年代学与生业考古
稳定同位素研究古会谱模型的发展
林怡嫺 吴小红
(北京大学考古文博学院,北京100871)
摘要:考古学研究中,利用人类遗存的碳氮稳定同位素分析研究古食谱,巳经有数十年的历史。在 积年累月的发展过程中,形成了很多统计模型,用以分析稳定同位素测量数据,得出食谱组成的定 量结果。20世纪早期的研究主要应用的是线性食谱模型,21世纪前十年研发出了IsoError、IsoConc、IsoSource等线性食谱模型。2008年首次引人贝叶斯统计方法建立了MkSIR模型,其后基于贝叶斯统 计方法建立的食谱模型得到了迅速的发展,至今巳有SIAR、IsotopeR、MixSIAR、FRUITS等多种食 谱模型相继发表。随着对食物与消费者身体组织形成过程关系的研究日益深人,学界发现影响消费者身体组织同位素组成的因素越来越多。于是,研究者陆续新增相应的功能,对模型进行改良扩展,使 模型的复杂程度和使用难度日渐增加。本文旨在梳理稳定同位素食谱模型的发展过程,讨论模型新增 的功能及其产生的原因,希望有益于稳定同位素食谱模型的使用者对其有全面的认识,从而能合理地 应用模型,对食谱组成得出综合全面的定量结论。
关键词:稳定同位素分析;食谱模型;贝叶斯统计
一、引言
考古学研究中,重建古代人类的食谱,揭示古代人类的生业经济,研究人类与生态环境的关系以及古代社会的发展等,一直是广受关注的学术热点之一。对人类及其食物遗存进行稳定同位素分析复原古食谱的研究领域,发展了长达数十年之久。食物的组成特征会留在消费者的身体组织中,消费者身体组织的稳定同位素组成可以反映 食谱中各种食物混合的结果。对稳定同位素测量值进行统计分析,得出不同食物对食谱构成的定量结果,是重建古食谱这一研究领域尤为重要的研究内容。这类统计分析方法可称为数学混合模型(mathematical mixing models),为了更直观地表述,本文以“稳定同位素食谱模型”代表这类基于稳定同位素测量的统计分析方法。随着研究的日益深入,发现食物进入消费者身体组织的过程中可能造成稳定同位素值变化的因素越来越多,因此需要有相应的稳定同位素食谱模型对其进行描述。从*初的二元线性食谱模型,至今已经发展出多种以贝叶斯统计框架为基础的复杂食谱模型。本文旨在梳理稳定同位素食谱模型发展的过程,希望可以对稳定同位素食谱模型有更深 入的认识,以期能合理使用,从而在古代食谱相关研究中获得更为准确的结论。
二、线性食谱模型
稳定同位素分析可以应用在食谱研究中,是因为消费者不同食物的同位素特征有显著差异,比如Q植物和C4植物之间513C值的差异,陆生生物和水生(淡水或海洋)生物之间515N值的差异。食谱研究早期大多使用同位素二分法,分出Q植物和 Q植物,或陆生食谱和海洋食谱。稳定同位素食谱模型由数学方程组成。在模型发展 初期,*早的模型[式(2.1)]是基于同位素质量平衡,将消费者体内的同位素值视为被消费者消化吸收的所有食物均勻混合的结果。式(2.1)是基于同位素二分法*简 单的模型,将消费者食谱中的食物分为两类,测量消费者和两类食物的某种稳定同位素比值,求这两类食物在消费者的食谱中所占的比例:
(2.1)
这两类食物所占的比例/1和;2相加一定等于100%。这是一组由两个未知数(f1和f2)组成的两条方程式,可以得出唯一解。因为式(2.1)只有两类食物,因此称为二元食谱模型。
二元食谱模型是生态学研究*早应用于量化食谱组成的一类模型。首次在考古学研究中应用是1977年Vogel和van der Merwe对北美玉米种植的研究。因为中国北 方新石器时代至青铜时代是种植粟黍的粟作农业发展的重要时期,研究当时人类食谱 中粟黍等Q植物与水稻等Q植物的相对比例,可以反映粟黍农业的发展程度及其与稻 作农业共存消长的现象。因此先前有很多研究都是通过测量人骨的碳同位素比值513C及Q植物的513C全球平均值-26%。,Q植物的513C全球平均值-13%。和从食物到生成人骨胶 原蛋白的过程中发生的同位素分馏偏差值+5%~6%。,估算古代人类食谱中含有多少比 例的C4植物。
可以看出,二元食谱模型相当于线性插值法。因为消费者的同位素值是所有食物均勻混合的结果,因此会落在两类食物的同位素值之间。如果消费者的同位素值在两类食物的同位素值区间之外,那么模型会给出一类食物的比例大于100%,另一类食物的比例小于0的结果,两者都没有生物学意义。如果出现这类不合理的现象,则*可能 的情况是存在未知的食物来源,消费者或食物的同位素值存在不确定性。
长达数十年的食谱研究,基本上都是同时测量消费者胶原蛋白的碳氮同位素比值,两种稳定同位素测量值使线性食谱模型可以容纳的食物种类从两类增至三类:
(2.2)
式(2.2)的第一条方程式是消费者的513C值等于三类食物的513C值依其在食谱中的比例加权的总和,第二条方程式等同第一条方程式,表述的是消费者的515N值与食物的关系,第三条方程式限制三类食物所占比例的总和必须等于100%。这是一组由三个未知数和三条方程式组成的模型,这模型也有唯一解。因为消费者的同位素值是三类食物均勻混合的结果,必须落在三类食物同位素值(加上同位素分馏偏差值)组成的二维空间内部,因此,使用该食谱模型前可以先画出消费 者及其三类食物两种同位素值的XT二维散点分布图,如果消费者的同位素值在食物组成的二维空间之外,则表明可能还有未知的食物来源。以此类推,如果消费者的食谱中有4类食物,则需要3种同位素值;如果消费者有《类食物,就需要n-1种同位素值。然而,可以区分不同食物种类的同位素测量种类的数量是有限的。
1.误差问题
早期的线性食谱模型都以单一数值(比如样本的平均值)代表消费者及其食物的 稳定同位素特征。然而,消费者和食物的同位素组成皆可能存在不确定性。不确定性可能来自个体差异、抽样误差(不同随机样本之间的误差)或实验测量误差。为了建 立能容纳误差的食谱模型,Phillips和Gregg利用Excel建立了能处理两类食物的一种同位素值或三类食物的两种同位素值的食谱模型,称为IsoError。IsoError可以给出每类食物所占比例的平均值和95%置信区间(confidence interval)。两位研究者还实验了不同因素对食物占比估值误差的影响,发现影响误差值*主要的因素是不同食物之间同位素特征的差异,差异越明显,模型估算结果越精准。其次是消费者和同组食物内部的差异,再者是每组样本的样品数量。实验测量误差一般小于1%。,可以不予考虑。如果使用者已知消费者及其食物的同位素特征和误差,IsoError还可以模拟估算结果达 到想要的精准度所需的样品数量。IsoError的问题是,当食物种类的数量大于消费者同位素测量种类的数量加一时,IsoError无法给出明确的估算结果。因为IsoError没有限制食物所占的比例要介于0~100%,因此,当消费者的同位素值落在所有食物的同位素 值组成的凸多边形空间之外时,表明缺少某种重要的食物来源,或是同位素分馏偏差 值有错,或者真实情况与模型的假设不符,IsoError可能对食物的比例给出没有意义的负值。
2.食物元素含量问题
研究者意识到前文的食谱模型中都有隐含的假设:所有食物对消费者碳氮同位素513C值和515N值的贡献都是相同的。如果所有食物的碳含量和氮含量是相似的,那么这可能是合理的假设。这样的假设可能对肉食性动物和草食性动物都是合理的。然而对杂食性动物来说,因为食谱组成比较复杂,食物来自食物链上多种营养层级,如果某 种食物特别缺乏或特别富含氮,则逻辑上会造成这种食物对消费者贡献的氮相对于碳 而言成比例地减少或增加。Phillips和Koch因此选用Excel开发了一种食物元素含量加权食谱模型IsoConcU2],假设对每种元素而言,比如碳和氮,每种食物对消费者碳和氮 的贡献,与食物中碳和氮的质量百分比浓度(wtC%和wtN%)乘以食物被消化吸收的质量成正比。因为加入了食物元素含量的信息,在碳氮同位素二维分布图上,IsoConc是第一种将食物的同位素值组成的凸多边形空间转变成曲线弯曲空间的食谱模型。IsoConc基于生物质(biomass)、碳含量、氮含量建立了三种不同的食谱组成(所有食物的占比组合)。如果所有食物的碳和氮含量都相同,则三种食物占比组合也都相同,模型在数学上简化成没有元素含量信息的模型。如果所有食物的碳和氮含量没有明显差异,则没有必要增加模型的复杂程度。但是如果食物碳和氮含量差异显著,像是杂食性动物的食谱中植物和动物之间氮含量的差异,则可能需要使用食物元素含量加权模型。
线性食谱模型及食物元素含量加权模型都假设所有食物被消费者消化吸收的程度是一样的。但是Robbins等研究者指出,研究食物中不同元素含量的同时,还需要考虑消化率的问题。因为,对动物来说,吃其他动物的蛋白质、脂质和糖类都很 容易消化,然而吃某些植物的纤维不容易消化。消化率的差异主要会造成植物性食物 中消费者可以利用的碳含量出现偏差,因为植物的氮绝大部分都在蛋白质中,而蛋白 质很容易消化。因此,为了回应Robbins等研究者的问题,Koch和Phillips分析了食物 中宏量营养素(macronutrients)的消化率,依此校正模型中食物碳和氮含量的参数值 以反映实际消化吸收的部分,而不是使用食物原始的碳和氮含量。Koch和Phillips 在IsoConc中新增了可以输入食物元素含量的功能及容纳食物消化率的信息,是食谱模型发展进程中重要的里程碑。有不少重建古人类食谱的研究选用了IsoConc。然而,与IsoError不同,IsoConc没有输入消费者和食物同位素组成误差值的功能。
3.食物种类数量问题
IsoError虽然拥有可以输入误差值的功能,但是没有解决可以区分不同食物的同位素测量种类数量远远少于消费者食物种类数量的问题。假设已知消费者有7种不同的食 物来源,测量了消费者的碳氮稳定同位素513C值和515N值,可以基于式(2.2)建立容纳 2种同位素测量值和7个未知数与3条方程式的新模型,然而这样的模型理论上会有无数解。但是因为食谱模型需要满足同位素质量平衡,7个未知数都必须>0且总和必须等于100%,因此这样的模型得出的有限解,可以界定食谱中每种食物可能的占比区间。
Phillips和Gregg为了研究食物资源比较复杂的消费者解决食物种类的数量远比同位素测量种类多的问题,选用Visual Basic语言开发了新的食谱模型,名为IsoSource。IsoSource的第一步是使用线性食谱模型,在每种食物的比例都≥0且总和等于100%的限制下迭代建立各种可能的组合,每次迭代的差异很小,比如1%。第二步是对每种可能的占比组合算出消费者同位素组成的模拟值(每种食物的同位素值乘以各自可能的占比的总和)。第三步是比较消费者模拟值与实际测量值的差异,如果模拟值与实际测量值相等,或差异在可接受的范围,比如小于实验测量误差(比如513C值和515N值的仪器测量误差约0.2%。)或抽样误差等,代表这种占比组合是其中一种可能的结果,将差异小到符合要求的占比组合存成数据集,*终用图表展现数据集中所有的组合。每种食物在食谱中所占比例的*小值和*大值界定了其有可能的区间。开发者强烈建议 使用者发表所有可能的占比组合的分布图,不要只发表模型输出的平均值,因为平均值只是其中一种可能的结果,而且可能留下只有唯一解的错误印象。IsoSource的问题在于,没有纳入食物同位素组成与同位素分馏偏差的不确定性及食物中的元素含量。
IsoSource能否对消费者的食谱组成给出明确的结果,取决于消费者与食物同位素值的相对位置。如果消费者的同位素值位于食物的同位素值组成的凸多边形空间的中
展开