关于当今东亚人群的第一个大规模基因组调查结果是在2009年发表的,这个调查涵盖了来自大约75个群体的近2000人。26其中的一个调查结果得到了研究人员们的特别关注:东南亚的人类遗传多态性比东北亚的要更高一些。他们提出的解释是:有单一的一股现代人首先迁徙到了东南亚,然后再向北进入中国以及其他地方。这种模型遵从了一个更普遍的、能解释全球人群多态性模式的理论:有单一的一股现代人迁徙走出了非洲,然后往各个方向扩张,每衍生出一个新的群体,便丢失一部分遗传多态性。27现在我们知道,这个关于东亚人群历史的理论模型很有可能并不准确。欧洲的历史上发生了多次群体替代和混血事件。从古DNA研究中,我们也知道了当今欧亚大陆西部的遗传多态性模式并不是首批现代人迁徙进入该地区的准确反映。28类似的,对于东亚,这个由南往北迁徙并沿途丢掉遗传多态性的理论模型是非常错误的。
2015年,王传超与我们合作分析一份珍贵的数据:来自大约40个中国人群的、大约400个现代个体的全基因组数据。在DNA研究中,来自中国的样本非常稀少。王传超和他的同事们在中国完成遗传学实验,然后与我们合作分析电子化的数据。在接下来的一年半的时间里,我们把这些数据跟已经发表的其他东亚国家人群的数据和我们自己实验室生产的来自俄罗斯远东的古DNA数据进行综合分析。这项研究帮助我们更深刻地认识东亚人群的历史,以及找到当下不同东亚人群的起源。29
通过主成分分析,我们发现当下的绝大多数东亚人的血统可以用3个群组来描述。
第一个群组的核心人群来自黑龙江流域,也就是当今中国东北部与俄罗斯的国界线区域。这个群组包含了我们以及其他实验室从黑龙江流域获得的古DNA。所以,这个区域的居民在过去超过8000年的时间里,都保持着遗传上的相似性。30
第二个群组的主要人群来自青藏高原,也就是喜马拉雅山以北的大片区域。这片区域的大多数地方的海拔都比欧洲的最高峰阿尔卑斯山还要高。
第三个群组的主要人群来自东南亚,而且最具代表性的人群是中国大陆沿岸岛屿,例如海南和台湾的原住民。
我们使用了四群体检验来评估不同的现代人群之间的关系。除了以上3个群组的代表性人群,我们还纳入了美洲原住民、安达曼群岛原住民和新几内亚人。后面这3个人群的祖先至少从末次冰期开始就跟东亚人的祖先基本隔离了,所以这些人群所携带的东亚人相关的遗传信息实际上就像是来自那个历史时期的古DNA。
我们的分析结果支持这样的一个人群历史模型:当今绝大多数东亚人的现代人血统基本上来自两个很久之前便分离开的两个支系的混血,只是不同人群的融合比例不同而已。这两个支系的成员往各个方向扩张,它们相互之间,以及它们与其他遇见的人群间的混血,铸造了当今东亚的人群结构。