面对生命的多样性,演化生物学家们禁不住采用了“树”的隐喻手法。查尔斯·达尔文在创立进化论的时候,曾写道:“同一纲中的所有生物的亲缘关系,有时可以用一株大树来表示……绿色的、生芽的小枝可以代表现存的物种……主枝分为大枝,再逐次分为越来越小的枝条,而当此树幼小之时,主枝本身就曾是生芽的小枝。”(33)1现存的种群是从过去的种群中孕育出来的,人类这棵大树扎根于非洲,每一个种群都是一个分支。假如“树”这种隐喻手法是正确的,那么任何一个种群在过去的任何一个时间点,都有单一的一个祖先种群。而且更重要的是,一旦一个种群分离出来,正如树枝与树枝之间无法重新再长到一起去一样,种群之间也不会发生融合。
紧随着基因组革命,新数据犹如雪崩一般涌来,此时如果再用“树”的概念来描述不同的现代人群之间的关系,我们就大错特错了。我最亲密的合作者,应用数学家尼克·帕特森,曾开发了一系列专门的统计学测试,以评估“树”模型是否能真实、精确地概括种群间的关系。如本书第一部分所描述的,这些测试中最重要的是四群体检验,它对基因组中成千上万的位置上每个个体的差异性进行检查。例如,在某个位置上,有些人是腺嘌呤(四种核酸或者说DNA“字母”中的一个),而有些人则是鸟嘌呤,这每一个差异都代表了历史深处的一次突变。如果我们将四个种群之间的关系用一棵“树”来表达,那么这四个种群的突变频率之间一定是一种非常简单的关系。2
对“树”模型进行测试,最自然的方法是先假设两个种群是从同一个分支上分离出来的,然后去测量这两个种群基因组中的突变频率。如果“树”模型是正确的,那么这两个种群在与其他两个关系较远的种群分离后,突变频率应当已经发生了随机变化,也就意味着这两对种群之间的突变频率差异应当具备统计学意义上的独立性。如果“树”模型是错误的,那么这两对种群之间的突变频率差异应当有某种相关性,也就意味着不同的分支之间存在着混血的可能性。四群体检验是我们的一个核心手段,它帮助我们证明了尼安德特人与非洲以外人的关系比与非洲人的关系更亲密,因此也就支持了尼安德特人和非洲以外的人之间必定存在着混血行为。3不过,证明了古老型人类和现代人之间存在着混血行为,仅仅是四群体检验所带来的诸多发现的一小部分。
在我的实验室里,四群体检验第一次大显身手是帮我们厘清了美洲原住民和东亚人之间的关系。过去人们普遍认为,美洲原住民和东亚人是从一个共同的祖先支系演化而来的“姐妹人群”,而这个祖先支系又是早先从欧洲人和撒哈拉以南非洲人的祖先支系那里分离出来的。测试结果却出乎意料,我们发现,在那些撒哈拉以南非洲人不携带的突变上,欧洲人与美洲原住民之间的血缘关系,比欧洲人与东亚人之间的血缘关系要更近一些。当然,有人会说:原因很简单,过去500年来,欧洲移民者一定把一些血统传到了美洲原住民那里嘛!但是,在每一个我们研究过的美洲原住民群体里,我们都发现了这种模式,也包括那些我们有十足把握没有掺杂过任何欧洲人血统的人群。同样,如果认为美洲原住民和欧洲人是从同一个祖先人群那里演化而来,而这个祖先人群又是在更早时候与东亚人的祖先分离,我们照样可以从测试数据中发现矛盾之处。所以,在描述人群关系的标准树模型里一定存在着某些根深蒂固的错误。
我们曾经就上述结果写过一篇论文,试着描述在美洲原住民历史上的一次混血事件:早在原住民祖先跨过亚洲和美洲之间的白令大陆桥之前,就发生过一次欧洲相关人群与东亚相关人群之间的融合。我们在2009年就提交了这篇名为《发生在美洲原住民身上的古代混血》(Ancient Mixture in the Ancestry of Native Americans)的论文,而且该文章的审稿状态已经进入“小修待定”。但直到现在,这篇论文还没有发表。
就在我们对这篇论文做最后润色的时候,帕特森发现了一些更离奇的事情,这使得我们意识到自己仅仅了解了故事的一部分。4为了能解释他的发现,我需要先描述一下我们发明的另一种统计检验——三群体检验(ThreePopulation Test),用来检验一个“被试”人群是否携带有混血的信号。如果被试人群是由两个对照人群所代表的两个支系相互融合的产物,正如非裔美国人是欧洲人和西非人的混血人群一样,那么被试人群的突变频率就应该位于两个对照人群的频率之间。相反,如果这种混血并不存在,那也就不应该出现这种结果。于是,有无混血发生就会产生截然不同的模式。
当我们把“三群体检验”应用到广泛的人群上的时候,我们发现只要使用北欧人作为被试人群,检验得到的统计值就会是负值(34),意味着北欧人的祖先曾发生过混血现象。我们使用了来自世界各地的50多个人群的数据,并尝试了所有可能的对照人群组合,我们发现当对照人群之一是南欧人,特别是撒丁岛人,而另一个对照人群是美洲原住民的时候,混血的证据最为强烈。显然,美洲原住民对结果的影响最大,因为我们发现当使用美洲原住民作为第二对照人群的时候,比我们使用东亚人、西伯利亚人或新几内亚人时,结果都要显著得多。我们发现,居住在欧洲北部的人群,例如法国人,其祖先就是不同人群融合后的结果,而当时参与融合的人群之一,与当代美洲原住民拥有最多的共同血统,比任何其他现存的人群都多。
那么,我们该如何理解三群体检验和四群体检验的结果呢?我们提出的观点是,15000多年前,有一个人群居住在欧亚大陆北部,但这个人群并不是当今居住在该地区的人群的主要祖先(见图12)。这个人群中有一些人向东迁徙、横穿西伯利亚。后来,就是那些继承了他们血统的人们,跨过白令大陆桥到达美洲,最终形成了美洲原住民。其他的人则向西方迁徙,为欧洲人的血统做贡献去了。这可以解释为什么当使用美洲原住民作为祖先人群的替代者,也就是三群体检验中的对照人群时,我们可以看到强烈的、指示欧洲人存在着人群融合现象的信号。而当使用西伯利亚原住民时,信号就没有这么强烈了。这有可能是因为西伯利亚原住民发源自一次冰河时代以后、时间上要近得多的、从东亚更南边出发进入西伯利亚的人类迁徙。
图12 找寻欧亚北部的“幽灵人群”
我们称这个新的人群为“古代欧亚北部人”(AncientNorth Eurasians)。当我们提出这个概念的时候,他们已经是“幽灵”了,也就是说,我们可以基于统计重建来推断出这样一个人群的存在,但他们现在已经不再以纯种的形式存在了。毫无疑问,如果古代欧亚北部人生活在今天的话,他们可以被称为一个“种族”,因为我们可以在遗传学上证明他们完全不同于其他的欧亚人群,就像今天的“欧亚西部人”、“美洲原住民”和“东亚人”是不同的人群一样。尽管他们并没有留下任何“纯种”的后代,古代欧亚北部人实际上还是非常成功的。如果把他们为当代人类所贡献的遗传物质全部收集在一起的话,我们将看到他们可以解释数以亿计的基因组。总之,全世界将近一半以上人口的基因组中,都有5%~40%的比例来自古代欧亚北部人。
古代欧亚北部人的例子说明,“树”这种形象可以很好地类比物种之间的关系,也就是说,物种之间很少杂交,就跟真正的树枝在分叉之后不会再长回去一样5,但拿它来类比人群间的关系就很不妥当了。基因组革命已经告诉我们,分久必合,历史上已经多次出现高度分化的种群再次融合在一起的现象了。6树不是一个好的比喻,或许用爬藤架子来打比方更为恰当:从古老的时代开始,各种不同的人群就不停地分叉,又不停地重新交织在一起。7