不幸的是,我们所分析的尼安德特人基因组序列充满了错误。之所以这么说,是因为单纯从数据的角度来看,在尼安德特人和现代人从两者的共同祖先分离后,尼安德特人支系上发生的突变居然是现代人支系的好几倍!大部分尼安德特人支系上的突变一定是假的。遗传突变发生的速率基本是恒定的,而尼安德特人的骸骨历史这么久远,比起当代人,他们离共同祖先的时间更近,所以他们积累的突变数目应该更少才对。根据这种“突变”过度发生的程度,我们估计在尼安德特人的基因组序列上,每200个DNA字母中就有一个错误,也就是错误率高达0.5%。这个差异看起来似乎很小,但它仍然比尼安德特人和当代人基因组之间真正的差异密度要高多了,所以,大多数我们所发现的遗传差异是由测量过程的误差所导致的,而不是真实情况。为了解决这个问题,我们将研究限制在那些已知在当代人类个体之间存在着差异的基因组位置上,而在这些位置上,0.5%的错误率并不会对分析结果产生干扰。正是在这些位置上,我们设计了一套数学检验方法,并借此测量尼安德特人到底跟哪些当代人的血缘关系更近一些。
我们开发的这种检验方法现在被称为“四群体检验”(FourPopulation Test),而且已经被广泛地应用到了不同群体的比较工作中(见图7)。该测试以4个基因组同一位置上的DNA字母作为输入:例如,两个现代人的基因组、尼安德特人的基因组、黑猩猩的基因组。在某些位置上,如果存在着一个突变,它既能将两个现代人的基因组区分开来,又存在于尼安德特人的基因组上,那么这种突变一定是在尼安德特人和现代人最终分离之前产生的。我们开发的测试方法会去检查尼安德特人与这两个现代人的匹配率是否不同。如果这两个现代人是同一个共同祖先种群的后裔,而且这个共同祖先与尼安德特人的祖先早已分离,那么这个突变就没有理由只在其中的一个现代人身上传承下来,于是,尼安德特人分别跟两个现代人的基因组之间的匹配率也应该是一样的。相反,如果尼安德特人只跟其中一个现代人的祖先发生过混血,那么,这个现代人就应该与尼安德特人共享更多的突变。
图7 四群体检验
我们可以通过“四群体检验”来测试两个群体与其共同祖先的关系。例如,与黑猩猩相比,尼安德特人的祖先曾发生一个突变,即上图中字母T。而尼安德特人与欧洲人所共享的突变数目,比与非洲人所共享的突变数目要多9%。这说明在历史上,尼安德特人曾与欧洲人的祖先发生过混血。
在我们检验了多个当代人类群体后,我们发现,尼安德特人与欧洲人、东亚人和新几内亚人的血缘亲疏程度都差不多,但与所有非洲以外人群的血缘关系都比所有撒哈拉以南非洲人要更亲近些,后者包括相差很大的西非人、非洲南部的桑人采猎者等。差异并不大,但这种差异只是一种偶然事件的概率比1/1015还要低。这就是数据告诉我们的结论。假如尼安德特人曾经与非洲以外人群的祖先发生过混血,而与非洲人的祖先没有产生过什么瓜葛,那么这种结论也就在预期之中了。