在第4会合点,我们第一次遇见由两个以上物种组成的朝圣者小队。物种数目的增多会为推定它们关系带来很多问题。随着我们的朝圣继续推进,这些问题会变得越来越严重。如何解决这些问题,便是《长臂猿的故事》讨论的主题。[121]
我们前面提到过,差不多16种长臂猿可以被分作4个系群。每个系群的染色体数目都不相同,如今各有自己的属名,分别是长臂猿属(含7个物种,其中最著名的是白掌长臂猿,学名Hylobates lar)、白眉长臂猿属(Hoolock,含2种孟加拉白眉长臂猿,在2005年被重新命名)、合趾猿属(Symphalangus,合趾猿)和黑冠长臂猿属(Nomascus,含6种“戴帽子”的长臂猿)。这篇故事将会解释如何确立这4个系群的进化关系,换句话说,如何建立它们的系统发生树。
树状家系图可以“有根”,也可以“无根”。如果我们画的是一棵有根树,这意味着我们知道祖先在哪里。这本书里的大多数树状图都是有根的。但是如果完全不清楚祖先在树状图上的位置,我们就只能画一棵无根树。无根树无所谓方向,无所谓时间,常常以星形图的形式呈现。下图给出了三个例子,穷尽了4个系群的可能关系。
树分叉处的两个分支哪个在左哪个在右其实并无区别。而且目前(本篇故事的后面部分会有所不同)分支的长度并不包含信息。分支长度不包含信息的树状图被称为分支图(cladogram)或分支树(在这个例子里则是无根分支图)。分支图传达的唯一信息便是各分支的次序,其余都是点缀。比如,如果交换图中(a)中白眉长臂猿属和长臂猿属的位置,对4个系群的关系没有任何影响。
只要我们限定所有分叉都只一分为二,即形成二歧分支(dichotomy),那么这三幅无根分支图就代表了4个物种间所有可能的关系。有根分支树也一样,按照惯例,通常都忽略三歧(trichotomy)或多歧(polytomy)分支,我们需要暂时承认我们的无知,把它们看作无法解析的情况。
一旦我们确定了无根分支图上最老的点(也就是“根”的位置),它就变成了一幅有根分支图。然而这并不总是一个容易做的决定,等我们的朝圣之旅接近尾声时,这个问题还会回来纠缠我们。不幸的是,一旦改变根的位置,各分支的顺序也会随即发生剧烈的变动。以上页图(a)部分为例,如果根被安放在黑冠长臂猿属和其他三个长臂猿系群之间,我们会得到下图左侧所示的有根分支图。如果还是同一幅无根分支图,但这次把根安放在白眉长臂猿属和其他三个系群之间,我们就得到了下图右侧的有根分支图。这两种有根分支图在长臂猿的研究者中各有拥趸。尽管在外行看来,两幅图所示的关系模式极为不同,但实际上它们的差别只在于根的位置。
如何才能找到分支图的“根”?通常的办法是把分支图进行扩展,直到它涵盖至少一个——最好不止一个——外类群(outgroup)物种,即事先普遍认为这个物种跟其他系群的关系足够远。比如在长臂猿的分支图里,猩猩或大猩猩,甚至大象或袋鼠都可以充当这个外类群。不论我们对长臂猿内部各系群的亲缘关系有多么不确定,但我们都知道任何长臂猿和类人猿或大象的共同祖先都比各种长臂猿的共同祖先更古老。因此对于一幅包含了长臂猿和类人猿的分支图来说,把根安放在这二者之间是毫无争议的。
有了这些准备,我们现在可以决定上述无根分支图当中哪个才是正确的。4个长臂猿系群的无根分支图有3种可能。如果要鉴定关系的是5个动物系群,那么我们需要考虑的备选分支图就有15种之多。如果动物系群的数目高达20种,则根本不必试图数出备选分支图的数目,因为那将是个天文数字[122]。随着需要归类的系群数目的增加,可能的分支图的数目会急剧增长,即使是最快的计算机也要算到世界末日。不过从原理上看,我们的任务非常简单。我们只需要从所有备选里挑出最好地解释了系群间相似性和差异性的那幅分支图。
怎么才算是最好的解释?任意一组动物之间都存在无穷多的相似性和差异性,要对它们进行计数可能比你想的还要难。某个“特征”是另一个“特征”不可分割的一部分,这种情况常有发生。如果你把它们单独计数,那么你实际上是把同一个东西数了两遍。举一个极端的例子,假设有A、B、Y和Z4种千足虫(millipede),其中A和B在各方面都比较相似,唯一的区别在于A的腿是红色的,而B的腿是蓝色的。Y和Z在各方面比较相似,但跟A或B非常不同,而且Y的腿是红色的,Z的腿是蓝色的。如果把腿的颜色当作单个“特征”,我们就能正确地将A和Y归为一个系群,而把B和Z归为另一个系群。但是如果我们天真地把100条腿各算一个特征,那么这些腿的颜色会使得支持AY和BZ分组的特征数目暴增至100倍。人人都能看出来,我们错误地将同一个特征数了100遍,而它“实际上”只是一个特征,因为胚胎发育时是一个单独的“决定事件”同时决定了所有100条腿的颜色。
左右对称性也有同样的问题。胚胎学的原理决定了,除了少数例外,动物每侧身体都是另一侧的镜像。没有动物学家会在绘制分支图的时候把两侧的镜像各计一遍,但是这种非独立性(nonindependence)并不总是如此显而易见。鸽子需要高高突起的胸骨(即龙骨突)来锚定飞行肌,不会飞行的鸟比如无翼鸟(kiwi)则不需要。当我们考虑鸽子和无翼鸟的区别时,我们应该把龙骨突和翅膀算作两个独立特征吗?还是说我们应该把它们算作一个特征,因为有时候一种特征的状态会决定另一种特征,或者至少不同程度地降低另一种特征的自由度?在千足虫和左右对称性的例子里,合理的答案相当明显,但在龙骨突的例子里则不然。你会发现人们各执一端,而争辩的双方都是富于理性的人。
这些相似或不同都是可见的特征,但可见特征的进化在于它们是DNA序列的外在表现,而今天我们可以直接比较DNA序列。长链DNA还带来额外的好处,即DNA文本里有更多可供计数和比较的内容。翅膀和龙骨突多样性的问题可能会被数据的洪流淹没得无影无踪。更妙的是,自然选择对许多DNA差异视若无睹,因此给我们保留了一个“更纯净”的祖先信号。举个极端的例子,有些DNA密码是同义的,即它们编码相同的氨基酸。如果一个突变把一个DNA密码词变成了它的同义词,那么它对于自然选择来说就是不可见的,但对于遗传学家来说,它和别的突变没什么两样。同样的情况也适用于“假基因”(通常来自真基因的偶然重复)和许多其他“垃圾DNA”序列,这些序列虽然位于染色体上,但其中包含的信息从来不会被实际使用。免于自然选择的DNA片段可以自由突变,从而为分类学家们留下了有用的痕迹信息。不过,这些都不会改变基本的事实,即某些突变确实有重要的实际作用。虽然从数量上看,这些突变不过是冰山一角,但正是因为有了这些自然选择看得见的突变,才有了我们熟悉的这些美丽而复杂的生命。