• 精选
  • 会员

再生遗存

2020年6月29日  来源:祖先的故事 作者:理查德·道金斯 提供人:huangtang13......

就像考古标本一样,化石多多少少算是来自过去的直接遗存。我们接下来要转向第二类历史证据,即一代代复制传递的再生遗存。对研究人类史的历史学家来说,再生遗存指的可能是通过传统的口头叙事或书面文字记录流传下来的目击证词。要想了解生活在14世纪的英格兰是种什么体验,我们并没有活着的目击者可供咨询,但幸亏我们有包括乔叟作品在内的书面文件。这些文件包含的信息可以被复制,被印刷,被储藏在图书馆里,被重印分发,今天我们还可以读到它们。一个故事一旦被印刷,或者像今天这样被储存进某种计算机媒介,那么它的副本就有相当大的机会长存不朽,流传至遥远的未来。

书面记录和口头传承的可靠性有极大的差异,前者可靠得多。就像我们了解自己的父母一样,你也许认为每一代孩子都了解他们的父母,也会认真聆听父母讲述过往的故事细节,然后再转述给下一代。你大概会觉得,如此这般五代以后,会有大量口头传承保存下来。实际上,我虽然还清楚地记得自己的四位祖辈,但对自己的八位曾祖辈却只知道寥寥无几且支离破碎的几件逸事。我有一位曾祖父会习惯性地哼一支无名小调(我也会哼),而且只在系鞋带的时候哼。第二位非常贪吃奶油,而且输棋的时候会掀棋盘。第三位是一名乡村医生。这就是我所知的全部。八个完整的人生是如何被削减到只剩下这么一点的?即使我们跟当事人之间的传话链条是这么短,即使人类语言是如此丰富,组成八个完整人类生命的成千上万个私人细节还是这么快就被遗忘了,这是如何发生的?

令人沮丧的是,口头传承往往很快消亡殆尽,除非被吟游诗人的词句神化,就像荷马写下的那些篇章一样,即便如此,关于那个时期的历史也很难称得上准确。它会渐渐退化为不知所云的虚假传说,而这个过程快得惊人,甚至用不了几代人的时间。关于真实存在的英雄和恶棍、动物和火山的历史事实会快速退化(或者升华——这取决于你的口味)为关于半神和恶魔、半人马和喷火龙的神话。[21]不过我们不必为口头传承及其不完美性耽搁太久,毕竟在进化史上没有类似口头传承的现象。

书写是一种巨大的进步。纸张、莎草乃至石板都可能会腐朽风化,但书面记录却有可能被准确复制无穷多代,尽管实际上复制并不是百分之百准确的。我需要解释一下,我所说的“准确”和“代”都有特定的含义。如果你手写一张便条给我,然后我抄了一份传给第三个人(即下一“代”复制者),我写的副本并不是原先版本的精确复制,因为我们的字体不一样。如果你写得足够细心,而我又煞费苦心地从我们共享的字母表里找到一个字母匹配上你每一个潦草的笔画,那你的信息有很大机会被完全准确地复制。理论上,这种准确性可以历经无穷多代传抄而依然保存,因为作者和读者有一份约定的字母表,而且字母表是离散的,所以复制才能使信息在原稿损毁之后依然存在。书写的这种性质被称为“自规范”(self-normalising)。书写之所以有这种性质,是因为字母表是非连续的。这种说法让人想起模拟信号和数字信号的区别,关于这一点,需要再多解释几句。

在英语硬辅音[22]c和g之间存在一个中间辅音(即法语的硬辅音c,如法语单词comme里的c)。但没人想着用一个看起来介于c和g之间的字符来表示这个发音。我们都知道英语的书面字母必须是字母表里26个字母中的一员,我们也知道法语使用的是同样的26个字母,但它们表示的发音却不完全一样,其中某个发音可能介于英语的两个发音之间。在各种语言乃至各种地方口音或方言中,字母表都“自规范”到不同的发音上。

自规范机制可以对抗“中国式耳语”(Chinese Whispers)[23]造成的信息代际衰减。一幅画也可以由一群艺术家进行一连串的仿制临摹,却没有同样的机制保护其中的信息免于衰减,除非这幅画的绘画风格包含了某种仪式化的传统来充当它的自规范机制。历史事件的目击证词不同于绘画,一旦书于纸面,就有很大的机会保持准确,甚至几个世纪之后的历史书依然能够准确地复述它。我们今天仍然可以大概准确地描述出庞贝城(Pompeii)在公元79年的毁灭[24],这要归功于一个名叫普林尼(Pliny)的年轻目击者,他在寄给历史学家塔西陀[25]的两封信里记下了自己看到的景象。经过一代代的传抄,塔西陀的部分著作流传了下来,最终被印刷出版,使我们今天可以读到。哪怕是在谷登堡[26]之前的年代,文件的复制全凭抄写,跟记忆和口头传承比起来,书写依然代表着准确性的巨大进步。

不断复制却依然保持完美的准确性,这是只存在于理论中的理想情况。实际上抄写很容易犯错,更不必说抄写者会调整自己的抄本,使之能够更加“如实地”反映他所理解的原意。最著名的例子是对《圣经·新约全书》历史的修订,使之更符合《圣经·旧约全书》的预言,19世纪的德国神学家对此曾有不辞辛劳的详述。该研究涉及的那些抄本或许不是故意编造的谎言。那些福音的作者生活的年代距离耶稣之死已经很久了,而他们真心地相信耶稣是《圣经·旧约全书》中弥赛亚预言的化身,因此他“必须”出生于伯利恒(Bethlehem),“必须”是大卫(David)[27]的后代,如果文献居然莫名其妙地没有这么写,那么一个尽职尽责的抄写员就有义务纠正这一缺陷。我猜,就像我们会理所当然地更正一个拼写错误或语法不当,一个虔诚的抄写员也不会将这种“纠正”视为伪造。

跟有意的修改不同,一切重复、复制过程都难免发生一些诸如串行、漏词这样的低级错误。但不管怎样,我们不能指望书写资料带我们回到文字发明之前的时代,而文字的历史只有5 000年左右。标识符、计数符和图画更古老一些,大约有几万年的历史,但这些跟进化的时间尺度比起来依然是微不足道的。

幸运的是,涉及进化时有另一种复制信息,它也经历了许多代的重复拷贝,复制代数简直超乎想象,若以略带一点诗意的眼光去看它,我们可以认为它等价于书面文字:就像一份历史记录一样,它不断更新,传抄了许多亿代,却依然保持了惊人的准确度,因为就像我们的书写系统一样,它也有一份自规范的字母表。所有现存生物的DNA分子都来自远古的祖先,有着令人咋舌的保真度。DNA分子中的原子固然在不断更新,但它所编码的信息却被复制了数百万年,有时候甚至达到数亿年。我们可以凭借现代分子生物学技术直接读取这份记录,一个字母一个字母地逐字读出DNA的拼写序列,或者采用稍微间接的方法,读出它们编码的蛋白质的氨基酸序列。或者我们可以采用更间接一些的方法,就像隔着毛玻璃一样,研究DNA的胚胎产物,从中读取有关信息,包括个体的外形、器官以及生化反应。不需要依赖化石,我们同样可以窥见历史。由于DNA的代际改变非常缓慢,历史实际上以它独有的字符编码被铭刻编织进了现代动植物的脉络纤维里。

DNA信息的书写有一套名副其实的字母表。就像罗马、希腊和斯拉夫书写系统一样,DNA的字母表是一个严格限定的字符集,其中的字符是人为规定的,因此并没有不言自明的含义。人为选择的字符被组合起来之后能够表达无限复杂和无限量的信息。英语字母表里有26个字母,希腊字母表里有24个,但DNA的字母表只有4个字母。许多至关重要的DNA序列片段只包含3个字母组成的单词,而这些3个字母组成的单词又都来自一部仅有64个词的字典。字典里的每个词都是一个密码子(codon),这些密码子当中有一些是同义词。也就是说,这些遗传密码实际上是“简并的”[28]

这部字典给这64个密码赋予了21种含义:20种生物体所需的氨基酸,加上一个万能的标点符号。人类语言数不胜数,而且在持续变化,字典里有数以万计的不同词汇,但DNA那个普适的字典只有64个单词,而且基本上一成不变(只在极其罕见的情况下有非常细小的变化)。这20种氨基酸连缀成串,每一串都是一个特定的蛋白质分子,长度通常为数百个氨基酸。尽管只有4个字母和64个密码子,但密码子的不同序列所能编码的蛋白质数目却是不计其数的,没有理论上限。一串密码子组成“一段话”,编码一个特定的蛋白分子,构成一个可识别的单元,这个单元通常被称为“基因”。一个基因和它的邻居(或许是另一个基因,或许是无意义的重复序列)之间并没有任何分隔符,其边界只能通过其序列本身来判断。但从这一点看,它们有点像缺少标点符号的电报报文,不过电报还会在词和词之间留空格,而DNA并没有。

跟书面语不同,DNA序列中有意义的片段好像孤岛一样被无意义的海洋隔开,那些无意义片段从来不会被转录(transcribe)[29]。有意义的外显子(exon)在转录过程中被组装成“完整的基因”,而无意义的内含子(intron)序列直接被阅读装置丢弃。在许多情况下,即便是有意义的DNA片段,其信息也从来不被读取,也就是说这些基因很可能已经作废了,虽然曾经有用,但它们现在只是待在那里而已,就像杂乱的硬盘里存放着某一书稿章节的早期版本。在阅读本书时把基因组想象成一个亟需整理的旧硬盘,确实会时不时有所帮助。

有必要再次重申,对于死亡很久的动物来说,其DNA分子本身并不会保存下来。可以永久保存的是DNA所包含的信息,而且其保存必须借助频繁的复制。《侏罗纪公园》的剧情设定虽然不无聪明,但在实践上却是不可行的。当然,吸了恐龙血的昆虫在被裹进琥珀之后的一小段时间里,其体内确实含有复活一只恐龙所需的必要信息,特别是化石证据表明恐龙的红细胞包含DNA(这一点跟它们的后裔鸟类一样,却和我们哺乳动物不同)。另外,有些生物分子确实有可能保存几千万年,比如,研究者从一只4 600万年前的蚊子化石里提取出了血红蛋白样的化学物质,甚至令人难以置信地从一根7 000万年前的恐龙骨头里提取出了胶原蛋白。但这都是些小而稳定的物质,脆弱的长链DNA完全是另外一回事。一旦缺少持续的维护,DNA就开始崩解破碎,用不了几年就衰败得一塌糊涂,对于一些软组织来说,甚至用不了几天就完全无法解读其中的DNA信息了。

DNA信息衰减直至消亡的过程难以逆转,但寒冷缺氧的条件确实可以在一定程度上减缓这一过程。目前有记录的最古老的基因组是从一根有70万年历史的马骨中提取出来的,加拿大的永久冻土使之得以保存。即使在冰点以上,冰冷而稳定的环境也可以将DNA保存数十万年之久。从冰冷洞穴中发掘出来的遗骨向我们提供了数量不等的古人类DNA,其中最为惊人的是5万年前一名近亲繁殖的尼安德特人的完整基因组(我们后面将会介绍)。想象一下如果有人成功把她克隆出来,将引起怎样的轰动!不过,虽然从人类生活的角度看,不管几十万年还是几万年都是相当长的时间跨度,但和我们前往过去的旅程比起来,它们只占了其中一小部分。唉,化学规律告诉我们,我们理论上能获得的可识别的古代DNA的年龄上限只有几百万年,显然不足以带我们回到恐龙时代。

关于DNA很重要的一点是,只要生物繁殖的链条没被打破,那么它所编码的信息就会在旧分子破坏之前被复制到一个新的DNA分子上去。通过这种方式,DNA编码的信息的寿命远远超出DNA分子本身。DNA之中的信息是可以复制更新的,而且每次复制时大多数字母都可以得到完美的复制,因此这些信息也就具备了无限保存的潜力。我们祖先的DNA信息有许多经由一代代活生生的个体传递至今,分毫未改,有些甚至经历了数亿年的光阴。

以这种方式去看DNA,它所记录的信息对于历史学家来说简直是一个丰盛得难以置信的馈赠。哪个历史学家敢于奢求这样一个世界,里面每个物种的每个个体都随身携带着一份代代相传的书面文档,冗长而详尽?甚至文档的内容还会发生随机的变化,变化发生的频率足够低,不至于把记录搞乱,又足够高,可以生成标新立异的新版本。其妙处还不止于此。文档的内容并不是任意的。我在《解析彩虹》(Unweaving the Rainbow)一书中提出了一个达尔文主义的观点,把动物的DNA看作“死者的遗传之书”,一部对祖先世界的描述性记录。这个说法依据的是一个事实,即在达尔文主义进化过程中,任何一个动物或植物的外形、先天行为乃至细胞生化活动都是一篇密文,其中包含了它的祖先所生存的世界的相关信息:它们寻觅什么样的食物,摆脱什么样的天敌,耐受什么样的气候,引诱什么样的配偶,等等,这一切信息最终都写入了DNA,又通过了一连串自然选择。我们知道海豚的祖先曾经在陆地上生活,向我们泄露秘密的是海豚特殊的解剖和生理特点。将来有一天等我们学会了正确地解读DNA包含的信息,也许它们的DNA会向我们再次确认这一点。4亿年前,所有陆生脊椎动物的祖先,包括陆生的海豚祖先,离开了生命自起源之时就一直栖居的海洋。毫无疑问,我们的DNA里记录了这个事件,只是我们还不懂得如何解读。任何一只现代动物,它的一切,它的肢体、心脏、大脑和繁殖周期,尤其是它的DNA,全都可以被看成一份文档,一部关于它的过去的编年史,尽管这部编年史是一部被复写了许多遍的抄本。

DNA的编年史也许是赠予历史学家的礼物,但它并不容易解读,需要有理有据地深入解读。若是能够跟我们的第三种历史重建方法结合起来,它会变得更为有力。所以我们现在来看看这种方法,而且我将再次以人类历史中的类似情况做类比,具体而言是和语言的历史相类比。

核心关键词不超过3个

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000