本文摘自《生命是什么》(作者:王立铭),有删改。
地球已经46亿岁了。
在地球的童年时期,生命就已经诞生。它们不断地繁衍、进化,使一座座辉煌壮丽的生命大厦遍布在地球的每个角落。
如果把生命比喻成一栋大厦,那么物质就像是砖头瓦块,能量就像是建筑工人。砖头瓦块已经齐备,建筑师也已经蓄势待发,但是对于任何一种能够抗拒亿万年的风霜摧折、在地球上生存和繁盛的生命来说,仅仅有这些还远远不够。
这座大厦太脆弱了。万一一场地震或者火灾毁掉了唯一的大厦怎么办?万一大厦的基础被蝼蚁松动,或者一场台风卷走了大厦的顶层呢?要知道,概率再小的意外,放在几十亿年的时间尺度中,都会变得实实在在起来。
那么,那些由能量这个天才建筑师建立的生命大厦——是如何逃开了无可避免的意外事故和难以抗拒的沧桑巨变,绵延不绝一直到今天的呢?
答案其实很简单:即生命的自我复制。自我复制,通俗点说,就是繁殖,生孩子,传宗接代。自我复制是地球生命基业长青、繁衍进化的基础。
自我复制以自身为样本,不停地制造出和自己相似但又不完全一样的子孙后代。这样就保证了即便其中一些因为意外事故死去,还有足够的个体能存活下来延续香火。
而更重要的是,自我复制为生命现象引入了变化。这种变化大多数时候难以察觉,有时候也可以惊天动地,使整座大厦都焕然一新。
但是无论如何,在自我复制过程中产生的变化,总是快过地球环境动辄以千万年计数的变化。也正因为这样,地球上的生命来了又走,样貌也千变万化。
当然,在自我复制中也出现过不够精确的自我复制,这也提供了大量在地球环境中“试错”的生物样品。谁能活下来,谁能继续完成新一轮自我复制,谁就是胜利者。
自我复制因其自身的特点保证了地球生命的永续。对自身的不断复制保证了生命不会因一场意外而彻底毁灭,而自我复制过程中出现的错误,则帮助生命适应了地球环境的变化,逐渐演化。
那么,自我复制又是怎么发生的呢?
让我们做一个思想实验,构造一个极端简化的生命,探讨一下生命自我复制的原理。从最简单的情形开始,我们思想实验中的生命——就叫它生命1.0吧!
生命1.0:一枝独秀
生命1.0阶段,即只有一个蛋白质分子,它大概就是为生命制造能量货币的ATP合成酶。它的尺寸很小,仅有个纳米那么大,却有许多结构,通过飞速旋转不停地生产ATP。有了它,生命1.0就可以制造ATP分子,然后用ATP来驱动各种生命活动了。
但是生命1.0是难以实现自我复制的。ATP合成酶有一个极端精巧和复杂的结构,每个维度上原子排列的精确度极高。且不说想要分毫不差地复制一个这样的结构非常困难,即便是想要看得清楚一点都不容易。即使在今天人类的技术水平下,想要复制出这样一个结构都如科幻般。在刚刚出现生命1.0的远古地球上,难以自我复制的生命1.0注定要孤独一生,而且它的一生一定非常短暂。
生命2.0:纸上谈兵
为了解决自我复制的技术困难,生命体显然需要一种方法,能更简单精确地记录和复制自身,于是,生命2.0应运而生。
人体中的ATP合成酶是由五千多个氨基酸分子按照某种特定顺序串起来形成的蛋白质大分子。在三维空间中,这些氨基酸彼此作用形成了复杂、动态的三维结构。那么可想而知,只要我们能记录下这五千多个氨基酸分子的先后顺序,然后依样画葫芦地依照这个顺序去组装就行了。这样一来,三维空间的信息就被精简成了一维,只是一组顺序排列的氨基酸分子而已。
在今天的绝大多数地球生命中,三维到一维的信息简化是通过DNA(脱氧核糖核酸)分子实现的。DNA分子的化学构成其实非常简单,就是由四种长相平凡的核苷酸分子环环相扣串起来的一条长长的链条。
图1 三个碱基密码子对应一个氨基酸
它的秘密隐藏在四种核苷酸分子的排列组合顺序中(见图1)。在今天的地球生命体内,DNA长链按照三个核苷酸的排列顺序决定一个氨基酸的原则,能够忠实记录任何蛋白质分子的氨基酸构成——当然也包括生命1.0中的ATP合成酶。图1三个碱基密码子对应一个氨基酸。在今天绝大多数的地球生命中,DNA链上的核苷酸分子会按照三三一组形成“密码子”,每组密码子对应一种氨基酸。这样一来,生命2.0在自我复制的时候,就不需要担心复杂的ATP合成酶蛋白无法精细描摹和复制了。它只需要依样画葫芦地复制一条DNA长链就行了,因为DNA长链本身的组合顺序就已经忠实记录了ATP合成酶的全部信息(见图2)。
图2 DNA 的复制模型。首先,一条DNA 双螺旋链一分为二;随后,两条DNA 单链分别作为模板,与新加入的碱基分子配对,形成两条新DNA 双螺旋
而与此同时,我们可以想象,复制一条可以看成是一维的DNA长链,要比直接复制ATP合成酶的精细三维结构省心省力得多。
那么,简单而强大的生命2.0能否稳定地生存和繁衍呢?
很遗憾,还是不行。事实上它根本就不可能存在。DNA是一种化学上非常稳定的分子——这并不奇怪,能被选中作为信息密码本的化学分子当然必须稳定和可靠,甚至是懒惰。也正因此,一根光秃秃的DNA长链根本就什么都不会干,它既不可能自我复制,也不可能制造出什么ATP合成酶来。就像一本写满了字母的密码本,要是没有人抄写,没有人解读,它自己什么也做不了。
生命3.0:只欠东风
好吧,不气馁的我们继续升级出了生命3.0。这次,我们需要的东西就多了许多。除了负责制造能量货币的ATP合成酶之外,生命3.0还需要一大堆各种各样的蛋白质分子,来实现DNA分子的自我复制,利用DNA分子携带的信息制造各种新的蛋白质。
这些蛋白质分子(见图3),根据DNA密码本的信息制造ATP合成酶——有的负责读取DNA密码本的信息,有的负责搬运蛋白质的原料氨基酸,有的负责氨基酸的装配顺序,等等。
当然了,再多的蛋白质分子也难不倒我们,我们可以利用在生命2.0中就确定的规则,把它们的信息也写入DNA长链中去,这样仍然是复制一条DNA长链,生命3.0就可以把所有蛋白质分子的信息都忠实地复制和传递下去了。
图3 复制DNA 所需蛋白质
图3为复制DNA所需要的蛋白质。图中仅仅呈现了极小的一部分,但我们已经可以看到,DNA复制是一个需要大量蛋白质帮手参与的精细过程。DNA双链首先会在拓扑异构酶和解旋酶的帮助下分解成单链。随后,不同的DNA聚合酶分别负责两个方向的DNA复制,复制完成的短片段还要在连接酶的帮助下连接成长片段。
生命3.0的命运如何?我们已经很接近成功了,但是还差重要的一点点。蛋白质分子和DNA长链,对于生命的生存和复制来说,是相辅相成缺一不可的。我们必须想出一个办法,把这些东西统统聚拢到一起,保护起来。否则,蛋白质和DNA都很容易在自然环境中扩散得无影无踪,谁也找不到谁。
这就需要用一张致密的网把所有蛋白质和DNA都给包裹起来。这张网就是细胞膜,是一层仅有几纳米厚度、由脂肪分子构成的薄膜。这层薄膜紧紧地包裹住了蛋白质和DNA,形成了一个细胞,把它们和危险的自然环境隔绝开来。在今天的地球生命里,除了少数例外(比如病毒没有细胞结构),绝大多数生命都是由一个或者多个细胞组成的。
生命4.0:中心法则
这次,就叫它生命4.0吧。目前,生命4.0已经有点极简版地球生命的样子了。我们权且相信它能够在地球上生存下来,因为它能够不断地从环境中攫取能量供给生命活动,也能不停地自我复制对抗衰退和死亡。实际上,今天的地球生命尽管比我们思想实验中的生命4.0要复杂得多,但是从基本原理上看,确实相差无几。但是新的问题来了:这个看起来靠谱的生命4.0,真的有可能在40亿年前魔法般地出现在地球上吗?换句话说,生命4.0的构想固然有它的内在逻辑,但它真的有可能模拟了地球生命的最初起源吗?
很遗憾,答案是不可能。或者,至少看起来非常不可能。其中的麻烦有点像“鸡生蛋还是蛋生鸡”的问题。蛋白质的全部信息都存储在DNA密码本中,依靠DNA密码本中忠实记录的信息,我们能够制造出各种各样的蛋白质分子。因此,让我们权且假定DNA是“鸡”,蛋白质是它下的“蛋”。
但是,一条孤零零的DNA长链是没有办法干任何事情的,它需要各种蛋白质分子的帮忙,才能实现自我复制,需要依赖蛋白质的帮忙才能制造出新的蛋白质。如果没有提前准备好蛋白质“蛋”,DNA“鸡”根本没法继续生“蛋”!
换句话说,我们设计的生命4.0想要自发出现,我们得不断祈求大自然同时造就信息互相匹配的“鸡”和“蛋”。而且,“鸡”和“蛋”还必须几乎同时出现,距离无比接近,才有可能配合起来造就生命。要是在一阵电闪雷鸣中,一只DNA“鸡”被创造了出来,但是它附近却没有那只冥冥中注定属于它的蛋白质“蛋”,那么这只DNA“鸡”只能沉默着走向分解破碎,因为它自己什么也做不了。而反过来,要是那个蛋白质蛋因为没有DNA“鸡”帮它保留和传递信息,“蛋”必然也会快速走向衰退和死亡。
让我们再回顾一下生命4.0的基本设计原则吧。DNA负责记录蛋白质分子的氨基酸排列信息,以DNA序列为模板可以制造出各式各样的蛋白质分子。而反过来,蛋白质分子除了制造能量,还可以帮助DNA实现自我复制。这好像是个挺简单的二元系统,在自然界,简单往往意味着高效、节约和更容易自发出现。但是很让人意外的是,地球生命不约而同地选择了一种更复杂、相对也更容易出错和更浪费的办法:在DNA和蛋白质的二元化结构之间,平白无故地多了第三者:RNA(核糖核酸)。
这是一种长相酷似DNA的化学物质,两者的唯一区别就是化学骨架上的一个氧原子。对于我们的生命4.0系统来说,RNA显得非常怪异和多余。当生命开始活动的时候,DNA密码本的信息首先被忠实地誊抄到RNA分子上,然后RNA分子再去指导蛋白质的装配。放眼望去,加上RNA的生命——就叫它生命5.0好了——实在是看不出有什么优势。
图4 生命的“中心法则”
然而,这套叠床架屋的所谓“中心法则”(见图4)几乎成了所有地球生命运转的核心,既保证了遗传信息的世代流传,也保证了每一代生命体实现自身的生命机能。这种巨大的反差驱使人们从反方向思考,也许DNA→RNA→蛋白质的系统有极其深远但仍不为人所知的意义,以至于这个看起来如此多余、低效和浪费的系统能够挺过严酷多变的地球环境和物种竞争,保留在绝大多数地球生命的身体里。
依据中心法则,DNA的自我复制保证了遗传信息的传递和生命的生生不息,DNA也通过指导蛋白质合成决定了生命活动的形态。RNA的产生则是其中的一个中间步骤,RNA一方面忠实抄写了DNA的密码信息,另一方面直接指导了蛋白质的制造。(值得指出的是,地球生命中也有不少中心法则之外的生命。比如某些病毒并没有DNA,而是直接利用RNA来存储遗传信息并指导蛋白质合成(例如流感和丙肝病毒)。也有一些病毒虽然使用DNA,但是和图中不同,它们仅有一条单链DNA,只在启动自我复制的时候才变成双螺旋。)
直到1982年,切赫在试管里合成了一个新的RNA分子。然后,利用这条理论上不可能存在污染的纯净RNA,他们确认,这条RNA在什么外来蛋白质都没有的条件下,仍然可以实现自我剪接,把那段没用的中间序列(内含子)切割出来。
事情已经无可置疑,RNA可以自己剪断和粘连自己。RNA分子,居然可以身兼DNA和蛋白质的双重功能:它显然可以和DNA一样存储信息,同时也可以像蛋白质一样催化生物化学反应——在切赫的例子里,这个化学反应就是对自身进行切割和缝合。切赫给他们找到的这种新物质命名为“核酶”(见图5),广泛存在于从细菌到人体的多种生物中。
图5 “锤头”核酶(hammerhead ribozyme),一条RNA链能内部折叠配对,形成一种状似发卡的结构,并能在特定位置实现自我剪切
这个发现具有极其深远的意义,既然在一种单细胞浮游生物体内存在着一种分子,它既可以作为密码本记录生命体的遗传信息,又可以作为分子机器驱动一种简单的生命活动过程,那么举一反三,就会想到,也许曾经存在一大类逻辑类似的核酶分子,它们既能够记录五花八门的遗传信息,又能够实现形形色色的生命机能,一身担起DNA和蛋白质的使命。而只要稍加推广,我们就会发现,核酶的概念似乎可以用来解释生命起源!
核酶这种奇怪的东西,只要想象一个这样的RNA分子,它自身携带遗传信息,同时又能催化自身的复制,那不就可以实现遗传信息的自我复制和万代永续了吗?什么DNA,什么蛋白质,对于伟大的生命起源来说,不过是事后锦上添花的点缀而已!
要知道,虽然切赫发现的核酶确实实现了一点替代蛋白质的功能,但这个功能还是非常简单的。而如果真要设想一种核酶能够实现自我复制的功能,它必须能够以自身为样本,把一个接一个的核苷酸按照顺序精确地组装出一条全新的RNA链条来。这个难度比起RNA剪接,简直是汽车流水线和榔头剪刀的差别。
不过没过多久,大家在研究细胞内的蛋白质生产过程的时候,就意识到RNA的能力远超人们的想象。我们知道,蛋白质分子的生产是以RNA分子为模板,严格按照三个核苷酸分子对应一个氨基酸分子的逻辑,逐渐组装出一条蛋白质长链的过程。这个过程是在一个名叫“核糖体”(模型见图6)的车间里进行的。而从20世纪80年代开始,人们在研究核糖体的时候逐渐意识到,这个令人眼花缭乱的复杂分子机器,居然是以RNA为主体形成的!
图6 核糖体模型
在细菌中,核糖体车间的工作人员包括50多个蛋白质,以及三条分别长达2900、1600和120个核苷酸分子的RNA链。这些RNA链条上的关键岗位对于决定蛋白质生产的速度和精度至关重要。既然连蛋白质生产这么复杂的工作RNA都可以胜任,那还有什么理由说,在生命诞生之初,RNA分子就一定不能做到自我复制。
我们当然没办法看到地球生命演化历史上第一个自我复制的核酶到底是什么样子的,但是如果人类科学家能在实验室里人工制造出一个能够自我复制的核酶,我们就有理由相信,具备同样能力的分子在远古地球上出现,并不是什么天方夜谭。
今天,绝大多数地球生命都在中心法则的支配下生存繁衍,DNA存储遗传信息并持续地自我复制,DNA通过RNA控制了蛋白质的合成和生物体的性状(见图7)。RNA仅仅作为信息流动的中间载体出现,看起来多余而浪费。但是在远古地球,情形可能会很不相同。赞成RNA世界理论的科学家认为,在那时也许既没有DNA也没有蛋白质,而是RNA分子身兼两职:既能代替DNA存储遗传信息,又能代替蛋白质推动各种生物化学反应。而可能在RNA世界出现甚至统治地球之后,今天地球生命的绝对统治者——DNA和蛋白质——才崭露头角。从某种意义上说,它们利用各自的优势,从身兼存储遗传信息和催化生命活动的RNA分子那里抢走了原本属于它的荣耀。
图7 今天的生物世界和RNA 世界
相比RNA,DNA是更好的遗传信息载体,因为DNA的化学性质更加稳定,在自我复制的过程中出错率更低。相比RNA,蛋白质又是更好的生命活动催化剂。由20种氨基酸装配而成的蛋白质分子,比仅有四种核苷酸装配而成的RNA,可以折叠出更复杂的三维立体结构,可以推动更多更复杂的生物化学反应。
因此,在今天的地球上,对于绝大多数生物而言,RNA反而成了一个中间角色,仅仅通过生硬地将DNA插入蛋白质中的信息流动,宣示着自己曾经的无限荣光。仅仅在少数病毒体内,RNA仍然扮演着独一无二的遗传信息密码本的角色。而我们推测,一些病毒之所以至今仍然顽固地抗拒使用DNA作为遗传物质,一个可能的原因是它们需要快速产生变异以逃脱免疫系统的攻击。在这方面,复制环节错误率较高的RNA分子反而具备了独特的优势。
通过思想实验1.0到4.0,我们对生命演化史有了一定的了解。地球生命在诞生之初可能根本不需要独立的遗传物质和催化分子,它们只需要在混乱无序的自然界中建立起精致有序的生命结构。而RNA祖先则肩负起自我复制、为生命开枝散叶的重任。而此后40亿年的漫漫演化,DNA和蛋白质出现,多细胞生物诞生,人类萌生,智慧出现,其实都只是那一次伟大结合的绵绵余韵而已。