这一期,我们接着讲四位科学家围绕发现 DNA 形状的江湖恩怨故事,这个故事特别能印证平哥经常说的那句话:科学家也是人,有人的地方就有江湖。
在 DNA 结构研究上,开始遥遥领先的是女科学家罗莎琳?富兰克林,当时她手里握着最可能的 DNA 结构的图像,并且通过 X 射线晶体学得到了应证,这个技术是由莱纳斯?鲍林完善起来的。如果把发现 DNA 结构比作一场重要的考试,富兰克林差不多正确答完了所有的基础题,只剩下一些大题还要作答。在当时,晶体照相术已经被成功地用来绘制晶体中的原子,但绘制 DNA 分子是一个更大的挑战。只有富兰克林能设法得到需要的实验结果。但她拒绝分享自己的发现,这让威尔金斯一直怀恨在心,要知道威尔金斯一直觉得富兰克林只是给自己打打下手的助理,现在不但风头盖过了自己,而且表现的并不友善。
如果富兰克林不是对自己的实验结果这么藏着掖着,所有的矛头就不会一下子都指向她。上世纪 50 年代,国王大学的女性学者遭到了从上而下的一致蔑视,这和现代的理性观点是格格不入的,或者说,无论放在哪个时代,这么做都不合适。那个年代,即使一位女性学者已经身居高位或者事业有成,她也不能进入大学里的高级休息室用餐,只能在小房间里将就一下,连沃森也承认这种房间“黑漆漆的脏兮兮的”,沃森就是说富兰克林虽然长得还行、但穿衣品味一塌糊涂的那位。这还不算什么,对富兰克林来说,最麻烦的是会不断遭到打压,有时甚至是骚扰,因为有三个男人偷偷算计着和她共享研究带来的荣誉,他们迫不及待地想要获知研究成果,却忘记了最基本的尊重。克里克后来回忆说,“恐怕我们摆出的姿态,都是居高临下以恩人自居的”。三个男人里有两个来自有竞争关系的机构,还有一个或多或少和他们是一丘之貉。所以也就不奇怪,富兰克林把自己的研究成果藏了起来。
威尔金斯和富兰克林处不好关系这件事,被沃森和克里克利用了起来。尽管这两人公开踏足了威尔金斯的领域,但威尔金斯本人却越发站队到了他们这一边。这也并非完全出乎意料,要怪只能怪富兰克林自己对重要事件的处理变得越来越怪异。富兰克林的实验结果显示 DNA 一定是螺旋状的,但她却对所有人坚持说不是这种形状。明知会让威尔金斯既沮丧又尴尬,但富兰克林 1952 年的夏天还是在国王学院的物理系里张贴了一张嘲弄的布告,上面写着:“很遗憾我们必须在 1952 年 7 月 18 日星期五来宣布 DNA 螺旋结构的寿终正寝,希望威尔金斯博士能致悼词。”
这样闹腾的结果就是在 1953 年 1 月,威尔金斯给沃森看了富兰克林的图像,富兰克林显然对此一无所知,否则也不会同意。这极大推动了沃森研究的进展。很多年后,沃森自己也承认,这是一次关键的事件,用他自己的话说,“这使我们的脑子活络了起来”。这有点像考试作弊,看到了标准答案的一半,再补足另一半就不会那么难了。沃森和克里克已经知道了 DNA 分子的基本形状和有关它尺寸的重要信息,他们在研究上铆足了干劲拼命使力。老天似乎也站在了他们一边。还记得我说过当时美国最有可能赢得竞赛的著名生物学家莱纳斯?鲍林吗?当时,鲍林本来要去英格兰参加一次会议,如果去成了他肯定能见到威尔金斯,那时候的威尔金斯心态可能已经不是太正常了,他觉得只要不是富兰克林率先发现 DNA 的形状就行,敌人的敌人那就是朋友。如果鲍林能早一点知道 DNA 的形状,那诺奖的历史可能就要改写了。哪知道,人算不如天算,那时刚好是麦卡锡时代,鲍林在纽约的伊德尔维尔德机场过境时被关押了起来,这个机场就是现在的肯尼迪国际机场,他的护照也被没收了,理由是他是一名自由主义者,不适合出国旅行。要说克里克和沃森走运的地方还不止于此。鲍林的儿子在卡文迪许实验室工作,没心没肺的他一直向两人通报父亲研究的最新进展。
我们再说沃森和克里克,他们就怕被对手迎头赶上,也是全身心地扑在了研究上。当时已知 DNA 有四种化学成分,分别是腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶,它们以特定的方式配对。通过不断琢磨切成了分子形状的硬纸板,沃森和克里克弄明白了这些碎片是如何拼接起来的。他们由此制成了一个钢结构的模型。这个模型由金属片以螺旋形状组装在一起,它或许是现代科学史上最著名的模型之一了。模型做好后,两人随即邀请了威尔金斯、富兰克林以及这个领域的其他专家来鉴赏。只要是对 DNA 领域有一些研究的人,都可以一眼就看出,他们解决了这个问题。毫无疑问,这是一次对科学精彩的探秘,至于是不是受到了富兰克林图片的启发,已经无关紧要了。从我看到的材料,富兰克林从头到尾,直到去世,都不知道威尔金斯把她给卖了,自己的研究成果被拿给了她的死对头看。
1953 年 4 月 25 日的《自然》杂志刊登了一篇题为《脱氧核糖核酸的结构》的文章,这篇文章仅仅只有 900 个英文单词,由沃森和克里克撰写。同时刊登的还有分别来自威尔金斯和富兰克林的文章。不过,悲催的是,富兰克林的文章是放在其他三个人之后的,给人的感觉是她只是做了一些核实工作,和这起重大发现的主要贡献者扯不上关系。那时的世界风起云涌:埃德蒙德?希拉里即将问鼎珠峰,伊丽莎白二世不久也将皇冠加冕。所以发现生命之谜这件事显得有些波澜不惊。它在《新闻纪事》中被捎带提及了一下,其他地方则对它视若罔闻。
罗莎琳 ?富兰克林没有和其他人共享诺贝尔奖。她 1958 年死于卵巢癌,年仅 37 岁。四年后,诺奖颁布,但不能追授。几乎可以肯定,富兰克林患上癌症和她常年因为工作,过度暴露在 X 射线下有关,而这本来是可以避免的。在最近一本颇受褒奖的有关她的传记中,布伦达?马多克斯指出,她很少穿防铅围裙,走在 X 光前也无所顾忌。
我讲的这些围绕着 DNA 结构发现史的故事,是综合了《万物简史》的原著以及 TED 上的演讲和其他网上查阅到的一些我自己觉得还算可靠的资料写的。但是,说实话,这种科学史的故事,永远会存在着各种不同的版本,这些科学家之间到底发生了些什么,总是会有各种各样的争议。所以,如果你在其它材料上看到了与我讲的这些不一致的说法,这很正常,不用大惊小怪。我也没觉得我说的这些故事就一定是靠谱的,毕竟我们后人都是只能通过各种二手材料来编故事。
DNA 的双螺旋结构并没有一经公布就轰动了世界,事实上,沃森和克里克的发现直到上世纪八十年代才真正得到证实。就如同克里克在他的一本书作中所描述的那样:“从可能正确到很可能正确,我们的 DNA 模型用了超过 25 年的时间来证明自己,但在这之后,它的正确性就得到了公认。”
虽然验证花的时间很长,但科学研究一向秉持的态度就是非同寻常的主张必须要有非同寻常的证据,只有这样,才能保证科学大厦的稳固。但随着 DNA 结构的公布,科学家们很快就在遗传学上获得了进展。到了 1968 年,《科学》杂志甚至发表了一篇题为“分子生物学即将成为过去时”的文章,它提出了一个让人难以置信但听上去也有点道理的观点——遗传学的研究工作已经接近尾声了。
这个观点显然是生物学家们自大了,新的研究工作事实上才刚开始。即使是现在,关于 DNA,我们了解的也不是很多,特别是 DNA 中有很大一部分看起来一点用都没有,这一点太让我们摸不着头脑了。97% 的 DNA 似乎没有什么特别的用处,只是一段很长的毫无意义的乱码,生物化学家喜欢称之为“垃圾”或“非编码 DNA”。你只有沿着每一条链,才能不时在这里或那里发现控制和组织重要功能的部分,这就是奇怪的、一直让人难以捉摸的基因。在《科学》杂志 2018 年创刊 125 周年之际,公布了 125 个最具挑战性的科学问题,其中第 67 个问题就是 DNA 中的这些垃圾到底有没有用?
我们把 DNA 长链上有确切功能的片段称为“基因”,更具体一点说,基因就是制造蛋白质的指令。基因发号施令一直是规规矩矩、不厌其烦。从这个意义上来说,基因很像钢琴的琴键,每个琴键只能不多不少,发一个音,虽然单调,但职责明确。而如果把基因结合起来,就像你把琴键组合起来一样,就能创造出无限变化的和弦和旋律。继续打比方就是,如果你组合了所有的琴键,就可以创造出伟大的交响乐,就如同把所有基因结合起来,就有了人类基因组。
另一种更常见的理解基因组的方法是把它看成一本身体指令的手册。这么想的话,染色体就是这本书的章节,而基因就是制作蛋白质的单独指令。撰写指令的单词是密码子,组成单词的字母是碱基。碱基就是遗传密码的字母。它由四种核苷酸组成,分别是腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶。虽然这四种物质起着重要的作用,但它们的组成却并不独特。举个例子,你知道鸟嘌呤这个名字是怎么来的吗?因为鸟嘌呤广泛存在于鸟粪中。
众所周知,DNA 分子的形状就像一个螺旋形的楼梯或扭起来的绳梯,这就是著名的“双螺旋”结构。这种结构的支柱由一种被称为脱氧核糖的糖类组成,整个双螺旋则是由核酸组成,所以 DNA 的学名为“脱氧核糖核酸”。结构里的梯级由两个碱基跨越中间的空间相连而成。它们只能以两种方式结合:鸟嘌呤总是与胞嘧啶配对,腺嘌呤总是与胸腺嘧啶配对。如果用字母来写的话,就是G与C配对,A与T配对,这些碱基的出现顺序构成了 DNA 的密码,人类基因组计划就是为了破解这些密码。
DNA 的绝妙之处就在于它的复制方式。当需要生成一个新的 DNA 分子时,两条单链从中间平分开,就像拉开一件夹克的拉链,然后每条单链都脱落去形成新的组合。由于沿着一条单链的每个核苷酸都会与其他特定的核苷酸配对,所以每条单链都可以作为创建新匹配链的模板。如果你的 DNA 只有一条单链,那么你可以很简单地通过建立必要的组合来重构另一条与之匹配的单链。假设一条单链上的最顶层由鸟嘌呤构成,你就知道匹配链上的最顶层必须是胞嘧啶。一路往下进行核苷酸的配对,最终你将得到一个新分子的密码。这就是自然界发生的事情,一眨眼几秒钟的功夫就能完成,虽然工程量着实巨大。
大多数时候,我们的 DNA 尽职尽责毫无差池地进行着复制工作,但偶尔,概率大约是百万分之一,生成的核苷酸放错了地儿。这种错误就是单核苷酸多态性(SNP),生物化学家一般把出错的核苷酸称为“Snip”。通常,这些 Snip 深埋在非编码的 DNA 片段中,身体也察觉不出它出错了。但身体不时也会对它作出反应。Snip 可能会使你更容易患上某种疾病,不过很公平,它也可能带来些好处,例如更多的保护性色素 、使生活在高海拔地区的人生成更多的红细胞等等。日积月累,这些细微的变化会积累起来,个人也好,人群也罢,特征都会越来越明显。
在亿万年的演化过程中, DNA 复制的准确度和出错率会达到一个微妙的平衡,错误如果太多,身体将不能运作自如。但如果错误太少,人的适应性就会下降。机体在稳定性和创新性上也有着类似的平衡,这种平衡是人类必须的。红细胞的增加可以帮助高海拔地区的人群呼吸和移动起来更轻松,因为红细胞增多后能携带更多的氧气。但红细胞增多也会使血液变得粘稠,如果红细胞加的太多,心脏泵血“就像用泵抽石油”,心脏的负担一下子就加重了。因此,高海拔地区的人获得了更高的呼吸效率,但是,付出的代价却是心脏病风险的增加。达尔文的自然选择理论,就很好地诠释了这些。这套理论也能很好地解释为什么我们是如此的相似。
你和我的基因有着 0.1% 的差异,这是由 Snip 造成的。现在,你把你的基因和第三个人进行对照,仍然是 99.9% 完全一致,但 Snip 的差异大多是在和我不同的地方。把更多的人拉来进行对比,你会发现更多不同地方的 Snip 差异。我们每一个人的身体里都有着 32 亿个碱基,所以,准确地说,并不存在一个标准的“人类基因组”,每一个人都有每一个人的基因组。但从宏观上来看,我们所有人的基因有 99.9% 是相同的。所以,如果盯着基因看,我们每个人都几乎一模一样,但如果盯着 Snip 看,那么我们又可以说,这世界上没有完全一模一样的两个人。哪怕将来克隆人出现了,Snip 也是不可避免的,DNA 在复制的过程中,必然会出错。
我们现在依然无法解释为什么那么多数量的 DNA 只是漫无目的地存在。这么说或许会让人有些不安,但事实却是生命的目的好像就是为了使 DNA 永存,用生物学家马特?雷德利的话说,“它们的存在纯粹只是因为它们擅长自我复制”。换句话说,你身上大多数的 DNA 不是为了你、而是为了自己而存在。你是对它有益的机器,而不是,它是对你有益的物质。按照道金斯在《自私的基因》中的观点,生命是因为 DNA 的需要而变成了现在的样子。
但我总算找到了垃圾 DNA 的一个用处,它可以帮助警察破案。1986 年,生物学家杰弗里斯就帮助警方,利用 DNA 比对技术,主要就是比对了那些垃圾 DNA,成功地给两起谋杀案的嫌疑人定了罪。
令人意外的是,即使是那些有确定功能的基因,也不全都是对生命的健康成长有益的。也就是说,有时候我们的身体花费了巨大的能量来生成一种毫无益处的蛋白质,这种蛋白质甚至还会对我们造成致命的伤害。我们的身体毫无选择,只能照做,因为这是基因下达的命令,我们对基因从来就是言听计从。总之就目前的发现而言,将近一半的人类基因除了复制自己无所事事,这个比例是所有生物中最高的。
所有生物在某种意义上都是他们基因的奴隶。这就是为什么三文鱼、蜘蛛以及其他不计其数的生物做好了在交配中死亡的准备。繁殖后代和传递基因的欲望是大自然中最强烈的冲动。从进化的角度来看,性满足是一种奖励机制,鼓励我们向后代传递基因。