我们在第3章里看到,在进化过程中,有几十亿读者通过基因型网络探索着代谢图书馆各个角落里的不同社区。尽管有些探索者掉下网络一命呜呼,但也有一些探索者通过网络发现了新表现型的进化文本。基因型网络或许同样可以服务于蛋白质,前提是蛋白质图书馆里的社区也具有多样性。否则,进化的蛋白质还不如待在原地不动。因为如果图书馆不同区域堆放的书籍相同,也就没有探索图书馆的必要了。
图书馆中每个蛋白质附近书架上的文本是否意义相近,是否就像现代社区中大同小异的家家户户?还是更像中世纪的村庄,风格独特,魅力各异,所含蛋白质拥有独一无二的新功能?尽管我们研究了几十年蛋白质,如今甚至可以用计算机挖掘堆积如山的蛋白质数据,但是对于这个问题,直到现在我们也没有找到答案。
要回答这个问题,光有计算机还不够,还需要热爱书本的图书管理员。一个年轻的智利研究者埃万德罗·费拉达(Evandro Ferrada)带着这份热爱来到苏黎世,加入了我们的研究小组攻读他的博士学位。埃万德罗曾经有过研究蛋白质的经验,他能熟练地从巨大的蛋白质数据库中筛选出所需的信息,不论是蛋白质的折叠方式还是蛋白质分子内的原子信息。埃万德罗个性安静,常常陷入沉思,这种个性我以前在别人身上见过,这些人常常与生命的深层奥秘缠斗。也许这也是他同意研究这个问题的原因,因为蛋白质的空间结构正是这样的奥秘:挑战性强,意义深远,异常艰难,但也不是没有被解决的可能。另外,蛋白质的空间结构里还隐藏着蛋白质进化的秘密。
埃万德罗重点研究的是酶,因为这类蛋白质的种类异常丰富。这毫不意外,因为酶需要催化5 000多种不同的化学反应。科学家已经对酶进行过深入研究:他们已经把蛋白质图书馆中散落的几千种蛋白质标记了出来。一旦我们知道了酶的精确位置,就可以用计算机进行分析。埃万德罗利用电脑选出一对蛋白质,它们的折叠方式相同,但在基因型网络中处于不同位置。紧接着,他检验了第一个蛋白质所在社区的一小部分相邻蛋白,列出了其中所有已知的蛋白质和它们的功能。之后,他以相同的方式检验了第二个蛋白质所在的社区,列出了经过检验的所有已知蛋白质和它们的功能。他比较了两张列表,关注点集中在两个列表中的蛋白质是否相同,以及两个社区的蛋白质功能是否相同。然后他选取了另一对蛋白质,重复相同的检验过程,关注相同的问题,直到他研究了几百对蛋白质和它们所在的社区。
最终的答案很简单:即使两个蛋白质在图书馆里离得很近,它们的社区内包含的大部分蛋白质功能也不同。比如,某两个蛋白质中存在差异的氨基酸只有不到20%,即便如此,它们各自所在社区里的蛋白质的大部分功能也都不同。蛋白质图书馆和代谢图书馆一样,社区高度多样化。出于同样的原因,这种多样性使得庞大的基因型网络与探索蛋白质图书馆的过程相适应,蛋白分子在保存原有意义的同时,拥有进化成为功能不同的新蛋白质的巨大潜力。
代谢图书馆和蛋白质图书馆中充斥着基因型网络,这些网络由含义相同的文本构成,每个文本都被放置在高维空间的超几何体上,两个图书馆里的多样性社区数量也都多得难以想象。它们彼此间有诸多相似之处,但都与人类图书馆大相径庭。不过这也没什么好奇怪的,因为远在人类出现之前,它们就已经存在了。