我们在这里想象一家高档餐厅的厨房,厨房的食品储藏室里整齐地摆放着各种蔬菜、肉类、鱼、食用油、香料以及调味料。这些食材足以用来烹制任何你想吃的菜品,从家常小炒到异国风味,每一种都色香味俱全,厨师长还要求厨房能够24小时进行供应。调节因子在细胞内扮演的角色之一就像这个厨房里的抠门经理,勒令厨师只能按需取用食材,不忍心把钱浪费在哪怕一个额外的马铃薯上。
不过调节因子扮演的角色不只是经理,还同时兼任厨师长,手握决定每天食谱的大权,指导其他人哪里应该加入一量杯的豆子,哪里应该添加两量杯的鸡汤,哪里又需要少许盐,然后用350摄氏度的烤箱烤制30分钟。这里所说的食谱,正是基因组中每一个基因精密的表达方式。基因的正确表达可以使细胞内每一种蛋白质的数量都保持在恰当的水平。
考虑到生命的复杂性,把一条蓝鲸的基因表达和一个蛋奶酥的配方相提并论,多少显得有失公允。任何一种细胞内的蛋白质成分都远比最精致的料理复杂,数千种蛋白质分子的数量和合成时机在细胞内受到精确调控,哪怕技艺最精湛的五星厨师都对这种火候的控制望尘莫及。不仅如此,进化还在孜孜不倦地研究着新的“菜色”,细胞、组织、器官乃至整体的新性状,都是不断变化的、庞杂的调控系统的产物。
生物调控是发育生物学研究的议题,发育生物学是生物学中研究一个细胞如何发育为一个生物整体的分支学科。发育的过程十分神奇。发育生物学试图解释生物体内的细胞为何不仅仅是一坨松散无形的囊泡,而是能在动物体内发育出如心、肝、肺、脑等器官,在植物体内发育出根、茎、叶、花等构成。
每种器官都有高度精专的分工,并含有许多特异的细胞种类。以你的心脏为例,其中的细胞就包括泵血的心肌细胞、将心肌细胞联络在一起的结缔组织细胞,以及像龙舟上给桨手们提供挥桨节奏的鼓手那样,通过电信号控制心脏搏动节律的起搏细胞,这些都是心脏特有的细胞类型。那么这些特异的细胞是如何从同一个受精卵分化而来,又如何在恰当的时间和位置发生分化的呢?一个细胞要如何知道自己应当分化成起搏细胞,而不是一个神经元或者干细胞呢?
答案就是调控,调控指导着所有生物的发育。多细胞生物体内的细胞通过合成特异的蛋白质完成相应的分化。我们体内的每个细胞都包含有人类全部的基因,细胞的区别源于它们选择性表达的基因。肌肉细胞能够表达马达蛋白,这种小小的分子机器是肌肉细胞能够收缩的关键,所以几乎所有种类的肌肉细胞都表达这种蛋白质。人类的眼睛内有一种透明蛋白,能够透光并将光聚焦到感光的视网膜上。软骨细胞能够表达胶原蛋白和弹性蛋白,作为缓冲物以防止关节骨之间过度的摩擦和损耗。
已分化细胞和特异蛋白之间的关联并不简单,虽然不同的分化细胞的确各自表达着独特的蛋白质,但蛋白质并不能代表细胞的种类。实际上,任何蛋白质都会在多种细胞中表达。眼睛内的玻璃体,即位于角膜和视网膜之间的透明胶体,其中的胶原蛋白与软骨细胞合成的无异;肱二头肌肌肉细胞与心肌细胞合成的马达蛋白同样别无二致,类似的例子不胜枚举。决定一个细胞“身份”的不是某一种独特的分子,而是分子指纹(inolecular fingerprint),即一个细胞内所含有的数百种蛋白质的组合方式。所以新的细胞种类就意味着新的分子指纹,也就是调控下的基因表达的新形式。
对细胞分化起关键作用的基因往往在许多不同类型的细胞中都能表达,所以对这些基因的调控往往需要多个开关。在图5-2中这些开关以小的矩形方框表示,每一个矩形的方框都代表一段不同的关键词,每个关键词都有与之结合的调节分子(图中的其他形状)。典型的例子有编码晶状体蛋白的基因,这是眼内晶状体分子指纹中的成员蛋白之一,正是依靠它我们的眼睛才能进行聚焦(我们会在第6章对这个基因展开更多讨论)。
图5-2 一个基因与多个调控分子的对应关系
晶状体蛋白至少有5个调节分子,Pax6就是其中之一,它通过结合在基因附近的区域决定基因表达与否。有的调节因子与DNA结合紧密,所以能够强烈影响基因的表达;而有的则结合疏松,对转录的影响也就相对较弱。调节分子对多聚酶转录基因的干预,就如同内阁议员们向国王进谏施压。有的调节分子倾向于抑制基因表达,有的则倾向于激活;有的对基因表达影响重大,有的则无足轻重,所有调节因子的效应总和决定了基因表达与否。
那么是什么在调控调节因子?很简单:其他调节因子。图5-2中调控基因的所有调节因子本质上都是蛋白质,和其他所有蛋白质一样,它们都由各自的基因编码,而基因则受到调节因子的调控。调节晶体蛋白表达的Pax6不仅在晶状体内,也同样在角膜、胰脏以及发育中的神经系统内表达,它的表达受到多种调节因子的共同调控。那么如何调控这些调节因子呢?当然是再依靠其他调节因子。那么调节因子的调节因子呢?当然是依靠新的调节因子。所有这些调节因子形成了一条花环链,调节分子之间的级联关系如图5-3所示。
一眼看去,图5-3中的级联关系已经足够繁杂了,不过现实中的基因调节远比这复杂得多:调节因子之间的相互调控不仅是线性的,甚至可以是环形的。图5-4示意了5种调节因子基因之间形成的环状调控通路,5种基因依次用小方块和方块里的A到E表示。出于简便考虑,图里没有画出调节因子在DNA上的识别位置,只标出了调节因子之间相互调控的关系,黑色的箭头意味着调节因子能够激活目标基因,而灰色的直线则表示调控因子会抑制目标基因。简而言之,这些基因之间能够相互促进或者抑制。图中的虚线则表示情况更加复杂的关系:每种调节因子还掌控着其他数百个基因的命门,它们都不在这个环里。
图5-3 调节因子级联图
图5-4 环形调控回路
Pax6基因正是这种环形回路里的一员,它的变异会引起严重的后果,也反映出调节环路的威力:人类具有Pax6基因缺陷会导致先天性虹膜缺失,同时伴有晶状体浑浊以及视网膜退化,从而致盲。作用与Pax6类似的基因在许多动物身上都扮演着相同的角色,包括老鼠、鱼类和果蝇,虽然它们的眼睛与人类相比在结构上有着天差地别。果蝇体内的“Pax6”被称为eyeless,顾名思义,没有eyeless基因的果蝇无法发育出眼睛。不过当果蝇体内的eyeless过剩时,结果更惊人。生物学家在果蝇胚胎内原本不会表达eyeless的部位激活了这个基因的表达,结果是果蝇在触角、腿部甚至翅膀上都发育出了眼睛。
图5-4看起来有点像工程师画的布线图。考虑到基因的不寻常性,即便基因之间并没有线条把它们连接起来,这样的比喻也还算合理。类似的布线图是一种记录环路基因型的简洁手段,其中包含编码调节因子的DNA以及调节因子识别与结合的关键词信息。只需要简单一瞥,你就能知道图5-4中的基因A能够激活基因B和C,而D能够抑制C等。在活细胞内,基因之间的相互激活和抑制构成了一部交响乐,每一个基因都相当于一种乐器,它们跟随着相互之间的旋律与节奏演奏,直到整个环路达到平衡——就像复调闭和弦,环路中所有基因的表达都不再变化。
在这个平衡点上,环路内有的基因被关闭,而有的则被激活。举个假想的例子,图5-4中的A和C基因可能在平衡后处于激活状态,而B、D和E则会被关闭。所有基因的开闭状态(例如,“开”“关”“开”“关”“关”)被称为“基因表达谱”(gene expression pattern),由于环路里的基因调控着许多其他基因的表达,所以基因表达谱除了是环路本身的表现型,同时也决定了细胞的分子指纹。基因表达谱是又一种无法被直接感知,只能通过精密设备进行测量的指标。但它又与最明显的表现型有关,即生物躯体的形态。于是,想要新的生物形态首先要有新的基因表达谱。
基因调节环路塑造了千奇百怪的生物形态,从聚集在腐烂水果上的果蝇到遍地丛生的拟南芥,再到斑马鱼——一种身长不到10厘米、全身布满条纹的淡水鱼。这几种生物都非常不起眼,但是有两个特征使它们成了研究发育的理想实验对象:它们身形娇小且繁殖迅速,能够让我们在短时间内研究大量的个体样本。
我们从它们身上学到的一点是,调节环路对身体形态的调节速度非常快,令人难以置信。黑腹果蝇(drosophila melanogaster)的幼虫在果蝇产卵后的15小时之内就会孵化,紧接着在7天之内就会完成化蛹和变态,发育为成年果蝇。一个生命从无到有只需要15个小时,还可以独立捕食、爬行、在世间游荡,这也就难怪成千上万的科学家殚精竭虑想要弄清楚果蝇的基因到底是如何工作的。
果蝇的身体主要有三个组成部分,这三部分又可以再细分为14段体节:头部为单独的一部分,胸部占三段体节,腹部占11段,每一段体节各司其职,负责爬行或是生殖的功能。对于大多数人而言,果蝇既不漂亮也不高贵:这种卑微的虫子根本无法与翅膀华丽的鸟儿,抑或与雄伟的巨型红衫相提并论。不过,14段体节和它们的作用对于果蝇来说,犹如哥特式教堂的飞扶壁和帕提侬神庙的多立克柱式,科学家研究体节得到的启迪堪比在生命科学任何其他领域的所得。直到今天仍然有许多人,从学习生物学的高中生到诺贝尔奖得主,都还在研究果蝇的体节。体节是研究基因调控的理想素材,体节研究中得到的许多原理在其他动物体内同样适用。
果蝇在产卵前会在卵内植入一些短小的遗传物质片段作为化学信号,帮助幼虫发育。这之中就包括一种名为bicoid的基因的RNA转录产物,利用它,果蝇卵能够翻译出一种bicoid蛋白。(没错,研究果蝇的生物学家在取名的时候通常没那么讲究。)bicoid蛋白集中在受精卵的前部和将来会发育为果蝇头部的位置。bicoid蛋白就像一滴坠入水里还来不及扩散的糖浆,它在果蝇受精卵内的浓度在离开前端之后呈现迅速衰减态势。
除了bicoid之外,果蝇妈妈还在受精卵的前端留下了几种其他基因的RNA转录产物,同样的道理,受精卵的后端也有独特的化学信号,在离开后端之后它们的浓度也迅速衰减。果蝇妈妈的工作完成之后,胚胎的每一个部分都会拥有自己独特的调节因子组合,如同条形码一样,独一无二。
当一个精子与卵子相遇,受精卵便会形成并开始分裂。胚胎发育中会根据母亲留下的RNA分子决定合成蛋白的种类。在每一个胚胎子细胞内,蛋白质的合成数量都由母亲预留的RNA决定。而这些胚胎中早期合成的蛋白质正是决定其他基因开闭的调节因子,某个基因的开或关取决于对应调节因子的数量。举个例子,如果一个基因的激活因子只在受精卵的前端十分丰富,如bicoid,那么这个基因只会在受精卵前部被激活表达。
在早期调节因子调控的基因中有一些比较特殊,它们本身也是调节因子,用来激活别的基因,而进一步激活的基因中又有一些是编码调节因子的,以此类推。不仅如此,调节因子之间还会逐渐形成相互调控。最复杂的调控环路中涉及多达15种不同的基因,这个环路里的基因均执行着我上面所说的相互调节,结果是有的基因最终得以表达,而有的则没有,形成了自己独特的基因表达谱。
调控环路中有一种格外特殊的蛋白质,名叫齿状蛋白(engrailed)。经过与别的基因相互作用和影响,齿状蛋白在胚胎里呈现高度规律的间隔表达。果蝇胚胎中有7个区域表达齿状蛋白,另外7个则不表达,两种区域间隔分布,形成了果蝇体节最早的划分依据。接着,齿状蛋白以及别的调节因子继而控制其他基因表达,决定一段体节究竟是发育出腿,还是萌出翅膀,抑或是参与构成腹部。
上面的过程以及更多没有提到的变化都发生在数个小时之内。不过果蝇胚胎受到发育生物学家们的普遍青睐,不仅仅是因为它的发育速度:在果蝇体节完全形成之前,胚胎细胞之间还没有被彻底分隔。换句话说,分子在成长的胚胎里能够自由出入不同的细胞。而对于大多数其他物种而言,胚胎细胞在受精后几乎会立刻与别的细胞分隔,这让细胞间的交流通信变得异常困难。
当然这并不意味着根本不可能。男性的生殖器官阴茎和阴囊就是一个典型的例子。当男性胎儿发育到8周的时候,一小簇睾丸间质细胞(leydigcells)就会在将来发育出性器官的位置附近释放雄性激素。雄性激素中包括睾酮等对塑造性器官至关重要的激素,激素会指导周遭的细胞向阴茎和阴囊分化,并在日后分化出精子细胞。雄性激素从睾丸间质细胞内被分泌出来后会进入细胞之间的空隙,雄性激素的分子结构能够让它随意穿过细胞膜,进入另一个细胞内。
在新细胞内,雄性激素的受体,即一种能够识别雄性激素分子形状的特殊蛋白质,早已等候多时。当两者相遇时,受体分子的形状就会发生改变,形成一把分子锁。蛋白质的形变让它能够识别DNA上的某个关键词,并激活相邻的基因。雄性激素受体能够激活许多不同的基因,其中就包括某些调节因子,它们在雄性器官内维持着数百个基因的激活状态,正是这些基因赋予了男性生殖器官中的细胞独特的分化性质。
从果蝇到人类,胚胎发育的每时每刻,所有组织内都在发生类似的信号交联,涉及的信号分子数以百计。正是在这种超乎常人想象的信号交流过程中,细胞得以确定自己的位置和命运,就像表达bicoid的细胞们“知道”自己位于胚胎的“头等舱”一样。基于同样的原理,细胞在信号指令的操控下分裂、移动、膨胀、收缩并变得扁平,最终完成细胞分化和生物塑形。不管何时,当细胞需要发生分化,生物形态需要进行重塑时,都逃不过细胞对信号分子表达的调整。
如果我们能够弄清从果蝇到人类胚胎发育的调节方式,我们就能预测器官、组织和细胞的形成,以及为何不同的生物在外形上千差万别。如此,真可谓大功一件。然而不幸的是,环路体系的表达谱着实庞杂,即便像图5-4中画出的经过简化的环路依旧十分复杂。如果说A能够激活B,而C却抑制B,B能够激活C,而D则抑制C,那么我们很难一眼看出各个基因最终的表达情况。实际情况是,许多现实中的环路含有的基因数量比图5-4要多得多,数十种调节因子像尼龙绳一样相互交织,繁复程度远远超过我们大脑的处理能力。不过也不是毫无办法,我们还有能够利用数学运算模拟环路内分子关系的计算机,与我们的碳基大脑不同,科学家可以依靠硅基大脑的算法,预测环路内所有基因最终的基因表达谱。
曾经有一名杰出的计算机科学家耗费毕生精力试图完成这项工作,他的名字叫约翰·瑞尼茨(John Reinitz)。20世纪90年代,当我还是耶鲁大学一名研究生的时候见过约翰。他比我年长几岁,大家都称他为怪胎,在那个抽烟并不光彩的年代,他时刻烟不离手。即便是在星期五便装日,他也衣冠楚楚,一丝不苟。他开着一辆古董级的大众甲壳虫,后座上堆满了垃圾食品的包装盒。约翰叛逆、不拘小节,他敢于挑战主流的勇气对他的研究来说简直是无价之宝。
当时有许多科学家在研究果蝇的胚胎,而计算机对于他们的价值仅限于写论文。多数人研究果蝇主要是通过改变DNA与编码的基因,或者是在实验室里控制某种调节因子的表达,然后观察这些改变对于体节发育的影响。这些科学家的实验同样多产:其他的暂且不论,他们在果蝇基因组中找出了数千种与胚胎发育有关的关键基因。但是对于理解整个表达环路中的基因表达谱而言,单个基因在整体中显得微不足道,实验科学家们一次只能针对一个基因的研究手段注定收效甚微。虽然今天科学界已经普遍接受了这项技术,但是在20世纪90年代早期,约翰试图用计算机模拟果蝇的想法根本不被一众科学家看好,甚至遭到了少数人的无视及鄙夷。
约翰的想法有点像建造一台飞行模拟器,后者对于培训空军和商业飞行员来说不可或缺,它不仅可以模拟整套驾驶舱的操作机械,还能够模拟飞行中受到的气流干扰及仪表故障。与之类似,约翰收集了果蝇胚胎早期发育中的各种调节因子,以及它们相互之间调节关系的海量信息,将这些信息代入算法,并在计算机中模拟果蝇发育的过程。就像那些运行效果优良的飞行模拟器一样,约翰的果蝇模拟器也得以顺利运行——这可不是一件容易的事。果蝇模拟软件能够模拟果蝇胚胎的早期发育,而且运算速度惊人。它能够不断重复运算,直到保证没有任何算法遗漏。正如飞行模拟器能够模拟坠机,除了演算正常胚胎的发育,果蝇模拟器还能模拟基因表达调节异常的情况下,不同基因突变如何导致胚胎发育畸形。
我在这里写的这几行字几乎相当于约翰在过去几十年里花费的全部心血,他在建立果蝇模拟器的过程中受尽了同行的冷漠和蔑视。当我抬手准备拍死一只苍蝇的时候,脑海里经常会闪过他默默奋斗的身影。(然后世界上就少了一只苍蝇。)