外面正在下着DNA。我的花园位于牛津运河的岸边,花园的尽头栽着一棵大柳树,它正在向空中撒播毛茸茸的籽。空气一阵阵地流动着,这些籽向外面的各个方向飘飞。我的目力所及之处--整个运河的水面都变白了,上面漂浮着棉花样的斑点,因此我们能肯定在其他方向也同样如此。这些飞絮大多由纤维素组成,使包含了遗传信息DNA的荚显得很小。DNA的内容肯定只是其中的--d,部分,那么为什么我刚刚说外面芷下DNA而不是纤维素呢?答案是:DNA起着决定作用。纤维素软毛尽管很大,但只是起到降落伞的作用,最终没有什么用处。棉毛、柔荑花以及树等所做的一切都是为了完成这一件事:将DNA散播山野各处。不只是撒播某一个DNA,而是撒播所有的其编码详细解释柳树(这柳树将释放出新一代毛茸茸的种子)生长指令的DNA。这些毛茸茸的东西,确切地说是在散播着制造自:身的指令。它们之所以在{UL,是因为它们的祖先都是这么做的。,在NL,外面在下着指令,在下着程序,在下着生长的树,撒播的茸毛以及运算的法则。这并非是一个暗喻,这是很浅显的真理。如果说在下着松软的碟片,这才会令人费解。
虽然很浅显,也很真实,但它长久以来不被理解。多年以前,如果你问任何生物学家,生命之于非生命,到底有何特别之处。他会告诉你,有一种特殊物质叫原生质。原生质不像任何其他物质,它是至关重要的,是生机勃勃的,是跳动充满活力的,是"暴躁易怒"(学校校长用于形容反应迅速的词L)的。如果你把一个生命体切分成更小部分,你最终会得到纯粹的原生质的微粒。在8世纪的某个时候,一位类似于柯南道尔式的人物,即柴林格教授,他认为海底的抱脚虫软泥就是纯粹的原生质。当我还是一一个学生的时候,那些高年级课本的作者尽管原本应该知道得更多,但他们仍然在书中写作原生质。现在,你永远不会听到或看到这个词,它就像原生质本身以及所谓的宇宙乙醚一样消失了。有关组成生命的物质,没有任何特殊之处。生命是分子的集合体,就像别的事物一样。
特别之处在于,这些分子放在一起的模式要比非生命物质复杂得多,而且这种放在一起的过程是由接下来的程序以及所形成的一套指令来完成的。这些程序和指令存在于有机体本身。也许它们的确是不安地摇摆、悸动、跳动着的,并散发出生命的热量,但这些特性全都是偶然出现的。在每个生命的心脏中所存在的既不是火,也不是温暖的呼吸,更不是"生命的火花"。它是信息,是语句,是指令。如果你想要一个暗喻,不必联想到火或者是火花、呼吸之类的词;相反,应当想到刻在水晶块上的0亿个独立的字码。如果你想理解生命,不要联想生机勃勃的、跳动的凝胶或软泥,而是应当想想信息技术。这就是我在前面的章节中认为蚁后是数据信息库所暗示的意思。
先进信息技术的基本要求是某种有着大量的记忆单元的储存媒介。每个单元必须能够处于独立的状态。数字信息技术现在已经统治了我们这个充满技巧性的世界。有一种基于模拟信息基础上的其他类型的信息技术。比如一台普通留声机记录的信息是模拟的,它储存于波纹状的凹槽中;而现代激光唱机(通常被称为"压缩光盘",这是有些遗憾的,因为名字不够有内涵,也经常错误地将重音放在第一个音节上)是数字式的,其信息储存于一系列细小的凹点中,每个凹点很明确地要么就在这,要么就不在这,没有中间状态。这就是数字系统的诊断特性,其根本元素很明确地,要不就处于这种状态,要不就处于另一状态,没有中间状态,没有所谓的折中。
基因的信息技术是数字的。这一事实由孟德尔在8世纪末发现。孟德尔认为我们不会来自父母的遗传混合。我们从独立的微粒中获得遗传。至于所说的每个微粒,我们要么就继承它,要么就不继承它。事实上,就像新达文主义的开山祖之一R.A.费歇所指出的,每次我们想到性别的时候,微粒遗传总是写在我们的脸上。我们从男性和女性父母那儿继承了特质,但是我们每个人要么是男性,要么是女性,而不会是雌雄同体。每个新生婴儿在继承男性或继承女性两方面都有约略等同的可能性,但任何一个婴儿只可能成为其中的一个,而不会是将两者混合。我们现在知道,同样的事情也发生在我们继承的微粒上。它们不混合,当它们一代代地往下遗传时,各自保持独立和分离。当然,通常也有遗传单元作用于身体而出现明显的混合迹象。比如,二个高个男子和一个矮个女子结合,或者一个黑人和一个白人结合,他们的后代通常是取中间状态。但是混合的迹象只适用于身体方面的效果,而且这是大量的微粒所产生的较小的一个效应。当微粒传入下一代,它本身是保持独立和分离的。混合遗传和微粒遗传的区别在进化论历史上是很重要的。在达尔文时代,每个人(除了那个在修道院畅饮大嚼的孟德尔,很不幸,一直到去世,他都被忽略和漠视)都认为遗传是混合的。一位名叫费里曼杰肯的苏格兰工程师指出,作为合理的进化论原理,混合遗传这一事实(就像它被认为的那样)统治着自然选择。恩斯特梅耶则很不友善地指出,杰肯的文章"是基于物理科学家常有的偏见以及误解之上的"。而达尔文深为杰肯的文章而困惑。这充分体现在一篇关于白人因为海难而在一座"黑人"居住岛上搁浅的故事里:
承认他有着我们所能想像的白人所具备的一切超过黑人的优势,承认他在获取生存机会的斗争中其生命会比黑人首领要长。然而,从这些承认中,并没有得出结论:经过有限或无限的世代以后,岛上的居民会是白人。我们的海难英雄可能成为国王,在生存之战中,他将杀死许多黑人,他将有许多妻子和儿女,而他的许多臣民从生到死都是单身汉......我们的白人特性当然很容易使他活得够长,然而他却没有足够的能力在任何一代中使他的臣民的子孙变白......在第一代可能有不少聪明年轻的混血儿,要比黑人更聪明。我们可以推测一些世代的国王仍会是皮肤或多或少有些黄的人担任,但是谁能相信这整座岛屿的人口将会逐渐变成白色甚至黄色人种呢?或者岛上的居民们将会获得力量、勇气、智慧、耐心、自制、容忍这些品质吗?因为这些品质,我们的英雄杀掉‰2抵了他们的祖先而创造了许多孩子,事实上,如果这种为生存而进行的斗争能选择任何事物,它会选择这些品质吗?我们不要为白人更高人一等这些种族言论所分心。在杰肯和达尔文的时代,这些言论是毫无疑问的,就像在今天,我们对人的权利、人的尊严和生命的神圣性的最明确的设想也是毫无疑问一样。我们可以以更中立的类推来改述一下杰肯的话。如果你将白色颜料和黑色颜料混合到一起,你所得到的是灰色,你没法得到原来的白色或黑色。混合的颜料与孟德尔的遗传观点相差不太远,甚至今天的流行文化也经常根据"血液"的混合来解释遗传。杰肯的观点是一种"淹没"的观点,随着世代的推移,在混合遗传的设想下,变化最终越来越具有淹没性和模糊性,越来越多的一致性将得到盛行,最终将不会有变化让自然选择进行下去。这个观点听起来似乎是合情合理的,但它不仅反对自然选择,更是在反对关于遗传本身这一无法逃避的事实!随着世代的延递,变化渐渐消失,这明显不是正确的。人们不会比他们祖父母时代彼此更相像。变化是一直保持着,而且有许多变化可供选择之用。这是由W.威伯格于908年很明确地指出过,而且古怪的数学家.哈代也曾提出这个观点。根据哈代(和我的)同事的打赌书中所记录的,哈代曾经和他的同事打过一个赌"XXX太阳明天会升起"。但这个赌使R.A.费歇尔和他的同事们(他们都是现代人口遗传学的鼻祖们)根据孟德尔的微粒遗传对费雷明杰肯给出一个充分的答案。如我们将在第十一章里看到的,在20世纪初,孟德尔主要的追随者都认为自己是反达尔文主义者,在那个时候,这是一个讽刺。费歇尔和他的同事们认为,达尔文的选择是明智的,而杰肯的问题得到了很好的解答,如果在进化中发生改变的是独立遗传微粒或基因的相对的"频率"--在任何微粒个体中它们要不就在男,要不就不在那儿。费歇尔之后能达尔文主义被称为新达尔文主义。它的数字特性并不是一个偶然的、正好与遗传信息技术相符合的事实。数字式可能是达尔文主义本身奏效的一个必要的前提条件。
在我们的电子技术中,独立的数字定位只有两个状态,传统上以0或表示,尽管你可以认为它们可以是高和低、近和远、上和下等所有能够区分彼此的其他东西。这些状态的模式能够被"读出",因此它能对某些东西有影响。电子技术用不同的物理媒介来储存这些和这些0,包括磁盘、磁卡、穿孔卡片和智能芯片,这些东西里面有许多半导体小单元。
柳树籽、蚂蚁和所有其他生命细胞中主要的存储媒介并不是电子的,而是化学的。存在和发现有这么一个事实:某种分子能够聚合,并形成一条无限长的链。存在许许多多不同的聚合体。比如,"聚乙烯"由一种叫乙烯的小分子的长链组成。淀粉和纤维素是聚合糖。一些聚合体是由两种或更多不同种类的小分子组成的链,而不是像聚乙烯那样只由一种小分子组成。一旦有异质进入一个聚合体链,信息技术就有了理论上的可能性。如果在一条链中存在两种小分子,这两种分子可能会被认为分别是l和0,这样任何数量的信息都能被存储起来,只要这条链足够的长。运用于生命的微粒聚合体叫聚核苷酸。在生命细胞里有两种聚核苷酸的家族,分别缩写为DNA和RNA。它们都是一些名为核苷的分子所组成的链。DNA和RNA都是不同种类的链,均有4种不同的核苷。当然,这就给核苷的存储提供了存在的机会。生命细胞的信息技术使用四个状况,分别由A、、C和G表示,而不是l和0。在二态的二元信息技术以及生命细胞所运用的四态信息技术之间,区别是很小的。
如我在第一章的最后所提到的,在一个简单的人类细胞里有足够的信息容量来存储三到四倍于30册大不列颠百科全书的信息。我不知道一颗柳树籽或一只蚂蚁的可比数量,但也会是相当可观。百合种子或火蜥蜴精子的DNA中有着足够的空间来存储60倍于大不列颠百科全书的信息。有一种被不公平地称之为"原始"变形虫的DNA,则有着l 000倍于大不列颠百科全书信息的存储空问。
有一点很令人惊奇,比如在人体细胞里,只有大约l%的遗传信息似乎是真正用到的,大约相当于一册大不列颠百科全书的信息。没有人知道其他99%的信息为什么在7]]D。在前一本书里,我认为,在那l%努力的同时,这99%是寄生的,属于不劳而获的一类--这个理论最近被分子生物学以"自私的DNA"为名经常提及。一个细菌其信息容量比人类细胞要小一些,但它可能利用了所有的空间,几乎没有什么空间可以容纳寄生虫。它的DNA"只"能装《新约》的一个复制件!
现代遗传工程师们已经有了将《新约》或别的东西写进细菌的DNA的技术。在任何信息技术里,代码(符号)的"方法"是"主观的",而且没有理由我们为什么不应该安排结合方式:.比如三个一组,从DNA的4个字母表N盂U']的26个字母表(将有空间留给所有上方或下方的字母)。不幸的是,这样就要花费大约五个世纪才能将《新约》写进一个细菌,因此我怀疑任何人是否将会为之困扰。如果他们这样做,细菌的繁殖速度非常快,以致于《新约》的000万个复制件仅在一天当中就能复制完。如果只有人类能读DNA字母表,那这将是一个"传教士般"的梦想。但是,符号是非常小的,《新约》的l 000万个复制件能同时在一个针头的表面上跳舞。
常规上,电子计算机的存储器分为ROM和RAM。ROM代表只读记忆。更严格地说来,它是"只写...一次、可读许多次"的记忆。那些0和的模式只"烧"进去。一次,然后就在整个记忆的生命中保持不变,信息可以很多次地被读出。其他电子存储器,叫做RAM,既能"写",也能读。因此,RAM能够做ROM所能做的一切,甚至更多。RAM代表的确切字母找不到,因此我不再提及。关于RAM,问题在于,你能在你想要的任何情形下,将任何l或0的模式输入任何你想要的部位。当我敲这些字的时候,它们直接进入RAM,控制事物的文字处理程序也在RAM里,尽管它理论上是"烧"进ROM,然后不会再改变。ROM用于许多固定的标准程序,这些程序是反复需要的,不可以被改变。
DNA是ROM。它能被读几百万遍,当它最初开始排列在它所处的初生细胞里的时候,只能写一次。任何个体细胞中的DNA被"烧进去",除了极少可能的退化,它在个体的生命时间里永远不会被改变。但它能被复制,亦即在细胞分裂时被复制。A、、C和G核昔的模式很忠实地复制进每一个婴儿成长中的上万亿个新细胞的DNA中。当一个新个体孕育的时候,一个新的、独一无二的数字模式被"烧进"了他的DNA/ROM,而他/它将在今后的生命中紧紧依附于这一模式。这种模式被复制进他/它所有的细胞(除了他/它的生殖细胞,如我们所知,生殖细胞某一半DNA得到了复制)。
所有的计算机存储器,无论是ROM或者是RAM,都是通过存储单元指令存入或取出的。这是指记忆的每个存储单元都有标签,通常是一个数字,但这是不容置疑的惯例。这对理解一个记忆存储单元的地址和内容是很重要的。每个存储单元都通过其地址得以知晓。比如,这章节开头的两个字母"",此刻就处于我电脑中的6446和6447两个存储单元之中。我的电脑一共有65536个RAM存储单元。在另一时间,这两个存储单元将会不同,一一一个存储单元的内容是这个存储单元最近所写入的任何内容。每个ROM存储单元也有一一个地址和内容,不同之处是每个存储单元直到最后都与其内容紧密联系。
DNA沿着线状的染色体排列着,像是长长的计算机磁带。我们身体每个细胞中所有的DNA,其存储单元就像ROM在计算机中的存储单元安排方式那样。我们用来标识一个地址的确切的数字或名字都是主观决定、不容置疑的。所需注意的是,我的DNA的微粒存储单元相当于你的DNA的某一微粒存储单元--它们有着相同的地址。我的DNA存储单元32762的内容有可能、或不可能和你的存储单元32762的内容一模一样,但我的存储单元32762在我细胞中所处的地点肯定与你的存储单元32762是相同的。"地点"在这儿是指沿着染色体长度的地点。一个细胞中染色体的确切物理地点无关紧要。的确,它以液态方式四处漂游,因此它的物理地点也在变化,但是沿着染色体的每...个存储单元都是沿着染色体长度的直线顺序进行排列的,就像沿着计算机磁带的每个存储单元所排列的那样,虽然磁带是平铺散布,而不是卷起来。我们所有人,所有人类,都有同样的一套DNA地址,但这些地址内容并不相同。这就是我们彼此互不相同的主要原因。
物种间没有相同的地址。比如,黑猩猩有48条染色体,而我们是46条。严格说来不可能通过地址来比较内容,因为地址不会越过物种障碍而与其他物种的地址等同相当。然而,关系相近的物种,比如猩猩和人类就有着大量的相近的内容,我们可能很容易地找到共同点,尽管这两个物种并不运用伺样的地址系统。定义一个物种的方法是所有的成员都有着同样的DNA地址系统。除了极少的例外,所有成员都有相同数目的染色体,在同一物种里,某一个体沿着其染色体长度的每一存储单元的数目,与另一个体相对应的染色体的同一存储单元的数目是精确地对应着的。区分一'个物种中的成员,要诀在于这些存储单元的内容。
不同的个体,其内容的不同来自于下面的几个方式。在这儿我必须强调,我是在讨论像我们自身这样的有性生殖。我们的精子和卵子各自包含了23条染色体。我的一个精子里的每个存储单元与我的其他精子中的存储单元相类似,你的卵子(精子)也都这样。我的其他所有的体细胞是都包含着46条染色体(两套)。每一个这样的细胞里,同样的地址要用两次。每个细胞包括两个染色体九,以及沿着染色体九的存储单元7230。两者的内容可能,或不可能相同,就像它们在这一物种的其他个体中有可能、或不可能相同那样。如果一个有着23条染色体的精子是由一个有着46条染色体的体细胞产生的,那么它只能得到每个存储单元的两个复制本中的一个。它能得到哪一个,就是几率的问题了。同样的道理对卵子也是适应的;结果是,根据其存储单元的内容,每个精子所产生的和每个卵子所产生的都是独一无二的,尽管一个物种的所有成员其地址系统都是相同的(有个别的例外,不过与我们无关)。当一个精子和一个卵子结合,那么46条染色体当然也就结合在一起,而且这46条染色体被复制到发育中的胚胎的所&女‰有细胞中。
我说ROM不能"写",除非当它是第一次被制造,这对于细胞中的DNA来说也是一样的,除非是复制过程中发生偶然错误。但是,由整个物种的ROM组成的共有信息库能被建设性地"写入"。当世代交替下去,物种非任意的生存和个体繁殖的成功,将极有效地把改进了的生存指令写入这个物种共有的遗传存储中。当世代更迭下去时,每个DNA存储单元中,每个不同的内容有多少复制本的数量的改变,这是一个物种的进化改变的一大组成部分。当然,在任何时候,每个复制本必须位于某一个体之中。不过进化的关键是,在某个种群动物中,每个地址上的其他可能的内容所改变的频率。地址系统保持一样,但是存储内容的统计数字随着世纪的推移而变化。
地址系统本身发生变化,但那需要很长时间。黑猩猩有24对染色体,而我们有23对。我们和黑猩猩有着共同的祖先,因此,要不就是我们、要不就是黑猩猩的祖先在某一个点上发生了染色体数目的改变。要么我们失去了一个染色体(两个合并),要么是黑猩猩得到了一个(一个分裂)。肯定至少有那么一个个体,他有着不同于其父母的染色体数目。在整个遗传系统中还有其他偶然的改变。如我们所知,代码的长度偶尔可能被复制成完全不同的染色体。我们知道这些,是因为我们发现,分散在染色体四周的DNA长链的内容是一致的。
从一个存储单元中读取计算机存储器中的信息时,有两件事可能发生。要么这信息是简单地在某处写入,要么它牵涉到某种"行动"。在某处写入意味着复制。我们已经看到DNA很容易从一个细胞复制到另一个新细胞,而一大"块"DNA可以从一个个体复制到另一个个体。而"行动"就要更复杂些了。在计算机里,一种行动是程序指令的执行。在我的计算机ROM里,存储单元数字64489、64490和6449,一起涵括了内容的模式--和0,当它被指令中断时,会导致计算机扩音器发出类似于雷达信号般的声音。这种位组合模式是l000000000000,这种模式并非天生就有雷达信号或其他噪声。没有任何证据显示它对扩音器会产生如此效果。只有当计算机其余部位接通电源时,才会产生这种情况。同样,DNA四字母代码的模式,比如对眼睛的颜色或行为也产生效应,但这些效应并非DNA数据模式本身所固有的。它们只在胚胎的其余部分发育时才产生效应,而胚胎发育也被DNA其他部位模式的效应所影响。基因之问的这种相瓦作用将是第七章讨论的主题。
在它们被牵涉到任何一种行动之前,DNA代码必须转译成其他媒介方式。它们首先转录为相应的RNA符号。RNA也有四字母表。从这儿,它们被转译为不同种类的聚合体,名叫多肽或蛋白质。它可被称为聚氨酸,因为其基本单元是氨基酸。在生命细胞中,一共有20种氨基酸。所有的生物蛋白都是由这些基本构筑成分所组成的链。尽管一。个蛋白质是一个氨基酸链,但它们大多数并不长,也不是线状的。每条链都卷成一个复杂的结,这种精确的形状是由氨基酸的顺序所决定的。氨基酸的既定顺序使得这个结的形状不会改变。而氨基酸的顺序又由DNA密码决定(通过RNA,以之作为中介)。所以说,蛋白质的三维卷曲形状由DNA中的密码的一维顺序所决定,这是有道理的。
转译程序体现了著名的三字母"遗传密码"。这是一本字典,在这本字典里面,64套(4x4x4)DNA(或RNA)符号中的每一套都被翻译成20种氨基酸的一种,或是一个"停读"符号,一共有3个这种"停读"标点符号。许多氨基酸至少被一套DNA对之进行编码(你可能对有64套DNA,却只有20种氨基酸这一情况有了某种猜测)。从严密连续的DNA/ROM向稳定不变的三维蛋白质形状,这整个的翻译过程是数字信息技术的一个了不起的壮举。接下来的由基因影响身体的步骤,就不像计算机那样明显了。每一个生命细胞,即使是一个简单的细菌细胞,都可以看做是巨大的化工厂。DNA模式,或者是基因,都通过对这个化工厂的进程施加影响,努力产生效应一一它们是通过对蛋白质分子的三维形状施以影响而做到这一点的。用"巨大"这个词形容细胞听起来也许有些惊人,特别是当你还记得l 000万个细菌细胞坐在一个针头表面的那个例子。但你也应该还记得每个这样的细胞能够容纳《新约》的全部内容,而且,当它被自身包含的精密机器的数目测量时,它是极其巨大的。每个机器在DNA延伸的情况下放在一起时,每个机器都是一个很大的蛋白质分子。称作酶的蛋白质分子在一定意义上都是机器,每个分子都会导致一个化学反应发生。每种蛋白机器都竭尽全力制造自己的化学产品。为了能做到这些,它运用一种在细胞内到处漂游的原料,这些原料也很可能是其他蛋白机器的产品。为了对蛋白机器的大小有一个概念,可以这么说,每个蛋白机器都是由大约6000个原子组成,以分子的标准来衡量,这是非常大的。在一个细胞中,有大约00万个这样的机器,而且有超过2000个不同的种类,每个种类在化工厂(细胞)专门从事各自的运作。这是酶的独特的化学反应,从而让一个细胞有了自己的个体形状和行为。
既然所有体细胞都包含着同样的基因,那么所有体细胞彼此不相同这一点就有些令人惊讶。理由是,基因的一个不同子集在不同种类的细胞中被读出,其他的被忽略了。在肝细胞里,那些与。肾的构建相关的DNA/ROM的部分不被读;反之亦然。一个细胞的形状和行为取决于这个细胞中的哪个基因被读,然后翻译为它们的蛋白质产品。这取决于细胞中已存在的化学物质,而这些化学物质又部分地取决于之前读出的是哪个基因,同时也部分取决于邻近的细胞。当一个细胞分裂为两个,两个子细胞彼此并不一定相同。比如,在最初的受精卵里,某种化学物集中到细胞的尾部,其他则在另一尾部。当这种极化的细胞进行分裂时,两个子细胞得到不同的化学分配。这意味着在两个子细胞中,将会读到不同的基因,而一种自我巩固的分歧会继续。整个躯体的最后形状、肢翼的大小、行为方式的选择,这些全都是不同类细胞之间的相互作用的间接结果,这些细胞的不同是通过读出不同的基因而产生的。这些不同的进程,根据第三章中的"回归"程序,可以认为是一种"当地自治",而不是在某种宏大设计中的一种协调。"行动",运用到这个章节中,是指遗传学家在提及基因的"表型效应"时所谈到的。DNA对躯体、对眼睛、对头发、对进攻行为的强烈程度以及其他上千种特性都有着影响。在被RNA读出,然后翻译成蛋白质链(随后影响细胞形状和行为)之后,DNA充分发挥它们的影响。这是DNA模式中的信息能被读出的方式之一。另一方式是它能被复制进一个新的DNA链,这就是我们早些时候讨论的复制。
DNA这两种信息传递方式--垂直方式和平行方式,有一个根本区别。信息以垂直方式传给可以产生精子或卵子的细胞(这些细胞也能制造其他细胞)中的其他DNA。因此它是垂直传给下一代,再到下一代,直到无限远的未来世代。这些DNA可称之为"档案DNA"。它很可能是永生的。档案DNA沿着这些前仆后继的细胞往下遗传,这些细胞被称为基因线。基因线是指在一个躯体内,一组细胞是精子或卵子的先祖,因此也是未来世代的先祖。DNA也可以侧向或平行传递:把DNA传向非基因线的细胞,比如肝细胞,或皮肤细胞;在这些细胞中传给DNA,然后传给蛋白质并对胚胎发育产生效应,从而对成年形状和行为也产生效应。你可以将平行传递和垂直传递认为是第三章中所阐述的"发育"和"复制"。
自然选择是相互竞争的DNA将自己成功地垂直传递到物种档案的这样一种过程。"DNA竞争对手"是指物种染色体地址中的其他不同内容。有些基因要比竞争对手更容易、更成功地保存于档案。尽管沿着物种档案进行垂直传递最终是意味着"成功",但成功的评判标准通常是指基因通过侧向传递对躯体所采取的行动。这也就像原始的计算机模型。比如,假设在老虎身上有一个基因,通过它在下巴的细胞中侧向传递,使得牙齿变得比那些由竞争基因组成的老虎的牙齿更尖利。一只有着格外尖利牙齿的老虎比其他老虎能够更有效地、更多地杀死猎物,因此,它就有更多的后代,因此也就垂直传递,使牙齿尖利这一基因有更多的复制本。当然,它也同时传递其他基因。但一般来说,只有这个特别的"利齿基因"才会在利齿老虎的身体中找到自己。根据其垂直传递,基因本身从其对所有系列的躯体的效应中获益。
DNA作为一个档案媒介,其表现是惊人的。其保存信息的容量要远远超过在石头上的碑文。牛和豆荚有着极其相近的基因,名叫组蛋白4基因。DNA内容有306个字母长。我们不能说在所有物种上它都占据了同样的地址,因为越过物种对地址标签做比较是毫无意义的。但我们能够说,在牛身上有一个306个字母的长度,实际上和豆荚的那个306个字母的长度是一致的。牛和豆荚的不同之处在于,在这306个字母中,只有两个字母不相同。我们不能确切地知道牛和豆荚的共同祖先生活在哪个久远的年代,但是化石证据表明,这大概是在0亿年之前到20亿年之前的某个时段。姑且说就是l5亿年以前吧。在这个不可想像(对于人类)的时问里,从遥远祖先分支而来的这两个世系的每一个,它们都保留了306个字母中的305个(一般说来,可能是一个世系保留了所有的306个字母,而另一世系则保留了304个)。而刻在墓碑上的字母在仅仅几百年问里就可能变得无法辨认。在某种意义上,组蛋白4的DNA文件的保存更能令人印象深刻,因为它并非像墓碑上的字那样保存内容同样的物理结构,而是随着世代的交替更迭,反复地被复制、复制、再复制,就像是希伯来的手抄本每隔80年抄写一次以防止流失一样。很难确切地估计组蛋白4文件从与豆荚的共同祖先开始,在世系中究竟复制了多少遍最终才产生了牛,但很可能是200亿次。同时也很难找到恰当的准绳来比较在这200亿次的复制过程中,99%以上的信息的保存量。我们可以试着用祖母的耳语这个游戏寻找答案。想像200亿个打字员坐成一排。这排线可以整整绕地圈500次。第一个打字员打了一页文件,递给第二个人;第二个人复制了这个文件,又递给下一个人,这样不断复制和传递到下一个人......最终,文件信息到了最后一个人手里,于是我们读到了它(或者是我们的第l2000个曾曾曾......孙读到了它,如果说所有的打字员都有一个好秘书的打字速度)。原信息的忠实度将会有多少?
为了回答这个问题,我们必须对打字员们的精确性做一些假设。让我们把问题转向另一方向。为了能与DNA的表现相匹敌,打字员们必须有多好才行?答案实在荒谬得都不想说出来。每个打字员在一万亿次中只能出现一个错误率,也就是说,他必须准确到这个地步:打《圣经》25万次,只能出现一个简单的错误。实际生活中,平均一张纸出现一个错误,就算是好秘书了。这样,组蛋白4基因的错误率大约为5亿次。如果这一长排打字员是生活中的秘书,那么在这200亿人排成的打字员中的第20个打字员会把内容减少到原文的99%,到了第一万个成员的时候,留存的信息内容不到原文的l%。在99.9995%的打字员看到它之前,几乎全部内容都消失了。
整个的比较看来有点像骗局,但很有趣,也展现出事实的真相。我有一个印象,就是我们所用的衡量方法是复制的错误。,但是组蛋白4文件并不曾被复制,它遵从于自然选择。组蛋白对于生存极其重要。它被用在染色体的结构工程上。在复制组蛋白4基因的过程中,更多的错误可能会大量地出现,但是突变的有机体并不存活,或者至少不会繁殖。为了使这种比较更公平,我们必须假定,每个打字员的椅子上都有一把枪,和打字员系在一起,如果打字员犯了错误,他将被一枪打死,其位置也被储备打字员所代替(那些易受惊的读者可能更愿意设想一个弹簧排出器,可以代替枪将这些不合格的打字员轻轻地弹出这条长线,但是枪却给了一个关于自然选择的更理想的画面)。
因此通过观察在地质年代中实际所发生的改变的数目,这种衡量DNA保存的办法,将忠实的复制和自然选择的过滤效应混合到一起。我们只看到DNA的成功改变所产生的后代。那些导致死亡的改变我,10n不能看到。在自然选择对基因的新一代发生作用之前,我们能衡量在普通人当中实际上的复制忠实度吗?是的,这与突变率相反,而且它能被衡量。任何一个字母在任何一个复制情境下被错误复制的可能性都要比十亿分之一要稍多一些。这两者不同之处是突变率,以及改变在进化过程中实际上被并入到组蛋白基因中的更低的比率,是自然选择在保存这些古代文件的有效性的衡量办法。
组蛋白基因的永世保存,从遗传标准来看是罕见的。其他基因以更高的比率改变着,可能是因为自然选择更能容忍它们一些。比如,决定蛋白质编码的基因,如血纤维蛋白肽在进化中以接近于基本突变率的比率改变着。这也能意味着,这些蛋白质(它们在血液的凝结过程中产生)细节中的错误对于有机体没有什么影响。血红蛋白基因有一个介于组蛋白和血纤维蛋白肽之间的改变比率。可能自然选择对它们出错的容忍度也介乎其中。血红蛋白在血液中起着重要作用,具体到细节方面都是很重要的,但是它的一些其他变体看来也能同样做得很好。
如果能想得深远一些,这儿似乎有一荒谬之处。进化最慢的分子,如组蛋白,被证明是最遵从于自然选择的。血纤维蛋白肽是进化最快的分子,因为自然选择几乎完全忽略了它们。它们不受控制地以突变的比率进化着。看来有些荒谬的理由是,我们如此强调自然选择,把它作为进化的驱动力。如果没有自然选择,我们也许会认为不会有进化。或反过来说,强烈的"选择压力",可能会导致快速的进化。相反,我们所发现的是,自然选择对进化起到一个制动的效应。在没有自然选择的情形下,进化的比率是一个最大可能的比率。这与突变率是同义的。
这实际上并不真的很荒谬。当我们仔细想想,我们明白不可能不如此。自然选择所决定的进化不会比突变率更快,因为突变最终是新的异种进入物种的惟一方式。所有的自然选择能做的是接受某种新的异种,并拒绝其他的。突变率必须给出一个比率的上限,进化能够以这个比率继续下去。-事实上,大多数自然选择更倾向于防止进化的改变,而不是推动它。我得赶紧声明,这并不是指自然选择只是破坏性的过程。它也能以我们'在第七章中将解释的方式进行建设性的工作。
即使突变率也是相当低的。这也是说,即使没有自然选择,DNA密码在精确保存其档案方面的表现同样令人印象深刻。一个保守的估计是,在没有自然选择的情况下,DNA复制非常精确,它需要500万世代才错误地复制字母的百分之一。即使没有自然选择,我们假设中的打字员们仍是无法望其项背。为了与没有自然选择的DNA匹敌,打字员们每个人必须能够打完全部的《新约》,而错误却只有一个才行。也就是说,他们每个人必须比真正生活中的打字员要精确450倍。这显然比适合相比的5亿这个数字要少得多,这是自然选择以后的组蛋白4基因个打字秘书更精确的因素,但它仍是一个很醒目的数字。
但我已经对打字员不公平了。事实上,我假定他们注意不到错误,且不会纠正它们。我假定根本就没有校正这回事。事实上,他们当然校正了。因此用这种简单的方式,这数以亿计的打字员不会导致原始信息减少。DNA复制机制也同样地进行错误校正工作。如果没有这个机制,它将不会保持那种我描述的令人惊讶的精确性。DNA复制程序结合了各种各样的"校正"训练。这是非常必需的,因为DNA密码的字母绝非像雕刻在岩石上的文字那样是静态的。相反,所涉及的分子太小了--记住《新约》在针尖表面上的那个说法--以致于它们处于来自于因为加热而不断碰撞的分子们的袭击。在信息中,字母不断变迁,不断周转。在每个人体的细胞中,每天有大约5000个DNA字母衰退,并迅速由修补机制所替换。如果这个修补机制不在那儿永不停息地工作,信息就将慢慢溶解流失。最新复制内容的校正只是正常修补工作的特例。校正主要是对DNA出色的精确性和信息存储的忠实性负责。
我们已经看到,DNA分子处于令人惊叹的信息技术中心位置。它们能够将大量的精密的数字化信息包容进一个小小的空问,而且它们能够以少得令人吃惊的出错率(但仍有一些错误)保存这些信息,并且保存时间非常之长,如数百万年之久。这些事实正在将我们引向何处?它们在将我们引向关于地球生命的真理,引向我在本篇开头所述的柳树籽中暗含的事实。有机生命体之所以存在,是得益于DNA而不是其他东西。虽然这不是很明显,但我希望能够说服你。相对于个体生命期的时间刻度,DNA分子包含的信息是永恒的,DNA信息的生命期从几百万年到上亿年不等,或者,换句话说,从一万个个体生命期到一万亿个个体生命期不等。每个有机体个体应该被视为临时的工具,在这里,DNA信息度过了它们地质生命期中的极小一部分。
这个世界充满了存在的事物!且不争论这些,但这将把我们带到什么地方?存在着的事物要么是因为它们最近才存在,或者是因为它们有着一种特性,可以使得它们过去就不可能毁灭。岩石存在的比率不是很高,但它们一旦存在,就坚硬而持久。如果它们不是这样,那就不成其为岩石了,它们就是沙子。事实上,它们有些就是,这就是我们为什么有海滩!它们正好就像岩石的存在那样耐久。另一方面,露珠存在,并非因为它们能持久,而是因为它们还没有时间蒸发。看来有两种"存在价值":露珠类的,总结为"可能存在,但不能持久";岩石类,归结为"存在可能性不大,但一旦存在,就能持久"。岩石具有持久能力,而露珠则具有"生殖能力"(我原想试着想一个不那么丑陋的词,但实在办不到)。
DNA则兼而有之。DNA分子本身,作为一个物理实体,类似于露珠。在适当的条件下,它们以高比率存在,但时问不长,在几个月之内就可以毁掉。它们不像岩石那样持久。但是在它们的序列中,所拥有的模式则与最坚硬的岩石一样持久。,它们能存在几百万年之久,这就是为什么它们现在还在这儿的原因。与露珠最根本的区别是,新的露珠并不是由旧的产生,虽然它们毫无疑问地彼此相像,但它们并非就与它的"父母"特别地相像。不像DNA分子那样,它们并没有形成世系,因此不会传递信息。露珠存在,是自发地独自产生,而DNA信息则是复制。
像"世界充满了事物,这些事物有着它所带到这个世界的东西"这样的真理,在我们将之运用到某种特别的持久能力,以及许多复制品世系的持久能力之前是微渺的,甚至有些傻。DNA信息有着区别于岩石的持久能力,也有着区别于露珠的"繁殖能力","这些事物所带到这个世界的东西"就有了并不明显和反复的意思。"这些事物所带到这个世界的东西"包括了构建像你像我这样的机器,以及所知宇宙中最复杂事物的能力,让我们看看这些是如何做到的。
从根本上来说,我们了解到的DNA的特性已被证明是任何积累选择过程必需的基本要素。在第三章电脑模型中,我们精密详尽地将积累选择的基本成分构筑进了计算机之中。如果积累选择在这个世界上真的发生,一些有着这些基本成分的个体必然诞生。现在,让我们看看这些成分是些什么。这样做的时候,我们应该记住一个事实,即这些成分至少肯定是在早期地球上自发地产生,否则累积选择和由此而来的生命,将永远不会在最初的时候开始。我们在这儿谈论的,并不专门是DNA,而是宇宙中生命产生所需的基本成分。
当年,犹太人先知伊齐基尔在骨骼山谷里,对骨骼进行预言,并把它们连接到一起。然后他又对骨架进行预言,并将肌肉和筋腱附着在骨架上。但它仍没有呼吸。因为它缺少了生命成分中至关重要的一点。一个死气沉沉的行星里有原子、分子和大块的物质,根据物理学定律,它们偶尔会互相碰撞,并导致原子和分子接合在一起(就像伊齐基尔的干巴巴的骨头那样),但有时也会导致它们分开。它们既能形成巨大的原子结合物,但也会被压碎而又分开,但依然是没有呼吸。
伊齐基尔于是召集了四股风,将生命的呼吸吹进干枯的骨头里。一个像我们的早期地球一样死气沉沉的星球,究竟需要些什么样的重要成分,才能有机会像我们的星球这样最终产生生命?它不是呼吸,不是风,不是任何万灵药,也根本不是一种物质,而是一种特性,一一种自我复制的特性。这是积累选择的基本要素。作为普通物理定律的结果,某种方式上肯定产生形成了自我复制的实体,或者是我称之为复制者的东西。在现代生命中,这个角色差不多完全由DNA分子来担当,但是一些能产生复制品的东西也可以这样。在原始地球上的第一个复制者究竟是不是DNA分子,对此我们可能犹存怀疑。一个羽翼丰满的DNA分子,在没有其他那些存在于生命细胞中的分子的帮助下,是不可能一蹴而就地产生和存在的。第一个复制者可能比DNA要简单、粗糙。还有两种其他的必需的成分,它们通常自动地从第一种要素,即从自我复制本身所产生。在自我复制过程中,肯定偶尔会有锚误,即使DNA系统很少出现错误,有可能地球上的第一个复锒者相对要不稳定得多。一些复制者至少在将来会运用"力量"。最后一种要素听起来比它实际上的要险恶得多,其意思是指复银者的一些特性本应对它们被复制的可能性产生影响。至少这可能是自我复制本身这一基本事实不可避免的结果。