饭饭TXT > 学习管理 > 《失控:全人类的最终命运和结局》作者:凯文·凯利/译者:东西文库【完结】 > ☆书香门第☆失控:全人类的最终命运和结局.txt

第十五章:人工进化.2

作者:凯文·凯利/译者:东西文库 当前章节:15412 字 更新时间:2026-6-23 04:52

曾有那么一瞬间,连接主义者猜想:也许创造理智与意识所需要的一切,不过就是一个够大的互相连接的神经元网络,理性智能可以在其中完成自我组装。甫一尝试,他们的这个梦就破灭了。

但是人工进化者们仍然在追寻着连接主义的梦想。只是,和着进化的缓慢节奏,他们会更有耐心。而这缓慢的、非常缓慢的进化节奏着实令我不安。我这样向汤姆·雷表达我的忧虑:「现成的进化芯片和并行进化处理机让我有些焦虑,因为进化需要的时间多得令人难以置信。这个时间从何而来?看看大自然的运行速度,想一下,在我们谈话期间,有多少微小分子被吸附到一起。大自然的并行速度之快、规模之广之大令人难以置信,而我们却打算尝试超越它。在我看来,根本就没有足够的时间能做成这件事。」

雷回答道:「哦,我也有同样的焦虑。但另一方面,让我惊讶的是,在我的系统里即使仅靠一个虚拟处理器,进化也能进行得如此之快。再者,时间是相对的。进化的时间尺度是由进化中一代的时间跨度来决定的。对人类来说,一代是三十年,但对我的小东西们来说,一代就是几分之一秒。而且,当我扮演上帝时,我能加快整体的突变率。我不敢肯定,但是也许我可以在计算机上得到更多的进化。」

在计算机上进行进化还有其它的原因。比如,雷能记录每个「小东西」的基因组序列,保存完整的人口统计和种群谱系。它生成大量数据,而在现实世界中根本无法收集这些数据。尽管随着人造世界复杂性的激增,提取信息的复杂性和成本也会激增,但做起来仍可能比无法掌控的有机世界更容易些。正如雷告诉我的那样,「即使我的世界变得像真实世界一样复杂,但我是上帝,我无所不知。我能获取任何我感兴趣的信息而不打扰它,也不用走来走去踩坏植物。这是一个根本的不同。」

丹尼·希利斯(Danny Hillis, 1956.09.25~):美国发明家、创业家和作家。他与其他人联合创立了「思考机器公司」(Thinking Machine Corporation),该公司研发了并行超级计算机「连接机」(Connection Machine)。——译自「维基百科」

史蒂文·列维(Steven Levy, 1951~):美国新闻工作者,写了不少有关电脑科技、密码系统、网络安全和隐私的书。

15.5 驾驭野性的进化

回到十八世纪,本杰明·富兰克林很难让朋友们相信,他试验室里产生的微弱电流与荒野中发生的雷电本质上是一回事。部分原因是由于他的人造电火花与撕裂天空的巨型闪电相比根本不在一个级别上,但更主要的原因是,那些旁观者们认为,福兰克林所声称的再现自然有违常理。

今天,汤姆·雷也难以让他的同事们信服,他在实验室里人工合成的进化与塑造自然界动植物的进化本质上是相同的。他的世界里几个小时的进化与蛮荒大自然中数十亿年的进化在时间尺度上的差别也只是部分原因;最主要的是,怀疑者们也认为,雷所声称的再现一个难以明了的自然过程是有违常理的。

在富兰克林之后二百年,人工生成的可驾驭和可度量的闪电通过电线被导入建筑物和工具,成为社会尤其是数字社会中最重要的组织力量。再二百年后,可驾驭和可度量的人工适应也将被导入各种机械设备,成为我们社会的主要组织力量。

还没有一个计算机科学家可以合成出符合预期的、无比强大的、能带来翻天覆地变化的人工智能。也没有一个生物化学家能够创造出人工生命。然而,雷和一些人已经捕捉到了进化的一角,并按照他们各自的需求来再现进化。许多技术人员相信,星星之火必将燎原,我们所梦寐以求的人工生命和人工智能都将由此而来。与其制造,不如培育。

我们已经运用工程技术造出了尽可能复杂的机器。如今,我们所面对的项目——有数千万行代码的软件程序,覆盖全球的通讯系统,必须适应迅速变化的全球购买习惯并在几天内更新设备的工厂,价廉物美的机器人——其复杂度只有进化才能搞定。

由于进化是缓慢的、无形的和冗长的,因而在这个快节奏的、咄咄逼人的人造机器世界里,进化恍若一个难以察觉的幽灵。但我更愿意相信,进化是一种能被容易地转化为计算机代码的自然而然的技术。正是进化与计算机之间的这种超级兼容性,将推动人工进化进入我们的数字生活。

15.6 进化聪明分子的愚钝科学家

不过,人工进化不仅限于硅片。只要是工程方法一筹莫展的地方,都可以导入进化。生物工程这种尖端领域已经采用了合成进化技术。

这是一个来自真实世界的问题。你需要一种药物来抗击刚刚分离出机理的疾病。把这个疾病机理看作是一把锁。你所需要的是一把正确的钥匙——一种药——来打开这把锁。

有机分子的构成非常复杂。它们由数千个原子组成,其排列方式多达数十亿种。仅仅知道一种蛋白质的化学成分对我们了解其结构没有太大帮助。长长的氨基酸链层层叠叠绕成一团,而热点[1]——蛋白质的活跃部分——恰好处于外侧面的合适位置上。这种折叠蛋白质的方式就好比将一条一英里长、上面用蓝色标记了六个点的绳子绕成一团,使六个蓝色的点都落在不同的外侧面上。缠绕的方式不计其数,但是符合要求的却没有几个。你甚至无从知道一种方式是否接近答案——除非你已经快完成了它。变化是如此之多,纵使穷尽地老天荒也无法一一试遍。

制药商们通常有两种手段来对付这种复杂性。过去,药剂师靠的是碰运气。他们试遍所有从自然中发现的化学物质,看看哪一个可以解开这把给定的锁。一般都会有一两种天然化合物能够部分地发挥效用——这也算是获得了钥匙的一部分。今天,在工程学时代,生物化学家们试图破译基因代码和蛋白质折叠之间的路径,看是否能通过工程方法设计出构建分子所需的步骤。尽管有些许成功的例子,但蛋白质折叠和基因路径仍然因过于复杂而难以控制。因而,这种被称为「合理化药物设计」的逻辑方法,实际上已经撞上了工程方法所能处理的复杂性的极限。

自二十世纪八十年代末起,世界各地的生物工程实验室都开始致力于完善另一种我们用来创造复杂体的工具——进化。

简单地说,进化系统产生出数十亿随机分子,并用来试着开锁。在这数十亿个平凡的候选者中,也许只有一个分子的一部分与这把锁的六个点之一相合。这把「亲和」钥匙便被保留下来,其余的则被无情地淘汰。接着,由幸存下来的「亲和」钥匙又繁育出数十亿个新变种,同时与锁相合的那个点保持不变(称为绑定),再被用来试那把锁。也许此时又能发现一把可以匹配两个点的「亲和」钥匙。这把钥匙就作为幸存者保留下来,其余的则死去。幸存者繁育出数十亿个变种,最般配的后代将存活下去。这种淘汰-变异-绑定的过程重复几代后,这个分子繁育程序就会找到一种药——或许是救命药——与锁的所有点都相契合。

几乎任何一种分子都能被进化。譬如说,生物技术人员能进化出一种改进版的胰岛素。他们将胰岛素注入兔子体内,兔子的免疫系统会对这种「毒素」产生抗体(抗体是毒素的互补构型[2])。接下来,将这种抗体提取出来,注入进化系统。在进化系统中,抗体就好比是测试用的锁。经过几代进化之后,生物技术人员可以得到抗体的互补构型,实际上也就是胰岛素的替代版。这种替代版极具价值。天然药物的替代品具备诸多优势:它们可能更小;更容易注入身体;副作用更小;更容易制造;或靶向更精准。

生物进化者们还可以进化出一种对抗肝炎病毒的抗体,然后再进化出一种与抗体相配的仿肝炎病毒。被选中的病毒并非完美的变种,而是缺失了一些可引发致命症状的活性点。这种有缺陷、无能力的替代品就是所谓的疫苗。因而,疫苗也可以通过非工程的方法进化出来。

所有药物制造的常规逻辑在进化方法面前都不再适用。进化出来的分子与合理化设计出来的药物在效果上并无二致。唯一不同的是,我们对其功效的原理和方式一无所知。我们只知道它通过了所有的测试。这些发明出来的药物已经超出了我们的理解力,它们是「非理性设计」的产物。

药物进化允许研究人员不明就里,而进化本身却慢慢聪明起来。印地安那州立大学的进化生物化学家安德鲁·埃林顿[3]告诉《科学》杂志,在进化系统中「要让分子告诉你有关它的事情,因为它比你更了解它自己。」

繁育药物可以使医学受益。但药物与软件不同。我们也许可以繁育软件,然后将系统交到它的手里,任由其自行繁育,走向无人知晓的境界。但我们能否让分子也走上这条不知通往何处的进化之路呢?

答案是肯定的,但这也会是一项艰巨的任务。汤姆·雷的电进化机偏重于处理可遗传的信息,却忽略了机体;而分子进化则偏重于机体,却忽略了可遗传的信息。单纯的信息本身很难消除,而没有死亡就没有进化。肌肉和血液之所以对进化非常有帮助,正是因为机体提供了一个让信息死去的便捷方式。任何能将可遗传信息与可消亡机体合二为一的系统都具备了进化系统的要素。

圣地亚哥的生物化学家杰拉尔德·乔伊斯研究的是早期生命化学。他提出了一种简单的方法,能够将信息和机体这对进化的双重本质融入到一个强健的人工进化系统中:他在一个试管里再现了可能是地球生命的早期阶段——「核糖核酸[4]世界」。

核糖核酸是非常精密的分子系统。它并不是最早的生命系统,但地球生命发展到某个阶段几乎必然成为核糖核酸生命。乔伊斯说:「生物学中的一切迹象都表明,39亿年前的地球是由核糖核酸来唱主角。」

核糖核酸有一个独一无二的优势,是我们所知的任何其他系统都不具有的。它能同时兼任机体和信息两个角色——既是表现形式,又是内在成因;既充当信使,又是信息。一个核糖核酸分子既要担当起与世界互动的职责,又要完成延续世界的重任,至少要把信息传递给下一代。尽管身负重任,核糖核酸仍然是一个极为紧凑的系统,开放式的人工进化正可以由此展开。

斯克里普斯研究所座落在加利福尼州圣地亚哥市附近的海边,是一座雅致时髦的现代化实验室。在这里,杰拉尔德·乔伊斯带着一小群研究生和博士后进行他的进化实验。在塑料试管的底部有少许液滴,体积还赶不上顶针大小,这就是他的核糖核酸世界。几十支这样的试管放在冰桶里,需要进化的时候,就把它们加热到身体的温度。一旦暖和起来后,核糖核酸能在一小时内产生出十亿个副本。

「我们所拥有的,」乔伊斯指着一个小试管说,「是一个大型的并行处理器。我之所以选择生物进化而不是计算机模拟,原因之一就是在地球上,至少在不久的将来,还没有计算机能为我提供1015个并行的微处理器。」试管底部的液滴在尺寸上与计算机芯片上的智能部分大体相当。乔伊斯进一步阐述道:「实际上,我们的人工系统甚至比自然进化还要好,因为没有多少自然系统能让我们在一小时内产生1015个个体。」

自维持的生命系统除了能带来智能革命外,乔伊斯认为进化还可以在制造化学品和药品上带来商业利润。在他的想象中,分子进化系统能够每天24小时、一年365天不停运转。「你给它下达一项任务,并告诉它,在搞清楚如何将分子A变成分子B之前,不要离开工作间。」

乔伊斯一口气说出了一大串专门从事定向分子进化[5]研究的生物技术公司(吉莱德[6]、Ixsys[7]、Nexagen[8]、Osiris[9]、Selectide[10],以及达尔文分子公司)。他的名单中还不包括那些已经颇具规模的生物技术公司,如基因泰克公司[11],该公司不仅从事定向进化技术的前沿研究,也进行合理化药物设计。达尔文分子公司主要专利的持有人是研究复杂性的科学家斯图尔特·考夫曼,该公司募集了数百万美元来利用进化设计药物。诺贝尔奖得主、生物化学家曼弗雷德·艾根[12]称,定向进化是「生物技术的未来」。

然而,这是真正的进化吗?它与那个带给我们胰岛素、眼睫毛和浣熊的进化是一回事么?没错,这就是进化。「我们通常所说的进化是达尔文进化,」乔伊斯告诉我,「不过在另一种进化中,选择压力[13]是由我们来决定的,而不是自然,因此我们称其为定向进化。」

定向进化是另一种监督式学习,另一种遍历博尔赫斯图书馆的方法,另一种繁育。在定向进化中,选择是由培育者引导的,而非自然发生的。

热点(hot spot):基因组上的某些小块区域。这些区域内发生基因重组的频率要高于周围区域上百倍乃至上千倍。热点的成因目前尚不清楚,但所有热点的特性都很相似。此外,最近的研究显示,人类基因组中有超过25000个热点,这也表明热点是基因组中普遍存在的现象。——译自「维基百科」

互补构型(complementary shape):指能像手与手套、钥匙与锁一样合在一起的构型。——译自「雅虎问答」

安德鲁·埃林顿:Andrew Ellington

核糖核酸(RNA):是一种重要的生物大分子,是细胞中遗传信息的中间载体。对一部分病毒而言,RNA是其唯一的遗传物质。——摘自「中文维基百科」

定向分子进化(directed molecular evolution):根据所需要的属性进行分子进化的技术。

吉莱德(Gilead):1987年成立于硅谷的一家高科技生物制药公司,研发和生产的药品种类主要包括抗艾滋病毒药、抗肝炎药、严重心血管疾病和呼吸道疾病用药。公司2009年的收入超过70亿美金,在《商业周刊》评选的2009年50强公司中名列第一。

Ixsys:创立于1989年,是第一家从事定向分子进化研究的公司。后更名为「应用分子进化」(Applied Molecular Evolution,简写为AME)。现为纳斯达克上市公司。

Nexagen:位于俄亥俄州的健康保健品公司,主打产品为减肥药Jen Fe Next。

Osiris:纳斯达克上市公司,从事干细胞产品的研发和生产。

Selectide: 1990年创立于亚利桑那州图森市,公司后经多次收购与转手,已名存实亡。

基因泰克(Genentech):美国历史最悠久的生物技术公司,创办于1976年。公司在上世纪末和本世纪初曾推出过几款癌症用药,风靡市场。瑞士制药业巨头罗氏集团目前为该公司的完全拥有者。

曼弗雷德·艾根(Manfred Eigen, 1927.05.09~):德国化学家及生物物理学家,诺贝尔化学奖得主,曾任马克斯·普朗克生物物理化学所主任。

选择压力(selection pressure):也称为进化压力,指在由变异引起的进化中,影响生物体进化方向的外加力量。

15.7 死亡是最好的老师

戴维·艾克利[1]是贝尔通信研究所[2]神经网络和遗传算法领域的研究员。我偶然间了解到了艾克利对进化系统一些最独到的看法。

艾克利是个壮得像头熊、满嘴俏皮话的家伙。他和他的同事迈克尔·利特曼[3]制作了一段关于人工生命世界的搞笑视频,并在1990年第二届人工生命大会上播放出来,惹得在场的250位严肃的科学家们哄堂大笑。他的「造物」实际上就是些代码片断,和经典的遗传算法没有多大区别,但是,他用滑稽的笑脸来表示这些代码片段,让它们四处游动相互啃咬,或者撞上代表边界的墙壁。聪明的活下来,愚蠢的则死掉。和其他人一样,艾克利发现,他的世界能够进化出对环境异常适应的有机体。成功的个体非常长寿——按其所在世界的时间尺度衡量的话,能活25000「天」。这些家伙把系统给琢磨透了。它们知道如何用最小的努力来获取自己所需的东西,也知道如何远离麻烦。具有这种基因的「生物」,不仅个体很长寿,而且由其组成的种群也世代兴旺。

在对这些「街霸」的基因进行了一番研究后,艾克利发现它们有些资源尚未充分利用,这使得他觉得自己可以像神一样有番作为:通过改进它们的染色体,利用上这些资源,使它们更加适应他为它们搭建的环境。于是,他修改了它们进化后的代码(这个举动实际上相当于早期的虚拟基因工程),再把它们放回到他的世界。作为个体,它们能力超强,脱颖而出,适应力超过了以往的任何前辈。

然而,艾克利注意到,它们的种群数目总是低于自然进化而来的那些家伙。作为一个群体来说,它们活力不足。尽管从未绝迹,但它们总是濒临灭绝。艾克利认为,由于数目太少,这个物种的繁衍不会超过300代。也就是说,尽管手工改进的基因能够最大限度地适合个体,但从对整个族群有利的角度看,却不如那些自然成长起来的基因。此时此刻,在这午夜黑客的自酿世界中,一句古老的生态学格言第一次得到了明证:对个体而言最好的,对物种而言却不一定。

「我们弄不明白从长远看到底什么才是最好的,这点让人很难接受。」艾克利在人工生命会议上的一席话赢得了一片掌声。「但是我想,嘿,这就是生命!」

贝尔通信研究所之所以允许艾克利从事他的芥子世界的研究,是因为他们认识到进化也是一种计算。贝尔通信研究所曾经而且现在也一直对更好的计算方法很感兴趣,尤其是那些基于分布式模型的方法,因为电话网就是一个分布式计算机。如果进化是一种有效的分布式计算,那么是否还有其它的方法?如果可以的话,我们又能对进化技术做出怎样的改进或变化呢?借用我们常用的那个图书馆/空间的比喻,艾克利滔滔不绝地说道,「计算的空间庞大得令人难以置信,我们只不过探索了其中非常微小的一些角落。我现在做的,以及我想进一步做的,是扩展人类认识到的计算的空间。」

在所有可能的计算类型中,艾克利最感兴趣的是那些与学习有关的过程。「强学习」是一种学习方式,它需要聪明的老师。老师会告诉学生应该知道些什么,而学生则分析信息并将其储存在记忆中。不太聪明的老师则通过不同的方法教学。她对所要教的东西本身也许并不了解,但是,她能告诉学生什么时候猜出了正确答案——就像代课教师给学生测验打分一样。如果学生猜出了部分答案,老师可以给出「接近」或「偏离」的暗示,帮助学生继续探索。这样一来,这位不太聪明的老师就可能生成其本身所不具备的知识。艾克利一直在推动对「弱学习」的研究,他认为这是一种让计算空间最大化的方式:利用最少的输入信息,获取最多的输出信息。「我一直在试图找出最愚笨、最孤陋寡闻的老师,」艾克利告诉我,「我想我找到了。答案是:死亡。」

死亡是进化中唯一的老师。艾克利的使命就是查明:只以死亡为老师,能学到什么?我们还不是很清楚答案,但却有些现成的例证:翱翔的雄鹰,鸽子的导航系统,或白蚁的摩天大楼。找到答案需要些时间。进化是聪明的,但同时又是盲目和愚笨的。「我想像不出比自然选择更笨的学习方法了。」艾克利说道。

在所有可能的计算和学习的空间中,自然选择占据了一个特殊的位置,它是一个极点,在这个点上,信息传递被最小化。它构成了学习和智能的最低基线:基线之下不会有学习产生,基线之上则会产生更加智能、更加复杂的学习。尽管我们仍然不能完全理解自然选择在共同进化世界中的本质,但它依然是学习的基础熔点。如果我们能够给进化一个度量值的话(我们还不能),就可以以此为基准评判其他形式的学习。

自然选择躲藏在许多表象之下。艾克利是对的;如今计算机科学家们都意识到,计算方式有许多种——其中许多是进化的方式。任何人都知道,进化和学习的方式可能有数百种;不论哪种策略,实际上都是在对图书馆或空间进行搜索。「传统人工智能研究的闪光思想——也是唯一思想——就是『搜索』,」艾克利断言道。实现搜索的方法有很多种,对自然生命中起作用的自然选择只是其中的一种。

生物意义上的生命是与特殊的硬件绑定在一起的,这就是以碳为基础的DNA分子。这个特殊的硬件限制了自然选择所能使用的搜索方法。而有了计算机这个新硬件,特别是并行计算机,许多新的自适应系统得以问世,全新的搜索策略也得以应用。例如,生物DNA的染色体无法将自己的代码向其它生物体的DNA分子「广而告之」,以便它们获得信息并改变其代码,而在计算机环境中,你就能做到这一点。

戴维·艾克利和迈克尔·利特曼都是贝尔通信研究所认知科学研究组的成员。他们着手在计算机上构建一个非达尔文的进化系统。他们选择了一个最合逻辑的方案:拉马克[4]进化——也即获得性遗传[5]。拉马克学说很有吸引力。直觉上,它远比达尔文进化更有优势,因为按道理有用的变异能更快地进入基因序列。然而,它的计算量之大很快就让满怀憧憬的工程师们明白,构造这样一个系统是多么不现实。

如果一名铁匠需要凸起的肱二头肌,他的身体该怎样倒推出基因上所需的变化呢?拉马克系统的缺陷在于,对于任何一个有利的变化,都需要回溯到胚胎发育期的基因构成。由于生物体的任何变化都可能由多个基因引起,或者是在身体的发展过程中由多个相互作用的指令引起。任何外在形式的内在因果都是一张错综复杂的网络,理清这个网络所需的追踪系统其复杂性与这个生物体本身相比也不惶多让。生物学上的拉马克进化受困于一条严格的数学定律:求多个质数的乘积极其容易,但分解质因素则异常困难。最好的加密算法正是利用了这种不对称的难度。拉马克学说之所以没有在生物界中真正存在过,就在于它需要一种不可能存在的生物解密方案。

不过,计算中并不需要躯体。在计算机进化(如汤姆·雷的电进化机)中,计算机代码兼任基因和躯体两个角色。如此一来,从表象中推导出基因的难题就迎刃而解了。(事实上,这种「表里如一」的约束并非只限于人工领域,地球上的生命必然已通过了这个阶段。也许任何自发组织的活系统都必须从一个「表里如一」的形式开始,就像自复制的分子那么简单。)

在计算机的人工世界里,拉马克进化是有效的。艾克利和利特曼在一台拥有16000个处理器的并行计算机上实现了拉马克系统。每个处理器管理一个由64个个体组成的亚种群,总计大约有100万个个体。为了模拟出躯体和基因的双重信息效果,系统为每个个体制作了基因副本,并称其为「躯体」。每个躯体的代码都略微有些差别,它们都尝试解决同一个问题。

贝尔通信研究所的科学家们设置了两种运行模式。在达尔文模式中,躯体代码会发生变异。某个幸运的家伙可能会意外地得到较好的结果,于是系统就选择它进行交配和复制。然而在达尔文进化中,生物交配时必须使用其代码的原始「基因」副本——即它所继承的代码,而非后天获得的经过改良的躯体代码。这正是生物的方式。所以,当铁匠进行交配时,他使用的是他的「先天」代码,而非「后天」代码。

相比之下,在拉马克模式中,当那个改良了躯体代码的幸运儿被选中进行交配时,它能使用后天获得的改良代码,作为其交配的基础。这就好比铁匠能将自己粗壮的胳膊传给后代一样。

经过对两个系统的比较,艾克利和利特曼发现,就他们所考量的复杂问题而言,拉马克系统的解决方案要比达尔文系统强上两倍。最聪明的拉马克个体比最聪明的达尔文个体聪明得多。艾克利说,拉马克进化的特点在于它把种群中的「白痴非常迅速地排挤出去。」艾克利曾经朝一屋子的科学家大喊道:「拉马克比达尔文强太多了!」

从数学意义上来说,拉马克进化注入了一点学习的要素。学习被定义为个体在活着时的适应性。在经典的达尔文进化中,个体的学习并不重要。而拉马克进化则允许个体在世时所获得的信息(包括如何增强肌肉,或如何解方程)可以与进化这个长期的、愚钝的学习结合在一起。拉马克进化能够产生更聪明的答案,因为它是更聪明的搜索方法。

拉马克进化的优越性使艾克利大感惊讶,因为他认为大自然已经做得很好了:「从计算机科学的角度看,自然是达尔文主义者而不是拉马克主义者,这实在是很蠢。可是自然受困于化学物质,而我们没有。」这使他想到,如果进化的对象不局限于分子的话,也许会有更有效的进化方式和搜索方法。

戴维·艾克利(David Ackley):卡内基梅隆大学哲学博士。在到新墨西哥大学任职之前,他是贝尔通信研究所的研究员,兴趣主要是在人工生命领域;目前的研究重点包括遗传算法及程序设计、分布式计算和社会性计算、具鲁棒性的自我意识系统,以及计算机安全。

贝尔通信研究所(Bellcore-Bell Communication Research):1984年原贝尔实验室根据1982年联邦法院做出的裁决进行了拆分,各个地方的分支研究机构组成了一个联盟,成为贝尔通信研究所。1996年被美国科学应用国际公司(SAIC)收购,更名为泰尔科迪亚(Telcordia)。公司在电信、移动、安全等领域拥有1800多个专利。

迈克尔·利特曼(Michael Littman):哲学博士,罗格斯大学计算机科学系教授。

拉马克(Lamarck, 1744.08.01~1829.12.18):法国人,1809年发表了《动物哲学》(Philosophie Zoologique)一书,系统地阐述了他的进化理论,即通常所称的拉马克学说。书中提出了用进废退与获得性遗传两个法则,并认为这既是生物产生变异的原因,又是适应环境的过程。达尔文在《物种起源》一书中曾多次引用拉马克的著作。——摘自「中文维基百科」

获得性遗传(Inheritance of Acquired Traits):与「用进废退」(User and Disuse)一起构成拉马克进化学说的核心观点,认为生物在出生后,为适应环境的变化可能产生变异,并且这种变异可以遗传给后代。

15.8 蚂蚁的算法天赋

意大利米兰的一组研究员提出了一些新的进化和学习方法。他们的方法填补了艾克利所提到的「所有可能的计算空间」中的一些空白。这些研究员们把自己的搜索方法称为「蚁群算法」,是因为他们受到了蚁群集体行为的启迪。

蚂蚁把分布式并行系统摸了个门清。蚂蚁既代表了社会组织的历史,也代表了计算机的未来。一个蚁群也许包含百只万工蚁和数百只蚁后,它们能建起一座城市,尽管每个个体只是模模糊糊地感觉到其他个体的存在。蚂蚁能成群结队地穿过田野找到上佳食物,仿佛它们就是一只巨大的复眼。它们排成协调的并行行列,穿行在草木之间,并共同使其巢穴保持衡温,尽管世上从未有任何一只蚂蚁知道如何调节温度。

一个蚂蚁军团,智愚而不知测量,视短而不及远望,却能迅速找到穿越崎岖地面的最短路径。这种计算正是对进化搜索的完美映射:一群无知而短视的个体们在数学意义上崎岖不平的地形上同时作业,试图找出一条最优路径。蚁群就是一个并行处理机。

真正的蚂蚁通过名为信息素的化学系统来彼此交流。蚂蚁在彼此之间以及自己的环境中散发信息素。这些芳香的气味随着时间的推移而消散。它还能通过一连串的蚂蚁来接力传播:它们嗅到某种气味,复制它并传给其它蚂蚁。信息素可以被看作是在蚂蚁系统内部传播或交流的信息。

米兰小组(成员为阿尔贝托·克罗尼、马可·多利古和维多里奥·马涅索)按照蚂蚁的逻辑构建了方程式。他们的虚拟蚂蚁是一大群并行运转的愚笨处理器。每个虚拟蚂蚁有一个微不足道的记忆系统,可以进行本地沟通。如果干得好的话,所获得的奖赏也以一种分布式计算的方式与其他同类分享。

意大利人用标准的旅行商问题来测试他们的蚂蚁机。这个问题是这样描述的:你需要拜访很多城市,但每座城市只能拜访一次,那么哪条路径最短?为了求解这个问题,蚁群中的每个虚拟蚂蚁会动身从一座城市漫游到另一座城市,并在沿途留下信息素的气味。路径越短的话,信息素挥发得越少。而信息素的信号越强,循迹而来的蚂蚁就越多。那些较短的路径由此得到自我强化。运行5000回合之后,蚂蚁的群体思维就会进化出一条相当理想的路径。

米兰小组还尝试了各种变化。如果虚拟蚂蚁都由一座城市出发或均匀分布在各个城市,会有什么不同吗?(分布的效果要好一些。)一个回合中虚拟蚂蚁的数量会有影响么?(越多越好,直到蚂蚁与城市的数量比为1: 1。)通过改变参数,米兰小组得到了一系列蚂蚁搜索算法。

蚂蚁算法是拉马克搜索的一种形式。当某只蚂蚁偶然发现一条短路径,这个信息通过信息素的气味间接地传播给其它虚拟蚂蚁。这样,单只蚂蚁毕生的学习所得就间接地成为整个蚁群信息遗产的一部分。蚂蚁个体把它学习到的知识有效地传播给自己的群体。与文化教导一样,传播也是拉马克搜索的一部分。艾克利说:「除了交配,信息交换还有许多方式。比如晚间新闻。」

无论是真实的蚂蚁,还是虚拟的蚂蚁,它们的聪明在于,投入「传播」的信息量非常少,范围非常小,信号也非常弱。将弱传播引入进化的提法相当有吸引力。即使地球的生物界中存在拉马克进化,那它也一定被埋藏得很深。不过,仍然存在充满了各种稀奇古怪算法的空间,各种拉马克式的传播尽可以在那里找到用武之地。我听说有的程序员整天在鼓捣「弥母(文化基因)」式的进化算法——即模仿思想流(弥母)从一个大脑进入另一个大脑,试图捕捉到文化革命的精髓和力量。连接分布式计算机节点的方法有千千万万,迄今为止,只有极少数的方法(如蚂蚁算法)被人们考察过。

直到1990年,并行计算机还遭到专家们的嘲笑,认为它尚有很多地方值得商榷,过于专业,属于狂热派的玩物。它们结构混乱,难以编程。但狂热派却不这么看。1989年,丹尼·希利斯与一个知名计算机专家公开打赌,预测到1995年,并行机每月处理的数据量将超过串行机。看来他是对的。当串行计算机由于其狭窄的冯·诺依曼通道不堪复杂任务的重负而痛苦呻吟时,专家的看法一夜之间就发生了变化,并迅速席卷了整个计算机产业。彼得·丹宁[1]在《科学》杂志上撰文(《高度并行的计算》[2],1990年11月30日),称,「解决高级科学问题所需的计算速度,只能通过高度并行的计算架构来获得。」斯坦福大学计算机科学系的约翰·柯扎[3]更直截了当,「并行计算机是计算的未来。句号。」

然而,并行计算机还是很难掌控。并行软件是水平的、并发的、错综复杂的因果网络。你无法从这样的非线性特性中找出缺陷所在,它们都隐藏了起来。没有清晰的步骤可循,代码无从分解,事件此起彼伏。制造并行计算机很容易,但要为其编程却很难。

并行计算机所面对的挑战是所有分布式群系统都会面对的——包括电话网络、军事系统、全球24小时金融网络,以及庞大的计算机网络。它们的复杂性考验着我们掌控它们的能力。「为一个大规模并行机编程的复杂度可能超过了我们的能力。」汤姆·雷对我说。「我认为我们永远也写不出能充分利用并行处理能力的软件。」

并行的愚昧的小东西能够「写」出比人类更好的软件,这让雷想到了一个能得到我们想要的并行软件的办法。「你看,」他说,「生态的相互作用就是并行的最优化技术。多细胞生物本质上就是在宇宙尺度上运行大规模的并行代码。进化能够『想出』我们穷尽一生也无法想清楚的并行编程。如果我们能够进化软件,那我们就能大大往前迈进一步。」对于分布式网络这类事物,雷说,「进化是最自然的编程方式。」

自然的编程方式!这听起来真让人有些泄气。人类就应该只做自己最擅长的工作:那些小而灵的、快而精的系统。让(人工注入的)自然进化去做那些杂乱无章的大事吧。

彼得·丹宁(Peter J.Denning, 1942~):美国计算机科学家,多产的作家。他最有名的发明是提出了工作集模型(Working-Set Model),该模型成为所有内存管理策略的参考标准。

《高度并行的计算》:Highly Parallel Computation

约翰·柯扎(John Koza):美国计算机科学家,斯坦福大学顾问教授,以利用遗传算法对复杂问题进行优化的开拓性工作而著称。他是科学游戏公司的创始人之一,该公司开发了美国博彩业的计算机系统。

15.9 工程霸权的终结

丹尼·希利斯也得出了相同的结论。他很认真地表示,想让自己的「连接机」进化出商务软件。「我们想让这些系统解决一个我们只知如何陈述却不知如何解决的问题。」一个例子就是如何编写出数百万行驾驶飞机的程序。希利斯提议建立一个群系统,以进化出「驾驶技巧」更优秀的软件,系统中有一些微小的寄生虫程序会试图坠毁飞机。正如他的实验所展示的,寄生虫会促使系统更快地向无差错和抗干扰强的导航程序收敛。希利斯说:「我们宁肯花更多时间在编制更好的寄生虫上,也不愿花上无数个小时去做设计代码和查错这些事情。」

即使技术人员成功地设计出一款庞大的程序,譬如导航软件,要想对其进行彻底的测试也是不可能的。但进化出来的东西则不同。「这种软件的成长环境里充斥着成千上万专职的挑刺者,」希利斯说着,又想起了自己的寄生虫,「凡是在它们手下躲过一劫的,都经受住了严酷的考验。」除了能够创造我们制造不出来的东西以外,进化还有一点值得夸耀:它能造出来缺陷更少的东西。「我宁愿乘坐由进化出来的软件驾驶的飞机,也不愿乘坐由我自己编制的软件驾驶的飞机。」作为一名非凡的程序员,希利斯如是说道。

长途电话公司的呼叫路由程序总共有200万行代码。而这200万行代码中的三行错误代码就导致了1990年夏天全国电话系统的连锁崩溃。现在,200万行已经不算多了。装载在海军海狼潜艇上的作战计算机包含了360万行代码。1993年微软发布的新操作系统「NT」总共包含400万行代码。一亿行的程序也离我们不远了。

当计算机程序膨胀到几十亿行代码时,仅仅是维护程序、保持正常运行本身就会成为一个主要负担。有太多的经济活动和人的生命会依赖于这种数十亿行的程序,因此不能让它们有哪怕片刻的失效。戴维·艾克利认为,可靠性和无故障运行时间将成为软件最首要的任务。「我敢说,对真正复杂的程序来说,仅仅是为了存活下来就要消耗更多的资源。」目前,一个大型程序中只有一小部分致力于维护、纠错和清理工作。「将来,」艾克利预言道,「百分之九十九的原始计算机周期都将被用在让这个怪兽自我监视以维持其正常运转上。只有剩余的百分之一将被用于执行用户任务——电话交换或其他什么。要知道,这个怪兽只有活下来,才能完成用户任务。」

随着软件越来越大,生存变得越重要,同时也越来越困难。要想在日复一日的使用中存活下来,就意味着必须能够适应和进化,而这需要做更多的工作。只有不断地分析自己的状况,修正自己的代码以适应新的需要,净化自己,不断地排除异常情况,并保持适应与进化,程序才能生存下来。计算必须有生命力和活力。艾克利称之为「软件生物学」或「活力计算」。程序员即使24小时都开着寻呼机,也不能确保数十亿行的代码能够不出故障。人工进化也许是唯一能使软件保持生命力和活力的方法。

人工进化是工程霸权的终结。进化能使我们超越自身的规划能力;进化能雕琢出我们做不出来的东西;进化能达到更完美的境界;进化能看护我们无法看护的世界。

但是,正如本书标题所点明的,进化的代价就是——失控。汤姆·雷说道:「进化系统的一个问题就是,我们放弃了某些控制。」

丹尼·希利斯所乘航班的驾驶程序是进化出来的,没有人能弄懂这个软件。它就像一团千丝万缕的乱麻,也许真正需要的只是其中的一小部分,但是它能够确保无故障地运行。

艾克利的电话系统是由进化出来的软件管理的,它是「活」的。当它出问题时,没有人能排除故障,因为程序以一种无法理解的方式埋藏在一个由小机器组成的未知网络中。不过,当它出问题时,它会自行修复。

没有人能把握住汤姆·雷的培养液的最终归宿。它们精于设计各种小技巧,却没人告诉它们下一步需要什么技巧。唯有进化能应付我们所创造的复杂性,但进化却不受我们的节制。

在施乐公司帕洛阿尔托研究中心,拉尔夫·默克勒[1]正在制造能够自我复制的极小分子。由于这些分子的尺度为纳米级别(比细菌还小),因此这种技术被称为纳米技术。在不久的将来,纳米技术的工程技能与生物技术的工程技能将趋于一致:它们都把分子看成是机器。对纯粹的生命来说,纳米技术可以看作是生物工程;对人工进化来说,纳米技术则等同于生物分子。默克尔告诉我,「我可不想让纳米技术进化。我希望把它限制在一定的框架内,并且受到国际公约的制约。对纳米技术来说,最危险的事情莫过于交配。是的,我想,应该有个国际公约来限制在纳米技术中使用交配。一旦交配,就有了进化;只要进化,就会有麻烦。」

进化并未完全超脱我们的控制;放弃某些控制只不过是为了更好地利用它。我们在工程中引以为傲的东西——精密性、可预测性、准确性以及正确性——都将为进化所淡化。

而这些东西必须被淡化,因为真实的世界是一个充满不测风云的世界,是一个千变万幻的世界;生存在这个世界里,需要一点模糊、松弛、更多适应力和更少精确度的态度。生命是无法控制的;活系统是不可预测的;活的造物不是非此即彼的。谈起复杂程序时,艾克利表示:「『正确』是水中月,是小系统的特性。在巨大的变化面前,『正确』将被『生存能力』所取代。」

当电话系统由适应性很强的进化软件来运行时,是没有一种所谓的正确方式的。艾克利继续道:「说一个系统是『正确的』,听起来就像是官话、空话。人们评判一个系统,是根据其对意外情况的反应力以及应对措施的创造性。」与其正确,不如灵活,不如耐久;所谓「好死不如赖活」。艾克利说:「小而专且正确的程序就像蚂蚁,对身处的世界茫然无知;而反应灵敏的程序往往是失控的庞然大物,仅把百分之一的精力花在你要解决的问题上。孰优孰劣,不言自喻。」

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体大小
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
首 页 < 上一章 章节列表 下一章 > 尾 页