在断断续续地对分类者系统做了这些年的研究以后,建立一个计算机模型对他来说似乎是手到擒来的一件事。既然在最初的论文中,自由漂浮的运行体具有规则的效果——“如果你遭遇如此这般的弦线,则对其采取如此这般的行动”——那现在要做的事是,就这样把它们写入程序,把这个模型弄得越像分类者系统越好。但荷兰德一开始按这个思路思考就意识到,他的分类者系统有一个严重的哲学上的缺陷。在那篇关于自发涌现的论文上,自发性是真实的,涌现也完全是来自内部的,但分类者系统尽管具有学习的功能和发现突发规则群的能力,但却仍然存在在紧要关头突然出现,从而扭转了局面的外部因素。这个系统仍然依靠程序员的影子操纵。“分类者系统获得奖赏只是因为我决定了输赢的规则。”荷兰德说。
这一点一直令他烦恼不已。撇开宗教的问题不说,现实世界运转正常,并不需要宇宙仲裁人的裁决。生态系统、经济体系和社会等所有这一切都在依循达尔文的相对论原则运行。每个人经常不断地在与其他人相互适应。正因为如此,我们就不可能掂量着一个作用者说:“它的强健度为1.375。”生物学家分辨说,无论“强健”意味着什么,自从达尔文时代以来,强健度已不可能是一个单一而确定的数字。这就好像是拿一个体操运动员和一个相扑摔跤手做比较,这个问题是毫无意义的,因为这两者之间不存在一个共同的衡量标准。一个特定的生物体的存活和繁衍的能力有赖于它跻身于怎样的生存空间。它周围都有什么别的生物体、它能得到什么样的资源,甚至与它以往的历史也有关。
荷兰德说:“这一观点的改变极其重要。”确实,进化生物学家用一个名词来表述其重要性:生态系统的生物体不只是演化,而是共同演化。生物体不是像费什这一代生物学家所认为的那样,是通过攀登某种抽象的强健制高点来得以变迁的(古典人口基因学中关于强健最大化生物体的观点,与新古典经济学的关于功能最大化作用者的观点看上去如出一辙)。而在现实中,生物体在共同演化的无限复杂之舞中,经常在循环往复、相互追逐。
荷兰德说,从表面上看,共同演化像是一片混沌。在研究所里,考夫曼喜欢将此比喻成在一个橡皮场景中攀登强健度的制高点。每攀登一步,整个橡皮的场景就会变一次形。然而,这样的共同演化之舞所产生的结果却一点儿都不混乱。在自然界中,花朵靠蜜蜂的帮助来受精繁殖、蜜蜂靠花蜜来维持生命。猎豹追逐吞食瞪羚,瞪羚则能从猎豹的爪下逃生。共同演化产生了无数能够完美地相互适应,并能适应于其生存环境的生物。在人类社会中,共同演化之舞产生了同样完美的经济与政治的相互依存之网,比如像同盟与竞争,以及供求关系等。这正是阿瑟的玻璃屋经济的动力之源。在阿瑟的这个概念中,你能够观察到人工经济作用者在相互适应。这是深埋在阿瑟和考夫曼的自动催化技术变迁分析中的动力之源,这也是在这个没有中央权威的世界上隐藏于各国关系之中的动力之源。
荷兰德说,确实,共同演化是任何复杂的适应性系统突变和自组的强大力量。他由此而明白,如果他真要想从最深层次来理解这些现象,他就必须从他的系统中排除来自外部的奖赏机制。但不幸的是,他也知道,对来自外界奖赏的假设是与分类者系统的市场比喻紧密相关的。在荷兰德建立的分类者系统中,每一条分类者规则都是一个极小、极简单的作用者,它们一起参与内部经济体系,在这个内部经济体系中,通用的货币就是每个作用者的“强度”,而唯一的财富之源就是来自最终用户的回报,即来自程序员。如果不彻底改变分类者系统的构架,就根本无法绕过这个问题。
所以,荷兰德要做的就是彻底改变分类者系统的构架。他认为,他需要的是一个全然不同的、更加彻底的对相互作用的比喻:战斗。他设计了一个生态系统,在这个高度简化的生物社区中,数字化的生物体在数字化的环境中游荡,寻找着赖以维生和繁衍的资源,这些资源就是数字化的水、草、壳物、草莓等。当这些生物碰到一起时,它们当然会试图将彼此作为资源。荷兰德说:“我把这与我女儿曼加的‘邮寄怪兽’的游戏做了比较。在这个游戏中,你有很多攻击和防守的可能步骤,你怎样利用这些可能的步骤,决定了你在与其它怪兽战斗中的输赢。”
更具体一些说,生态系统代表的环境是一片广袤的平原,其中遍布着“泉眼”,从泉眼里喷出以a、b、c、d为象征的各类资源。单独的生物体随意地漫游在这个环境中,像平静而温和地在四野吃草的羊一样一路吞食资源,并储存到自己的内部资源库中。但只要当两个生物体相遇,它们马上就会从羊的状态转入狼的状态,相互进攻。
在接下来的战斗中,战斗的结果取决于每个生物体的那对“染色体”,这染色体只是一组资源象征符号串成的两个序列,比如aabc和bbcd。“如果你是其中的一个生物体,那么你就用你的每一序列的‘攻击性’染色体与对方的第二序列‘防御性’染色体相匹配,如果它们俩能够相互匹配,那你就得到高分。这种情形非常类似于免疫系统:如果你的攻击能对应对方的防守,那你就打开了缺口。而对方也对你报之以交互的行动,即,他的攻击与你的防守相匹配。这种相互作用极其简单。主要看你的攻击与防守能力能否强过对手。”
他说,如果回答是肯定的,那你就能饱餐一顿:你对手储备库里所有的资料符号和它的两个染色体序列都归你所有了。而且,如果吃掉你以前的对手意味着,目前你的储备库里有足够的资料符号来复制你自己的染色体,那么你就能通过创造一个全新的生物体来自我繁衍,其中也许会有一、两个变种。但如果情况不是这样的话,那你就回去接着吃草。
婉转一些说,这个生态系统不完全是盖尔曼想要的那种,使用者会感到没有什么好玩的,也没有一点儿新奇的图像。但荷兰德才不会去理会这些呢。他会打入一串密码和符号来启动这个系统,然后看到它产生出更多的密码,看到一行行字母数字乱码像瀑布一样在屏幕上涌现出来(那时他的计算机已经升级到苹果二型机了)。这个生态系统是荷兰德式的游戏。在这个游戏中他终于排除了明显的外来回报。他说:“这是一个封闭的圈子。你真正回到了‘如果我不能寻找到足够的资源来复制我自己,我就无法生存’这样一个概念。”他抓住了他认为是生物竞争本质的东西。现在他可以把这个系统当作知识乐园,当作一个探索和了解共同演化的真正作用的地方。“我将生态系统中的很多现象都列入了研究计划。我想证明,即使用这个极其简单的结构,每种现象也都能够以这种或那种方式显现出来。”
荷兰德最有兴趣研究的生态现象是被英国生物学家里查德.达金斯称为进化的军备竞赛现象。这就是为什么植物的表层演化得越来越坚硬,越来越能产生有毒的化学驱虫剂来抵抗害虫袭击的原因。而害虫也演化出更坚硬的颚和更复杂的化学抵抗机制来与之抗争。在这点上,红皇后假设又是著名的一例。这个假设来自于《爱丽丝梦游仙境》一书。书中的人物红皇后告诉爱丽丝,她必须以最快的速度奔跑才能呆在原来的地方。进化的军备竞赛似乎是自然界日益复杂化、日益专业化的主要的推动力量,正如冷战中真正的军备竞赛是日益复杂化、日益专业化武器产生的主要推动力量那样。
在1988年秋季,荷兰德当然无法就进化的军备竞赛做太多的研究。那时他的生态系统还只是一个书面设计。但在一年左右时间里,这个系统就运作得非常成功了。“如果从非常简单的生物体开始,只用一个字母来代表生物体的进攻性染色体,用另一个字母来代表防御性染色体,那么我就会看到多字母染色体的生物体(这些生物体可以通过变种来加长它们的染色体)。它们在共同演化。如果一个生物体把攻势增强了一些,另一个生物体就会增强其防御力量。因此它们越变越复杂。有时它们还会分裂,这就产生了一个新的物种。”
荷兰德说:“这时我看到,如此简单的机制能产生军备竞赛和物种的形成,我的兴趣更加浓厚了。”
特别是,他想了解进化中的一种深层的自相矛盾性。事实上,这种无情的竞争不但导致了进化的军备竞争,也导致了共生现象和其它形式的合作现象。确实,荷兰德把各种形式的合作作为自己的研究兴趣毫不奇怪。这是生物进化的根本问题,更别说这也是经济学、政治科学和所有人类现象的根本问题。在这个竞争激烈的世界上,生物体究竟为什么会相互合作?为什么他们会对轻易就会翻脸的“同盟者”门户开放?
著名的“囚犯的两难境地”很精彩地揭示了这个问题的本质。“囚犯的两难境地”最初是由一群数学家从博弈理论发展而来的。这个故事说的是:两个囚犯被分别关在独牢里。警方对他们俩共同犯的一个案子进行审讯。两个囚犯都可以做出自己的选择:他要么供出他的同伙(即背叛他),要么保持沉默(也就是与他的同伙合作,而不是与警方合作)。现在,这两个囚犯都知道,如果他俩都保持沉默的话,他俩都会被释放,只要他们拒不承认,警方无法给他们定罪。但警方也完全明白这一点。所以他们给这两个囚犯一点儿刺激:如果他们其中的一个人背叛,告发了他的同伙,那么告发的囚犯就会被无罪释放,同时还会得到一些奖赏。而他的同伙就会被按最重的罪来判决,而且为了羞辱他,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯相互背叛的话,两个人都会被按最重的罪来判决,谁也不会得到奖赏。
所以,这两个囚犯该怎么办呢?是相互合作还是相互背叛?从表面上看,他们应该相互合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑。A犯不是个傻子,他马上就意识到,他根本就无法相信他的同伙会不向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑而向警方交待了,那么,A犯反正也得服刑,起码他不必在这之上再受罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其它许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这令人沮丧的真实的一面。让我们看看冷战时期两个超级大国将自己锁定在一场四十年的军备竞赛中,其结果对双方都毫无益处。还有看上去永无止境的阿以僵局,和各国的贸易保护主义的永恒倾向。在自然界,看一看过于相信他人的生物也许会被吃掉。所以这个问题又出现了:为什么所有生物体都敢于相互合作呢?
这个答案大部分来自荷兰德在密西根大学巴奇小组的成员罗伯特.爱克斯罗德组织的一场计算机竞赛。爱克斯罗德是一个政治科学家,对合作的问题久有研究兴趣。他组织这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都会扮演其中一个囚犯的角色,然后这个程序会被成双成对地融入不同的组合,参与者就开始玩“囚犯的两难境地”的游戏,每个人都要在合作与背叛之间做出选择。但这里有个不同之处:他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈理论家所谓的“重复的囚犯的两难境地”,这更逼真地反映了某种经常而长期的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果这两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果这两个程序已经交手过多次,则双方就建立了各自的历史和在这方面的声誉。然而,对方的程序将会如何举动却极难确定。确实,这是爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序能总是不管对手做何种举动都采取合作的态度吗?或者,它能总是采取叛卖行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?
事实上,竞赛的第一个回合后交上来的十四个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,桂冠属于最简单的策略:针锋相对(TIT FORTAT)。这是多伦多大学心理学家阿纳托.拉帕波特(Anatol Rapoport)提交上来的策略。针锋相对的策略以合作开局,但从此以后就采取以其人之道,还治其人之身的策略。那就是,针锋相对的策略实行了胡萝卜加大棒子的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报,从这个意义上来说他是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。
当然,因为只有为数不多的程序参与了竞赛,针锋相对策略的胜利也可能只是一种侥幸,但也许不是。在上交的十四个程序中,有八个是“善意的”,它们永远不会首先背叛。而且这些善意的程序都轻易就赢了六个非善意的程序。为了决出一个结果来,爱克斯罗德又举行了第二轮竞赛,特别邀请人们从针锋相对策略那里将桂冠夺过来。这次有六十二个程序参加了竞赛,针锋相对策略又一次夺魁。结论是无可争议的。好人,或更准确地说,善意的、宽容的、强硬的、简单明了的人,确实总是赢家。
荷兰德和巴奇小组的其他成员对这一切当然深为着迷。“我一直对‘囚犯的两难境地’深感苦恼,”荷兰德说。“这是我不喜欢的事情之一。所以看到这个竞赛结果我非常高兴。这真令人鼓舞。这游戏太棒了。”
针锋相对策略的胜利对生物进化和人类事务所具有的深刻含义是显而易见的。爱克斯罗德在1984年发表的《合作进化》一书中指出,针锋相对策略能导致社会各个领域的合作,包括在最无指望的环境中的合作。他最喜欢举的例子就是第一次世界大战中自发产生的“自己活,也让他人活”的原则。当时在前线战壕里的军队约束自己不开枪杀伤人,只要对方也这么做。处于无人区的军队根本无法与地方军队取得联系,而且他们当然不会是朋友。但使这个原则能够实行的原因是,双方军队都已陷入困境数月,这给了他们相互适应的机会。
在这本书的其中一章中,爱克斯罗德还指出,针锋相对的相互作用使得自然界即使没有智能也能产生合作关系。这一章是他与他的合作撰写人,巴奇小组的生物学家威廉姆.汉弥尔顿共同写的。在这方面他们举了地衣等例子:真菌从地下的石头中汲取养分,为海藻提供了住食,而海藻反过来又为真菌提供了光合作用;金蚁合欢树为一种蚂蚁提供了住食,而这种蚂蚁反过来又保护了该树;无花果树的花是黄蜂的食物,而黄蜂反过来又为无花果树传授花粉,将树种撒向四处。
更广泛地说,共同演化会使针锋相对的合作风格在这个充满背信弃义劣行的世界上蔚然成风。爱克斯罗德说,假设少数采取针锋相对策略的个人在这个世界上通过变种而产生了。那么,只要这些个体能相互遇见,足够在今后的相逢中形成利害关系,他们就会开始形成小型的合作关系。一旦发生了这种情况,他们就能远胜于他们周围的那些背后藏刀的类型。这样,参与合作的人数就会增多。很快,针锋相对式的合作就会最终占上风。而一旦建立了这种机制,相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意,针锋相对政策强硬的一面就会狠狠地惩罚他们,让他们无法扩散影响。爱克斯罗德写道:“这样,社会进化的齿轮就会有所掣肘。”
这本书出版不久,爱克斯罗德就与荷兰德当时带的研究生史蒂芬尼亚.福莱斯特(Stephanie Forrest)共同将这种合作的情形用计算机模拟了出来。问题是,共同演化的一个人群是否能通过基因算法来找到针锋相对的策略。结果答案是肯定的:在计算机运作之中,会出现针锋相对的策略,或与之类似的策略,并很快在该群人中流行开来。荷兰德说:“当这种情况出现时,我们都高举双手,三呼万岁!”
当荷兰德谈到,研究所的人应该像观察“锋面”那样观察社会科学时,他指的正是这种关乎合作起源的针锋相对的机制。他说,当他在设计开发生态系统时,他脑海里盘旋的是整个关于合作的问题。合作的机制当然不可能出现在这个程序的第一版本中,因为他在第一个版本中设入了单个生物体总是会互斗这样一种假设。但在新的版本中,他力图完善生物体演化的各个方面,包括其合作的可能性。确实,他想把生态系统设计成某种能够共同演化的、“整体的”模型。
“在研究所,除了生态系统之外,我们还在创建其他三个模型,一个是股市模型,一个是免疫系统模型,还有一个是斯坦福大学经济学家汤姆.沙金特建立的贸易模型。我发现这些系统之间具有非常相似的特点。它们都有‘贸易’的存在,都有以各种方式进行交换的货物,都有‘资源转换’机制,比如通过酶或各种生产过程实现资源的转换。而且它们都有作为技术发明之源的‘交配选择’机制。所以我由此开始创建一个完整的共同演化的模型。我记得史蒂芬尼亚.福莱斯特、约翰.米勒和我坐了下来,努力想弄清楚,如何在生态系统中设入最小的装置,来模拟出所有这些特点?我们的结论是,用不着改变基本的模型,只消在进攻和防御染色体上增加内容就能做到这一点。我提供可以由染色体来界定的额外的分辨体,从而增加了贸易的可能性,这些分辨体类似于商标,或细胞表面的分子标签。同时我必须在这个生态系统中加上一条类似规则的东西,我这是第一次这么做。这条规则是:‘如果其他人显示这样的识别标签,则我就和他进行贸易,而不是进行战斗。’这就产生了合作的演化,以及说谎和模仿这类非常规现象。我基于这样的设想,草拟出如何做一个沙金特式的模型的想法,然后就开始构思如何通过从另一个方向把生态系统设计成看上去像一个免疫系统的模型。现在的生态系统模型正是由此而来的。”
荷兰德说,生态系统的这个统一的版本做得非常成功。这个系统可以演示合作演化,同时也可以演示食肉动物和猎物之间自发形成的关系。这一成功激励我开始研究设计更高级版本的生态系统。“我目前正在编写的最新版本能演示多细胞生物体的演化。所以现在我们不只限于探讨贸易,我希望我们还能探讨个体和组织的涌现。每个作用者都极力提高其繁殖率,但又总是受到总体组织延续的制约,这里面有许多值得研究的名堂。癌症就是这方面的一个很好的例子,就先不谈美国的自动化工业的情形了!”
荷兰德说,这种模型的实际应用为期还早,但他确信,这方面的一些优秀的计算机模拟也许会比桑塔费其它研究项目对这个世界做出的贡献要大。“如果我们做得好的话,那些不是科学家的人,比如华盛顿的官员们,可以不需要了解这些模型运行的详情便能够建立这类模型,从而助使他们把握各种政策性选择的真正含义。”他说,从大体上说,这样的模型就像政策的飞行模拟器一样,能够使政治家模拟经济的强迫着陆,而不需要让两千五百万人都搭上这架飞机。这些模型甚至不必做得很复杂,只要能让人对情况的发展和最重要变量的相互作用力产生逼真的感受就行了。
荷兰德承认,当他在华盛顿谈论这个飞行模拟概念时,并没有引起听众的重视。大多数当政的政治家都忙于躲闪迎面而来的打击,无暇顾及下一次飞行的政策问题。另一方面,他显然不是唯一从模拟角度来考虑策略的人。1989年,加州奥林达的麦克塞斯公司推出了一种叫“模拟城市”的游戏。这个游戏可以让玩者扮演市长的角色,面对犯罪、污染、交通堵塞、抗税等种种问题,努力使他或她的城市繁荣昌盛起来。这个游戏很快就跃上了畅销排行榜之首,同时赢得了真正的城市规划管理人的高度信赖。他们说,尽管“模拟城市”的游戏在具体细节上去冗删繁,但它找对了感觉。荷兰德当然也买了这个游戏,而且非常喜欢它。“‘模拟城市’是我所知道的最好的一个飞行模拟概念的例子。”他说。桑塔费研究所正认真和麦克塞斯公司商谈改造“模拟城市”的接口,使其能够用于桑塔费的许多模拟中。荷兰德现在正和麦克塞斯公司一起开发一个用户友好介面的生态系统版本,使任何人都能在上面做计算机实验。
心智的网络实验室
与此同时,阿瑟在桑塔费经济学项目的最初这段日子中也对计算机实验发生了浓厚的兴趣。“我们就像在从事常规经济学那样用计算机程序来做数学分析和定理证明,但因为我们研究的是报酬递增率、学习以及适应性和归纳法这些界定含糊的概念,所以问题往往复杂得无法用数学来解决。因此我们不得不借助计算机来观察事情的发展结果。计算机就像一个网络实验室,我们可以由此观察我们的思想变成行动的结果。”
但阿瑟的问题是,即使在桑塔费,经济学家们一想到用计算机模型也会变得神经高度紧张。“我猜我们不得不在经济学中引入计算机模拟了,但我想我已经上了年纪,很难改变了。”有一天午餐时阿罗闷闷不乐地说。
“感谢上帝,我的小伙子,如果定理的时代要退出历史舞台了的话,我也就随之而退场了。”六十多岁的汉恩在另一个场合这么说。
阿瑟不得不承认经济学家的怀疑和犹疑是有一定道理的。在很多方面,他自己也有同感。他说:“在经济学领域,计算机模拟全无成功之例。在我个人的早期经历中,我和我的同事杰佛里.麦克尼考花了很长时间来观察模拟模型在经济学的作用,我们得出了两个结论,这两个结论现在已成为普遍的共识。第一个结论是,总的来说,只有那些不能做分析性思考的人才借助计算机模拟。经济学要求用演绎法和逻辑分析,而计算机模拟却正好与之相反。第二个结论是,你只要把自己的假设设置于计算机模型,就可以从计算机模拟中想得到什么结论就能得到什么结论。人们经常从基本的政治角度出发,比如,我们需要降低税收,那么就做一个对降低税收如何如何有利的假设。我和杰佛里设计了一种游戏,它能够深入到模型里去发现改变一个假设怎样改变了整个结果。其他人也做过类似的事。所以计算机模拟在社会科学,特别是在经济学领域里声名狼藉,就好像是无赖的手法。”
事实上,即使是这些年以来,阿瑟发觉自己对“模拟”这个词仍然有一种警惕心。他和他的同事们更愿意将经济学程序称为“计算机实验”,这个词体现了荷兰德和桑塔费的物理学家所实践的某种严谨性和准确性。他说,荷兰德和物理学家们从事计算机模拟的方法给了他很大的启发。“我认为这太妙了。到了极为小心的人手里,所有的假设都经过仔细斟酌,整个算法明确清晰,模拟就像实验室的实验一样具有可重复性和严谨性,在这种情况下,我发现计算机模拟是无懈可击的。事实上,物理学家在告诉我们,有三种可以从事科学研究的方法:数学理论、实验室的实验和计算机模拟。你必须反复使用这三种方法。当你发现计算机模拟的结果似乎不符合常情,你就回过头去从理论上理解它,然后再以理论为依据,回到计算机模拟或实验室去印证。对我们许多人来说,似乎经济学研究也可以照此办理。我们开始认识到,以往的经济学过于自我局限,只对能用数学进行分析的问题做研究。但现在我们进入了归纳法的世界,一切都变得极为复杂,我们可以用计算机实验来拓展研究的范围。我把这视为一个势在必行的发展方向,一种解放。”
当然,阿瑟希望桑塔费经济学项目能开发出足以说服其他经济学家的计算机模型来。或,起码不要使他们再次失望。确实,到1988年秋天时,阿瑟和他的经济学项目组已经用了好几个这样的计算机实验了。
阿瑟与荷兰德的合作直接诞生了最初的玻璃房经济的设想。“1988年6月,我到桑塔费后意识到,我们需要从一个切实的问题入手,而不是一开始就建立完整的人工经济学模型。这个想法引出了人工股市模型。”
阿瑟解释说,在经济学的所有陈芝麻烂谷子的问题中,股市行为是最古老的问题之一。这是因为新古典经济学发现华尔街完全不可理喻。有论点说,既然所有的经济作用者都是完全理性的,那所有的投资者必然是完全理性的人。而且,既然这些完全理性的投资者对所有股票的长远预期获利都掌握同样的信息,那他们对每股股值的估计,即,在扣除利率后的预期净利,就应该总是一致的。照此推理,这种完全理性的市场就永远不可能陷入投机性的炒做和崩盘,股市最多只会由于对各种股票预期的最新信息而稍有波动。无论怎样,根据逻辑推理,纽约股票交易所大厅必然是个非常安静的地方。
但事实上,纽约股票交易所大厅几乎成了一个失控之地,形形色色的泡沫和崩盘在大起大落,横扫交易大厅,就更别提人群的恐惧心理和不安全感、以及狂喜和聚众闹事的欲念搅成一锅粥的情状了。如果有个火星人订阅一份星际版的华尔街日报,读完报纸后也许会认为股市是一个什么活物。阿瑟说:“在有关股市的报道中,记者总是用描述心理的词汇来描述股市:股市极度紧张不安、股市萎靡沮丧、股市信心十足。”股票交易所本身就是人工生命的一种形式。阿瑟说,所以他们在1988年认为,用桑塔费的方式来模拟股市似乎是唯一能够解释股市的方法。“我们的想法是做小面积的剖析,先用常规的新古典经济学的完全理性的作用者的假设来做模拟,然后再用能够像人类那样学习和适应环境的人工智能作用者取而代之。这个模型有一个股市,作用者可以在其中自由买卖。随着他们对贸易规则的掌握,你会看到各种市场行为涌现出来。”
问题显然在于,会发生什么样的涌现行为?这些作用者会像常规经济学描述的那样安然自若地进行股票交易吗?或者,它们的行为模式会如风起云涌的股市那样逼真吗?阿瑟和荷兰德毫不怀疑会发生后一种情况。但事实上,即使在研究所,很多人也对此抱怀疑态度。
阿瑟对1989年3月份的一次会议的记忆尤为深刻。当时荷兰德从安.阿泊返回研究所,另外还有几个人也来参加在小教堂举行的这个经济学研讨会。当谈到股市模型的这个题目时,沙金特和明尼苏达大学的莱蒙.马里蒙都激烈地争辩说,适应性作用者叫的价会很快向股票的“基价”靠拢,也就是,肯定会出现新古典经济学理论预期的那种情况。他们说,股市也许会出现偶尔的上下波动,但作用者无法真正别有所为。基价就像一个无限巨大的万有引力场一样将它们紧紧吸引得不离左右。
“我和约翰(荷兰德)相互望望,然后一个劲地摇头。我们说,这不可能。强烈的直觉告诉我们,我们建立的股市具有自我组织行为方式的巨大潜能,会越变越复杂,新的、丰富多采的行为会涌现出来。”阿瑟说。
阿瑟回忆说,他们就此发生了一场激烈的争论。当然,阿瑟知道,自从1987年9月召开了第一次经济学研讨会以后,沙金特对荷兰德研究学习的方式就一直持有浓厚的兴趣。其实沙金特早在这之前就开始研究学习对经济行为的影响。而马里蒙当时就像阿瑟一样对计算机实验极感兴趣。但在阿瑟看来,马里蒙和沙金特似乎并不真正把学习当作研究经济学的新视角。他们似乎把学习当作巩固常规经济学理论的一种方法,就好像是在用这种方法来理解经济作用者在不完全理性的情况下是如何摸索到新古典经济学的行为模式的。
公平地说,阿瑟必须承认,这两个人有理由这样认为。沙金特在他研究的“理性的期望”理论之外,还掌握了一些实验证据来支持他们的论点。研究者证明,在一系列让学生们扮演股票交易者的计算机模拟实验中,实验对象的交易价格很快就会集中到股票基价上。而且,马里蒙和沙金特也在进行他们自己的桑塔费式的计算机模拟实验:一种被称为“威克塞尔三角”的老问题。情节是这样的:三个不同类型的作用者生产和消费三种不同类型的货物,其中之一最终变成了一种交换的中介:钱。当马里蒙和沙金特用分类者系统替代了原来模型中的理性作用者后,发现这个系统每一次都回到新古典经济学的结论上(也就是说,交换的媒介是库存成本最低的货物——比如说,是金属磁盘,而不是鲜牛奶)。
尽管如此,阿瑟和荷兰德仍然不放弃努力。阿瑟说:“问题是,逼真的适应性行为真的会导致理性期望的结果吗?我认为,答案是肯定的,但这只有在面对非常简单的问题、或这个问题一再出现的情况下才有可能。从根本上说,理性期望的理论是说,人类并不愚蠢。这就像玩连圈叉的井字游戏一样(tic-tac-toe),几次以后就能学会预测对手的行为,于是双方就能把这个游戏玩得滴水不漏。但如果是在一个决不会重复出现的情况下,或在非常复杂的情况下,作用者必须做大量的算计,那么你对作用者的要求就太高了。因为你这就是在要求它们了解自己的期望、把握市场的驱动力。把握其他人的预期。以及其他人对其他人的预期的预期、等等。很快,这些倒霉的作用者就会陷于无法预期的状况。”在这种情况下,阿瑟和荷兰德认为,作用者就会处于极不均衡的状况,导致理性期望值的“万有引力”就会变得非常微弱,动力和意外事件就会主宰一切。
阿瑟回忆说,这场既友好又激烈的争论持续了一段时间。当然,结果双方谁也没有退让。但阿瑟明显感到这对他是一场挑战:如果他和荷兰德相信他们的股市模拟能展现逼真的涌现行为,那么,他们就必须证明这一点。
但不幸的是,股市模型的编程工作时续时断。1988年6月的一天,在午餐时间,阿瑟和荷兰德粗拟了这个计算机模拟的初槁。当时他们俩都在桑塔费的首期复杂系统暑期班上担任讲师。那年夏天,荷兰德回到安.阿泊,用阿瑟唯一了解的计算机语言,BASIC语言,编写了完整的分类者系统和基因算法(这使荷兰德终于摆脱了用十六位进制符号编写程序。他只得自学了BASIC语言。但从此他只用BASIC语言编写程序)。那年秋季,在经济学项目开始的最初几个月,荷兰德回到了桑塔费。他一回到桑塔费就和阿瑟一起进一步开发股市模型。但由于将此编写为生态系统占去了荷兰德许多时间,而阿瑟又苦于行政事务缠身,所以股市模型编写进展缓慢。
更糟糕的是,阿瑟开始意识到,尽管分类者系统的概念有许多强处,但使用起来却麻烦甚多。他说:“起初,桑塔费的人都认为分类者系统是全能的,能解答股市的问题,也能在早上替你煮咖啡。所以我曾经和荷兰德开玩笑说:‘嘿,约翰,分类者系统真的能够产生低温核聚变吗?’”
“到了1989年初,戴维.莱恩和里查德.派尔默组织了一个专门研究荷兰德思想的小组,每周有四次午餐前的聚会。那时候荷兰德已经离开了桑塔费,但我们花了一个月的时间来研究他的《归纳法》一书。当我们深入到分类者系统技术之中的时候,我发现,对分类者系统的构架设计必须十分小心,才能保证它在实际中能够运用,而且还必须对规则之间环环相扣的环节设计得十分周密。同时,你设计的可能会是‘深度’分类者系统,那就是,一个规则激活另一个规则、再激活另一个规则,从而引起长长的连锁反应的分类者系统,或者,你设计的可能是‘广度’分类者系统,即,刺激-反应式的系统,它能在稍有差别的情况下能产生150种反应方式。我的经验是,广度系统的学习功能非常强,而深度系统则不然。”
阿瑟和荷兰德以前的学生史蒂芬尼亚.福莱斯特对这个问题做了许多探讨。福莱斯特现在在新墨西哥大学,是桑塔费研究所的常客。她告诉阿瑟,问题出在荷兰德的水桶队列算法上。这个算法能够对各种规则论功行赏。如果水桶队列算法能够倒过来奖励上几代规则,那等到倒溯到这些规则的鼻祖的时候,奖品已经所剩无几了。所以毫不奇怪,为什么浅显系统的学习功能较佳。确实,对水桶队列算法的提炼与改良已经成为分类者系统研究中最紧迫的一环了。
阿瑟说:“这些使我开始对分类者系统产生了怀疑。随着我对这个系统越来越熟悉,这个系统的弊端也就变得越来越明显了。然而,我越是仔细研究这个系统,就越是叹服其中所包含的思想:你的脑子里可以有许多相互矛盾的假设,这些假设可以相互竞争,因为这样你就不必把某种专家预先编入这个系统,我真的非常欣赏这个思想。我开始从与荷兰德略有不同的角度来构想他的系统。我把它们想成是普通的计算机程序,有许多模数和分支点,但其程序每次都要自己判断究竟该激活哪一个模数,而不是沿着固定的序列来激活这些模数。一旦当我开始把它们构想成是一种自我适应的计算机程序,我就感到顺畅得多了。我认为这正是荷兰德的成就之所在。”
他说,不管怎样,他们终于完成了股市模型的版本。沙金特对最初的设计提出了许多简化办法,对这个版本的出台给予了很大帮助。1989年春末,杜克大学物理学家里查德.派尔默也加入了进来,以他高超的编程技术大力支持了这个模型的出台。
同时,派尔默和荷兰德、阿瑟一样,也被这个模型深深吸引住了。他说:“这个模型关系到自我组织,这正是我深感兴趣的研究领域。大脑是怎样组成的?什么是自我意识的本质?生命是怎样自发产生的?我的脑子里一直盘旋着这些重大的问题。”
另外,他正在为自己已经花费了大量时间来从事的另外一个桑塔费研究项目感到焦虑不安。这个项目就是“双重喊价竞赛”模型,这是他和卡内奇麦伦大学的约翰.米勒和威斯康星大学的约翰.鲁斯特共同设计开发的。这个最终于1990年初举办的竞赛是在1987年9月第一次经济研讨会上构思的。这个模型在原理上与爱克斯罗德在10年前设计的模型非常类似。但这个模型不是重复运作“囚犯的两难境地”的游戏,而是包含了交易者对付像股票交易这样的商品市场的各种策略。是不是最好一开盘就叫价?是不是先别做声,等到最好的价格出现时再叫价?因为买卖双方在这样的市场上都是自发叫价的,所以这个系统就被称为“双重叫价”,而答案却是冥然不知的。
派尔默说,这个竞赛游戏应该非常有趣,对他和他的同事来说,为这个游戏编程当然也是一个很大的挑战。但这个模型中的作用者基本上是静态的。对他来说,这个竞赛游戏根本就没有阿瑟和荷兰德式模型的神奇魅力。在阿瑟和荷兰德式的模型中,你可以看到作用者越变越复杂,能够发展成为自己真正的经济生命。
派尔默从早春就开始以全副精力投入了股市模型的设计和开发。1989年5月,他和阿瑟完成了股市模型的初版。按照他们设计的意图,这个模型在开始时,其作用者完全愚昧无知,都是一些随意制定的规则,让它们自己学会如何叫价。他们发现,这些作用者就像他们预期的那样,学习进展神速。
他们观察到,这个系统每一次运行的结果都像见了鬼似地符合汤姆.沙金特的预言。阿瑟说:“在这个模型中,单股的股息是三美元,折扣率为百分之十,这样,股票的基价为三十美元。而股价真的就在三十美元上下浮动,证明了常规经济学理论的正确!”
阿瑟深感懊丧和烦恼。现在唯一可做的似乎是把沙金特从斯坦福大学叫回来,祝贺他的胜利。“但有一天早上我和里查德走进办公室,在我的苹果机上运作这个系统。我们一直在观察其运作,一边讨论着如何改进这个程序。我们注意到,每当价格达到三十四美元时,作用者就会买进。我们可以把这种情况图示化,情况似乎很异常。我们以为是这个模型出了错误。但当我们又苦苦思考了一个多小时以后,才认识到这个模型并没有错误,而是这些作用者发现了技术分析的原始形式。那就是,这些作用者开始相信,如果股价上涨到一定程度,就会继续看涨,那就买进。但当然,这种认识变成了一种自圆其说的预言:如果在股价达到三十四美元时有足够的作用者意欲购买,那就会造成股价继续看涨。”
而且,当股价跌到二十五美元时,就会发生正好相反的情况:作用者都会尽力卖出,这样就对股市看跌也形成了一个自圆其说的预言。这正是股市出现泡沫和崩盘的道理!阿瑟为之精神大振,就连平时最小心翼翼的派尔默都受到了他热情的感染。阿瑟说,这个结论在这个模型的最新的、更完整的版本中一再得到确认。但在1989年5月的早晨他们就意识到他们成功了。
“我们马上意识到,我们已经从这个系统中窥见了突发特征的一线希望,看到了一线生命的曙光。”