1. Paul G. Allen and Mark Greaves, “Paul Allen: The Singularity Isn’t Near,” Technology Review, October 12, 2011, http:// www. technologyreview. com/ blog/ guest / 27206/.
2. ITRS, “International Technology Roadmap for Semiconductors,” http:// www . itrs. net/ Links/ 2011ITRS/ Home2011. htm.
3. Ray Kurzweil, The Singularity Is Near (New York: Viking, 2005), chapter 2.
4.艾伦和格里夫斯的著作《奇点依旧遥远》的尾注2,内容如下:
计算机的能力开始达到我们所需的范围,借此就可支持大规模脑仿真。千万亿次运算级的计算机(如IBM沃森系统所用的BlueGene / P)现在已投入商业使用。更高运算级的计算机目前也在规划当中。这些系统配置所需的原始计算能力极有可能可以模拟单个大脑所有神经元激活的模式,尽管目前仍然比实际大脑的速度慢许多倍。
5. Kurzweil, The Singularity Is Near, chapter 9, section titled “The Criticism from Soft ware” (pp. 435– 42).
6. Ibid., chapter 9.
7.尽管我们不可能精确地测定基因组中的信息量(因为存在重复的碱基对,所以实际的量显然远比未经压缩数据总量要低)但以下两种方法仍可以估算出基因组中压缩的信息量,两种方法都表明了300万至1亿字节的范围相对较高。
⑴就未压缩的数据来看,人类基因编码有3亿个DNA双螺旋分子,每一个编码2个字节(因为每个DNA碱基对有4种排列方式)。因此,未压缩的情况下,人类基因组约有8亿字节。过去常称非编码DNA为“垃圾DNA”,不过现在它显然在基因表达中发挥着重要作用。然而,这种编码非常低效。因为存在大量冗余(例如,被称为“ALU”的序列重复达几十万次),而压缩算法可以对此加以利用。
随着最近基因数据库的激增,基因数据压缩吸引了众多的关注。最近,将标准数据压缩算法运用到基因数据中的工作显示,减少90%的数据(实现字节最大压缩)是可行的:Hisahiko Sato et al., “DNA Data Compression in the Post Genome Era,” Genome Informatics 12 (2001): 512– 14, http://www. jsbi. org/ journal/ GIW01/ GIW01P130. pdf。
因此我们可以将基因组压缩至约8000万字节,却不损失信息(这意味着我们完全可以重建8亿字节未压缩的基因组)。
现在考虑一下,98%以上的基因组并不编码蛋白质。即便经过标准数据压缩(消除冗余,还可以查字典寻找常见的序列)之后,非编码区的算法信息量还是相当低,这就意味着我们可能编码出一种算法,用更少的字节执行相同的功能。然而,由于我们仍然处在逆向建立基因组这一过程的初期,不能基于功能对等算法得出进一步减少的可靠估算。因此,我正在使用范围为3000万到1亿字节基因组压缩信息。这个范围最高值只根据假定进行了数据压缩,而未经过算法简化。
只有部分信息(尽管是大多数)描述了大脑设计的特征。
⑵另一种推理方式如下。尽管人类基因组包含大约3亿个碱基,但如上所述,只有一小部分编码蛋白质。根据目前的估计,编码蛋白质的基因有26000个。如果我们假设这些基因平均有3000个包含有用数据的碱基,就相当于只有约78万个碱基。DNA中的一个碱基只需要2个字节,也就是转化为约20万个字节(78万个碱基除以4)。在一个基因的蛋白质编码序列中,3个DNA碱基的每一个“字”(密码子)转换成一个氨基酸。因此,可能存在43(64)个密码子编码,每个包含3个DNA碱基。然而,64个中只有20个氨基酸和一个终止密码子(空氨基酸)。 其余的43个编码与21个有效编码同等存在。而6个字节需要编码64种可能的组合,只有约4.4(log221)字节需要编码21种组合,6个字节省下1.6个字节(约27%),为我们带来约1500万个字节。此外,基于重复序列的某种标准压缩在这里是可行的,尽管DNA蛋白质编码部分的压缩可能性比所谓的垃圾DNA要小得多——因为垃圾DNA中有大量的冗余。所以,这可能会使其数目少于1200万字节。不过,现在我们必须为控制基因表达的DNA非编码部分添加信息。虽然这部分DNA构成基因组的很大部分,但它的信息容量级别不高,且充斥着大量的冗余。估计匹配编码蛋白质的DNA约有1200万字节,我们再次估算到约2400万字节。从这个角度来看,3000万至1亿字节的估计相对较高。
8. Dharmendra S. Modha et al., “Cognitive Computing,” Communications of the ACM 54, no. 8 (2011): 62– 71, http:// cacm. acm. org/ magazines/ 2011/ 8/ 114944 - cognitive- computing/ fulltext.
9. Kurzweil, The Singularity Is Near, chapter 9, section titled “The Criticism from Ontology: Can a Computer Be Conscious” (pp. 458– 69).
10. Michael Denton, “Organism and Machine: The Flawed Analogy,” in Are We Spiritual Machines Ray Kurzweil vs. the Critics of Strong AI (Seattle: Discovery Institute, 2002).
11. Hans Moravec, Mind Children (Cambridge, MA: Harvard University Press, 1988).
后记 拥抱“奇点”
“1. “In U. S., Optimism about Future for Youth Reaches All- Time Low,” Gallup Politics, May 2, 2011, http:// www. gallup. com/ poll/ 147350/ optimism- future- youth - reaches- time- low. aspx.
2. James C. Riley, Rising Life Expectancy: A Global History (Cambridge: Cambridge University Press, 2001).
3. J. Bradford DeLong, “Estimating World GDP, One Million B. C.—Present,” May 24, 1998, http:// econ161. berkeley. edu/ TCEH/ 1998_ Draft / World_ GDP/ Estimating _ World_ GDP. html, and http:// futurist. typepad. com/ my_ weblog/ 2007/ 07/ economic -growth. html. See also Peter H. Diamandis and Steven Kotler, Abundance: The Future Is Better Than You Think (New York: Free Press, 2012).
4. Martine Rothblatt, Transgender to Transhman (privately printed, 2011). She explains how a similarly rapid trajectory of acceptance is most likely to occur for “transhumans,” for example, nonbiological but convincingly conscious minds as discussed in chapter 9.
5.以下文字摘自雷·库兹威尔所著《奇点临近》(纽约:维京出版社,2005年)第3章(第133 - 35页),根据物理定律讨论了计算的极限。
电子计算机的极限可谓高不可攀。麻省理工学院教授塞思·劳埃德(Seth Lloyd),在美国加州大学伯克利分校教授汉斯·布雷默曼和纳米技术理论家罗伯特·弗雷塔斯工作的基础上,根据已知的物理定律,对被称为“终极笔记本电脑”的最大计算能力进行了估测,它重为1千克,体积为1升,与小型笔记本电脑的规格差不多。
[Note: Seth Lloyd, “Ultimate Physical Limits to Computation,” Nature 406 (2000): 1047– 54.
[Early work on the limits of computation were done by Hans J. Bremermann in 1962: Hans J. Bremermann, “Optimization Th rough Evolution and Recombination,” in M. C. Yovits, C. T. Jacobi, C. D. Goldstein, eds., Self- Organizing Systems (Washington, D.C.: Spartan Books, 1962), pp. 93–106.
[In 1984 Robert A. Freitas Jr. built on Bremermann’s work in Robert A.Freitas Jr., “Xenopsychology,” Analog 104 (April 1984): 41–53, http:// www . rfreitas. com/ Astro/ Xenopsychology. htm#SentienceQuotient.]
计算潜力随着能量的增多而上升。我们可以按照如下叙述理解能量和计算能力之间的联系。一定物质的能量与每个原子(和亚原子粒子)的能量相关。所以原子数越多,能量越多。如上文所述,每个原子都可用于计算。因此,原子越多,计算能力越强。每个原子或粒子的能量随着其运动频率的升高而升高:运动越剧烈,能量越多。计算潜能也存在着同样的关系:运动频率越高,元件(可以是一个原子)可执行计算越复杂。(我们可以在现在的芯片中看到这一点:芯片频率越高,运算速度越快。)
因此,物体的能量与其计算潜力之间存在一个正比关系。从爱因斯坦的方程E = mc2可以得知,一千克物质潜在的能量非常巨大。光速的平方是一个非常大的数字:约为1017米2/秒2。物质潜能的计算也由一个非常小的数字决定,普朗克常数:6.6×10-34焦耳-秒(焦耳是一个能量单位)。这是我们可以应用的、最小规模的能量计算。总能量(即每个原子或粒子的平均能量与该粒子数量相乘所得的积)除以普朗克常数,我们就得到了一种物质计算能力的理论极限值。
劳埃德演示了一千克物质的潜在计算能力等于pi倍能量除以普朗克常数的计算过程。由于能量数字巨大且普朗克常数极其微小,这个等式得出了一个非常大的数字:约每秒5×1050次。
[注:π×能量最大值(1017千克×米2/秒2)/(6.6×10-34)≈5×1050次/秒。]
如果我们将这个数字联系到人类的大脑容量,得出最保守的估计(1019cps和1010个人),大约相当于5亿兆人类文明。
[注:5×1050次/秒相当于5×1021(5亿兆)人类文明(每人需要达到1029cps)。]
如果我们使用的计算机达到1016cps,我相信它足以能模拟人类智能,终极笔记本电脑将相当于具备5000亿兆人类文明的大脑。
[注:100亿(1010)人,每人按1016cps的速度运算相当与人类文明的1026cps。因此,5×1050cps相当于5×1024(5000亿兆)人类文明。
这样一台笔记本电脑的计算能力让它可以在万分之一纳秒内模拟过去万年来人类所有思想(也就是一亿人类大脑工作万年)。
[注:这个估算是一个比较保守的假设,假设过去万年来,一直都有1亿人,显然情况并非如此。人类的实际数目一直在逐渐增加,到2000年达到约61亿。一年有3×107秒,一万年则有3×1011秒。因此,估计值1026cps代表人类文明,过去万年来的人类思想就相当于3×1037次计算。终极笔记本电脑一秒钟内执行5 × 1050次。因此,模拟过去万年来100亿人的思想需要10-13秒左右,仅为一纳秒的万分之一。]
同样,也有一些告诫。将2.2磅重的笔记本电脑全部转化为能量等于一次热核爆炸。当然,我们不希望笔记本电脑爆炸,而是保持着一升的体积。因此,至少需要一点精心的包装。通过分析这样的装置所含熵(自由程度由所有粒子的状态代表)的最大值,劳埃德表示,这样一台电脑理论内存容量为1031字节。很难想象,技术将一路迎难而上,直到接近这些极限。不过,我们可以轻易预想到,这些技术必将成为现实。俄克拉何马大学的研究项目表明,我们已经证明每个原子(虽然到目前为止只在少量的原子上得到证实)能够存储至少50字节信息。因此,在1千克物质所包含的1025个原子中存储1027字节内存最终必将实现。
但是,因为每个原子有许多性质可以开发用来存储信息——例如精确位置,旋转和所有粒子的量子态,所以我们也许可以使之超过1027字节。神经学家安德斯·桑德伯格估计一个氢原子的潜在存储容量大约为400万字节。但是这些尚未得到证明,所以我们将使用保守估计。
[注:Anders Sandberg, “The Physics of the Information Processing Superobjects: Daily Life Among the Jupiter Brains”,Journal of Evolution and Technology 5(December 22, 1999),http:// www. transhumanist. com/ volume5/ Brains2. pdf.]
如上所述,每秒1042次计算在不产生明显热能的情况下可以实现。通过全面部署可逆计算技术,使用产生低级错误的设计以及允许合理能量损耗,我们应该停留在1042和1050次/秒之间的某个点上。
这两个极限之间区间的设计十分复杂。从1042到1050,检查其间出现的技术问题超出了本章的范围。然而,我们应该记住,使之有效的条件并非从1050这个极限开始,还要基于各种实际考虑向后推理。而且,技术将继续得到提升,并始终利用最新的技艺发展到一个新的水平。因此,等到有一天,我们获得了1042cps(每2.2磅)的文明,那时的科学家和工程师将利用广泛使用的非生物基本智能解决如何达到1043,然后是1044等问题。我期望着我们无限接近极限。
即使处于1042cps,一个2.2磅重的“终极便携电脑”10微秒的计算量也相当于过去万年来所有人类思想(假设十万年来有100亿人类大脑)。
[注:见上文附注。1042cps等于1050cps与10-8之积,所以万分之一纳秒变成了10微秒。]
如果我们研究计算的指数增长(第2章),就会发现到2080年实现这一计算量估计只需花费1000美元。
在有幸加入《如何创造思维》的翻译之前,我就接触过这本书。作为未来主义者以及大名鼎鼎的人工智能专家,雷·库兹韦尔的新作的思想深度和宽度都是一般作品无法比拟的,所以在翻译的过程中,有时会被难住,导致无法继续。所幸,在很多人的帮助和激励下,我磕磕碰碰地完成了本书最终的翻译。
对于本书的赞美之词,我觉得我毋庸多说,每个推荐此书的读者朋友都已经说得很多了。作者有着非常丰富的科学研究、实践经历,并且出版过多部畅销书,而且作为一个预言家,雷·库兹韦尔的视角和洞察力独特而深刻,文笔老道而流畅。
书中介绍了很多雷·库兹韦尔的大胆预言,其中包括人类基因组计划。它是库兹韦尔钟爱的用来解释指数级增长的案例,旨在阐明人类基因组30亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。他预测,未来电脑将在意识上超过人脑。电脑超越人脑是库兹韦尔在摩尔定律的基础上推演出来的。在20多年前,库兹韦尔就预言:人工智能计算机将于1998年战胜人类的国际象棋冠军,他的这一预言后来也被证实的确如此。这些预言只是库兹韦尔的众多预言中的冰山一角,书中也还包含很多其他预言。虽然,他的很多预言乍一听就像是天方夜谭,但是,他的每一个预言背后都有严密的逻辑推理和大量的科学数据作为支撑,这也就是为什么很多人对他的说法将信将疑,但是却无法否定他的推断和预言的原因。不管库兹韦尔的预言是否会成真,今天科技发展的速度已经远远超出了过去我们所能预见到的,所以,我更愿意相信他的预言都会成真。
最后,我要感谢对本书翻译工作提供帮助的朋友:李明、盛杨灿、李果、胡猛、肖琳、张伟、彭蕾。另外,本书涉及知识面极其广泛,其中多以生化物理类知识为主,限于译者水平,错漏在所难免,敬请各位读者朋友予以批评指正。
《大数据时代》
◎ 第9届文津图书奖获奖图书。
◎ 迄今为止全世界最好的一本大数据专著。
◎ “大数据时代的预言家”,国外大数据系统研究的先河之作。
本书购买链接:http://t.cn/RvvmaDf
《大连接》
◎ 六度分隔理论后,社会网络研究领域最具影响力的发现。
◎ 三度影响力,社会网络的强连接原则。
◎ TED大会演讲人,社会网络研究权威专家尼古拉斯·克里斯塔基斯力作。
本书购买链接:http://t.cn/Rvv8j8E
《爆发》
◎ 全球复杂网络研究权威巴拉巴西力作。
◎ 超越《黑天鹅》的惊世之作。
◎ 人类行为93%是可以预测的,揭开人类行为背后隐藏的模式。
本书购买链接:http://t.cn/RvvmXS3
《人人时代》
◎ 互联网革命最伟大的思考者”克莱·舍基 经典作品
◎ 洞察中国社会数字化进程第一人胡泳领衔翻译
◎ 腾讯董事会主席兼首席执行官马化腾重磅推荐。
本书购买链接:http://t.cn/Rvvm7Oz
[1] Tribute to John von Neumann, Bulletin of American Mathematic Society, 64[nr3, part2]:1-49
[2] 见《心智、大脑与计算机:认知科学创历史导论》,哈尼什著,王淼等译,浙江大学出版社,2010年8月,p.203
[3]标准模型是一套描述强力、弱力及电磁力这三种基本力及组成所有物质的基本粒子的理论,该理论被认为是理解宇宙起源和物质构成的最基本原理。如作者所言,该模型中包含了许多参数,如各粒子的质量和相互作用的强度,不能由理论推导计算得出,必须由实验决定,而且这些参数必须要非常精确才能够恰到好处地产生我们观测的原子和观测原子的我们。——译者注
[4] 人择原理指出,我们之所以活在一个各种自然常数调控得如此准确,以至能孕育我们所知的生命的宇宙之中,是因为如果宇宙不是调控得如此准确,人类便不会存在,更遑论观察和谈论宇宙的起源。——译者注
[5] 平行宇宙论,或称多重宇宙论,是指一种尚未证实的物理理论,其中我们所在的宇宙只是若干可能宇宙的一员。——译者注
[6] 库兹韦尔定律(Kurzweil’s Law)是指库兹韦尔发现的“加速循环规则”,即技术的力量正以指数级的速度迅速向外扩充。——编者注
[7] 伯努利定律是由“流体力学之父”丹尼尔·伯努利发现的,是指在一个流体系统中,流速越快,流体产生的压力就越小。——编者注
[8] 曼德布罗特集(Mandelbrot set)是在复平面上组成分形的点的集合。——编者注
[9] 英语表示胖的单词“portly”与波特曼“Portman”相似,故能引发联想。——译者注
[10] 轴突是指动物神经元传导神经冲动离开细胞体的细而长的突起。轴突为神经元的输出通道,作用是将细胞体发出的神经冲动传递给另一个或多个神经元分布在肌肉腺体的效应器。在神经系统中,轴突是主要的信号传递渠道。——编者注
[11] 树突是细胞体的延伸部分产生的分枝。树突是接受从其他神经元传入的信息的入口。树突接受上一个神经的轴突释放的化学物质(递质),使该神经产生电位差形成电流传递信息。每个神经元可以有一或多个树突,可以接受刺激并将兴奋传入细胞体。——编者注
[12] 连续统是一个数学概念,是指连续不断的数集。——编者注
[13] 条件句是一种表示假设的主从复合句,一般由条件从句引出某种假设,再由主句表示基于这种假设下的反馈。——编者注
[14] 表观遗传是指DNA序列不发生变化,但基因表达却发生了可遗传的改变。——编者注
[15]《富足》(Abundance)即将由湛庐文化策划出版。——编者注
[16]① 虫洞是宇宙中可能存在的连接两个不同的时空的狭窄隧道。——编者注