饭饭TXT > 学习管理 > 《那些最重要的科学新发现（出版书）》作者：[美]约翰·布罗克曼/译者：陈沛【完结】 > 《那些最重要的科学新发现》作者：[美]约翰·布罗克曼.txt

第 16 页

作者：美-约翰·布罗克曼/译者：陈沛当前章节：15151 字更新时间：2026-6-22 11:34

有些事件属于科学发现，比如灯泡的闪光，而一些发现是由大量研究的累积带来的进展。数字通信与数字计算经历了几十年的发展，最终促使了知识创造与知识共享的革新。这便是不断的知识累积带来的成果。如今，3D打印技术和创客运动只是冰山一角，未来的大趋势是数字化，它不仅包括对由计算机控制的制造机器（已有几十年的历史）的设计描述，还包括通过指定数字材料的组装来实现设计本身的数字化。

生命基于遗传密码，而这种密码决定了20种标准氨基酸的位置，这在几十亿年前就确定好了（这一发现是由分子生物学取得的）。当前，我们正在研究如何将这一知识运用到其他领域；新兴的研究舍弃了持续地沉积与移除材料的流程，取而代之的是对离散的模块的可逆构造进行编码。这一方法不仅是跨学科的，而且跨越程度非常大，从精确操纵原子到活细胞的全基因组合成，再到功能电子设备的三维集成，再到飞机和航天器的模块化机器人组装。总的来说，这就是设计现实，也就是将数据变为物体，或将物体变为数据。

回到2015年的这则新闻：工作往往意味着离开家到不想去的地方做一些不想做的事情，为一些永远看不到的人制造产品，从而获得报酬以购买想要的东西。如果我们可以只制造自己想要的东西呢？与数字计算将信息转换为商品的方式类似，数字化制造将制造成本降低至与原材料的成本差不多的水平。

2015年，各国领导人齐聚联合国，并以联合国的名义发布了可持续发展的目标。这一目标包括：终结贫穷与饥饿、确保人们获得医疗保障和能源、进行基础设施建设，以及减少不平等现象。然而，这其中并没有提到如何实现这些目标。这需要花费大量资金。不过，发展无须复制工业革命，就像发展中国家跳过固定通信直接发展移动通信一样，各国可以通过可持续的本地按需制造替代全球供应链的大规模生产。这虽然是一项巨大的挑战，但有着清晰的研究路线图，这就是新闻背后的科学故事。

147

POINTING IS A PREREQUISITE FOR LANGUAGE

指向手势催生了语言

尼克·恩菲尔德（N. J. Enfield）

悉尼大学语言学教授，马克斯·普朗克研究所语言与认知研究小组研究员；著有《交谈的要素》(74)《语言的自然原因》（Natural Causes of Language）。

发展和比较心理学的相关研究发现，普通的指向手势是人类语言发展与应用的一个关键因素，是人类进行社交的一个重要前提。

指向手势看起来很简单，我们都会时不时地做出这个动作，比如当告诉他人去车站的路时，告诉店员想要买哪一块面包时，告诉他人牙缝里有菠菜叶时。我们在做这个手势时常常还会说出相关的话语，不过对于不会说话的婴儿来说，只需做出指向手势就足够了。

婴儿在9个月大时就能够通过指向手势进行交流了，这比他们学会说话的时间要早一年。实验表明，不会说话的婴儿可以通过指向手势来获得想要的东西、帮助他人，以及与他人分享自己觉得有趣的东西。

指向手势不仅能吸引他人的注意力，还能促使两人暂时关注同一事物。通过指向手势，我们不仅会关注同一事物，而且会共同关注同一事物。这是人类才具有的技能，而且是社会和文化制度实现的前提。若想获得“共享意向”这一通过共享看法、信仰、渴望和目标创建关系的能力，我们必须能够做出指向手势，并且能够理解他人的指向手势。

比较心理学的相关研究发现，成熟形式的指向手势是人类特有的，能够理解指向手势的物种并不多。不过，值得注意的是，家养的狗能够理解指向手势，而我们的近亲大猩猩却不可以。几乎没有证据表明，除了人类之外还有其他物种的成员之间能够通过指向手势进行交流。显然，只有人类才具有基于指向手势的合作和基于社会动机的社会认知基础。

指向手势为了解人类语言的形成指明了新方向。长期以来，认知科学一直关注的是语言的逻辑结构。此外，关于指向手势的新闻为我们提供了一个新角度：从根本上来说，语言来源于人类通过共享意向交流的思维能力。虽然它看似是一种简单的指向行为，但实际上，这是一种我们在学习听说之前就必须掌握的能力。

148

MACRO-CRIMINAL NETWORKS

宏观犯罪网络

爱德华多·萨尔切多-阿尔巴兰（Eduardo Salcedo-Albarán）

哲学家。

如今，计算机强大的计算能力大幅度提升了我们认知和理解世界的能力。我们处理和分析的数据越多，所发现和理解的自然和社会现象也就越多。丰富的社会数据可以揭示全球的发展趋势，比如，通过现有计算工具对大量司法信息的分析，研究人员发现了一种新的复杂社会现象：宏观犯罪网络。

人类智力允许人类拥有的稳定社交网络的人数为150～200人。这就是所谓的“邓巴数”(75)，这一数字表示的是人类能够发生互动的社交网络的大小。因此，如果没有计算能力、算法和对社会复杂度的正确理解，我们将无法认知和分析宏观犯罪网络。

令人感到不幸的是，我们当前的社会缺乏相应的工具、立法和执行机制来应对这些具有全球性、弹性、分散性的犯罪组织，而且这些组织具有不同结构，并由不同类型的人员来领导。宏观犯罪网络能够躲过大多数执法人员的追踪，因为这些执法人员还执迷于寻找由单一老大掌控、全职犯罪分子组成的结构单一的犯罪组织。这种“有组织的犯罪”的传统观念已经过时了，因为它无法反映当前宏观犯罪网络的复杂性。

如果我们现在不运用正确的思路或计算工具来处理和分析海量数据，以调查和起诉犯罪行为，最终结果就如同使用17世纪的望远镜来研究银河系。在面对宏观犯罪网络时，最大的挑战不是高性能计算机或深度学习的运用，而是改变学者、调查人员、起诉者以及法官的观念。注重单个受害者和单个施害者的立法会导致对系统性犯罪的分析出现错误和执法不足，比如，拉丁美洲和西非的腐败、东欧的人口贩卖以及非洲中部的武装政变等犯罪行为。这些全球性的犯罪组织总是得不到重视。

各种各样的犯罪总会成为新闻。从腐败到恐怖主义，再到贩卖人口现象，犯罪行为影响了我们的生活方式，也阻碍了各国的发展。充分了解庞大、弹性、分散的宏观犯罪组织，对于维护全球的安全来说具有关键意义。我们需要投入和分配正确的科学、制度和经济资源来应对这一问题。

149

VIRTUAL REALITY GOES MAINSTREAM

虚拟现实成为主流

托马斯·梅青格尔（Thomas Metzinger）

德国美因茨大学哲学家，开放思维网站（Open-Mind.net）编辑；著有《自我的隧道》（The Ego Tunnel）。

假设你刚刚服下了一颗虚拟环境快感增强药丸，这种药丸不是药效强烈的非法药物，而是VR设备附带的赠品，是直接面向消费者的合法增强药物。这种药物可以防止恶心，将实时的、基于功能磁共振成像的神经反馈循环稳定地导入我们自己的虚拟现实中。这种虚拟现实能让我们直接与自己情感的无意识的成因交互，就如同它们是外部环境的一部分。此外，这种药物能将人格障碍和《楚门的世界》(76)般的幻觉风险降至最低。这种药物还可以有效地防止上瘾，当我们的大脑能长时间地保持稳定后，再次服用药物时，药效也会减弱，至少说明书上是这么说的。当我们打开VR设备时，就会有两名早已定义好的朋友招呼我们，这两位虚拟化身会短暂地显示一下各自的数字形式的标识符，然后迅速地与我们进行眼神交流，同时面带微笑，而我们也会自发地热情回应。这时，药物便开始发挥药效了。令人感到幸运的是，这些虚拟化身既无法看到沉浸式色情的试用版，也无法看到代表我们慈悲自我的昂贵化身。在心理治疗中，我们每周只服用两次这种药物，并且会受到国家安全局的监督。

将来，虚拟现实将会获得突破性的发展，价格达到大众消费者可以接受的水平。此外，相关技术很快便能实现让用户在虚拟现实、增强现实和代替现实之间进行切换的功能，体验虚拟元素和“实际”物理环境的融合，或者全方位的视频反馈，将会使用户在时空上产生幻觉，会以为自己的位置在变动。头戴式显示器Oculus Rift、虚拟现实眼镜Zeiss VR One、索尼旗下的虚拟现实头戴式显示器PlayStation VR、虚拟现实头戴式显示器HTC Vive、三星旗下的虚拟现实佩戴设备和微软公司的混合现实头载式显示器HoloLens等产品仅仅是这个尝试的开始。当不断加速的技术发展不再由科学家，而是由大众市场因素驱动时，我们便很难预测未来20年里技术将会对社会心理产生的影响。这也许会带来巨大的好处（如在临床应用上），也有可能会带来一系列从军事应用到数据保护的新伦理问题，比如，由动作捕捉系统产生的“运动指纹”、电子化身所有权以及个性化都将成为监管机构需要考虑的重要问题。

然而，关于虚拟现实，真正具有新闻价值的可能是：公众将逐渐对“意识体验是什么以及将会变成什么样”产生全新的理解。虚拟现实是可能的世界和自我的代表，其目标是让两者显得真实，最好能让用户产生对“存在”的主观感受。有趣的是，一些关于人类思维和意识体验的具有说服力的理论也以类似的方式描述了这类体验。卡尔·弗里斯顿（Karl Friston）等顶尖理论神经生物学家和雅各布·霍维（Jakob Hohwy）、安迪·克拉克（Andy Clark）等杰出哲学家将这一体验描述为：世界的内部模型的不断创新、表示概率密度函数的现实的虚拟神经表征，以及不断涌现的假设，它们是关于感官输入的潜在原因的，目的是最小化感官输入的预测误差。1995年，芬兰哲学家安蒂·雷翁索（Antti Revonsuo）指出，意识体验是世界的一个虚拟模型，也就是动态的内部模拟，由于它在表象上处于透明状态，因此在常规状态下无法作为一个虚拟模型来体验，我们“透过它”，就像我们与现实进行直接接触一样。因此，我所认为的具有历史意义的新闻是：一个虚拟现实嵌入另一个虚拟现实的程度将会越来越深。这不仅会带来心理方面的问题，还会带来伦理和立法方面的问题。在特定的条件下经过数百万年进化而成的意识思维如今以因果联系和信息化的形式被编入代表可能现实的技术系统中。随着时间的推移，我们不仅会越来越多地在文化和社会层面嵌入意识，而且意识会越来越多地受到特定技术的影响，久而久之，意识将会获得快速、自主的动态以及新的属性。这就产生了一种错综复杂的系统，一种嵌套的信息流，在这个过程中，生物思维与相关技术相互影响，而我们才刚开始了解这一点。

150

THE TWIN TIDES OF CHANGE

变化的两种趋势

蒂莫·汉内（Timo Hannay）

麦克米伦出版公司数字科学分部总经理，科学富营（SciFoo）合伙创始人。

新闻的本质决定了其转瞬即逝的属性。在媒体（无论是大众媒体还是社交媒体）的推动下，新闻很快就会被淹没，就如同海面上的涟漪。不过，那些重要、持久的新闻是由社会变革和技术进步带来的巨大浪潮，它们会持续影响几代人。令人感到幸运的是，与真实的浪潮类似，有些趋势是可以预测的。

当前出现的一个不可阻挡的趋势是，我们与自然界的关系将会处于不断的变化之中，这个争议便是最好的证明：人类对自然界的影响是否如此深刻，以至于出现一个新的地质时期——“人类世”？对于这个问题，无论未来几年能否达成一致，但可以肯定的是，人类世必定存在，因为我们对地球的影响只会越来越大。这其中的部分原因是，技术将会变得越来越强大，而且其更为重要的推动力是人类不断发展的集体精神。

达尔文已经证明，人类是自然界的产物，而非神的旨意。因此，我们不能为所欲为，无所顾忌，成为自然界的祸害。然而，仍然有人像克努特大帝（Canute）(77)一样试图控制海浪。当下发生的任何超乎我们想象的东西，最终都会变成自然而然的事物，难以成为新闻。对于以后的人而言，对动植物（包括人类）进行基因编辑就像今天的选择性繁殖一样自然，全球规模的地球工程将变得与修水坝和建桥梁一样重要，并且无处不在。

未来，人类在自然界中所处的位置就类似于人类和技术的关系。人工智能和仿生学领域的发展已经引起了很多人对这个问题的反思：谁或什么才是主流，这个问题对于人类来说意味着什么？工业革命见证了机器取代人类的体力劳动，而现在机器正在取代脑力劳动。人类将来还需要做什么？即使那些不为工作感到担忧的人，当他们发现自己的新老板是一种算法时，心里可能很不是滋味吧？

然而，自人类发明车轮之后，人类和技术之间始终是愉快而富有成效的共生关系。尽管我们仍然热衷于恐怖类的故事，但我们将继续把创新作为人类福祉的主要源泉。因此，创新会被视为人类自身的自然延伸。实际上，这是一种对人性的促进和增强，而非某种人工制造或来自外星的东西。虚拟现实中的部分生活与透过隐形眼镜看到的一样真实。脑部被植入具有计算机功能的芯片的人将得到与植入心脏起搏器的人一样的对待。乘坐无人驾驶交通工具或飞机不再充满风险，而是变得安全可靠。也许，很快便会有接受过基因增强手术的作者或人工智能在Edge上发表文章。这将会成为重大新闻，但这种新闻不会持续太久。

因此，人类将会受到两个不可阻挡的趋势的冲击：一是科学技术会逐渐变得平淡，二是之前被认为不可能的事情将会成为习以为常的事情。未来会不断涌现出新闻故事，同时，在新闻故事的背后，关于技术和社会变化的趋势将会缓慢而无情地发生，并不断考验和扩展人类的已知知识和界限。对于人类和当今时代来说，这才是真正的新闻。

151

IMAGING DEEP LEARNING

将深度学习成像

安迪·克拉克（Andy Clark）

爱丁堡大学哲学家和认知科学家；著有《了解不确定性》（Surfing Uncertainty）。

世界充斥着越来越多的深层次架构，比如多层人工神经网络（深度学习），它主要用于寻找图像和文本等大数据集的模式。不过，这些深层次架构的功能和盛行掩盖了一个主要问题：知识的不透明性。这些架构虽然学会了如何完成精细的任务，但并没有探究和揭示所运用的知识。

这真是既令人感到失望（理论层面）又危险（实践层面）。深度学习及其所发现的模式已经渗透进我们日常生活的方方面面，从在线搜索、推荐系统、银行贷款申请、医疗保健到约会。那些对人类命运有着重大影响的系统应该尽可能地实现知识的透明化。不过，有一个好消息是，相关新技术已经出现了，它可以揭示由深度学习系统收集和整理的知识。

2015年6月，亚历山大·莫尔德温采夫（Alexander Mordvintsev）和其他作者在网络上发表了一篇短文，标题是《神经网络生成图像：深入神经网络》（Inceptionism: Going Deeper into Neural Networks）。“神经网络生成图像”以一种特殊架构命名的方式很快就会成为所有博客追逐的潮流。这些作者运用了一个训练有素的人工神经网络，它可以决定给定图像的显示内容。他们还设计了一种自动方法，让人工神经网络以某种方式增强输入图像，并将其调整为依据某些特定指标分类的图像。实际上，这种操作涉及反向运行神经网络，因此，相关博客频繁引用“网络梦想”和“反向幻觉”等描述。就拿随机噪声和目标分类来说，当限制人工神经网络重点关注所训练的真实图像的统计属性时，将会得到一个模糊、令人印象深刻的图像，这一图像揭示了人工神经网络认为这类东西（香蕉、海星、降落伞或者其他东西）应该具有的模样。

令人感到惊喜的是，比如，目标“杠铃”让人工神经网络产生了两端具有重量的印象，这是符合要求的。不过真正的杠铃还具有握柄。这说明，人工神经网络还没有完全掌握一件物体的核心部分，即使已经很接近了。最有趣的是，我们可以输入一张真实的图像，选择多层神经网络中的一层，并要求系统增强其检测到的所有内容。这意味着，我们可以通过神经网络生成图像探测每一个处理层中发生的事情，并将其呈现出来。因此，神经网络生成图像是一种可以逐层探究神经网络多层次思维的工具。

由人工神经网络生成的图像大多比较迷幻，比如，反复增强特定网络层会产生具有分形美的图像，就像是对艺术的表达形式和风格的模仿。这是因为重复这一过程会产生反馈循环。实质上，这种反馈便是，在处理图像的过程中，人工神经网络会增强在某些层中看到的图像。因此，如果神经网络在云中看到了鸟的样子，或者在旋涡中看到了脸的样子，就会增强它们，从而带来更多特性。如果将增强的输出图像变为输入图像，然后执行同样的过程，结果便是这些增强让鸟（或者其他内容）的样子更加明显，然后另一轮增强又开始了。这将致使图像的某些元素很快产生重复，最终呈现的结果就类似于我们所熟悉的事物的梦幻版本。

如果你还没有见过这种令人着迷的图像，可以上网在“神经网络生成图像库”中找来看看，甚至可以使用DeepDream提供的代码创造这种图像。神经网络生成图像是人工神经网络自己生成的美和注视的对象。这项技术为创造性探索提供了新的工具，更不用说对我们自身创造性过程本质的建设性提示了。这项技术的意义远不在于为我们提供了一种图像处理模式，它还帮助我们了解那些不透明、多层次系统所处理的内容，也就是，当系统正在处理某一目标时，每一层所依赖的东西。

这是对人工大脑的神经成像。

152

THE NEURAL NET RELOADED

人工神经网络技术重获新生

贾姆希德·巴鲁查（Jamshed Bharucha）

心理学家，库珀联盟学院（Cooper Union）荣誉校长。

人工神经网络技术已经重获新生。在经历了60年的困扰后，人工神经网络技术在短短3年的时间里就进入了几亿人的日常生活。

2015年5月，谷歌公司前CEO桑达尔·皮查伊（Sundar Pichai）宣布，谷歌已经将语音识别的错误率降低至8%，在两年前这一数字还是23%。那么，取得这一进展的关键原因是什么呢？答案是人工神经网络，也叫作“深度学习”。在收购由杰弗里·辛顿（Geoffrey Hinton）和其两个学生创立的公司DNN研究院（DNN Research）仅仅6个月后，谷歌公司就宣布在图像识别方面取得了重大进展。反向传播算法重新引起人们的关注，而且这一次它与大数据相互交织在一起，这一算法突然间变得有市场价值了。

不过，这一新闻并没有登上头条。人工神经网络技术没有获得科学突破，也没有带来新颖的应用，为什么能算作一则重大新闻呢？因为这项技术产生了规模空前的影响，发展速度也令人惊讶。在分辨嘈杂、无限变量方面，视频与音频模式一直是人工智能的神器。人工神经网络一开始的计算能力就已经超过了存在了几十年的算法。在短短几年的时间内，这项技术就从模拟实验室中非常简单的问题演变成智能手机上的应用程序，用于识别真实世界中的语音和图像。

自从20世纪70年代的自组织映射算法和20世纪80年代的反向传播算法这些开创性成果出现之后，关于人工神经网络的理论研究就一直没有取得突破性进展。最近的这个转折点不在于提供了一种新见解，而更重要的是人工神经网络技术快速的处理速度让更大的神经网络、更大的数据集和更多的迭代成为可能。

这是人工神经网络的第二次新生。第一次新生发生在辛顿和扬·勒库恩（Yann LeCun）发现多层人工神经网络能够理解非线性分类之时。在取得这一突破之前，马文·明斯基和西摩·佩珀特（Seymour Papert）于1969年出版了一本名为《感知器》（Perceptrons）的书，其中提出的观点几乎摧毁了这一领域。他们在书中证明，弗兰克·罗森布拉特（Frank Rosenblatt）的感知器无法学会非线性分类。

20世纪50年代，罗森布拉特发明了感知器。这一成果的取得基于两点，一是沃伦·麦卡洛克（Warren McCulloch）和沃尔特·皮茨（Walter Pitts）在20世纪40年代完成的基础研究，该研究展示了人工神经元网络如何处理模式。二是唐纳德·赫布（Donald Hebb）的研究成果。他推测，当所连接的神经元处于活跃状态时，神经元之间的联系会加强。感知器在当时引起的轰动，我们可以从1958年7月13日《纽约时报》上的一篇名为《电子大脑可以自学》（Electronic “Brain” Teaches Itself）的文章中了解一二。《纽约时报》引用了罗森布拉特的说法：感知器会随着经验的增加而变得越来越聪明，美国海军表示，他们将利用这一原理建造第一个可以读写的感知器——思考机器。

就算明斯基和佩珀特的批评不是致命的，也给罗森布拉特个人和人工神经网络研究带来了很大的打击。不过，包括史蒂芬·格罗斯伯格（Stephen Grossberg）在内的少数人仍在暗自坚持研究。20世纪50年代，格罗斯伯格在达特茅斯学院读本科时，就开始研究人工神经网络相关的问题了。到了20世纪70年代，他发明了一种不经人工干预（自组织的）的学习算法。这种算法平衡了所获得类别的稳定性，而且具有学习新知识所必需的可塑性。

辛顿和勒库恩解决了明斯基和佩珀特提出的问题，并将人工神经网络研究从默默无闻中拯救出来。反向传播算法的兴起引起了人们对格罗斯伯格的模型，以及日本学者福岛邦彦和荷兰学者科荷伦（Kohonen）的模型的关注。然而在1988年，史蒂芬·平克和艾伦·普林斯（Alan Prince）做了与20年前明斯基和佩珀特一样的事情，攻击人工神经网络在解释语言获取方面的价值，这种言论带来了毁灭性的打击，人工神经网络研究再次归于沉寂。

2012年，辛顿和他的学生赢得了ImageNet挑战赛，此后，图像识别的性能获得了巨大提升。谷歌公司抓住了这一机会，人工神经网络重获新生。

关于深度学习的反对之声不绝于耳。所有的方法都受益于强大的计算能力，传统的符号方法也不例外。时间会告诉我们哪些方法对于解决哪些问题更有效。无论如何，我们都不能否认从2012年到2015年人工神经网络方面的突破让人工智能研究变得触手可及。

153

DIFFERENTIABLE PROGRAMMING

可微编程

戴维·达尔林普尔（David Dalrymple）

计算机科学家，神经科学家，麻省理工学院媒体实验室研究员。

在过去的几年里，人工智能领域一些历经几十年都没有解决的经典难题被悄无声息地解决了，所采用的方法是一种被人工智能纯粹主义者长期贬斥为“统计”风格的方法。从本质上来说，这种方法是关于从大量数据中统计出概率分布的，而非分析人类用于解决问题的技术，并将其变为可执行的程序。被解决的经典难题包括目标分类、语音识别、描述所生成的图像，以及以著名艺术家的风格合成图像，甚至包括引导机器人执行一些未被设定的任务。

这种独占鳌头的新方法原名叫作“人工神经网络技术”，现在叫作“深度学习”，后者强调的是神经网络研究所取得的实质性发展。通过这种方法获得的成果通常与比较大的数据集和强大的计算系统有关，大型科技公司也因此对这一领域突然兴趣大增。虽然不断增多的投资对深度学习的快速发展起到了关键作用，但大型公司总是将资源投向不同种类的机器学习方法。总的来说，深度学习取得的进展令人难以置信，虽然许多其他技术也有所改进，但幅度要小得多。

那么，是什么让深度学习脱颖而出，以及它为什么能够解决人类一直无法解决的难题，其魔力何在？

第一个关键因素源自人工神经网络相关的早期研究，这是一种不会停止的算法，它会一次又一次地重新进行，被称为“反向传播算法”。这种算法不仅是链式法则（一种简单的微积分技巧）的巧妙应用，更是连续和离散数学的深度整合，这种整合能使潜在解决方法的复杂集合通过向量微积分自动改进。

反向传播算法的关键功能在于，将潜在解决方法的模板组织成有向图，比如，从一张图像到生成的标题，中间有许多节点。通过反向遍历这张图像，算法可以自动计算出一个“梯度向量”，它将有利于搜索出更好的解决方法。只有深入了解深度学习技术，我们才能发现它与传统的人工神经网络技术在结构上的类似之处。反向传播算法对于新旧结构来说都至关重要。不过，采用反向传播算法的传统的人工神经网络技术远远落后于更新后的深度学习技术，即使采用当今的硬件设备和数据集，也是如此。

第二个关键因素在于，人工神经网络的组件可以同时用于多个位置。随着人工神经网络的不断优化，每个组件的副本会被强制保持一致，这一方法被称为“权重同步”（weight-tying）。这就对权重同步的组件提出了额外要求：它们必须学会同时在多个位置发挥作用，而不是局限于某个特定的位置。由于某个词语可能会出现在一段文本的任意位置，以及物体会出现在图像的任意位置，因此，权重同步让人工神经网络学会了一个普适的功能。

在人工神经网络的多个位置放置具有通用功能的组件的方法类似于在程序中编写函数，并在多个地方调用这个函数，后者是计算机科学领域惯用的一种方法——函数式编程。实际上，不仅仅是类似，权重同步组件实际上就是编程中的可重用函数，前者的功能甚至更强。在过去的几年里，许多最成功的架构重用组件的模式与函数式编程中由常见的“高阶函数”生成的组合模式相同。这表明，函数式编程的其他知名的运算符可以为深度学习架构提供有益的思路。

探索被训练成深度学习网络的功能结构最简单有效的方式是，采用一种能在函数式编程中直接运行反向传播算法的新语言。事实证明，函数式编程会被编译成类似于反向传播算法所需的计算图。计算图的独立组件也需要是可微的，但科学家布赖恩·格里芬斯特（Brian Grefenstette）等人发表的一些简单数据结构（堆栈、队列和双端队列）的可微结构表明，实现可微的方法可能只是一种数学技巧。通过研究，这一领域可能会创造出一种新的编程范式——可微编程。使用这种语言编写程序就类似于为优化器（optimizer）画出函数结构，并将细节留给优化器来完成。这种编程语言将根据整个程序的目标采用反向传播算法自动学习相关细节，就如同深度学习中的权重优化，不过函数式编程是对权重同步的最为直观的诠释。

深度学习代表着另一种潮流，是“专家系统”或“大数据”的某种体现。深度学习基于两个不会停止的算法——反向传播算法和权重同步。可微编程虽然是一个新概念，但其自身可能就是不会停止的算法的自然延伸。即使特定的工具、架构和技术短语很快流行起来，又很快过时，但它们的核心概念仍将是人工智能获得成功的关键。

154

DEEP LEARNING, SEMANTICS, AND SOCIETY

深度学习、语义学与社会

史蒂夫·奥莫亨德罗（Steve Omohundro）

计算机科学家，复杂系统研究中心（Center for Complex Systems Research）共同创始人。

深度学习是我们近期取得的最激动人心的技术和科学成果。从技术的层面来说，在语音识别、图像识别、图像描述、情感分析、翻译、药物研发和视频游戏性能等领域，深度学习独占鳌头。这促使大型科技公司大幅度投资该领域，以至于出现了300多家关于深度学习的初创公司，它们总共吸收了超过15亿美元的投资。

从科学的层面来说，深度学习为当下最重要的科学问题“我们如何表示和操作意义”提供了新的角度。许多关于“意义”的理论都建议将短语、声音或图像映射至采用正规操作方式的逻辑演算中。比如，蒙塔古语义学（Montague Semantics）试图将自然语言短语映射到简单类型的λ演算中。

深度学习将输入的词语、声音或图像自然地映射成人工神经网络活动的向量。这些向量会表现为一种奇怪的“意义等式”。比如，在接受了大型语料库的训练后，托马斯·米克洛夫（Tomas Mikolov）设计的程序Word2Vec得出了这样一种奇怪的逻辑关系：国王-男人+女人=王后。Word2Vec的深度学习算法试图从语境中预测出词语（反之亦然）。“国王吃了午饭”“王后吃了午饭”这种语境上的变换等同于“男人吃了午饭”“女人吃了午饭”。通过对大量类似词语的统计，该程序的深度学习算法得出了这样的关系：“国王”到“王后”的向量与“男人”到“女人”的向量相等，以及“王子”到“公主”的向量与“英雄”到“女英雄”的向量相等，当然还有许多其他类似的关系。其他的“意义等式”还包括：巴黎–法国＋意大利＝罗马、奥巴马–美国＋俄罗斯＝普京、建筑学–建筑＋软件＝程序员。通过这种方式，深度学习算法就从训练范例的统计信息中发现了这些重要关系。

深度学习的成功研究可以归功于20世纪50年代被首次提出的分布式语义学。意义、关系和有效的推理都来自对背景数据的统计，亚历克·拉德福德（Alec Radford）、卢克·梅茨（Luke Metz）和苏米斯·勤塔拉（Soumith Chintala）设计的深度学习算法在生成图像时也发现了类似的现象。代表微笑的女性的向量减去没有表情的女性，加上没有表情的男性，便会生成微笑的男性的图像。戴眼镜的男性减去不戴眼镜的男性，加上不戴眼镜的女性，便会生成戴眼镜的女性的图像。

目前，深度学习已被用于数百个重要应用程序之中。一直以来，工业机器人都存在这样一个问题，即如何通过视觉，从一堆杂乱的零部件中找到并捡起想要的零部件。最近，一家工业机器人公司宣布，他们运用深度学习算法进行了8个小时的训练，已经解决了这个难题。一家无人机公司宣布，他们成功研发出了一种能让无人机在复杂的真实环境中自动飞行的深度学习算法。为什么这些进展都出现在当前呢？若想这些深度学习算法能有效地学习，就需要大型的训练库，通常需要数百万个范例，再加上网络的庞大规模，这意味着它们还需要具有强大的计算能力。深度学习之所以产生重大影响，原因在于互联网就是大型训练库的来源，加上带有图形处理器的现代计算机有能力来训练深度学习算法。

未来，深度学习的发展会走向何方？也许，很快所有的应用程序都会采用深度学习技术。最近，有几所大学发布了关于深度学习的作业项目。只需几个月，数百名学生就能通过相关技术解决各种各样的问题，而这些问题在10年前还是主要的研究项目。我们正处于深度学习技术的“寒武纪大爆发时期”。世界各地的研究团队正在尝试不同规模、结构和训练方式的技术，而一些团队则正在研发让深度学习更高效的硬件。

以上这些成果都令人兴奋不已。不过，这也意味着人工智能可能很快就会对人类社会产生重大影响。我们必须努力确保这些系统带给人类的是有益的影响，并创建有助于整合新技术的社会结构。许多在竞赛中获奖的深度学习算法从输入到输出都是“前馈”（feed-forward）的，它们通常会对输入进行分类或评估，但不生成或者创造任何新的东西。最近的大部分深度学习算法都是“周期性”的，可以通过“强化学习”来训练，最终促使算法采取最佳行动以最大化奖励。这种系统能更好地发现令人惊讶或意想不到的实现目标的方法。下一代深度学习算法可能会创建出世界模型，并能进行详细的推理以选择最佳行动。这类深度学习算法的设计必须非常慎重，以防止发生意料之外或人们不愿看到的行为。我们必须审慎选择将要通过深度学习来优化的目标。如果科学和公众意志能引导这些发展走上有益的方向，未来将一片光明！

155

SEEING OUR CYBORG SELVES

半机械人的我们

托马斯·巴斯（Thomas Bass）

纽约州立大学奥尔巴尼分校教授；著有《越南战争与范春安的危险游戏》（The Spy Who Loved Us）。

我们仍然遵循着摩尔定律前进。这意味科技新闻将始终关注的是，计算机变得更小、更智能，执行速度更快，能更好地应用于我们的日常生活中。实际上，后者这种应用是指，将计算机作为人造器官和眼镜植入人体。我们之所以成为半机械人，不仅源于计算机取得的进步，还源于计算机的外部设备取得的进步，后者就是让计算机可以听见、触摸和看见的技术。

基于光学和镜头分辨率方面取得的成果，让计算机的视觉能力越来越强大。在某些方面，人造镜头比人眼的功能更强大，而且前者的价格将会变得越来越便宜，消费者可以随意使用。这些技术就是会出现大量相关新闻的原因，这些新闻涉及自动驾驶汽车、无人机和其他基于集成多个摄像头的技术。

这些技术也是我们生活在盛行自拍和充满监控的时代的原因。世界监控我们就像我们自拍一样容易。我们的隐私会消失在那些精心调整的自拍当中，这些自拍有时还会引起那些生活得没我们好的朋友的嫉妒。我们以前逛街时会四处观望，而现在总是盯着万能的屏幕。与此同时，公共空间安装的监控摄像头会记录下我们的行为，实际上公共空间自身也处于监视之中。

用聚合物制造而成的镜头的成本只需几毛钱，图像分析软件变得越来越智能，几乎无处不在，用于显微镜的高级镜头的成本也不到一美元。《自然·光子学》（Nature Photonics）杂志曾公布了爱丁堡的研究人员取得的一项成果——一种先进的摄像机，它可以通过光子摄像头拍摄那些位于角落和人类视力到不了的地方。这也意味着，自动驾驶汽车的保险费用很快就会比由人驾驶的车辆的保险费更低。

视觉的语言就是生活的语言。我们观看大场景或关注小问题，我们看到了或看不到彼此的观点。我们有许多看的方式，并且每天都在增加。随着计算机的视觉能力变得越来越强大，我们还需要努力理解所看到的内容。

156

THE REJECTION OF SCIENCE ITSELF

反科学

道格拉斯·洛西科夫（Douglas Rushkoff）

传媒理论家，纪录片制片人；著有《向谷歌巴士扔石头》（Throwing Rocks at the Google Bus）。

我最感兴趣的新闻是，反科学的人越来越多了。31%的美国人认为，人类从一开始到现在就没有发生过多大的变化。只有35%的人认同，人类在自然选择过程中发生了进化。这就不难理解为什么有些父母不愿意为孩子接种疫苗，以及选民支持那些注重热情而非事实的候选人。

可以肯定的一点是，科学自身也是导致出现这些现象的原因之一。科学拒绝承认任何“本质先于存在”的可能性，它们还过于频繁地与企业合作，从科学发现中获利，而对影响人类福祉的长期因素很少关注。

然而，在技术蓬勃发展的当下，有这么多人支持反科学的观点，危害尤为严重。我们正在制造各种之前被认为只有神才拥有的新工具。从数字编程、基因编辑到机器人、纳米技术，我们正在创造一些一旦出现就会自我进化的东西，它们会自我适应、复制，就像生命一样。人类已经进化成了最接近神的物种，而大多数人对于人类如何发展到这一步的具体过程还不甚了解。

在人类获得如此强大的能力的同时，仍有许多人对科学事实置若罔闻，转而追捧可被证伪的虚假幻想，这种现象的发生也许不是一种巧合。如果不将这些能力视为科学带来的成果，或者完全忽视其科学背景而加以利用，我担心人类还无法谦逊谨慎、负责任地运用这些能力。

因此，21世纪的科学大新闻：我们是接受还是反对科学。这也许会决定人类的最终命运。

157

RE-THINKING ARTIFICIAL INTELLIGENCE

重新审视人工智能

罗德尼·布鲁克斯（Rodney Brooks）

机器人学家，麻省理工学院荣誉教授；著有《肌肉与机器》（Flesh and Machines）。

过去的一年里涌现出了很多关于人工智能的新闻，其中一些新闻提到了这样的场景：超级智能系统觉醒了，但它们不遵从人类的伦理道德，给人类带来了危害。这样的系统可能会成为人类的灾难。这些新闻引起了各个领域科学家和工程师的高度关注。一些新闻则促使人工智能业内人士开始思考这样的问题：如果由人工智能来做军事战略方面的决策，这是否符合伦理道德。有一些新闻则提到，许多汽车生产商认为自动驾驶汽车很快会投入使用。还有一些新闻提到了哲学家关心的问题：当发生危及人类生命的事件时，自动驾驶汽车应该如何做出抉择。

设置

手机

书架

书页