《对苹果设计说不(出版书)》
作者:戴维·波格
内容简介:
《对苹果设计说不》由戴维·波格、《环球科学》杂志社及外研社科学出版工作室共同编写,外语教学与研究出版社于2014年5月出版。该书属于《科学美国人》精选系列专栏作家文集,副标题为“科学达人的技术笔记”,
《科学美国人精选系列·专栏作家文集:对苹果设计说不(科学达人的技术笔记)》一书收录了“技术档案”和“科学评论”两个专栏的内容,书中以广博、深刻的视角,睿智、诙谐的语言,探讨众多日常可及的科学与技术,或者针对对当今世界具有重大影响的科技事件进行评判,引领读者体验现代科学技术的魅力。
目录
序
前言
对机器说话
开放还是封闭?
有人格的电子设备
Siri,你不能再聪明点吗
“人肉”小偷侵犯隐私吗
高清显示屏的尴尬
充满变数的谷歌眼镜
机器识别的迷梦
手机代替记忆?
专心开车,发什么短信
积木式手机是幻想
科技公司,你还信吗
电子阅读器困难重重
密码无须处处有
电脑里的幽默精神
歇了吧,航空安检
有正版,傻子才去看盗版
让空调“上网”
用意识遥控电器
微视频的“微”魔力
把智能设备穿在身上
软件续租伤不起
群英云集 纽约生辉
未来是傻瓜的
科技产品的繁冗之痛
对苹果设计说不
作死的电子产品升级
科技信徒背后
消费电子废品
电子产品败笔何在
“大数据”需要“大理论”
“好莱坞”范儿的制造业
稀有元素决定未来
聪明电极,你敢用吗?
“人肉”时代
有人偷窥又何妨
见证永远
大众点评的威力
网络安全的噩梦
取缔验证码正当时
Wi-Fi惹烦忧
互联网是块单面镜
看不懂的用户条款
利益左右科学
高风险下的新药开发
阻击太空杀手
超级计算机与小制造商
知识是累赘
文化差异 科学动力
移动医疗来了
告别赢家通吃
地球工程保护北极海冰
受到挑战的美国专利制度
超越“上帝粒子”
科学与偏见
被选择性拒绝的科学
传授批判性思维
复活猛犸象是好事
让气候阴谋论远离课堂
美国教育失败?
作者介绍
序
科学文化传播的新起点
李大光
中国科学院大学教授
“《科学美国人》精选系列·专栏作家文集”由外语教学与研究出版社(以下简称外研社)编辑出版。它的出版对中国推广现代科学知识和科学思维方式具有重要意义。对于工作繁忙、学习紧张,没有时间阅读每期《环球科学》(《科学美国人》中文版)的人来说,购买这套书,在业余时间阅读,基本就可以了解这一世界著名科学杂志的精彩内容。
《科学美国人》是世界上历史最悠久、最著名的大众科学刊物之一。该刊物于1845年由画家、企业家和出版商鲁弗斯·波特(Rufus M. Porter,1792~1884)创办。在过去将近170年的时间里,《科学美国人》由1845年的发布美国专利局(现为美国专利商标局)新闻的4页周报,发展成内容广泛的关于科学知识和科学文化的著名刊物,销量占据全球大众科学杂志的半壁江山。
任何作品和出版物都与其产生的历史背景有密切关系。《科学美国人》产生于欧洲工业革命时期,那时也是欧洲工业革命和科学技术发现对美国产生重大影响的时期。欧洲的工业化和科学技术发明不仅仅传播到北美大陆,同时也引发了美国19世纪中叶到20世纪初的科学发明高潮。在美国实用主义哲学思想和美国首部专利法案通过并颁布的影响下,爱迪生等发明家不仅带动了美国科学技术的发展,同时也奠定了美国经济发展的基础,与此同时,还产生了美国的探险文化和对客观事实的好奇文化。在这个背景下,美国文化形成了偏重于科学文化的模式。诞生于此时的《科学美国人》具有鲜明的科学与工业色彩,饱含无穷的探索和想象空间,同时还有对科学价值和科学文化的深刻反思。该刊的理念和内容吸引了众多科学家和技术发明家,很多知名科学家,包括爱因斯坦等,都曾给该刊投稿。除科学家之外,还有很多科学哲学家和科学人文学者在此发表关于科学与宗教、科学与伦理以及科学与社会之间关系的思考文章。
《科学美国人》进入中国已经有几十年了。虽然其中文版《环球科学》是按月出版的,但由于其中的内容非常前沿,即便时隔数月甚至数年之后来看,不少文章仍然可以带给我们不一样的启迪,让我们看到科学发展的历程。因此,精选这个著名杂志中适合中国人文化欣赏习惯和兴趣的文章,单独出一套精选系列,就具有了特殊的意义和价值。
“精选”自然有精选的方式和眼光。本系列精选的范围不仅仅是原版的《科学美国人》中的专栏文章,还包括中国科学家在《环球科学》上撰写的精彩文章。经过专业编辑们的谨慎遴选,这套丛书可谓是精品中的精品了。
本系列分为四册,分别是:
1.《大象如何站在铅笔上》——超乎想象的科学解读;
2.《外星人长得像人吗》——怀疑论对科学的揭秘;
3.《哀伤是一种精神病》——走出健康误区;
4.《对苹果设计说不》——科学达人的技术笔记。
其中,关于外星人的传说的文章对中国人的思维方式具有启发意义。作者迈克尔·舍默(Michael Shermer)是科学史博士,在关于伪科学的论述方面是比较著名的学者。他关于伪科学的定义和科学的定义在美国国家科学基金会(National Science Foundation)每两年发布一次的《科学与工程学指标》(Science and Engineering Indicators)中被多次引用,并成为科学方法定义的理论基础。他创办的《怀疑论者》(Skeptic)在科学文化领域具有重要影响。同时,他还成立了“怀疑论者协会”(The Skeptics Society),经常组织科学文化的研讨会。2002年,舍默的书《人为什么相信怪异的东西:伪科学、迷信与我们这个时代的迷惘》(Why People Believe Weird Things: Pseudoscience, Superstition, and Other Confusions of Our Time)在中国出版,获得好评。他的书对于识别各种所谓的“大师”和伪科学现象、培养国人的批判性思维具有重要意义。
除了科学的思维以外,在科学知识的表达方式上,中外也有很大区别。西方科学知识体系以美国为代表,其表述的基本特征是:
1.全球视野,关注的是世界范围内的重大事件以及产生的影响;
2.对科学技术知识的表述一般从使用者最有可能产生错误认识或者体验的角度展开讲解;
3.描述的角度极其新鲜,往往是读者难以想象的,因而起到的启发效果奇好;
4.视野超前,即往往针对某个科学领域最先进的研究成果进行讲解。而且跟踪的多数是最好的研究机构或者科学家的研究成果,甚至是诺贝尔奖获得者的研究成果。这也是在过去的将近170年间,有100多位诺贝尔奖得主为其撰稿和该刊物持续畅销的原因之一。
《科学美国人》不仅仅是科学家和技术人员关注世界科学技术前沿动态的重要刊物,也是科学记者或科学作家了解美国和欧洲科学的优秀读物。由外研社出版的“《科学美国人》精选系列”集合了该杂志里最好的作品,通过精选、编辑、再创作呈现给读者。该系列既是大众科学文化创作领域的教科书,也是供中国科学家和技术人员在撰写大众科普文章时参考的极具价值的优秀作品。
外研社是中国引进外国先进文化的重镇,也是中外文化交流的研究机构。外研社将科学文化作品作为出版重点,说明中国文化正在向先进的前沿领域挺进,也说明世界正在向科学技术文化领域迈进。在科学文化领域中,中国应该认真学习西方的先进经验,逐步形成用理性思维方式看待身边世界和各种现象的潮流,这是民族文化得以进步的力量源泉之一。一个民族在世界上的地位不仅仅靠经济指数,也不仅仅靠军事力量,只有同时具备科学文明的民族才会赢得世界的尊重。从这个角度讲,我希望这套书能成为外研社在科学文化传播中的新起点。
前言
科学奇迹的见证者
陈宗周
《环球科学》杂志社社长
1845年8月28日,一张名为《科学美国人》的科普小报在美国纽约诞生了。创刊之时,创办者鲁弗斯·波特(Rufus M. Porter)就曾豪迈地放言:当其他时政报和大众报被人遗忘时,我们的刊物仍将保持它的优点与价值。
他说对了,当同时或之后创办的大多数美国报刊都消失得无影无踪时,近170岁的《科学美国人》依然青春常驻、风采迷人。
如今,《科学美国人》早已由最初的科普小报变成了印刷精美、内容丰富的月刊,成为全球科普杂志的标杆。到目前为止,它的作者,包括了爱因斯坦、玻尔等151位诺贝尔奖得主——他们中的大多数是在成为《科学美国人》的作者之后,再摘取了那顶桂冠的。它的无数读者,从爱迪生到比尔·盖茨,都在《科学美国人》这里获得知识与灵感。
从创刊到今天的一个多世纪里,《科学美国人》一直是世界前沿科学的记录者,是一个个科学奇迹的见证者。1877年,爱迪生发明了留声机,当他带着那个人类历史上从未有过的机器怪物在纽约宣传时,他的第一站便选择了《科学美国人》编辑部。爱迪生径直走进编辑部,把机器放在一张办公桌上,然后留声机开始说话了:“编辑先生们,你们伏案工作很辛苦,爱迪生先生托我向你们问好!”正在工作的编辑们惊讶得目瞪口呆,手中的笔停在空中,久久不能落下。这一幕,被《科学美国人》记录下来。1877年12月,《科学美国人》刊文,详细介绍了爱迪生的这一伟大发明,留声机从此载入史册。
留声机,不过是《科学美国人》见证的无数科学奇迹和科学发现中的一个例子。
可以简要看看《科学美国人》报道的历史:达尔文发表《物种起源》,《科学美国人》马上跟进,进行了深度报道;莱特兄弟在《科学美国人》编辑的激励下,揭示了他们飞行器的细节,刊物还发表评论并给莱特兄弟颁发银质奖杯,作为对他们飞行距离不断进步的奖励;当“太空时代”开启,《科学美国人》立即浓墨重彩地报道,把人类太空探索的新成果、新思维传播给大众。
今天,科学技术的发展更加迅猛,《科学美国人》的报道因此更加精彩纷呈。新能源汽车、私人航天飞行、光伏发电、干细胞医疗、DNA计算机、家用机器人、“上帝粒子”、量子通信……《科学美国人》始终把读者带领到科学最前沿,一起见证科学奇迹。
《科学美国人》也将追求科学严谨与科学通俗相结合的传统保持至今并与时俱进。于是,在今天的互联网时代,《科学美国人》及其网站当之无愧地成为报道世界前沿科学、普及科学知识的最权威科普媒体。
科学是无国界的,《科学美国人》也很快传向了全世界。今天,包括中文版在内,《科学美国人》在全球用15种语言出版国际版本。
《科学美国人》在中国的故事同样传奇。这本科普杂志与中国结缘,是杨振宁先生牵线,并得到了党和国家领导人的热心支持。1972年7月1日,在周恩来总理于人民大会堂新疆厅举行的宴请中,杨先生向周总理提出了建议:中国要加强科普工作,《科学美国人》这样的优秀科普刊物,值得引进和翻译。由于中国当时正处于“文革”时期,杨先生的建议6年后才得到落实。1978年,在“全国科学大会”召开前夕,《科学美国人》杂志中文版开始试刊。1979年,《科学美国人》中文版正式出版。《科学美国人》引入中国,还得到了时任副总理的邓小平以及时任国家科委主任的方毅(后担任副总理)的支持。一本科普刊物在中国受到如此高度的关注,体现了国家对科普工作的重视,同时,也反映出刊物本身的科学魅力。
如今,《科学美国人》在中国的传奇故事仍在续写。作为《科学美国人》在中国的版权合作方,《环球科学》杂志在新时期下,充分利用互联网时代全新的通信、翻译与编辑手段,让《科学美国人》的中文内容更贴近今天读者的需求,更广泛地接触到普通大众,迅速成为了中国影响力最大的科普期刊之一。
《科学美国人》的特色与风格十分鲜明。它刊出的文章,大多由工作在科学最前沿的科学家撰写,他们在写作过程中会与具有科学敏感性和科普传播经验的科学编辑进行反复讨论。科学家与科学编辑之间充分交流,有时还有科学作家与科学记者加入写作团队,这样的科普创作过程,保证了文章能够真实、准确地报道科学前沿,同时也让读者大众阅读时兴趣盎然,激发起他们对科学的关注与热爱。这种追求科学前沿性、严谨性与科学通俗性、普及性相结合的办刊特色,使《科学美国人》在科学家和大众中都赢得了巨大声誉。
《科学美国人》的风格也很引人注目。以英文版语言风格为例,所刊文章语言规范、严谨,但又生动、活泼,甚至不乏幽默,并且反映了当代英语的发展与变化。由于《科学美国人》反映了最新的科学知识,又反映了规范、新鲜的英语,因而它的内容常常被美国针对外国留学生的英语水平考试选作试题,近年有时也出现在中国全国性的英语考试试题中。
《环球科学》创刊后,很注意保持《科学美国人》的特色与风格,并根据中国读者的需求有所创新,同样受到了广泛欢迎,有些内容还被选入国家考试的试题。
为了让更多中国读者了解世界科学的最新进展与成就、开阔科学视野、提升科学素养与创新能力,《环球科学》杂志社和外语教学与研究出版社展开合作,编辑出版能反映科学前沿动态和最新科学思维、科学方法与科学理念的“《科学美国人》精选系列”丛书,包括“科学最前沿”(已上市)、“专栏作家文集”、“诺奖得主文集”、“经典回眸”和“科学问答”等子系列。
丛书内容精选自近几年《环球科学》刊载的文章,按主题划分,结集出版。这些主题汇总起来,构成了今天世界科学的全貌。
丛书的特色与风格也正如《环球科学》和《科学美国人》一样,中国读者不仅能从中了解科学前沿和最新的科学理念,还能受到科学大师的思想启迪与精神感染,并了解世界最顶尖的科学记者与撰稿人如何报道科学进展与事件。
在我们努力建设创新型国家的今天,编辑出版“《科学美国人》精选系列”丛书,无疑具有很重要的意义。展望未来,我们希望,在《环球科学》以及这些丛书的读者中,能出现像爱因斯坦那样的科学家、爱迪生那样的发明家、比尔·盖茨那样的科技企业家。我们相信,我们的读者会创造出无数的科学奇迹。
未来中国,一切皆有可能。
对机器说话
语音识别程序已经越来越靠谱。
撰文 戴维·波格(David Pogue)
在过去几年里,语音识别软件已悄悄地成长起来,并延伸到我们生活中的每个角落:它安装在客服热线和机票预订系统的人机交互端口设备中;扎根于微软视窗(Microsoft Windows)操作系统之中;它是苹果(iPhone)和安卓(Android)之类触摸屏手机的一种替代文本输入的方法。但是我们还得面对这样的现实:大多数使用这种软件的用户都宁肯自己不用它。
这是因为语音识别通常只是B计划:它是替代打字或人类实际交谈的最糟糕方法。一些公司之所以将它用在电话系统中,是因为它的成本低于雇用真人。许多向电脑输入指令的人之所以使用语音识别软件,是因为他们必须这样做。语音识别之所以在触摸屏手机上崭露头角,则是因为在屏幕键盘上打字又慢又麻烦。
那么怎样才能让语音识别更上一层楼,而不仅仅是一种变通方法(B计划)呢?我们离《星际迷航》(Star Trek)中从不出错的会话计算机还有多远?
好啦,现在我们正在接近这一目标。经过十年的收购、兼并和挪用公款丑闻之后,主要的语音识别公司现在只剩一家:Nuance通信公司。该公司仅销售唯一一款商用语音识别软件,供Windows、Macintosh和iPhone使用。该软件也为奥迪、宝马、福特、奔驰汽车,还有摩托罗拉、诺基亚、三星、Verizon公司和T-Mobile公司的移动手机提供语音控制系统。用它能玩转声控玩具、GPS(全球定位系统)单元和自动取款机,并可接听美国电话电报公司、美国银行、美国药品零售商CVS和许多其他银行的电话。
Nuance通信公司每年都会推出一个新的用户语音识别程序版本,例如它推出的Dragon Naturally Speaking。通常情况下该公司不会为新版本添加很多新功能。相反,它将大部分资源集中于一个目标:提高精确度。
最初,你必须对着话筒阅读45分钟的脚本来训练这些程序,让程序能识别你的声音。多年来随着技术的改善,训练时间不断减少,逐步降到20分钟、10分钟、5分钟——而现在你已经完全不用对该软件进行训练。一旦发出指令,便能得到(由笔者测试)99.9%的精确度。按照这种精确度,每读两页文字还是会错一个单词,但这已经让人印象深刻了。
语音工程师使用各种方法来提升精确度。最早的语音识别程序要求你说话时在两个单词之间要暂停一下,那种软件根本无法区分“their”与“there”和“they're”。但假以时日,更强大的PC处理器将会使连续语音分析成为可能。现在的语音识别软件已能开始鼓励你用较长的句子说话,这样,软件就会有更多上下文用来进行分析,以提高精确度。
提高语音识别精确度还有另一种技巧:2010年Nuance公司为iPhone提供了一款免费语音识别应用程序,名为Dragon Dictation。你说的话会被传送到该公司的服务器上,在那里进行分析之后,几秒钟之内就会转换成文本并返回到你的手机屏幕上。
不过,没人知道该公司已储存了所有这些语音样本,有数百万份,这样一来便创建出一个包括有不同声音、年龄、语调和口音的巨大数据库,根据它们可对不同的语音识别算法进行测试。
是的,该技术正在不断改善。但读者经常问我:“既然语音识别软件这么好,那么我能用它来做电话和访谈记录吗?”答案仍然是否定的。除非你对着话筒说话,无背景噪音,最好不带口音,否则这个软件的效果也没有这么好。你依然必须读出所有的标点符号,最后还要加上“句号”。天知道,我们人类相互理解都会如此困难,要求一台电脑完美地完成这一任务,确实有点过分。难怪今天的语音识别应用程序仍然会犯错误,比如将“mode import”误听为“modem port”,将“move eclipse”误听为“movie clips”——够了,你应该完全清楚了。
因此,在我们的有生之年,键盘肯定不会消失。《星际迷航》中的计算机会话方式仍然是数十年之后的事情。当然,99.9%的精确度对我们来说已经非常好了——但是除非达到100%精确度,否则语音识别技术仍将属于B计划。(翻译 詹浩)
开放还是封闭?
谷歌的Android并未证明开放就是好的。
撰文 戴维·波格(David Pogue)
在美国,有这么个老生常谈:苹果公司曾经失去过一次在计算机行业称霸的机会。它本可以成为个人电脑领域的巨无霸,但是因为系统太封闭而没能成功。这里的“封闭”有两层意思:一层在字面上——早先的Macintosh电脑机箱完全封死,里面的零件不能乱拆乱动;另一层则是比喻——苹果在授权方面也很封闭,具体来说,只有苹果生产的电脑才能运行苹果操作系统。微软就不同了,它向所有老牌电脑公司颁发了运行Windows的许可,今天,世界上90%的个人电脑都在运行Windows操作系统。
没过几年,又一场“实验”开始了——主题是音乐播放器。苹果和微软都照着和上次完全相同的剧本演出。竞争的一方是史蒂夫·乔布斯(Steve Jobs),他坚持iPod以及配套的软件都要由苹果公司一手包揽;另一方是微软,它把自己的播放器软件平台Plays for Sure提供给任何付了许可费的公司。
但这一次,结果颠倒过来了。苹果模式大获全胜,iPod一举鲸吞了85%的播放器市场。微软呢?直接把Plays for Sure拉出去砍了。(微软后来又开发了一套全新的音乐播放系统,名叫“Zune”,出人意料地模仿起苹果的封闭式架构,但也以失败告终。)
好了,我们已经有了几项对照研究,得出了互相矛盾的结果。那么,究竟哪种模式才正确呢?授权还是专有?
眼下,我们正陷入另一场激烈的市场争夺战,这是对两种模式的又一次检验,获胜者将在市场上占据主导。这就是规模空前的智能手机之战,交战双方是苹果(iPhone,专有式)与谷歌(Android,开放式)。
和以前一样,苹果自己开发硬件,并独享自己的操作系统。谷歌则继承了微软“我们的软件随便用”的信条,并且比微软更进了一步:它的Android操作系统不仅公开,而且免费;任何公司都能开发使用Android智能手机(或者平板电脑、电子阅读器等等)而无须向谷歌支付任何费用,甚至可以对Android进行改动。
实验进行到现在,一直十分顺利。全世界的手机制造商正在大量生产Android手机,至今已造出3,000多万部。而苹果售出的iPhone达到了7,500多万部,但它比谷歌早入行一年。
这样看来,Android取得了巨大的成功。但话说回来,如果把这场战争看成实验,那么它的设计非常差劲。我们要问的是:Android的魅力到底有多少来自于它的开放性?
实际上,我们大可以认为“开放”让用户非常痛苦,因为开放之后,AT&T和Verizon等运营商就会在你的新手机里塞满乱七八糟的图标,这些图标指向它们那些又差又贵的附加服务。(苹果就绝对不会允许第三方在iPhone中预装任何垃圾软件。)
更糟的是,“开放”就意味着不止有一个Android。一个操作系统变成了由各种小幅改进版本组成的分裂平台。如果你用过Android手机,一定会有切身体会:Adobe推出了Android插件,终于能在手机上播放Flash动画了。你为此兴奋不已。但仔细一研究,这款插件只能在少数几个Android版本上使用。
谷歌的应用商店也比苹果的开放。苹果挨个审查应用软件,这种做法早已恶名远扬。别的不说,Android手机上能运行色情软件,iPhone上就不行。但审查也意味着苹果的商店更有条理、质量更高;相比之下,谷歌的Android软件市场则是一片混乱。
这么说可能显得偏激。但所谓“开放”,会不会使人眼花缭乱、无所适从呢?
从手机制造商的角度看,Android真是因为开放性才显得诱人的吗?还是因为它完整、精致、优美、自带软件库,重点是不用手机制造商付一分钱?
对用户来说,开不开放真有那么重要吗?用户是“想要一部摩托罗拉的Droid手机,因为它轻薄、流畅,还能加入Verizon网络”,还是“想要一部Droid手机,因为它的Android界面更漂亮一点”?显然是前者。
也许,全世界需要最后再做一次规模庞大的科学实验:一边是封闭、专有的模式(苹果),一边是封闭、免费的模式(谷歌)。你瞧,我们得把“免费”和“可修改”这两个变量分开,才能找出Android气势如虹的确切原因。
好吧,我也知道这个实验不可能做得出来,但要弄清楚“开放”的真实价值,这是唯一的办法。(翻译 红猪)
有人格的电子设备
我们想要我们的电子设备人格化到何等程度?
撰文 戴维·波格(David Pogue)
iPhone 4S最具话题性的新特色,就是语音助理Siri。你可以向“她”下达五花八门的语音指令,无需辅导,也用不到什么特别的句法,她会很奇妙地遵从你的指令行事。
你可以对她说“给我的助理打个电话”“八点叫我起床”“约一下伍德沃德博士,本周五,下午两点”;也可以说“从这里去机场要怎么走?”或是“播放泰勒·斯威夫特(Taylor Swift)的歌曲”“在我进办公室后,提醒我把史密瑟斯的行业报告归档”;还可以问她“一升相当于多少液量盎司?”“这里距离火星有多远?”,或者“乔治·华盛顿(George Washington)是哪天出生的?”
针对每项指令,Siri会与苹果公司的服务器进行短暂的连接,然后用一种平静的女性嗓音回复,同时在屏幕上显示你所要查询的信息。
不过,网上很快就冒出了一帮自作聪明的家伙,开始问她一些难以给出确切回答的问题,接着便为她那诙谐乃至犀利的答复惊叹连连。
你:“Siri,我爱你。”Siri:“你真会说话,戴维。现在我们可以继续办公了吧?”
你:“生命的意义何在?”Siri:“我现在也答不上来,不过给我些时间,让我写一部剧情空洞的超长剧给你。”
你:“把舱门打开,Siri。”Siri:“很抱歉,戴维,恐怕我不能那么做。(停顿)满意了吗?”(译者注:这段问答至停顿为止,典出《2001:太空漫游》(2001: A Space Odyssey)中波曼船长与超级计算机HAL9000的对白片段。)
Siri确实是语音控制领域的一大突破,此外亦是计算机人格化的一大突破。问题在于,我们想要我们的电子设备人格化吗?程序员和设计师们一直在为这个问题满腹纠结。每一款操作系统的创建人员,都得设计一套标准句法用于人机沟通。数十年来,各家开发厂商总在不同的理念之间犹豫不决,换来换去。
Siri尚未登场之前,苹果公司的软件向来回避“我”和“你”这类的人称代词。结果便是一些拗口的被动语态大串联,譬如“文档没有被找到,无法被打开”。
微软在对话框内所用的英文,不仅爱用被动语态,还总以程序员为假想对象,而非大众,如“SL_E_CHREF_BINDING_OUT_OF_TOLERANCE:激活服务器确定特定的产品密钥已超过其激活次数。”哦,当然当然!
美国花旗银行的自动提款机则与礼仪女王艾米丽·波斯特(Emily Post)的精神背道而驰。它们将“我”和“您”的交谈体验发挥到了极致。提款机的欢迎画面上会显示:“您好。我能为您提供什么服务?”当你退出后,则会看到:“谢谢,为您服务永远是我们的荣幸。”这些机器甚至有心为你的愚蠢过失担责:“对不起,此密码我无法识别。”
如今,我们内心深处——其实也没多深——都清楚,这些电脑并不是真的在与我们交流;它们所呈现出的表达方式,全部由某处的某名程序员编写而成。那么,这些软件公司为什么要费这个心?倘若人人都知道这只是种花招,那么我们还有必要在意机器能展现出多少人格魅力吗?
有必要。
设计师的用意,显然在于模仿人类的日常对话,好让自己设计出的机器更加友好。不过这种理念是有副作用的:若要编写出像真人一样谈吐的机器程序,程序员就必须像真人一样思考。
以花旗银行为例,撰写那种采用第二人称的对话语句,需要工程师迫使自己代入真人的思维模式。此外,若缺乏在逻辑、术语、表述清晰上的考量,也无法为自动提款机撰写出合格的第一人称表述。处于这种思维框架内的人,永远写不出“激活服务器确定特定的产品密钥已超过其激活次数”这样的句子。
与此同时,Siri在“人格”上的优越性则在于:她才不管你说的是“会下雨吗?”“我需要带把伞吗?”还是“天气预报怎么说?”她的控制程序要求她理解任意形式的措辞。此时所要达成的效果已经超出了“友好”的范畴,升级为“快感”。当你第一次不用阅读任何说明书,不用遵循任何守则,就能让Siri按你的指令行事时,你会为自己的无师自通感到莫大的骄傲。
的确,能像真人一样交谈的机器乃是彻头彻尾的障眼法,对此我们全都心知肚明。不过人的心理是很奇妙的——就好像我们在观看精彩的魔术表演时,明明知道一切都是戏法,却依然会被取悦一样。(翻译 薄锦)
Siri,你不能再聪明点吗
语音识别软件是个好软件,只要别把它用在手机上。
撰文 戴维·波格(David Pogue)
苹果公司在2012年推出的iPhone 4S,看上去跟前一款相差无几。新款配置了像素更高的摄像头和速度更快的处理器,却只增添了一项新功能:Siri。
相信大家如今都很熟悉Siri,这是一款可以执行语音指令的辅助类软件。使用者无须接受任何培训,只要按下Home键,像平常一样讲话即可。
Siri在社会文化领域引发了一股热潮。YouTube恶搞视频、各种使用攻略、功能雷同的Android版应用接踵而至。还有专家提出了在公共场合使用手机的新礼仪——如今的手机用户就连通话以外的时间都在对着手机讲话。语音识别功能一时成了时代的宠儿;突然之间,电视机厂商也争相涌入,当然更少不了其他手机厂商的跟进。语音功能被炒得沸沸扬扬,似乎我们与电子产品的互动方式已就此彻底改变。
接着又掀起了一轮大力贬斥的声浪。
电子产品资讯网站Gizmodo,打出了“Siri乃苹果公司背诺之作”的标题。大家发现,有时在你口述完一段文本后,Siri会沉思片刻,然后——就没有然后了。已有多名消费者对苹果发起了集体诉讼,指控苹果涉嫌虚假宣传。苹果方面则表示,Siri还处于公测阶段。
到底是怎么回事?Siri,这位电子界的救世主哟,怎么会成为如此失败的产品?
所有人都忽略了一项事实:“作为虚拟助手的Siri”与“作为语音识别引擎的Siri”须区分看待。就像现实中所显示的,这两种不同性质的功能,迈向成功的轨迹也大相径庭。担当虚拟助手的Siri,其开发商是Siri公司,后被苹果公司收购。(Siri其实是研究机构SRI早年某个军用人工智能开发项目的副产物。这下清楚了吧?)
而听写功能——涉及文本语音转换(text-to-speech)技术——则由美国Nuance软件技术公司提供,该公司旗下产品包括语音识别输入软件Dragon Naturally Speaking等。
在你口述文本时,Siri会生成相应的音频文件,并将其发送到Nuance公司的服务器上;服务器会对这段音频进行分析,再将转换出的文本返回到你的手机上。Siri容易在网络信号不佳或手机网络发生拥堵时表现失常,原因就在于此(使用Wi-Fi上网时,Siri的听写功能就会好用很多)。
需要与远程服务器进行数据交换,正是Siri的听写功能准确率不尽如人意的症结所在。
语音输入的问题还不止于此。不正常的背景杂音、起风、口部与话筒之间的距离不定,均会增加手机完成文本语音转换的难度——准确率也远不如PC版的语音输入软件,后者就完全没有这方面的问题。使用Siri(还有恐怕更经不起考验的Android版语音输入应用)听写出来的文本,平均每段都会出现两到三处错误。
PC版语音输入软件的表现则好很多——准确率接近100%,因为它没有这些困扰。经过你的训练,PC版的语音输入软件可以做到只识别一种声音:你的嗓音。而手机版没有训练功能。声音识别训练所涉及的运算量是远非手机所能负荷的。
这些贬斥的声音并非欲加之罪。我们已经习惯了那些每一次都能正常使用的消费电子技术:电子邮件、全球定位系统、数码相机。依赖于手机上网质量的语音输入技术,性能却时好时坏。这种状况出现在当今时代,难免会令用户感到难以接受。
但我们也别对Siri全盘否定。Siri的“虚拟助手”功能——所有那些设定闹钟、拨打电话、发送短信、安排行程之类的指令——性能就很稳定。哪怕你所用的全是些最基本的指令,像是“X点叫我起床”“拨打XXX的电话”“发条短信给XXX”“提醒我……”等,也能帮你节省时间、避免错漏。
自由形式的手机语音输入是一项尚未成熟的技术。不过,它在电子产品控制界面领域的应用,让我们看到了语音输入软件的光明未来,一如Siri在之前所承诺的那样。不妨等到Siri公测结束后再来评说。(翻译 薄锦)
“人肉”小偷侵犯隐私吗
有个家伙偷了我的iPhone。我对他进行了追踪,然后把他的地址发到了网上。这是否侵犯了他的隐私权呢?
撰文 戴维·波格(David Pogue)
2012年夏天,当我登上美国国家铁路客运公司的列车时,根本不知道等着我的会是一段怎样的旅程。
当我在老家康涅狄格州站下车后,发现我的iPhone不见了。但我当时仍存着几分希望。苹果的免费服务Find My iPhone(寻找我的iPhone)可通过GPS、Wi-Fi和手机信息,对丢失的苹果产品进行地理定位。没过几天,Find My iPhone就发来一封电子邮件,通知我手机已经找到了——地图显示,它就在马里兰州锡特普莱森特市(Seat Pleasant, Md)的一个房屋里。
哦,太妙了。我要怎么拿回一部远在5个州以外的手机啊?于是我头脑一热,就去推特(Twitter)上发了条推文,说了我手机丢失的事。“Find My iPhone显示,它就在马里兰州。有人愿意帮我把它找出来吗?探险开始!”我还附上了一张地图,那枚绿色的定位标记就钉在一个房屋的卫星图片上,一个外形平凡无奇的房屋。
不到一个小时的时间里,帮我寻找手机的消息便传遍了各大博客及推特,甚至登上了国家级的报纸和电视。“波格的手机在哪里”变成了一场高科技的寻宝游戏。
利用Find My iPhone所提供的地址,当地警方也介入了此次案件。那个房屋的屋主招认了自己偷窃手机的罪行——当然,他对于警察如何获知他的具体方位,感到困惑不已。然后又过了一天,我便拿回了自己的手机。(我决定放弃提起诉讼。)对我来说,这件事就是这么回事。现代科技+警方表现良好的传统动作=圆满结局,不是吗?然而对于有些人来说,并不是这样。有很多人都为此次事件感到困扰。他们将我发布窃贼地址的行为,视为对其个人隐私的野蛮侵害。
“这个国家还有没有底线可言啊?”有位读者写道,“波格先生……不仅……将临时的‘代理权’委托给了大众,(为他们)提供了设备所在地的详细地图,还把警察也叫了过去。那里可是他人的私人住宅。这把隐私原则置于何地?”当时我的第一反应是:“等等——我们这是在对小偷表示同情吗?”敢偷别人的东西,不就要冒着放弃部分权利的风险吗?我在推特上发布的内容,跟警察局里印有嫌犯照片的通缉海报有什么区别吗?
当然,具体到这一次的案件,区别就在于:贴出地图、发起追捕行动的一方是我个人,而非执法机关。这会不会构成对小偷个人权利的侵害?会不会导致美国从此沦为一个网民化身联防队员的世界?
这个问题不太容易回答。法律并没有对手机方位信息的获知权做出全面且明确的界定,就连政府或执法机关都是如此。有时候,警方需要申请相关的许可文件,才能要求手机运营商提供这类信息,有些时候就不用。而就我这次事件而言,美国印第安纳大学伯明顿分校的隐私研究员克里斯托弗·索格安(Christopher Soghoian)表示,在这方面我们甚至没有多少法律可以遵循。美国国会在2011年提交了一项法案,简称GPS法案(Geolocational Privacy and Surveillance Act,即《地理位置隐私与监督法案》),这项法案肯定会反对这类“查找手机”的服务,认为失窃手机的机主利用地理定位信息协助案件调查是“非法”的。