用户评价靠谱吗
撰文│迈克尔·莫耶(Michael Moyer)
翻译│王栋
用户评价长期以来被看作是最真实、最准确的数据,然而网上评价的可信度引起了新的关注。经过审视,我们发现网上评价系统并不一定靠谱。
亚马逊、猫途鹰和Yelp这样的网站,长期以来都靠顾客评价图书、旅店和餐馆。这种做法的背后,是一种被称为众包的营销哲学。这种哲学认为,来源于各个阶层的大量人群的意见集合,会提供最真实、最精确的评价。然而,仔细审视一下就会发现,这样的公众意见可能既不准确,也不一定真正来自公众。通过这种途径得到的评价,最好的结果是不够精确,最坏的结果则是完全虚假。
用户投票评价制度很容易受到操纵。
根据美国宾夕法尼亚大学沃顿商学院运营与系统管理教授埃里克·克莱蒙斯(Eric K. Clemons)的说法,网上评价系统存在很多与生俱来的偏颇。第一条很明显却往往被人忽略:对一件商品进行评价的,都是那些已经选购了这件商品的人。因此,他们自然倾向于喜欢这件商品。克莱蒙斯举例说:“我刚好喜欢拉里·尼文(Larry Niven)的小说,所以每当他有新小说出版,我就会买一本。其他的书迷也是这样,所以一开始小说的评价都非常高——五星。”如此高的评价足以吸引那些从来不喜欢科幻小说的读者购买此书。如果他们在读过之后发现不喜欢这本书,由此产生的厌恶感会带来大量的一星评价,导致对总评价的过度修正。
以上缺点还暴露出了另一种更有害的偏颇:人们往往不会评价那些他们觉得不好也不坏的产品。他们赞美喜欢的商品,而把不喜欢的贬为垃圾。这样的心理导致对同一产品有许多一星和五星评价。
然而,对这些看似具有两极分化评价的商品进行的一项线下对照调查表明,人们的真实意见分布符合一个钟形曲线——评价集中在三星或四星,二星很少,而一星和五星几乎没有。由用户自行决定是否参与评价的网上评价系统,产生了一个并不真实的评价断层,就像在当代政治中,只有那些最偏激、最吵闹的声音才会引发关注。
这种自行决定是否参与的机制,还以其他方式显示出了它的影响。2009年,在一项针对亚马逊网站内超过两万件商品进行的研究中,葡萄牙马德拉大学的计算机科学家瓦西利斯·科斯塔科斯(Vassilis Kostakos)发现,绝大部分的商品评价都来自于很少一部分用户。这些超级评论员往往都被授予顶级评论员徽章,网站还会对他们进行排名以鼓励他们参与评价。在这样的激励下,每一位超级评论员都发表了数以千计的评价,最终淹没了为数更多的普通用户的意见(在亚马逊网站上发表过评价的用户中,有95%只评价了不到8件商品)。科斯塔科斯评论道:“我们并不是在说,这些人在评价方面做得好不好,我们只是说,他们做得太多了。”看起来,明智的公众意见其实已被少数积极分子垄断。
不过,超级评论员的存在有一个不容置疑的优点:他们很少当“托儿”。与商品直接相关的人(比方说这本书的作者)对评价网站的蓄意操控,才是网上评价系统中最久远和最难解决的问题之一。
一些网站试图用自动过滤软件来删除可疑的评价,这种软件能搜索评价中过度褒扬或贬低的词句,尤其是那些自我介绍很简短的人所发表的评价。但是,这种方法缺乏透明度,会滋生不信任,或者使情况更糟。
让我们看看网站Yelp的案例,该网站就对可疑的评价进行屏蔽。Yelp首席执行官和合伙创立人杰里米·斯托普尔曼(Jeremy Stoppelman)在为Yelp的过滤措施辩护时指出,一些商业公司甚至发布广告,承诺为正面评价给予资金奖励。然而,一些商业公司认为,这种过滤措施背后隐藏着更罪恶的目的。2010年上半年,地方企业家联盟起诉了Yelp,控告该公司实际上在施行一种“数字欺诈”。这项诉讼声称,Yelp的销售代表会打电话给商业公司,提出一个简单的条件:“在我们这儿做广告,我们就让那些负面评价消失。”
Yelp公司极力否认这一指控,并且声明所有的删除都是自动进行的,是一视同仁的。不过,Yelp仍然拒绝透露过滤软件具体如何运行,以免不道德的用户利用这些信息绕开过滤软件。透明度的缺乏,让人感觉Yelp自己或许就在操控用户评价。
但是,评价系统并不是无法改进的。克莱蒙斯提到了RateBeer.com这个网站,它吸引了约3000名会员,每名会员都评价了至少100种啤酒;除了那些最罕见的啤酒,所有牌子和种类的啤酒都有成百上千条评价。如此巨大的数据量实际上杜绝了评价被操控的可能,并且该网站的热心用户们还倾向于评价他们品尝过的所有啤酒,而不是仅仅评价那些他们喜欢或者讨厌的啤酒。
当然,与评价100种啤酒相比,评价同样数量的餐馆和旅店会更难(花费也更多)。除非其他网站能够积累同样数量的有效数据,一句老话或许仍是给消费者的最佳建议:购物时要小心!
给数据中心降温
撰文│拉里·格林迈耶(Larry Greenemeier)
翻译│王栋
对数据中心来说,互联网简直太“热”了。
虽然同飞机和汽车相比,互联网消耗的化石燃料要少得多,但随着由苹果公司、奈飞公司和其他一些公司提供的“云服务”增多,数据中心开始朝着更高的处理速度和更大的存储容量前进。
这些容量和速度的提升是有代价的:数据中心的运行会产生大量的热,必须由高耗能的风冷或液冷设备来导走,才不会让这些互联网的“引擎”烧毁自己。
意大利卡塔尼亚大学的计算机科学家及电气工程师迭戈·雷福尔贾托·雷库佩罗(Diego Reforgiato Recupero)认为,科学家在遏制这种能量消耗方面所做的工作并不够。在2013年3月29日出版的《科学》杂志上,雷库佩罗提出,互联网流量每3年就会翻一番,但网络耗能效率却没有得到同样的提升。
为了不让数据中心成为耗能大户,排放更多温室气体到大气中,我们需要找到新的解决办法。雷库佩罗特别提到了两种硬件管理技术:一种是“智能待机”,可以将计算机服务器和网络设备中未被使用的部分置入功率极低的状态;另一种是被称为“动态频率调整”的技术,在网络流量较低时,允许数据中心的处理单元在百忙之中喘口气。
数据中心
维基百科给出的数据中心定义是“数据中心是一整套复杂的设施,不仅仅包括计算机系统和其他与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接设备、环境控制设备、监控设备以及各种安全装置”。谷歌将数据中心解释为“多功能的建筑物,能容纳多个服务器以及通信设备。这些设备被放置在一起是因为它们具有相同的对环境的要求以及物理安全上的需求,并且这样放置便于维护”,而“并不仅仅是一些服务器的集合”。
黑客工具隐匿手机数据
撰文│杰西·埃姆斯帕克(Jesse Emspak)
翻译│郭凯声
一种黑客工具可以修改智能手机的操作系统,从而让手机显示虚假信息,隐藏真实的数据。
警察没收了一名贩毒嫌犯的手机,但通话记录却显示,嫌犯只与母亲通过电话,未与其他任何人打过电话。与此同时,机场保安检查了一位记者的手机,但当保安想看看手机上是否有不适合曝光的东西时,却发现记者一直在海滩消磨时光。于是毒贩和记者得以安然脱身。几分钟之后,那些警方一直在寻找的姓名、号码及GPS数据等,才又重新在毒贩和记者的手机里现身。
一项新的编程技巧将有可能使上述场景成真。计算机科学家卡尔-约翰·卡尔松(Karl-Johan Karlsson)专门设置了一部手机,让它去忽悠别人。他改动了一部安卓版智能手机的操作系统后,便将一些虚假数据(比如单纯的数字)输入手机,使真正的数据逃脱“法眼”。2014年1月,他在夏威夷国际系统科学大会上介绍了自己的黑客招数。
卡尔松用警方通用的两种取证工具测试了他的黑客招数。正常情况下,这两种工具能查出手机的通话记录、地点数据,乃至密码等。但在他运行那个被他篡改了的系统后,这些工具查到的只有他设置进手机中的虚假信息,真实的信息早已“遁形”。
不过,卡尔松坦言,虽然他的黑客招数曾经得手,但在美国联邦调查局或美国国家安全局的高超分析手段面前,也只能“原形毕露”。虽然如此,这种黑客招数还是能给某些刑事案件的审判造成麻烦。因为手机里存在两种互相矛盾的数据,会让案情变得扑朔迷离。
计算机安全专家米科·许珀宁(Mikko Hypponen)认为,卡尔松的黑客招数,意味着间谍、执法部门及用户之间的装备暗战进入了一个新阶段。
话题六 走进智能网络世界
科学技术是人类战胜自然、改造自然的武器,是推动社会生产力发展的重要力量。科技的每一次发展都是人类文明史上的飞跃,都是人类征服自然、征服自身的壮举。21世纪,信息技术全面爆发,互联网已成为人们生产生活的组成部分。接下来,互联网会带给我们什么?让我们拭目以待。
打造围棋“深蓝”
撰文│卡伦·弗兰克尔(Karlen A. Frankel)
翻译│陈家乾
在围棋领域,一直以来人类都能轻松击败计算机。但一种新的围棋算法将挑战人类智力,威胁人类在围棋领域的统治地位。
IBM研制的超级计算机“深蓝”在6局比赛中击败了国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)。这个里程碑式的事件终结了人类又一个在智力策略游戏上的统治地位。只有亚洲的围棋仿佛是计算机科学的“阿喀琉斯之踵”(一般指致命的弱点)——人类总是能够轻松击败计算机。但一种新的围棋算法,却能战胜高水平的棋手。
围棋的复杂度高,且极具欺骗性,对计算机程序提出了巨大的挑战。围棋的棋盘由两组数量相同、互相正交的平行线构成,分为9线小棋盘与19线大棋盘两种。对弈双方分执黑白两色棋子。通过在棋盘的交叉点上落子,棋手要尽可能扩张自己的领地并包围对方棋子。在大棋盘的对弈中,每一步可采取的策略数量都非常巨大。对局中期,平均每一步能采取200种不同的策略,相比而言,国际象棋中每一步数十种的可选策略就显得微不足道了。此外,还要考虑数量众多的后续策略。由于棋盘上每个位置都对应着三种状态:黑子占据、白子占据和空位,N个位置便可构成3N种不同的状态。如果考虑规则约束,小棋盘大约有1038种不同的状态,大棋盘的状态数量则达到了惊人的10,170种。其他一些因素也会影响比赛胜负:棋盘上棋子的数量优势并不能确保胜利,棋手必须在考虑局部形式的同时兼顾全局。
超级计算机“深蓝”
1997年5月11日,国际象棋世界冠军卡斯帕罗夫在与一台名叫“深蓝”的IBM超级计算机经过6局比赛后,最终拱手称臣。“深蓝”是一台IBM RS/6000 SP 32节点的计算机,运行着当时最优秀的商业UNIX操作系统。它的设计思想着重于发挥大规模的并行计算技术。因此,它拥有超人的计算能力,每秒可检查超过2亿个棋步。
为了处理如此众多的可能情况,人工智能专家已经设计出一些算法,来限制搜索的范围,但这些算法都无法在大棋盘的比赛中战胜实力稍强的人类棋手。2006年秋季,两位匈牙利研究人员报告了一种新算法,它的胜率比当时最佳算法提高了5%,能够在小棋盘的比赛中与人类职业棋手抗衡。这种被称为UCT的算法,是匈牙利国家科学院计算机与自动化研究所(位于布达佩斯)的列文特·科奇斯(Levente Kocsis)与加拿大艾伯塔大学(位于埃德蒙顿)的乔鲍·塞派什瓦里(Csaba Szepesvári)合作提出的,是著名的蒙特卡罗方法的扩展应用。
20世纪70年代,蒙特卡罗方法首次运用于围棋程序,这种方法的作用类似于选举投票:用统计采样的方式,预测大规模群体的表现与特质。围棋程序会随机出招,模拟大量的比赛,对候选走法加以评估并排序。然而,每一步都采用评估值最高的走法,并不能保证获得比赛的胜利。相反,这种方法仅仅是限制了搜索的范围。
进军围棋:人类仍然统治着围棋领域,但一种新的算法已经能够击败实力强劲的人类棋手。
UCT扩展了蒙特卡罗方法,集中关注那些最有希望赢得比赛的走法。科奇斯说:“UCT的主要思想是对走法进行选择性采样。”他解释说,这种算法必须达到一种平衡,既要尝试当前的最佳走法,发现其中可能隐藏的昏招,还要搜索“当前并非最佳的走法,以确保不会因为先前的估计错误而错失妙招”。
UCT为每一种走法计算一个索引值,然后按照索引值最高的走法出招。索引值由采用该走法后最终取胜的概率(即胜率)决定,该走法被计算却未被采用的次数也对索引值有一定的影响。UCT会在内存中维护一棵“决策树”,用来记录每一种走法的统计数据。如果遇到一种先前从未计算过的走法,算法就会将它纳入决策树,并随机出招完成余下的比赛。
判定随机比赛的胜负后,UCT就会更新比赛中采用过的所有走法的统计数据。如果该走法的索引值等于它的胜率,算法就能快速选定这招最有希望获胜的策略。即使开局时走出妙招,也仍然无法确保比赛的最终胜利。所以在选择走法时,UCT会增大计算次数少的候选走法的权值,以使胜率的总体分布趋向平衡。
法国南巴黎大学的数学家西尔万·热利(Sylvain Gelly)与巴黎技术学校的王一早(Yizao Wang,音译)将UCT集成到一个他们称之为MoGo的程序中。该程序的胜率竟然比先前最先进的蒙特卡罗扩展算法几乎高出了一倍。2007年春季,MoGo在小棋盘的比赛中击败了实力强劲的业余棋手,在大棋盘比赛中也击败了实力稍弱的职业棋手,充分展示了能力。热利认为UCT易于实现,并有进一步完善的空间。那时,科奇斯就预言,10年以后,计算机就能攻克最后的壁垒,终结人类职业棋手对围棋的统治。
阿尔法围棋
阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌旗下DeepMind公司的团队开发。其主要工作原理是“深度学习”。2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。
博客搞定数学难题
撰文│达维德·卡斯泰尔韦基(Davide Castelvecchi)
翻译│庞玮
依靠网络进行科学合作如今已很常见,有数学家提出依靠博客评论的方式实现大众科学家集体合作,这种协作方式为数学指出了一条新的、更快的研究之道。
20世纪中叶,法国数学家尼古拉·布尔巴基(Nicolas Bourbaki)所著的百科全书式专著,追溯了每一个数学概念的基础,将所有分支的源头都归结到集合论,也就是维恩图之类的东西,由此改变了这一领域的面貌。和他提出的许多概念一样,布尔巴基本人也只存在于抽象之中——他并不是一个真实存在的人,而是一群联系密切的年轻法国数学家给自己起的集体代号。如今,“博学家”堪称互联网时代的布尔巴基:他也是一个集体代号,而且或许能创造出一种新的数学研究形式。
“博学家”诞生于英国剑桥大学数学教授蒂莫西·高尔斯(Timothy Gowers)的博客,这位博主曾经获得过数学界的最高荣誉——菲尔兹奖。在2009年1月发布的一篇博文中,高尔斯提出了这样的问题:网络上的自发合作能否破解数学难题?这一合作能否开诚布公,将解题的创造性过程展示给全世界?虽然基于网络的科学合作甚至“众包”(指依靠网络集体协作来完成某项任务,比如国内的众多“字幕组”),如今已司空见惯,但高尔斯提出的协作有所不同。他指出,在通常的网络合作中,每位科学家都各自承担一个大项目下的一小块研究任务。有些情况下,鸟类爱好者或业余天文学家这样的大众科学家集体协作,也可以做出重要贡献。但是,高尔斯问道:“如果要解决的问题无法分拆成众多子任务,那又该怎么办?”这样的问题能不能依靠他博客的读者通过回帖的方式来解决呢?
为了对这种方法进行首次尝试,高尔斯选择了所谓的“密度黑尔斯-朱伊特定理”。高尔斯说,这个问题有些类似于“下一种单人井字棋,但目的是要输”。这个定理声称,如果你的井字棋棋盘是多维的,而且维数足够大,下不了几步你就会发现,棋子会不可避免地排成一条线——无论你如何努力,都没办法输掉这场游戏。从1991年起,数学家就知道这个定理是正确的,但现有的证明使用了很多来自其他数学分支的复杂技巧。高尔斯向他的博客读者提出挑战,希望他们能帮助自己找到一个更基本、更简捷的证明——这种化繁为简的工作通常都被认为是极端困难的。
计划进行的速度远远超出了高尔斯的预期。不到6个星期,他就宣布证明已毕。把证明写成一篇正规论文的时间甚至比证明本身更花时间。原因有点特殊,因为具体证明过程分散在数百个回帖之中。2009年10月,这群证明者在网络预印本文库arxiv.org上发表了最终论文,署名为“博学家”。
不过另一方面,这一计划也有点令人失望,因为绝大多数贡献都是由区区6个人做出的——他们全都是职业数学家,而且是这一领域的“常客”。其中有一位也频繁更新博客,而且也是菲尔兹奖得主,他就是美国加利福尼亚大学洛杉矶分校的陶哲轩(Terence Tao)。
高尔斯认为,将人才汇聚起来自有它的好处。在尝试解决某个问题时,数学家常常会做很多无用功,一行行进行推导,几个星期甚至几个月后才发现走进了“死胡同”。而且很多时候,某位专家看来很有道理的推理过程,在另一个专家看来明显就是竹篮打水。所以当所有尝试都暴露在公众的反馈之中时,解决问题的过程会快很多。
陶哲轩形容这种体会虽然“无序”但充满乐趣,而且“比传统的研究方式更让人痴迷”。高尔斯此后又启动了几项网络协作计划,陶哲轩也发起了自己的协作项目。现在,非专业人士也参与了进来,用高尔斯的话来说,他们以“实际有效”的方式做出了贡献。这些高端爱好者包括一位教师、一位神父,还有一个现在从事计算工作的数学博士。不过这种协作方式究竟能获得多大范围的认可还不清楚。陶哲轩说,有些难题也许适合用这种途径来解决,比如在不对所有可能的走法进行“暴力运算”的基础上开发一种全新的国际象棋算法。那些著名的数学猜想可能不在此列,因为那些问题大多历史悠久,数学家早就对所有的死胡同都了如指掌了。
美国加利福尼亚大学圣迭戈分校的认知科学家拉斐尔·努涅斯(Rafael Núnez)对人在钻研数学时的心智过程及社交过程进行过研究。他指出,解决问题只不过是另一种人类活动。数学家站在一块黑板前一起工作时,相互之间会通过语音和肢体语言进行微妙的交流,网络协作则丧失了所有这些细节。但正如人类已经学会如何在一个联成一体的世界中进行其他工作一样,数学家也会适应这种新的媒介。努涅斯提醒说:“不仅是数学,我们在网络上所做的任何事情都不同于以往。”
抛开这些不谈,这一计划本身所具有的开放性或许是它最重要的特征。正如高尔斯在博客中所写,“博学家”可能是“人类如何解决一个严肃的(数学)研究问题的第一份完整记录,包括了所有的错误开局、死胡同及诸如此类的东西”,或者,用陶哲轩的话来说,这个计划的价值在于,它是“一个范本,展示了‘腊肠’是如何被制作出来的”。
微博的搜索利器
撰文│弗朗西·迪普(Francie Diep)
翻译│王栋
研究人员需要通过自动化程度更高的途径完成搜索工作。科学家研发出一种智能程度更高的语言处理器,它能帮助科学家从数百万条信息中识别出有用信息。
自从2006年推特(一家美国社交网络网站)面世以来,研究人员就一直在研究它,以期更深入地了解人类社会。总的来说,它提供了一个巨型数据库,囊括了人们的所做、所想、所感。但是,科学家手头现有的研究工具却很不完美。例如它的关键词搜索功能,虽能返回很多结果,却无法给出明确的总体趋势。
当美国科罗拉多大学博尔德分校的计算机科学家詹姆斯·马丁(James H. Martin)在推特上搜索关于2010年海地地震的相关内容时,他找到了1400万条相关信息。“你总不可能让研究生们把它们挨个读个遍吧。”他说。研究人员需要找到自动化程度更高的途径来完成这项工作。
一个很有前景的方法是,研发一种能够对推特上的句子成分(例如主语、谓语和宾语)进行标记的程序,然后利用这些标签来确定每条推特的内容是关于什么的。这种被称为“自然语言处理”的方法并不是什么新主意,但在社交短信上的应用却刚刚兴起。“它现在拥有广阔的应用领域。”马丁说。
施乐公司帕洛阿尔托研究中心的科学家研发出了一种这样的程序,该程序利用的是名为“分析器”的语言处理器,该处理器通常用于测试新发表的文章。“分析器”能够区分词语和标点,标记句子成分和分析句子的语法结构。但是,“它们在微博上的应用效果不佳”,帕洛阿尔托研究中心的研究员凯尔·登特(Kyle Dent)说。他和同事编写了数百条规则,来辨识推特上的“#”标签、重复字母(例如“pleaaaaaase”)和其他一些或许在《华尔街日报》上看不到的那些语言特征。2011年8月8日,他们在美国人工智能促进协会会议上展示了这项研究。
登特和同事还想利用他们的程序来区分反问句和疑问句。利用该程序,商家可以及时了解人们对产品的问题反馈。在最近进行的一项测试中,他们的程序准确识别出了2304条微博中68%的内容。“对于这样一个全新领域,首次尝试就取得这样的成绩已经很不错了。”美国空间和海上作战司令部的杰弗里·埃伦(Jeffrey Ellen)评论道,他效力的单位主要为美国海军提供情报技术。
“虽然微博搜索技术还未成熟到可以投入应用,但作为一个领域,它很快就会发展到那个程度。”马丁说。一旦该技术成熟,研究人员就如同拥有了一座前所未有的、关于人类行为的数据宝藏。“小道八卦”被记录下来,还可以随时查询,这是有史以来的第一次。埃伦说:“一百年前,我们根本无法知道所有人的想法。”
下一代网络:每秒千兆
撰文│拉里·格林迈耶(Larry Greenemeier)
翻译│王栋
美国的学术界需要更快的网速,为此美国29所大学试图建立下一代高速网络,网速达到每秒千兆。
在一项网速排名中,美国落在了许多国家的后面。一家网络分析公司——阿卡迈科技公司将美国列在了第14位,远远落后于冠军韩国,同样也输给了日本和罗马尼亚等地区和国家。对于提升网络速度,一个关键问题是:谁将为此埋单?通信公司对这类基础设施的建设往往谨慎,除非他们确信用户产生了对更高速度的需求。而对美国用户来说,他们使用互联网,主要是为了查看邮件和使用社交网络。对于这些用途,当前的宽带网速已经足够,通信公司自然不愿意花费额外成本来提高网速。
当然也有例外,那是在学术领域,因为大学和研究所总是希望网速更快。“我们觉得,如果没有千兆网速的支持,我们的研究人员就会落后。”美国联邦通信委员会的前政策顾问埃莉斯·科恩(Elise Kohn)说。科恩同曾参与制定美国联邦通信委员会“国家宽带计划”(即一项由美国国会授权的、旨在为所有美国人提供宽带接入的计划)的布莱尔·莱文(Blair Levin)一起,领导了一个试验性项目,试图建立一个网速高达每秒千兆的互联网连接网络。该项目由美国29所大学,比如杜克大学、芝加哥大学、华盛顿大学和亚利桑那州立大学等共同发起。这个项目叫作Gig.U。
美国2011年的平均网速是每秒5.3兆,而Gig.U项目的网速要快出很多倍:用户能在不到一分钟的时间里下载相当于两部高清电影的数据量,并能流畅地在线观看视频,而不会感觉存在“马赛克”现象或其他干扰。韩国2011年的平均网速是每秒14.4兆,而且他们还宣称,未来要让每一个家庭都拥有每秒千兆的互联网连接。
美国的千兆互联网将随着地域的变化而有所不同,这取决于不同网络服务商为满足Gig.U用户的不同需求而提供的接入方式。“有的人可能需要千兆以上的网速,有的则不需要那么快。”科恩说。在Gig.U的意见征集期,当地网络服务提供商会被征集升级至高速网络的设想和建议。最终,Gig.U成员和那些对该项目感兴趣的非营利及私营公司会提供资金支持,来实现这些设想。Gig. U打算鼓励研究人员(如学生和教授等)开发新应用和新服务,使这种具有超快数据传输速率的互联网得到充分利用,以加速美国部署下一代网络的进程。
计算机触觉界面
撰文│亚当·皮奥里(Adam Piore)
翻译│冯泽君
未来的手机屏幕不仅能给我们带来视觉的享受,也能给我们带来触觉的体验。
只要敲敲屏幕,就能在智能手机上拨电话或是调节歌曲音量。这固然很棒,但也不免单调——不管你敲哪里都是一个感觉,不会有任何触觉反馈。难道你不想来点更棒的体验?
美国威瑞森电信公司的一项概念界面很可能革新智能手机,带来全新的体验。这项技术通过屏幕下方的一种机械设备使局部屏幕凸起,凸起部分的形状与该处屏幕所显示的图形一致。想往家打电话?屏幕上就会升起拨号键。想跳到下一首歌?屏幕上就会凸显暂停和快进键。这些凸出部分不仅能提供更多触感,还能有效区分各个指令,减少错误操作。乔治·希加(George Higa)是威瑞森电信公司的用户界面设计师,也是这项专利的持有者,他说:“你将会感觉到屏幕上凸出了一块很精巧的区域。”这项专利并没有规定威瑞森电信公司采用哪种技术来使屏幕凸出,希加说:“技术发展太快,可能有多种技术都能实现该功能。”
研究表明,触觉反馈可以通过探针阵列、喷气或电流来实现。美国约翰斯·霍普金斯大学的机械工程教授艾利森·奥卡穆拉(Allison M. Okamura)说:“触觉反馈(基于触感的反馈)是计算机界面的未来。”但是,要在小型掌上设备上实现触觉反馈还有一定的难度。美国西北大学的科学家研发出一台名为TPaD的设备,可以用超声速振动屏幕,使相应部分变得“很柔滑”,操作者可以在屏幕的不同部分调节柔滑度。但据奥卡穆拉所知,这种设备最小也有15厘米高,5厘米厚。奥卡穆拉说:“威瑞森电信公司描述的设备很棒,但我还不知道怎么在手机上实现。”
光芯片打造未来网络
撰文│褚波
人们对网络带宽的需求与日俱增,而光芯片或将是唯一能始终满足这种需求的传输介质。
目前,企业和个人对网络极度依赖,他们在创造了大量数据的同时,对更新、更好的应用和服务的需求也在与日俱增,因此,寻找一种能快速传递大量信息的传输方式迫在眉睫。正是这种需求,推动了光通信的进步。
在传输数据时,光网络是利用光脉冲来加速数据流,而不是通过导线发送电子,因此可以大大加快数据传输速度。为了实现这种通信方式,科学家一直希望找到一种方法,可以将光信号和低成本、大批量的芯片制造技术结合起来,以生产低成本的光芯片。
在此背景下,IBM的科学家研制出了一种原型光芯片“Holey Optochip”,这是世界首个并行光收发模块,每秒可以传输1Tb的数据——相当于每秒可以下载500部高清电影,或者让十万人同时享受10Mb宽带上网。
制造Holey Optochip,需要使用一种新方法,在标准的硅CMOS(互补金属氧化物半导体)芯片上打48个孔。因为这些孔的存在,光信号就能从芯片背面进入24个接收器和24个发射器通道(每个孔对应一个接收器或发射器),这使得Holey Optochip成为了一种高性能、低能耗的光学模块,并把数据的传输速度提升到了创纪录的水平。另外,这款原型产品所采用的元器件目前都已经商用,这为该芯片的商业化大规模生产提供了可能。
同时,研究人员在制作Holey Optochip时,也考虑了能耗因素,把整个收发器的能耗控制在5瓦以下,也就是说一个100瓦灯泡所消耗的能量,就足以支持20个收发器的运行。对于需要高速运算的企业来说,利用这种低能耗光芯片,他们可以在执行高强度分析、数据建模与预测等任务时,减轻能耗压力。
Holey Optochip显示出的特性说明,高速度、低功耗的网络互连在短期内是可以实现的,而光学器件或许是唯一一种传输介质,可以始终满足迅速扩增的带宽需求。据预测,未来的计算将主要依靠光芯片技术,它将促进云计算、超级计算机和数据中心的发展。
纳米晶体管改造计算机
撰文│达维德·卡斯泰尔韦基(Davide Castelvecchi)
翻译│王栋
物理学家展示了一种新型纳米晶体管,这种设计将使计算机运行更快,耗电量更低。虽然它还没有转化成实用器件,但应用前景不可限量。
每块计算机芯片上,都密密麻麻地排列着数十亿个晶体管。自从1947年美国科学家约翰·巴丁(John Bardeen)、沃尔特·布拉顿(Walter Brattain)和威廉·肖克莱(William Shockley)在贝尔实验室制作出第一个晶体管原型以来,晶体管的生产一直都基于相同的原理。目前,物理学家展示了一种彻底简化的晶体管设计,这种设计能使计算机运行得更快,耗电量更低。虽然奥地利物理学家朱利叶斯·埃德加·利林菲尔德(Julius Edgar Lilienfeld)早在1925年就为这种设计申请了专利,但迄今,它从未转化成实用器件。
每个晶体管都有一个门电极,它决定着电流能否通过半导体片,从而界定一个“开”或“关”的状态,这是计算机二进制运算的关键。传统的设计是,半导体片被加工成类似三明治的结构,即一种材料夹在另一种材料的中间。在“关”的状态下,这个“三明治”是绝缘体,但它可以转化为电导体,通常的方法是在门电极上施加一个电场。在芯片制造过程中,“三明治”结构是通过向硅片中“掺杂”其他元素形成的。例如,中间一层可以加入易于获得电子的元素;外面的两层则加入易于释放电子的元素。单独来看,每一层材料都是导电的,但除非门电极处于“开”的状态,否则电子无法穿过中间一层。
相邻材料层之间的边界叫作“结”。爱尔兰廷德尔国家研究院的琼-皮埃尔·科林奇(Jean-Pierre Colinge)说:“随着晶体管尺寸的缩小,如何在几纳米的距离内,使硅片中掺杂元素的密度发生突然变化,以形成一个明显的边界,已成为科学家面临的一个大难题。”
一种解决办法就是干脆去除边界。根据利林菲尔德的设想,科林奇及其同事制作了一种晶体管,其只含一种掺杂元素,这样边界就不存在了。这种新型器件是一个1微米长的纳米管,其中掺杂了大量的硅,门电极横穿中部。门电极产生的电场会耗尽纳米管中间区域的电子,关闭晶体管,进而阻止电流通过纳米管。2010年3月,这个研究小组在《自然·纳米技术》杂志上发表了他们的研究成果。
要有效耗尽电子,纳米管只能有10纳米厚。这种纳米管有可能实现规模生产。科林奇说,“这个器件应该很容易整合在硅芯片上”,因为它与现有制造工艺是兼容的。他认为,无边界设计可以更有效地开关电流,这就意味着晶体管能在较低电压下工作,产生的无用热量更少,速度也将更快。(实际上,经过数十年的快速发展,计算机运算频率过去数年一直停顿在3GHz左右。)
位于美国纽约州约克敦海茨的IBM华生研究中心物理科学部主任托马斯·泰斯(Thomas Theis)认为,如果发明者能将无结晶体管的长度显著缩短,更好地与现有部件相匹配,这种晶体管的应用前景就不可限量。科林奇说,把晶体管的尺寸缩短到10纳米应该是可行的,他的团队正在努力实现这一目标。科林奇还透露,自他们的文章发表以来,多家半导体公司都对无结晶体管很感兴趣,或许这些公司已经做好准备进入“无边界时代”了。
手机网络将永不崩溃
撰文│科琳娜·约齐欧(Corinne Iozzio)
翻译│林清
在未来,无论何时何地,我们都能用手机拨打紧急电话。
2012年,飓风“桑迪”横扫美国东海岸,在灾情最为严重的地区,它摧毁了多达半数的手机基站。这场飓风将我们依赖手机作为主要通信工具的缺陷暴露无遗。高通公司和其他无线通信公司一直致力于制定移动通信新标准:该套技术规程可以确保设备之间互相“通话”,即使在网络出现故障时也能保持线路畅通。2014年,与此相关的“邻近服务”或所谓的LTE Direct标准获批。
通常而言,手机通话的信号需要通过手机基站进行传播。LTE Direct技术将省去这个“中间人”的麻烦。在紧急情况下,那些处在4G LTE网络中,并使用同一频率的手机,将能够直接连接。大约在500米范围内,用户可以互相拨打电话,或与现场救援人员通话。如果目标不在附近,系统还可以通过多部手机进行信息传递,直到最终到达目标手机。
要想利用LTE Direct技术,高通公司和其他通信公司还需升级天线和处理器,所以要想让手机具备以上功能,我们还要再等上更长时间。但标准的获批意味着许多公司可以开始大展拳脚了。
话题七 人工智能拉开时代科技大幕
未来,人工智能(AI)的发展不仅会带来技术本身的进步,还将引领各行各业的创新发展。随着AI时代的到来,越来越多的公司加入到研发有实用价值的机器的队伍中去。机器人可以穿越太平洋、做比萨饼,无人机可以飞进火山口搜集数据、保护野生犀牛……“无所不能”的机器,满足你的猎奇心。本话题中的新进展预示着日新月异的进步将彻底改变人类的生活。
一心多用的机器耳朵
撰文│蒂姆·霍尔尼亚克(Tim Hornyak)
翻译│宋彦
日本研究人员开发出一套机器人倾听系统,这套系统能够同时理解多人说话。研究人员预计这一技术会有更广泛的应用。
日本的圣德太子是公元7世纪的著名政治家,也是日本第一部宪法的制定者。据说他拥有同时倾听多人说话的能力,能一次听取10位请愿者的陈述,并马上作出裁决或提出意见。
日本研究人员从圣德太子的传奇故事中得到启发,花了5年时间,开发出一套能够同时理解多人说话,并作出响应的类人机器人系统。他们为机器人设置了一个饭店场景,让它在那里充当服务生的角色。如果有3个人出现在它的面前,并同时点不同的菜,机器人听懂菜名后,重复一次,并报出总价,正确率在70%左右。这个过程耗时不超过2秒,更重要的是,机器人不需要事先针对特定语音进行训练。
这样的听觉能力涉及人工智能领域中的一个基本难题——如何教会机器从嘈杂的环境中挑出重要的声音。这就是人们常说的“鸡尾酒会效应”(声学中人耳的掩蔽效应:在鸡尾酒会嘈杂的人群中,如果两人交谈,他们耳中听到的都会是对方的说话声,周围的各种噪声被自动掩盖掉了),大多数机器在这方面的表现,并不比一个灌了不少马丁尼酒的醉汉强多少。作为这一语音识别研究小组的负责人和这一领域的先行者,日本京都大学的奥乃博表示:“对于一个机器人来说,在嘈杂的环境中识别出说话的人,是一件非常困难的事情。”回音、杂音和其他信号干扰都会带来识别困难。
确实,能够用简单的自然语言直接和机器交流,从艾伦·图灵时代(Alan Turing)开始就一直是人类的梦想。但直到今天,这一梦想仍然离普通用户十分遥远。2006年,微软公司在现场演示Windows Vista的语音识别功能时,就闹了一个笑话:语音识别软件把简单的问候语“Dear Mom”(亲爱的妈妈)处理成了不知所云的“Dear Aunt, let's set so double the killer delete select all”。一大堆单词堆砌在一起,谁也不知道Vista在说些什么。
相比之下,奥乃博的系统可算异常精准,而且说话的人不需要佩戴耳麦,因为麦克风已经嵌入机器人体内。被奥乃博称为“机器监听”的程序会执行所谓的听觉场景计算分析,结合数字信号处理和统计方法,先定位声源,再用计算过滤器将不同的声音分离开来。下一步,“特征缺失掩码的自动生成”才是真正的关键。这一强大的技术能在系统专注于某一特定的说话者时,将它认定的其他不可靠的声音信号(比如周围的闲谈)屏蔽掉。然后,系统会将处理之后的信息,与一个内置的语音数据库进行比对,该数据库中储存着5000万条日语单奥乃博与他的机器人R2和SIG2,这些机器人可以同时听懂多个人的谈话。词发音,能够确定说话者说的是哪些单词。如果回放每个说话者经过过滤的声音,我们就会发现,中间只会听到极少数其他人的声音。