饭饭TXT > 海外名作 > 《女士品茶》作者:[美]萨尔斯伯格/译者:邱东等【完结】 > 【书香门第】女士品茶.txt

第21章 家庭中的天才

作者:美-萨尔斯伯格/译者:邱东等 当前章节:7062 字 更新时间:2026-6-16 06:22

20世界的前25年,数百万的移民从东欧、南欧迁往英国、美国、澳大利亚和南非。这些移民中的大多数来自他们本国的贫穷阶层,他们逃离压迫人的统计者和混乱的政府,寻求经济机会和政治自由。他们大都寄住在大城市的贫民窟,在那里,他们希望通过教育这个魔杖,使自己的孩子摆脱贫困。在这些孩子当中,有些人显示出非同寻常的潜力,有的甚至是天才。本章就介绍两个移民孩子的故事,其中一个拿到两个理学博士和一个哲学博士学位,而另一个,14岁时就离开了就读的高中。

I?J?古德(I. J. Good)

古达克(Goodack)出生在波兰,但他不喜欢沙皇,也不喜欢沙皇对波兰的统治,特别不愿加入沙皇的军队。在他17岁的时候,就同与他有相同想法的朋友一起逃往了西方。他和他的朋友两人一共只有35卢布和一大块奶酪。一路上,他们没有车票,被发现时就用奶酪贿赂查票人员,晚上就睡在火车的座椅下面。古达克到达伦敦后,栖身在白教堂(Whitechapel)的犹太人贫民窟里,除了勇气和健康的身体外,当时他一无所有。后来他开了家修表店,而所有的修表技术都来自别的修表匠,他是靠在人家橱窗外偷看学会的(那里的光线倒很不错)。后来,他又对浮雕古董产生了兴趣,最后终于在大英博物馆附近开了一家古董珠宝店(从他未婚妻那里借的钱)。开业前,他雇了个画家,让他把自己的名字喷在新店铺的玻璃橱窗上,但那个家伙喝醉了酒,根本拼不出“Goodack”这几个字母,结果店名成了“古德浮雕定石之家”(Good’sCameo Corner),而这家人的姓氏也从此变成了“古德”。

古达克的儿子I?J?古德1916年12月9日出生于伦敦。最初,古达克为儿子取名为伊西多尔(Isidore),但有一年,由于戏剧《善良的伊多西尔》(The Virtuous Isidore)到镇上演出,到处都张贴着宣传演出的大型海报,使年轻的古德非常尴尬。从那以后,他改名为杰克(Jack),并以I?J?古德的名字发表论文和著作。

1993年,在与大卫?班克斯(David Banks)的一次访谈中,杰克?古德回忆起他大约9岁的时候发现了数字的奥秘,并且心算能力变强。当时古德患白喉不得不卧床休息,他的一个姐姐来教他如何算平方根。在那里的正规学校课程安排中,学生学完长除法后,才开始学开平方,开平方的过程包含一连串的平分及平方运算,写在纸上有点像长除法的形式。

因为被迫在床上静养,古德开始用心算的方法开2的平方根。他发现计算好像可以一直延续下去,而且当他把已计算部分的结果再平方时,得数只比2小一点点。他继续心算下去,想看看能否找到某些模式或规律,但没有找到。他认识到整个过程可以看成一个数的平方与另一个数的平方的两倍之差,因此,只有当一定的模式存在时,这个数才可以用两数的比来表示。躺在床上,只靠心算,10岁的古德就发现了2的平方根是无理数。与此同时,他也发现了“丢番图”(Diophantine)的问题的解,即“佩尔方程式”(Pell’s equation)。虽然早在古希腊时代,毕达哥拉斯学派(Pythagorean Brotherhood)就发现了2的平方根是无理数,佩尔议程式也在16世纪就解出来了,但这些都不影响一个10岁孩子在心算上的惊人成就。

在1993年的访谈中,古德沉思道:“那是一个不错的发现——曾被哈代(Hardy,活跃在20世纪20-30年代的英国数学家)称为古希腊数学家最伟大的成就之一。如果这一发现是当今的大人物所为,我会觉得很平常,但这在两千五百年前却是一个惊人之举。”

在12岁的时候,古德进入由缝纫用品商公司开办的艾斯克(Aske)男子中学 就读。这所学校位于哈姆斯代德(Hampstead),是专门为商贩的孩子们开办的学校,校规一向非常严格,它的校训就是要学会服务和服从(serve and obey)。在就读的所有学生中,大约只有十分之一能够升到最高年级;而这十分之一当中,又只有六分之一最后能进大学。在早年的求学生涯里,古德的老师是斯马特(Smart)先生。斯马特先生经常在黑板上抄一组练习题让学生去做,其中有些题是非常难的,他知道这要耗费学生很多时间,这样一来,他就可以利用这段时间在讲桌上做自己的事情。有一次,当他刚写完最后一题时,小古德就举手说:“我做完了。”斯马特先生略带惊讶地问:“你做完第一题了吗?”“不!”古德回答:“我全部都做完了。”

那时候,古德对数学难题的书异常地着迷。他喜欢先看答案,然后再在题目与答案之间找出一条捷径。在面对“一堆弹子”的问题时,他一看答案,就知道可以用比较繁琐的计算方法求出问题的解来。但对他来说,他感兴趣的是探索如果归纳解题的方法。在这个过程中,他发现了数学归纳法的原理,并完善了它。而这个原是仅仅是在300年前才被早期的数学家所发现。

19岁的时候,古德进入剑桥大学。在此之前,有关他的数学天才的传闻,却比他的人更早传到那里。尽管如此,他还是发现,在剑桥有许多同学和他一样具有数学天分。那时候,剑桥耶稣学院(Jesus College)的数学导师似乎更喜欢规范的数学证明方式,以至于在整个数学证明过程中,任何直觉的思维成分,都要受到排斥。更糟糕的是,导师在黑板上写证明过程时的速度非常快,往往学生还来不及抄下来,就已经被擦掉,又写上了新了内容。古德在剑桥表现杰出,连一些资深的数学家都对他特别青睐。1941年,他获得数学博士学位,论文阐述拓扑学的偏维(partial dimension)理论,是对亨利?勒贝格(就是前面曾提到过的那个成就令奈曼敬仰,但初次见面却对这个年轻人异常粗鲁的数学家)思想的扩展。

二战期间,古德成为一名密码破译员,他工作的地方就在伦敦附近的布莱奇利公园(Bletchley Park)里的一个实验室,其工作就是破译德国人的密码情报。一组密码往往由表述信息的字母转换成的一连串的符号或数字构成。在1940年,这些密码已变得非常复杂,转换的模式甚至可以随着每个字母的不同而改变。例如把“战争开始了”(war has begun)这段信息编成密码,一种方法是将这段话的每个字母配上一组数字,这样就构成了由12 06 14 09 06 23 11 19 20 01 13这样一行数字组成的密码。破译人员会注意到,其中06这组数是重复出现的,从而是可以判断它代表着同一个字母。如果这段信息足够长,且大约知道不同字母在语句中出现的统计频率,再加上一点幸运的猜测,密码破译员就有可能在几小时内把这段情报破解出来。

在第一次世界大战的最后几年,德国人研制出一种编码机器,可以为每个字母变换密码。譬如,第一个字母的编码也许是12,而当这个字母第二次出现时,机器就会给它一个与上次完全不同的编码,这个字母的编码可能就变成了14;等到第三次遇到同一字母时,也许编码又变了,如此这样编下去。依靠此种方法,密码专家就不会把上次已经使用过的数字,作为同一个字母的编码,再次使用。不过,作为密码的未来接收者,他们也必须了解这种新型密码的编制规律。因此,就机器编码来说,从一种编码转换为另一种编码,还是有一定的规律性的。密码破译专家可以依据一定的统计模式,估计出编码的规则性,从而找出破解密码的方法。然而,对于密码破译者来说,密码破译工作的难度还是越来越大:一旦最初的编码被一种固定程序所替换,那么整个程序就有可能被一种更高级的固定程序所替换,从而使衍生出来的新密码的破译难度更大。

所有这些工作,都可以用一种数学模式来表示,它很像第13章里讲到的贝叶斯分层模型。编码的每一级的变换形式,都可以用一个参数来代表,因此,我们所面临的就是如何测量的问题:编码资料里的数字可当成观测的初始值,参数代表第一层编码,超参数描述参数的改变,超超参数代表超参数的变换,如此一层层下去。最后。由于密码总要被接收者破译,因此,到最后一层,此时的参数是固定不变的,所以理论上这种密码也是可以破解的。

古德的一项主要成就,就是他从做密码分析师的工作发展出来的经验贝叶斯法(empirical Bayes)与层次贝叶斯模型(hierarchal Bayes methods)。由于战争时的工作经验,使他对数理统计的基础理论产生了极大兴趣。后来他在曼彻斯特大学(University of Manchester)教了一段时间的书,但英国政府又诱劝他回到情报单位工作,在这里,他成为电脑处理分析密码的重要人物。电脑可以大量检验各种数字的可能组合,使他有机会研究分组理论(classification theory),在分组理论中,观察单位按“贴近度”(closeness)的不同定义来组织。

在英国情报单位工作的同时,古德又拿到两个更高的学位,即剑桥与牛津两所大学的理学博士。他1967年到美国,被维吉尼亚理工学院(Virginia Polytechnic Institute)聘为大学杰出教授,一直到1994年退休。

古德永远对偶然出现的数字巧合感兴趣。“我在本世纪第七个十年的第七年、第七个月的第七日的第七时,抵达(维吉尼亚州的)布莱克斯堡(Blacksturg),被安顿在第七街区的七号公寓)一切就是这么巧合。”接着,他又说:“我有个不太成熟的想法,上帝对那些愈不相信他存在的人,提供的巧合愈多。让这些人自己相信比强迫他们相信要好得多。”这双能发现数字巧合的眼睛,也瞄上了统计估计理论中的工作。由于人类的眼睛可以在纯随机的数字中,看出某些模式,因此他会问,这样一个明显的模式,它的真实意义是什么?古德用他的头脑,探索出了数理统计模型的根本意义,正因如此,他后来所写的论文和书籍,哲学的味道愈来愈浓。

迪亚科尼斯

佩尔西?迪亚科尼斯(Persi Diaconis)是希腊移民的后代,1945年1月31日生于纽约。他的经历与I?J?古德完全不同,但和古德一样,他从小就喜欢数学谜题。古德看的是H?E?迪德内(H. E. Dudeney)写的书,书的内容在整个维多利亚时代的英格兰都很盛行;而佩尔西?迪亚科尼斯读的是马丁?加德纳(Martin Gardner)为《科学美国人》(Scientific American)杂志撰写的“数学娱乐”(Mathematical Recreations)专栏。后来还是在高中的时候,迪亚科尼斯遇到了加德纳,加德纳的专栏经常介绍一些玩扑克牌的小把戏,和一些使事情看起来很不同的方法,这些都使佩尔西?迪亚科尼斯非常着迷,尤其是有关概率的复杂问题。

由于佩尔西?迪亚科尼斯太沉迷于扑克片游戏,因此14岁时就离家四处游荡。其实早在他5岁时,就表演一些魔术游戏。在纽约,他经常到一些魔术师聚焦的饭店或商店去。在一家餐饮他碰到了魔术师迪亚?弗农(Dia Vernon),弗农在全国各地旅行,表演魔术。弗农邀请他当助手,一起旅行表演。“机会来了。”佩尔西?迪亚科尼斯叙述到,“马上出发。我没有跟父母说一声,就跟弗农走了。”

当时弗农已经60多岁了,佩尔西?迪亚科尼斯跟了他两年,把他的道具与技术都学到手了。后来弗农在洛杉机安顿下来,开了一家魔术道具店,佩尔西?迪亚科尼斯继续一个人旅行表演魔术。别人觉得他的姓氏拼写比较麻烦,因此他给自己取了个艺名佩尔西?沃伦(Persi Warren)。就像他回忆的那样:

那并不是什么了不起的生活,但日子过得还不错。有一次,我在卡兹奇(Catskill)表演,有人看了我的表演之后觉得很喜欢,就过来说:“喂,老兄,想不想到波士顿表演?……我可以付你200元美金。”……然后我就去了波士顿……安顿好表演场地,按确定的表演日期表演,……这时,或许就有经纪人来邀请你到别处去表演,日子就像这样。

24岁的时候,迪亚科尼斯厌倦了旅行表演的生活,回到纽约。但他没有高中文凭。他原本在学校念书的时候还曾跳级,但14岁离家出走时,还差一年高中才毕业。由于没有高中文凭,他注册念纽约市立学院(City College of New York)的成人教育班。后来他发现在他离家的这些年里,许多军队和大学与理工学院都寄信给他,请他去读书,而且信的开头都称呼他为“亲爱的毕业生”。看来在他离家逃学之后,学校的老师决定无论如何还是让他毕业,因此把最后一年的分数也给了他,使他能顺利拿到毕业证书。迪亚科尼斯并不知道,其实他已经是纽约华盛顿高中(Washington High School)的正式毕业生了。

迪亚科尼斯上大学的理由很奇怪。他曾经买过一本研究生程度的概率论教科书《概率论导论及其应用Ⅰ》(Introduction to Probability Theory and Its Application, Vo1.Ⅰ),作者是普林斯顿大学的威廉?费勒(William Feller)教授。他发现要看懂这本书很难(想看懂费勒这本书的大部分人都这样认为 )迪亚科尼斯进入纽约市立学院,想学到足够多的数学理论,以便把费勒搞懂。1971年,他26岁时拿到了纽约市立学院的学士学位。

有好几个大学的数学研究生院都接受了他的就读申请,以前有人告诉他,哈佛大学数学系从没收过纽约市立学院的毕业生(其实是误传),因此他决定申请哈佛的统计系而不是数学系。他想去哈佛,他认为,进入哈佛后,如果自己不喜欢统计,“那我可以转念数学或其他学科。他们会知道我很棒……”因此会接受他转系。结果,他对统计很感兴趣,在1974年拿到数理统计博士学位,并接受斯坦福大学的一个职位,还一直升至教授。写本书时,他是哈佛大学的教授。

电脑完全改变了统计分析特性的结构。开始,它用来做费歇尔、耶茨及其他统计学家做过的同样类型的分析工作,只不过快得多,能量也大得多。还记得(在第17章)杰里?科恩菲尔德要算一个24阶矩阵的逆矩阵时遇到的困难吗?现在我桌子上的电脑可以算出100阶矩阵的逆矩阵(尽管总是碰到这种情形的人大概没有很好地定义问题),就连一些条件不够充分的矩阵,也能通过去处,求出广义的逆矩阵,这在20世纪50年代还只是纯理论的概念。对于实验设计产生的数据(涉及多重处理与交叉对照),大量复杂的变异分析都可以通过电脑来完全,这类工作涉及到的数学模型和统计观念,其实可以追溯到1920年到1930年。试问,电脑还有什么不能做吗?

在20世纪70年代,迪亚科尼斯和一些年轻的统计学家在斯坦福成立了一个研究小组,试图研究电脑和数理统计的结构,设法回答上述问题。他们最早提出的答案之一是“投影追踪”(projection pursuit)数据分析法。现代电脑带来的其中一项弊端,就是很可能组成一些难度庞大的数据组,假设我们正在跟踪一群经诊断为高危心脏病的病人,他们每半年到医院检查一次,检查时,每个病人抽取10毫升的血,分析血液中100种不同酶的尝试,其中有许多种被认为心脏病有关。此外我们为病人做心电图检查,测量六种不同的项目,并进行心电图监控(或者要求他们一整天都载着监控器,记录一天下来约90万次的心跳)。为了医疗诊断,该测的测了,该量的量了,该抽的也抽了,得到了30-40个测量结果。

怎么处理这些数据呢?

假设每位病人每次检查会产生500个测量值,而在研究期间必须跟踪10次,一个病人就有5000个测量值。如果总共研究2万个病人,可以描绘成一个5000维空间里的2万个点。通常在科幻小说里,仅有四维空间就可让人晕头转向,但在统计分析的真实世界里,处理数千维空间则是很平常的事。在1950年,理查德?贝尔曼(Richard Bellman)就提出了一组定理,他把这组定理称为“维度的诅咒”(curses of dimensionality)。这组定理表示,当空间的维度增加时,得到确切参数估计的可能性就越来越小。一旦分析空间维度达到10至20个,观测值又少于10万,那么就分析不出任何结果。

贝尔曼的定理是基于标准的统计分析方法论。但斯坦福的研究小组发现,在这个5000维的空间里,这些真实的数据并非分散分布,实际上趋向较低的维度空间。假设这些分散在三维空间的点,全都落在同一个平面甚至同一条线上,这正是真实数据呈现的状态。每个临床研究病人的5000个观测值,不会毫无关联的呈分散状态,因为其中很多的测量值是彼此相关的。(普林斯顿大学和贝尔实验室的约翰?图基也曾提出过这种看法,他们认为至少在医学研究上,数据的真正“维度”通常不会超过5。)根据这种思想,斯坦福研究小组发展了一种电脑应用技术,以找出实际存在的低维度空间。这些技术应用最广的就是“投影追踪”。

在此期间,由于大量的无序信息的增加,引起了其他科学家的注意,许多大学纷纷设立信息科学这门新科学。由于这些受过工程训练的信息科学家并不知道数理统计界的最新发展,因此会在计算机科学领域做平行发展,因而有时会重新发现一些统计学上已经知道的事,但有时也会打开一个全新的、费歇尔或他的追随者不曾预料过的领域。本书的最后一章,还会讨论这个问题。

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体大小
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
首 页 < 上一章 章节列表 下一章 > 尾 页