饭饭TXT > 海外名作 > 《女士品茶》作者:[美]萨尔斯伯格/译者:邱东等【完结】 > 【书香门第】女士品茶.txt

第9章 钟形曲线

作者:美-萨尔斯伯格/译者:邱东等 当前章节:7545 字 更新时间:2026-6-16 06:22

读完这本书的前八章,你也许会以为统计革命只是发生在英国。从某种意义上说,这倒也是事实,因为最先将统计模型应用于生物研究和农业研究的,的确是在英国,还有丹麦。在费歇尔的影响下,统计学方法很快就传到了美国、印度、澳大利亚和加拿大。正当统计模型的实际应用在说英语的国家和地区推广之际,由于欧洲大陆长期形成的一种数学传统,使得欧洲的数学家正在研究与统计建模有关的理论问题。

这些理论问题中,最为重要的是中心极限定理(central limit theorem)。直到20世纪30年代初,这还是个未经证明的定理,或者说只是一个猜想(conjecture),因为许多人都信其为真,却没有一个人能证明它成立。费歇尔早在研究似然函数值的理论时,就曾假设这个定理是成立的;而回溯到19世纪初,法国数学家皮埃尔?西蒙?拉普拉斯也用这个推论证明了他的最小平方法(method of least squares)。此外,心理学这门新兴科学也是根据中心极限定理开创了智力测验技术与精神疾病量表。

什么是中心极限定理?

大量数据集合的平均数都有一个统计分布,而中心极限定理则阐明,无论初始数据是怎么来的,这个分布都可以用正态概率分布来逼近。这个正态概率分布与拉普拉斯的误差函数(Laplace’s error function)相同,有时也叫做高斯分布(Gaussian distribution),而在浅显通俗的普及书里,也常被称为“钟形曲线”(bell-shaped curve)。在18世纪晚期,亚伯拉罕?棣莫弗(Abraham de Moivre)已经证明,由机会博弈(games of chance)所得数字的简单集合符合中心极限定理。然而,在此之后的150年里,对这个猜想的证明没有丝毫的深入进展。

用正态分布来描述大部分数据都是正确有效的,因此,中心极限定理普遍被认为是一个正确的猜想。一旦假定数据服从正态分布,数学上的处理就容易多了。正态分布具备某些非常优良的性质:如果有两个随机变量服从正态分布,那么两变量之和也同样服从正态分布。就一般而言,正态变量的各种类型的和与差也都服从正态分布。因此,由正态随机变量(variate)推演得出的许多统计量,其自身也服从正态分布。

正态分布只有K?皮尔逊四个参数中的两个——平均数和标准差,另外两个参数对称性偏度(symmetry)和峰度(kurtosis)均为零。因此,一量知道了平均数和标准差这两个参数值,其他的一切也就一清二楚了。费歇尔曾指出,由一组数据得出的平均数与标准差的估计值就是他所说的充分估计量(sufficient estimator),因为这两个参数值已经把这些数据中所有的信息都包括在内了。既然这两个参数值已经涵盖了能够从那些原始测量值中揭示出的一切,就根本没有必要去占有任何原始测量值了。如果有足够的测量值可以用来相当精确地估计出平均数与标准差,就不再需要其他任何测量值了,任何为搜集这些数据所做的努力,都不过是浪费时间而已。例如,有两个重要指标服从正态分布,如果你正打算得出这样一个正态分布的那两个参数,那么你只需要收集大约50个测量值就足够了。

正态分布的这种数学上便于处理的特性,使科学家能够构建一个复杂关系模型。只要其基本分布是正态的,费歇尔的似然函数通常就有了以简单代数进行处理的一种形式。即便模型复杂到必须用迭代运算法去解的程度,只要其分布是正态的,用纳恩?莱尔德(Nan Laird)和詹姆斯?韦尔(James Ware)的EM演算法去解,就变得轻而易举了。由于正态分布在数学上的计算处理非常敏捷,因此在建模时,统计学家常常要假定所有的数据都服从正态分布。不过,做这样的假定就不能不援引中心极限定理。

但是,中心极限定理是否成立?说得更准确一点,它在什么条件下成立?

在20世纪20年代和30年代,斯堪的纳维亚地区、德国、法国和苏联的一批数学家,运用20世纪早期发明的一套新的数学工具,倾心于上述这些问题的研究。但就达个时候,整个人类文明都正面临着一场日益迫近的浩劫——那些极权主义的国家的恶性膨胀。

数学家并不有昂贵设备的实验室。在20世纪二三十年代,黑板和粉笔就是一个数学家最具代表性的实验设备。对数学研究而言,用黑板比用纸张更方便,因为数学研究过程的演算总免不了出错,而黑板上的粉笔字很容易擦掉。几乎没有数学家是关起门独自做研究的,只要你是一个数学家,你就必定要同其他的数学家一起讨论自己在研究的问题,你就必定要接受别人对你那些新想法的批评审视。在数学研究过程中太容易出错,或者太容易在研究中隐含着自己毫无察觉而在别人看来却是显而易见的假设。有一个数学家的国际组织,在这个团体中,数学家们书信往来、开会、审阅彼此的论文,经常交换相互的批评和质疑,探究分歧所在。20世纪30年代初期,德国的威廉?费勒(William Feller)和里夏德?冯?米泽斯(Richard von Mises),法国的保罗?利维(Paul Lévy),俄罗斯的安德烈?柯尔莫哥洛夫(Andrei Kolmogorov),斯堪的纳维亚的亚尔?瓦尔德马?林德伯格(Jarl Waldemar Lindeberg)和哈拉尔德?克拉美(Harald Cramer),奥地利的亚伯拉罕?沃尔德(Abraham Wald)和埃尔门?哈特利(Herman Hartley),意大利的圭多?卡斯泰尔诺沃(Guido Castelnuovo),还有许多其他数学家也都在这个团体中,其中不乏那些利用新工具来检验中心极限定理这个猜想的数学家。

然而,这种自由轻松、无拘无束的相互交流不久就将不复存在。它将毁于斯大林的肃反运动、纳粹的种族灭绝和墨索里尼的帝国梦。黑暗笼罩着欧洲。斯大林正把非法操纵的示众式的公开审讯同半夜里的秘密逮捕结合运用到了极致,处决、恐吓和威胁任何一个受到他偏执狂式的无端猜疑的人。起初,希特勒及其罪大恶极有党羽把犹太裔教授从各大学里清洗出去,随后将他们关进惨无人道的集中营。墨索里尼则把国人强行禁锢在他所谓的“组合国”(Corporate state)所划定的各个社会等级中。

“死亡万岁!”

这一猖獗的、反理智主义(anti-intellectualism)的极端事件,就发生在西班牙内战时期。当时长枪党的党徒们(以西班牙的法西斯主义者闻名)已经占领了古老的沙拉曼卡大学(University of Salamanca)。该大学的校长是享誉世界的西班牙哲学家米格尔?德?乌纳穆诺(Miguel de Unamuno),当时他已经70岁出头了。长枪党的米连?阿斯特赖(Millan Astray)将军,一个在先前的战争中失去了一条腿、一只手臂和一只眼睛的残疾人,当时任这个刚以武力控制了西班牙的恶势力的宣传部长。他的座右铭就是:“死亡万岁!”如同莎士比亚笔下的国王理查德三世,阿斯特赖身体上的残缺不全恰恰映射出他扭曲的邪恶心灵。有一次,长枪党在沙拉曼卡大学的纪念大厅举行盛大的庆典,台上有新指派的省长、弗朗西斯科?佛朗哥(Francisco Franco)夫人、M?阿斯特赖、沙拉曼卡的大主教,还有年事已高的乌纳穆诺,他是被当作被征服的战利品拖到台上的。

“死亡万岁!”阿斯特赖高声狂呼,挤满了人群的大厅里随声附和着他的喊叫。又有人高呼:“西班牙!”大厅里的人也跟着喊。“西班牙!死亡万岁!”穿着蓝色制服的长枪党的党徒们齐刷刷地站起来高呼,并朝着台上的佛朗哥肖像行法西斯的举手礼。就在这一浪高过一浪的叫嚣声中,乌纳穆诺站起身来,从容地走向讲台,镇静地开始演讲:

你们大家都记住我的话。你们都了解我,并且知道我不可能保持沉默,因为沉默也可以解释为默认,沉默中常常意味着谎言。我想对刚才的演讲做个评论,我们不防就叫它“M?阿斯特赖将军的演讲”吧……。就在刚才,我听见一种嗜尸成癖的愚蠢无知的叫嚣:“死亡万岁!”而我,一个终生致力于各种悖论研究的人……我必须告诉你们,作为一个权威,这种荒诞怪异、语无伦次的谬论让我恶心。阿斯特赖将军是个残疾人……他是战争造成的一个残疾人……。不幸的是,眼下的西班牙这种残疾太多了。而且不久,如果上帝不能拯救我们,这种残疾人甚至还会更多……。

M?阿斯特赖把乌纳穆诺推到边上,厉声吼叫:“该死的臭知识分子!死亡万岁!”与他的叫嚣相呼应,那些长枪党徒们蜂拥而上,抓住乌纳穆诺。但是,老校长仍然继续说道:

这里是知识的殿堂,而我才是这个殿堂的领袖。是你们亵渎了这个神圣的地方。你们可以凭借极其残暴的兽行获胜,但是你们无法得到人们的认可。因为要让人认可必须靠说服而不是压服,要达到说服的目的所必须具备的东西,恰恰是你们所没有的,那就是理智和正义……。

乌纳穆诺遭到软禁,不出一个月就被宣告“自然死亡”。

苏联的大清洗运动切断俄国数学家与欧洲其他地方的联系;希特勒的种族政策几乎毁掉了德国的大学,因为欧洲许多伟大的数学家要么是犹太人,要么是与犹太人联姻,而非犹太裔的那些数学家又大多是反纳粹的。结果,威廉?费勒去了美国的普林斯顿大学(Princeton University),亚伯拉罕?沃尔德到哥伦比亚大学(Columbia University)去了,埃尔门?哈特利和里夏德?冯?米泽斯去了英国伦敦,埃米尔?J?冈贝尔逃到了法国,埃米纳脱(Emmy Noether)在美国国宾夕法尼亚的布林莫尔学院(Bryn Mawr College)求得一个临时工作。但是,并非每个人都逃得脱。不能出示证明受聘到美国去工作的那些人,美国移民局对他们总是大门紧闭;而拉丁美洲那些国家的国门则由于那些小官僚的反复无常而时开时关。纳粹军队占领了波兰首都华沙后,大肆搜捕能找到的华沙大学所有的教授和学者,逮捕他们并惨绝人寰地将他们杀害,然后一起埋在一个巨大的坟墓里。在纳粹的种族主义世界里,波兰人和其他斯拉夫人只配做他们这些亚利安(Aryan)主人的奴隶,没有受教育的权利。欧洲那些历史悠久的大学里许多有培养前途的青年学生就这样被毁掉了。在苏联,大部分数学家都躲进了纯数学中去寻求庇护,而不敢在应用领域中做任何尝试。因为,那些从事应用研究的科学家,正受到斯大林令人不寒而栗的无端猜疑。

不过,在这些黑暗没有完全成为现实之前,欧洲的数学家们就已经解决了中心极限定理的证明问题。芬兰的亚尔?瓦尔德马?林德伯格和法国的保罗?利维分别发现了能够使中心极限定理这个猜想成立所必需的一组重叠的条件。这证明了至少存在三种解这个问题的方法,而且证明了中心极限定理不是只有一个单个的定理,而是有一组定理,其中每个中心极限定理都能从略有区别的一组条件中推导出来。到了1934年,中心极限定理(组)终于不再是猜想了,一个科学家必须要做的只是要证明林德伯格?利维条件(Lindeberg-Lévy Conditions)成立,那么中心极限定理就成立,于是,他就可以随意地把正态分布设为一个合适的模型。

林德伯格?利维条件与U统计量

然而,就一个特定情况而言,要证明林德伯格?利维条件成立很难。但在理解林德伯格?利维条件上倒有几分安慰,因为他们描述的条件看上去是合理的,而且在大多数情况下都是成立的。不过要证明其成立却是一个棘手的问题,这也正是战后远在北卡罗莱纳大学辛苦工作的瓦西里?霍夫丁(Wassily Hoeffding)在这个故事中竟会有如此重要地位的原因。1948年,霍夫丁在《数理统计年报》(Annals of Mathematical Statistics)上发表了一篇论文,题目是“渐近正态分布的一组统计量”。

回想费歇尔曾把统计量(statistic)定义为:从观察到的测量值得出的、可用来估计其分布参数的一个数值。费歇尔还建立了有用的统计量应该具备的一些准则,在这个过程中,他还指出了利用皮尔逊的许多方法导出的统计量不符合这些准则。有很多种计算统计量的不同方法,其中的很多统计量都能满足费歇尔提出的准则。一旦计算出统计量,为了要用它,我们必须知道它的分布。如果它服从正态分布,用起来就容易多了。霍夫丁提出了一种他所谓的“U-统计量(U-statistics),并指出一个统计量如果属于这种U-统计量,则满足林德伯格?利维条件。正因为如此,我们只须指出一个新的统计量是否与霍夫丁的定义相一致,而不必去解那些很困难的数学来证明林德伯格?利维条件成立。霍夫丁所做的一切就是用一组数学必要条件取代另外一组。然而,霍夫丁的条件事实上很容易检查。因此,霍夫丁的论文发表之后,几乎所有的论文在证明一个新统计量服从正态分布的时候,都是通过证明该统计量是一个U统计量来完成的。

霍夫丁在柏林

第二次世界大战期间,霍夫丁处在一个不确定的微妙境况中。他1914年出生在芬兰,父亲是丹麦人,母亲是芬兰人。第一次世界大战之后,芬兰沦入俄罗斯帝国的统治,就在这个时候,霍夫丁随家人迁往丹麦,随后又迁往柏林,因此他拥有斯堪的纳维亚地区两个国家的双重国籍。1933年他高中毕业,随后开始在柏林攻读数学。就在那个时候纳粹开始在德国掌权。预料到以后可能发生的事,霍夫丁就读的那所大学的数学系的系主任R?冯?米泽斯早早地离开了德国,不久之后,为霍夫丁授课的其他许多教授,有的逃走了,有的被解除了职务。在动乱中,年轻的霍夫丁所选的课都是由一些低水平的教师来讲授的。即便如此,这些教师中的很多人也没能维持到把他们承担的课程教完,因为纳粹在持续不断地“净化”大学教师队伍,把大学教师中所有的犹太人和犹太人的同情者全都清除出去。

随同数学系里的其他学生一道,霍夫丁被迫去听路德维希?比贝尔巴赫(Ludwig Bieberbach)讲授的一堂课。比贝尔巴赫一直都是教师中的小角色,只是因为对纳粹党的狂热拥护,才合他成为数学系新的系主任。比贝尔巴赫这堂课讲的是“亚利安”数学与“非亚利安”数学的区别,他声称颓废的“非亚利安”(解读为犹太)数学家仰仗着复杂难解的代数符号做研究,相反,“亚利安”数学家则在更高贵、更纯粹的几何直觉领域里从事研究。结束了讲课的时候,他让学生提问题。坐在后排的一个学生问他,为什么偏偏是这个里夏德?库朗(Richard Courant,20世纪初德国伟大的犹太裔数学家之一)运用几何洞察力创建了他的实分析理论(theories of real analysis)。此后,比贝尔巴赫再也没有就这个题目上过公开课。但是他创办了《德国数学》(Deutsche Mathematik)杂志,这个杂志很快就成为当政者眼中居第一位的数学期刊。

1940年,霍夫丁完成了他的大学学业,像他这个年龄的其他男青年都要应征到部队去服兵役,但由于他的双重公民身份,并且当时的芬兰已成为德国的一个盟国这样的事实,他因此不必服兵役。他找到一份工作,在一家跨校际的精算杂志社的办公室兼职。与比贝尔巴赫创办的那个杂志不同,这是一个很难约到论文,因此也很难定期出版发生的杂志。霍夫丁甚至连寻找一份教书的工作都不能,因为他必须申请到正式的德国公民身份才有资格去教书。

1944年德国政府宣布,具有“德国血统或相关血统“的非德国籍青年也要服兵役。不过,在霍夫丁体检的时候,发现他患有糖尿病而免于服兵役。这时他终于有了找工作的资格。他兼职的那家期刊的编辑哈拉尔德?格佩特(Harald Geppert)建议他从事某种军事应用方面的数学研究工作,他提这项建议的当时,期刊的另一个编辑赫尔曼?施密德(Hermann Schmid)也在场。霍夫丁犹豫了一下,然后,出于对格佩特的谨慎的依赖,他对格佩特说,任何一种与战争有关的工作都违背他的良心。施密德出身于一个普鲁士贵族家庭,霍夫丁希望他的家族荣誉感能让他对这次谈话守口如瓶。

随后的几天里,霍夫丁一直提心吊胆的,但什么事都没有发生,他得以继续他的研究。当俄国军队逼近柏林的时候,一天早上,格佩特在早餐里放了毒药喂给他年幼的儿子,随后他和他的太太也服毒自杀了。1945年2月,霍夫丁和他的母亲一起逃到汉诺威的一个小镇上,他们在那里的时候,这个地方成为英军占领区的一部分。而他父亲仍滞留在柏林,在那里,他被俄国秘密警察以间谍罪逮捕,因为他一度曾为美国驻丹麦的商务参赞工作过。好几年时间,他杳无音信,直到他设法越狱,又历尽千辛万苦逃到了西方。在此期间,年轻的霍夫丁于1946年秋天到达纽约,继续他的学业,后来应邀到北卡罗莱纳大学任教。

运筹学

纳粹的这种反理智主义、反犹太主义倒行逆施的结果之一,就是让第二次世界大战的同盟国因此而丰收了许多才华横溢的科学家与数学家,在他们的鼎立相助下打赢了这场战争。英国生物学家彼得?布莱克特(Peter Blackett)向海军部建议,武装部队应该请一些科学家来协助解决战略和战术上的问题。无论是哪个专业研究领域的科学家们,他们都训练有素,能够应用逻辑和数学模型来解决问题。他建议组成科学家的攻关小组,让这些小组从事有关战争问题的研究,由此诞生了一门新学科——“运筹学”(operational research,在美国称之为operations research)。从事不同领域研究的科学家组成的科研小组联合起来共同研究,决定用远程轰炸机对付潜艇的最佳使用方案;为防空武器提供射击表;决定靠近前线的军火补给站的最佳选址;甚至还要解决军队的食物补给问题。

战争结束后,运筹学的应用由战场搬到了商场。那些在战争期间被征募到军队去服务的科学家已经证明了用数学模型和科学的思维来解决战事中的战术问题是多么有用。同样的步骤和许多相同的方法也能用来组织工厂里的生产,找出仓库与销售部门之间的最优关系,解决许多别的商务问题,均衡有限的资源,或改进生产与提高产量。从那时候起,大公司里大部分都设立了作业研究部门,而这个部门所从事的多数工作都与统计模型有关。

我在辉瑞公司工作的时候所做的几个项目,其目的都是为了改善对药物研究进行控制和提取新产品进行测试的方法,在所有这些研究中涉及到的一个重要方面就是,当条件可以满足时,有能力用正态分布去处理问题。

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体大小
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
首 页 < 上一章 章节列表 下一章 > 尾 页