充血性心脏衰竭是世界上致人死亡的重要原因之一。虽然这种病在壮年人当中也时有发生,但此病主要还是一种老年性疾病。以美国为例,在65岁以上的老年人当中,有半数是死于充血性心脏衰竭或它的并发症。从公共健康的角度来看,充血性心脏衰竭不仅是致人死亡人重要原因,也是引发生活中诸多其它疾病的一个重要因素。此外,患者为稳定病情而反复住院,以及治疗过程的复杂程序,是导致国家的公共医疗服务成本居高不下的一个重要因素。为此,许多人都殷切希望能找出更好的辩论治疗方法,以减少患者住院治疗的需求,同时改善这些病人的生活质量。
不幸的是,充血性心脏衰竭不是一种普通的疾病。其病因不是一种简单的传染源,也不能通过阻断某种生化酶的通路而缓解。人体中荷尔蒙精巧地控制着心脏,调节其跳动的速度和收缩能力,以适应身体变化着的需求,但充血性心脏衰竭患者的心脏对这种调节的反应能力越来越差,患者的主要症状表现为心肌逐渐衰弱,心脏的肌肉变得越来越肥大、松弛。患者会因此而出现肺部和脚踝的水肿,轻微的运动都会导致他们呼吸困难。患者还会因进餐时胃部供血而造成的脑部供血不足而感到困倦和意识混乱。
为保持体内平衡,病从的身体会自动调节以适应心脏能量输出的减少。对许多患者,调节心肌和其它肌肉变化的荷尔蒙会在某种稳定状态达到平衡。虽然就一般人来说,这样的荷尔蒙水平是不正常的。如果医生在治疗过程中使用了β肾上腺素收缩剂或钙离子隔断剂,结果可能使患者的情况变得更为复杂。肺部水肿是充血性心脏衰竭病人死亡人一个重要原因。现代医学依靠利尿剂这种药物可以使水肿得到缓解。然而,患者在使用了利尿剂后,为调节肾功能和心脏功能所导致的荷尔蒙的变化,又会因相互影响而造成新的难题。
长期以来,医学界一直致力于研究更加有效的治疗充血性心脏衰竭的方法,希望延长患者的生命,减少他们的住院次数,提高他们的生存质量。由于一些治疗可能会对某些病人产生不良影响,因此,治疗的任何可能会对某些病人产生不良影响,因此,治疗的任何临床研究都需要考虑到特殊病人的情况。在这种情况下,这种研究的最终数据分析可以指认对哪些病人有效,哪些病人有不良反应。所以,对充血性以及衰竭研究的统计分析将变得难度极大。
当设计一项研究时,首先遇到的问题是要测量什么。例如,测量某一种治疗患者的平均住院治疗时间,这是一种粗略的总体测量,没有考虑到重要的方面,如他们的年龄,他们最初的健康状况,他们发病的次数,以及住院治疗的时间。最好要考虑到每个患者发病的整个时间过程,估量可能的住院治疗情况,如住院时间长度,与上一次住院治疗的间隔,出院期间患者的生活质量,并根据患者的年龄以及其它可能发生的疾病,对所有这些结果进行调整。从医学的观点来看,这可能是一个理想的方案,但它提出了一个困难的统计学问题。这里没有一个数据与单个患者相联,相反,患者的记录是事件的时间过程,有些记录是重复的,有些通过多重测量得到。因为在这个试验中的测量是多层次的,因此,其分布函数——这些函数的参数必须是可估计的,其构成也必须是多维的。
早期的理论性工作
解答这个问题,是从法国的数学家保罗?利维开始的。保罗?利维出身于数学世家,他的父亲、祖父都是数学家。保罗?利维1886年出生,在他还很小的时候,就显示出与众不同的学习天赋。按当时漫无边际的惯例,他很快升入专门培养天才学生的学校,并且在学习期间获得过许多学术性奖励。还是十几岁少年的他,就获得了希腊文和数学的法国中学中学优等生会考奖;获得法国国立圣路易学校(Lycée Saint Louis)颁发的数学、物理学和化学的成绩优异奖;获得了高等师范学院及综合工科大学入学竞赛第一的成绩。1912年,26岁的保罗?利维获得科学博士学位,他后来写的一本有关抽象函数的重要著作,就是以他的博士论文为基础的。保罗?利维获得科学博士学位,他后来写的一本有关抽象函数的重要著作,就是以他的博士论文为基础的。保罗?利维在33岁时就成为综合工科大学的全职终身教授,法国科学院院士。他在抽象分析理论方面的工作使他闻名于世。1919年,他所在学校安排他就概率论问题开展一个系列讨论,为此,他首次着手就这一问题展开深入的研究。
利维不满于当时作为复杂计算方法之集合的概率理论(那里安德烈?柯尔莫哥洛夫的理论尚未出现)。利维寻找一些基础性的抽象数学概念,以便把这些方法统一起来。在这一过程中,棣莫弗正态分布的推导和数学家的“大众定理”(FOLK theorem)打动了他。(按大众定理,棣莫弗的结果在许多其它情况下也都成立,现在叫做“中心极限定理”)我们已经看到利维(与荷兰的林德伯格(Lindeberg))如何在20世纪30年代早期最终证明了中心极限定理,以及这个定理成立的必要条件。与此同时,利维着手对正态分布公式进行研究,通过逆向推导,寻求这一分布的独特性质,使得该分布能由这么多的情形产生出来。
然后,利维又另辟新路,从另一个角度探讨这个问题,探询这种正态分布成立的特定条件是什么。他确定只需两个简单的条件就能使一组数列趋向一个正态分布。但这两个条件并不是正态分布能产生的唯一途径,利维对中心极限定理的证明建立了一组更具有普遍意义的必要条件,这两个条件相当于有一组随机产生的一个接一个的数列:
1. 变异是有界的,因此个别值不可能是无穷大的,也不可能是无穷小的。
2.下一个数字的最佳估计值必是它的前一个数值。
利维称这样的数列为鞅(martingale)。
这里,利维借用赌博中的一个术语。在赌博中,martingale的意思是指赌博者在输了的情况下加倍下注,如果他输赢的机会各半,即50%:50%,那么损失的期望值就等于他原来的损失。Martingale这个英文词还有另外两个含义。一个意思是用来描述法国农夫套马的一种装置,让马低着头不向后甩。在此装置控制下,马的头可以随意活动,但马头下一个最有可能的位置是它现在所在的位置。Martingale的另一种解释是用在航海上的。指一片很重的木头,悬挂在船帆的下桁上,用以防止帆的下桁因剧烈摇晃而左右摆动。这里,帆的下桁最后的位置也就是它下一次位置的最佳估计。至于这个词本身,是来源于法国的一个叫马提克(Martique)的小镇,该小镇的居民以小气而著称。据说他们下周要花的一点小钱,估计起来最有可能等于他们今天花的钱。
利维正是从马提克小镇居民的小气习性中受到启发,创立了最小气可能性的抽象数学概念,而具有这种性质的数列通常是正态分布的。到1940年,鞅已经成为抽象数学理论的一个重要的工具。它的简单必要条件,意味着诸多类型的随机数列都具备鞅的性质。1970年,挪威奥斯陆大学(the University of Oslo)的奥德?奥伦(Odd Aalen)研究发现,在临床试验中,病人的反应方式就是一个鞅。
鞅与充血性心脏病研究
回想前面有关充血心脏病研究所引发的问题,因为患者的反应各不相同,我们的问题就是如何解释研究中患者住院治疗的时间早晚问题(当患者年龄已经很大的时候),如何处理患者住院治疗的次数和住院时间的长短。把长时间得到的数据看成鞅,所有这些问题的答案都可能回答。奥伦特别注意到,当一个患者住院治疗时他可以从分析中排除,到其出院后再列入研究范围。重复多次的住院治疗可以把每次住院作为一个新事件来处理。在每一个时间点,分析人员需要了解的就是仍在研究中(或回到研究中)的病人数和最初进入研究的病人数。
在20世纪80年代初,奥伦与丹麦奥尔胡斯大学(Aarhus University)的埃里克?安德森(Erik Anderson)及荷兰乌得勒支大学(University of Utrecht)的理查德?吉尔(Richard Gill)一起探索他的新发现。在本书的第1章我就曾指出,数学的发展总是和科学发展具有不可分割的联系。抽象的数理统计是如此错综复杂以至于很容易出错,只有通过同事间共同的讨论和批评,才能发现其中可能出现的错误。正是奥伦和安德森、吉尔这三个人的通力合作,造就了20世纪最后十年这个领域的一项最富成效的研究结果。
之后,理查德?奥尔森(Richard Olshen)与其在华盛顿大学的合作者,以及哈佛大学的魏立人(Lee-Jen Wei)教授又对奥伦、安德森和吉尔三个人的研究成果进行了补充。他们又提出了大量用于分析临床试验中序列事件的新方法。特别是魏立人对于两个鞅之差仍然是鞅这一概念的开拓性的应用,消除了对模型进行多个参数估计的必要性。如今鞅方法在慢性疾病的临床试验研究统计分析中占据着主导地位。
以马提克上镇居民以小气著称的传奇故事为起点,法国人利维创立了建立在最小气原理的数学概念之上的鞅方法的最初概念。之后,又经过更多头脑的共同研究开发,他们包括美国人、德国人、俄国人、英国人、意大利人和印度人。之后,又由挪威人、丹麦人和荷兰人将这种方法运用于临床试验研究。两个美国人,其中一个出生在中国的台湾,又进一步将这项研究推向深入。20世纪80年代以来,有关这方面问题研究的文章和书籍特别多,光是作者名录就可以写好多页,研究者还来自上面没有提到的很多国家。的确,数理统计学已成为一种国际合作性的研究。