有一个简单的假设可以得出凯恩斯所需要的那种有限概率。让我们假定宇宙中事物的数目是有限的,比方说是N。设β是一个由n 个事物组成的类,并且设a 是一个由任意选取的m 个事物组成的类。
那么可能出现的的数目是
N!
—————,并且这些可能出现的α包含在β内的数目是
m( N!-m)!
n!
——————。所以“所有的α都是β的机会是
m!(n -m)!
n!(N -m)!
——————,而这是个有限数。
N!(n -m)!
这就是说,我们对之没有任何证据的每个 概括性命题为真的机会都是一个有限数。
可是我却担心,如果N 象爱丁敦所认为的那样大,那么使得一个归纳概括具有很高概率所需的有利实例的数目将会大大超过实际可能发现的有利实例的数目。所以这种摆脱困难的方法从理论上看尽管很好,却不能用来为科学实践找到合理的根据。
先进科学使用的归纳法与简单列举的归纳法有些不同。首先要有许多观察到的事实,然后有一个与所有事实都相一致的一般理论,然后又从这个理论引导出为以后的观察所证实或推翻的推论。这里的论证依靠反概率原理。
设P 为一个一般理论,h 为已经知道的数据,q 为有关p 的一个新的实验数据。那么
(p /h)(q / ph)
p / qh = ————————
q/h
在最重要的情况下,q 是从p 和h 得出的结果,所以q/ph=1。因此,在这种情况下,
p/h
p/ qh = ————
q/h
由此可以看出如果q/h 的值很小,q 的证实就大大增加了p 的概率。可是这却不具有人们可能希望得到的那些结论。如果用“p”表示“非P”,我们就有
q/h =pq /h +pq /q =p/h 十pq /h
因为在已知h 的情况下,p蕴涵q,这样如果
pq/h
y=————
p/ h
1
我们就有p / gh = ——。
1+ y
如果y 的值小,那么这将是一个很大的概率。现在有两个条件可以使y 的值小:(1)如果P/h 的值大,(2)如果pq/h 的值小,也就是p 伪而使q 变得不大可能的那种情况。计算这两个因子所遇到的困难正和凯恩斯的讨论中所出现的困难一样。为了算出p/h,我们需要具有某种在发现使我们想到p 的个别证据之前,计算p 的概率的方法,而这种方法却是不容易找出来的。我们看得清楚的只是如果一个让我们想到的定律在发现任何有利于它的证据之前就具有相当大的概率,那就一定要依靠一个大意是说某种相当清楚的简单定律必然为真的原理。但这却是一个困难的问题,我在以后还要谈到它。
在某些种类的情况下,对于pq / h 进行近似计算具有更大的可能。让我们拿海王星的发现作例。就这个实例来讲,p 是万有引力定律,h 是海王星发现以前关于行星运动的观察,而q 是海王星存在于计算表明它所应该存在的地方。这样pq/h 就是在万有引力为伪的情况下,海王星出现于它所在的地方的概率。这里我们必须对于我们所用的“伪”这个词的意思做出一条规定。
就这个词的适当意思来讲,认为爱因斯坦的理论证明牛顿的理论为“伪”是不正确的。在肯定一切表示数量的科学理论时都应该保留误差范围;如果做到了这一点,牛顿的万有引力学说对于行星运动来说就仍然为真。
下面的论证看来似乎今人抱有希望,但是在事实上却是不正确的。
就我们所举的实例来讲,脱离开p 或者某个一般定律,h 对于q 就是无关的;这就是说,对于其它行星的观察不能使海王星的存在具有比原来更多或更少的概率。至于其它定律,我们也许可能认为波得定律使得有一个大体具有海王星轨道的行星存在从大体上看是可能的,但是它却不能指明在某一特定日期行星已经走过的一段轨道。如果我们假定波得定律以及万有引力以外的任何其它有关定律给予认为有一个大体沿着海玉星轨道运行的行星的假定以概率X,并且假定对于海王星的视位置的计算带有误差范围θ,那么海王星在它所在的位置被发现的概率就将是θ/2π 。现在θ的值很小而x的值也不能认为很大。所以pq / h ,这个值等于xxθ/2π,就必然很小。假定
我们把X 作为1/ 10 ,θ作为6分钟,那么pq /h =1/ 10x ×3600=1/ 36 ,000。所以如果我们假定p/h=1/36,我们就将有y=1/1000 和
1000
p / qh =————
1001
这样,即使在海王星被发现之前,万有引力定律象掷骰子出双六那样不大可能,在发现之后它却具有1000 比1 的有利情况。
这个论证如果推广到所有观察到的有关行星运动的事实,显然表明如果万有引力定律在最初被人提出来的时候即使具有很小的概率,它不久就几乎成了带有必然性的东西。但是它却丝毫不能帮助我们估计这种最初的概率,因此即使它真,也不能为我们从观察到理论中间所做的理论性质的推理提供稳固可靠的基础。
另外,上面这种论证由于以下的事实也可以受到人们的反对,即万有引力定律并不是使人预料海王星在它原来的地点出现的唯一定律。假定万有引力定律在时间t 以前一直为真,这里t 是发现海王星之后的任何一个时刻;那么我将仍然有q/p’h=1,这里p'表示认为这个定律只是到t 以前一直为真的假设。所以我们有比纯粹机会或者纯粹机会和波得定律加起来更多的理由来预料海王星的发现。这个定律直到那时一直为真这件事已经成为具有很大概然性的事情。推论它在将来有效就需要一个绝不能从数学的概率论中推导出来的原理。这种想法破坏了建设一般理论的归纳论证的全部力量,除非这种论证受到某种类似人们所认为的自然的齐一性的原理的支援。在这里我们又一次看到归纳需要某种超出逻辑范围、不依靠经验的普遍原理的支持。
D.莱新巴哈的理论
莱新巴哈的概率论的特点在于归纳就包含在概率的定义之中。这个理论有如下述(略加简化):
已知一个统计上的系列——例如生死统计上的系列——并且已知包含该系列中某些分子的部分重合的两个类a 和B,我们常常发现当项目数大时,a的分子为B 的分子的百分数大体上保持不变。假定当项目超过了比方说10,000 时,人们发现记录下来的a 为B 的比例永远不能大大超过或不及m/n,并且这个有理分式比任何其它分式都更加接近平均观察到的比例。这样我们就“假定”不管这个系列怎样扩展,比例将永远接近M/n。我们把一个a 为一个B 的概率定义为在观察次数无限增加时观察到的频率的极限,借着我们的“假定”,我们认为这个极限是存在的并且就在m/n 的邻域中,这里m/n是可能得到的最大实例中所观察到的频率。
莱新巴哈明确断言任何命题都不带必然性;所有命题都只具有不同程度的概然性,并且每个概率都是一个频率的极限。他承认,根据这种理论,计算频率所用的那些项目本身也只具有概然性。拿死亡率作例来看:当我们判断一个人死了之后,他可能仍然活着;因此死亡统计中每一项都是可以怀疑的。根据定义,这就表示一次死亡的记录一定是一系列记录当中的一个,而这个系列中有些记录是正确的,有些则是错误的。但是那些我们认为正确的记录也只具有概然的正确性,并且必定是某种新的系列的分子。这一切他都承认,但是他说到了某个阶段我们就结束了这种无止境的后退,而采取一种他所谓的“盲目假定”①。一个“盲目假定”是认某个命题为真的一次决定,尽管我们并没有这样做的充分理由。
① 《经验与预测》,第401 页。
在这个理论中有两种“盲目的假定”,也就是:(1)在这个统计系列中我们选取当作基本项目的那些最终项目;(2)认为在有限次数的观察中发现的频率,不管观察次数怎样增加,大体上会保持不变的那个假定。莱新巴哈认为他的理论是完全属于经验范围的,因为他并不断言他的“假定”为真。
我现在并不是要研究莱新巴哈的一般理论,这种理论已经在前面一章里谈论过。我现在要研究的只是他关于归纳的理论。他的理论的要点是:如果他的归纳假定为真,那么预测就是可能的,否则预测就是不可能的。因此我们唯一能够得到支持一种预测而不是另一种预测的概率的途径就是设想他的假定为真。我并不是想否认要得到支持预测的概率就需要某种假定,我想否认的是所需要的那种假定就是莱新巴哈的假定。
他的假定是:已知a 和B 两个类,并且已知a 的实例是按照时间顺序排好的,如果我们在观察了充分数目的a 之后,发现a 为B 的比大体上永远是m/n,那么不管以后可能观察到多少个a 的实例,这个比例将仍然继续保持下去。
我们首先看到这个假定仅仅在表面上比那个应用到所有观察到的a 都是B 的情况上的假定具有更大的普遍性。因为在莱新巴哈的假设中由a 组成的系列的每一段落都具有大约M/n 的分子为B 的性质,并且我们可以把那个比较狭义的假定应用到这些段落上去。因此我们可以只研究那个比较狭义的假定。
因此莱新巴哈的假定和下面的话意义相同:在我们观察了大量的a,并且发现所有的a 都是B 之后,我们就将假定所有的a 几乎可以都是B。这个假定对于概率的定义,以及一切科学预测来说都是必要的(他这样认为)。
我认为这个假定可以证明是错误的。假定a1,a2,……an是已经观察过并且发现是属于某一类B 的a 的分子。假定an+1 是要观察到的下一个a。如果它是一个B,那么把不包括an+1 在内的由B 组成的类来代替B。对于这个类来说,这种归纳就无能为力。这种论证显然还可以推广。由此可以看出,如果要让归纳具有正确有效的机会,a 和B 就不能是任意的类,而必须是具有某些性质或关系的类。我的意思并不是说X 和B 之间存在着一种适当关系时归纳就一定正确有效,我只是说在这种情况下归纳可能正确有效,而就它的一般形式来讲,它却可以证明是错误的。
a 和B 一定不是可以叫作“制造出来”的类,这一点似乎是明显的。我想把上面出现的不包括an+1 在内的B 叫作一个“制造出来”的类。广义来讲,我所说的一个“制造出来”的类是一个通过说出某某一项是或不是它的一个分子而得出至少是它的一部分定义的。这样,“人类”就不是一个制造出来的类,但是“不包括苏格拉底在内的全部人类”却是一个制造出来的类。如果以a1,a2,……an+1是a 的最先观察到的n+1 个分子,那么a1,a2,……an就具有不是an+1 的性质,但是我们一定不能用归纳的方法推论出an十1具有这种性质,不管n 可能有多么大。a 和B 这些类必须通过内包,而不是通过说出它们的分子来得到定义。任何为归纳提供合理根据的关系一定是一种概念的关系,并且由于不同的概念可能给同一个类下定义,所以可能出现一对在归纳上相关并分别替a 和B 下定义的概念,而另外一些成对的概念虽然也替a 和B 下定义,在归纳上却不相关。例如,我们可以根据经验推论出无羽毛的两足动物是有死的,但却不能推论出地球上居住的理性动物是有死的,尽管存在着这两个概念碰巧替同一个类下定义这件事实。
数理逻辑就它迄今为止的发展来看,是以尽可能做到外延的处理为其目的的。也许这是一个多少带有偶然性的特点,来自算术对于逻辑学家的思想和意图所产生的影响。与此相反,归纳的问题却要求做到内包的处理。固然在一个归纳推论中出现的a 和B 这些类,就观察到的实例a1,a2,an来讲,是以外延方式表达出来的,但是超过了这一点,重要的却是这两个类直到现在只以内包方式表达出来。举例来说,a 可能是血液中有某些杆状菌的那一类人,而B 则可能是出现某些症状的那一类人。归纳的最重要的性质就是人们事先并不知道这两个类的外延。在实际应用上,我们认为某些归纳值得证实,而另外一些归纳则不值得证实,我们还似乎受着一种对于很可能具有联系的那些种类的内包的觉察力的引导。
因此莱新巴哈的归纳假定不仅过于广泛而且还太偏重外延。如果莱新巴哈的假定不想成为可以证明是错误的东西,我们就需要有某种范围较窄和偏重内包的假定。
我们对于莱新巴哈关于不同等级频率的理论还要谈论一下,这些不同等级频率最后导致一组“盲目假定”的概率。这是和他认为在逻辑中应该用概卒来代替真理的学说分不开的。让我们通过一个实例来看这个理论,比方说一个六十岁的英国人在一年内死去的机会。
第一阶段是简单明白的:把文件上的记载当作完全正确的东西,然后以总人数去除去年死去的人数。但是我们现在记得统计中每一个项目都可能是错误的。为了计算这个概率,我们必须得到某组经过仔细研究的类似的统计,并且发现其中所含错误的百分比。我们还记得那些认为他们发现错误的也可能弄错,于是我们就开始去统计关于错误的错误。在这种后退的某一阶段我们势必停顿下来;不管我们在什么地方停顿下来,我们习惯上总会给它一种“分量”,这种分量人们认为大概不是必然性就是我们猜想在后退的下一阶段会出现的那种概率。
作为一种认识论来看,这种方法有着许多可以反对的理由。
首先,在后退中靠后的阶段通常比靠前的阶段要困难和不确定得多;我们不大可能,比方说,在对于官方统计的错误所作的估计上,达到官方统计本身所达到的正确性。
其次,那些我们必须当作出发点的盲目假定是一种想使心灵与肉体两个世界取得调和的努力:盲目假定要完成的任务就是数据在我的体系中所要完成的任务,数据可能是错误的,但是莱新巴哈想通过把它们叫作“假定”而逃避开认它们为“真”所承担的责任。在选择一个假定而不是另一个假定的时候,除了他认为这个假定更有可能为“真”以外,我看不出还有什么别的理由;并且因为,照他自己的话来讲,这并不表示(当我们处在盲目假定这个阶段时)存在着使这个假定具有概然性的某种已知的频率,所以他才不得不凭借频率以外的某种其它标准来挑选假设。他并没有告诉我们这可能是什么东西,因为他并没有觉察出它的必要性。
第三,如果我们为了结束无止境的后退而抛弃盲目假定完全属于实用方面的需要,并且从纯粹理论方面观察莱新巴哈的概率可能表示的意思,我们就会感到自己陷进了难以解决的复杂情况之中。在第一等级,我们说一个a将为一个B 的概率是m1/n1;在第二等级,我们对于这个陈述给予概率m2/n2,这是通过使这个陈述作为某一系列类似陈述当中的一个陈述而得到的;在第三等级,我们对于认为有一个概率m2/n2支持我们的第一个概率m1/n1的那个陈述给予概率m3/n3;这样一直继续下去。如果我们能够完成这种无止境的后退的话,那么支持我们最初估计m1/n1的最后的概率会是一个无限乘积
m2 m3 m4
——·——·—— ……
n2 n3 n4
而我们可以预料这个乘积为零。因此看来在选择第一等级上概然性最大的估计时,我们几乎肯定是会错的;但是一般来说这仍然是我们可以得到的最精确的估计。在“概然的”定义中就存在的这种无止境的后退是今人难以接受的。如果我们想避免这种无止境的后退,我们就必须承认我们原来统计中每个项目不是真便是伪,并且承认我们得到的第一个概率的值m1/n1 不是对便是错;事实上我们对于概然性判断必须和对其它判断一样完全使用真—或—伪这种二分法。详尽来讲,莱新巴哈的立场有如下述:
有一个命题p1,比方说“这个a 是一个B”。
有一个命题P2,说p1具有概率x1。
有一个命题p3,说P2具有概率X2。
有一个命题p4,说p3具有概率x3。
这个系列是无尽止的,并且导致(人们要这样认为)一个极限命题,只有对这个命题我们才有权力加以肯定。但是我却看不出怎样才能把这个极限命题表达出来。困难在于:就这个系列中所有先于它的分子来说,根据莱新巴哈的原理,我们没有理由认为它们为真的可能性比为伪的可能性大;事实上它们并不具有我们可以估计的概率。
我的结论是:想不用“真”和“伪”这些概念的努力是个失败,并且概然性的判断和其它判断并没有本质上的不同,而是同样包含在完全的真—伪二分法的范围之内。
E.结论
自从休谟以来,在科学方法的讨论中归纳一直起着非常重大的作用,所以弄清楚上面的论证所得出的结论(如果我没有弄错的话)是很重要的。
第一:数学的概率论并没有任何东西可以使我们有理由认为不管是一个特殊归纳还是一个普遍归纳具有概然性,不管有利于它的实例的确定数目有多么大。
第二:如果对于一个归纳中所涉及的A 和B 这些类的内包定义的性质不如什么限制,那么我们就能证明归纳原理不仅可以怀疑而且是虚妄的。这就是说,已知某一个类A 的n 个分子属于另外某一个类B,那么使A 的下一个分子不属于B 的那些“B”的值比起使下一个分子属于B 的值更多,除非n不太小于宇宙中事物的总数。
第三:在一般所谓的“假言归纳”中,由于迄今为止所有它的观察到的后果都得到证实而使我们认为某一普遍理论具有概然性,这种归纳与单纯列举的归纳并没有什么重要的不同。因为如果P 是所说的那种理论,A 是由有关现象组成的类,而B 是由P 的后果组成的类,那么P 和“所有的A 都是B”就具有相同的意思,P 的证据就是通过单纯列举得到的。
第四:如果一个归纳论证可以正确有效的话,那么归纳原理的叙述就必须加上某种迄今尚未发现的限制。在实际应用上,科学的常识在各种不同的归纳面前畏缩不前,这一点我认为是对的。但是那种指导科学的常识的东西到现在却一直没有得到明确的表述。
第五:如果科学的推理一般来说正确有效的话,它们之所以正确有效必然是借助于自然界的某个或某些定律,而这个或这些定律说出了现实世界的一种或几种综合性质。肯定这类性质的一些命题的真实性靠着来自经验的论证是连概然性也得不到的,因为这类论证一旦超出了迄今记载下来的经验的范围,它们的正确性就要依靠我们所说的那些原理。
这些原理是什么,并且如果有意义的话,那么又是在什么意义上。我们能够名符其实地认识这些原理,仍然是有待我们探讨的问题。
【第六部分 科学推理的公设】