图5.8三碰撞。最后的行为关键地决定于哪两球先碰撞,这样使得结果不连续地依赖于起因。这有点使人不满意,我们也许会更喜欢点粒子的图像。但是,为了避免某些点粒子模型引起的理论困难(当两个粒子撞到一起时出现的无限大力和无限大能量),人们必须做其他假设,诸如在短距离时粒子的相互作用力变成非常强的排斥力等等。在这种情形下,我们可以保证任何一对粒子实际上都不会碰撞到一起。(这也使我们避免了它们碰撞时的点粒子如何行为的问题!)然而,为了直观起见,我宁愿完全按照刚球模型来讨论。看来这种“撞球”图像正是大多数人下意识的实体的模型。
牛顿5撞球的实体模型(不管多碰撞问题)确实是一个决定论模型。
此处“决定论”的含义是:所有球(为了避免某些麻烦,假定为有限个)
在将来(或过去)的物理行为数学地被某一时刻的位置和速度所完全决定。这样看来,在这个撞球的世界上根本没有余地让“精神”用“自由意志”的行动去影响物体的行为。我们如果还信仰“自由意志”的话,就要被迫对实际世界的如此构成方式提出质疑。这个令人烦恼的“自由意志”问题一直徘徊在这整部书的背景里――虽然在多数情况下,我必须说只在背景里。在本章后头有一个很小却很奇特的地方牵涉到它(关于相对论中超光速讯号传递的问题)。我将在第十章直接着手自由意志的问题。读者一定会对我的结果深感失望。我的确相信,这里存在一个真正的、而非想象的问题。但它是非常根本的,并且要把它表述清晰非常困难。物理理论中的决定论是一个非常重要的问题,但是我相信这只是问题的一部分。例如,这个世界很可能是决定性的,但同时却是不可计算的。这样,未来也许以一种在原则上不能计算的方式被现在所决定。我将在第十章论证,我们具有意识的头脑的行为的确是非算法的(亦即不可计算的)。相应地,我们自信所具备的自由意志就必然和制约我们在其中生活的世界的定律中某些不可计算部分紧密地纠缠在一起。是否接受这样的关于自由意志的观点,亦即给定的物理(例如牛顿)理论,是否的确是可计算的,而不仅仅是否是决定性的,是一个有趣的问题。可计算性不同于决定性――这正是我试图在本书所要强调的。撞球世界中的生活是可计算的吗?我现在使用一个决定性的、但不可计算的“玩具宇宙模型”,来解释可计算性和决定性是不同的。我承认这是一个人为的特别例子。宇宙任何“时刻”的“态”可用一对自然数(m,n)来表示。用 Tu表示一台固定的普适图灵机,譬如在第二章(63页)定义的那一台。为了决定下一“时刻”宇宙的态,我们必须知道Tu在m上的作用最终停止不或不停(亦即用第二章65页的记号,Tu(m)≠□还是Tu(m)=□成立)。如果它停止,则下一时刻的态为(m+1,n)。如果它不停止,则为(n+1,m)。从第二章我们知道,不存在图灵机停止问题的算法。这样就不存在去预言这个模型宇宙“将来”的算法,尽管它是完全决定性的6!当然,这不能认为是一个严肃的模型。但它表明存在一个要回答的问题。我们可对任何决定性的物理理论考察其可计算性。那么,牛顿的撞球世界究竟是否可计算的呢?
物理可计算性的问题部分地依赖于我们打算对此系统问哪一种问题。
在牛顿撞球模型中,我能想到一些可以问的问题,我对这些问题的猜测是,要弄清其答案不是一个可计算(亦即算法的)事体。球 A和球B究竟会碰撞否便是这样的一个问题。其思路是,在某一特定时刻(t=O)所有球的位置和速度作为初始数据给定后,我们要知道,A和B是否会在将来的任一时刻(t>O)碰撞?为使这个问题更明确(虽然不是特别现实),我们可以假定,所有球的半径和质量都一样,并且每一对球之间的作用力是反平方律的。我之所以猜想这是非算法可解的问题的一个原因是,该模型有点像爱德华?弗列得钦和托马索?托弗里在1982年提出的“计算的撞球模型”。在他们的模型中,球被若干堵“墙”所限制(而不是反平方律的力);但是它们互相以类似于我刚描述过的牛顿球那样弹性反弹(见图5.9)。在弗列得钦――托弗里模型中,所有电脑的基本逻辑运算都可由球来实现。我们可以模拟图灵机的任何计算:对图灵机Tu的特别选取规定了弗列得钦――托弗里机器的“墙”等等的搭配;运动的球的初态可认为是输入磁带的信息的码,将球的终态解码就得到图灵机输出磁带的信息。这样一来,人们会特别关心这样一个问题:如此这般的图灵机会有停止之时吗?“停止”的是意味着球A最终和球B碰撞。我们已知这个问题不能用算法回答(71页),这事实至少暗示我前面提出的“球A最终和球B碰撞吗?”的牛顿问题也不能用算法回答。事实上,牛顿问题比弗列得钦和托弗里提出的问题要棘手得多,后者可依照分立变数(亦即按照诸如“球或者在通道上或者不在”的“在或不在”的陈述)来指明其状态。但在完整的牛顿问题中必须以无限的精度,按照实数的座标而不是以分立的方式指明球的初始位置和速度。这样,我们又面临着在第四章处理关于孟德勒伯洛特集是否可递归的问题时所必须考虑的所有麻烦。当允许输入和输出数据为连续变化的变数时 “可计算性”的含义是什么呢7?我们可以暂时假定所有初始位置和速度座标均为有理数(虽然不能预料在t的时刻以后的有理数仍保持为有理数),而使此问题变得稍为缓和。我们知道有理数为两整数的比,所以为一可列集。我们可用有理数来任意地逼近所选择用来考察的任何初始数据了。对于有理数的初始数据,也许不存在决定A和B是否最终会碰撞的算法的猜测决不是毫无道理的。图5.9弗列得钦――托弗里撞球电脑中的一个“开关”(由A?雷斯勒提出的)。如果一个球进入B,则是否有一个球接着从D或E出来,得看是否另一球进入A中(假定A和B的同时进入)。
然而,这并不是诸如“牛顿撞球世界是不可计算的”断言的真正含义。
我用来和我们的牛顿撞球世界作比较的弗列得钦――托弗里“撞球电脑”
的特殊模型的确按照计算而进行。无论如何,这是弗列得钦和托弗里思想的基本点――他们模型的行为应该和一台(普适)电脑一样!我试图要提的问题是,在某种意义上,人类大脑驾驭适当的“不可计算的”物理定律,能比图灵机做得更好,这一点是不是可以理喻的。追究如下的问题将是徒劳的:
“如果球A永远碰不到球B,则你的问题的答案为‘非’。”
人们可能永远也等待不到断定问题中的球不会碰到一起的时刻!那当然正是图灵机行为的方式。事实似乎很清楚地表明,牛顿撞球世界在某个合适的意义上(至少在如果我们不管多碰撞的问题之时)是可计算的。人们通常计算这种行为的方法是做一些近似。我们可以想象这些球的中心被指定在点的网格上,譬如讲网格的点被划分到百分之几单位。时间也被认为是“分立”的,所有可允许的时刻是某一小单位(用△t表示)的倍数。这就产生了一定的“速度”的可允许的分立值(两个连续允许的格点的位置的座标值的差,除以△t)。利用力的定律来计算加速度的适当的近似,再利用它使“速度”并因此下一允许时刻的新的格点位置被确定到所需要的近似程度。只要我们能维持所需的精度,则这种计算就可一直进行下去。很有可能算不了多少次其精度就失去了。以后的步骤是从更细的空间分格,以及更细的时间间隔重新开始。这一回能得到更好的精度,并在精度损失之前能计算到更久的将来的某一时刻。不断地增加细度,则计算的精度和所到达的将来的时间的长度就能不断地改进。可用这种方法将牛顿撞球世界计算到任意高的精度(不管多碰撞的问题)――我们可以在这种意义上讲牛顿世界的确是可计算的。
然而,认为这一个世界在实际上是“不可计算的”断言是具有某种含义的。这是因为得知的初始数据的精度总是受限制的。这类问题的确存在着固有的不可忽视的“不稳定性”。初始数据的极为微小的改变会导致结果行为的绝大的变化。(任何玩撞球的人,在他想用一个球去撞另一个使之落入球囊时,都知道我这样说的意思!)这在(连续)碰撞发生时尤其明显。但是,这种不稳定性行为也会发生在牛顿的引力远距离作用时(多于两体的情况下)。所谓的“混沌”或“混沌行为”经常用来表示这种不稳定的类型。例如,混沌行为对天气影响重大。虽然我们对控制基本元素的牛顿方程式了解甚多,但是远期天气预报之不可靠性则是臭名昭彰的!这根本不是那类可以任何方式驾驭的“不可计算性”。这只是因为所知的初始态的精度有限,而终态不能由初态可靠地算出。实际上只是随机因素被引入到未来的行为中而已。如果大脑的确使用了物理定律中的不可计算性的有用的因素,则它们必须具有完全不同的、并从这里引出更正面得多的特性。相应地,我根本不把这种“混沌”行为称为“不可计算性”,而将其称为“不可预见性”。正如我们很快就会看到的,在(经典)物理学中的决定性的定律中存在不可预见性,是一种非常一般的现象。在制造思维机器时,不可预见性正是我们希望尽量减小而不是去 “驾驭”的东西!为了更一般地讨论可计算性和不可预见性的问题,对物理定律采用比以前更广泛的观点将会更有助。这就促使我们不仅只考虑牛顿力学的理论,而且研究随后超越过它的各种理论。我们需要领略力学的美妙的哈密顿形式。哈密顿力学牛顿力学不仅在于非凡地应用到物理世界方面,而且在于它所引起的数学理论的丰富方面取得瞩目的成功。令人惊异的是,自然界所有超等理论都被证明是数学观念的丰富来源。这些绝顶精确的理论就作为数学而言也是极富成果的,这个事实具有一种深刻和美丽的神秘。它毫无疑问地表明,在我们经验的实在世界和柏拉图的数学世界之间有某种根本的关联。
(我将在第十章495页再讨论这一些。)牛顿力学也许是这方面的一个顶峰,因为它一诞生即获得了微积分。而且,牛顿理论形成了非凡的称为经典力学的数学观念的实体。十八和十九世纪许多伟大数学家的名字都和此发展相关联:欧拉、拉格朗日、拉普拉斯、刘维尔、泊阿松、雅科比、奥斯特洛夫斯基、哈密顿。被称为“哈密顿理论”8的即为这一工作的总结。为了我们的目的对其稍微了解即可以了。威廉姆?罗曼?哈密顿(1805―1865)是一位多才多艺和富有创见的爱尔兰数学家,他还是在165页讨论过的哈密顿线路的发明者。他把力学发展成强调其与波传播相类似的形式。波和粒子的关系的暗示,以及哈密顿方程的形式对于后来的量子力学的发展极为重要。我在下一章还会提及。
用以描述物理系统的“变量”是哈密顿理论的一个奇妙的部分。迄今为止,我们一直把粒子的位置当作基本的,而速度作为位置对时间的变化率。我们记得在牛顿系统中为了确定随后的行为,必须指定初始态(192页),也就是需要所有粒子的位置和速度。在哈密顿形式中,我们必须挑选粒子的动量,而不是速度。(我们在190页提到粒子动量是速度和质量的乘积。)这种改变似乎很微不足道,但是重要的在于每一粒子的位置和动量似乎被当作独立的量来处理。这样,人们首先“假装”不同粒子的动量和它所对应的位置的改变率没有什么关系,而仅仅是一组分开的变量。我们可以想像它们“可以”完全独立于位置的运动。现在在哈密顿形式中我们有两族方程。有一族告诉我们不同粒子的动量如何随时间变化,另一族告诉我们位置如何随时间变化。在每一种情况下,变化率总是由在该时刻的不同位置和动量所决定。粗略地讲,第一族哈密顿方程表述了牛顿的关键的第二运动定律(动量变化率=力),而第二族方程告诉我们动量实际上即是依赖于速度(位置变化率=动量÷质量)。我们记得,伽利略――牛顿的运动定律是用加速度,即位置变化率之变化率(亦即“二阶”方程)来描述。现在,我们只需要讲到事物的变化率(“一阶”方程),而不是事物变化率的变化率。
所有这些方程都是从一个重要的量推导而来:哈密顿函数 H,它是系统的总能量按照所有位置和动量变量的表达式。哈密顿形式提供了一种非常优雅而对称的力学描述,我们在下面写出这些方程,仅仅是为了看看它们是什么样子的。虽然,甚至许多读者并不熟悉完全理解之所必须的微积分记号――它在这里是不需要的。就微积分而言,所有我们真正要理解的是,出现在每一个方程左边的点表示(在第一种情况下,动量的;在第二种情况下,位置的)对时间的变化率:pHxxHp iiii= - = ,?这里下标i用以区别所有不同的动量座标p1,p2,p3,p4,…和所有不同的位置座标x1,x2,x3,x4,…。n个不受限制的粒子具有3n个动量座标和3n个位置座标 (每一个代表空间中的三个独立的方向)。符号?表示 “偏微分”(“在保持其他变量为常数的情况下取导数”)。正如前述的,H为哈密顿函数。(如果你不通晓“微分”,不必担心。只要认为这些方程的右边是某些定义完好的,以xi和pi来表达的数学式子就行了。)在实际上,座标x1,x2,…和p1,p2,…可允许为某种比粒子通常的笛卡尔座标(亦即xi为通常的沿三个不同的相互垂直的方向测量的距离)更一般的东西。例如座标xi中的一些可以是角度(在这种情形下,相应的pi就是角动量,而不是动量,参见190页),或其他某些完全一般的测度。令人惊异的是,哈密顿方程的形状仍然完全一样。事实上,合适地选取H,哈密顿形式不仅仅是对于牛顿方程,而且对任何经典方程的系统仍然成立。对于我们很快就要讨论的马克斯韦(――洛伦兹)理论,这一点尤其成立。哈密顿方程在狭义相对论中也成立。如果仔细一些,则广义相对论甚至也可并入到哈密顿框架中来。此外,我们将要看到在薛定谔方程(332页)中,哈密顿框架为量子力学提供了出发点。尽管一世纪以来构的形式却是如此地统一,这真是令人惊叹!相空间哈密顿方程的形式允许我们以一种非常强而有力的一般方式去“摹想”经典系统的演化。想象一个多维“空间”,每一维对应于一个座标x1,x2,…p1,p2,…(数学空间的维数,通常比3大得多。)此空间称之为相空间(见图5.10)。对于n个无约束的粒子。相空间就有6n维(每个粒子有三个位置座标和三个动量座标)。读者或许会担心,甚至只要有一个单独粒子,其维数就是他或她通常所能摹想的二倍!不必为此沮丧!
尽管六维的确是比能明了画出的更多的维数,但是即使我们真的把它画出也无太多用处。仅仅就一满屋子的气体,其相空间的维数大约就有10 000 000 000 000000000000 000 000去准确地摹想这么大的空间是没有什么希望的!既然这样,秘诀是甚至对于一个粒子的相空间都不企图去这样做。只要想想某种含糊的三维(或者甚至就只有二维)的区域,再看看图5.10就可以了。图5.10相空间。相空间的单独点Q表明某一个物理系统的整个态,包括其所有部分的瞬态运动。我们如何按照相空间来摹想哈密顿方程呢?首先,我们要记住相空间的单独的点 Q实际代表什么。它代表所有位置座标x1,x2,…和所有动量座标p1,p2,…的一种特别的值。也就是说,Q表示我们整个物理系统,指明组成它的所有单独粒子的特定的运动状态。当我们知道它们现在的值时,哈密顿方程告诉我们所有这些座标的变化率是多少;亦即它控制所有单独的粒子如何移动。翻译成相空间语言,该方程告诉我们,如果给定单独的点Q在相空间的现在位置的话,它将会如何移动。为了描述我们整个系统随时间的变化,我们在相空间的每一点都有一个小箭头――更准确地讲,一个矢量――它告诉我们Q移动的方式。这整体箭头的排列构成了所谓的矢量场(图5.11)。哈密顿方程就这样地在相空间中定义了一个矢量场。
我们看看如何按照相空间来解释物理的决定论。对于时间t=0的初始数据,我们有了一族指明所有位置和动量座标的特定值;也就是说,我们在相空间特别选定了一点Q。为了找出此系统随时间的变化,我们就跟着箭头走好了,这样,不管一个系统如何复杂,该系统随时间的整个演化在相空间中仅仅被描述成一点沿着它所遭遇到的特定的箭头移动。我们可以认为箭头为点Q在相空间的“速度”。“长”的箭头表明Q移动得快,而“短”的箭头表明Q的运动停滞。只要看看Q以这种方式随着箭头在时间t移动到何处,即能知道我们物理系统在该时刻的状态。很清楚,这是一个决定性的过程。Q移动的方式由哈密顿矢量场所完全决定。图5.11相空间中的矢量场。它代表了按照哈密顿方程的时间演化。
关于可计算性又如何呢?如果我们从相空间中的一个可计算的点(亦即从一个其位置和动量座标都为可计算数的点,参阅第三章95页)出发,并且等待可计算的时间t,那么一定会终结于从t和初始数据计算得出的某一点吗?答案肯定是依赖于哈密顿函数H的选择。实际上,在H中会出现一些物理常数,诸如牛顿的引力常数或光速――这些量的准确值视单位的选定而被决定,但其他的量可以是纯粹数字――并且,如果人们希望得到肯定答案的话,则必须保证这些常数是可计算的数。如果假定是这种情形,那我的猜想是,答案会是肯定的。这仅仅是一个猜测。然而,这是一个有趣的问题,我希望以后能进一步考察之。
另一方面,由于类似于我在讨论有关撞球世界时简要提出的理由,对我来说,这似乎不完全是相关的问题。为了使一个相空间的点是不可计算的断言有意义,它要求无限精确的座标――亦即它的所有小数位! (一个由有限小数描述的数总是可以计算的。)一个数的小数展开的有限段不能告诉我们任何关于这个数整个展开的可计算性。但是,所有物理测量的精度都是有限的,只能给出有限位小数点的信息。在进行物理测量时,这是否使“可计算数”的整个概念化成泡影?”
的确,一个以任何有用的方式利用某些物理定律中(假想的)不可计算因素的仪器不应依赖于无限精确的测量。也许我在这里有些过分苛刻了。假定我们有一台物理仪器,为了已知的理论原因,模拟某种有趣的非算法的数学过程。如果此仪器的行为总可以被精密地确定的话,则它的行为就会给一系列数学上有趣的没有算法的(像在第四章中考虑过的那些)是非问题以正确答案。任何给定的算法都会到某个阶段失效。而在那个阶段,该仪器会告诉我们某些新的东西。该仪器也许的确能把某些物理常数测量到越来越高的精度。而为了研究一系列越来越深入的问题,这是需要的。然而,在该仪器的有限的精度阶段,至少直到我们对这系列问题找到一个改善的算法之前,我们得到某些新的东西。然而,为了得到某些使用改善了的算法也不能告诉我们的东西,就必须乞求更高的精度。尽管如此,不断提高物理常数的精度看来仍是一个棘手和不尽人意的信息编码的方法。以一种分立(或“数字”)形式得到信息则好得多。如果考察越来越多的分立单元,也可重复考察分立单元的固定集合,使得所需的无限的信息散开在越来越长的时间间隔里,因此能够回答越来越深入的问题。(我们可以将这些分立单元想象成由许多部分组成,每一部分有“开”和“关” 两种状态, 正如在第二章描述的图灵机的0和1状态一样。)为此看来我们需要某种仪器,它能够(可区别地)接纳分立态,并在系统按照动力学定律演化后,又能再次接纳一个分立态集合中的一个态。如果事情是这样的话,则我们可以不必在任意高的精度上考察每一台仪器。那么,哈密顿系统的行为确实如此吗?某种行为的稳定性是必须的,这样才能清晰地确定我们的仪器实际上处于何种分立态。一旦它处于某状态,我们就要它停在那里(至少一段相当长的时间),并且不能从此状态滑到另一状态。不但如此,如果该系统不是很准确地到达这些状态,我们不要让这种不准确性累积起来;我们十分需要这种不准确性随时间越变越小。我们现在设想的仪器必须由粒子(或其他子元件)所构成。需要以连续参数来描述粒子,而每一个可区别的“分立”态复盖连续参数的某个范围。(例如,让粒子停留在二个盒子中的一个便是一种表达分立双态的方法。为了指明该粒子确实是在某一个盒子中,我们必须断定其位置座标在某个范围之内。)用相空间的语言讲,这表明我们的每一个“分立”的态必须对应于相空间的一个“区域”,同一区域的相空间点就对应于我们仪器的这些可选择的同一态(图5.12)。图5.12相空间中的一个区域对应于所有粒子位置和动量的可能值的一个范围。这样的区域可代表某仪器一个可区别态(亦即“选择”)。图5.13随着时间的演化,相态区域Rt沿着矢量场被拖到一个新区域Rt。这可表示我们仪器的某一特定选择的时间演化。现在假定仪器在开始时的态对应于它的相空间中的某一个范围R0。我们想象R0随着时间沿着哈密顿矢量场被拖动,到时刻t该区域变成Rt。在画图时,我们同时想象对应于同一选择的所有可能的态的时间演化(见图5.13)。关于稳定性的问题(在我们感兴趣的意义上讲)是,当 t增加时区域Rt是否仍然是定域性的,或者它是否会向相空间散开去。如果这样的区域在时间推进时仍是定域性的,我们对此系统就有了稳定性的量度。在相空间中相互靠近的点(这样它们对应于相互类似的系统的细致的物理态)将继续靠得很近,给定的态的不准确性不随时间而放大。任何不正常的弥散都会导致系统行为的等效的非预测性。
我们对于哈密顿系统可以一般地说什么呢?相空间的区域究竟是否随时间散开呢?似乎对于一个如此广泛的问题,很少有什么可说的。然而,人们发现了一个非常漂亮的定理, 它要归功于杰出的法国数学家约瑟夫?刘维尔(1809―1882)。该定律讲,相空间中的任何区域的体积在任何哈密顿演化下必须保持常数。(当然,由于我们的相空间是高维的,所以“体积”必须是在相应高维意义上来说的。)这样,每一个R1的体积必须和原先的R0的体积一样。初看起来,这给了我们的稳定性问题以肯定的答案。
在相空间体积的这层意义上,我们区域的尺度不能变大,好像我们的区域在相空间中不会散开似的。然而,这是使人误解的。我们在深思熟虑之后就会感到,很可能情况刚好与此相反!在图5.14中我想表示人们一般预料到的那种行为。我们可以将初始区域R0想象成一个小的、“合理的”,亦即较圆的而不是细长的形状。这表明属于R0的态在某种方面不必赋予不合情理的精确性。然而,随着时间的发展,区域R1开始变形并拉长――初看起来有点像变形虫,然后伸长到相空间中很远的地方,并以非常复杂的方式纠缠得乱七八糟。体积的确是保持不变,但这个同样小的体积会变得非常细,再发散到相空间的巨大区域中去。这和将一小滴墨水放到一大盆水中的情形有点类似。虽然墨水物质的实际体积不变,它最终被稀释到整个容器的容积中去。区域Rt在相空间中的行为与此很类似。它可能不在全部相空间中散开(那是称之为“爱哥狄克”的极端情况),但很可能散开到比原先大得极多的区域去。(可参阅戴维斯(1974)的进一步讨论。)
麻烦在于保持体积并不意味就保持形状:小区域会被变形,这种变形在大距离下被放大。由于在高维时存在区域可以散开去的多得多的“方向”,所以这问题比在低维下严重得多。事实上,刘维尔定理远非“帮助”
我们将区域Rt控制住,而是向我们提出了一个基本问题!若无刘维尔定理,我们可以摹想相空间中区域的毫无疑义的发散趋势可由整个空间的缩小而补偿。然而,这一个定律告诉我们这是不可能的,而我们必须面对这个惊人的含义――这个所有正常类型的经典动力学(哈密顿)系统的普适的特征9!
鉴于这种发散到整个相空间去的行为,我们会问,经典力学怎么可能作出预言?这的确是一个好问题。这种弥散所告诉我们的是,不管我们多么精确地(在某一合理的极限内)知道系统的初始态,其不确定性将随着时间而不断增大,而我们原始的信息几乎会变得毫无用处。在这个意义上讲,经典力学基本上是不可预言的。(回想前面考虑过的“混沌”概念)
图5.14尽管刘维尔定律告诉我们,随着时间演化相空间体积不变,但是由于该演化的极端复杂性,这个体积通常会等效地弥散开来。那么, 何以迄止为止牛顿动力学显得如此之成功呢?在天体力学中 (亦即在引力作用下的天体)其原因在于,第一,有关的凝聚的物体数目相对很少(太阳、行星和月亮),这些物体的质量相差悬殊――这样在估量近似值时,可以不必管质量更小物体的微扰效应,而处理更大的物体时,仅仅需要考虑它们相互作用的影响――第二,可以看到,适用于构成这些物体的个别粒子的动力学定律,也可以在这些物体本身上的水平上适用――这使得在非常好的近似下,太阳、行星和月亮实际上可以当作粒子来处理,我们不必去为构成天体的单独粒子的运动的微小细节去担忧10。我们再次只要考虑“很少”的物体,其在相空间中的弥散不重要。除了天体力学和投掷物行为(它其实是天体力学的一个特例)之外,只牵涉到小数目的粒子的简单系统的研究,牛顿力学所用的主要方法是根本不管这些细节的“可决定性地预言的”方面。相反地,人们利用一般的牛顿理论做模型,从这些模型可以推导出整体行为。某些诸如能量、动量和角动量守恒定律的准确推论的确在任何尺度下都有效。此外,存在可与制约单独粒子的动力学规律相结合的统计性质,它能对有关的行为作总体预言。(参阅第七章关于热力学的讨论;我们刚讨论过的相空间弥散效应和热力学第二定律有紧密的关系。我们只要相当仔细,便可利用这些观念作预言。)牛顿本人所做的空气声速的计算(1个世纪后拉普拉斯进行了微小的修正)便是一个好例子。然而,牛顿(或更笼统来说,哈密顿)动力学中固有的决定性在实际上适用的机会非常稀少。相空间弥散效应还有一个惊人的含义。它告诉我们, 经典力学不能真正地描述我们的世界!我说得有点过分了一些,但是并不太过份。经典力学可以很好地适用于流体――特别是气体的行为,在很大的程度上适用于液体――此处人们只关心粒子系统的“平均”性质,但是在对固体作计算时就出了毛病,这里要求知道更细节的组织结构。固体由亿万颗点状的粒子所组成,由于相空间弥散其排列的有序性应不断地降低,何以保持其形状大致不变呢?正如我们已经知道的,量子力学在理解固体的实在结构时是不可或缺的。量子效应可多多少少防止相空间的弥散(见第八章和第九章)。
这也和制造“计算机器”的问题相关。相空间弥散是某种必须控制的东西。相空间中对应于一个电脑的“分立”态的区域(例如前述的R0)不应允许其过度弥散开来。我们记得,甚至弗列得钦――托弗里“撞球电脑”需要某种外围的固体墙才能工作。包括许多粒子的物体的“刚性”正是需要量子力学起作用的某种东西。看来,甚至“经典”电脑也必须借助于量子物理学的效应才能有效地工作!马克斯韦电磁理论在牛顿的世界图像中,人们设想一个微小粒子靠一种超距作用的力作用到另一个粒子上。如果粒子不是完全点状的。可以认为由于偶尔的实际物理接触而互相反弹离开。正如我前面(193页)提到的,电学和磁学(古人即知道此两者的存在,威廉?吉尔伯特在1600年和本查明?佛兰克林在1752年分别进行了一些细节的研究)的行为和引力很类似。虽然同号的电荷(磁极强度)相互排斥而不是吸引,它们都以距离的反平方律衰减。这里的电磁力是由电荷(磁极强度),而不是由质量决定其强度。在这个水平上,将电学和磁学归并到牛顿理论中去并没有什么困难。光的行为也可以粗略地(虽然有某些困难)容纳进去。我们或者将光当作单独粒子(正如我们现在应称之为“光子”的那样)组成,或者把它当作某种媒质中的波的运动。在后一情况该媒质(“以太”)本身应认为是由粒子组成的。运动电荷会产生磁力的这一事实引起了额外的复杂性,但是这并没有把整个体系瓦解。大量的数学家和物理学家(包括高斯)提出了在一般牛顿框架中似乎满意的、描述运动电荷效应的方程组。第一位向这个“牛顿式” 的图像提出严肃挑战的科学家是英国伟大的实验家兼理论家米凯尔?法拉第(1791―1867)。
为了理解这个挑战的性质,我们首先要定义物理场的概念。首先考虑磁场。大部分读者都有过这样的经验,将一张纸放在磁铁上时,纸上的铁粉末具有特别的形态。这些粉末以一种令人惊异的方式沿着所谓的“磁力线”串起来。我们可以想象,即便粉末不在该处,磁力线仍在那里。它们构成了我们称之为磁场的东西。这“场”在空间的每一点都朝着一定的方向,亦即在该点力线的方向。实际上,我们在每一点都有一个矢量。这样,磁场就给我们提供了一个矢量场的例子。(我们可把它和上一节考虑的哈密顿矢量场相比较,但现在这一个矢量场是在通常的空间中,而不在相空间中。)类似地,一个带电的物体被一种称之为电场的不同种类的场所围绕;而且引力场也类似地围绕着任何有质量的物体。这些也都是空间的矢量场。
远在法拉第之前,人们就有了这些观念,它们已成为牛顿力学理论家的一部份武器。但是认为这种“场”中不包含实际物理物质的观点占优势。反之,它们被当作为某一个粒子放在不同的点时所作用的力提供一种必要的“薄记”。然而,法拉第深刻的实验发现(利用运动线圈、磁铁等等)使他坚信,电磁场是真正的“东西”,并且变化的电磁场有时会相互“排挤”到原先空虚的空间,以产生一种脱离物体的波动!他猜测到光也许就包括这类波动。这种观点背离了占统治地位的“牛顿智慧”。按照牛顿的观点,这类场不能在任何意义上被认为是“真实的”,而仅仅是作为“真正的”牛顿点粒子超距作用“实在”图像的方便的数学辅助物而已。面临着法拉第以及优秀的法国物理学家安德列?玛雷?安培(1775―1836)和其他人更早的实验发现,伟大的苏格兰物理学家兼数学家詹姆斯?克拉克?马克斯韦(1831―1879)对从这些发现产生的电磁场方程的数学形式感到疑惑。他以惊人的灵感,对这些方程作了初看起来似乎非常微小的, 但却是含义深远的改变。 这个改变根本不是由已知的实验事实 (虽然与之相协调)暗示的。这是马克斯韦理论自身所要求的结果,部分是物理学上的,部分是数学上的,还有部分是美学上的。马克斯韦方程的一个含义是电磁场的确在空虚的空间中相互“推挤”。振动的磁场产生振动的电场(这是法拉第的实验发现所隐含的)。而振动的电场又反过来产生振动的磁场(由马克斯韦理论推导得来的),并且这又接着产生电场等等。(这种波的详图见312页的图6.26和313页的图6.27。)马克斯韦能够算出这种效应在空间传播的速率――并且他发现这正是光的速率!此外,这些所谓的电磁波还展示出了很久以来就知道的于涉和令人困惑的极化性质(我们在第六章269,311页还要回到这些上来)。除了说明波长在一个特定范围(4―7×107米)的可见光的性质外,还预言了导线中电流产生的其他波长的电磁波。出色的德国物理学家亨利希?赫兹于1888年在实验上证实了这种波的存在。法拉第的富有灵感的希望在美妙的马克斯韦方程中的确找到了坚实的基础!虽然我们在这儿并不必了解马克斯韦方程的细节,稍微看看它们是什么样子的并没有什么害处:1cdivE = 4 divB = 0.
2? ,πρ,
p
EtcurlB jBtcurlE = - = - 4此处E、B和j分别为电尝磁场和电流;ρ为电荷密度,c只是一个常数,也就是光速11。不必忧虑curl及div等项,它们简单地表示不同类型的空间变化。(它们是某种相对于空间座标的偏微分算符的组合。可以回想我们在讨论哈密顿方程时遇到的用符号?表示的偏微分运算。)在前面两个方程左边出现的算符?/?t实际上和用在哈密顿方程的点一样,其不同之处只是技术性的。这样?E/?t表示电场的变化率,而?B/?t表示磁场的变化率。第一个方程①说明电场如何按照磁场和电流在该时刻的行为而变化; 而第二个方程说明磁场如何按照电场在该时刻的行为而变化。第三个方程粗略地讲是反平方律的另一种形式,它是讲(该时刻的)电场必须和电荷分布相关;而第四个方程对磁场说同样的东西,除了在这情况下没有“磁荷” (或分开的“北极”或“南极”粒子)以外。
这些方程在下面这一点和哈密顿的很相像,即依据在任何给定时刻的① 严格地讲,这仅就将其近似地认为在作匀速直线运动,尤其是没有旋转时而言。地球的旋转的确有(相对小的)可探测到的动力学效应,最显明的即是北半球和南半球的风偏折方式不同,伽利略认为海潮的起因在于这种非均匀性。电场和磁场的值,它们给出了这些量对时间的变化率。所以马克斯韦方程和通常的哈密顿理论一样是决定论的。仅有的也是一个重要的差别是,马克斯韦方程是场方程而不是粒子方程。 这表明我们需要用无限个参数去描述系统的态(空间中的每一点的场矢量),而不仅仅需要像在粒子论中的有限的数目参数(每个粒子的三个位置和三个动量座标)。因此马克斯韦理论的相空间是无限维的!(正如我以前提到过的,一般的哈密顿框架,实际上可以包容马克斯韦方程。但由于这无限的维数,该框架必须稍微推广一下12。)
马克斯韦理论为我们的物理实在的图像添加上具有根本性的新的部分。我们必须接受场自身的存在,而不能把它仅仅当作牛顿物理中的“实在”粒子的数学的附属物。在这一点上它超越了我们的原先的理论框架。
马克斯韦的确向我们指出,当场以电磁波传播时,它们自身携带一定量的能量。他还给出了这种能量的显明的表达式。从一处传播到另一处的“脱离物体”的电磁波能传递能量的这一惊人事实,最终由赫芝在实验上探测到它的存在而被证实。这个事实虽然如此惊人,而现在却变成这么熟悉的东西了。可计算性和波动方程马克斯韦能直接从他的方程推导出,在没有电荷或电流(亦即在上述方程中j=0,ρ=0)的空间区域,所有电磁场的分量必须满足一称为波动方程①的方程。由于波动方程是有关于一个单独的量的,而不是电磁场的所有六个分量的方程,所以可视作马克斯韦方程的“简写”。它的解表现了类似波动的行为,并牵涉到诸如马克斯韦理论的“极化”(电场矢量的方向,见311页)等等其他复杂性。
因为波动方程及其可计算性的关系已被清楚地研究过,所以我们对它格外有兴趣。事实上,玛利安?玻依堪?玻―埃勒和因?里查德(1979,1981,1982,还可参阅1985)指出,尽管波动方程在平常的意义上具有决定性的行为,――亦即初态数据一被提供,则其他时刻的解即被决定――还存在某种古怪类型的可计算的初始数据,它使得在以后可计算的时刻被决定的场的值实际上是不可计算的。这样,此一似是而非的物理场论的方程(虽然不完全是在我们世界中实际成立的马克斯韦方程)会在玻―埃勒和里查德的意义上产生不可计算的演化!这结果在表面上似乎相当令人震惊――这看来和我在上一节的猜测相抵触,除了那时人们关心的是“合理的”哈密顿系统的可能的可计算性以外。然而,玻―埃勒和里查德结果固然是惊人的并和数学有关系,它和猜测的冲突并没有什么真正的物理意义。原因在于,他们“古怪”的初始数据不以一种通常人们对物理上有意义的场所要求的方式而“光滑地改变”
13玻―埃勒和里查德实际上证明了,如果我们不容许这一类场,则不会产生不可计算性。无论如何,甚至如果允许这类场,很难想象任何物理“仪器”(诸如人脑?)能利用这样的“不可计算性”。这只有当允许作任意高精度的测量时才相干。但正如我说过的,这在物理上不是非常现实的,尽管如此,玻―埃勒和里查德的结果代表了一个重要研究领域的美妙开端,迄今这个领域还很少被研究过。① 电和磁之间的不同在于单独“磁荷” (亦即北极或南极)似乎不能在自然中分开存在,磁粒子被称作“偶极子”,亦即微小的磁铁(北极和南极连在一起)。洛伦兹运动方程;逃逸粒子马克斯韦方程本身还不是一个完整的方程组。如果给定了电荷和电流的分布,则它们提供了电磁场传播方式的美妙的描述。在物理上,这些电荷主要是我们知道的电子和质子等带电粒子,而电流是由这种粒子的运动所引起的。如果我们知道这些粒子在何处并如何运动,则马克斯韦方程告诉我们电磁场会如何行为。该方程并没有告诉我们这些粒子自身如何行为,此问题的部分答案在马克斯韦年代即已经知道,但直到1895年杰出的荷兰物理学家亨德里克?安东?洛伦兹利用与狭义相对论有关的思想去推导现在称之为带电粒子的洛伦兹运动方程后(参阅威塔克(1910)310页,395页),才得到了令人满意的方程组。这些方程告诉我们带电粒子的速度如何因所处的电磁场的影响而连续地改变14。把洛伦兹方程和马克斯韦方程相联立,人们便能同时得到带电粒子的电磁场的时间演化的规则。
然而,这一套方程并非一切都相安无事。如果一直到粒子的自身的直径的尺度之下(电子的“经典半径”大约为10-15米)场都是非常均匀的,而且粒子运动也不过分激烈的话,则它们给出了极好的结果。但此处存在一个原则上的困难,在其他情况下它会变得重要起来。洛伦兹方程要我们去做的是考察带电粒子所在处的准确的那一点的电磁场(并且实际上提供了该点的“力”)。如果粒子是有限尺度的,则那一点应如何选取呢?是否我们应取粒子的“中心”,或是对表面上所有点的场(“力”)取平均?
如果场在粒子尺度下不是均匀的,则这就产生了差异。还有更严重的问题:粒子表面(或中心)的场究竟如何?记住我们考虑的是一个带电的粒子。 粒子本身引起的电磁场必须叠加到粒子所处的地方的 “背景场”上去。
粒子的自身场在靠近“表面”处变得极强,并且轻而易举地糟塌它附近的所有其他的场。而且,围绕着自身的粒子场会多多少少地指向外面(或内面)。这样粒子所要反应的总的实际场根本不是均匀的,在粒子“表面”的不同地方指向不同的方向,更不要说它的“内部”了(图5.15)。现在我们必须开始忧虑,互异的作用到粒子上的力是否使之旋转或变形,我们必须知道它的弹性性质等等(并且这里还有一个和相对论有关的特别有疑问的问题,我先不在此烦恼读者)。显然,这个问题比初看时复杂得多。图5.15我们要如何严格地应用洛伦兹运动方程?由于自己的场在粒子的位置处起主导作用,作用在它上面的力不能简单地从该粒子所处地方的场得到。