也许我从一开始就把粒子当作点粒子会更好些。但这会导致另一类问题,因为在粒子的近邻处其自身的电场会变成无穷大。按照洛伦兹方程,如果它必须对它所处的地方的电磁场响应,则它必须对此无穷大的场响应!为了使洛伦兹力定律有意义,必须找出一种减去粒子自身的场以剩下的有限的背景场的方法,这样粒子才能毫不含糊地对背景场响应。1938年狄拉克(我们在后面还要提到他)解决了这个问题。但是,狄拉克解导出了某些令人恐慌的结论。他发现为了决定粒子和场的行为,不但必须知道每个粒子的初始位置和速度,也必须知道其初始加速度(这是一种在标准的动力学理论的范围内不太正常的情况)。对大多数的初始加速度值,粒子的最终行为变得完全疯狂,它自发地加速并很快地趋近于光速!这就是狄拉克的“逃逸解”,它并不对应于任何实际发生在自然里的东西。人们必须找到一种正确选择初始加速度以避免逃逸解的方法。只有一个人使用“先知”――也就是,必须指明能最终导出逃逸解的初始加速度并避免之,才能做到。这根本就不是在一个标准的决定性的物理问题中选择初始条件的方法。在传统的决定论中,这些初始数据可以任意给定,不受任何未来的行为要求的约束。而在这里,不仅是将来完全决定了在过去某一时刻的应选取的初始值,而且这些非常特别的数据由于要使未来行为确实 “合理”的要求,而被非常苛刻地约束。
基本的经典方程就只能走到这么远。读者会意识到经典物理定律中决定性和可计算性的问题真是乱麻一团,在物理学定律中是否有一个目的论的因素呢?未来是否对过去允许发生的事有某种影响呢?在实际上,物理学家并未认真地将这些经典电动力学(经典带电粒子和电磁场的理论)的含义当作实在的描述。他们对上述困难通常回答是,带电的单独粒子问题是在量子电动力学范畴里, 我们不能指望利用纯粹经典过程得到有意义的答案。这无疑是对的。但正如我们以后将要看到的,在这一点上量子理论自身也有问题。事实是,狄拉克正是因为想到,也许能为解决(物理上更适当的)量子问题中的甚至更大的基本困难得到灵感,而考虑带电粒子的经典问题。以后我们必须面临量子理论的这个问题!爱因斯坦和彭加莱狭义相对论我们回顾一下伽利略的相对性原理。它告诉我们,如果我们从一个静止座标系转换到运动座标系,伽利略和牛顿的物理定律完全不变。这意味着仅仅考察在我们周围的物体的动力学行为,不能确定我们是处于静止状态,还是沿着某一方向作匀速运动。(回忆一下187页描述伽利略在海上的船)。当我们将马克斯韦方程合并到这些定律中去时,伽利略的相对论仍然对吗?我们知道马克斯韦电磁波以固定的速率――即光速传播。常识似乎告诉我们,如果我们在某一方向非常快地运动,则光在那一方向相对我们的速率应减少到比c小(因为我们沿着那个方向去“追逐”光线),而且在相反的方向光速应相应地增加到比c大(因为我们向着光运动)――这都和马克斯韦理论的不变的值c不一致。确实,常识似乎是对的:合并的牛顿和马克斯韦方程不满足伽利略相对论。
正是由于对这件事体的忧虑导致爱因斯坦于1905年――事实上彭加莱在他之前(1898――1905)――提出狭义相对论。彭加莱和爱因斯坦各自独立地发现马克斯韦方程也满足一个相对论原理(参阅派斯1982);也就是如果我们从一个静止座标系换到运动座标系时,方程也有类似的不变的性质。虽然在这种情况下,变换规则和伽利略――牛顿物理不相容!为了使两者相容,必须修正其中的一组方程――或者抛弃相对论原理。爱因斯坦不想抛弃相对论原理。他凭着超等的物理直觉坚持,这个原则必须对于我们世界的物理定律成立。此外,他知道伽利略――牛顿物理对于所有的已知现象,只在速度和光速相比很微小的情况下被检验,这时不相容性不显著。只有光本身才牵涉到速度大到足以使这种偏离变重要。所以,正是光的行为才能告诉我们究竟要采用何种相对论原理――而制约光的方程正是马克斯韦方程。这样适合于马克斯韦理论的相对论原理要保留;而相应地伽利略――牛顿定律要作修正!
在彭加莱和爱因斯坦之前,洛伦兹也着手并回答了问题。直到1895年,洛伦兹采取的观点认为将物质结合在一起的力量具有电磁性(后来证明正是如此)。这样,实在物体的行为应该满足从马克斯韦方程推导出的定律。其中一个推论,是以与光速可相比拟的速度运动的物体在运动的方向会有微小的收缩(所谓的“费兹杰拉德――洛伦兹收缩”)。洛伦兹利用它来解释迈克尔逊和莫雷在1887年进行的令人困惑的实验发现。 该实验似乎指出不能用电磁现象来确定一个“绝对”静止的坐标系。(迈克尔逊和莫雷指出,地球表面上的光的表观速度不受地球绕太阳公转的影响,这和预想的非常不一样。)是否物体的行为总是这样,以至于不可能在局部检验它的匀速运动呢?这是洛伦兹的近似的结论;而且他只局限于物体的特殊的,也就是认为只有电磁力才有意义的理论。作为一位杰出的数学家,彭加莱在1905年指出,马克斯韦方程基础的相对论原理,物体有一个精确的行为方式使得局部检测物体的匀速运动根本办不到。他并透彻地了解了此原理的物理含义(包括我们很快就要考虑到的“同时性的相对性”)。
他认为这仅仅是一种可能性,而不像爱因斯坦那样坚持相对论原理必须成立。马克斯韦方程满足的相对性原理后来被称作狭义相对论。 要掌握它不甚容易。它有许多反直观的特征,一下子很难把这些特征当作我们生活其中的世界的性质接受下来。事实上,若不是富有创见和洞察力的俄国/德国几何学家赫曼?闵可夫斯基(1864―1909)于1908年引进了进一步的要素,很难对狭义相对论赋予意义。闵可夫斯基曾是爱因斯坦在苏黎士高等理工学院的导师。1908年,闵可夫斯基在他发表在哥廷根大学的著名演讲中说道:
从今以后空间自身以及时间自身必像影子般地渐渐消退,只有两者的某种结合保持为独立的实体。现在,让我们按照美妙的闵可夫斯基空间――时间来理解狭义相对论的基础。和空间――时间概念相关的一个困难在于它是四维的,这样要去摹想它就非常困难。然而,我们已逃过了相空间这一关,区区四维不会引起我们太多的麻烦!和以前一样,我们将采用“欺骗”的手法把空间画成更少的维数――但是,这回欺骗的程度没有过去那么严重,我们的图画也相应地更为准确一些。二维图(一维空间和一维时间)对许多目的是足够的。
但我还希望读者允许我有点更冒险地升高到三维图(二维空间和一维时间)。这样子我们就得到了非常好的图画,并在原则上认为不必做许多改变就可将三维图的观念推广到四维的情况去。关于空间――时间里要记住的是,在它上面的每一点代表一个事件――也就是某一时刻的空间的一点,只有瞬息存在的一点。整个图代表过去、现在和将来的全部历史。因为一个粒子总存留在时间内,所以它不是以一点,而是以称作粒子的世界线的一条线来代表。如果粒子做直线匀速运动,则其世界线为直线。如果它作加速运动(亦即非匀速运动),则世界线是弯曲的。世界线描述了粒子存在的整个历史。
我在图5.16中画出了具有二维空间和一维时间的空间――时间图。我们可想象沿着垂直方向测量有一标准的时间座标t,以及在水平方向测量的两个空间座标x/c和z/c①, 在中心处的圆锥是空间――时间原点O的 (未来)光锥。为了领略其意义,可以想象在事件O处发生一次爆炸。(此爆炸在时刻t=0发生在空间的原点。)从爆炸发出的光的历史正是此光锥。
在二维空间中看,闪光是以基本的光速c向外运动的圆圈。在全部三维空① (B/(t 在此方程中的存在正是马克斯韦的理论推导的妙举。本质上讲,方程中的其他所有的项从直接实验证据中都已知道。系数1/c2非常小,这正是为何该项未被实验观察到的原因。间中看,变成以光速c向外运动的一个球面――光的波前的球面――但是我们在这儿压缩了空间方向,所以只得到了一个圆圈,正如从一块石头落到水池中去的那一点发出的涟漪的圆圈那样。如果我们在向上的方向连续截割光锥的话,就能在此空间――时间中看到这一圆圈。这些水平面代表随时间坐标t增加时不同的空间的描述。相对论的一个特征是,一个物质粒子不能以比光速更快的速度运动(后面还要讲到)。所以从爆炸出来的物质粒子必须落到闪光的后头。用空间――时间的语言来说,这表明所有这些粒子的世界线必须在光锥内部。图5.16闵可夫斯基空间――时间(仅有两维空间)中的一个光锥,描述了在空间――时间原点的事件O处发生的爆炸的闪光的历史。用称作光子的粒子比用电磁波来描述光更为方便。 此刻我们暂时可以将一个“光子”当作一个电磁场高频振动的小“波包”。在下一章我们将要讨论的量子描述中,这个术语的物理意义将会更清楚。但在这里 “经典”
光子对我们也是有助的。在自由空间中光子总是以基本速度c沿直线运动。这表明在闵可夫斯基空间――时间图中光子的世界线总是画成一根和垂直线倾斜45°的直线。在 O点处的爆炸产生的光子描写了一个中心位于O的光锥。这些性质在空间――时间的所有点都应成立。原点并没有任何特别之处;点O和任何其他点无区别。这样的空间――时间的每一点都必须有一个和在原点光锥具有同样意义的光锥。如果我们宁愿使用光的粒子描述的话,则任何光束的历史亦即光子的世界线,在每一点上总沿着光锥,而任何物质粒子的历史必须在每一点的光锥的内部。 这一切从图5.17可以看到。 所有点处的光锥族可以被看成空间――时间的闵可夫斯基几何的一部分。图5.17闵可夫斯基几何图。
图5.18(a)欧几里德几何和(b)闵可夫斯基几何的“距离”测量的相互比较(后者的“距离”表示经历的“时间”)。什么是闵可夫斯基几何?光锥结构是其最重要的方面。但是闵可夫斯基几何有比这更丰富的内容。 它有一种和欧几里德几何的距离极相似的 “距离”的概念。在三维欧几里德几何中,按照标准的笛卡尔座标,从点到某一点距离r可写作r2=x2+y2+z2(见图5.18a。这正是华达哥拉斯定理――或许二维的情况更熟悉些。)在我们的三维闵可夫斯基几何中,其表达式非常相似图5.18b),根本的差别是我们有两个负号:
s2=t2-(x/c)2-(z/c)2更正确地讲,我们应该有四维闵可夫斯基几何,当然距离表达式应写作s2=t2-(x/c)2-(y/c)2-(z-c)2。
此表达式中 “距离” s的物理意义是什么呢?假定有一点其座标为 {t,x/c,y/c,z/c}。(或者在三维的情形{t,x/c,z/c};见图5.16),并且在O的(未来)光锥的内部。则直线段OP可以代表某一个物质粒子――比如说由我们爆炸发射出的某一个特定粒子的一部分历史。 线段OP的闵可夫斯基“长度”s有直接的物理解释,它是粒子所实际经验的事件O和P之间的时间间隔!这就是说,如果有一非常可靠和精确的钟附在该粒子上15, 那么在事件O和P记录下的时间的差刚好是s。 和通常预料的相反的是,座标值t本身不描述精确的钟测量的时刻,除非它“静止”地处于我们的座标系中(亦即x/c,y/c和z/c取固定值),这表明在图中钟有一根“垂直”的世界线。这样,只对于“静止”(亦即具有“垂直”世界线)的观察者“t”才表示“时间”。按照狭义相对论,量 s为每一位从原点以均匀速度离开的观察者提供正确的时间量度。这是非常令人吃惊的――和伽利略――牛顿的简单取座标值t为时间测量的“常识”十分矛盾。我们注意到,只要有任何运动,则相对论性(闵可夫斯基)的时间测量s总是比t要小(因为从上式我们知道,只要x/c,y/c和z/c不全为零,则s2比t2小。)运动(亦即OP不沿着t―轴)总是使得在和座标值t相比较钟“变慢”。如果运动速度和c比较很小,则s和t就几乎一样,这就解释了为何我们不知道“运动着的钟走得慢”的事实。在另一种极端情况下,速度刚好为光速,P就处在光锥上,我们发现s=0。光锥刚好是它从0起,闵可夫斯基“距离”(亦即“时间”)为零的集合。这样,光子根本没有“经历”任何时间流逝!(我们不允许更极端的情况,P运动到光锥外面,因为这一来s变成虚的了――也即负数的平方根――也就是违反了物质粒子或光子不能运动得比光快的规律。①)
可以把闵可夫斯基“距离”一样好地应用于空间――时间中的任何一对点上去,其中一点处在另一点的光锥之内――这样,一个粒子可以从一点运动到另一点。我们简单地考虑将O移到空间――时间中的某一不同点。两点间的闵可夫斯基距离是一台从一点匀速运动到另一点的钟经验的时间的间隔。当此粒子允许为光子时,闵可夫斯基距离变成零,我们两点中的一点就必须处在另一点的光锥上――这个事实可用来定义那一点的光锥。
闵可夫斯基几何的基本结构以及世界线的“长度”的古怪测度包含了狭义相对论的精华。在这里,世界线的“长度”被解释作物理钟所“测量”① 波动方程(或达朗伯特方程)可写成{1/c2((/(t)2-((/(x)-((/(y)2-((/(z)2}(=0(或“经历”的时间。特别是读者也许熟悉的相对论中的“双生子佯谬”:
双生子中的一个留在地球上,而另一个以接近于光速的巨大速度旅行到邻近恒星上去,然后再返回。当他返回之时,人们发现两人衰老得不一样。旅行者还很年轻,而他那位待在家里的兄弟却已垂垂老矣。这按照闵可夫斯基几何很容易描述――人们可以看到,这个现象虽然令人迷惑,实际上并非荒谬。我们在图5.19中用世界线,AC代表留在家中的那个双生子,而旅行者的世界线包括AB和BC两段,这代表去和回的航行的两个阶段。留在家中的那个双生子所经历的时间由闵可夫斯基距离AC所测量, 而旅行者所经历的时间由两段闵可夫斯基距离AB和BC的总和16给出。这两个时间不同,而且我们有AC>AB+BC此不等式的确表明留在家中的那个所经历的时间比旅行者更长。
图.19按照闵可夫斯基三角形不等式来理解狭义相对论中所谓的“双生子佯谬”。(为了比较,我们也给出了欧几里德的情形。)上面的不等式看起来和通常的欧几里德几何中的著名的三角形不等式(A,B,C,现在变成了欧几里德空间中的三点),亦即AC<AB+BC相当类似。该不等式断言,一个三角形的两边的和总比第三边大。我们并不把这个当成佯谬!从一点到另一点(这里是从A到C)之间的距离依赖于我们采取的实际途经,这是起码的常识。(在现在情形下,这两种途径为AC以及更长的折线ABC)。它是两点(此处为A和C)之间的最短距离为连接它们的直线(直线AC)度量的特例。不等式符号在闵可夫斯基情况下的反向是因为定义“距离”时的符号改变所引起,因此闵可夫斯基的AC比折线ABC“更长”。闵可夫斯基“三角形不等式”是更一般结果的特例:连接两个事件的最长的 (在经历最长时间的含义上) 世界线为直线 (亦即加速度为零)。如果两个双生子从同一事件A开始并终结于同一事件C。第一个双生子没有加速地从A旅行到C,而第二个加速,则他重新相遇时,前者总是经历了更长的时间流逝。以与我们直觉相矛盾的方式,引进这样的时间测度的奇怪概念,似乎是有点荒谬。但是现在已有极大量的实验证据支持它。例如,许多次原子粒子以一定的时间尺度衰变(亦即分裂成其他粒子)。这些粒子有时以非常接近光速的速度运动(譬如从外空间到达地球的宇宙线或是人造的粒子加速器中的粒子),它们衰变时间精确地以从上述考虑导出的方式变迟缓。
以下事实会更令人印象深刻,现代的钟(“核子钟”)可以做得如此精密,以至于时间变化效应可被快速低空飞行的飞机携带的钟直接检测出来,结果和闵可夫斯基“距离”测度s,而不和t相一致。严格地讲,考虑到飞机的高度,就牵涉到广义相对论的一个小的附加的引力效应,但是这些也都和观测相一致;参阅下一节。)此外,还有许多其他紧密地和整个狭义相对论框架相关的效应,它们都经常接受了严密的验证。爱因斯坦的著名的关系E=mc2即是其中之一,这表明能量和质量等效。在本章的结尾我们要遇到这一个关系式的一个令人哭笑不得的推论!
我还没有解释相对论原理如何和这类事体相协调。以闵可夫斯基几何的观点看,以不同的均匀速度运动的观察者怎么会是等同的?图5.16中的时间轴(“静止观察者”)怎么能和其他直的世界线,比如OP(“运动观察者”)完全等同?让我们先考虑欧几里德几何,很清楚,就几何整体而言,任何两条直线都是完全等同的。人们可以将整个欧几里德空间在自身上, “刚性”地滑动,使得其中一条直线和另一条直线的位置重合为止。考虑一个二维亦即欧几里德平面的情形。我们可以想象在一个平面上刚性地移动一张纸,使得画在纸上的任一条直线和平面上的已给定的直线相重合。这个刚性运动保持几何结构不变。虽然稍不明显一些,这些议论类似地在闵可夫斯几何中也成立。在这里人们必须小心地理解“刚性”的含义。现在我们用一种古怪的材料取代那张滑动的纸――为了简单起见,我们首先研究二维的情况――该材料在一个45°方向上伸长而在另一个45°方向上压缩时两条45°线必须仍保持为45°线。从图5.20可看到这一点。
在图5.21中我试图描绘三维的情形。这种称作彭加莱运动 (或非齐次洛伦兹运动)的闵可夫斯基空间的“刚性运动”似乎显得不“刚性”,但它保持了所有的闵可夫斯基的距离。而“保持所有距离”在欧几里德情况下正是“刚性”的意义。狭义相对论原理声称,物理在这种空间――时间的彭加莱运动之下不变。尤其是,世界线为我们原先闵可夫斯基图画 (图5.16)
的时间轴的“静止”的观察者S和以OP为世界线的“运动”观察者M有完全一样的物理。图5.20二维空间――时间中的彭加莱运动。
图5.21三维空间――时间中的彭加莱运动。左图画出S的同时性空间,而右图为M的同时性空间。注意S认为R比Q早,而 M认为Q比R早。(此处的运动被认为是被动的,这只是因两个观察者S和M对同一空间――时间所做的不同描述所引起的。每一座标平面t等于常数代表观察S的任一“时刻”的空间,亦即他认为同时(发生在“同一时刻”)的一族事件。我们称此平面为S的同时空间。当我们过渡到另一观察者M,就必须将原先的同时面族抛弃,而取代以M的同时面族17。我们注意到图5.21中的M的同时面显得向上倾斜。按照欧几里德几何的刚性运动思考,则会以为这倾斜似乎方向错了,但在闵可夫斯基情况下正是我们所预料的。当S认为所有在t为常数的平面上的事件同时发生时,M却持不同观点:从他看来,在他的每一个倾斜的等时空间上的事件才显得是同时的!闵可夫斯基几何本身并不包含 “同时性”
的唯一概念,而每一位匀速运动的观察者各有自己的“同时性”的概念。
图5.22两个人A和B相互很慢地穿过, 但是他们对于仙女座大星云空间飞船队是否在他遭遇的时刻已经出发有不同的观点。考虑图5.21中的两个事件R和Q。依S看来,事件R在事件Q之前发生,因为R处于比Q更早的同时面上;但是,依 M看来,情况刚好相反,Q处于比R更早的同时面上。这样,一个观察者认为事件R早于Q发生,而另一个观察者认为Q比R早发生! (只有当R和Q所谓类空地分隔开也就是一个事件处在另一事件的光锥之外,并因此没有物质粒子或光子能从一个事件运动到另一个事件时,这才会发生。)只要事件在相隔非常远的距离上发生,甚至非常小的相对速度也会导致重大的时序差异。假定在仙女座大星云(离开我们银河系最近的大星系,大约是二千亿亿公里那么远)处发生了一个事件,地球上两个观察者相互遭遇时将他们的钟对好,由于他们的运动速度不同, 他们两对该事件发生时刻的判断可有几天的差别 (图5.22)。对于其中一个人来说,试图去歼灭地球行星上生命的空间飞船队已上路了;而对于另外一个人来说,尚未决定是否要发射这个飞船队。爱因斯坦广义相对论我们回忆一下伽利略关于任何物体在引力场中同样快下落的伟大的洞察。(这是洞察的而不完全是直接观察的结果。由于空气阻力作用,羽毛和石头不会一起下落!伽利略的洞察在于意识到,如果空气阻力可减少到零,它们就会一起下落。)这一直觉的深刻意义整整花了三个世纪的时间才被意识到,而成为一个伟大理论的奠基石。这就是爱因斯坦的广义相对论――引力的一个非同寻常的描述。正如我们很快就要理解到的,为了实现它,我们需要引进弯曲的空间――时间的概念。
伽利略的洞察和“空间――时间曲率”有何关系呢?我们知道在牛顿的理论中粒子被通常的引力所加速。这样的一个与之如此不同的思想,怎么能重新产生并且改善那个理论的所有超等的精确性呢?此外,伽利略古老的直觉包含着以后没被合并到牛顿理论中的某种东西,这怎么可能呢?由于最后一个问题最易于回答,让我们从它开始。在牛顿理论中,是什么制约着在引力作用下的物体的加速度?首先,引力作用到物体上,牛顿引力定律告诉我们这必须和物体质量成正比。 伽利略的直觉是发生在牛顿引力定律中的“质量”和牛顿定律中的是同一“质量”。(可以用“比例于”来取代“同一的”。)正是它保证了引力作用下的物体的加速度实际上与它的质量无关。在牛顿的一般理论中完全没有要求这两种质量概念的同一性。牛顿只是把它当成一个假设。的确,在反平方律方面电力和引力是类似的,但电力所依赖的是与牛顿第二定律中的质量完全不同的电荷。“伽利略直觉”不能应用于电力:在电场中物体(带电的物体)不会以同样的速度下落!现在,我们就简单地接受伽利略关于引力作用下的运动的洞察,并探究其含义。设想伽利略从比萨斜塔上释放两块石头。如果在一块石头上有一镜头指向另一块石头的摄像机,那么其提供的摄像是一块在空中徘徊的石头,就像引力对它没有影响似的(图5.23)!这正是因为在重力下所有物体都以同样速度下落。
图5.23伽利略从比萨斜塔上释放两块石头(和一台摄像机)。
我们在这里不管空气阻力。因为在太空中实际上没有空气,所以太空飞行给我们提供了这些观念的一个更好的验证。现在,太空中“下落”简单地表示在引力作用下沿着合适的轨道运动。这个“下落”没有必要是冲着地球中心的直线下降。运动也可以有水平分量。如果此一水平分量足够大,那它就能围绕地球而不必朝向地面的方向“下落”!在引力下的自由轨道上旅行只不过是一种优雅(并且非常昂贵)的“下落”方式。正如前面使用摄像机,现在一位作“太空行走”的航天员看到他的空间飞船在他之前徘徊,表观上不受在他之前的地球的巨大的球体的引力的影响(见图5.24)!这样,人们只要过渡到自由下落的“加速参考系”去,就可以局部地消除引力效应。
图5.24航天员看到他的空间飞船在他之前徘徊, 如同不受引力影响似的。因为引力场效应正和加速度效应一样,所以可用自由下落的方式来对消引力。事实上,你如果处在一台正在加速上升的电梯之内,就会简单地觉得表观引力场的增大;如果电梯下降,则引力场减弱。如果悬挂电梯的绳索断了,那整个下落加速度就完全抵消了引力的效应(不考虑空气阻力和摩擦效应),而电梯乘客就像上述的航天员那样显得在空中自由浮动,直到它撞到地面上为止!甚至在火车和飞机上,加速度会使一个人感到引力的强度和方向不和他视觉提示的应是“往下”的方向一致。这是因为加速度和引力效应是互相类似的,人的感觉不能将它们区分开来。爱因斯坦把引力的局部效应和加速度参考系的效应等效的事实称为等效原理。
图5.25潮汐效应。双箭头表明相对加速度(魏尔)。
上述的考虑是“局部的”。然而,如果人们允许去做足够精密的(不完全局部的)测量,他就能在原则上断定在“真正”引力场和纯粹加速度之间的区别。在图5.25中我用稍微夸张的方式显示出由许多粒子构成的原先静止的球面,在地球引力作用下自由下落时如何受(牛顿)引力场的非均匀性的影响。该引力场在两个方面不均匀。首先,因为地球在有限距离的某处,靠近地球表面的粒子向下加速比远处的粒子更快(由于牛顿反平方律引起)。第二,由于同一个原因,在水平方向上不同位置的粒子加速度的方向也有些轻微差别。球面由于这种非均匀性引起了微小变形而成为一个“椭球面”。由于它靠近地球的部分遭受到比远处的部分稍微更大的加速度,它在向地球中心方向(以及相反的方向)被拉长。由于加速度在沿地球中心方向稍微向内侧的作用,它在水平方向变狭窄。
这种畸变效应被称为引力的潮汐效应。如果我们用月亮来取代地球的中心,并且粒子的球面用地球表面取代,则我们刚好得到由于月亮的影响而在地球表面产生的潮汐,鼓出的部分正是朝着和背着月亮的方向。这个不能用自由下落“消除”的引力场的一般特征正是潮汐效应。(潮汐畸变的大小实际和离开吸引中心的距离成反立方律,而不是反平方律的关系。)图5.26当球面围绕着物体(此处为地球)时,就有一个纯粹向内的加速(里奇)。
牛顿引力的反平方律可按照这个潮汐效应得到一个简单的解释:由原先18球形而畸变成的椭球的体积等于原先球体 (就认为该球面围绕着真空好了)的体积。这种体积性质是反平方律的特征,它对于其他的力的定律不成立。下一步,我们假定球面围绕着的不是真空而是总质量为M的某物体。此物体的引力产生附加的向内去的加速度分量。这样,由原先粒子球面变形成的椭球体积就会收缩,其收缩量和M成比例。我们让球面以固定的高度围绕着地球(图5.26),所发生的体积减小效应即为一个例子。由地球引力导致平常的向下(亦即向内)加速就是引起球形体积减小的同一个原因。这种体积减小效应印证了牛顿引力定律继续存在的部分,也即此力和吸引物体的质量成正比。我们画出这种情形的空间――时间图。我在图5.27上画出球面(在图5.25中画成了一个圆圈)上粒子的世界线。我在这里是用使球面的中心显得处于静止(“自由下落”)的座标系。广义相对论把自由下落运动看作“自由运动”――和无引力物理中的“均匀直线运动”相类似。这样,我们试图在空间――时间中用“直”的世界线来描绘自由下落。然而,从图5.27看出 “直”这个字在此处的用法显得混乱。
这只不过是术语的问题。我们以后就将自由下落的粒子的世界线称作空间――时间的测地线。图5.27空间――时间曲率:画在空间――时间中的潮汐效应。
图5.28曲面上的测地线。在正曲率处测地线收敛,而在负曲率处它们发散。这是一个好术语吗?“测地线”在通常情况下的含义是什么呢?我们考察二维曲面的类似情形。测地线为在曲面上(局部的)“最短程”的曲线。如果我们想象在此曲面上拉伸一根绳子(不要太长,否则它会滑走),那么这根绳子在曲面上就和一根测地线相重合。 我在图5.28上给出了两个曲面的例子,第一个具有“正曲率”(和球面类似),而第二个具有“负曲率”(一个马鞍形的面)。在正曲率曲面上,两根互相邻近的一开始相互平行的测地线会相互靠近;对于负曲率曲面,它们会相互离开。如果我们想象,自由下落粒子的世界线在某种意义上像是曲面上的测地线,则可以看到在前面讨论的引力潮汐效应和曲面的曲率效应之间有种紧密的相似性――但是现在情形下正的和负的曲率效应会同时存在。 我们可从图5.25和图5.27看到,空间――时间的“测地线”在一个方向上互相离开(当它们和地球在同一直线上时) ――正如图5.28中负曲率曲面的情形――在另一方向上它们互相靠近(当它们相对于地球处于水平的方向上)――正如图5.28中正曲率曲面的情形。这样,我们的空间――时间曲率确实似乎具有类似于我们两个曲面的“曲率”,但是由于更高的维数而变得更为复杂,在不同的位移上牵涉到正和负的曲率的混合。
这就显示了如何用空间――时间“曲率”的概念来描述引力场。这种描述的可能性终究到底是从伽利略的直觉而来的(等效原理),它允许我们用自由下落来消除“引力”。实际上我到此为止还不必要超出牛顿理论的范围。这个新的图像只是为此理论提供了重新表述 19。然而,当我们将此图像和狭义相对论的闵可夫斯基描述――亦即现在我们知道应用于不存在引力情况下的空间――时间几何相结合时,就得到了新的物理。其最终的结合物即为爱因斯坦的广义相对论。
回想一下我们从闵可夫斯基得到的教益。引力不存在时,空间――时间中定义了两点之间的特殊类型的“距离”测度。我们在空间――时间中有根描述某粒子的世界线,则沿着此世界线测量的闵可夫斯基“距离”表示这个粒子实际经历的时间。(在前一节我们事实上只考虑沿着与直线段一致的世界线的“距离”,但这个断言对于任意弯曲的世界线“距离”的测量也成立。)如果没有引力场――亦即没有空间――时间曲率时,闵可夫斯基几何是准确的。但是在引力存在时,我们只能将闵可夫斯基几何当作一种近似――如同平面是弯曲曲面几何的近似描述一样。我们如果用放大倍数越来越大的显微镜去考察曲面――使得曲面的几何伸展到越来越大的范围去――则该曲面就显得越来越平坦。我们说一个弯曲曲面在局部上像是一个欧几里德平面20。我们可以以同样的方式说在引力存在时,空间――时间在局部上像闵可夫斯基几何(也就是平坦的空间――时间),但是我们在更大的尺度下允许某种“弯曲性”(见图5.29)。特别是,正如在闵可夫斯基空间中一样,空间――时间中的任一点都是一个光锥的顶点。但是这些光锥不像在闵可夫斯基空间中的那样以完全一致的方式排列。我们将在第七章的一些空间――时间模型的例子中看到这种明显的非一致性(参阅387页的图7.13和7.14)。物质粒子的世界线的朝向总在光锥之内,而光子的世界线总是沿着光锥。正如在闵可夫斯基空间中一样,沿着任何一条这样的曲线,总存在测量该粒子所经历的时间的闵可夫斯基“距离”的概念。正如在曲面的情形,这种距离测度定义了与平空间不同的曲面的几何。
图5.29弯曲空间――时间图和上述的二维曲面情况相似,空间――时间中的测地线可有类似的解释。但是我们必须记住闵可夫斯基和欧几里德情形的不同之处。空间――时间中的测地的世界线取(局部)最大的距离(亦即时间),而不是取(局部)最小的长度。按照这一规则,引力作用下的自由运动粒子的世界线,实际上是测地线。这样,尤其是在引力场中运动的天体可用测地线来描写。在空虚的空间的光线(光子的世界线)也是测地线,并且是具有零“长度”的测地线21。我在图5.30中作为例子画出了地球和太阳的世界线的略图,地球绕太阳的运动是一根绕着太阳世界线的螺旋状的测地线。我也标出了从一个遥远的恒星到达地球的光子。因为按照爱因斯坦理论,光线被太阳的引力场所偏折,所以其世界线显得稍微有些“弯折”了。图5.30地球和太阳以及从遥远恒星处来的被太阳所偏折的光线的世界线。我们还要看看如何将牛顿的反平方律包括进来,并按照爱因斯坦相对论作何种修正。让我们回到在引力场中下落的粒子球面的例子上来。我们记得,如果球面围绕的只是真空,则按照牛顿理论,球的体积一开始不会改变;但是如果围绕的是一个总质量为M的物体,则会产生和M成正比的体积减小。这种规律在爱因斯坦理论中(对于小球面)刚好是一样,除了决定此体积减小的不完全是M,还有一附加的“通常非常小的”来自被围绕物质的压力的贡献。
四维空间――时间的曲率必须描写在任何地方在任何可能方向运动的粒子的潮汐效应。它的完整数学表达式由被称为黎曼曲率张量的量所给出。这个东西是有点复杂,在每一点具有二十个称作分量的数。不同的分量是在空间――时间中在不同方向上的不同曲率。黎曼曲率通常写作Rijkl。但是因为我不想在这里解释这些小指标的意义(事实上也不想解释张量的意义),我就简单地将它写作黎曼。
存在一种将此张量分解成两部分的方法,
第一部分是魏尔张量,第二部分是里奇张量(各有十个分量)。此分解可表达如下:
黎曼=魏尔+里奇。
(其具体表达式在目前并不特别有用。)魏尔张量魏尔是测量我们自由下落的球面的潮汐畸变(亦即形状的初始变形,而非尺度的变化),而里奇张量里奇测量其初始体积改变 22。我们记得,牛顿引力理论要求下落球面所围绕的质量和这初始体积的减小成正比。粗略地讲,它告诉我们,物体的质量密度,或等效地能量密度(因为E=mc2)――应该和里奇张量相等。
事实上, 这基本上就是广义相对论的场方程――也即爱因斯坦场方程――实际的断言23。然而,关于这些还有许多技术上的细节,最好不在这里纠缠。只要知道存在一个称作能量――动量的张量,它将有关的物质和电磁场的能量、压力和动量都组织在一起。我把这一张量叫做能量,则爱因斯坦方程可非常粗略地写作:
里奇=能量。正是在能量张量中“压力”的出现以及为了使整个方程协调的条件要求,使得压力正如前述的也对体积缩小效应有所贡献。此方程似乎没有牵涉到魏尔张量。但它是一个重要的量。在空虚的空间里感受到的潮汐效应纯粹是由魏尔引起的。事实上,上述的爱因斯坦方程意味着,存在将魏尔和能量相联系的微分方程,和该方程我们以前遇到的马克斯韦方程很相像24。的确,把魏尔当作用E,B这一对量描述的电磁场量(实际上也是一个张量――马克斯韦张量)的引力类似物是一种富有成果的观点。在一定的意义上可以讲,魏尔实际上是引力场的测定。魏尔的“源”是能量张量。这和电磁场(E,B)的源是(p,j),也即马克斯韦理论的电荷和电流的组合的情形很相似。这种观点将有助于第七章的讨论。
如果注意到在爱因斯坦理论和牛顿在两个半世纪前提出的理论之间,虽然在形式和内在的观念之间有如此深刻的差别,但在观测上要找到差异却非常困难,人们会十分惊异。假如所考虑的速度和光速c相比较小很多,并且引力场不太强(使得逃逸速度比c小得多,参阅第七章388页),那么爱因斯坦理论的结果实质上和牛顿的一样。但是,在这两个理论的预言的确不同时,爱因斯坦理论更准确。现在已有几个印象深刻的实验,证明爱因斯坦新理论完全成立。正如爱因斯坦所坚持的,在引力场中钟走得慢一些,此效应以不同的方式得到直接的测量。光和无线电波的确被太阳所偏折,并被遭遇者稍微地延迟――也很好地检验了广义相对论效应。空间探测器和运动行星,正如爱因斯坦理论所要求的那样,对牛顿轨道要做小修正,这些也被实验所证实。 (特别是从1859年起天文学家就开始忧虑的被称作“近日点进动”的水星运动的失常,1915年为爱因斯坦所解释。)也许最令人印象深刻的是,对一个包括一对微小的大质量恒星(假定为两个“中子星”,参阅388页)的称作双脉卫星系统上的一系列观测,其数据和爱因斯坦理论非常接近,并间接地证实了一个在牛顿理论中根本不存在的效应,即引力波的辐射。(引力波是电磁波的引力类似物,以光速c来传播。)还没有找到任何被确证的和爱因斯坦广义相对论相冲突的观测。
正因为这种种奇异的现象,使我们坚信爱因斯坦理论是对的!相对论因果性和决定论我们记得在相对论中,物质不能运动得比光快――也就是说,它们的世界线必须处于光锥之中(参见图5.29)。(尤其在广义相对论中,我们必须用这种局部的方式描述事物。光锥并不均匀地排列着,所以讲非常远的粒子的速度是否超过这里的光速并没有多大意义。)光子的世界线沿着光锥,但对于任何粒子都不能允许其世界线处在光锥之外。事实上,更一般的陈述应是,不允许任何讯号在光锥外传播。
图5.31从观察者W看来比光更快的讯号, 在观察者U看来变成在时间上向后旅行。右图(b)只不过是左图(a)以U的观点重新画出。(这种重画可视作彭加莱运动。可将其和图5.21相比较――但这里以 (a)到 (b)
是采用积极的而非消极的意义上的变换。)
要理解为什么这样,可以参考闵可夫斯基空间图(图5.31)。假定我们有一台能发出比光传播得更快的讯号的仪器。利用这台仪器,观察者W从他的世界线的事件A发出一到达遥远的事件B的讯号,B刚好处于A的光锥的下面。从W的观点看,可以画成图5.31a的样子。但从第二个观察者U的观点看, 应重新画成图5.31b的样子, U正在进行着离开W (譬如讲,从AB之间的某点开始)的快速运动。对于U而言,事件B显得比A还更早地发生!(正如前面(228页)提到的,这种“重画”是一个彭加莱运动。)从W的观点看,U的同时性空间看起来是“向上倾斜”的,这就是为何事件B从U的观点看显得比A还早的原因。这样,对于U而言,W似乎是在往时间向后的方向上发出讯号!图5.32如果V装备有和W一样的超光速讯号的仪器, 但该仪器的指向和W的相反,它就可以被W用来向他自己的过去发送信息。这还不算什么矛盾。但是如果还有一个从U的观点看对称的(由于狭义相对论原理),离开U以和W相反的方向运动并装备有与W一样的仪器的第三个观察者V,他也能发出一个刚好比光还快的讯号。从他(亦即V的观点看,该讯号是向U的方向返回。从U的观点看来,这讯号又是发向过去,但这回是沿着相反的空间方向。V可以在接到到W发出的原始记号的B时刻发出第二个讯号到W去。从U看来,该讯号在比原先发射事件A更早的事件C处到达W(图5.32)。但比这更糟糕的是,实际上事件C在W自身的世界线上比事件A更早,W在发出A讯号之前即经历了事件C!观察者V发回到W的讯号由于W的预先安排, 可以简单地重复B处收到的。
这样,W就会在自己的世界线更早的时刻收到后来想发出的同一个讯号!将两个观察者分隔足够大的距离,我们就可以使得返回讯号,比原始的讯号早一个任意长的时间间隔。也许W原始的讯号是说他折断了腿,他可在此事件发生之前接受到返回讯号,然后(假定)用他自己的意志,采取行动去避免事故发生!这样,先知先觉地发射讯号和爱因斯坦的相对论原理一道会导致和我们“自由意志”的正常感觉的严重冲突。实际上的情形比这还要更严重。因为我们可以设想,也许“观察者W”仅仅是一台机械仪器,它的程序是如果收到“不”的讯号时即发出“是”的讯号,反之亦然。而V也可以是一台机械仪器,如果收到“不”的讯号时即发出“不”的讯号,反之亦然。
这就导致了和我们以前遇到的25同样的矛盾。现在似乎和观察者W是否有自由意志“无关”,并且告诉我们超光速讯号发射仪器不存在物理学上的可能性。这会在下面给我们带来一些令人困惑的推论(第六章330页)。