打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
张天蓉博客:广义相对论与黎曼几何

爱因斯坦建立的引力场方程,是广义相对论定量描述引力、时空和物质的统一性的理论手段,在宇宙学研究中具有重要作用。这个引力场方程

Gmn =Rmn-1/2gmnR=8πG/c4)Tmn

是一个二阶张量方程,其中Rmn为里奇张量,它由黎曼几何张量缩并而成,表示曲率,意味着空间的弯曲状况;Tmn为能量-动量张量,表示物质(质量)分布和运动状况,意味着描述的是能量流、动量流及其应力;gmn为3+1维时空的度规张量,称为爱因斯坦张量;G是重力常数,c是真空中光速,8πG/c4称为系数,可由低速的牛顿理论来确定。

方程的意义是:空间物质的能量-动量(Tmn)分布=空间的弯曲状况(Rmn)。其解的形式是:

ds2=Adt2+Bdr2+Cdq2+Ddφ2

式中A,B,C,D为度规gmn分量。考虑能量-动量张量Tmn的解比较复杂,最简单就是让Tmn等于0。对于真空静止球对称外部的情况,得到了施瓦西解。如果是该球体内部的情况,或者是考虑球体轴对称的旋转,就稍微复杂一点。考虑星云内部或外部的情况,星云内的星球还要运动、转动等,这些因素都要影响到星云内部的曲面空间。

含宇宙常数项的场方程

Rmn- 1/2gmnR)+ Λgmn = 8πG/c4Tmn

Λ是宇宙常数,其物理意义是宇宙真空场。Λgmn为宇宙项,如果从数学上理解,则由这个场方程得到的解也是:

ds= Adt+ Bdr+ Cdq+ Ddφ2

ds表达空间弯曲程度的一小段距离。由于4维空间与时间有关,ds是随时间变化而变化的。如果没有宇宙项,ds随时间是增大的,宇宙就是膨胀的;而当加了宇宙项,选取适当Λ值,ds不随时间变化,宇宙就是稳定的。从物理的意义上理解,把宇宙项移到方程式的右边,变为:

Rmn-1/2gmn R)=8πG/c4)Tmngmn

Λ项为负值,起到了斥力的作用,即宇宙真空场与普通物质场之间存在着斥力。宇宙项和通常物质场的引力作用起到了平衡的作用,所以可得到稳定的宇宙解。

爱因斯坦于1905年发表狭义相对论之后,开始着首如何将引力纳入狭义相对论框架的思考。他以一个处在自由落体状态的观察者设计理想实验开展分析,从1907年开始用了长达8年时间探索引力的相对性理论。在历经多次弯路和错误之后,他于1915年11月在普鲁士科学院作了发言,其内容正是著名的爱因斯坦引力场方程。这个方程式的左边表达的是时空弯曲的状态,右边表达的是物质及其运动。正如惠勒所说:“物质告诉时空怎么弯曲,时空告诉物质怎么运动。”他把时间、空间和物质、运动这四个自然界最基本的物理量联系了起来,具有非常重要的意义。引力场方程是一个二阶非线性偏微分方程组,数学上想要求得方程的解是一件非常困难的事。爱因斯坦曾经用了很多近似方法,从引力场方程得出了几个最初的预言。

场方程的非线性特质使得广义相对论与其他物理学理论迥异。例如,电磁学的麦克斯韦方程组,其电场、磁场以及电荷、电流的分布是呈线性关系(两个解的线性叠加仍然是一个解);又如量子力学中的薛定谔方程,对于概率波函数也是线性的。

透过弱场近似或慢速近似,可以从场方程转化为牛顿重力定律。事实上,场方程中的比例常数8πG/c4是经过这两个方面的近似,以跟牛顿重力理论做连结统一而得出的。这个场方程的解不可能反映宇宙的多样性,也不能作为宇宙有限无限性的唯一判据。在广义相对论中,物体的速度与质量有直接关系,速度会影响引力。

以下是张天蓉老师的系列科普文章《广义相对论与黎曼几何》,这里的收藏做了一些删减,不影响原文的意思表达。

1.曲率和

欧几里德几何诞生于公元前,距今已有2000多年。16世纪笛卡儿将坐标的概念引入几何,建立了解析几何。18世纪前半页,法国数学家亚历克西斯·克莱洛等人创立了微分几何,而曲率和挠率是微分几何中最重要的基本概念。

1:克莱洛及双重曲率

理解曲率需要引人曲线的切线或称“切矢量”的概念,即曲线上两点无限接近时它们的连线的极限位置所决定的那个矢量(图1)。曲率是切矢量方向的变化率(切矢量的旋转速率),切矢量旋转得越快,曲线的弯曲程度也越大。所以,曲率的几何意义就是曲线的切矢量对于弧长的旋转速度。

就平面曲线而言,如果每一点的曲率已经确定,这条曲线的形状也就确定了。任意一个圆上的每个点的曲率都一样,等于它的半径的倒数。圆的半径越小,倒数则大,因而曲率也越大;反之亦然。考虑平面螺旋线(图2a),从内到外近似于一个一个从小到大的圆,它的曲率是中心大边沿小。如果平面螺旋线象一个平面上的锥形弹簧,它的三维形状如图2b,是一条三维曲线。

图2:空间曲线的挠率

将平面螺旋线放在三维空间中(图2c),可以对曲线上每个点定义一个由3个矢量组成的三维标架。令曲线的切线方向为T,在曲线所在的平面上有一个与T垂直的方向N(对于圆周,N指向圆心)。平面内与切线T垂直的矢量有无穷多条,它们都可称为曲线在该点的法线,这些法线构成一个平面,叫做通过该点的法平面,而N称之为曲线在该点的主法线。由切线T和主法线N,使用右手定则可以定义出三维空间中的另一个矢量B,B也是法线之一,称之为次法线。从图2c很容易看出,螺旋线上每个点的切矢量T和主法线N的方向都逐点变化,唯独次法线B的方向不变。推广到一般:一条平面曲线上每个点的次法线都指向同一个方向,即指向与该平面垂直的方向。

对于空间曲线,它象是平面螺旋线逐渐被拉开的,在每一点的次法线方向便会从原来的垂直线逐渐发生偏离。也可以说,次法线的方向处在与曲线“密切相贴”的那个平面。这个密切相贴的平面逐点不一样,称为曲线在该点的“密切平面”(图2d)。一般三维曲线上的不同点,三个标架T、N、B的方向都有所不同,每一点的次法线B的方向也会变化,但它仍与该点的密切平面垂直。

因为空间曲线与平面曲线的不同,克莱洛认为需要用另外一个曲率即“挠率”的几何量来表征这种差别。换言之,挠率可以表示曲线偏离平面曲线的程度,被定义为次法线B随弧长变化的速率。

2.牛顿引力

引力是一种颇为神秘的作用力,它存在于任何具有质量的两个物体之间。然而,除了巨大质量的星体产生的引力能够被观测到之外,一般物体的引力很难被探测到。人类对引力的本质仍然知之甚少,不像电磁场、电磁波或光可以通过产生、接受、控制来研究和理解,我们对引力的了解还差得太远。

万有引力定律是理解引力的第一个里程碑。这个定律说的是任意两个物体之间都存在相互吸引力,力的大小与它们的质量乘积成正比,与它们距离的平方成反比。其比例系数(引力常数)G是个很小的数值,致于到底多大,牛顿自己也搞不清楚,一直到牛顿死后70年左右,才被英国物理学家亨利·卡文迪什用一个很巧妙的扭秤方法测量出来。现公认

= 6.67×10-11N·m2/kg2

按照这个数值计算,两个50公斤成人之间距离1米时的万有引力只有十万分之一克。

牛顿当时还研究了地球的形状。从理论上(将惯性离心力分解,如图3a所示)推测地球不是一个很圆的球形,而是一个在赤道处略为隆起、两极略为扁平的椭球体。当时在学界也有相反观点,卡西尼根据其他一些理论,认为地球是个长椭球。为此,法国科学院测量队进行1年多的远征,对地球进行弧度测量,证实地球确实为一扁形椭球体,赤道半径要比极半径长出20多公里。

3:地球自转对地球形状的影响

克莱洛从1745年开始研究太阳、地球、月亮的三体问题。牛顿定律用于解决二体问题不难,但对三体就显得异常复杂。后来经庞加莱研究,得知这个问题实际上与复杂的混沌现象有关。克莱洛算了月球轨道、远地点和近地点等,有趣的是,他的计算结果认为牛顿重力理论的平方反比定律是错误的,建议用“与半径4次方成反比”作为修正,并得到欧拉的支持。1748年,克莱洛意识到,月球远地点的观察数据与理论计算之间的差异是来自所作近似不太恰当,于是在1749年宣布,现在的理论计算结果是与平方反比定律相符合的。

万有引力遵循平方反比律,其实可能大有缘由。静电力和引力相仿,也遵循平方反比律,还有诸如光线、辐射、声音的传播等,都由平方反比规律决定。为什么刚好是平方反比,难道大自然总是以一种高明而又简略的方式来设置自然规律?时间的积累和科学家们的努力,部分回答了这个问题。人们逐渐认识到,这个平方反比率不是随意选定的,它与空间维数为3有关。

4:点信号源的传播服从平方反比律

在各向同性的3维空间中,任何一种点信号源的传播都将服从平方反比定律,这是由空间的几何性质决定的。如图4,辐射可以用从点S发出的射线表示。一个点源在一定时间间隔内所发射的能量S是一定的,这份能量S向各个方向传播,不同时间到达不同大小的球面。当距离r呈线性增加时,球面面积4pr2却是以平方规律增长。同样一份能量,分配的面积越来越大,单位面积的能量就越来越少。比如说场强I=S/(4pr2),当距离由r变成2r时,同样能量的覆盖面增大4倍,因而使强度变成了1/4。这个结论也就是场强的平方反比定律。

现代矢量分析及场论可以对平方反比律解释得更深入一些。简略说,服从平方反比律的场,是“无旋”的、保守力的场,是有心力、无源处的场,它的散度为0,场强可以表示为某个标量的梯度,做功与路径无关,等等。按场论的观点,在n维欧氏空间中,场强的变化与r(n-1)成反比,当n=3时,便简化到平方反比定律。

追溯万有引力的平方反比定律的发现历史,便扯出了牛顿与胡克间的著名公案。胡克对万有引力的发现及物理学的其它方面都做出了不朽的贡献,然而现在一般人除了知道“胡克定律”之外,恐怕就说不清楚胡克是谁了。胡克与牛顿在万有引力的发现问题上有很多议论,这都无可奈何,成者为王败者寇,学术界也基本如此,正如胡克所说,“利益没有良心”。

3.曲面的微分几何

用微积分的方法对曲线及曲面进行研究,除了欧拉、克莱洛等人的贡献之外,蒙日的工作举足轻重。由于微分几何与微分方程的研究紧密结合,大大促进了微分方程,特别是偏微分方程理论的进展。

由曲率和挠率在空间的变化规律所完全决定的空间曲线,它可以用一个点在空间移动而得到。假如不是一个点,而是一条曲线在空间移动,那么得到的将是一个嵌在三维空间的曲面。

由一条直线在空间平滑移动产生的曲面叫“直纹面”。尺子(直线)两端A、B沿曲线C1和C2移动,形成一个直纹面。尺子移动的方式可以多种多样,能形成各种不同的直纹面(图5)。

5:各种直纹面

柱面、锥面和切线面这三种直纹面具有一个共同特性:可以展开成平面。将圆柱形或锥形沿轴(母线)剪开,得到的图形平摊在桌面上没有任何皱褶,这样的曲面叫做“可展曲面”。切线面也是一种可展曲面。双曲面、螺旋面、马鞍面等都不是可展曲面。可以证明,可展曲面只有以上三种直纹面。概括讲,可展曲面都是直纹面,但直纹面却不一定可展。球面不是直纹面,球面也是不可展的。

一个曲面是否可展在物理学上很重要,比一个曲面是否为直纹面要重要得多,因为物理学家们需要知道,是什么几何量决定了曲面的可展性。

曲率和挠率这两个几何量决定曲线在三维空间中某一点的形态。由于曲线都是可展的,我们可以将定义曲线的曲率概念应用到曲面的微分几何研究之中。对于曲面上的一个给定点G,能画出无限多条曲面上的曲线,因而可以作出无限多条切线。这些切线都在同一个平面上,称为曲面在这点的切平面。通过该切点与切平面垂直的直线叫做曲面在这点的法线。

过法线可以作出无限多个平面,其中每一个平面都与曲面相交于一条平面曲线C,于是可以定义平面曲线C在G点的曲率(图6a所示)。设曲线C1、C2…在G点的曲率分别为Q1、Q2…,在(Q1、Q2…)中的最大值和最小值,叫做曲面在点G的主曲率。这两个主曲率的切线方向(或两个法平面方向)总是互相垂直的。这是大数学家欧拉在1760年得到的一个结论,称之为曲面的两个主方向。从图6右边两图可以看到,两个主曲率可正可负。当曲线转向与平面给定法向量相同方向时,曲率取正值,否则取负值。


图6:曲面的两个主曲率

综上所述归纳如下:

①.就曲线而言,任意一条空间曲线都是可展的,都可以伸展为一条直线。不同的空间曲线只是由它们“嵌入3维空间”时的弯曲和扭曲程度而区分。如果定域在曲线上看,所有的曲线都是一样的,都与直线具有同样的几何性质。换言之,如果有一种极小的蚂蚁生活在一条空间曲线上,它在曲线上不能知道周围空间的任何信息,那么,它就感觉不出它的曲线世界与其它的曲线(或直线)有任何的不同。

②.曲面有可展与不可展之分。一个球面是不可展的,而柱面、锥面可展,它具有与平面完全相同的内在几何性质。假如有一种生活在柱面上的生物,它会觉得与生活在平面上是一模一样的。但是,球面生物能感觉到几何上的差异。比如说,柱面生物在它的柱面世界中画一个三角形,三个内角之和等于180度,这个结论与平面生物得到的一致。球面生物在它的世界中画一个三角形,如果把三个角加起来,要大于180度。

这种与曲面嵌入3维空间的弯曲方式无关,只研究所谓曲面本身上的几何,叫做内蕴几何。高斯是研究内蕴几何之第一人。他抓住了微分几何中最重要的概念,建立了曲面的内在几何,奠定了近代形式曲面论的基础,使微分几何成了一门独立的学科。

4.内蕴几何

高斯在1827年所著《关于曲面的一般研究》发展了内蕴几何。所谓“内蕴”,是相对于“外嵌”而言,指曲面(或曲线)不依赖于它在三维空间中嵌入方式的某些性质。从物理意义上讲,一个观察者在自己生活的物理空间所能观察和测量到的几何性质就是这个空间的内蕴性质。

一条直线可以在3维空间任意弯曲,即随意改变它的曲率和挠率,生活在直线上的“点状蚂蚁”观察不到这些“弯来绕去”,能测量到的只是弧长。但是,弧长与曲线嵌入空间中的弯曲情况无关,所以这是个内蕴几何量。空间曲线的曲率和挠率是在三维空间中观察“蚂蚁曲线”时得到的重要性质,这并不是内蕴几何量。对曲面来说也是如此。

由于所有空间曲线的内在性质都与直线相同,也就是曲线除了弧长再没有其它内蕴几何性质。因此,内蕴几何主要研究曲面的性质。既然弧长是内蕴的,由弧长所导出曲面上的面积、夹角等其它几何量也是内蕴的。(计算弧长按勾股定理先设计一小段,再利用计算公式进行积分。)由此可定义曲面的等距变换,即保持弧长不变的变换。曲面的内蕴几何量都是等距变换下的不变量,或者说,根据计算弧长的公式(称曲面第一基本公式)可以建立起曲面的内蕴几何。

空间曲线的曲率和挠率不是内蕴的,对于曲面,可以由两个主曲率定义“平均曲率”。研究发现,主曲率和平均曲率也都不是内蕴几何量。直观地看,柱面和锥面等可展曲面应该与平面有相同的内蕴几何,而球面一类的不可展曲面,代表了另外种类的几何。高斯注意到,虽然主曲率和平均曲率不是内蕴的,但从几何直观上看,应该存在某种“内蕴曲率”。

7:高斯映射和高斯曲率

高斯通过研究曲面在一个给定点及其附近邻域的法线方向,定义了高斯映射,继而再定义了曲面的内蕴曲率,即高斯曲率。如图7a所示,高斯映射将曲面在一个给定点P及其附近邻域(总面积为A)的法线矢量,保持原来的方向将端点平移到原点,这些法线与单位球面相交于一块面积为B的图形。高斯认为,面积B与面积A的比值可以代表曲面在P的内蕴弯曲程度(定义为高斯曲率)。

高斯曲率为什么能代表曲面的内在弯曲度,可以这样理解:如果曲面是一个平面,那么p点附近所有法线都指向同一个方向,高斯映射将整个平面映射为单位球上的一个点,因此面积B为0,从而得到平面的高斯曲率为0。如果曲面是一个柱面,高斯映射是单位球面上的一个圆(注:高斯映射应该是单位球面上的一条线段),圆(线段)的面积也是0,柱面的高斯曲率也为0。考虑半径为r的球面的情形(图7c),根据高斯曲率K的计算公式,K=B/A=1/r2,可见r越大,高斯曲率越小,这符合我们对球面内蕴曲率的直观理解。

高斯曲率与主曲率有一个简单关系:高斯曲率就等于两个主曲率的乘积。对柱面、锥面、切线面这三种可展曲面,曲率的最小值为0,因此两个主曲率相乘而得到的高斯曲率也为0。高斯曲率表明,三维空间中曲面在每一点的曲率不随曲面的等距变换而变化(绝妙定理),也就是说,高斯曲率是一个内蕴几何量。

绝妙定理绝妙之处在于它提出并证明了内蕴几何这个几何史上全新的概念,它说明曲面并不仅仅是嵌入三维欧氏空间的一个子图形,曲面本身就是一个空间,这个空间独立于外界3维空间而存在,有它自身内在的几何学。

图8:内蕴几何是测地员(或“爬虫”)观察到的几何

图8b是生存在各种类型曲面空间中的“爬虫生物”所观察到的几何。在图8b中,平面是一个2维的欧氏空间,而球面和双曲面则是非欧氏空间。

5.黎曼几何

高斯以他的“绝妙定理”建立了曲面内在的微分几何,高斯的得意门生黎曼将曲面的概念扩展到流形,使内蕴几何扩展到n维的一般情形,形成了黎曼几何。黎曼在演讲论文《论作为几何基础的假设》中提出了一大堆陌生概念,开创了一种崭新的几何体系。据说当时在黎曼就职演讲的听众中,唯有高斯听懂了黎曼在说些什么。

根据曲面第一基本形式(曲面上计算弧长的公式),可以建立起曲面的内蕴几何。三维空间中两个参数u和v所描述的曲面的第一形式可用下式表达:

ds2= E du2+ 2F dudv+ G dv2

9:平面(ab)和球面(c)上的弧长(微分)表达式

上式中的E、F、G是曲面第一基本形式的系数。黎曼将二维曲面的概念扩展为“n维流形”,将E、F、G等系数扩展为定义在n维黎曼流形上每一点p的“黎曼度规”gij(p):

有了度规,就有了度量空间长度的某种方法,能够测量和计算距离、角度、面积等几何量,从而建立流形上的几何学。从图9中平面和球面上的弧长微分计算公式,能对黎曼度规gij得到一点直观印象。在二维平面和二维球面的弧长微分公式中,下指标i和j的取值从1到2,可以将度规gij写成2×2的矩阵形式:

上面3种情况下的度规意义是:

①.平面直角坐标的度规是个简单的dij函数(i等于j时为1,否则为0),对整个平面所有的p点都是一样的;

②.平面极坐标的度规对整个平面不是常数,随点p的r不同而不同;

③.球面坐标上的度规也不是常数。

由①和②可知,同样是描述平面,如果所选坐标系不同,度规也将不同。由于平面极坐标和直角坐标可以互换,所以②的极坐标度规可以变换成①的dij函数形式的度规。对③的球面度规是否可以变换成如①的那种d函数形式的度规?答案是否定的。也就是说,在ds保持不变的情形下,无论你作何种坐标变换,都不可能将球面的度规变成①所示的d形式。由此表明,球面的内在弯曲性质无法通过坐标变换而消除,黎曼度规可以区分平面、球面或其它空间的内在弯曲状况。

一般来说,黎曼流形上每一点p的黎曼度规gij(p)随p点的不同而不同,这种以空间中的点为变量的物理量叫做“场”。黎曼度规gij(p)具有两个指标(i和j),在坐标变换下是按一定规律变化的几何量,叫做二阶张量,gij(p)是黎曼流形上的2阶张量场。不难看出,对n维流形上的点p,gij(p)在给定的坐标系中有n2个分量,可以表示成一个n×n的矩阵。除了2阶张量场,黎曼流形上也能定义0阶张量(标量)场、1阶张量(矢量)场、3阶、4阶以及更高阶的张量场。

张量在物理及工程上应用广泛,尤其是“矢量”的概念,包括速度、加速度、力、电流、水流、电场、磁场等等,这些既有方向,又有大小的物理量,都可以用矢量来表示。n维空间的矢量有n个分量,标量则只有1个分量。

如果一个黎曼流形上每一点的度规张量都可以写成dij函数形式,则称之为“平”流形。流形“平”或“不平”,定义在它上面的几何规律将完全不同。

黎曼将二维曲面的球面几何、双曲几何(罗巴切夫斯基几何)、欧氏几何,统一在下述黎曼度规表达式中(公式a是2维曲面的高斯曲率):


如同嵌入三维空间中的二维曲面大多是不可展一样,流形的多数也不是“平”的。高斯曲率用来描述平面和“不可展”曲面的差异,黎曼将曲率的概念扩展为“黎曼曲率张量”。

黎曼流形上在某一点的切空间,一般情况下n维流形只考虑n≥3,因为人类大脑想象不出、计算机也画不出更高维“不平坦”流形是什么样子,所以只好用嵌入3维空间的2维曲面来表示“弯曲”流形(如图10所示)。

10:流形和过每一点的切空间

6.平行移动和协变微分

所谓平行移动,就是将一个矢量按平行于自身的方向沿空间的一条曲线移动。这种沿着某条曲线的平行移动,可以看成是由许多沿着无穷小的一段弧长ds平行移动的连续操作而构成的。因此,首先需要理解“平行移动无穷小弧长ds”的意义。“无穷小”与微分有关,涉及流形中矢量场的“导数”概念。

黎曼流形上定义的张量场,就是流形上每个点都有的物理量(张量),包括标量、矢量、二阶以上张量等。如果用n维空间的坐标表示张量的分量,标量是1个数,矢量是n个数,2阶张量是n2个数,3阶张量是n3个数,依次类推。根据分量数目的这种规律,可以将坐标系中的张量分量用取值从1到n的指标i、j、k…来表示。比如标量f,不需要指标,为0阶张量;矢量Vi,1个指标,为1阶张量;有两个指标的度规张量gij是二阶张量;4阶张量Rijkr有4个指标。

必须注意,分量数目符合上述规律的物理量不一定是张量,只有当坐标变换时,张量的分量按照某种相关的规律变化,才能称之为张量。另外,张量的指标i、j、k等,有的在上,有的在下,这只是一种约定俗成,分别指“逆变”和“协变”。例如某矢量,如果它的分量按照和坐标基矢ei相同的变换规律“协调一致”地变换,这样的矢量叫做协变矢量,指标写在下面,记为Vi。如果某矢量的分量按照和坐标基矢ei变换的“转置逆矩阵”的规律而变换,这样的矢量叫做逆变矢量,指标写在上,记为Vi。其它阶张量指标按类似约定来分成“协变”或“逆变”,从而决定该指标写在“下”或“上”。


图11:任意坐标下的协变矢量和逆变矢量

图11给出了协变矢量和逆变矢量的直观几何意义。同一个矢量V,可以用对坐标平行投影的方法表示成逆变矢量,也可以用对垂直坐标投影的方法表示成协变矢量。对直角坐标系而言,两种坐标系是一样的,所以没有“协变量”、“逆变量”的区别。

张量的变换规律决定了张量的一个重要性质:如果在某个坐标系中,一个张量是0,那么,这个张量在其它坐标系中也是0。也就是说,张量是独立于坐标而存在的。这一点对于物理定律的描述很重要,因为物理定律也是不依赖于坐标的,坐标只是为了计算的需要而被引入,而物理定律往往用一个方程式(右边等于0)表示。张量0可以不依赖于参照系选择,与矢量的原始定义是相恰的。矢量同时具有大小和方向,它并没有什么坐标牵扯进来。在一定的坐标系,V可以表示成坐标基矢ei(或者ei)的线性组合:

V = Vie= Viei

这个表达式已约定俗成,叫做爱因斯坦约定。它表示,如果指标i在式子中出现两次(一上一下),即指对指标的所有可能取值求和。矢量(张量)的协变分量和逆变分量可以通过度规张量gij互相转换:

V= gijVj

假设V = Vie= Viei描述的是欧氏空间的一个矢量场V,使用笛卡尔直角坐标系,基矢ei是整个空间不变的,对V的导数只需要对Vi求导就可以了。但是,对一般的流形(平坦空间的曲线坐标或者不平坦的任意度规),坐标架和基矢ei都逐点变化,对V的导数还必须考虑ei的导数。一般来说,ei的导数仍然是ei的线性组合,将其系数记为Gmab,叫做克里斯托费尔符号。

度规张量gij实际上是坐标基矢ei的内积:gij = ei·ej。因此,由坐标基矢之导数定义的克里斯托费尔符号与度规张量以及度规张量的导数有关。

7.二维曲面上的平行移动和曲率

根据“无限小”平行移动公式,矢量的平行移动是将矢量的坐标分量作相应改变。这可由几个简单例子作直观理解。


图12:平行移动举例

如图12a,将锥面从顶点剪开后重新展开成一个平面图形。这个平面图形与欧氏平面的区别在A和B是锥面上的同一点,因此,直线OA和OB被理解为是同一条线。图15a中右方的闭合曲线C1没有包含顶点O,曲线C1所在的区域和欧氏平面没有任何区别。当一个矢量平行于自身沿C1经过点(1-2-3-4-5-1)逆时针绕行一周后,和原来在平面上绕行一周一样,方向不会改变。但是,如果矢量是沿着左边的曲线C2平行移动,由于C2包括了顶点O,矢量在绕行过程中必然要碰到直线OA。假设矢量从B点出发时的方向垂直于OB,由于A、B、1三个点其实是同一个点,所以出发时的矢量方向也是垂直于OA的。当矢量经过点2、3、4到达5时,应该保持和原来相同的方向。客观上点5就在直线OA上,但在OA和OB之间剪去了一个角,平行移动到点5时,矢量并不垂直于OA,而OA和OB又是同一条线,所以最后的矢量与OB也不垂直。这种产生矢量变化的原因在于平面被剪去一角后成为锥面,使得绕行C2一周在平面上并没有绕过360度,而是少走了一个角度,导致矢量平行移动后产生了“角度亏损”。

因此,任何矢量在锥面上作平行移动的规律很简单:如果绕行的回路中没有顶点,矢量方向不变;如果回路包括了顶点,则将产生一个固定的角度亏损,这个角度差别取决于锥形的形状。

矢量平行移动一周之后产生的角度亏损与绕行曲线所包围的区域的弯曲性质有关,如果那块区域是完全平坦的,则没有角度亏损。换言之,角度亏损是被包围的区域中的“不平坦”产生的。对于锥面的情况,不平坦的来源是顶点。a的圆Ca

地球是一个球面,我们更感兴趣在球面上的平行移动。在图12b中,赋予球面经纬坐标,考虑纬度为a的圆Ca,球面上的矢量沿圆Ca的平行移动可简化为锥面上的平行移动,这好比给球面带上一顶刚好与Ca相切的锥形帽子。因此,球面上沿Ca平行移动的角度亏损等于沿锥面平行移动的角度亏损。这个角度差与锥形“帽子被剪去”有关,它与纬度a的关系是:矢量顺时针平行移动后,其方向以顺时针方向旋转了2πsina,相应的角度亏损为2π(1-sina)。如果纬度a变大,圆周Ca向上方移动且变小,锥形帽子剪去的角度也就更小,锥形变得更平坦,因而使得平行移动后的角度亏损也更小。

物理上,球面平行移动的计算可以用来解释傅科摆现象(图12c)。傅科摆是证明地球自转的一种简单设备,根据法国物理学家莱昂·傅科而命名。考虑悬挂在位于纬度为a处的单摆,因为地球绕着南极北极的轴自转,单摆上方的固定点将和地球一起转动,而摆平面的方向却是相对自由的。如果用一个矢量V来表示摆平面的方向,在以太阳为参考系的观测者看起来,当地球自转一周时,矢量V沿着纬度为a处的纬圈平行移动了一圈。根据刚才对球面上平行移动的分析可知,矢量V平行移动一圈之后,将和原来的方向相差一个角度(2πsina这正是被傅科摆实验证实了的摆平面旋转的角度)。

由以上分析知道,矢量沿a纬圈平行移动一圈的角度亏损为2π(1-sina),这个角度亏损来源于所包围区域的“不平坦”性的总和。如果绕行的圆圈越小,角度亏损也越小。在北极(或南极)附近,纬度a靠近90°的地方,圆圈的面积接近0,角度亏损也接近0。因为球面的对称性,它处处的“不平坦”程度都是一样的,所以在球面上将任何矢量平行移动一圈回到出发点后的角度亏损很容易计算:角度亏损q正比于闭曲线所包围的区域面积A。

对于一般的2维曲面,上述“角度亏损q正比于区域面积A”的结论在大范围内不能成立,但在2维曲面某个给定的P点附近,当绕行的回路趋近于无限小的时候仍然成立。也就是说:无限小的角度亏损dq将正比于无限小的区域面积dA。

高斯曲率是根据高斯映射来定义的,高斯映射也涉及到平行移动,只是说法不太一样。有了黎曼流形上矢量平行移动的概念,就可以用平行移动来重新定义二维曲面上的内蕴曲率R。

矢量绕曲面上P点附近无限小的一块区域平行移动后,产生的角度亏损dq将正比于区域的面积dA,即

dq  = RdA

这里的比例系数R,被定义为2维曲面在P点的曲率。对半径为r的球面:2π(1-cos(da))= Rπ(dr)2,其中dr = r×da,于是可以解出球面的曲率R=1/r2。对剪去一个有限角度d而形成的锥面,只要绕过的区域包含了顶点,角度亏损便都固定等于d,无论面积dA取得多小。因此,锥面上顶点处的曲率等于无穷大,其余点的曲率为0。

按照定义,曲率R可正可负。如果矢量沿着闭合曲线逆时针方向平行移动一周后得到逆时针方向的角度变化,或者顺时针方向平行移动后得到顺时针方向的角度变化,得到的曲率为正,否则为负。马鞍面是曲率为负值的二维曲面例子。

8.测地线和曲率张量

平行移动的概念不仅可以被用来定义曲面的曲率,也可以被用来定义测地线。

测地线是欧氏几何中“直线”概念在黎曼几何中的推广。按欧氏几何,直线是两点之间最短的连线,这可用“切矢量方向不变”来定义。将后一种说法稍加改动,便可直接推广到黎曼几何中:“如果一条曲线的切矢量关于曲线自己是平行移动的,则该曲线为测地线。”

图13:在纬度a的圆上以及在赤道上切矢量的平行移动有所不同

切矢量的平行移动与矢量的平行移动类同。一般来说,沿着球面上纬度为a的圆的平行移动等效于在一个锥面“帽子”上的平行移动。然而,当a=0时(对应于赤道),锥面变成了柱面,因而可以将锥面或柱面(赤道)展开成平面来研究球面上的平行移动。图13的中图和右图分别是锥面和柱面展开的平面上平行移动的示意图。可以看出,切矢量的平行移动对a=0(赤道)和a>0(非赤道)两种情形有所不同。对于小于赤道的圆,从锥面展开的平面图可知,点1的切矢量平行移动到2、3、4等各点后不一定再是切矢量;而赤道在柱面展开的平面图中是一条直线,点1的切矢量平行移动到各点后仍然是切矢量。在赤道上(大圆)的切矢量平行移动后仍然是切矢量,这符合测地线的定义,因此所有大圆都是球面上的测地线。

测地线是否一定是短程线,在欧氏空间是肯定的,在一般的黎曼空间不一定如此。比如球面上,连接两点的测地线至少有两条(大圆的两段),那条小于180°的圆弧是短程线,而另一条就不是短程线了。从局部考虑,对于充分接近的两个点,测地线是最短曲线。

二维曲面上一点P的曲率R,被定义为“任意矢量沿曲面上无限小的闭曲线平行移动后的角度亏损对闭曲线所包围之面积的导数”,即标量曲率R=dq/dA。这包含了如下几点涵义:曲率R是局部的,随点P位置的变化而变化;曲率R的定义依赖于一个2维曲面;曲率R的定义与某个角度亏损有关。这个亏损了的角度,就是矢量的方向平行移动后相对于原来的方向绕某一个轴转动的角度。

如果在2维曲面上的每个点能定义一个曲率R,我们就说定义了2维曲面上的一个标量曲率场。考虑一般的n维黎曼流形,需要将上述的曲率概念加以推广。但是,如果按照2维曲率定义的方法,当n大于2时,不只是一个曲率值,而是可以定义多个曲率数值。其原因在于,过高维空间中一点的二维面不止一个,考虑角度亏损也不只有一个角度亏损值。相对于每一个可能存在的转轴,都将有一个所谓角度亏损值。如此一来,n维流形上每一个点的曲率需要不止一个数值来描述。为了解决这个困难,在每个点的切空间中定义一个曲率张量,即赋予黎曼流形上一个曲率张量场。

那么,这个曲率张量的阶数是多少,或者说,这个曲率张量需要几个指标才能表征n维黎曼流形在一个给定点的内蕴弯曲度,我们可以用如下的方法将2维空间标量曲率概念推广到n维以上的流形。


图14:黎曼曲率张量和平行移动

首先,考虑n维流形中的矢量V在P点附近的平行移动方式,是可以沿着过P点的任何一个2维子流形的回路平行移动。在图14中,V是在由坐标xm和dxn表示的曲面上沿着dxm、dxn、-dxm、-dxn围成的四边形回路平行移动。当V绕回路一圈返回原点时将和原来矢量不一样,得到了一个改变量dV。类比于标量曲率R的定义,矢量的这个增量应该正比于平行移动的路径所围成的面积(面积是dxmdxn)。此外,增矢量dV与原矢量V有关,考虑dV和V方向上的差异,增量dV的逆变分量dVa可以写成如下形式:

dVa  = dxdxVgRamg

这里将平行移动一周之后的微小变化用符号d表示,以区别于坐标的线性微分增量dx或dxn。式中的比例系数Ramg便是黎曼曲率张量。所涉及的四个指标,其中m和n对应于平行移动路径所在的2维曲面,另外两个指标a和g分别表示矢量增量dV及原来矢量V的逆变指标。公式右边的重复指标m、n和g是求和的意思,遵循“爱因斯坦约定”。

黎曼曲率张量是个四阶张量,对n维空间,四个指标都可以从1变化到n,因而分量数目很多。利用对称性的性质,独立分量的数目大大减少,只有n2(n2-1)/12个。当n=4时有20个独立分量;当n=2时,曲率只有一个独立分量,即2维曲面的高斯曲率。

在黎曼几何中有多种方式理解和定义内在曲率。本来是同一个东西,从不同角度看可以加深理解。用平行移动概念来定义的四阶黎曼曲率张量Ramg是定义曲率最标准的形式;“截面曲率”被定义为n维流形过给定点的所有2维截面高斯曲率的总和,截面曲率等效于黎曼曲率张量,与截面曲率有关的20个独立分量同样也是内蕴曲率的完整描述。

爱因斯坦的引力场方程用的是另外两个称之为里奇曲率的几何量:里奇曲率张量Rμν和里奇曲率标量R。这两个曲率是通过上述黎曼曲率张量的指标缩并而得到的。缩并就是将矩阵只用一个数(它的trace)来表示,缩并后,原来的n2个矩阵就变成了n2个数值,这就是所谓的里奇曲率张量。将里奇曲率张量的两个指标进一步缩,可化为一个标量= gμνRμν。在2维曲面情形下,R正好是高斯曲率的2倍。

高斯和黎曼的微分几何,强化的是流形的“内蕴”性质。遗憾的是我们无法用直观的图像来表达更为高维空间的这种内蕴性,唯一能加深和验证理解的直观工具就是想象嵌入在三维欧氏空间中的各种二维曲面。因此务必记住,在研究这些曲面的几何性质时,尽量不把它们当作三维欧氏空间中的子空间,而是把自己想象成生活在曲面上、只能看见这个曲面上发生的事件,当我们基于这个曲面进行测量或考虑问题时,涉及的几何量才是内蕴几何量。而要保持内蕴的思考,那就是:一切都得从度规张量出发。

理解黎曼几何和广义相对论的另一个重要原则是,物理规律与坐标系无关。尽管任何有用处的实际计算都是在某个坐标系进行的,但计算结果表达的物理定律却是独立于坐标而存在。这也是要将描述物理规律的方程式写成“张量”形式的原因,因为张量的坐标分量在坐标变换下是作线性齐次变换。线性表明张量属于切空间,齐次表明张量与坐标系选择无关。如果一个张量在某个坐标系下所有分量都是零,经过线性齐次变换后,它在任何坐标系中都将是零。

9.等效原理

狭义相对论是基于相对性原理和光速不变原理而建立的,它通过洛伦茨变换将麦克斯韦的电磁理论编织进新的时空理论之中。按照狭义相对论,时间和空间不再是独立而绝对的,而是由闵可夫斯基的四维时空将它们联系在一起。在这个理论框架内,所有相对作匀速运动的惯性参考系都是平权的,物理定律在任何惯性参考系中都具有相同的形式。但是,除了惯性参考系,还有非惯性参考系,一个在加速参考系中的物理规律是否适合惯性参考系?

从最基本的原理、最简单的情形出发来思考问题,从来就是爱因斯坦的特点。意大利的比萨斜塔,伽利略在这里做过“自由落体”实验,证明了地表引力场中一切自由落体都具有同样的加速度。后来有人质疑伽利略的斜塔实验,但这并不重要。关键是斜塔实验所证明的物理规律是公认的,之后的多次类似实验也是相符合的。1971年,阿波罗15号宇航员大卫·斯科特在月球上将一把锤子和一根羽毛同时扔出,两样东西也是同时落“地”。爱因斯坦认识到这条定律的重要性,因为它首先可以被表述为“惯性质量等于引力质量”,进一步的推论可以得到加速度与引力间的等效原理。

何谓惯性质量,何谓引力质量?简言之,牛顿第二定律F=ma中的m是惯性质量,它表征物体的惯性(抵抗速度变化的能力),而引力质量则是决定作用在物体上引力(如重力)大小的一个参数。在自由落体实验中,与引力质量成正比的地球引力,克服惯性质量而引起了物体的加速度,这个加速度应该正比于两个质量的比值。正如实验所证实的,下落加速度对所有物体都一样,两个质量的比值也对所有物体都一样。既然对所有物体都相同,两者的比例系数便可以选为1,说明这两个质量实际上是同一个东西。这个看起来平淡无奇的结论却激发了爱因斯塔的好奇心,他认为其中也许深藏着惯性和引力之间的奥秘。

图15:等效原理

爱因斯坦设计了一个思想实验来探索这个奥秘。实验的基本思想是(图15):设想在没有重力的宇宙空间中,一个飞船以匀加速度g =9.8m/s2上升,这个上升加速度与地面上的重力加速度相等。关在飞船中看不到外面的观察者,将会感到一个向下的力。这种效应与我们坐汽车上的感觉一样,汽车向前加速,乘客会感觉一个相反方向(向后)的作用力,反之亦然。因此,图15的左a和右b中的人无法区分是在以匀加速度上升的飞船中,还是在地面的引力场中。换言之,加速度和引力场是等效的。

假如考虑有光线从水平方向射进飞船,由于飞船加速向上运动,光线在到达飞船另一侧时应该射在更低一些的位置。因此,飞船中的观察者看到的光线是一条向下弯曲的抛物线。而图b与图a是等效的,当光线通过引力场的时候,也应该和飞船中的光线一样呈向下弯曲的抛物线形状。也就是说,光线将由于引力的作用而弯曲。

光线在引力场中弯曲的现象可以从另一个角度来理解。可以认为不是光线弯曲了,而是引力场使得它周围的空间弯曲了。或者用相对论的术语表达,是“时空弯曲”了。光线是按照最短的路径传播,只不过在弯曲的时空里的最短路径已经不是原来的直线而已。

由引力与加速度等效,还可以推出另一个惊人的结论:引力可以通过选择一个适当的加速参考系来消除。比如说,一台突然断了缆绳的电梯,立即成为一个自由落体,以9.8m/s2的重力加速度下降,电梯中的人将会产生“失重感”。而且,不仅仅是有失重感觉,还会看到别的物体好像没有重量似的。也就是说,电梯下落的加速度抵消了地球的引力。爱因斯坦从中看出了暗藏的引力奥秘:引力与其它的力(比如电力)大不一样,因为我们不可能用诸如加速度这样的东西来抵消电磁力。为什么可以消除引力,也许引力根本可以不被当成一种力,而可能是弯曲时空本来就有的某种性质。这种将引力作为时空某种性质的奇思妙想,将爱因斯坦引向了广义相对论。

开始,爱因斯坦只是企图按照上面的思路将引力包括到狭义相对论的范畴,但他很快就意识到有大障碍。一个均匀的引力场的确可以等效于一个匀加速度参考系,而宇宙中并不存在真正均匀的引力场。按照万有引力定律,引力与距离成平方反比率,地球施加在我们头顶的力要比施加在双脚的力小一些,并且,引力的方向总是指向引力源的中心(即作用在物体右侧和左侧的引力方向不是绝对平行),地球表面“重力处处一样”只是一个近似。然而,要建立宇宙中引力的物理数学模型,就必须考虑这点了,因为在大尺度上,这种差异能产生明显的可见效应。例如,地球表面海洋的潮汐现象,就是因为月亮对地球的引力不是一个均匀引力场而形成的(图19a)。


图16:潮汐力、地球的引力

尽管爱因斯坦的思想实验描述了如何用一个匀加速参考系来抵消一个均匀的引力场,但实际上的引力场却是非均匀的,不可能使用任何参考系的变换来消除。图16b显示的是地球引力场,在四个方向需要用四个不同的匀加速参考系来作局部等效的近似描述。

这个问题困扰了爱因斯坦好几年,直到后来得到数学家格罗斯曼的帮助为止。根据格罗斯曼的介绍,爱因斯坦才惊奇地发现,早在半个世纪之前,黎曼等人就已经创造出了他所需要的数学工具。有了黎曼几何,爱因斯坦才顺利地开启了广义相对论的大门。

10.双生子佯谬

描述任何事件,除了要由3个值决定位置(地点),还有一个事件发生的时间问题。如果把时间当作另外一个维度,我们的世界便是4维的了,称之为4维时空。但时间和空间的物理意义终有区别,无法简单的完全一视同仁。

天才数学家庞加莱将四维时空中的时间维和空间维分别用实数和虚数来表示,3个实数坐标代表空间,1个虚数坐标描述时间,或者反过来使用也可以,只不过是一种约定。习惯上经常使用的是后者。闵可夫斯基发展了庞加莱想法,他用仿射空间来定义4维时空,可以在形式上用对称统一的方式处理时间和空间。这样一来,如同3维欧氏空间中的坐标旋转,洛伦茨变换成为4维时空中的一个双曲旋转。欧氏空间中的两个相邻点的间隔是一个正定二次式:

ds= dx2+dy2+dz2

这不适用于闵可夫斯基时空,因为时空中的坐标除了实数之外,还有了虚数。因此,在闵可夫斯基时空中两个相邻点间隔的平方变成了:

dt= dt2-dx2-dy2-dz2

这儿的dt被称为固有时。不同于欧几里德度规,闵可夫斯基时空的度规是“非正定”的。时间和空间的概念不同,空间是各向同性伸展的,空间位置可以随意移动,朝一个方向前进之后可以反向再回来。但是时间不同,它是单向性的,只能向前,不会倒流,否则便会破环因果律。也正是因为如此,狭义相对论引出了许多“佯谬”,其中“双生子佯谬”是最著名的一个,最早由朗之万在1911年提出。

假设一对刚出生双胞胎A和B(即哥哥刘天/弟弟刘地),A坐宇宙飞船去太空旅行,航速假定为光速的3/4;B则留在家里(地球上)过日子(图17)。按照相对论,飞船上与地球上的时间差异效应很明显。所谓“时钟变慢”,是一种物理效应,不仅仅是时钟,而是所有与时间有关的过程,诸如植物生长、细胞分裂、原子震荡,以及人的心跳、物体运动等所有过程都放慢了进程。现在是B在家里过了60年之后,A从太空返回了地球。根据“运动中的时间变短”,A只旅行了40个年头,仍然风华正茂,当他看到弟弟B,已是老态初现。人们要问,到底会不会是这种现象?这就是双生子佯谬问题。


图17:双生子佯谬和同时性

首先需要明确,狭义相对论并不认为所有的参考系都等同,只是认为惯性参考系才是等同的。A飞离地球和返回地球是两个阶段,每一段的过程相对地球都是匀速运动,都能够分别当作是惯性参考系。但就整个过程看,却不能共同作为一个统一的惯性参考系,即A出发与返回的整个过程并不是在一个惯性参考系。在图17b中,画出了一个时间轴t加一个空间轴x,(t,x)是地球参考系的坐标,兄弟A、B的时空过程分别用他们的“世界线”来表示。世界线是指事件在时空中所走的路径。B的世界线是沿着t轴,而A的世界线是一条折线。

考虑太空船掉头返回的加速或减速过程是必不可少的,关键是要把“固有时”概念搞清楚。


图18:固有时和坐标时的区别以及与弧长的类比

固有时或称原时。设想如图18a的旅行者(太空人)自己记录距离和时间,他的记录就是固有时(图18c)。从图18b可以看出固有时和坐标时的区别,坐标时是事件之外的观察者使用某个参考系而记录的事件发生的时间,固有时是旅行者自己的时钟记录的时间。

固有时与弧长不同,普通空间的弧长一般比坐标数值大,但固有时却比坐标时小。换言之,固有时用以描述时空中两个事件之间流过的时间,这个时间被赋予事件自身的时钟所测量。因而,测量结果不仅取决于两个事件对应的时空点位置,而且也取决于时钟参与其中的具体过程。更简节地说,固有时是时钟的世界线长度。

如何计算双胞胎在重逢时各自度过的真实年龄,结论是:计算和比较他们在两次相遇之间的固有时。因为固有时t是内蕴不变的,这个计算可以在任何一个参考系中进行,都将得到同样的结果。

11.四维时空

在科学史上,相对论引发诸多“佯谬”是绝无仅有的。除了双生子佯谬,还有滑梯佯谬、贝尔飞船佯谬、转盘佯谬等,以及它们的许多变种。这些佯谬的产生,都是出于对同时性、时钟变慢、长度收缩、相对性原理、不同参考系观察者、统一时空等概念的思考和质疑。时间和空间到底是什么?公元四世纪哲学家圣·奥古斯丁对“时间”有一句名言:“无人问时我知晓,欲求答案却茫然”。相对论是否部分地回答了这个问题,尽管众口难调,见仁见智,但相对论起码为我们提供了一种科学的思路和方法,使我们能从物理理论上较为详细地诠释这些概念,何况还有上百年来大量实验结果及天文观测数据的验证和支持。修正尚可,否定不易,起码不是诋毁谩骂之辈能做到的。

提出一种佯谬,往往总是涉及到加速度参考系,但分析和理解佯谬并不一定需要广义相对论,许多相关问题也并非一定要使用弯曲时空理论来解释,正如黎曼流形的每一个局部都还是一个欧氏空间。广义相对论的弯曲时空,它在每一个局部仍然是一个闵可夫斯基空间。

闵可夫斯基4维时空的性质对广义相对论至关重要,是理解弯曲时空、分析黑洞等奇异现象的基础。它是欧氏空间的推广,仍然是平坦的。闵氏空间与欧式空间的区别在于度规张量的正定性,在黎曼流形上局部欧氏空间定义的度规张量场gij是对称正定的。如果将时间维加进去,度规张量便不能满足“正定”的条件了。将非正定的度规张量场包括在内,黎曼流形的概念扩展为“伪黎曼流形”。幸运的是,奇维塔联络及相关的平行移动、测地线、曲率张量等概念,都可以相应地推广到伪黎曼流形的情形。

度规张量是一个二阶张量,可以被理解为方形“矩阵”。矩阵也是“对称正定”的,行和列对换后仍然是原来矩阵的那种矩阵。度规张量的对称性,是由它的定义决定的:

ds= gijdxidxj.

任何矩阵都可以分解成一个对称矩阵和一个反对称矩阵之和。根据度规的定义可知,gij的反对称部分对ds2的贡献为0。所以,度规张量可以被认为是一个对称矩阵,矩阵“正定”可以理解为这个矩阵的所有特征值都是“正”的。欧氏空间度规的正定性意味着实际空间中距离(弧长)的平方是一个正实数ds= dx2+dy2+dz2。因而,欧氏空间的度规是一个对称正定的d函数。

闵可夫斯基时空的度规是对称的,但数学形式不是正定的:dt= dt2-dx2-dy2-dz2,其度规记为h函数。式中的t是时间,x、y、z是3个空间维坐标,而dt取代了弧长ds,被称为固有时。由于时间间隔和空间距离的量纲不一样,这里约定将光速定义成1。也就是说,四维时空的度规本来应该表示成:c2dt= c2dt2-dx2-dy2-dz2,当约定了c=1,公式变得简明(务必记住这点)。

欧氏空间度规函数d和闵氏空间度规函数h写成矩阵形式:

在公式(2-13-2)中,第一维的本征值1对应于时间,其它本征值为-1的3个维度对应于3维空间。时间和空间统一在4维时空中,是为了数学上的方便。狭义相对论揭示了时间空间的相对性及它们之间通过洛伦茨变换的互相关联,但时间和空间毕竟是不同的物理概念,时间用时钟度量,空间用尺子度量,它们在4维时空中分别对应实数和虚数,用以反映“时钟”和“尺子”不能互变的物理事实。

图19a的4维时空图实际上只画了3维,包括1个竖直方向的时间维和2个水平空间维。时间轴往上的方向表示未来,向下代表过去。图中的圆锥称为光锥。以时空中的一点为锥顶的光锥将这个点附近的时空分成类时、类光、类空三个部分。

四维时空中的一个点,有时间有位置,按照通常ij理解把它叫做一个“事件”。例如,图19b中的A点,表示粒子初始时刻t1的空间坐标为(x1,y1)这个“事件”,在时刻t2,粒子运动到了空间位置(x2,y2),即粒子最后在时空中的位置,这个“事件”用点B(t2,x2,y2)来表示。从A到B的曲线,叫做粒子的“世界线”,它用以描述一个点粒子在时空中的运动轨迹。如果考虑的对象不是一个点,比如说,一条线虫,它在时空中的轨迹就成为了“事件面”,而要描述像阿扁那样的2维生物随时间长大的过程,就是个“世界体”了(图19b)。


图19:四维时空和世界线

解读双生子佯谬中的兄弟两次相遇,是当作2维时空中的两个事件点,分别计算两条世界线的“固有时”再加以比较而得到答案。2维闵氏时空中两个任意事件之间直线路径的距离表示为:t2=t2-x2。这个表达式右边的数值可取正、零、负,分别定义为两个事件之间的相对关系是类时、类光或类空。如果两事件的关系是类时(t2﹥0),t代表固有时。类时关系说明两个事件之间有因果先后的关联。如果两个事件的关系是类光( t2=0),说明它们位于不同的光锥上,只有速度最快的光才能将它们联系起来。在类空(t2﹤0)情形下,两个事件之间的间隔无法叫“固有时”,因为它的本质已经不是时间,而更像空间。但它可以被另一个物理量即“固有距离”s来表征:s2=x2-t2。“类空”说明两个事件之间不可能具有因果关系,除非存在超光速的信号,才能将它们互相联系起来。两个类空事件点之间不可能有真实粒子的“世界线”,真实粒子世界线的位置一定在光锥以内,是类时的。类空的两个事件互相位于对方的光锥之外。

图20:二维闵可夫斯基时空中事件之间的关系

12.匀加速参考系上的观察者

假设有3个人A、B、C,相对于地球静止参考系,B和A分别乘坐匀速运动和匀加速运动的宇宙飞船去太空,而C则一直留在地面。分析这3个人分别体验到的时空世界是怎样,可假设C所在的地面附近是一个平坦时空。图21a是C在他的闵氏2维时空中画出来的B和A的世界线,他将整个飞船视为一个点。

图21:匀速运动参考系和匀加速运动参考系

C在他的坐标系中静止不动,世界线是垂直向上的直线;B的飞船作匀速运动,世界线是一条指向斜上方的直线;A的飞船作匀加速运动,世界线是一条双曲线。我们可以观察到,作匀速运动的B在他的全部过程中可以看到整个2维时空中的事件,但作匀加速运动A却不是这样。“事件”是2维图中的一个点(某时某处),“可以看到事件”的意思是从这个事件发出的光,即在2维时空图上从事件点向上方画的两条45°斜线之一,将与该观测者的世界线相交。匀速运动的直线可以和图21a中任何位置点发出的光线相交,说明B可以看到整个2维时空。对于A的双曲世界线,情况就不一样了。A所能看到的时空事件很有限。比如图21b中所示的事件S1、S2,发出的光线(向上的绿色小箭头)到达不了A所在的双曲线,即不会与A的世界线相交。同时,A发出的光信号也到不了S2、S3处。所以A能够传递信息的空间只有图中右边双曲线所在的非阴影的部分,也就是说,对作匀加速运动的A而言,存在一个“事件地平线”,即相对论术语的所谓“视界”。A的视界呈现在图21b中,就是那条从左下角到右上方的45°直线,她不能看见这条直线左边(视界之外)时空发生的任何事件。

图21c是2维时空图的第一象限。假设这是一个相对于地面静止的参考系观测到的平坦时空。将图a中所描述的情形改变一下,设想A、B、C三人在t=0时,B和A坐上的都是匀加速运动宇宙飞船,C仍然留在地面。在开始的片刻,A和B及飞船的世界线都是图中所画的那条双曲线。在t=0之后,飞船发出的光信号能够与地面上C的世界线相交,说明C可以“看”见A和B。然而,对作匀加速运动的飞船来说,不能收到C在t﹥0之后发出的任何信号。因此,飞船中的A和B看见的C只是t=0那一刻的形象,C后来的变化已经消失在飞船的“视界”之外。

假设在图中B1的那个时空点,B不从飞船上掉到了茫茫宇宙空间中,B继续按飞船B1时刻的即时速度V在空中作匀速运动。因而B脱离了飞船的世界线,他的世界线变为一条在B1点与双曲线相切的直线(图21c)。问题是:从B1之后,A还能看见B吗?B和C之间又如何?

从图21c中可见,B的世界线从B1经过B2,将穿过“A的视界”,然后到达阴影部分中的B3。在没有穿过视界之前,B发出的光信号可以被A接收到。不过,从B发出信号到A接受到信号的时间变得越来越长,越来越长…,当B接近“视界”的时候,传输的时间趋于无穷大。也就是说,A看见的B已经凝固在B的世界线与视界相交的那一点,或者说,B已经走出了A的视界。

除了光信号传输时间变得越来越长之外,A还能观察到B的光信号产生的多普勒效应(红移)。信号的红移也是越来越大,频率越来越低,直到无法接受到为止。

B掉入太空作匀速运动,与C之间的光通信没有什么问题,只是信号到达对方延迟一段时间而已。并且,他们两人都感觉不到A的那条“视界”存在。他们两人而言,周围的2维时空是均匀的,是各向同性的,处处都是一样。

由此可见,本来是一个平坦的闵可夫斯基时空,作匀加速运动的A却观察到一些不一般的现象。在A的世界中存在一个“视界”,视界之外的事件,将在A的眼中消失,这些怪异之事,类似爱因斯坦的广义相对论所预言的弯曲空间中的“黑洞”。按照经典广义相对论对黑洞的描述,黑洞周围也有一个视界,在视界之内是一片漆黑,连光也无法逃离,所以谁也看不见它,就像A现在看不见视界外的C和B一样。对A而言,她的两个朋友都好像“掉进了黑洞”。

霍金专门研究黑洞,最有名的成果是 “霍金辐射”。他说:其实黑洞并不是绝对的黑,它也有一定的温度,因而会有热辐射现象,就像我们坐在炉子旁边感到温暖一样,靠近黑洞时也能感到“温暖”的辐射。


图22:安鲁效应和伦德勒坐标

那么,A在视界附近是否也像黑洞附近那样,有一个温暖的背景?假定A有粒子探测器,开始时似乎没有什么动静,但随着时间流逝,宇宙飞船越来越接近视界时,探测器有了号信响,并且越接近视界,探测器响的次数越明显,这说明它接受到了视界附近的辐射。

对于黑洞,B和C的探测器是没有任何动静的,因为他们所在的惯性参考系能观测到的是闵氏空间的量子基态,即绝对温度为零的真空态。但是,闵氏空间的真空态与加速参考系中的观察者能看到的真空态是不一样的,加速参考系的真空态能量低于闵氏空间的真空态能量。对加速参考系中的A来说,闵氏空间的真空态不是真空,而是一个有一定温度的比真空态能量要高的某个热力学平衡态。因此,A才会发现在“视界”附近时,她处在一个温暖热辐射的背景中。这种加速运动的观察者可以观测到惯性参考系中观察者无法看到的黑体辐射的现象,叫做“安鲁效应”,是1976年由哥伦比亚大学的威廉·盎鲁提出的。

如上所述,象A和她的飞船作匀加速运动的物体,在2维时空中的世界线是一条两端无限趋近原点光锥线的双曲线,光锥线便是参考系中观察者的“视界”。如果A的匀加速度是a,可以证明,这条双曲线与x轴的交点位于x=1/a2的位置。不失一般性,可以假设a=1,那么,双曲线与x轴的交点就位于x=1。

考虑加速度为a=2,1/2,1/3,1/4,…,等等的参考系,有一群加速度不相同的宇宙飞船,每一个飞船在2维闵氏时空中都能划出一条双曲线。这些双曲线都以同一条原点光锥线为渐近线,加上从原点出发的辐射状等时线,在2维时空中形成一组特别的坐标系,叫做伦德勒坐标系(图23b)。闵可夫斯基时空是平坦的,平坦时空中可以有曲线坐标,正如在2维平面上有直角坐标系也有极坐标系一样。伦德勒坐标系便是平坦闵氏空间中的曲线坐标,由于它是由匀加速观测者的世界线构成的,所以也叫加速度坐标系。伦德勒加速度坐标系可以用来模拟和理解“黑洞”,也被用来解释“贝尔的飞船佯谬”(飞船佯谬是质疑空间的“尺缩效应”)。


图23:贝尔的飞船佯谬

【有两艘用绳索连在一起的宇宙飞船,让它们以相同的加速度同时从静止开始运动。由于两艘飞船的速度在任何时刻都是一样,因而两艘飞船间的空间距离保持不变。考虑飞船和绳索都以高速运动,它们会有“尺缩效应”。空间的距离不变而绳索的长度却缩短了,绳索应该断开,另一种观点则认为绳索不会断。】

13.引力场方程

闵可夫斯基是爱因斯坦的老师,为他的狭义相对论奠定了数学基础。格罗斯曼是爱因斯坦的同学。没有与两位同窗好友的缘分,或许就没有伟人爱因斯坦。爱因斯坦在回忆中称格罗斯曼为铁杆朋友,但这个“铁哥”格罗斯曼完全不同于爱因斯坦。他上课认真听课做笔记,完整的笔记成为爱因斯坦每次考试时的救命稻草,让他得以敷衍考试,完成学业。爱因斯坦用心思考的是他认为更重要的事情。在大学毕业后,靠格罗斯曼的父亲的关系和推荐,失业许久的爱因斯坦到瑞士专利局工作,收入不菲、稳定轻松,最适合爱因斯坦当时那种看起来心不在焉、脑袋里却天马行空的“独立思考”者。

也许是天意安排,格罗斯曼后来成为黎曼几何专家。在爱因斯坦为找不到适当的数学工具来表述他的天才物理思想而困惑多年之后,又是这个铁哥们儿向爱因斯坦提起了黎曼几何,并将里奇、契维塔等数学专家介绍给他,使爱因斯坦用黎曼几何和张量分析这两个强大的数学工具,顺利地克服难关,创立了弯曲时空理论——广义相对论。

1912年左右,爱因斯坦有了等效原理,有了时空弯曲的想法,有了黎曼几何和张量微积分,开始着手构造引力场方程。与牛顿的引力定律有所不同,爱因斯坦想要建立的是“场”方程。所谓场,意思是说空间中每个点都有相应的标的物理量,这个物理量一般都逐点不一样。“场”的概念最先由法拉第提出,麦克斯韦建立了电磁场的方程。此前拉格朗日在研究牛顿理论时,曾引入了引力势的概念,拉格朗日的学生泊松推广了引力场理论,建立了与牛顿万有引力定律等效的引力场泊松方程:

Dj = 4πGρ

式中的D是拉普拉斯算符。这是引力势j满足的对坐标的二阶微分方程,方程右边的G和ρ分别是万有引力常数和空间的质量密度。

当初在爱因斯坦看来,洛伦茨变换、统一时空等,都仅仅是使理论完美漂亮的数学手段而已。真正使爱因斯坦的引力观念飞跃上升到时空几何层次的,是“转盘佯谬”。一个圆盘以高速旋转,设想圆盘由许多大小的圆圈组成,越到边缘处圆圈半径越大,圆圈的线速度越快。由于长度收缩效应,这些圆圈的周长会缩小。考虑圆盘的任何部分都没有径向运动,每个圆圈的直径将保持不变。周长与直径的比值是圆周率p。根据狭义相对论的尺缩效应,圆盘高速转动时比值会小于p,就好象圆盘弯成了一个曲面一样,如图24a所示。 

图24:转盘佯谬

如果圆盘是一个刚体,就不可能弯曲。于是佯谬有另外一种叙述方法:对同样一个圆盘边缘,由于相对论的“尺缩效应”,位于圆盘边缘上观测者的尺子,要比静止观测者的尺子更短,这就出现了运动观测者测量到的圆盘周长大于静止观测者所测结果的现象。而当运动观测者测量直径的时候,尺子不会缩短,所以,运动观测者测量到的周长与直径的比值,要大于圆周率p。

爱因斯坦由此意识到他最初企图将引力和加速度系统包括进狭义相对论的想法是行不通的,他需要另外一种几何,来描述被引力(或加速度)弯曲了的时空。由于真实宇宙中各处的引力是不一样的,时空的弯曲程度也将处处不一样。爱因斯坦苦苦思索7、8年之久,终于惊喜地发现黎曼几何正好可以将他的狭义相对论与引力场弯曲时空的思想完美地缝合在一起,缝成一个美妙的新理论。

爱因斯坦认为黎曼几何中的“度规”张量场类似于他想要描述的引力势,可以建立一个与空间度规有关的引力场方程,在“低速弱场”的近似下,这个方程应该得到牛顿引力定律的结果,也就是泊松方程。泊松方程的左边是引力势对空间的二阶导数,右边除了几个常数之外,是物质密度ρ,在物理上可以解释为:空间的物质分布决定了空间的引力势,空间的引力势场是泊松方程的解。

爱因斯坦想要的引力场方程则应该解释为:时空中的物质分布决定了时空的度规。将度规类比于引力势,泊松方程左边的引力势的二阶导数就应该对应于度规的二阶导数。与度规二阶导数有关的是曲率张量,作为场方程的左边就应该是曲率张量表征的几何量。曲率张量有好几种,爱因斯坦选中了有两个指标的里奇曲率张量。对场方程的右边,爱因斯坦将质量密度ρ的概念扩展成一个张量,称之为能量动量张量。归纳上面的想法,爱因斯坦的引力场方程有如下形式:

方程(2-15-2)右边的G与泊松方程一样,是牛顿万有引力常数,Tmn是四维时空中的能量动量张量,其物理意义如公式(2-15-3)所示,它的表达非常复杂。这些“物质”形态不仅仅包括具有静止质量m的通常意义下的物质,还包括了所有具有能量的状态,因为E=mc2,任何形态的能量都可以等同于一定的质量,都应该对时空弯曲有所贡献。意思是说,宇宙中各个系统的剪应力和压强也要以动量流的形式被包含在能量动量张量中。

方程左边是的时空的几何描述,其中第一项Rmn是里奇曲率张量。后来,爱因斯坦发现如果只有第一项Rmn,方程不能自动满足能量守恒和动量守恒的要求,于是加上了里奇标量曲率R与度规gmn相乘的第二项。

爱因斯坦引力场方程的物理意义是非常明确的。一个物理方程的求解过程,就是从已知的物理量得到未知函数的过程。这个场方程对于待求解的度规张量gmn而言,是高度非线性的,求解异常困难。同时,还要考虑到引力场或引力波也是一种物理存在,也具有能量,它是否也要被考虑进能量动量张量之中,爱因斯坦并未将它放进去,也不知如何放进去。在研究计算具体问题时,这是务必考虑的。

方程(2-15-2)左边的第三项,与度规张量成正比,比例系数L便是著名的宇宙常数。物理界和天文界对此宇宙常数的研究兴趣盎然经久不衰,因为它的存在与宇宙中发现的“暗能量”有关。

14.宇宙常数

爱因斯坦1915年建立广义相对论的引力场方程,在1917年引入了宇宙常数一项。场方程看起来不是很复杂,解起来却异常困难。先忽略宇宙常数,看引力场方程包含的物理意义,如今很难体会或揣摸爱因斯坦当时的真实思想,但可以从现有物理知识出发,重新认识场方程到底意味着些什么。

相对于经典牛顿力学,狭义相对论否认了速度(运动)的绝对意义。即谈及速度v时,一定是相对于哪个参考系而言的速度,否则毫无意义。广义相对论更进了一步,因为广义相对论取消了惯性系,速度不仅没有了绝对意义,连速度对惯性系的相对意义也没有了。例如,在广义相对论预言的弯曲时空中,我们只能在同一个时空点来比较两个速度(任何矢量),却无法比较不同时间、不同地点的两个速度的大小和方向,除非将它们在黎曼流形上平行移动到同一个时空点。由于在黎曼流形(伪的)上,每个不同时空点定义了不同的坐标系,只有利用黎曼几何和微分几何,才能正确描述广义相对论中弯曲时空的精髓。或者说,狭义相对论将独立的时间和空间统一成了“4维时空”,广义相对论则将平直的时空变成了带着活动标架的“流形”。

与爱因斯坦最后在一起工作过的著名物理学家约翰·惠勒有一句解释广义相对论的名言:“物质告诉时空如何弯曲,时空告诉物体如何运动”。在场方程的右边是度规张量,表征时空弯曲的几何度量。这意味“物质”分布决定了方程的解,“物质告诉时空如何弯曲”是显而易见的。后一句说的是弯曲的时空中粒子将如何运动。

考虑在度规为gij的时空中有一个“自由落体”运动的“试验粒子”,这样的试验粒子将沿测地线运动,速度矢量相应地沿测地线平行移动。测地线是弯曲空间中最接近直线概念的几何量。

用2维球面来理解弯曲时空。两个人从赤道上的不同点出发,都一直向北走。按平坦空间的几何,他们以为运动方向是互相平行的。然而,实际结果是两人相距越来越近。对这个事实可以用两种方式来解释:一是认为有一种力将他们推得互相靠近,二是想象成是由于空间弯曲的几何原因。这两种解释是等效的,正如广义相对论中将引力等效于时空弯曲一样。

爱因斯坦建立引力场方程之后,物理学家和天文学家蜂拥而上,使用各种数学方法研究方程的解,将其与牛顿经典理论比较,用以解释各种天文观测现象。那时宇宙学还只是初生婴儿,物理和天文学界基本上公认宇宙的静态模型。所谓静态模型,并非万物静止不动,而是就宇宙空间的大范围而言,宇宙是处处均匀各向同性的,在每一点朝各个方向看去都是无穷多颗恒星,恒星之间的平均距离不会随时间的流逝而扩大或缩小。但是,根据广义相对论的运算结果,宇宙并不符合上述静态模型,而是动态的,有可能会扩张或收缩。爱因斯坦为了使宇宙保持静态,在引力场方程式中加上了宇宙常数项Λ。

当初,爱因斯坦及大多数物理学家都认为,万有引力是一种吸引力,如果没有某种排斥的“反引力”与其相平衡,整个宇宙最终将会因互相吸引而导致塌缩。当引入Λ使场方程满足守恒条件的时候,爱因斯坦就发现,方程中可以加上与度规张量成正比的一项仍然能满足所要求的所有条件。那么,是否可以利用这一项来使得场方程预言的宇宙图景成为静态、均匀、各向同性,爱因斯坦假设这个比例常数Λ很小,在银河系尺度范围都可忽略不计,只在宇宙尺度下Λ才有意义。不过,爱因斯坦的想法很快被天文学的观测事实推翻了。

物理学家证明了,即使爱因斯坦的宇宙常数提供了一个能暂时处于静态的宇宙模型,这个静态模型也是不稳定的。只要某一个参数有稍许变化,就会使变化增大而往一个方向继续下去,最后使得宇宙很快地膨胀或塌缩。后来在1922年,前苏联宇宙学家亚历山大·弗里德曼根据广义相对论,从理论上推导出描述均匀且各向同性空间的弗里德曼方程,没有用到宇宙常数,得到的解却不会因为互相吸引而塌缩,给出的是一个不断膨胀的宇宙模型。没过几年,哈勃的天文观测数据证实了这个膨胀的宇宙模型。

哈勃的观测事实,令爱因斯坦懊恼遗憾不已。

爱德温·哈勃是美国著名的天文学家,他的观测资料证实了银河系外其他星系的存在,并发现了大多数星系都存在红移的现象。重要的是,哈勃发现来自遥远星系光线的红移与距离成正比,即著名的哈勃定律:v=H0D,其中v是星系的运动速度,D是星系离我们的距离。

从多普勒效应(图25a)知道,如果光源以速度v运动,观察者接受到的光波波长与光源实际发出的光波波长有一个等于v/c的偏移。哈勃观测到来自这些星系的光谱产生红移,说明这些星系正在远离我们而去(图25b)。假如光源远离的速度3000公里/秒,即光速的百分之一,观测到的波长将向低频方向(红色)移动百分之一。


图25:多普勒效应和哈勃定律

哈勃定律说明,离我们越远的星系,远离而去的速度越快。仔细一想,这种描述正是一幅宇宙不断扩展膨胀的图景。其中的比例因子H0当时被认为是一个常数,称哈勃常数,后来被认为随时间而变化,叫做哈勃参数。根据2013年3月21日普朗克卫星观测获得的数据,哈勃参数大约为67.80±0.77 千米每秒每Mpc。

所以,根据弗里德曼的预测和哈勃的实验证实,宇宙并不是稳态的,而是在膨胀。弗里德曼的结论本来就是从没有包含宇宙常数的爱因斯坦方程式推导而来的,得到哈勃观测结果的验证,这令爱因斯坦懊恼遗憾不已。他撤回了他的“宇宙常数”,对此表示遗憾,认为这是自己“一生所犯下的最大错误”。

宇宙的确在不断地膨胀,但膨胀的速度是否变化,是加速膨胀还是减速膨胀,这关系到宇宙的历史和未来。1998年,两个天文学研究小组对遥远星系中爆炸的超新星进行观测,发现它们的亮度比预期的要暗,即它们远离地球的速度比预期的快。有趣的是,新的观测结果需要将爱因斯坦引入又摒弃了的宇宙常数“Λ”请了回来。

“Λ”的起死回生与爱因斯坦当初的对或错无关,而是与宇宙中暗能量存在的事实有关的。暗能量在引力场中起的作用,正好与爱因斯坦原来引进的Λ一项类似,因而才又把Λ一项加进了方程。暗能量的来源,则是量子场论所预测的真空涨落。而量子论是爱因斯坦一生中始终怀疑也从未接受的理论。

15.大爆炸宇宙模型

1959年,有人对美国科学家作过一次调查,其中有一道题目是“你对宇宙的年龄有何想法”。回答这个问题有三分之二的人认为宇宙是永恒不变、始终如一的,没有开始也没有结束,谈不上“年龄”。5年之后,美国新泽西贝尔实验室的两位科学家的意外发现改变了大多数科学家对这个问题的看法。

1964年,新泽西贝尔实验室的阿诺·彭齐亚斯和罗伯特·威尔逊负责有关射电天文和卫星通信实验的项目。为了有效接受卫星返回的信号,他们在实验室附近的克劳福德山架设了一台新型的喇叭天线。在将天线对准天空方向检测噪音性能时,发现在波长为183.75px的位置一直有一个类似“噪声”的信号存在。这个额外信号因喇叭天线造成的噪声比原来预期的数值增加了100倍。于是,他们彻底检查天线,清洗了上面的鸽子窝鸟粪等赃物。然而噪声信号依然存在(图26)。奇怪的是,这种噪声与天气、季节、时间都无关,也与天线的方向无关,好像是某种充满天空的、顽固存在的神秘之光。 

图26:微波背景辐射

两位科学家对接受到的神秘信号感到困惑,猜测辐射可能来自于银河系之外的其它什么星系。当时,普林斯顿大学天体物理学家迪克、皮伯斯、劳尔和威尔金森正在研究“大爆炸”的一种宇宙演化模型,他们认为在现在的宇宙中应该充满着某种波长(几个厘米)的微波辐射。这种辐射无孔不入、无处不在,很有可能被无线电探测仪器接受到,如果接受到了就是“大爆炸”理论的一个有力证据。彭齐亚斯和威尔逊收到的“不明噪声”的频率大约4080兆赫,正好符合普林斯顿科学家们所期望能探测到的微波辐射。

普林斯顿大学的天文学家们得知情况后,来贝尔实验室考察喇叭天线观察接受到的“噪声”数据,经过一段时间的讨论、研究、分析,得到的结论是:这些信号的确是宇宙学家们所预言的“微波背景辐射”,不是普通的噪音,而是大爆炸的余音。于是,两个科研小组的两篇文章同时发表在《天体物理学报》的同一期上,向人们宣布宇宙微波背景辐射(CMB)的发现。

大爆炸学说的理论模型,最早是比利时宇宙学家乔治·勒梅特提出来的,他居然还是一位天主教神父。勒梅特在当神父的同时,也热衷于研究爱因斯坦的广义相对论及哈勃的观测数据。1931年,他从宇宙膨胀的结论出发,对广义相对论进行时间反演,认为膨胀的宇宙反演到过去应该是坍缩、再塌缩,一直到不能坍缩为止。那时宇宙中的所有质量都应该集中到一个几何尺寸很小的“原生原子”上,当今的时间和空间结构就是从这个“原生原子”产生的。

宇宙起源于大约138亿年前“奇点”的一次大爆炸,这听起来实在匪夷所思。如果宇宙有开始,那么在之前又是什么?可能谁也无法回答这个问题。于是有人认为大爆炸之前可能是无数次的塌缩和膨胀的往复循环。各种猜测都有,但仅仅限于猜测。可以说没有什么比宇宙起源问题更能吸引人,又更困扰人!事实上,无论科学家给出什么样的宇宙演化图景,都一定会使大众产生出没完没了也答复不了的更多问题。人类对宇宙知之甚少,在博大浩瀚的宇宙面前,人类显得渺小和幼稚,科学家们也不过是尽其所能来理解和解释这个世界而已。

当初,大爆炸不过是基于爱因斯坦的引力场方程,在弗里德曼假设均匀各向同性条件下,简化倒推到时间的原点而得到的假说。哈勃定律证实了宇宙膨胀的事实后,有两种互相对立的解释。与勒梅特相对立的英国天文学家弗雷德·霍伊尔等人提出了一种稳态理论。有趣的是,霍伊尔在1949年3月的一期BBC广播节目中,将勒梅特的理论称作“大爆炸的观点”,没想到这个当时颇带讽刺攻击意味的名词,之后竟成了勒梅特理论的标签。大爆炸理论并不完善,但它是迄今为止能够解释更多的天文现象而被主流所接受,大多数物理学家都相信,大爆炸是能描述宇宙起源和演化的最好理论。

对科学界来说,更具有实际意义的是研究大爆炸之后的宇宙是如何演化到现在这个状况。

根据现有的宇宙理论,大爆炸之后的宇宙演化主要有3个阶段:极早期宇宙、早期宇宙、结构形成。伽莫夫当时提出的太初核合成过程,发生在大爆炸之后“早期宇宙”时段中的3分钟到20分钟之间(图27a)。1940年代,伽莫夫与他的学生提出了热大爆炸宇宙学模型。伽莫夫让阿尔菲研究了大爆炸中元素合成的机制,在阿尔菲1948年提交的博士论文中,伽莫夫说服朋友汉斯·贝特在论文上署了名,自己的名字署在最后。三个人的名字(阿尔菲、贝特、伽莫夫)谐音恰好组成前三个希腊字母α、β、γ。这份标志宇宙大爆炸模型的论文在1948年4月1日发表,称为αβγ理论。


图27:宇宙大爆炸模型

按照热大爆炸宇宙模型,极早期的宇宙,所有物质都高度密集在一个很小的范围内,温度极高,超过几十亿度。在大爆炸开始的最初3分钟内发生了什么,物质处于何种状态等,也不乏物理模型,但大多数属于猜测,很难用实验或观测来验证。

大爆炸后的“极早期宇宙”阶段,对我们来说是难以想象的短,大约只是最开始的10-12秒。而在如此“转瞬即逝”的一刹那,物理学家们仍然大有文章可做,将这个阶段分成了许多更小的时间间隔。比如说,在最开始的10-40秒,被称为量子引力阶段,因为那时候的“世界”应该表现出显著的量子效应和巨大的引力。接着,宇宙进入暴涨时期:空间急剧变化、时空迅速拉伸、量子涨落也被极快速地放大,并产生出强度巨大的原初引力波。

2014年3月17日,哈佛史密松天体物理中心的天文学家约翰·科瓦克博士等宣布,他们利用设置在南极的BICEP2探测器研究宇宙微波背景辐射时,直接观测到了原初引力波的“印记”。

10-12秒很短,但对于光和引力波信号来说,也能走过300微米左右的距离。电子的经典半径是10-15米数量级,这段300微米的短短距离中已经足以容得下1000亿个电子,更何况那时连电子都还未能形成。所以,当我们算出了这些数据之后,多少也能对物理学家为什么要研究这“极早期宇宙”有了一点点理解。因为这段时间虽然极短,却包含了大量可研究内容的。

大爆炸模型中的时间尺度很有趣。在极早期宇宙阶段,讨论的尺度是如此之小,而在谈及宇宙的年龄(137亿年)时,又是如此之大,大到连误差都是以亿年计算!这个领域将物理学中极大(大宇宙),和极小(基本粒子)的理论问题奇妙地融合在一起。

有很多方法来估计宇宙的年龄,图27b中简略介绍了使用哈勃定律计算宇宙年龄的过程。天文学中对宇宙年龄的计算涉及到许多方面,从理论模型到观测资料的准确度,都会影响计算结果。从理论角度看,宇宙年龄和哈勃参数基本是成反比的。但是,哈勃参数如何随时间变化,就由所采用的理论模型来决定。某个时候的哈勃参数,又与观测技术的水平有关。此外,宇宙年龄计算还与星系、恒星以及地球等星体年龄的计算结果有关。所以,这不是一个简单的问题。

在“极早期宇宙”,以及称为“早期宇宙”的第二阶段,都是量子物理大显身手的地方。在极早期宇宙时代,量子和引力这两个不怎么相容的理论碰到了一起。对那个阶段的研究,类似于对黑洞的研究,为量子引力研究开辟了一片天地。

遗憾的是,我们很难得到“极早期宇宙”传来的信息,因为大爆炸极早期的光波无法穿越稍后“混沌一团”的宇宙屏障。引力波倒是能穿过,这也就是为什么刚才所说的2014年春天哈佛科学家宣布收到“原生引力波”时科学界激动不已的原因。

所谓“早期宇宙”的时间段,就比“极早期宇宙”要长多了,在40万年左右,它包括了“微波背景辐射”时期。40万大约是宇宙现在年龄(137亿年)的3万分之一,只算是宇宙的“孩童时代”。这段时期从两个方面影响了我们对宇宙早期历史的探索:

其一,在这段时间之前,物质以高温高密的等离子体形式存在,天地混沌一片,星体尚未形成。光子、电子及其它粒子一起,充满整个宇宙,是一片晦暗的迷雾状态。由于光子被粒子频繁散射,平均自由程很短,形成了一道厚实的屏障,宇宙显得不透明,使得更早时期(即大爆炸开始到30万年之间)的光无法穿透这段时空,因而使得人类对“微波背景辐射”之前诸如暴涨过程的研究造成了困难。

其二,随着宇宙的膨胀,其温度不断降低。当宇宙年龄大到38万年时,温度降至3000K左右,等离子体中的自由电子逐渐被俘获,进入复合阶段。光子的平均自由程也逐渐增加,宇宙变得透明起来。光子被电子等粒子散射,形成了一种至今弥漫于宇宙中的背景电磁波,即现在称之为“3K微波背景”的电磁辐射。这种可以被观察研究的大爆炸的余晖即“遗留辐射”,已经成为我们研究早期宇宙,发展宇宙论的基础。

也就是说,宇宙发育40万年左右的那一段时间,正从“孩童转型成人”。它既给我们提供了“微波背景辐射”,让我们从中得以探索到那时候宇宙的种种形态,又以它不透明的特性,阻挡掩盖了更早期的宇宙,不让人们能看到它更早期“胚胎形成”的过程和模样。

再后来,随着宇宙膨胀,温度逐渐下降,进入到“结构形成”阶段。从1.5亿年至10亿年,是再电离期,宇宙的大部份由等离子体组成。再后来,逐渐形成了恒星、行星、星系等天体,一直到我们现在可见的宇宙。

16.暗物质和暗能量

曾几何时,宇宙中所有物质组成成分被列在元素周期表上,或者是基本粒子表中。然而,天文观测的最新结果与此并不相符合。根据普朗克卫星2013年公布的资料,宇宙中只有一小部分(4.9%)是常见的、熟悉的普通物质,而大约四分之一(26.8%)是一种看不见摸不着、至今尚未弄清楚的暗物质。更不可思议的是其余的68.3%,连物质都谈不上,是某种无孔不入无处不在的所谓“暗能量”。

暗物质说法并非现在才有,早在1932年,荷兰天文学家扬·奥尔特就认为宇宙中除了普通物质之外还存在一种看不见的物质。之所以称为“暗物质”,是因为它不像普通物质那样能够对光波或者电磁波有所反应。我们所见的普通物质,被灯光一照便现出原形,还有紫外线、红外线、x射线、伽马射线和各种频率的无线电波,都是可以通过探测手段发现的物质。但是,暗物质似乎对光或电磁波不屑一顾,完全无动于衷。

暗物质之所以被认为存在,是因为它们仍然具有“引力”作用,仍然符合广义相对论的预言,造成了时空的弯曲。最有力证据是天文学家观测星系时发现的“星系自转速度问题”。恒星或气体围绕星系的核心转动,对星系本身而言叫做“星系自转”。根据引力理论(无论是牛顿引力或是广义相对论),都可以预期到,在足够远的距离上,环绕星系中心天体的平均轨道速度应该与轨道至星系中心距离的平方根成反比(图28)。但观测结果并非如此。

美国女天文学家薇拉·鲁宾是研究星系自转速度曲线,继而发现暗物质存在证据的先驱。从薇拉得到的“观测结果”曲线看(图28b),远处恒星具有的速度要比理论预期值大很多。恒星的速度越大,拉住它所需的引力就越大,这更大的引力从何而来,只能认为这份额外的引力来自于暗物质。


图28:薇拉·鲁宾观察到星系自转问题

支持暗物质存在的另一个有力证据来自引力透镜现象。透镜原理是光线穿过玻璃产生折射而偏离直线的路径弯曲。根据广义相对论,光线在引力场附近也会发生偏转。由此可见,在某种情况下,引力场能够起到和光学透镜类似的作用,即产生“引力透镜”效应(图29)。


图29:引力透镜

1936年,爱因斯坦就提出用恒星作为引力透镜的想法,但他同时又认为成像的角度太小而无法观测到这种效应。然而,在1979年,英国天文学家得到了引力透镜成像。引力透镜可以看成“望远镜”来使用,能够观测到非常遥远的星系,它是当今新型的天文观测手段。

观测更遥远的星系等于是观测更早期的宇宙图景。比如说,我们接受到的距离为100亿光年远的星系的光,相当是大爆炸之后37亿年左右发出来的,那时星系处在逐渐形成的阶段。这些早年的光通过引力透镜的放大作用被捕获到,能够帮助我们了解早期星系的形成和演化的过程。2012年初,芝加哥大学天文学家团队借助哈勃太空望远镜拍摄了一个近100亿光年远的星系团的引力透镜影像(图30),其中包括一条90°左右的透镜弧。有了引力透镜,“一眼”看过去就是上亿光年。


图30:RCS2 032727-132623星系团的引力透镜影像

引力透镜是研究暗物质的重要方法。图29(右图)中所示的爱因斯坦环便是一例,那张图中的圆环图像很清楚。大多数情形下,只能判断出一小段圆弧,或者是表现为“爱因斯坦十字”等特殊景象(图31)。


图31:引力透镜和暗物质

暗物质到底是些什么,科学家们列举了很多可能组成暗物质的“候选者”。实际上,暗物质中可能有一部分不发光也不吸收光,仅仅是产生引力效应的普通物质。分析研究显示,质子、中子和电子这些只能占其中的一小部分(20%左右),其余暗物质可能存在于棕矮星、白矮星、中子星、黑洞等。

暗物质的其它可能性,包括各种可能的中微子,以及由粒子对称理论所预言的可能存在的其它粒子,或者是我们认知之外的东西。

暗能量的证据主要来自于宇宙加速膨胀的事实。2011年诺贝尔物理奖颁发给了美国天文学家珀尔马特、施密特与亚当里斯,以表彰他们“透过观测遥远超新星而发现了宇宙加速膨胀”。

如何解释宇宙加速膨胀,人们提出了各种假设,其中宇宙常数是比较流行的一种。爱因斯坦原来将宇宙常数一项放在场方程等号左边,如果把它移到等号右边,场方程变为:

这样等号右边的能量动量张量加上了宇宙常数一项,如果宇宙常数为正值,它的作用应该与原来的能量动量张量的作用相反。能动张量的作用是产生与万有引力等效的时空弯曲,而宇宙常数一项是负值,其效果便与普通物质产生的吸引力相反,在长距离时相当于某种排斥力的作用。因而,宇宙常数有时被称为“反引力”或“负压强”。

现在解释“加速度”膨胀有多种理论模型,暗能量的存在是其中之一。但是,要解释为什么存在如此大比例的暗能量时,又想起了被爱因斯坦丢弃的宇宙常数。真是在造化弄人,这垃圾箱里捡回来的?似乎还挺好用,能够解释不少观测结果。

图32:a.宇宙常数L的数值对宇宙模型的影响;b.真空涨落

图32a的数条曲线描述了宇宙常数L的数值对宇宙模型的影响。当宇宙常数L=0时,对应于那条紫色曲线;当时间从现在增大的时候,这条曲线增长越来越慢,表示宇宙的膨胀速度将减小;当L﹥0时,宇宙有可能加速膨胀。

根据质能关系E=mc2,质量和能量可以看作是物质同一属性的两个方面。但是,它们在宇宙构造成分中的具体表现大不相同。也就是说,暗物质和暗能量这两个概念在本质上有所区别。暗能量和暗物质的共同点是既不发光也不吸收光,两者可能都是只对引力起作用。然而,暗物质是引力自吸引式的,这与普通物质类似;暗能量的作用却类似于长距离的自相排斥和空间扩展。从这个意义上看,它们的作用是互相制约而无法交互替代。另外,暗物质能够像普通物质一样聚集分布,似乎是形成星系时的支撑框架;暗能量在宇宙中却基本是均匀分布、无处不在、无孔不入的。暗能量到底是怎样的一种能量,是如何产生的?这种“排斥力”的本质是什么?它是否属于四种作用力之中,还是另一种新的基本力?目前对这些问题尚无法作出明确回答。有人猜测暗能量是量子场论中所描述的真空涨落,但计算的结果并不完全支持这种解释,因为计算两者的数量相差甚远,真空涨落要比暗能量大10120数量级。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
最美丽的理论:爱因斯坦引力场方程的推导
牛顿引力和爱因斯坦引力理论的几点意见
光的世界-宇宙时空模型概论(上)
广义相对论详细发现过程和相关宇宙学应用!
科学家或发现能统一暗物质和暗能量的理论
科学家发现能统一暗物质和暗能量的理论
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服