微分幾何簡介及其在廣義相對論中的應用


微分幾何簡介及其在廣義相對論中的應用

一、集合論、拓撲空間與微分流形

1. 集合論簡介

  集合論是數學最基本的理論之一。它包含的主要思想有,確定地指定了的若干事物的全體叫一個集合(set)集合中的每一件事物叫一個元素(elements)點(point)。可以用數學的語言將上述話轉述為,若\(x\)是集合\(X\)的元素,則記為\(x\in X\),自然若\(x\)不是集合\(X\)的元素,則記為\(x\not\in X\)。根據ZFC公理體系的提法,我們自然還可以構造一個不含任何元 素的集合,叫做空集(empty set),記作\(\emptyset\)。我們指出,四維時空,即我們生活的世界、我們一切活動的舞台,是一堆時空點的集合,因此討論集合對我們討論四維時空的理論是十分有用的。在這里我們不加證明的列舉集合論的一些基本概念與定理如下

  定義1.1.1 若集合\(A\)的每一個元素都屬於集合\(X\),則稱\(A\)\(X\)子集(subset),記作\(A\subset X\),並規定\(\emptyset\subset X,\ \forall X\)。自然可以根據這個定義集合的相等\(A=X\)當且僅當\(A\subset X\)\(X\subset A\)。自然還可以定義所謂的真子集(proper subset),若\(A\subset X\)\(A\neq X\),則稱\(A\)\(X\)的真子集,記為\(A\subsetneqq X\)

  定義1.1.2並集(union)\(A\cup B:=\{x|x\in A或x\in B\}\)交集(intersection)\(A\cap B:=\{x|x\in A且x\in B\}\)差集(difference)\(A-B:=\{x|x\in A且x\not\in B\}\);若考慮的最大集合\(X\),則任何集合\(A\)都應該是\(X\)的子集,且\(A\)補集(complement)定義為\(-A:=X-A\)

自然地,我們可以利用上述定義直接證明如下定理

  定理1.1.1 集合之間的運算應該滿足如下的運算定律

\[\begin{align} &\begin{aligned} 交換律\quad A\cup B=B\cup A,\quad A\cap B=B\cap A \end{aligned} \\ &\begin{aligned} 結合律\quad(A\cup B)\cup C=A\cup(B\cup C),\quad(A\cap B)\cap C=A\cap(B\cap C) \end{aligned} \\ &\begin{aligned} 分配律\quad&(A\cap B)\cup C=(A\cup C)\cap(B\cup C) \\ &(A\cup B)\cap C=(A\cap C)\cup(B\cap C) \end{aligned} \\ &\begin{aligned} De Morgan律\\ &A-(B\cup C)=(A-B)\cup(A-C) \\ &A-(B\cap C)=(A-B)\cap(A-C) \end{aligned} \end{align} \]

  我們在四維時空中為了具體的討論某一個問題,都希望能將事件(event)的時空坐標確定下來,為了具體將坐標這件事情確定下來,我們必須將我們要研究的時空用一組有序實數標記具體的時空點。換句話說,我們要用幾個實數集合\(\mathbb R\)構造出一個坐標系來,這就是構造卡氏積(Cartesian product)的基本動機。

  定義1.1.3 非空集合\(X,\ Y\)卡氏積\(X\times Y\)

\[X\times Y:=\{(x,y)|x\in X,y\in Y\} \]

有限個非空集合\(X,\ Y,\ Z\)卡氏積\(X\times Y\times Z\)自然也可以定義為

\[X\times Y\times Z:=\{(x,y,z)|x\in X,y\in Y,z\in Z\} \]

顯然,它是滿足結合律的,即\(X\times(Y\times Z)\equiv(X\times Y)\times Z\)

  我們自然可以作\(n\)實數集\(\mathbb R\)卡氏積,記為

\[\begin{aligned}\mathbb R^n:=\underbrace{\mathbb{R\times\cdots\times R}}\\n個\mathbb R\quad\ \end{aligned} \]

可見\(\forall x\in\mathbb R^n\),都可以用一組有序實數\((x^1,\ x^2,\cdots,\ x^n)\)來標記,這就是元素\(x\)自然坐標。闡述完自然坐標的概念,我們自然可以對考慮在\(\mathbb R\)的各個元素之間定義所謂的距離

  定義1.1.4\(\mathbb R^n\)中的任意兩個元素\(x=(x^1,\ x^2,\cdots,\ x^n),\ y=(y^1,\ y^2,\cdots,\ y^n)\)之間的距離定義為\(|x-y|:=\sqrt{\begin{aligned}\sum_{i=1}^n\end{aligned}(x^i-y^i)^2}\)

  這些定義都是如此的自然,下面我們還要考慮一個問題,我們該如何描述任意時空點的坐標?為了回答這個問題,我們自然要選擇一個時空中的一個參考點,首先將這個這個參考點的坐標標定出來,為此我們要選取\(\mathbb R^n\)中一個特殊的元素將其與這個參考點認同起來,不失一般性,我們可以將這個元素選取成\((0,0,\cdots,0)\)。這個想法啟發着我們構造一種涉及到兩個不同集合之間的認同操作,這就是構造映射(map)的基本動機。

  定義1.1.5 對於兩個非空集合\(X,\ Y\),定義一個從\(X\)\(Y\)映射\(f:X\rightarrow Y\)是一個法則,它為\(X\)中的每一個元素\(x\)都指定了\(Y\)中的某一個元素\(y\)與之對應,進一步地可以寫成\(y=f(x)\)。稱\(y\)\(x\)映射\(f\)下的像(image),稱\(x\)\(y\)原像(或逆像(inverse image))。稱\(X\)映射\(f\)定義域(domain)\(X\)的全體元素在映射\(f\)下的集合記作\(f[X]\),稱為映射\(f\)值域(range)。自然有映射之間的相等定義為,映射\(f:X\rightarrow Y\)映射\(f^\prime:X\rightarrow Y\)稱為相等的,若\(f(x)\equiv f^\prime(x),\ \forall x\in X\)

  利用映射,我們就可以將時空中的某個點與\(\mathbb R^n\)中的某一個卻元素聯系起來,再利用\(\mathbb R^n\)中的元素本身有所謂的自然坐標,並將其認同為時空該點的坐標。這樣,我們就得到了一個可以在時空中確定時空點坐標的方法。如果我們不對映射本身做任何限制,那么自然可以構造出無數種完全不同的坐標,但是這其中有很大一部分都是無用的,下面我們將討論如何對映射提出更高的限制,以便我們篩選出真正有用的坐標來。在討論映射的限制之前,我們有必要闡述一下一些有用的特殊映射

  定義1.1.6映射\(f:X\rightarrow Y\)稱為一一的(one-to-one),若任一\(y\in Y\)都有着不多於一個逆像(可以沒有);映射\(f:X\rightarrow Y\)稱為到上的(onto),若任一\(y\in Y\)都有逆像(並不要求唯一);若映射\(f:X\rightarrow Y\)即是一一的又是到上的,那么映射被稱為雙射(bijection)恆等映射\(f:X\rightarrow X\),若\(x=f(x),\ \forall x\in X\);若存在兩個映射\(f:X\rightarrow Y,\ g:Y\rightarrow Z\),則稱映射\(h:X\rightarrow Z\)\(g,\ f\)的符合映射,其滿足\(h(x)\equiv g(f(x)),\ \forall x\in X\),記作\(h=f\circ g\)常值映射(單點映射)\(f:X\rightarrow Y\),當且僅當\(f(x)\equiv f(x^\prime),\ \forall x,x^\prime\in X\)

  上述定義自然給出一些關於映射的一些結論,如:①映射\(f:X\rightarrow Y\)到上的當且僅當\(f[X]=Y\);②映射\(f:X\rightarrow Y\)一一的,則存在逆映射\(f^{-1}:f[X]\rightarrow X\),定義為\(f^{-1}(f(x))=x,\ \forall x\in X\),即逆映射是利用恆等映射來進行定義的。然而無論是否逆映射\(f^{-1}\)是否存在,我們都可以利用這個思想來定義任意子集\(B\subset Y\)映射\(f:X\rightarrow Y\)逆像\(f^{-1}[B]:=\{x|x\in X且f(x)\in B\}\subset X\)

  這就是集合論的基本內容。可以看見,為了研究時空本身的性質,我們需要將時空視作一個集合(后面我們將看到,它進一步的是一個微分流形)。又由於選定坐標的需要,我們需要構造一個具有自然坐標的集合\(\mathbb R^n\),並利用映射這個工具將時空與具有自然坐標的集合\(\mathbb R^n\)建立起聯系,從而賦予時空點以坐標。但這個坐標確是存在任意性的,而且也並不是所有的坐標都是有意義的,為此我們要對映射做一些適當的限制,從而幫我們選出想要的映射並利用這個映射構造出合適的坐標

2. 拓撲空間與映射的連續性(同胚映射)

  利用分析學中構建的函數也是映射,最簡單的一元實變函數正是這樣一個映射\(f:\mathbb{R\rightarrow R}\)。分析學中,我們自然能夠研究這個函數是否連續、是否可導等,那么自然地,我們也想問一般的映射能不能也有這些性質,以便我們去分析它的一些性質。首先考慮的便是映射的連續性,回想分析學中構造的\(\epsilon-\delta\)定義的連續性,首先我們需要一個開鄰域,還要有距離的概念,在一般的集合中卻沒有這些概念的定義,為此我們需要引入一些在集合上額外的結構來完善我們的論證。由於\(\epsilon-\delta\)定義中強調的是一個任意大的開鄰域之間的對應,實際上對距離的要求沒有想象中的那么高,那么我們可以先不去定義距離(事實上定義了距離的話將是所謂的度規空間),而首先考慮開子集如何定義,事實上,這就是構造拓撲空間的動機。

  回想分析學中給出的開集的性質,我們若要定義廣義的開集,自然希望它能繼承來源於分析學中開集的性質,那么可以做出如下定義

  定義1.2.1非空集合\(X\)的一個拓撲(topology)\(\mathscr T\)\(X\)若干子集的集合,滿足:
  (a) \(X,\ \emptyset\in\mathscr T\)
  (b) 若\(O_i\in\mathscr T,\ i=1,2,\cdots,n\),則有\(\begin{aligned}\bigcap_{i=1}^n\end{aligned}O_i\in\mathscr T\)
  (c) 若\(O_\alpha\in\mathscr T,\ \forall\alpha\),則\(\begin{aligned}\bigcup_\alpha^{\ }\end{aligned}O_\alpha\in\mathscr T\)

  上述定義中的性質也正是分析學中的開集的性質,則自然亦有如下定義

  定義1.2.2 指定了拓撲集合\(X\)稱為拓撲空間(topological space)拓撲空間\(X\)的子集\(O\)稱為開子集(簡稱開集),若\(O\in\mathscr T\)

  定義了開集后我們終於可以對前面我們要討論的映射下一個比較強的限制了,我們指出,這個限制給出了映射的連續性:

  定義1.2.3 設\((X,\ \mathscr T)\)\((Y,\ \mathscr S)\)拓撲空間映射\(f:X\rightarrow Y\)稱為連續的(continuous),若\(f^{-1}[O]\in\mathscr T,\ \forall O\in\mathscr S\)

  上述定義給出了一個連續映射的定義,通過這個定義我們終於可以利用映射這個工具嘗試給出時空坐標的一個條件,那就是我們希望坐標時空連續的。這個要求非常符合我們的直觀感覺,我們從未見過躍變的時空,因此我們自然希望也希望坐標時空各個部分都能是連續的。能做到這一點首先因為\(\mathbb R^n\)本身就是拓撲空間(其上定義的開集與分析學中定義的一致),那么我們只需要時空能夠構造出合適的拓撲結構即可。除此之外,我們還希望能討論時空的一些解析的性質,而為了研究的限制,我們自然還需要討論一些額外地結構。第一個問題就是作為無限延展的時空,其與\(\mathbb R^n\)根據連續統假設必然能構造雙射,我們要討論的問題就是當有着雙射的限制,兩個拓撲空間之間是否有着怎樣的關系,以及為時空賦予坐標的映射應不應該是雙射

  定義1.2.4 設\((X,\ \mathscr T)\)\((Y,\ \mathscr S)\)稱為互相同胚的(homeomorphic),若存在映射\(f:X\rightarrow Y\)滿足:(a)\(f\)雙射;(b)\(f\)\(f^{-1}\)都連續。這樣的\(f\)稱為\((X,\ \mathscr T)\)\((Y,\ \mathscr S)\)同胚映射,簡稱同胚(homeomorphism)

  同胚是建立在連續性基礎上的雙射,那這對我們為時空賦予坐標這件事有什么幫助呢。回到我們最開始的出發點,我們希望能夠分析時空的解析性質,最簡單的辦法就是能在時空中應用我們已經有的分析學中的技術。事實上,分析學本身就是在對經典物理世界性質的討論中建立起來的一種抽象工具,既然如此,我們自然希望它能夠繼續應用在我們想要建立起來的描述時空幾何結構中去。基於這個出發點,我們自然希望時空有着一些很好的性質,最簡單地便是至少在某一時空點附近的時空能回歸分析學研究的對象\(\mathbb R^n\)。但我們還未定義鄰域的概念,很難描述什么叫做時空點的“附近”。但是“回歸分析學研究的對象\(\mathbb R^n\)”這一點卻告訴我們,在這個所謂的“時空點附近的時空”(這是時空的一個子集),我們希望它與\(\mathbb R^n\)的某個子集(需要在這兩個子集子集上定義所謂的誘導拓撲以將這兩個子集都構造成為拓撲空間)的性質基本是一致的。這就是同胚的意義,它告訴了我們兩個拓撲空間是否是一致的,基於此我們希望同胚成為為時空賦予坐標這個操作的一個基本要求。現在我們來完善一下這段話中所需要的一些概念。

  定義1.2.5 設\((X,\ \mathscr T)\)拓撲空間\(A\)\(X\)的任意非空子集,定義\(A\)上的誘導拓撲(induced topology)

\[\mathscr S:=\{V\subset A|\exists O\in\mathscr T且V=A\cap O\} \]

那么,\((A,\ \mathscr S)\)稱為\((X,\ \mathscr T)\)拓撲子空間(topological subspace)

  定義1.2.6\(N\subset X\)稱為\(x\in X\)的一個鄰域(neighborhood),若\(\exists O\in\mathscr T\)使\(x\in O\subset N\)。若鄰域開集,那么它被稱為開鄰域

  有了這些討論,我們終於得到了時空上至少是連續的坐標系的構建方法,但對一個好的坐標,我們自然不滿足於僅僅是連續的。此外,還要強調的是,我們討論的時空從整體上看應該和\(\mathbb R^n\)有很大的不同,盡管它們在某個局域內是同胚的微分流形的定義可以讓這個要求升格為微分同胚),否則我們直接就可以用\(\mathbb R^n\)來刻畫時空,就像Newton力學所作的那樣,但很顯然它不符合實驗規律,這才是我們發展一般的微分幾何理論來闡述時空的動機。為了更進一步地討論,我們下面將簡要介紹一下微分流形的概念。

3. 微分流形簡介

  物理學的研究始終無法離開背景時空,但對背景時空的認識,現代物理學中采用的微分流形的方案是非常深刻的。微分流形作為\(n\)維坐標空間\(\mathbb R^n\)的一個推廣而存在,下面我們首先給出它的明確定義。

  定義1.3.1拓撲空間\(M\)稱為\(n\)維微分流形(n-dimensional differentiable manifold),簡稱\(n\)維流形,若\(M\)開覆蓋\({O_\alpha}\),即\(M=\begin{aligned}\bigcup_\alpha\end{aligned}O_\alpha\),滿足(a)對每一\(O_\alpha\ \exists\)同胚\(\psi_\alpha:O_\alpha\rightarrow V_\alpha\)\(V_\alpha\)\(\mathbb R^n\)通常拓撲(\(\mathbb R^n\)上自然定義的拓撲)衡量的開子集);(b)若\(O_\alpha\cap O_\beta\neq\emptyset\),那么復合映射\(\psi_\beta\circ\psi_\alpha^{-1}:\mathbb R^n\supset V_\alpha\rightarrow V_\beta\subset\mathbb R^n\)作為一個\(n\)\(n\)函數都是\(C^\infty\)光滑)的。

  下面我們來闡述一下微分流形這個定義對我們想要研究的對象提供了一個怎么樣的性質。首先定義1.3.1中的(a)要求正是我們前面討論的為時空賦予坐標的一個操作,而時空有了坐標,我們才能在上面利用已有的數學工具對時空的性質進一步地進行剖析,這是我們已經知道了的。只不過這里選定坐標的辦法不再要求是整個拓撲空間必須以某種映射與整個\(\mathbb R^n\)同胚,而是分開成了許多有交疊的開集,且只要求它們能同胚\(\mathbb R^n\)的某個開子集。這一點是符合常規的,因為我們總不能傾向於采用同一套坐標系,描述太陽上發生的事和地球上發生的事發生的毫不相關的事情,往往都會用不同的坐標系來分別描述它們,以方便我們的分析。但(b)要求卻指出了我們這隨意構造同胚應該滿足的一個要求,那就是描述交疊區可以采用兩套坐標,而這兩套坐標之間的變換函數必須是\(C^\infty\)光滑)的。提出這個要求后,我們才能肆無忌憚地通過變換坐標系的手段將我們研究的事物從時空的某個定義好坐標系開子集延伸到定義了另外一個坐標系開子集上去。為將坐標系的選定這一點明確下來,我們可以將這件事情確定為

  定義1.3.2坐標系\((O_\alpha,\ \psi_\alpha)\)在數學上又叫圖(chart),滿足定義1.3.1的全體集合\(\{(O_\alpha,\ \psi_\alpha)\}\)圖冊(atlas)定義1.3.1中的條件(b)又叫做相容性(compatibility)條件。因此一個圖冊中的任意兩個都是相容的。

  顯然\(\mathbb R^n\)是天然就是一個可以用自身衡量微分流形,且僅需含一個圖冊就可以覆蓋整個\(\mathbb R^n\),我們稱這類僅需含一個圖冊就可以覆蓋的微分流形平凡(trivial)流形,顯然四維Minkowski時空也是四維平凡流形。除此之外,我們的微分流形都是從拓撲空間上定義圖冊構造出來的,那么考慮兩個在同一個拓撲空間上構造的圖冊記為\(\{(O_\alpha,\ \psi_\alpha)\}\)\(\{(O_\beta^\prime,\ \psi_\beta^\prime)\}\),它們自然存在着兩種可能:①這兩個圖冊互不相容****,即\(\exists O_\alpha,\ O_\beta^\prime: O_\alpha\cap O_\beta^\prime\neq\emptyset\),但它們不滿足定義1.3.1中的相容性條件(b),很顯然,這是兩個完全不同的微分流形圖冊在這里就代表了不同的微分結構;②這兩個圖冊相容的,很顯然,我們可以直接取這兩個圖冊並集構造一個全新的圖冊,這本質上並沒有改變什么實質的東西,即這兩個圖冊代表的微分結構完全一致,為方便起見,我們可以將所有相容的圖冊放在一起構造出最大的圖冊,以后我們研究的對象都默認為這個構造出來的最大的圖冊**。

  微分流形上除了具有來自拓撲空間拓撲結構還有額外定義的微分結構,因此兩個流形之間的映射除了可以考慮連續性還可以談論可微性,這件事情本質上是借助微積分中對函數連續與可微性質來進行分類的。

  定義1.3.3\(f:M\rightarrow M^\prime\)稱為\(C^r\)類映射,如果\(\forall p\in M\)映射\(\psi_\beta^\prime\circ f\circ\psi_\alpha^{-1}\)代表的\(n^\prime\)\(n\)元函數都是\(C^r\)\(r\)次可導)類的。流形\(M\)\(M^\prime\)稱為互相微分同胚(diffeomorphic to each other),若\(\exists f:M\rightarrow M^\prime\),滿足(a)\(f\)是雙射;(b)\(f\)以及\(f^{-1}\)\(C^\infty\)的,這樣的\(f\)被稱為從\(M\)\(M^\prime\)微分同胚映射,簡稱微分同胚

  流形上自然還能定義函數,這是物理上的必然要求,例如我們考慮時空中的物質場分布,那么用函數來對其進行刻畫是最好不過的了。

  定義1.3.3\(f:M\rightarrow\mathbb R\)稱為\(M\)上的函數(function on \(M\))\(M\)上的標量場(scalar field on \(M\))。若\(f\)\(C^\infty\)的,則稱為\(M\)上的光滑函數\(M\)上全體光滑函數集合記為\(\mathscr F_M\),也可以簡單記為\(\mathscr F\),物理上討論的函數一般都是指光滑函數

  微分流形還有很多有趣的東西,但是從物理的角度上講,這是為了將我們的要研究的背景時空抽象出來並賦予其諸多優良的性質而構造出來的一個數學模型,下面我們將討論如何將我們已有的數學工具應用到這個數學模型上,以便進一步剖析時空的性質。

二、流形上的張量分析

1. 切矢(場)與余矢(場)

  既然我們要研究對流形進行分析,而流形的維數早已經在流形定義之初就已經給出了,那么最簡單的就是在上面定義矢量空間這個概念。

  定義2.1.1 實數域上的一個矢量空間(vector space)是一個集合\(V\),並在這個集合上定義兩個映射,即\(V\times V\rightarrow V\)加法(addition))以及\(\mathbb R\times V\rightarrow V\)數乘(scalar multiplication)),它們滿足以下條件

  • (a) \(v_1+v_2=v_2+v_1,\ \forall v_1,\ v_2\in V\)
  • (b) \((v_1+v_2)+v_3=v_1+(v_2+v_3),\ \forall v_1,\ v_2,\ v_3\in V\)
  • (c) \(\exists\ 零元\ \underline{0}\in V:\underline{0}+v=v,\ \forall v\in V\)
  • (d) \(\alpha_1(\alpha_2v)=(\alpha_1\alpha_2)v,\ \forall v\in V,\ \alpha_1,\ \alpha_2\in\mathbb R\)
  • (e) \((\alpha_1+\alpha_2)v=\alpha_1v+\alpha_2v,\ \forall v\in V,\ \alpha_1,\ \alpha_2\in\mathbb R\)
  • (f) \(\alpha(v_1+v_2)=\alpha v_1+\alpha v_2,\ \forall v_1,\ v_2\in V,\ \alpha\in\mathbb R\)
  • (g) \(1\cdot v=v,\ 0\cdot v=0,\ \forall v\in V\)

  我們現在要做的事便是在流形上構造出某個矢量場來,這件事情是自然的,例如我們考慮最簡單的時空中的電場分布,眾所周知,電場是一個矢量場,且它分布在時空之中,因此描述這類物理模型自然驅動着我們取構造所謂的流形上的矢量場。我們現在已經有了流形函數的定義,而函數正是所謂的標量場,最經典的標量場自然是電磁學中經常用的電勢,而電場作為電勢梯度而存在,梯度的定義比較復雜,但是與之聯系的還有所謂的方向導數的概念,我們現在要討論的就是如何利用方向導數這個再分析學中的概念,將其抽象稱為一般流形上的矢量

  定義2.1.2映射\(v:\mathscr F_M\rightarrow\mathbb R\)稱為\(p\in M\)的一個矢量(vector),若\(\forall f,\ g\in\mathscr F_M,\ \alpha,\ \beta\in\mathbb R\)

  • (a) 線性性:\(v(\alpha f+\beta g)=\alpha v(f)+\beta g(g)\)
  • (b) Leibnitz律:\(v(fg)=f\left|_g\right.v(g)+g\left|_p\right.v(f)\),其中\(f\left|_p\right.\)代表函數\(f\)\(p\)點的值,或記作\(f(g)\)

  容易證明,這樣定義的矢量滿足如下定理,而這個定理說明了我們構造的矢量的確構成一個矢量空間

  定理2.1.1 以\(V_p\)代表\(M\)\(p\)點所有矢量的集合,則\(V_p\)\(n\)維矢量空間\(n\)\(M\)維數),即\(\dim V_p=\dim M\equiv n\)

  回到定義2.1.2上,我們注意到這里定義的矢量與我們在分析學討論過的方向導數是完全一致的,或者說,我們是將分析學中的方向導數擁有的性質自然地抽象出來,並用它的性質定義了流形上的矢量。定義了矢量,我們自然想知道它的分量,而寫出矢量的分量又必須回到具體的坐標系下進行操作,而我們在定義微分流形的時候,已經完成了找尋坐標系的一系列步驟,現在我們僅需要利用這個已經定義好的坐標系矢量的分量表達出來即可。

  定義2.1.3\(X_\mu\)\(M\)\(p\)點的一個矢量,其滿足

\[X_\mu(f):=\left.\frac{\partial f\circ \psi_\alpha^{-1}}{\partial x^\mu}\right|_p,\ \forall f\in\mathscr F_M \]

其中\((O_\alpha,\ \psi_\alpha)\)\(M\)上包含\(p\)點的坐標系,即\(p\in O_\alpha\subset M\)。因此,\(F=f\circ\psi_\alpha^{-1}\)自然構成了一個\(\mathbb R^n\rightarrow\mathbb R\)多元函數\(x^\mu\)自然是第\(\mu\)個坐標。

  事實上定理2.1.1的證明需要用到定義2.1.3的一些性質,例如\(\{\left.X_\mu\right|\mu=1,2\cdots,n\}\)線性無關的,以及\(v=v^\mu X_\mu,\ \forall v\in V_p\)。這些證明都是很容易的,這里不再贅述,但是利用這樣一個定義,我們自然就有了矢量按分量展開的辦法,先做這樣一個定義

  定義2.1.4 用坐標系\((O_\alpha,\ \psi_\alpha)\)刻畫的任一點\(p\)\(\{X_1,\ X_2,\cdots,\ X_n\}\)稱為\(V_p\)的一個坐標基底(coordinate basis),每個\(X_\mu\)稱為一個坐標基矢(coordinate basis vector)\(v\in V_p\)\(\{X_\mu\}\)線性展開出來的系數\(v^\mu\)被稱為\(v\)坐標分量(coordinate components)。注意,\(v=v^\mu X_\mu\),這里利用了Einstein指標求和約定,即相同上下指標出現表示對此指標求和,並省略求和號\(\begin{aligned}\sum_\mu\end{aligned}\)不寫。

  利用微分流形上的都是相容的,並利用坐標基矢定義中利用的偏導數存在的鏈式法則,我們很容易得到如下定理,這個定理正是矢量分量的坐標變換規則,某些不談微分幾何廣義相對論書籍中也直接按照這個規則定義所謂的逆變矢量

  定理2.1.2 設\(\{x^\mu\}\)\(\{x^{\prime\nu}\}\)為兩個坐標系,其坐標域交集非空,\(p\)交集中的一點,\(v\in V_p\)\(\{v^\mu\}\)\(\{v^{\prime\nu}\}\)\(v\)在這兩個坐標系坐標分量,則

\[v^{\prime\nu}=\left.\frac{\partial x^{\prime\nu}}{\partial x^\mu}\right|_p v^\mu \]

其中\(x^{\prime\nu}\)是兩坐標系變換函數\(x^{\prime\nu}(x^\sigma)\)的簡寫。

  值得指出的是,我們這里定義的矢量看起來是利用函數定義的,但實際上,我們考慮的偏導數卻並不是流形上定義的函數自然擁有的,更一般地,是利用\(C^1\)曲線來定義流形上某點的矢量,而所謂的\(C^1\)曲線是指\(C:\mathbb R\rightarrow M\),顯然對\(M\)上任一點\(p\)總能夠造出這樣的曲線,所謂的\(C^1\)則是指,通過坐標系,我們總能構造出\(n\)一元函數,對這些函數的要求非常簡單,即至少一階可導。利用這類曲線,我們自然能定義出這樣一個矢量

  定義2.1.5 設\(C(t)\)流形\(M\)上的\(C^1\)曲線,則線上\(C(t_0)\)點的切於\(C(t)\)切矢(tangent vector)\(T\)\(C(t_0)\)點的矢量,其對\(f\in\mathscr F_M\)作用的定義為

\[T(f):=\left.\frac{d(f\circ C)}{dt}\right|_{t_0},\ \forall f\in\mathscr F_M \]

  這也是我們稱其做切矢的直接來源。定義了矢量,我們自然可以考慮在流形\(M\)上任意一點都指定一個矢量,這樣就構成了一個矢量場,物理上一般還對這個矢量場有着很高的要求,於是便有如下定義。

  定義2.1.5 設\(A\)\(M\)子集,若給\(A\)中任意一點都指定一個矢量,這樣就構成了一個定義在\(A\)上的矢量場\(M\)上的矢量場\(v\)稱為\(C^\infty\)類(光滑)的,若\(v\)作用於\(C^\infty\)類函數的結果仍是\(C^\infty\)類函數,即\(v(f)\in\mathscr F_M,\ \forall f\in\mathscr F_M\),我們討論的矢量場均指光滑矢量場

  我們已經完成了流形上的(切)矢量空間以及(切)矢量場的討論。但是考慮另外一件事情,線性代數中我們的確會構造出一種矢量,它被稱為列矢量,那列矢量自然有與之對應的行矢量,只需要對列矢量進行一次簡單的轉置即可。回到流形上的矢量空間,我們自然也希望能對這里的矢量能構造出類似的結構來,我們指出,這就是所謂的對偶矢量

  定義2.1.6 設\(V\)\(\mathbb R\)上的有限維矢量空間線性映射\(\omega:V\rightarrow\mathbb R\)稱為\(V\)上的對偶矢量(dual vector)\(V\)上全體對偶矢量集合稱為\(V\)對偶空間,記作\(V^*\)

  根據這個定義,可以很容易證明如下定理,注意利用我們在定義矢量空間所明確寫出的性質。

  定理2.1.3\(V^*\)矢量空間,且\(\dim V^*=\dim V\)

  可以利用\(V\)中的一組基\(\{e_\mu\}\)明確地定義出\(V^*\)中的一組基\(\{e^\nu\}\)

  定義2.1.7 設\(\{e_\mu\}\)\(V\)中的一組基,則可以定義\(V^*\)\(n\)個特別的元素:

\[e^{\mu*}(e_\nu):={\delta^\mu}_\nu,\ \mu=1,\cdots,n \]

其中\({\delta^\mu}_\nu\)為Kronecker符號,當且僅當\(\mu=\nu\)時為\(1\),其余為\(0\)

  自然有\(\omega=\omega_\mu e^{\mu*}\),其中\(\{e^\nu\}\)自然構成了\(V^*\)中的一組基,稱之為對偶基底。一般地,我們在切矢空間取了坐標基底\(X_\mu=\frac\partial{\partial x^\mu}\),相應的對偶空間坐標基底自然可以寫為\(dx^\mu\)。類似於定理2.1.2,可以得到對偶矢量的分量變換如下。

  定理2.1.4 設坐標系\(\{x^\mu\}\)\(\{x^{\prime\nu}\}\)有交,則交域中的任意一點\(p\)對偶矢量\(\omega\)在兩坐標系中的分量\(\omega_\mu\)\(\omega_\nu^\prime\)的變換關系為

\[\omega_\nu^\prime=\left.\frac{\partial x^\mu}{\partial x^{\prime\nu}}\right|_p\omega_\mu \]

  有了對偶空間,我們自然能從另外一個角度來考察矢量空間的性質,例如,我們依舊可以取對偶空間對偶空間,記為\(V^{**}\),不妨定義\(v^{**}(\omega):=\omega(v),\ \forall\omega\in V^*\),顯然這構成了一個\(V\rightarrow V^{**}\)同構映射,從而我們可以將\(V\)\(V^*\)認同起來,即把它們認為是同一個矢量空間。我們這里的討論是憑借矢量空間來構造的對偶矢量空間,實際上,考慮流形\(C^\infty\)函數的性質,也能得到對偶矢量空間,被稱為余矢量空間,不再贅述。對偶矢量場的定義類似於矢量場,不再重復,但是注意對\(f\in\mathscr F_M\)\(df\)自然能誘導出\(M\)中的一個對偶矢量場,這是分析學中的微分算符的一個推廣,被稱為外微分算符。有了矢量對偶矢量,我們可以考慮多個矢量空間與多個對偶矢量空間張量積以便構造張量

2. 張量以及張量空間

  定義2.2.1 矢量空間\(V\)上的一個\((k,l)\)型張量(tensor of type \((k,l)\))是一個多重線性映射

\[\begin{aligned} T:\underbrace{V^*\times\cdots\times V^*}\times\underbrace{V\times\cdots\times V}\rightarrow\mathbb R\\{k個}\quad\quad\quad\quad\quad\ \ {l個}\quad\quad\quad\quad\ \end{aligned} \]

進一步地,可以定義\(V\)\((k,l)\)\((k^\prime,l^\prime)\)型張量\(T\)\(T^\prime\)張量積(tensor product)\(T\otimes T^\prime\)是一個\((k+k^\prime,l+l^\prime)\)型張量,定義為

\[\begin{aligned} &T\otimes T^\prime(\omega^1,\cdots,\omega^k,\omega^{k+1},\cdots,\omega^{k+k^\prime};v_1,\cdots,v_k,v_{k+1},\cdots,v_{k+k^\prime}) \\ :=&T(\omega^1,\cdots,\omega^k;v_1,\cdots,v_k)T^\prime(\omega^{k+1},\cdots,\omega^{k+k^\prime};v_{k+1},\cdots,v_{k+k^\prime}) \end{aligned} \]

  根據這個定義的張量,我們自然有如下定理

  定理2.2.1\(\mathscr T_V(k,l)\)矢量空間,且\(\dim\mathscr T_V(k,l)=n^{k+l}\),其中\(n\)流形維數。以及\(\{e_{\mu_1}\otimes\cdots\otimes e_{\mu_k}\otimes e^{\nu_1*}\otimes\cdots\otimes e^{\nu_k*}\}\)構成這個矢量空間的一組基底,若采用坐標基底,僅需將\(e_{\mu_i}\)替換成\(\left(\frac\partial{\partial x^{\mu_i}}\right)\)\(e^{\nu_i*}\)替換成\(dx^{\nu_i}\)即可。

  仿照矢量空間對偶矢量空間中的討論,我們自然還有張量變換率如下。

  定理2.2.2\((k,l)\)型張量在兩個坐標系中的分量的關系為

\[{T^{\prime\mu_1\cdots\mu_k}}_{\nu_1\cdots\nu_l}=\frac{\partial x^{\prime\mu_1}}{\partial x^{\rho_1}}\cdots\frac{\partial x^{\prime\mu_k}}{\partial x^{\rho_k}}\frac{\partial x^{\sigma_1}}{\partial x^{\prime\nu_1}}\cdots\frac{\partial x^{\sigma_l}}{\partial x^{\prime\nu_l}}{T^{\rho_1\cdots\rho_k}}_{\sigma_1\cdots\sigma_l} \]

其中

\[{T^{\prime\mu_1\cdots\mu_k}}_{\nu_1\cdots\nu_l}:=T\left(dx^{\mu_1},\cdots,dx^{\mu_k};\left(\frac\partial{\partial x^{\nu_1}}\right),\cdots,\left(\frac\partial{\partial x^{\nu_l}}\right)\right)\\ {T^{\rho_1\cdots\rho_k}}_{\sigma_1\cdots\sigma_l}:=T\left(dx^{\rho_1},\cdots,dx^{\rho_k};\left(\frac\partial{\partial x^{\sigma_1}}\right),\cdots,\left(\frac\partial{\partial x^{\sigma_l}}\right)\right) \]

  由張量定義張量場矢量場的定義完全類似,不再詳細討論。現在有了張量場,我們終於可以討論定義在時空中最重要的結構——度規張量場了。

3. 度規結構

  度規是一個定義在矢量空間上的重要結構,因為我們定義的矢量空間到目前為止都是無法度量的,在這樣一個矢量空間談論距離毫無意義,而度規的定義就是我們為這個矢量空間賦予真正意義的距離的概念,而對時空而言,我們自然希望能夠去度量兩個時空點距離,因此我們要考慮流形上如何定義度規結構,首先定義矢量空間上的度規

  定義2.3.1矢量空間\(V\)上的一個度規(metric)\(g\)\(V\)上的一個對稱、非退化的\((0,2)\)型張量對稱是指\(g(u,v)=g(v,u),\ \forall u,v\in V\)非退化是指\(g(v,u)=0\ \forall u\in V\Rightarrow v=0\in V\)

  那么在流形上定義的度規場就是在流形上任一點都指定一個度規張量,並且滿足它是\(C^\infty\)的。有了度規,我們自然能定義矢量的長度如下

  定義2.3.2\(v\in V\)長度(length)大小(magnitude)定義為\(|v|;=\sqrt{|g(v,v)|}\)矢量\(u,v\in V\)稱為互相正交的(orthogonal),若\(g(u,v)=0\)\(V\)基底\(\{e_\mu\}\)正交歸一的(orthonormal),若任意兩個基矢正交且對每一基矢\(e_\mu\)都滿足\(g(e_\mu,e_\mu)=\pm1\)。自然有度規\(g\)正交歸一基底的分量滿足

\[g_{\mu\nu}=\left\{\begin{aligned}0,\quad&\mu\neq\nu\\\pm1,\quad&\mu=\nu\end{aligned}\right. \]

度規正交歸一基底的分量排成的矩陣是對角的,且對角元為\(+1\)或者\(-1\)慣性定理指出,對角元中為\(+1\)或者\(-1\)的數目與所選的正交歸一基底無關。利用這一點,我們可以定義對角元全為\(+1\)度規正定度規(positive definite metric)或者Rieman度規(Riemannian metric),對角元全為\(-1\)度規負定度規(negative definite metric),其余均為不定度規(indefinite metric),只有一個對角元為\(-1\)不定度規被稱為Lorentz度規(Lorentzian metric)。對角元之和叫度規號差(signature)。相對論中常用的度規正定度規Lorentz度規

  在流形上定義了度規場,那么我們可以衡量曲線長度,一般地,我們研究的都是定義了Lorentz度規的一般時空,在這個時空自然由如下幾種用線長分類的曲線如下。

  定義2.3.3 設存在流形\(M\)Lorentz度規場\(g\),則\(M\)上的類空(space-like)類光(light-like or null)類時曲線\(C(t)\)線長定義為

\[l:=\int{\sqrt{\left|g(T,T)\right|}}\ dt \]

定義元線長

\[ds^2\equiv g_{\mu\nu}dx^\mu dx^\nu \]

線長又可以定義為

\[\begin{aligned} &l=\int\sqrt{ds^2}&(\text{for spacelike})\\ &l=\int\sqrt{-ds^2}&(\text{for timelike})\\ &l\equiv0&(\text{for null}) \end{aligned} \]

  值得一提的是,在狹義相對論所涉及的Minkowski時空之中,\(ds^2\)是Lorentz不變量,而上面區分的三種曲線,也是根據質點運動規律來區分的,其中類時線有質量粒子(massive particle)時空中的運動軌跡,類光線無質量粒子(massless particle)(如光子(photon))在時空中的運動軌跡,而沒有粒子能夠在時空中以類空線運動。現在我們能具體對時空下一個准確的定義了,具體如下。

  定義2.3.4 設流形\(M\)給定度規場\(g\),則\((M,g)\)稱為廣義黎曼空間,我們感興趣的廣義黎曼空間主要分為兩類:一類為度規正定,則被稱為黎曼空間(Riemannian space),注意,負定度規正定度規沒有本質的區別;另外一類則是Lorentz度規,被稱為偽黎曼空間(pseudo-Riemannian space),即物理上的時空。對時空\((M,g)\)還應該提這兩個要求,一是\(M\)連通流形,二是\(g\)為有足夠可微程度的Lorentz度規場

  最簡單的時空應該是\(n\)維Minkowski時空,它是在\(\mathbb R^n\)上直接定義對角化的Lorentz度規而構造出來的,狹義相對論涉及的對象只有\(n\)維Minkowski時空,且一般\(n=4\),數學表述如下。

  定義2.3.5 設\(\{x^\mu\}\)\(\mathbb R^n\)自然坐標,在\(\mathbb R^n\)上定義度規張量場\(\eta\)

\[\eta:=\eta_{\mu\nu}dx^\mu\otimes dx^\nu \]

其中

\[\eta\equiv\left\{ \begin{aligned} 0&&\mu\neq\nu\\ -1&&\mu=\nu=0\\ +1&&\mu=\nu=1,\cdots,n-1 \end{aligned} \right. \]

則稱\((\mathbb R^n,\eta)\)\(n\)維Minkowski時空\(\eta\)稱為Minkowski度規

  注意到,如果考慮\(g(v,\cdot),\ v\in V\),顯然這是一個映射,它的作用是\(g(v,\cdot):V\rightarrow\mathbb R\),其滿足\(g(v,\cdot)(u)=g(v,u),\ \forall u\in V\)。不妨定義一個對偶矢量\(\omega\in V^*\)滿足\(\omega(u)\equiv g(v,u)\),則可以用\(\omega\)來代替\(g(v,\cdot)\)。可以說,我們可以利用度規構建一個映射\(V\rightarrow V^*\),其定義正是前面的操作,這就是常說的用度規對指標進行升降的操作,我們可以構造這個映射逆映射,並將這個逆映射稱為度規\(g\),那么這個逆度規對應着映射\(V^*\rightarrow V\)

  下面我們將介紹流形一個內稟的性質——曲率,有了這個曲率,我們將更進一步對時空的一般性質有更進一步的認識,並從此出發,構造Einstein的廣義相對論的基本理論框架。

4. Riemann曲率張量

  在Euclid空間以及Euclid幾何中定義的分析學是非常有用的數學工具,尤其是分析學中的場論中,自然存在着導數算符\(\vec\nabla\),它作用於函數(標量場)\(f\)得到的是矢量場\(\vec\nabla f\)(梯度),作用於矢量場\(\vec v\)並求縮並得到標量場\(\vec\nabla\cdot v\)(散度)。由於Euclid空間上自然定義的度規\(\delta_{ab}\)使得此空間上定義的矢量對偶矢量沒有本質的區別,這就是我們為什么在研究分析學的時候並沒有對這兩種不同的矢量進行區分的根本原因。現在我們為了將\(\vec\nabla\)推廣到任意流形,這兩個不同的矢量區分就顯得重要了起來。下面,我們首先給出(無撓)導數算符的定義,最后利用它得到所謂的Riemann曲率張量

  定義2.4.1 以\(\mathscr F_M(k,l)\)代表流形\(M\)上全體\(C^\infty\)\((k,l)\)型張量場的集合(函數\(f\)可以看作\((0,0)\)型張量場(標量場),即\(\mathscr F_M(0,0)\equiv\mathscr F_M\))。映射\(\nabla:\mathscr F_M(k,l)\rightarrow\mathscr F_M(k,l+1)\)稱為\(M\)上的(無撓)導數算符,若它滿足以下條件

  • (a) 線性性:

    \[\nabla_a(\alpha{T^{b_1\cdots b_k}}_{c_1\cdots c_l}+\beta{S^{b_1\cdots b_k}}_{c_1\cdots c_l})=\alpha\nabla_a{T^{b_1\cdots b_k}}_{c_1\cdots c_l}+\beta\nabla_a{S^{b_1\cdots b_k}}_{c_1\cdots c_l} \\ \forall\ {T^{b_1\cdots b_k}}_{c_1\cdots c_l},\ {S^{b_1\cdots b_k}}_{c_1\cdots c_l}\in\mathscr F_M(k,l),\quad\alpha,\beta\in\mathbb R \]

  • (b) Leibnitz律:

    \[\begin{aligned} \nabla_a({T^{b_1\cdots b_k}}_{c_1\cdots c_l}{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}})={T^{b_1\cdots b_k}}_{c_1\cdots c_l}\nabla_a{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}}\\ +{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}}\nabla_a{T^{b_1\cdots b_k}}_{c_1\cdots c_l}\\ \forall\ {T^{b_1\cdots b_k}}_{c_1\cdots c_l}\in\mathscr F_M(k,l),\quad{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}}\in\mathscr F_M(k^\prime,l^\prime) \end{aligned} \]

  • (c) 與縮並可以交換順序;

  • (d) \(v(f)=v^a\nabla_a f,\quad\forall f\in\mathscr F,\ v\in\mathscr F_M(1,0)\)

  • (e) 具有無撓性(torsion free)\(\nabla_a\nabla_b f=\nabla_b\nabla_a f,\ \forall f\in\mathscr F_M\)

  上述定義的導數算符有很多應用,也有很多性質,我們不在這里進行詳細的介紹了,下面直接通過它來構造Riemann曲率張量,並簡單列舉Riemann曲率張量的性質,簡述其對應的幾何意義與物理意義。

  定義2.4.2導數算符\(\nabla_a\)Riemann曲率張量場\({R_{abc}}^d\)由下式定義

\[(\nabla_a\nabla_b-\nabla_b\nabla_a)\omega_c={R_{abc}}^d\omega_d,\quad\forall\omega_c\in\mathscr F_M(0,1) \]

  Riemann曲率張量反映的是導數算符非對易性質,我們指出,導數算符實際定義了流形矢量沿曲線平移的概念。而其非對易,則告訴我們,從某點出發的矢量流形上某一閉合曲線回到原點后不能與原矢量重合,簡單的理解就是,我們描述的流形是“彎曲的”。由導數算符Leibnitz律出發還可以得到導數算符對易子矢量場\(v^c\)的作用為\((\nabla_a\nabla_b-\nabla_b\nabla_a)v^c=-{R_{abd}}^cv^d\)Riemann曲率張量還有如下性質:

  定理2.4.1Riemann曲率張量\({R_{abc}^d}\)滿足

  • (1) \({R_{abc}}^d=-{R_{bac}}^d\)
  • (2) \({R_{[abc]}}^d=0\)循環恆等式(cyclic identity));
  • (3) \(\nabla_{[a}{R_{bc]d}}^e=0\)Bianchi恆等式);

\(M\)上有度規場\(g_{ab}\)\(\nabla_a g_{bc}=0\),則可定義\(R_{abcd}\equiv g_{de}{R_{abc}}^e\),則有

  • (4) \(R_{abcd}=-R_{abdc}\)
  • (5) \(R_{abcd}=R_{cdab}\)

  由對稱性可知,對\(n\)維流形而言,Riemann曲率張量獨立分量的數目為\(N=n^2(n^2-1)/12\)。且獨立的縮並僅有一個\(R_{ab}:={R_{acb}}^c\),被稱為Ricci張量,還能構造一個標量曲率\(R:=g^{ab}R_{ab}\),稱為Ricci標量。我們指出,Riemann曲率張量反映了流形本身內稟的彎曲性質,而Einstein將引力解釋為時空流形受到物質場分布的影響產生的彎曲,這就是我們為什么要發展微分幾何,並用這套數學工具刻畫廣義相對論的重要原因。下面我們將簡要概括廣義相對論的一些基礎內容。

三、廣義相對論——時空作為微分流形的理論

1. Einstein場方程與廣義相對論歷史回顧

  廣義相對論是描述引力相互作用的最為成功的一個理論,其基本思想可以被概括成以下兩條:(1) 四維時空是一個彎曲的贗黎曼流形,其度規號差為\((-,+,+,+)\);(2) 物質的能動張量與時空幾何滿足著名的Einstein場方程

\[R_{\mu\nu}-\frac12Rg_{\mu\nu}=8\pi GT_{\mu\nu}\tag{3.1.1} \]

其中\(R_{\mu\nu}\),被稱為Ricci張量\(R=g^{\mu\nu}R_{\mu\nu}\)為Ricci張量的跡,\(g_{\mu\nu}\)度規張量\(T_{\mu\nu}\)物質的能動張量\(G\)Newton萬有引力常數。Einstein敏銳地認識到了Bianchi恆等式能量動量守恆的要求可以得到這樣一個方程,並且在諸多物理實驗中都得到了很好的驗證。

  廣義相對論是一百年前Einstein提出的一個描述引力相互作用的理論,我們在這里簡單回顧下它的歷史。眾所周知,Maxwell總結了大量關於電磁學的實驗事實,並從這些實驗事實中得到了電磁學理論一套完備的數學表述——Maxwell方程組。他進一步從這套理論中得到了對電磁波的預言,后來Hertz通過實驗證實了電磁波的存在,這被視為Maxwell電磁理論最成功的預言之一。但Maxwell電磁理論Newton的經典力學卻存在着某些不可調和的沖突,最直接的一點就是由Maxwell電磁理論得到的電磁波波速似乎是與參考系的選取無關的,即其在不同的坐標系中遵循不同於經典力學中的坐標變換規則——Galileo變換。在前人工作的基礎上,Einstein於1905年提出了狹義相對論,改變了人們對時空的觀念,從而調和了經典電磁學經典力學之間的矛盾。但是狹義相對論卻又與Newton提出的萬有引力理論存在不可調和的矛盾。在深入考量時空的性質之后,Einstein在1915年創造性地提出了廣義相對論,他將引力相互作用解釋成時空的彎曲,並提出了三大可以證實廣義相對論的推論,分別是引力紅移水星近日點進動引力透鏡效應,這三大推論最終都得到了實驗的驗證,從而奠定了Einstein廣義相對論的扎實基礎。

  Schwarzschild於廣義相對論提出后的第二年(1916年)給出了一個球對稱的真空解,即著名的Schwarzschild解,不久后,球對稱的電磁真空解——Reissner-Nordström解也得到了。隨后人們重新對Laplace曾經提出的特殊天體——“暗星”進行思考,Oppenheimer與Snyder從廣義相對論出發,重新證明了這類天體的存在,並由Wheeler在1967年建議定名為黑洞。對黑洞這種極端天體的研究始於上世紀六七十年代,Bekenstein在各種黑洞的理論分析中,首先提出黑洞熱力學的概念,他認為黑洞系統存在着溫度熱力學量,這個猜想很快得到了Hawking的數學證明並加以完善,形成了完整的黑洞熱力學理論

  但是黑洞的存在一直是個謎,它所要求的極端條件在偌大的宇宙中雖然並不少見,但是由於它本身不允許任何物質逃離其視界面以及可能發出輻射的吸積盤區域發出的輻射又是如此之弱,因此我們在茫茫星河之中實在難以直接觀測到黑洞存在的直接證據。直到2015年9月14日,LIGO探測到來自兩個黑洞合並的引力波信號GW150914,不僅證明了引力波的存在,更加有力地證實了廣義相對論的正確性,更是為黑洞的存在提供了最有力的間接證據。緊接着是北京時間2019年4月10日21:00整,全球六家天文台聯合發布由事件視界望遠鏡(Event Horizon Telescope)觀測到人類歷史上首張黑洞照片,這是位於距地球5500萬光年外的室女座方向的M87,其質量約有65億個太陽質量,完全證實了黑洞*的存在。

  廣義相對論至今已有百余年的歷史,其正確性在一個非常廣闊的尺度上通過種種實驗已確定無疑,但它必定不是我們希望能得到的能解釋整個物質世界種種客觀規律的最終理論,對廣義相對論修正理論的研究方興未艾。

2. Einstein場方程在低能下的漸進行為

  粗暴地將方程列出來並不能說明這個理論是正確的,事實上,Newton力學在幾百年的發展歷程中早就建立了無懈可擊的地位。為此,Einstein提出的場方程在我們觸手可及的范圍內不應該得到與Newton力學的結論違背的結果。索性,在最早得到Einstein場方程中已經考慮到了這一點,能動張量\(T_{\mu\nu}\)前面跟着的系數正是考慮了這個才得到的,具體的討論細節不再贅述。但是若僅僅滿足於這個相符,那么Einstein場方程就沒有提出的必要了,事實上我們將看到,在能量稍微高一點的情況下,廣義相對論得到的結果將與Newton力學有着明顯的差異,而實驗對它們的檢驗,毫無疑問地支持了廣義相對論的結果!

  第一個重要的實驗驗證便是著名的引力紅移實驗,廣義相對論給出的引力紅移量\(Z\)

\[Z\approx\frac{GM}{r}\tag{3.2.1} \]

其對應着這幾個實驗:

  1. 太陽譜線引力紅移
    理論值為\(2.12\times10^{-6}\),觀測值為\((2.12\times10^{-6})\times(1.05\pm0.05)\),可見觀測值以\(5\%\)的精度驗證了理論值。
  2. 天狼星伴星
    理論值為\(2.12\times10^{-4}\),觀測值為\((2.8\pm1)\times10^{-4}\)
  3. 波江座\(40\)伴星\(B\)
    理論值為\(5.6\times10^{-5}\),觀測值為\(7\times10^{-5}\)
  4. Mossbauer效應驗證
    這是一個地球附近的實驗驗證,一個實驗對應的理論值為\(4.92\times10^{-15}\),觀測值為\(4.92\times10^{-15}\times(0.997\pm0.008)\)

需要指出的是,雖然這些結果看起來都符合廣義相對論,但實際上Newton的萬有引力理論還是都可以解釋上述結果的。

  第二個重要的實驗驗證為水星近日點進動中有每百年\(43^{\prime\prime}\)Newton力學完全無法解釋的,但是利用廣義相對論可以得到正確的結果。

  第三個重要的實驗驗證為光線偏折實驗,這個實驗明顯地體現了廣義相對論Newton力學的區別。廣義相對論給出的理論值為

\[\Delta\theta\approx\frac{4GM}{R}\tag{3.2.2} \]

Newton力學給出的理論值為

\[\Delta\theta\approx\frac{2GM}R\tag{3.2.3} \]

顯然它們有很大的不同,而實驗上(日全食時對太陽在地面觀測者看來附近恆星所在位置的測量)支持了廣義相對論

  低能極限下,Einstein場方程還會給出一個相當重要的預言——引力波引力波可以看作是平坦時空流形——Minkowski時空下的一個線性弱場擾動,對這個的討論用到了大量的微分幾何,最后得到了一套完整的描述引力波的方法,目前人們已經具體觀測到了引力波的存在,再度穩固了廣義相對論的實驗基礎。

3. 一些重要的場方程精確解概略

  • 球對稱真空解——Schwarzschild外部解

    \[ds^2=-\left(1-\frac{2GM}r\right)dt^2+\left(1-\frac{2GM}r\right)^{-1}dr^2+r^2d\Omega_2^2\tag{3.3.1} \]

  • 電磁真空球對稱解——Reissner-Nordström解

    \[\begin{aligned} ds^2=-\left(1-\frac{2GM}r+\right.&\left.\frac{Q^2}{r^2}\right)dt^2 \\ &+\left(1-\frac{2GM}r+\frac{Q^2}{r^2}\right)^{-1}dr^2+r^2d\Omega_2^2 \end{aligned}\tag{3.3.2} \]

  • 軸對稱帶電一般解——Kerr-Newman解

    \[\begin{aligned} ds^2=&-\left(1-\frac{2GMr-Q^2}{\rho^2}\right)dt^2+\frac{\rho^2}\Delta dr^2+\rho^2d\theta^2 \\ &+\left[(r^2+a^2)\sin^2\theta+\frac{(2GMr-Q^2)a^2\sin^4\theta }{\rho^2}\right]d\varphi^2 \\ &-\frac{2(2GMr-Q^2)a\sin^2\theta}{\rho^2}dtd\varphi \end{aligned}\tag{3.3.3} \]

  這三個解反映了物質時空的作用,而對時空性質的刻畫我們利用了度規場\(g_{\mu\nu}\),而求解這三個解的過程,我們也大量應用了微分幾何工具。除此之外,這三個解所直觀描寫的時空並不完備,我們通過微分幾何的構造,能將上述幾個解所刻畫的時空區域進行延拓,構造所謂的最大延拓時空,並利用共性變換的技術繪出Penrose圖來直觀地描繪時空的完整結構。而在這個延拓之后,我們也能從中得到許多有趣的東西——例如黑洞以及蟲洞。這些內容都可以在廣義相對論的基本教材中可得到查閱,這里只做一個粗略的介紹。

四、引力相互作用與量子化展望

  量子理論則是二十世紀近代物理學發展的兩大支柱中的另一個重要的理論體系,其發展根源於我們對物質組成進行的深入的探索。在諸位物理學家努力下,最終完善了量子力學的基本概念,並發展了波動力學矩陣力學兩種等價的數學形式,對微觀世界的物理機制有了全新的認識。但是量子力學的理論本身與相對論本身存在着內在邏輯上的矛盾,但二者都是描述自然界現象的理論,既然自然界能正常地運行,那么這兩個理論就不應該存在着不可調和的矛盾,因此我們從邏輯上出發,自然而然地可以合理猜測應該由某種更為一般的萬有理論,而量子力學與相對論本身不過是它的某種近似罷了。

  初步對這個問題做出一個比較完善的解答的理論則是量子場論,在考慮了狹義相對論量子力學的基本原理的結合后,人們成功地在結合電磁相互作用的基礎上發展了量子電動力學,並進一步整合弱相互作用發展了電弱統一理論,在考慮強相互作用的基礎上形成了完整的粒子標准模型,完善了整個量子場論的研究。

  但是這套理論與廣義相對論依舊無法統一,這也意味着廣義相對論所描述的引力相互作用遲遲無法完成相應的量子化,我們也一直無法構建一個包含自然界四種基本相互作用大一統模型

  目前有兩條路徑達到這個我們期待的終極理論,一個是相互作用幾何化(即將四種相互作用都用幾何的語言描述刻畫,目前電磁規范理論引力理論都已經成功),另外一個則是考慮時空的量子化(將引力相互作用量子化為一個自旋\(2\)規范玻色子),但無論是從相互作用幾何化,還是考慮時空的量子化都遇到了極大的困難。

  目前人們更加傾向於將時空量子化弦論就是一個非常重要的嘗試。人們首先通過研究強相互作用粒子散射振幅在高能情形下的行為,發現它可以被一維弦動力學來進行等價描述。更進一步地,人們還發現了閉弦對應的粒子中包括一個無跡對稱的張量,通過研究它正對應着四維時空自旋為2的零質量粒子。前期對引力量子化的研究指出,這個粒子應該正是用來傳遞引力相互作用粒子,人們進一步發現,弦論至少應該是一個量子引力的理論。后來,在1984年到1985年間,人們又發現了五種微擾弦論,它們在量子理論的意義下是自洽的,並且在計算除引力相互作用外的三種相互作用中都給出了不同於量子場論計算中出現的無窮大結果,即它們給出的結果都直接是有限的,換句話說,超弦理論本身就應該能自然而然地將四種基本相互作用統一起來。更進一步地,第二次超弦革命將五種不同的微擾弦論統一了起來,並提出了十一維的超引力模型,並預言存在一個更大的M理論。但這些理論都還未完善,還需大量數學家和物理學家的共同努力,來完善我們對物質世界的探索。

參考文獻

[1] 梁燦彬, 周彬. 微分幾何入門於廣義相對論(上冊)[M]. 第2版. 北京: 科學出版社. 2006

[2] 陳斌. 廣義相對論[M]. 第1版. 北京: 北京大學出版社, 2018.

[3] 趙柳. 相對論與引力理論導論[M]. 第1版. 北京: 科學出版社, 2017.

[4] CARROLL S M. 時空與幾何[M]. 北京: 世界圖書出版公司北京公司, 2012.

[5] 趙崢, 劉文彪. 廣義相對論基礎[M]. 北京: 清華大學出版社, 2010.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM