最近在Coursera上學一門Introduction to Astronomy的課程,講到恆星演化末期的坍縮,需要用到相對論,於是課上也順帶介紹了一下相對論。一直對相對論感覺神秘不可理解的我幾個video下來居然也能理解一些了。想想高中和大一大二學物理的時候講相對論部分,純粹只是記了幾個公式,推導完全不會,更不用提理解了。學到新東西感覺很好,決定記下狹義相對論里面的基礎變換式洛倫茲變換的推導過程。
相對論最深遠的意義是改變了人們之前對時間和空間的概念。在經典物理學中,時間和空間是獨立的兩個維度,而相對論中,時間和空間是聯系在一起互相影響的。這個相互影響正是通過洛倫茲變換構建而成。
具體而言,洛倫茲變換探討不同慣性參考系(注:慣性參考系是指牛頓定律成立的參考系——零加速度(靜止或勻速直線運動)參考系。有加速度的參考系中的運動需引入不存在的“慣性力”才能用牛頓定律解釋。一般的討論都只限在慣性系中)中描述同一事件時空坐標的變換關系。這里“事件”這個概念表示時空坐標系中的一個點。只討論一維的情況,空間用x坐標表示,時間用t表示。則(x, t)代表發生在位置x,時間t的事件,例如x=實驗室,t=星期一中午1點,就對應我吃午飯的事件。洛倫茲變換式應用到這里,就可以表示不同慣性參考系中我吃午飯這個事件的(x, t)坐標之間的變換關系。由於要討論時空關系,這里的參考系包含時間維度。
整個狹義相對論的時空體系構建在兩個基本假設之上:
* 相對性原理:物理規律與所選(慣性)參照系無關;
* 光速不變原理:(真空中的)光速在不同參照系中都一樣。
高中第一堂物理課開始就學到物理現象的描述總是對某一個參考系而言的,相對性原理說的就是所有慣性系中的物理規律都是一樣的,沒有哪一個參考系比其他的更特殊。這個原理引申出一些結論:
1. 在一個慣性系O中看到某物體做勻速直線運動(不受力的作用,或所有力的作用相互抵消),則另一個慣性系O'中該物體也做勻速直線運動。
2. 空間一致性:參考系空間原點選在空間任意一點物理規律都一樣,只不過坐標需做相應的平移。
3. 時間一致性:參考系時間原點選在時間任意一點物理規律都一樣,只不過坐標需做相應的平移。
相對性原理比較容易理解。伽利略早在相對論提出幾百年前就已經提出了相對性原理,並給出了經典物理學中不同參考系中的時空變換式。設有兩個參考系O和O',他們原點重合(亦即以同一事件定義x=0和t=0這一點),並且O'相對O以速度v沿x軸做勻速直線運動。設某事件在O中的坐標為(x, t),對應在O'中坐標為(x', t'),則伽利略變換為如下形式:
$$\begin{eqnarray*}x' &=& x - vt\\ t' &=& t\end{eqnarray*}$$
這個變換符合常識,經典物理中,時間是一個獨立維度,因此O和O'中的時間總是一致的。另一方面,經過時間t后,O'移動了vt的距離,從而\(x'=x-vt\)。對時間求導,可以得到速度變換式\(u'=u-v\),從而\(u=u'+v\),即速度的疊加性。
光速不變原理就有點不符合常識了。設在O'中沿x方向發出一束光,在O'中測到的光束最前端速度為光速c,由於O'相對於O以速度v運動,對O而言光束最前端速度按照伽利略變換(“常識”)應為\(c+v\)。可是光速不變原理說,O中測到的這個速度也得是c,這就是奇怪之處了。不過這條光速不變原理正是相對論區別於經典物理的地方,由這條假設可以推出一整套全新的相對論物理體系。這套新的相對論物理體系並不是和經典物理完全相悖,相反,在低速條件下(相對c而言低速)經典物理是相對論很好的近似。因而,相對論代表了我們對物理現象的更深層次的理解。
這個奇怪的光速不變原理是怎么提出來的呢?最初的根源來自麥克斯韋(Maxwell)的電磁場方程組,由這個方程組可以推算出真空中的光速c的值。但是,這個推導和參考系並沒有關系,這就與伽利略變換相悖了。因此,人們有兩個選擇:(1)麥克斯韋方程組推導出的光速是基於某個未知參考系算出來的;(2)接受光速在不同參考系中不變這個結論。對十九世紀末的人們來說,光速不變實在是難以想象,相比之下第一選擇就容易接受的多了。於是很多人花了很大的力氣去尋找這個未知參考系(人們把這個參考系叫做“以太”),但一直都沒有成功(例如著名的邁克耳孫-莫雷實驗)。后來就有人慢慢開始懷疑以太可能不存在,而傾向於相信光速可能的確不變了。另一方面,洛倫茲也推導出了一組時空變換式,使得麥克斯韋方程組能夠與之兼容。再后來,基於這組變換式愛因斯坦發展出新的時空觀,並構建了新的物理體系,就成為相對論。因此,光速不變原理不是憑空想出來的。和其他的發現一樣,這個原理也是隨着人們對現象的認識逐步深入發展而來。
說回洛倫茲變換的推導。基於相對性原理和光速不變原理,就可以推出洛倫茲變換,相對論時空觀的基礎。
變換式的通用形式為
$$\begin{align*} x' &= f_x(x, t) \\ t' &= f_t(x, t)\end{align*}$$
首先要確定\(f_x\)和\(f_t\)的形式。根據時間一致性和空間一致性,可以得出這兩個f都必須是線性函數:考慮任意兩個事件1和2,用\((x_1, t_1), (x_2, t_2)\)以及\((x'_1, t'_1), (x'_2, t'_2)\)分別表示,則
$$\begin{align*}x'_1 &= f_x(x_1, t_1) \\ x'_2 &= f_x(x_2, t_2) \\ t'_1 &= f_t(x_1, t_1) \\ t'_2 &= f_t(x_2, t_2)\end{align*}$$
現假定把兩個參考系的原點都移到事件1發生的時空位置,那么在O中,事件2的坐標就變為\(x_2-x_1, t_2-t_1\),相應的,在O'中對應的坐標為\((x'_2 - x'_1, t'_2 - t'_1)\)。根據時空一致性,變換式應該仍然適用,從而
$$\begin{align*} x'_2 - x'_1 &= f_x(x_2 - x_1, t_2 - t_1) \\ t'_2 - t'_1 &= f_t(x_2 - x_1, t_2 - t_1)\end{align*}$$
若記\(p=(x,t)^\top\),這個式子可以簡寫為
$$f(p_2) - f(p_1) = f(p_2 - p_1)$$
這個關系只有\(f(p)=M p\)的線性變換才能滿足,其中M為2x2矩陣。
這里粗略給一下p為一維變量時證明的主要想法。上式等價於\(f(p_1)+f(p_2)=f(p_1+p_2)\)。取\(p_1=p_2=0\)得 \(f(0)=0\)。取\(p_1=p_2=p\)得 \(f(2p)=2 f(p)\)。歸納可證對任意正整數n,\(f(np) = n f(p)\)。取\(p=1\),得對任意正整數n \(f(n)=n f(1)\),取\(p=1/n\),得\(f(1/n)=1/n f(1)\)。令\(k=f(1)\),則我們有對任意正整數n,\(f(n) = kn\),\(f(1/n)=k/n\)。對於f連續的情況,可以通過極限說明對任意\(p\in[0,1], f(p)=kp\)。因而對任意正數\(p\)有\(f(p)=f([p]+(p-[p])) = f([p]) + f(p-[p]) = k[p] + k(p-[p]) = kp\)。對負數的情況,有\(f(p) = f(0) - f(-p) = -k(-p)=kp\),因而對任意實數\(f(p)=kp\)。
上面說明了f(p)必須為M p形式的線性變換,從而可設
$$\begin{align*}x' &= Ax + Bt\\ t' &= Cx + Dt \end{align*}$$
接下來只需要求出參數A,B,C,D即可,注意C和光速c不是同一個量,且A,B,C,D均為v的函數(嚴格來說應寫為\(A_v, B_v, C_v, D_v\))。
首先O'的坐標原點在O中以速度v運動,因而O'中的直線x'=0對應於O中的直線x=vt。考慮x=vt上的事件(v,1),該事件在O'中的x'坐標為0。故\(0 = Av + B\),得\(B=-Av\),因此
$$x'=A(x-vt)$$
另一方面,從O'中看O原點的運動為-v速度勻速運動,故O'中直線x'=-vt'對應O中直線x=0。考慮O'中的點(-v,1)該事件在O中的x坐標為0,故
$$\begin{align*}-v &= A(-vt) \\ 1 &= Dt\end{align*}$$
從而可推得\(D=A\)。因此變換式變為
$$\begin{align*}x' &= A(x-vt) \\ t' &= Cx + At \end{align*}$$
接下來用光速不變原理求出A和C。考慮O'中由原點發出的一束光的前端,其時空坐標由直線\(x'=ct'\)表示。根據光速不變原理,在O中其坐標也是直線\(x=ct\)。因此對於O'中的點(c,1),其在O中的坐標滿足\(x=ct\)。故
$$\frac{c}{1}=\frac{A(ct-vt)}{Cct+At}=\frac{A(c-v)}{A+Cc}$$
可以求得\(C=-\frac{v}{c^2}A\)。變換式變為
$$\begin{align*} x' &= A(x-vt) \\ t' &= A\left(t - \frac{v}{c^2}x\right)\end{align*}$$
接下來求A。考慮由(x', t')到(x, t)的逆變換,由上面變換式可以推出
$$\begin{align*}x &= \frac{1}{A\left(1-\frac{v^2}{c^2}\right)}(x' + vt') \\ t &= \frac{1}{A\left(1 - \frac{v^2}{c^2}\right)}\left(t' + \frac{v}{c^2}x'\right)\end{align*}$$
由於在O'中看O以速度-v運動,故得
$$A_{-v} = \frac{1}{A_v\left(1-\frac{v^2}{c^2}\right)}$$
即
$$A_v A_{-v}=\frac{1}{1 - \frac{v^2}{c^2}}$$
根據空間對稱性(O'以v的速度運動和以-v速度運動,得出的變換式應是對稱的,這也是空間一致性的一個應用),應有\(A_v = A_{-v}\),從而
$$A_v = A_{-v}= A = \frac{1}{\sqrt{1-\frac{v^2}{c^2}}}$$
在相對論中按慣例使用符號\(\gamma=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}}\)故最終的洛倫茲變換式為
$$\begin{align*} x' &= \gamma(x-vt) \\ t' &= \gamma\left(t - \frac{v}{c^2}x\right)\end{align*}$$
前面提到洛倫茲變換是狹義相對論的基礎,由這個變換可以推出一整套新的物理體系。這里提幾個結論,算是對洛倫茲變換對時空觀帶來影響的一個回顧。
長度收縮效應:高速運動的參照系中固定長度的物體,在靜止參考系中看起來會短一些。考慮O'中固定長度L'的直尺,一端固定在x'=0,另一端固定在x'=L'。考慮x'=0這一端,在O中,時間t時它的坐標為x=vt。而對於x'=L'這一端在O中的坐標由洛倫茲變換給出\(L' = \gamma(x-vt)\),從而\(x = vt + L'/\gamma\),因而在O中這個直尺看起來的長度只有
$$L=vt+\frac{L'}{\gamma} - vt = \frac{L'}{\gamma}=L'\sqrt{1-\frac{v^2}{c^2}} < L'$$
時間稀釋效應:高速運動的參照系中時間會變慢。考慮O'中的兩個事件(0,0)和(0,T'),兩個事件都發生在x'=0的位置,時間間隔為T'。t'=0的事件為O'的原點,因而對應於O的原點,故O中的該事件的時間為t=0。對t'=T'的事件,帶入洛倫茲變換,得
$$\begin{align*}0 &= \gamma(x-vt) \\ T' &= \gamma\left(t - \frac{v}{c^2}x\right)\end{align*}$$
消去x可解得
$$t=\frac{1}{\gamma\left(1-\frac{v^2}{c^2}\right)}T' = \frac{1}{\sqrt{1-\frac{v^2}{c^2}}}T' = \gamma T' > T'$$
此即為在O中測得的兩個事件的時間間隔。如果O中兩事件時間間隔為T,則O'中時間間隔為\(T/\gamma\),短於T,從而看上去O'的時間就變慢了。假想有一對同時出生的孿生兄弟A和B,把A送入高速飛行的飛船,B留在地面上。根據時間稀釋效應,當飛船返回地面時,飛船上的A會比留在地面上的B更年輕。當飛船速度足夠大的時候,可能B已經垂垂老矣,而A還與當初剛上飛船時無異。這個實驗據說已經被證實,只不過人造的飛船速度都很低(跟光速相比),從而時間稀釋非常微弱,但仍然可以用高精度的原子鍾測出來。這一效應也在微觀世界被證實,一些極短衰變時間的粒子在加速到接近光速后幾乎可以一直存在,得以“永生”。
相對論速度疊加:考慮洛倫茲變換的逆變換,前面實際上已經推得
$$\begin{align*}x &= \gamma(x' + vt') \\ t &= \gamma\left(t + \frac{v}{c^2}x'\right)\end{align*}$$
則在O'中以\(u'=\frac{dx'}{dt'}\)運動的物體在O中的速度為
$$u=\frac{dx}{dt} = \frac{\frac{dx}{dt'}}{\frac{dt}{dt'}} = \frac{\gamma \left(\frac{dx'}{dt'}+v\right)}{\gamma\left(1 + \frac{v}{c^2}\frac{dx'}{dt'}\right)} = \frac{u'+v}{1+\frac{vu'}{c^2}}$$
從而,當v和u'都非常小時,\(u\approx u' + v\)。而當u'=c為光速時,可得u=c,從而與光速不變原理一致。