萊尼感到沮喪頭疼:“喬治,那么多東西哪記得住!力、質量、牛頓定律、動量、能量。你說過,搞物理不需要死記硬背。你能不能把這些濃縮成一個東西讓我記住?”
“可以啊,萊尼。鎮靜。我可以把這一起都搞簡單。你只需要記住一件事情:作用量總是平穩的。”
過渡到高等力學
最小作用量原理——准確講是平穩作用量原理——是經典物理定律最簡潔的理論形式。這條原理只有一句話,但能涵蓋一切!這條原理不僅是經典力學遵循的原理,還是電磁學、廣義相對論、量子力學,還有化學,乃至物質的最基本的結構單元基本粒子都遵循的原理。
讓我們從經典力學的基本問題開始討論,即從運動方程確定系統的軌跡(或軌道)。我們一般假設有三個已知條件:各質點的質量、所受各種力\(F(\{x\})\)(其實,這個條件的更好的表述是給出勢能函數)、初始條件。系統從給定的坐標和速度開始按照牛頓運動定律在力的作用下運動。如果共有\(N\)個坐標,\((x_1,x_2,\dots,x_N)\),初始條件要指定\(N\)個位置和\(N\)個速度。例如,在初始時刻\(t_0\),我們定好位置\(\{x\}\)和速度\(\{\dot{x}\}\),解方程,求出系統在隨后某個時刻\(t_1\)的位置和速度。在這個過程中,我們常常要確定在兩個時刻\(t_0\)和\(t_1\)之間的整個軌跡,如圖1所示。
圖1:從時刻\(t_0\)到\(t_1\)時間段上的軌跡
但是,我們也可以重新表述這個經典力學問題,同樣給出\(2N\)個信息項。我們不是給出初始位置和速度,而是給出初末位置。我們的想法如下:棒球運動中,外場手擲棒球(\(t_0\)時刻\(x_0\)處),使棒球恰好1.5秒后到達二壘(\(x_1\)處),在此過程中,棒球如何運動?確定棒球的初速度已經包含在問題里邊。初速度不是已知的,會由問題的解給出。
我們示意地畫下時空圖(見圖2),以便說明問題。圖中水平軸為質點(即棒球)的位置,豎直軸為時間。軌跡的初末端點已標注在時空圖上,軌跡是連接這兩點的曲線。
圖2:棒球的軌跡
這個運動問題的兩種表述方式類似在空間畫一條直線的問題。一種畫法是給定初始點和方向畫直線,另一種畫法是連接兩個給定的點來畫直線。前者類似給定初始位置和速度求運動軌跡,后者類似給定時空圖上兩位置求軌跡。給定兩個點如何畫直線?答案是沿兩點之間最短路徑畫直線。對應於經典力學問題,軌跡為作用量為平穩值的路徑。
作用量與拉格朗日量
作用量原理與牛頓方程需要的參數完全一樣。你需要知道各質點的質量和體系的勢能函數。路徑的作用量是一個積分,兩個積分限分別為初末時刻 \(t_0\) 和 \(t_1\)。我會直接告訴你這個積分,然后討論一下對積分求極值會得到什么,后面你會看到,會得到牛頓方程。
在討論一般情況之前,我們先討論做直線運動的單個質點的情況。質點在\(t\)時刻的位置為\(x(t)\),速度為\(\dot{x}(t)\)。質點的動能和勢能分別為:
某軌跡的作用量為
\begin{equation}
\mathcal A=\int_{t_0}^{t_1}(T-V)dt=\int_{t_0}^{t_1}\left (\frac{1}{2}m\dot{x}^2-V(x) \right )dt
\label{eq:1}
\end{equation}
你可能會覺得方程(\ref{eq:1})中有打印錯誤。能量是\(T+V\),被積函數卻是\(T-V\)。為什么是動能和勢能的差而不是二者的和?你可以用\(T+V\)重做推導,你會發現結果是錯的。這個量\(T-V\)是系統的拉格朗日量,也稱拉格朗日函數,用\(L\)表示。要知道\(L\),需要給出質點的質量(以得到動能)和勢能\(V(x)\)。這不意外,牛頓方程也需要知道質量和勢能。
容易看出來,拉格朗日量是位置\(x\)和速度\(\dot{x}\)的函數。於是,我們將其寫為:
作用量可寫為拉格朗日量的積分:
\begin{equation}
\mathcal A=\int_{t_0}^{t_1}L(x,\dot{x})dt
\label{eq:2}
\end{equation}
平穩作用量原理非常神奇,使質點好像有超能力,能夠從所有可能路徑里找出使作用量為平穩值的路徑。讓我們暫停一下,思考我們正在做什么和將要得到什么。
對作用量求極值是對函數求極值的推廣。作用量不是通常的多變量函數,它有無窮多變量,每個時刻的位置都是它的變量。發揮一下想象力,把連續軌跡代之以100萬個點組成的“頻閃”軌跡。每個點都有一個坐標\(x\),但是只有給出100萬個\(x\),軌跡才能確定。作用量是整個軌跡的函數,因此是100萬個變量的函數,對作用量求極值會得到100萬個方程。
時間不是頻閃的,真實的軌跡是連續的,由函數\(x(t)\)給出。那么,作用量是函數的函數。函數的函數叫做泛函。求泛函的極值在數學上稱為變分。
盡管作用量泛函與普通函數差別很大,但是求作用量取平穩值的條件與求函數駐點的方法是很類似的。事實上,泛函取平穩值的條件與插播數學3的方程(4)的形式是一樣的,即
變分可不是幾個變量的微小變化,而是整個路徑的微小變化。
本講將會推導出作用量求極值所得方程,它們稱為歐拉-拉格朗日方程。對於單個自由度的情況,軌跡上每一點都對應一個方程。這些方程是微分方程,給出系統如何隨時間演化。因此,質點沒有將所有可能路徑都試一遍的超能力,至少不具有違背牛頓方程的能力。
這里我直接給出單自由度的歐拉-拉格朗日方程:
你可以將拉格朗日量代入,看是否能得到牛頓方程。
推導歐拉-拉格朗日方程
下面我們推導一下單自由度的歐拉-拉格朗日方程。首先把連續的時間換為頻閃時間,可用\(n\)標記各時刻。相鄰時刻之間的時間間隔 \(\Delta t\) 非常小。作用量是個積分,但積分是求和的極限。這里,求和是對相鄰時刻之間的時間間隔求和,即:
上面第一式就是用離散求和近似積分。第二式我們也熟悉,速度代之以相鄰位置之間的距離與時間間隔的商。
第二個代換有點微妙。由於我們要考慮對相鄰時刻間的時間間隔求和,我們需要表示出兩個時刻之間的中間時刻的位置。表示方法很簡單,把\(x(t)\)用相鄰時刻的平均位置表示即可:
因此,拉格朗日量里的 \(\dot{x}\) 代換為\(\frac{x_{n+1}-x_n}{\Delta t}\),\(x\)代換為\(\frac{x_{n}+x_{n+1}}{2}\)。於是,作用量為:
\begin{equation}
\mathcal A=\sum_{n} L \left ( \frac{x_{n+1}-x_n}{\Delta t},\frac{x_{n}+x_{n+1}}{2} \right )\Delta t
\label{eq:3}
\end{equation}
至此,就把作用量明顯地寫成各項的和,編個計算機程序計算作用量就類似這樣的形式。
現在,我們考慮作用量對 \(x_n\) 中的某個變量的極值。比如選 \(x_8\),當然也可以選其他的,都是同樣討論。看起來好像很復雜,但是容易看到,方程(\ref{eq:3})中只有兩項含有 \(x_8\),這兩項為:
下一步要做的就是將上式對 \(x_8\) 求導。注意到,\(x_8\) 在每一項有兩種存在方式,分別對應作用量的自變量速度和\(x\)。將作用量對 \(x_8\) 求導得:
$$\frac{\partial \mathcal A}{\partial x_8}=\frac{\partial A}{\partial x_8}=\left (-\frac{\partial L}{\partial\dot{x}}\Bigg|_{n=8}+\frac{\partial L}{\partial\dot{x}}\Bigg|_{n=7} \right )+\frac{1}{2}\left(\frac{\partial L}{\partial x} \Bigg|_{n=7} + \frac{\partial L}{\partial x} \Bigg|_{n=8} \right )\Delta t $$
其中,符號\(|\_{n=8}\)表示在 \(n=8\) 離散時刻計算函數值。
我們現在討論一下當\(\Delta t\)趨於0時上式的變化。先將上式兩邊同除以\(\Delta t\),第一項,
上式為一個函數在相鄰時刻 \(n=7\) 和 \(n=8\) 的函數值的差與時間步長的商,顯然是一個微商,即
$$\frac{1}{\Delta t}\left (-\frac{\partial L}{\partial\dot{x}}\Bigg|_{n=8}+\frac{\partial L}{\partial\dot{x}}\Bigg|_{n=7} \right )\rightarrow -\frac{1}{dt}\frac{\partial L}{\partial \dot{x}}$$
第二項
$$\left(\frac{\partial L}{\partial x} \Bigg|_{n=7} + \frac{\partial L}{\partial x} \Bigg|_{n=8} \right )$$
此為\(\frac{\partial L}{\partial x}\)在兩相鄰時刻的值的和的一半,點的差別趨於零,我們得到的正是\(\frac{\partial L}{\partial x}\)。
由\(\frac{\partial \mathcal A}{\partial x_8}=0\),我們得到歐拉-拉格朗日方程
\begin{equation}
\frac{d}{dt}\frac{\partial L}{\partial \dot{x}}-\frac{\partial L}{\partial x}=0
\label{eq:4}
\end{equation}
練習1:證明方程(\ref{eq:4})正是牛頓方程\(F=ma\)的另一種形式 |
---|
以上推導同樣可用於多自由度系統。對每個坐標\(x_i\)都對應一個歐拉-拉格朗日方程
$$\frac{d}{dt}\frac{\partial L}{\partial \dot{x}_i}-\frac{\partial L}{\partial x_i}=0$$
從以上推導可見,質點選擇運動路徑之前並沒有感知所有路徑的魔法。質點沿着軌跡的每一點,質點從當前時刻按使作用量最小的方式演化到下一時刻。最小作用量原理在每個瞬時表述為微分方程,該方程可確定體系下一時刻的行為。
更多質點,更高維度
對於一個多質點體系,假設需要\(N\)個坐標來描述,第 \(i\) 個坐標為 \(x_i\)。體系運動由\(N\)維空間的軌跡或軌道來描述。為了方便描述,我們把時間也作為一個坐標,這樣軌道就是\(N+1\)維空間的一條路徑。軌跡的起點為點集 \(x_i(t_0)\),軌跡的終點為另一點集 \(x_i(t_1)\)。所有坐標都為時間\(t\)的函數,這可表示\(N+1\)維空間中的軌道。
多自由度的最小作用量原理與單自由度情形的最小作用量原理本質上是一樣的。拉格朗日量為動能減去勢能:
作用量仍為拉格朗日量的積分:
\begin{equation} \mathcal A=\int_{t_0}^{t_1}L(\{x\},\{\dot{x}\})dt \label{eq:5} \end{equation}
最小(平穩)作用量原理仍然是體系的軌跡是使作用量為平穩值的軌跡。
變量很多的時候,我們改變軌跡的方式就更多了,比如我們可以改變\(x_1(t)\),或改變\(x_2(t)\),如此等等。多變量函數求極值,每個變量都有一個對應方程,與此類似,對於多自由度體系的最小作用量原理,每個變量\(x_i\)都對應有一個歐拉-拉格朗日方程,形式都與方程(\ref{eq:4})是一樣的:
\begin{equation} \frac{d}{dt}\frac{\partial L}{\partial \dot{x}_i}-\frac{\partial L}{\partial x_i}=0 \label{eq:6} \end{equation}
練習2:證明方程(\ref{eq:6})正是牛頓方程\(F_i=m_i\ddot{x}_i\)的另一種形式 |
---|
最小作用量有什么好處??
最小作用量原理很有用,有兩個主要原因。第一,最小作用量原理以很簡明的方式涵蓋了體系的所有運動信息。所有的參數(如質量和力)和所有運動方程都包含於一個函數——拉格朗日量。你知道拉格朗日量后,唯一剩下還需要知道的是初始條件。一個函數概況任意自由度體系的行為,這真是一個巨大的進步。在以后的幾部書,我們將發現,物理整體的各個分支理論——麥克斯韋的電動力學、愛因斯坦的相對論和基本粒子的標准模型——都可以用拉格朗日量描述。
應用最小作用量原理的第二個原因是,力學的拉格朗日描述在實用性上有優勢。后文會舉例說明。
比如做一維運動一個質點,從一個靜止的人看來,質點運動滿足牛頓定律。這位靜止的物理學家——比如是萊尼——用坐標\(x\)標記質點的位置。
另外一位物理學家喬治正相對萊尼運動(平動,這里不考慮有轉動的情況),他想知道如何描述質點相對自己的坐標。首先,相對喬治的坐標是什么意思?因為喬治在相對萊尼運動,所以喬治的坐標系的原點相對萊尼坐標系的原點在運動。這些可以通過萊尼坐標系的坐標\(x\)和喬治的坐標系的坐標\(X\)之間的變換來表示。
做法如下。在任意時刻\(t\),喬治的坐標系的原點在萊尼坐標系的坐標為\(x+f(t)\),\(f(t)\)為描述喬治相對萊尼的運動。時刻 \(t\) 的一事件,在萊尼坐標系的坐標為\(x\),在喬治坐標系的坐標為\(X\),它們有如下關系:
一個質點的運動軌跡,在萊尼看來是\(x(t)\),喬治看來是\(X=x-f(t)\)。如果喬治不想一直問萊尼看到的軌跡,他需要用他的運動定律在他的坐標系里描述質點。將運動方程從一個坐標系變換到另一坐標系,最容易的方法是應用最小作用量原理,或者歐拉-拉格朗日方程。
在萊尼的坐標系,軌跡的作用量為:
\begin{equation}
\mathcal A=\int_{t_0}^{t_1}\left (\frac{1}{2}m\dot{x}^2-V(x) \right )dt
\label{eq:7}
\end{equation}
我們也可以寫出喬治坐標系里軌跡的作用量。我們需要把 \(\dot{x}\) 用 \(\dot{X}\) 表示出來:
帶入方程(\ref{eq:7}),得:
\(V(X)\)表示萊尼采用的勢能函數,勢能函數用質點位置計算,這里用喬治坐標系的坐標來表示的。\(X\) 與 \(x\) 是對同一位置的不同的標記。我們知道在\(X\)坐標系里,拉格朗日量為:
把平方項展開,
\begin{equation}
L=\frac{1}{2}m(\dot{X}^2+2\dot{X}\dot{f}+\dot{f}^2)-V(X)
\label{eq:8}
\end{equation}
喬治該怎么處理方程(\ref{eq:8})?寫出歐拉-拉格朗日方程
移項,
這個結果不奇怪。在喬治看來,質點還受到一個“虛擬”力\(-m\ddot{f}\)。這里有意思的是,我們不是從運動方程變換得到這個結果,我們是從拉格朗日量直接得到這個結果。
讓我們再看一個例子。這次喬治坐着旋轉木馬。萊尼坐標系的坐標是\(x\)和\(y\),喬治坐標系的坐標是\(X\)和\(Y\),喬治坐標系隨着旋轉木馬旋轉。兩坐標系之間的關系為:
\begin{align} x& =X\cos(\omega t)+Y\sin(\omega t)\notag \\ y& =-X\sin(\omega t)+Y\cos(\omega t) \label{eq:9} \end{align}
萊尼和喬治兩位觀察者都會看到,質點做平面運動。假設萊尼看來,質點不受力,則拉格朗日量為:
\begin{equation}
L=\frac{m}{2}(\dot{x}^2+\dot{y}^2)
\label{eq:10}
\end{equation}
我們下一步要做的事情是,在喬治的旋轉坐標系里把作用量表示出來,然后應用歐拉-拉格朗日方程,求出運動方程。我們已經知道萊尼坐標系里的作用量,我們只需用喬治坐標系的坐標把萊尼坐標系的速度表示出來。將方程(\ref{eq:9})對時間微分,得:
應用\(\sin^2+\cos^2=1\),對以上兩式做一番代數運算,可得:
\begin{equation}
\dot{x}^2+\dot{y}^2=\dot{X}^2+\dot{Y}^2+\omega^2(X^2+Y^2)+2\omega(\dot{X}Y-X\dot{Y})
\label{eq:11}
\end{equation}
下一步要做的就是把方程(\ref{eq:11})帶入萊尼坐標系的拉格朗日量,即方程(\ref{eq:10}),然后即會得到喬治坐標系的拉格朗日量:
\begin{equation}
L=\frac{m}{2}\left (\dot{X}^2+\dot{Y}^2\right )+\frac{m\omega^2}{2}\left (X^2+Y^2\right )+\
m\omega\left (\dot{X}Y-X\dot{Y}\right )
\label{eq:12}
\end{equation}
我們來看看各項的含義。第一項,\(\frac{m}{2}\left (\dot{X}^2+\dot{Y}^2\right )\),我們很熟悉,質點在喬治坐標系里的動能。第二項,\(\frac{m\omega^2}{2}\left (X^2+Y^2\right )\),源自旋轉運動,在喬治看來,這是一個勢能:
容易看出,這個勢能對應的力方向沿徑向向外,大小正比於到圓周運動的圓心的距離:
這正是離心力。
方程(\ref{eq:12})中最后一項我們沒見過。它對應於科里奧利力。我們把歐拉-拉格朗日方程寫出來,才能搞明白科里奧利力怎么回事。歐拉-拉格朗日方程為:
形式上看正是牛頓方程,物體受力為離心力和科里奧利力。科里奧利力的分量為:
科里奧利力不僅是位置的函數還是速度的函數。
練習3:應用歐拉-拉格朗日方程,由拉格朗日量(\ref{eq:12})推導出運動方程。 |
---|
這一練習的要點不在於推導離心力和科里奧利力,而是在於如何將力學問題在不同坐標系間變換,只需要在各坐標系寫出相應的拉格朗日量就知道了。這是目前為止做這個變換的最簡便的方法,要比直接變換牛頓方程容易得多。
再有一例,留給讀者完成,將喬治坐標系里的方程變換到極坐標系:
練習4:將喬治坐標系里的拉格朗日量和歐拉-拉格朗日方程變換到極坐標系。 |
---|
廣義坐標和廣義動量
笛卡爾坐標系沒有什么特別的,不是通用的坐標系。對於任何力學系統,都有許許多多坐標系可用來表述。比如,我們要研究物體在球面上的運動,比如地球表面上的運動。在這個問題里,笛卡爾坐標系就很不方便,更自然的坐標系是兩個角度:經度和維度。更一般的情況,物體沿曲線滾動,比如沿山坡滾動,這個問題就沒有特別的坐標系。所以,這里提出一個重要的問題,是否能想出一個通用的方法建立經典力學方程,並且這個方法能任何坐標系。
考慮一個抽象問題,體系用一廣義坐標系表述。我們把\(x_i\)預留出來表示笛卡爾坐標系。廣義坐標的記號為\(q_i\)。\(q_i\)可以是笛卡爾坐標,也可以是極坐標,或其他我們可以考慮的任何事情。
我們還需要表示出速度,在這個抽象問題里,速度為廣義坐標\(q_i\)對時間的導數。初始條件由廣義坐標和廣義速度集表示,\((q_i,\dot{q}_i)\)。
在廣義坐標系里,運動方程可能很復雜,但作用量原理總是適用的。經典物理所有體系——甚至波和場——都可以用拉格朗日量描述。有時候,拉格朗日量可由已知的知識計算得到。比如由萊尼坐標系的拉格朗日量可計算得到喬治坐標系的拉格朗日量。有時候,拉格朗日量可由某些理論偏好或原理猜測。但是,拉格朗日量不管是怎么得到,都能簡潔地概括所有的運動方程。
為什么所有的體系都要用作用量原理和拉格朗日量描述?這個問題不容易回答,但是,能知道背后的原因與經典物理的量子起源密切相關,還與能量守恆密切相關。眼下,我們只先接受這一點,經典物理的所有已知的體系都可以用作用量描述。
拉格朗日量是廣義坐標和廣義速度的函數,\(L=L(q\_i,\dot{q}\_i)\),作用量原理為
$$\delta \mathcal A=\delta \int_{t_0}^{t_1}L(q_i,\dot{q}_i)dt=0$$
這意味着所得方程為歐拉-拉格朗日方程的形式,為經典力學運動方程的一般形式。每個 \(q_i\) 都對應一個方程:
\begin{equation} \frac{d}{dt}\frac{\partial L}{\partial \dot{q}_i}-\frac{\partial L}{\partial q_i}=0 \label{eq:13} \end{equation}
即所有的理論物理都在這個方程里。如果你知道\(q_i\)是什么,並且知道拉格朗日量,你就可以知道一切。
現在我們細看一下方程(\ref{eq:13})中的兩項。先看\(\frac{\partial L}{\partial \dot{q}\_i}\)。暫時把 \(q\_i\) 看做是通常的單個質點的笛卡爾坐標。\(L\) 就是通常的動能與勢能之差。此時,拉格朗日量會含有有\(\frac{1}{2}m\dot{x}^2\),則 \(\frac{\partial L}{\partial \dot{q}\_i}\) 則為\(m\dot{x}\),即動量的 \(x\) 分量。因此我們稱\(\frac{\partial L}{\partial \dot{q}\_i}\)為\(q\_i\)共軛的廣義動量,或稱\(q_i\)的共軛動量。
共軛動量的概念超越了動量的通常的定義(質量與速度之積)。共軛動量由拉格朗日量而定,可能不是具有明顯物理意義的量,但是總可以定義為:
\(p_i\)表示廣義動量。
引入廣義動量,歐拉-拉格朗日方程變為:
我們從極坐標描述的單個質點做些說明。此時,廣義坐標\(q_i\)為半徑 \(r\) 和角度 \(\theta\)。根據練習4的結果,拉格朗日量為:
\(r\)的共軛動量為:
對應的運動方程:
又\(\dot{p}_r=m\ddot{r}\),上式兩邊約掉\(m\),可得
角\(\theta\)的運動方程非常有意思。首先寫成\(\theta\)的共軛動量
這個物理量正是質點的角動量。角動量與\(p_{\theta}\)說的是一個東西。
現在考慮\(\theta\)的運動方程。拉格朗日量里根本沒有\(\theta\),於是有
\begin{equation}
\frac{d p_{\theta}}{dt}=0
\label{eq:14}
\end{equation}
換言之,角動量守恆。方程(\ref{eq:14})還可寫為
\begin{equation}
\frac{d }{dt}\left (mr^2\dot{\theta}\right)=0
\label{eq:15}
\end{equation}
我們可以看出\(r^2\dot{\theta}\)是常量。所以,角速度越大,質點越靠近原點。
練習5:用以上方法推導擺長為\(l\) 的單擺的運動。 |
---|
循環坐標
zhi
如前文所見,有時候有些坐標不會出現在拉格朗日量里。這種坐標被稱為循環坐標。我也不知道這里“循環”是什么意思?
我們知道的是,改變循環坐標的值,拉格朗日量不變,循環坐標的共軛動量守恆。角動量就是一個例子。另一個例子就是普通動量,即線動量。對於單個質點,拉格朗日量為:
這個拉格朗日量里沒有任何坐標,因此三個笛卡爾坐標都是循環坐標。(這里沒什么東西在循環,只是用了這個詞而已。)因此,動量的各個分量都是守恆的。如果勢能顯含某個坐標,則相應的動量的分量則不守恆。
我們再看另外一個例子:兩個質點沿直線運動,它們之間的勢能函數是兩質點之間距離的函數。為簡單起見,我們只考慮兩質點具有相同質量的情況,這不會使問題失去一般性。兩個質點的坐標分別為\(x_1\)和\(x_2\)。拉格朗日量為:
\begin{equation}
L=\frac{m}{2}\left(\dot{x}^2+\dot{y}^2 \right )-V(x_1-x_2)
\label{eq:16}
\end{equation}
拉格朗日量顯含\(x_1\)和\(x_2\),二者都不是循環坐標,兩個質點的動量也都不守恆。
但是,這里漏掉了重要一點。我們變換一下坐標。定義\(x_+\)和\(x_-\)如下:
用這兩個新坐標可重寫拉格朗日量。動能為
$$T=m\left(\dot{x}_+^2+\dot{x}_{-}^2 \right )$$
練習6:推導出上式。 |
---|
重點在於勢能,它只是\(x_-\)的函數。新的拉格朗日量為:
換言之,這個體系有個隱含的循環坐標,即\(x_+\)。這意味着\(x_+\)的共軛動量\(p_+\)守恆。容易看出來,\(p_+\)正是總動量:
真正的重點不在於循環坐標,而是在下一講,對稱性。