常數變易法
為什么寫這篇文章
學過“常數變易法”的同學請直接點擊“常數變易法的原理”
這里只講述常數變易法的原理,為什么要用常數變易法請參見參考資料《常數變易法的解釋 》
在學習高數的過程中,關於為什么在解一階線性微分方程的時候要使用常數變易法,為什么可以使用常數變易法,常數變易法為什么是有效並且正確的,老師都語焉不詳,一筆帶過,導致一直不能很好地理解其中的數學思想。自己也只能接受老師的解釋,將這個方法強行合理化。
但是最近再次看到一階線性微分方程的求解,看到直接給出來的求解公式一頭霧水,再去翻書,始終還是感覺隔靴搔癢,霧里看花,始終不自在,所以上網搜索了一下,搜到了一篇相關文章(常數變易法的解釋 ),終於明白了其中蘊含的深刻而巧妙的數學思想,喜不自禁。
所以在此記錄下個人的理解,一則梳理自己的思路,二則可供感興趣的同學參考,倘能有助於大家理解常數變易法的“自然”性,亦是幸甚。
什么是常數變易法?
有以下一階線性微分方程:$$ y' +P(x)y=Q(x) \tag1$$其中,\(P(x)\not \equiv 0\) 且 \(Q(x)\not \equiv 0\)。
若解其對應的齊次方程:$$ y' +P(x)y=0\tag2$$則易有:$$y=Ce^{-\int P(x)dx}(C\neq 0)$$即為齊次方程的通解。
這時,我們可以用常數變易法來求非齊次方程\((1)\)的通解,即將齊次方程\((2)\)的通解中的常數\(C\)換成(變易為)一個關於\(x\)的未知函數\(u(x)\),變易之后,非齊次方程通解表示如下:$$y=u(x)\cdot e^{-\int P(x)dx} \Big(u(x)\not\equiv 0\Big)\tag3$$於是將該通解形式代入原方程\((1)\),可以解得:$$u(x)=\int Q(x)e^{\int P(x)dx}dx+C$$將上式代入\((3)\)式,即可解得:$$y=e^{-\int P(x)dx}\cdot (\int Q(x)e^{\int P(x)dx}dx+C)$$這就是所謂常數變易法。
可以看到,這里把常數 \(C\) 直接代換為了函數\(u(x)\) ,顯得十分生硬不自然,沒有什么說服力。然而書上很少會對這個方法的由來作出介紹,所以想必會使很多人感到困惑。
錯誤的理解
對於常數變易法,我以前的理解是:
既然 \(y=Ce^{-\int P(x)dx}(C\neq 0)\) 可以使齊次方程 \(y' +P(x)y=0\) 成立,那么在其基礎上增添一個函數,就應該使得該方程運算結果多出一個與自由項相關的余項\(Q(x)\),所以可以使用常數變易法。
這樣的理解是基於表面形式做出的一個解釋,然而還是不能夠明確地說明這個方法的正當性與正確性。
所以我們需要進一步探究其內在的原理。
常數變易法的原理
基本
容易理解,我們可以把任意函數表示成為兩個函數之積,即 $$y(x)=u(x)\cdot v(x)\tag4$$對 \(y(x)\) 求導,得:\(y'(x)=u'(x)v(x)+u(x)v'(x)\)
計算
將 \(y(x)=u(x)\cdot v(x)\),\(y'(x)=u'(x)v(x)+u(x)v'(x)\) 代入非齊次方程\((1)\),整理得到:$$u'(x)v(x)+u(x)\cdot [v'(x)+P(x)v(x)]=Q(x)\tag5$$由解一階線性微分方程的常用方法分離變量法容易想到,如果沒有 \(u(x)\cdot [v'(x)+P(x)v(x)]\) 這一項,我們就可以簡便地利用分離變量法進行計算。
現在單獨考察 \(u(x)\cdot [v'(x)+P(x)v(x)]\) 這一項。其中 \(u(x)\) 不確定,不能用來保持 \(u(x)\cdot [v'(x)+P(x)v(x)]\not\equiv0\) ,所以考慮另一個因式 \(v'(x)+P(x)v(x)\) 。顯然 \(v(x)\) 是不確定的,在 \(u(x)\) 不確定的情況下,可以任意取值。則假設 \(v(x)\) 滿足 $$v'(x)+P(x)v(x)\equiv0\tag6$$ 觀察式 \((6)\) ,可以看到其形式與式 \((2)\) 基本一致。
求解式 \((6)\),可以得其通解形式:$$v(x)=C_1\cdot e^{-\int P(x)dx}(C\neq 0)\tag7$$將所得通解代入 \((4)\),則$$y(x)=u(x)\cdot C_1\cdot e^{-\int P(x)dx}(C\neq 0)\tag8$$將 \((8)\) 式代入 \((5)\) 式,得到:$$u'(x)\cdot C_1\cdot e^{-\int P(x)dx}=Q(x)$$使用分離變量法,容易解得:$$u(x)=\frac1{C_1}\int Q(x)\cdot e^{\int P(x)dx}dx+C_2\tag9$$將 \((7)\) \((9)\) 同時代入式 \((4)\) ,則$$y(x)=e^{-\int P(x)dx}(\int Q(x)e^{\int P(x)dx}dx+C_1C_2)$$令\(C=C_1C_2\),則得原一階線性微分方程的通解為:$$y(x)=e^{-\int P(x)dx}(\int Q(x)e^{\int P(x)dx}dx+C)$$
推廣
這一部分是在知乎看到了關於“常數變易法”在高階作用的問題之后增補的
問題鏈接:常數變易法思想的來源或本質是什么?
現在有一般\(n\)階線性微分方程$$P_{n}(x)y^{(n)}+P_{n-1}(x)y^{(n-1)}+P_{n-2}(x)y^{(n-2)}...+P_{1}(x)y'+P_{0}(x)y=Q(x)\tag{10}$$
由前述有,\(y(x)\)可以表示為\(y(x)=u(x)v(x)\)。
現在我們考察兩函數乘積的高階微分形式。
比較二項式展開定理我們不難發現,對\(y=uv\)的高階微分具有類似的形式。
比如:$$(uv)'=u'v+uv'$$$$(uv)''=(u'v+uv')'=u''v+2u'v'+uv''$$$$...$$
從原理上來看,展開多項式的每一項都應有\(n\)階微分,而這\(n\)階微分分別分配在\(u、v\)上;對於多項式的每一項,相當於任選\(k\)個微分算子作用於\(u\),則另有\((n-k)\)個微分算子作用於\(v\),與二項式展開定理本質相同,所以展開形式也應相同。
則有式\((11)\):$$(uv)^{(n)}=C_n^0u^{(n)}v+C_n^1u^{(n-1)}v^{(1)}+C_n^2u^{(n-2)}v^{(2)}+...+C_n^{n-1}u^{(1)}v^{(n-1)}+C_n^nuv^{(n)}\tag{11}$$
將這個一般形式代回式\((10)\),假設將\(u\)作為主要研究對象(以\(v\)為主要研究對象亦可,二者地位相同),則按\(u\)的導數降階排列多項式:$$M_{n-1}(x)u^{(n)}+M_{n-2}(x)u^{(n-1)}+...+M_0(x)u'+\bigl(P_n(x)v^{(n)}+P_{n-1}(x)v^{(n-1)}+...+P_{1}(x)v'+P_0(x)v\bigr)u=Q(x)\tag{12}$$
其中,\(M_i(x)\)為關於\(x\)的多項式。
按一階情況下的原理,可以令多項式\(\bigl(P_n(x)v^{(n)}+P_{n-1}(x)v^{(n-1)}+...+P_{1}(x)v'+P_0(x)v\bigr)\equiv0\)消去\(u\)項。解\(v\)即為解式\(10\)對應的齊次線性微分方程。
則剩下的式子為$$M_{n-1}(x)u^{(n)}+M_{n-2}(x)u^{(n-1)}+...+M_0(x)u'=Q(x)$$
令\(\alpha(x)=u'(x)\),則上式化為$$M_{n-1}(x)\alpha^{(n-1)}+M_{n-2}(x)\alpha^{(n-2)}+...+M_0(x)\alpha=Q(x)\tag{13}$$
比較式\((12)、(13)\),可以看到:通過常數變易法,成功地把求解一個\(n\)階線性微分非齊次方程的問題,為了求解一個對應的\(n\)階線性微分齊次方程和一個\((n-1)\)階線性微分非齊次方程的問題。
總結
很顯然我們可以看到,常數變易法是蘊含了很深刻的數學思想、具有很強健的數學基礎的解題方法,並非無根之萍,更不是突發奇想或是強行合理。
但是從其原理上來講,將其稱呼為“常數變易法”是不太妥當的,本質上它並非是單純地使用一個函數來替代了齊次方程通解的常數。
常數變易法的稱呼應該說為了便於日常應用和直觀記憶,這里可以不必糾結。
參考資料
[1] lookof,常數變易法的解釋
[2] 崔士襄,邯鄲農業高等專科學校,“常數變易法”來歷的探討