本篇文章,探討下多元函數微分學下的一些知識點之間的關系。包括全微分、偏導數、方向導數、梯度、全導數等內容。
初學這些知識的時候,學生會明顯覺得這些概念不難掌握,而且定義及計算公式也很容易記住,但總覺得差那么點東西,說又不知道從何說起。反正筆者是這種感覺。其實最根本的原因是沒有理清這些知識間的關系,對這些知識並沒有本質的理解。不妨現在就跟筆者一起再重新認識下它們,看看是否解開了你內心得些許疑惑。
一、導數和微分到底是什么,以及為什么會有這些概念
關於導數和微分到底是個什么玩意,筆者在探討一元函數微分的時候有清晰的描述,現在再復述一遍,如下:
導數和微分其實就是數學家創造的兩個代數工具,是為了從代數的角度來描述函數圖像在幾何上的變化。說白了,就是每次描述函數圖像變化,不用再畫圖了,有了這個,直接用算式算算就行了。因此導數和微分也是溝通幾何和代數的重要橋梁之一。而導數描述的是函數在一點處的變化快慢的趨勢,是一個變化的速率,微分描述的是函數從一點(移動一個無窮小量)到另一點的變化幅度,是一個變化的量。
我們知道在一元函數中,函數從一點到另一點的變化只有一個方向,就是沿着函數曲線移動就行了。而且函數在某一點處的切線也只有一條,因此函數的變化快慢只由這個切線(的斜率)決定。然而多元函數就不同了,多元函數往往是一個面,這也是為什么多元函數的微分學會多出那么多東西,催生那么多概念。但是不要怕,其實多出的東西只是一元函數微分的拓展,本質都是一樣的,不信請跟着筆者往下看,不難的,萬變不離其宗。
我們來看圖1。現在跟着筆者,咱們一起像數學家一樣來思考(其實學會從數學家的角度來思考問題,往往最能達到理解知識的本質的目的)。描述函數的變化,一個是描述函數的變化快慢,一個是描述函數變化多少。比如圖1中,類似於一元函數的探討,我想知道函數在A點變化的快慢趨勢,以及從A點到B點變化的幅度是多少。另外我們多元函數的圖像還有一個有意思的問題,就是函數可以固定一個變量,讓另一個變量來變化,那么這又是與一元函數的十分不同的變化了,其實這是一個變化維度的問題。這些是數學家最興趣的問題了。
好,到這里我們來總結下,我們想要全面的描述多元函數的變化,要考慮哪些方面呢,如下:
(1)函數在A點的趨勢變化。
(2)函數從A到B的變化的量。
(3)函數降維時候的變化,比如固定y,將二元函數看成一個一元函數來讓x單獨變化,又會產生什么變化。
明確了我們要解決的問題,其實就是怎么用數學工具來描述上面的那些變化,就要動手來解決問題了。那么根據一元函數微分學的經驗,描述變化快慢,就得看導數,即切線的斜率。描述變化的多少,就得看微分了。因此我們動手在上面按照這個目的畫了畫,得到了圖2和圖3.如下所示。
從圖2可以看到,過A點有無數條曲線,相應的也必定有無數條切線。因此切線的斜率必定不止一個。從圖3可以看到從A到B有無數條路徑可以到達。那么擺在我們面前的問題就是,如何將一元函數的導數和微分的知識進行相應的拓展,來適應這些“無數”的問題?
這點問題肯定難不倒數學家。於是就產生了多元函數微分學的那些概念。A點不是存在無數條切線嗎?那好辦,這些切線的斜率都是導數,那么就定義一個方向導數來表示他們。另外有無數條切線,就會有無個變化的方向,這里面哪個方向變化是最快的呢?於是梯度的定義就來了。數學家說,把變化最快的那個方向定義為梯度,所以梯度其實是一個向量,表示的是在A點變化趨勢最大的那個方向。好了變化快慢的問題基本解決了。那么從A到B變化多少的問題怎么解決呢?這就是全微分的定義了。把從A到B的變化的多少定義為全微分。還剩下最后一個問題,就是如果函數降維度變化,比如固定了x,讓y單獨變化,這種變化怎么描述?沒關系,就把他們定義為偏導數。好了,方向導數、梯度、全微分、偏導數的概念都已經出來了。當然了,真實情況肯定是數學家們經過大量的論證,才決定把A點無數條切線的變化方向稱之為“方向導數”更加合適,而不是稱之為“偏導”,我在這里這樣子講,是做了事后的諸葛亮而已。具體各個概念的定義及公式,也是經過數學家們大量的論證和證明才得到,可看相關教材。
好了,廢話好多。我們來總結下吧:
(1)方向導數:本質就是函數在A點無數個切線的斜率的定義。每一個切線都代表一個變化的方向。
(2)梯度:函數在A點無數個變化方向中變化最快的那個方向。
(3)全微分:函數從A點到B點變化的量(其實是取一個無窮小的變化的量)。
(4)偏導:多元函數降維時候的變化,比如二元函數固定y,只讓x單獨變化,從而看成是關於x的一元函數的變化來研究。
再經過一番論證加證明得到了教材上關於他們的嚴格的數學表達式,從此數學家們拿着這套表達式開始在微分幾何的領域叱吒風雲了!!
講到這里,我們來回顧下,我們是怎么打通理解這些知識點的,其實就是把自己想象成一位數學家,想象成自己要解決這些問題,應該怎么辦,然后結合已有的知識仔細琢磨,從而得到知識的本質理解。這就是思維是如何產生的過程。如果說的官方點,其實就是探尋那些概念的幾何意義。
二、相關概念的定義及公式回顧
為了加深理解,筆者干脆用白話把這些概念寫在這里供大家結合理解。
2.1 偏導
上面講了,偏導其實就是多元函數的降維下的導數。那么就非常簡單了,比如二元函數關於x的偏導,只需要模仿一元函數導數的定義即可。這里把y看成常量。如下:
\[{f_x}(x{\rm{y}}) = \mathop {\lim }\limits_{\Delta x \to 0} \frac{{f(x + \Delta x,y) - f(x,y)}}{{\Delta x}}\]
同理,大家可以得出f關於y的偏導。
2.2 方向導數
比如二元函數f在A點沿一個方向L變化,這條切線L由點A和切線L上另外一點B所確定。其中A(x1,y1),B(x2,y2)。那么怎么求f沿L的方向導數呢?經過數學家們的論證,有如下公式:
\[\begin{array}{l}
\frac{{\partial f}}{{\partial L}} = {f_x}\cos \alpha + {f_y}\cos \beta \\
\cos \alpha = \frac{{\overrightarrow {A{B_x}} }}{{\left| {\overrightarrow {AB} } \right|}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \cos \beta = \frac{{\overrightarrow {A{B_y}} }}{{\left| {\overrightarrow {AB} } \right|}}\\
\overrightarrow {AB} = ({x_1} - {x_2},{y_1} - {y_2})
\end{array}\]
2.3 梯度
數學家們經過證明,發現函數只要每一個變量都沿着關於這個變量的偏導所指定的方向來變化,函數的整體變化就能達到最快(變化的絕對值最大)。因此函數在A處的梯度為(以三元函數為代表):
\[gradA = ({f_x}(A),{f_y}(A),{f_z}(A))\]
2.4 全微分
全微分的定義書上有嚴格的數學語言。這里我就用大白話說簡單點。數學家們發現,其實跟一元函數差不多,多元函數從A到B的變化可以用一個線性變化來進行逼近,畢竟非線性的東西太復雜了。只要取的變化區間無窮小,總能找到一個多元的線性函數對這種變化的量進行逼近,而且線性函數的系數不受從A到B的路徑選擇的影響,只跟變化的量(即\[\Delta x\]或者\[\Delta y\])有關。於是把這個線性函數定義為全微分。之所以稱之為全微分,是針對偏微分而言的,偏微分這里不提,有興趣可以查查。而且數學家還證明了,系數其實就是偏導。
那么比如二元函數的全微分就是\[dz = {z_x}dx + {z_y}dy\]。
在此提一句,別總是糾結\[\Delta x\]和dx的區別,你可以簡單理解為取到無窮小就是dx。
2.5 切平面
在這里再啰嗦一句。其實大家可以順着想一想什么是切平面。前面說過A點存在無數條切線,這些切線肯定在同一個平面中,這個面就是在A點的切平面。是不是就很好理解了。
三、再啰嗦兩句
切記,導數和微分的本質含義。
導數,即描述函數在一點處的變化快慢的趨勢。
微分,即描述函數在一點處發生一個無窮小區間的變化的量的線性逼近。
相信通過這篇文章,大家對偏導、方向導數、梯度、以及全微分他們之間的區別和聯系理解的更加透徹了。
哦,對了,差點把全導數給忘記了。其實全導數本質上就是一元函數的導數。他是針對復合函數而言的定義。比如z=f(x,y),x=u(t),y=v(t)。那么z關於t的導數就是全導數。所以我說本質上就是個一元函數的導數,z本質上就是個一元函數。因此全導數沒什么好說的。