數學大綱2021復習
本文列舉 2021 數學一考研大綱內容,並將不熟悉的、易錯題型摘錄於本文中,便於復習。
- 數學大綱2021復習
- 1 高等數學
- 1.1 函數、極限、連續
- 1.1.1 理解函數的概念,掌握函數的表示法,會建立應用問題的函數關系
- 1.1.2 了解函數的有界性、單調性、周期性和奇偶性
- 1.1.3 理解復合函數及分段函數的概念,了解反函數及隱函數的概念
- 1.1.4 掌握基本初等函數的性質及其圖形,了解初等函數的概念
- 1.1.5 理解極限的概念,理解函數左極限與右極限的概念以及函數極限存在與左極限、右極限之間的關系
- 1.1.6 掌握極限的性質及四則運算法則
- 1.1.7 掌握極限存在的兩個准則,並會利用它們求極限,掌握利用兩個重要極限求極限的方法
- 1.1.8 理解無窮小量、無窮大量的概念,掌握無窮小量的比較方法,會用等價無窮小量求極限
- 1.1.9 理解函數連續性的概念(含左連續與右連續),會判別函數間斷點的類型
- 1.1.10 了解連續函數的性質和初等函數的連續性,理解閉區間上連續函數的性質(有界性、最大值和最小值定理、介值定理),並會應用這些性質
- 1.2 一元函數微分學
- 1.2.1 理解導數和微分的概念,理解導數與微分的關系,理解導數的幾何意義,會求平面曲線的切線方程和法線方程,了解導數的物理意義,會用導數描述一些物理量,理解函數的可導性與連續性之間的關系
- 1.2.2 掌握導數的四則運算法則和復合函數的求導法則,掌握基本初等函數的導數公式,了解微分的四則運算和一階微分形式的不變性,會求函數的微分
- 1.2.3 了解高階導數的概念,會求簡單函數的高階導數
- 1.2.4 會求分段函數的導數,會求隱函數和由參數方程所確定的函數以及反函數的導數
- 1.2.5 理解並會用羅爾定理、拉格朗日中值定理和泰勒定理,了解並會用柯西中值定理
- 1.2.6 掌握用洛必達法則求未定式極限的方法
- 1.2.7 理解函數的極值概念,掌握用導數判斷函數的單調性和求函數極值的方法,掌握函數最大值和最小值的求法及其應用
- 1.2.8 會用導數判斷函數圖形的凹凸性,會求函數圖形的拐點以及水平、鉛直和斜漸近線,會描繪函數的圖形
- 1.2.9 了解曲率、曲率圓與曲率半徑的概念,會計算曲率和曲率半徑
- 1.3 一元函數積分學
- 1.4 向量代數和空間解析幾何
- 1.4.1 理解空間直角坐標系,理解向量的概念及其表示
- 1.4.2 掌握向量的運算(線性運算、數量積、向量積、混合積),了解兩個向量垂直、平行的條件
- 1.4.3 理解單位向量、方向數與方向余弦、向量的坐標表達式,掌握用坐標表達式進行向量運算的方法
- 1.4.4 掌握平面方程和直線方程及其求法
- 1.4.5 會求平面與平面、平面與直線、直線與直線之間的夾角,並會利用平面、直線的相互關系(平行、垂直、相交等)解決有關問題
- 1.4.6 會求點到直線以及點到平面的距離
- 1.4.7 了解曲面方程和空間曲線方程的概念
- 1.4.8 了解常用二次曲面的方程及其圖形,會求簡單的柱面和旋轉曲面的方程
- 1.4.9 了解空間曲線的參數方程和一般方程,了解空間曲線在坐標平面上的投影,並會求該投影曲線的方程
- 1.5 多元函數微分學
- 1.5.1 理解多元函數的概念,理解二元函數的幾何意義
- 1.5.2 了解二元函數的極限與連續的概念以及有界閉區間上連續函數的性質
- 1.5.3 理解多元函數和全微分的概念,會求全微分,了解全微分存在的必要條件和充分條件,了解全微分的形式不變性
- 1.5.4 理解方向導數與梯度的概念,並掌握其計算方法
- 1.5.5 掌握多元復合函數一階、二階偏導數的求法
- 1.5.6 了解隱函數存在定理,會求多元隱函數的偏導數
- 1.5.7 了解空間曲線的切線和法平面及曲面的切平面和法線的概念,會求它們的方程
- 1.5.8 了解二元函數的二階泰勒公式
- 1.5.9 理解多元函數極值和條件極值的概念,掌握多元函數極值存在的必要條件,了解二元函數極值存在的充分條件,會求二元函數的極值,會用拉格朗日乘數法求條件極值,會求簡單多元函數的最大值和最小值,並會解決一些簡單的應用問題
- 1.6 多元函數積分學
- 1.6.1 理解二重積分、三重積分的概念,了解重積分的性質,了解二重積分的中值定理
- 1.6.2 掌握二重積分的計算方法(直角坐標、極坐標),會計算三重積分(直角坐標、柱面坐標、球面坐標)
- 1.6.3 理解兩類曲線積分的概念,了解兩類曲線積分的性質及兩類曲線積分的關系
- 1.6.4 掌握計算兩類曲線積分的方法
- 1.6.5 掌握格林公式並會運用平面曲線積分與路徑無關的條件,會求二元函數全微分的原函數
- 1.6.6 了解兩類曲面積分的概念、性質及兩類曲面積分的關系,掌握計算兩類曲面積分的方法,掌握用高斯公式計算曲面積分的方法,並會用斯托克斯公式計算曲線積分
- 1.6.7 了解散度與旋度的概念,並會計算
- 1.6.8 會用重積分、曲線積分及曲面積分求一些幾何量與物理量(平面圖形的面積、體積、曲面面積、弧長、質量、質心、形心、轉動慣量、引力、功及流量等)
- 1.7 無窮級數
- 1.7.1 理解常數項級數收斂、發散以及收斂級數的和的概念,掌握級數的基本性質及收斂的必要條件
- 1.7.2 掌握幾何級數與 p 級數的收斂與發散的條件
- 1.7.3 掌握正項級數收斂性的比較判別法、比值判別法、根植判別法,會用積分判別法
- 1.7.4 掌握交錯級數的萊布尼茨判別法
- 1.7.5 了解任意項級數絕對收斂與條件收斂的概念以及絕對收斂與收斂的關系
- 1.7.6 了解函數項級數的收斂域及和函數的概念
- 1.7.7 理解冪級數收斂半徑的概念,並掌握冪級數的收斂半徑、收斂區間及收斂域的求法
- 1.7.8 了解冪級數在其收斂區間內的基本性質(和函數的連續性、逐項求導和逐項積分),會求一些冪級數在收斂區間內的和函數,並會由此求出某些常數項級數的和
- 1.7.9 了解函數展開為泰勒級數的充分必要條件
- 1.7.10 掌握 $e^x,\sin x,\cos x,\ln(1+x)$ 及 $(1+x)^a$ 的麥克勞林展開式,會用它們將一些簡單函數間接展開為冪級數
- 1.7.11 了解傅立葉級數的概念和狄利克雷收斂定理,會將定義在 $[-l,l]$ 上的函數展開為傅立葉級數,會將定義在 $[0,l]$ 上的函數展開為正弦級數與余弦級數,會寫出傅立葉級數的和函數的表達式
- 1.8 常微分方程
- 1.8.1 了解微分方程及其階、解、通解、初始條件和特解等概念
- 1.8.2 掌握變量可分離的微分方程及一階線性微分方程的解法
- 1.8.3 會解齊次微分方程、伯努利方程和全微分方程,會用簡單的變量代換解某些微分方程
- 1.8.4 會用降階法解下列形式的微分方程:$y^{(n)}=f(x),y''=f(x,y')$ 和 $y''=f(y,y')$
- 1.8.5 理解線性微分方程解的性質及解的結構
- 1.8.6 掌握二階常系數齊次線性微分方程的解法,並會解某些高於二階的常系數齊次線性微分方程
- 1.8.7 會解自由項為多項式、指數函數、正弦函數余弦函數以及它們的和與積的二階常系數非齊次線性微分方程
- 1.8.8 會解歐拉方程
- 1.8.9 會用微分方程解決一些簡單的應用問題
- 1.1 函數、極限、連續
- 2 線性代數
- 3 概率論與數理統計
- 3.1 隨機事件和概率
- 3.2 隨機變量及其分布
- 3.2.1 理解隨機變量的概念,理解分布函數 $F(x)=P{X\le x}(-\infin < x < \infin)$ 的概念及性質,會計算與隨機變量相聯系的事件的概率
- 3.2.2 理解離散型隨機變量及其概率分布的概念,掌握 0-1 分布、二項分布 $B(n,p)$ 、幾何分布、超幾何分布、泊松分布 $P(\lambda)$ 及其應用
- 3.2.3 了解泊松定理的結論和應用條件,會用泊松分布近似表示二項分布
- 3.2.4 理解連續型隨機變量及其概率密度的概念,掌握均勻分布 $U(a,b)$ 、正態分布 $N(\mu,\sigma ^2)$ 、指數分布及其應用,其中參數為 $\lambda(\lambda > 0)$ 的指數分布 $E(\lambda)$ 的概率密度為 $f(x)=\begin{cases}\lambda e^{-\lambda x}, & x>0\ 0, & x\le 0\end{cases}$
- 3.2.5 會求隨機變量函數的分布
- 3.3 多維隨機變量及其分布
- 3.4 隨機變量的數字特征
- 3.5 大數定律和中心極限定理
- 3.6 數理統計的基本概念
- 3.7 參數估計
- 1 高等數學
1 高等數學
1.1 函數、極限、連續
1.1.1 理解函數的概念,掌握函數的表示法,會建立應用問題的函數關系
1.1.2 了解函數的有界性、單調性、周期性和奇偶性
1.1.3 理解復合函數及分段函數的概念,了解反函數及隱函數的概念
顯函數
表達式中左側是因變量的符號,右側是含有自變量的式子。
隱函數
方程 \(F(x,y)=0\) ,當變量在某一范圍內取值時,相應地總有唯一的滿足方程的 \(y\) 存在,則說方程在這一范圍內確定了一個隱函數。
1.1.4 掌握基本初等函數的性質及其圖形,了解初等函數的概念
- 基本初等函數
冪函數、指數函數、對數函數、三角函數、反三角函數五類函數稱為基本初等函數。
\(y=x^\mu(\mu\in \boldsymbol{R})\)
\(y=a^x(a>0\land a\not =1)\)
\(y=\log_ax(a>0\land a\not =1)\)
\(y=\sin x,y=\cos x,y=\tan x\) 等
\(y=\arcsin x,y=\arccos x,y=\arctan x\) 等
由常數和基本初等函數經過有限次的四則運算和有限次的函數復合步驟所構成並且可用一個式子表示的函數,稱為初等函數。
1.1.5 理解極限的概念,理解函數左極限與右極限的概念以及函數極限存在與左極限、右極限之間的關系
書中介紹了數列的極限和函數的極限,定義方式是“對任意,總存在”,也即當下標足夠大,或者自變量足夠接近某個數時,能夠使數列元素或函數值足夠接近。
數列極限的定義
設 \(\{x_n\}\) 為一數列,如果存在常數 \(a\) ,對於任意給定的正數 \(\varepsilon\) (不論這個數多么小),總存在正整數 \(N\) ,使得當 \(n>N\) 時,不等式 \(|x_n-a|<\varepsilon\) 都成立,那么就稱常數 \(a\) 是數列 \(\{x_n\}\) 的極限,或者稱數列 \(\{x_n\}\) 收斂於 \(a\) ,記為 \(\lim\limits_{n\rightarrow\infin}x_n=a\) 。
注意:
不論是數列的極限,還是函數的極限,都是一個確定的數(或者說,如果這個數不存在,則極限不存在)。因此如果給定了極限的范圍,那么極限一定可以取這個范圍里的某一個數。
例如:
\(\lim\limits_{n\rightarrow \infin}a_n<h\) ,不妨設為 \(\lim\limits_{n\rightarrow \infin}a_n=t\) ,\(t<h\) ,則一定有一個 \(N\) ,能滿足 \(|a_n-t|<\varepsilon\) 。
極限定義的一個應用可以參考等比級數(幾何級數)收斂的證明。
1.1.6 掌握極限的性質及四則運算法則
收斂數列的性質
- 極限的唯一性
- 收斂數列的有界性(收斂數列一定有上下界)
- 收斂數列的保號性
如果極限為正,則數列一定在某一個元素之后,保持為正。 - 收斂數列與其子數列間的關系
函數極限的性質
- 函數極限的唯一性
- 函數極限的局部有界性
- 函數極限的局部保號性
同數列極限的保號性。 - 函數極限與數列極限的關系(函數收斂,則相應的函數值數列也收斂同一值)
極限的四則運算
- 極限可以進行四則運算(除運算時除數極限不能為 0)
1.1.7 掌握極限存在的兩個准則,並會利用它們求極限,掌握利用兩個重要極限求極限的方法
極限存在的准則
- 夾逼准則:適用於數列極限和函數極限。
- 單調有界必有極限:作用於函數時,需要強調某個鄰域,並且得到的是一側的極限。
- 柯西極限存在准則:適用於數列,考察數列下標足夠大時,數列的兩個元素的值能無限接近。
兩個重要極限
- \(\displaystyle\lim_{x\rightarrow 0}\frac{\sin x}{x}=1\)
(使用夾逼准則以及函數幾何含義證明) - \(\displaystyle\lim_{x\rightarrow \infin}(1+\frac{1}{x})^x=e\)
(在整數域上,進行二項式分解,比較相鄰項得出單調性,然后擴大到等比級數得到上界,利用單調有界必有極限證明整數域極限,再利用夾逼准則求得實數域的極限。對於負數極限,通過公式變形同樣可以得到相同的結論)
注:
(1)\(\displaystyle\lim_{x\rightarrow \infin}(1+\frac{1}{x})^x=e\) 對正極限和負極限都成立。
證明:當 \(x\rightarrow -\infin\) 時,\(\displaystyle(1+\frac{1}{x})^x\overset{t=-x,t\rightarrow +\infin}{=}(1-\frac{1}{t})^{-t}=(\frac{t}{t-1})^t=(1+\frac{1}{t-1})^{t-1}(1+\frac{1}{t-1})=e\)
(2)當 \(x\rightarrow 0^+\) 時,設 \(\displaystyle y=(1+\frac{1}{x})^x\) ,則 \(\displaystyle\ln y=x\ln (1+\frac{1}{x})\) 。
取 \(\displaystyle u=\frac{1}{x}\) ,則 \(\ln y=\displaystyle \frac{\ln (1+u)}{u}\) 。
由於 \(\displaystyle\lim_{x\rightarrow 0^+}\ln y=\lim_{u\rightarrow +\infin}\frac{\ln (1+u)}{u}=0\) ,即 \(\displaystyle\lim_{x\rightarrow 0^+}(1+\frac{1}{x})^x=1\) 。
(3)當 \(x\rightarrow 0^-\) 時,\(y\rightarrow +\infin\) (暫不知如何求) 。
\(\displaystyle(1+\frac{1}{x})^x>0,x\in(-\infin,+\infin)\) 。
1.1.8 理解無窮小量、無窮大量的概念,掌握無窮小量的比較方法,會用等價無窮小量求極限
無窮小:極限是 0
無窮大:存在很大的下標或者自變量足夠接近某個數,數列或者函數能夠大於任何給定的數
無窮小的比較用比值法,有高階無窮小、低階無窮小、同階無窮小、\(k\) 階無窮小、等價無窮小
記 \(\displaystyle\lim \frac{a}{b}=C\) ,\(c\) 為非 0 常數
\(C\) | 比較 |
---|---|
0 | 高階 |
\(c\) | 同階 |
\(\infin\) | 低階 |
1 | 等價 |
若 \(\displaystyle \lim \frac{a}{b^k}=c\) ,則為 \(k\) 階無窮小。
注意:無窮小的比較是兩個無窮小在同一個無窮小量變化過程中的無窮小。
即 \(\displaystyle\lim_{x\rightarrow x_0}\frac{a(x)}{b(x)}\) 。
等價無窮小的兩個定理:
- \(\beta\) 是 \(\alpha\) 的等價無窮小的充要條件為 \(\beta=\alpha + o(\alpha)\)
這個定理給出了等價無窮小的一種判斷條件。 - 設 \(\alpha\sim \overset{\sim}{\alpha}\) ,\(\beta\sim \overset{\sim}{\beta}\) ,且 \(\displaystyle\lim \frac{\overset{\sim}{\beta}}{\overset{\sim}{\alpha}}\) 存在,則 \(\displaystyle\lim\frac{\overset{\sim}{\beta}}{\overset{\sim}{\alpha}}=\lim\frac{\beta}{\alpha}\)
這個定理說明,無窮小之比的極限可以進行等價無窮小替換。
1.1.9 理解函數連續性的概念(含左連續與右連續),會判別函數間斷點的類型
函數的連續性是用極限定義的(\(\Delta x\rightarrow 0\) 時 \(\Delta y\to 0\))。
第一類間斷點:存在左右極限的間斷點。
第二類間斷點:不是第一類間斷點的間斷點,如無窮間斷點,震盪間斷點。
1.1.10 了解連續函數的性質和初等函數的連續性,理解閉區間上連續函數的性質(有界性、最大值和最小值定理、介值定理),並會應用這些性質
連續函數四則運算得到的函數也連續。
連續函數對應的反函數、復合函數也連續。
基本初等函數在它們的定義域內都是連續的。
一切初等函數在其定義區間內都是連續的。
閉區間上連續函數的性質:
- 有界性(函數有界)
- 最大值最小值定理(有最大值與最小值)
- 介值定理(兩端函數值之間的任意一個函數值都可以取到,用零點定理證明)
1.2 一元函數微分學
1.2.1 理解導數和微分的概念,理解導數與微分的關系,理解導數的幾何意義,會求平面曲線的切線方程和法線方程,了解導數的物理意義,會用導數描述一些物理量,理解函數的可導性與連續性之間的關系
導數
若 \(\displaystyle\frac{\Delta y}{\Delta x}\) 當 \(\Delta x\rightarrow 0\) 時極限存在,則稱為可導,相應的極限稱為導數。
一元函數導數的幾何含義:曲線在某點切線的斜率。
一元函數可導等價於一元函數存在切線。
微分
若 \(\Delta y=A\Delta x+o(\Delta x)\) ,則稱為可微,\(A\Delta x\) 稱作微分。
微分的幾何含義:曲線在某點用切線近似得到的變化量。
導數與微分的關系
函數在某點的可微的充要條件是函數在這點可導。
例如,設微分為 \(A\Delta x\) ,導數為 \(f'(x)\),則有 \(f'(x)=A\) 。
導數的幾何含義
函數的導數表示函數的切線的斜率。
函數的切線方程
\(y-y_0=f'(x_0)(x-x_0)\)
函數的法線方程
\(\displaystyle y-y_0=-\frac{1}{f'(x_0)}(x-x_0)\)
連續與可導
可導一定連續,連續不一定可導。
可導從定義上就包含了連續的定義,但是可導在連續的基礎上增加了比值的極限存在的條件。
典型例子為:\(y=x^{\frac{1}{3}}\) (\(x\in \boldsymbol{R}\)),\(y'=\frac{1}{3}x^{-\frac{2}{3}}\) ,在 \(x=0\) 處無不可導。
1.2.2 掌握導數的四則運算法則和復合函數的求導法則,掌握基本初等函數的導數公式,了解微分的四則運算和一階微分形式的不變性,會求函數的微分
四則運算的導數
\((u\plusmn v)'=u'\plusmn v'\)
\((uv)'=u'v+uv'\)
\(\displaystyle (\frac{u}{v})'=\frac{u'v-uv'}{v^2}\)
復合函數的導數
對 \(\begin{cases}y=f(u)\\u=g(x)\end{cases}\)
有復合函數 \(y=f(g(x))\) ,其導數為
\(y'(x)=f'(u)\cdot g'(x)\) 或 \(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\text{d}y}{\text{d}u}\cdot\frac{\text{d}u}{\text{d}x}\)
基本初等函數的導數
- \((C)'=0\)
- \((x^\mu)'=\mu x^{\mu-1}\)
- \((a^x)'=a^x\ln a\)
- \((\log_ax)'=\displaystyle\frac{1}{x\ln a}\)
- \(\sin'x=\cos x,\cos'x=-\sin x\)
- \(\arcsin'x=\displaystyle \frac{1}{\sqrt{1-x^2}}\)
- \(\arccos'x=\displaystyle -\frac{1}{\sqrt{1-x^2}}\)
- \(\arctan'x=\displaystyle \frac{1}{1+x^2}\)
反三角函數導數的推導:
\(y=\arcsin x,x\in (-1,1),y\in(-\frac{\pi}{2},\frac{\pi}{2})\)
\(x=\sin y\)
\(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{1}{\frac{\text{d}x}{\text{d}y}}=\frac{1}{\cos y}\)
\(\cos^2 y=1-x^2\)
\(\cos y> 0\)
\(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{1}{\sqrt{1-x^2}}\)
\(y=\arccos x,x\in (-1,1), y\in(0,\pi)\)
\(x=\cos y\)
\(y'_x=(x'_y)^{-1}=-(\sin y)^{-1}\)
\(\sin y>0\)
\(\sin y=\sqrt{1-x^2}\)
\(\displaystyle y'_x=-(\sqrt{1-x^2})^{-1}=-\frac{1}{\sqrt{1-x^2}}\)
\(y=\arctan x,x\in(-\infin,+\infin),y\in(-\frac{\pi}{2},\frac{\pi}{2})\)
\(x=\tan y\)
\(\displaystyle x'_y=(\frac{\sin y}{\cos y})'=\frac{\cos^2y+\sin^2 y}{\cos ^2y}=\frac{1}{\cos^ 2y}\)
\(\displaystyle y'_x=(x'_y)^{-1}=\cos^2y=\frac{\cos^2 y}{\sin ^2y+\cos ^2y}=\frac{1}{1+\tan^2 y}=\frac{1}{1+x^2}\)
四則運算的微分
\(\text{d}(u\plusmn v)=\text{d}u\plusmn\text{d}v\)
\(\text{d}(uv)=v\text{d}u+u\text{d}v\)
\(\text{d}(\displaystyle\frac{u}{v})=\frac{v\text{d}u-u\text{d}v}{v^2}\)
一階微分形式的不變性
利用微分和導數的關系,可得復合函數的微分為
\(\text{d}f(g(x))=y'_x\text{d}x=y'_u\cdot u'_x\text{d}x=y'_u\text{d}u\)
這種 \(u\) 無論是自變量還是中間變量,\(\text{d}y=y'_u\text{d}u\) 的形式保持不變的性質稱為一階微分形式的不變性。
微分形式的不變性說明在進行換元時,\(\text{d}y=y'_u\text{d}u\) 的形式並不改變。
1.2.3 了解高階導數的概念,會求簡單函數的高階導數
1.2.4 會求分段函數的導數,會求隱函數和由參數方程所確定的函數以及反函數的導數
隱函數的求導
可通過對方程兩邊同時求導得到隱函數的導數。
反函數的求導
記原函數為 \(x=f(y)\) ,則反函數為 \(y=f^{-1}(x)\) ,有 \(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{1}{\frac{\text{d}x}{\text{d}y}}=\frac{1}{f'(y)}\)
由參數方程所確定的函數的導數
\(\begin{cases}x=\varphi(t)\\y=\psi(t)\end{cases}\)
\(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{\text{d}y}{\text{d}t}\frac{\text{d}t}{\text{d}x}=\frac{\text{d}y}{\text{d}t}\frac{1}{\frac{\text{d}x}{\text{d}t}}=\frac{y'_t}{x'_t}=\frac{\psi'(t)}{\varphi'(t)}\)
注:右式是一個關於 \(t\) 的式子。
1.2.5 理解並會用羅爾定理、拉格朗日中值定理和泰勒定理,了解並會用柯西中值定理
費馬引理
如果一個函數在點的某鄰域內有定義,可導,且該點是一個極大值點或極小值點,則該點處導數為 \(0\) 。
證:若為極大值點,則左側導數 \(\le 0\) ,右側導數 \(\ge 0\) ,由可導,因此兩側導數相等,即為 \(0\) 。
羅爾定理
如果一個可導函數兩個端點的值相等,則兩個端點之間一定存在導數為 \(0\) 的點。
拉格朗日中值定理
如果一個可導函數兩個端點連線的斜率為 \(k\) ,則兩個端點之間一定存在導數為 \(k\) 的點。
柯西中值定理
柯西中值定理的幾何含義可以理解為拉格朗日中值定理的參數方程形式。
參數方程形式為:\(\begin{cases}x=F(t)\\y=f(t)\end{cases}\)
\(\displaystyle\frac{f(b)-f(a)}{F(b)-F(a)}=\frac{f'(\xi)}{F'(\xi)}\)
左式為參數方程形式的連線的斜率,右式為參數方程形式的導數。
泰勒中值定理
\(\displaystyle f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)^2+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_n(x)\)
\(R_n(x)=o((x-x_0)^n)\)
或者
\(R_n(x)=\displaystyle\frac{f^{(n+1)}(\xi)}{(n+1)!}(x-x_0)^{n+1}\)
1.2.6 掌握用洛必達法則求未定式極限的方法
未定式
兩個趨於零或趨於無窮大的函數的比值的極限可能存在,也可能不存在,這種極限稱為未定式。
洛必達法則
給出了在一定條件下通過分子分母分別求導再求極限來求未定式的值的方法。
注:
- 洛必達法則可以用柯西中值定理證明。
- 洛必達法則既給出了 \(\displaystyle\frac{0}{0}\) 型未定式的求法,也給出了 \(\displaystyle\frac{\infin}{\infin}\) 的求法。
- 洛必達法則不僅適用於求導后比值存在的情況,也適用於求導后比值為無窮大的情況。
1.2.7 理解函數的極值概念,掌握用導數判斷函數的單調性和求函數極值的方法,掌握函數最大值和最小值的求法及其應用
極值
注意極值是鄰域里的概念,同時極值不要求連續。
可以通過求導數和二階導數求函數的極值。
駐點
極值點一定是駐點,駐點不一定是極值點。
最值
對連續的區間,求導數,求所有駐點和不可導點,然后判斷導數在駐點和不可導點左右鄰近的值。
1.2.8 會用導數判斷函數圖形的凹凸性,會求函數圖形的拐點以及水平、鉛直和斜漸近線,會描繪函數的圖形
凹凸性
圖形如名字。
斜漸近線
設為 \(y=ax+b\)
\(\displaystyle a=\lim_{x\rightarrow \infin}\frac{f(x)}{x}\)
\(\displaystyle b=\lim_{x\rightarrow \infin}(f(x)-ax)\)
函數圖形
定義域,特性(對稱、奇偶、周期),一階導數和二階導數,零點,漸近線。
1.2.9 了解曲率、曲率圓與曲率半徑的概念,會計算曲率和曲率半徑
曲率
\(\displaystyle K=\lim_{\Delta s\rightarrow 0}|\frac{\Delta \alpha}{\Delta s}|\)
圓的曲率
設圓半徑為 \(r\) ,則 \(\Delta s=r\Delta \alpha\) ,即 \(\displaystyle K=\frac{1}{r}\) 。
曲率計算公式
推導過程:
\(\Delta y=y'\Delta x\)
\(\Delta s=\sqrt{1+y'^2}\Delta x\)
\(\text{d}s=\sqrt{1+y'^2}\text{d}x\)
\(\tan \alpha=y'\)
\(\displaystyle\sec^2\alpha \frac{\text{d}\alpha}{\text{d}x}=y''\)
\(\displaystyle\sec^2\alpha\frac{\text{d}\alpha}{\text{d}s}\sqrt{1+y'^2}=y''\)
\(\sec^2\alpha=1+\tan^2\alpha=1+y'^2\)
\(\displaystyle\frac{\text{d}\alpha}{\text{d}s}=\frac{y''}{(1+y'^2)^{\frac{3}{2}}}\)
參數方程形式的曲線的曲率計算公式
記曲線的參數方程為
\(\begin{cases}x=\varphi(t)\\y=\psi(t)\end{cases}\)
\(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\psi'(t)}{\varphi'(t)}\)
\(\displaystyle \frac{\text{d}}{\text{d}x}(\frac{\text{d}y}{\text{d}x})=\frac{\text{d}y'_x}{\text{d}t}\frac{1}{\frac{\text{d}x}{\text{d}t}}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{\varphi'(t)^2}\frac{1}{\varphi'(t)}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{\varphi'(t)^3}\)
\(\displaystyle\frac{\text{d}\alpha}{\text{d}s}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{\varphi'(t)^3}\frac{1}{(1+(\frac{\psi'(t)}{\varphi'(t)})^2)^{\frac{3}{2}}}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{(\varphi'(t)^2+\psi'(t)^2)^{\frac{3}{2}}}\)
1.3 一元函數積分學
1.3.1 理解原函數的概念,理解不定積分和定積分的概念
原函數
原函數和導數是一對概念。
\(F(x)\) 的導數是 \(f(x)\) \(\Leftrightarrow\) \(f(x)\) 的一個原函數是 \(F(x)\)
不定積分
不定積分和求導是一對概念。
對函數進行不定積分得到帶有任意常數項的原函數。
\(F(x)\) 的導數是 \(f(x)\) \(\Leftrightarrow\) \(\displaystyle \int f(x)\text{d}x=F(x)+C\)
定積分
定積分是積分和的極限,從函數的幾何圖形上看,是函數在正向與 \(x\) 軸圍成的面積。
\(\displaystyle \int_a^b f(x)\text{d}x=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\xi_i)\Delta x_i\)
1.3.2 掌握不定積分的基本公式,掌握不定積分和定積分的性質及定積分中值定理,掌握換元積分法與分部積分法
不定積分基本公式
\(\displaystyle\int k\text{d}x=kx+C\)
\(\displaystyle\int x^\mu\text{d}x=\frac{1}{\mu+1}x^{\mu+1}+C(\mu\ne -1)\)
\(\displaystyle\int \frac{\text{d}x}{x}=\ln|x|+C\)
\(\displaystyle\int \frac{\text{d}x}{1+x^2}=\arctan x + C\)
\(\displaystyle\int \frac{\text{d}x}{\sqrt{1-x^2}}=\arcsin x+C\)
\(\displaystyle\int \cos \text{d}x=\sin x+C\)
\(\displaystyle\int \sin \text{d}x=-\cos x+C\)
\(\displaystyle\int \frac{\text{d}x}{\cos^2 x}=\tan x+C\)
\(\displaystyle\int \frac{\text{d}x}{\sin^2 x}=-\cot x+C\)
\(\displaystyle\int \sec x\tan x\text{d}x=\sec x+C\)
\(\displaystyle\int \csc x\cot x\text{d}x=-\csc x+C\)
\(\displaystyle\int e^x\text{d}x=e^x+C\)
\(\displaystyle\int a^x\text{d}x=\frac{a^x}{\ln a}+C\)
關於對數函數的導數
\(y=\ln |x|,x<0\)
\(y=\ln (-x)\)
\(y'=\displaystyle\frac{1}{-x}\cdot (-1)=\frac{1}{x}\)
不定積分的性質
\(\displaystyle\int (f(x)+g(x))\text{d}x=\int f(x)\text{d}x+\int g(x)\text{d}x\) (實際就是導數的和運算)
\(\displaystyle\int kf(x)\text{d}x=k\int f(x)\text{d}x\) (實際就是導數的積運算的特殊形式)
定積分的性質
\(\displaystyle\int_a^a f(x)\text{d}x = 0\) (補充規定)
\(\displaystyle\int_a^b f(x)\text{d}x=-\int_b^a f(x)\text{d}x\) (補充規定)
\(\displaystyle\int_a^b[\alpha f(x)+\beta g(x)]\text{d}x=\alpha\int_a^b f(x)\text{d}x+\beta \int_a^b g(x)\text{d}x\) (使用定義證明)
\(\displaystyle\int_a^c f(x)\text{d}x=\int_a^b f(x)\text{d}x+\int_b^c f(x)\text{d}x,(a<b<c)\) (使用定義證明)
\(\displaystyle\int_a^b1\text{d}x=b-a\) (使用定義證明)
若 \(f(x)\ge 0\) ,則 \(\displaystyle\int_a^b f(x)\ge 0\) (使用定義證明)
若 \(f(x)\le g(x)\) ,則 \(\displaystyle\int_a^b f(x)\text{d}x \le \int_a^b g(x)\text{d}x\) (推論)
\(\displaystyle|\int_a^b f(x)\text{d}x|\le\int_a^b |f(x)|\text{d}x\) (推論)
若 \(m\le f(x)\le M\) ,則 \(\displaystyle m(b-a)\le \int_a^b f(x)\text{d}x \le M(b-a)\) (推論)
定積分中值定理
\(\displaystyle\int_a^b f(x)\text{d}x=f(\xi)(b-a), \xi\in [a,b]\) (事實上,\(\xi\in (a,b)\)。利用性質中的推論可以證明 \(\xi\in [a,b]\))
換元積分法
不定積分的第一類換元法
\(\displaystyle\int f(\varphi (x))\varphi' (x)\text{d}x=\int f(\varphi(x))\text{d}\varphi(x)\overset{\varphi(x)=u}{=}\int f(u)\text{d}u\)
第一類換元法是將被積函數分離至積分變量。
不定積分的第二類換元法
\(\displaystyle\int f(x)\text{d}x\overset{x=\varphi(t)}{=}\int f(\varphi(t))\text{d}\varphi(t)=\int f(\varphi(t))\varphi'(t)\text{d}t\)
第二類換元法是將積分變量直接換元,達到化簡被積函數的目的。
第一類換元法和第二類換元法是對稱的換元方式。
不定積分的分部積分法
利用導數的乘法法則,可得積分的分部積分法。
\(\displaystyle\int uv'\text{d}x=uv-\int u'v\text{d}x\)
分部積分法適用於被積函數是一個乘積,其中一部分不容易求積分,另一部分容易求積分的情況。
定積分的換元法
\(\displaystyle\varphi(\alpha)=a,\varphi(\beta)=b\)
\(\displaystyle\int_a^b f(x)\text{d}x\overset{x=\varphi(t)}{=}\int_\alpha^\beta f(\varphi(t))\varphi'(t)\text{d}t\)
定積分換元時要同時調整積分限。
定積分的換元法通過牛頓-萊布尼茨公式證明。
定積分的分部積分法
\(\displaystyle\int_a^b uv'\text{d}x=[\int uv'\text{d}x]_a^b=[uv-\int u'v\text{d}x]_a^b=[uv]_a^b-\int_a^bu'v\text{d}x\)
定積分的分布積分法可以通過牛頓-萊布尼茨公式和不定積分的分布積分法證明。
1.3.3 會求有理函數、三角函數有理式和簡單無理函數的積分
有理函數
兩個多項式的商 \(\displaystyle\frac{P(x)}{Q(x)}\) 稱為有理函數。
有理函數的積分方法是將有理函數分解為多個部分分式之和。
三角函數的有理式
三角函數的有理式的一個通用積分方法是將三角函數換元為正切形式。
\(\displaystyle\sin x=2\sin \frac{x}{2}\cos\frac{x}{2}=\frac{2\tan \frac{x}{2}}{\sec ^2\frac{x}{2}}=\frac{2\tan \frac{x}{2}}{1+\tan^2 \frac{x}{2}}\)
\(\displaystyle\cos x=\cos^2\frac{x}{2}-\sin^2\frac{x}{2}=\frac{1-\tan^2\frac{x}{2}}{\sec^2\frac{x}{2}}=\frac{1-\tan^2\frac{x}{2}}{1+\tan^2\frac{x}{2}}\)
取 \(\displaystyle u=\tan\frac{x}{2}\) ,
則 \(x=2\arctan u\) ,\(\displaystyle \text{d}x=\frac{2}{1+u^2}\text{d}u\) 。
也即 \(\displaystyle\int F(\sin x,\cos x)\text{d}x=\int \displaystyle F(\frac{2u}{1+u^2},\frac{1-u^2}{1+u^2})\frac{2}{1+u^2}\text{d}u\)
無理函數
不是有理函數的代數函數就是無理函數。
無理函數一般都含有根式。
無理函數的積分可以通過換元去掉根號。
1.3.4 理解積分上限的函數,會求它的導數,掌握牛頓-萊布尼茨公式
積分上限的函數
稱 \(\displaystyle\int_a^x f(x)\text{d}x\) 是 \(f(x)\) 的積分上限的函數。
\(f(x)\) 的積分上限的函數是 \(f(x)\) 的一個原函數。
證:
\(\displaystyle\varPhi(x+\Delta x)=\int_a^{x+\Delta x}f(t)\text{d}t\)
\(\displaystyle\Delta \varPhi=\varPhi(x+\Delta x)-\varPhi(x)\)
\(\displaystyle=\int_a^{x+\Delta x}f(t)\text{d}t-\int_a^{x}f(t)\text{d}t\)
\(\displaystyle=\int_a^x f(t)\text{d}t+\int_{x}^{x+\Delta x}f(t)\text{d}t-\int_a^{x}f(t)\text{d}t\) (積分區間的可加性)
\(\displaystyle=\int_x^{x+\Delta x}f(t)\text{d}t\)
即 \(\Delta \varPhi=f(\xi)\Delta x\) (積分中值定理)
即 \(\displaystyle \frac{\Delta \varPhi}{\Delta x}=f(\xi)\)
牛頓-萊布尼茨公式
\(\displaystyle\int_a^b f(x)\text{d}x=F(b)-F(a)\) ,其中 \(F(x)\) 是 \(f(x)\) 在 \([a,b]\) 上的一個原函數。
牛頓-萊布尼茨公式給出了通過原函數求積分的方法,也即通過不定積分求定積分的方法,簡化了定積分的計算。
1.3.5 理解反常積分的概念,了解反常積分收斂的比較判別法,會計算反常積分
反常積分
被積函數為無界函數,或者積分區間為無窮區間的積分,稱為反常積分。
反常積分的比較判別法
如果 \(0<f(x)<g(x)\) ,且 \(\displaystyle\int_a^{+\infin}g(x)\text{d}x\) 收斂,則 \(\displaystyle\int_a^{+\infin}f(x)\text{d}x\) 收斂。
反之如果 \(\displaystyle\int_a^{+\infin}f(x)\text{d}x\) 發散,則 \(\displaystyle\int_a^{+\infin}g(x)\text{d}x\) 也發散。
一個重要的反常積分
\(\displaystyle\int_{-\infin}^{+\infin}e^{-x^2}\text{d}x=\sqrt{\pi}\)
推導:
記 \(\displaystyle y=\int_{-\infin}^{+\infin}e^{-x^2}\text{d}x=2\int_0^{+\infin}e^{-x^2}\text{d}x\) ,
\(y^2=4(\int_0^{+\infin}e^{-x^2}\text{d}x)^2=4\int_0^{+\infin}e^{-x^2}\text{d}x\int_0^{+\infin}e^{-y^2}\text{d}y\)
\(\displaystyle=4\int_0^{+\infin}\int_0^{+\infin}e^{-(x^2+y^2)}\text{d}x\text{d}y\)
\(\displaystyle=4\int_0^{\frac{\pi}{2}}\int_0^{+\infin}re^{-r^2}\text{d}r\text{d}\theta\)
\(\displaystyle=2\pi\int_0^{+\infin}\frac{1}{2}e^{-u}\text{d}u\)
\(=\pi\)
而 \(y>0\) ,則 \(y=\sqrt{\pi}\) 。
1.3.6 掌握用定積分表達和計算一些幾何量與物理量(平面圖形的面積、平面曲線的弧長、旋轉體的體積及側面積、平行截面面積為已知的立體體積、功、引力、壓力、質心、形心等)及函數的平均值
元素法
由定積分定義:\(\displaystyle\int_a^b f(x)\text{d}x=\displaystyle\lim_{\lambda\rightarrow 0}\sum_{i=1}^{n}f(\xi_i)\Delta x_i\) ,如果所求量可以分成許多部分,每個部分可以近似表達為 \(f(\xi_i)\Delta x_i\) ,並且差值是比 \(\Delta x_i\) 的高階無窮小,即所求量是所有部分的和的極限,則所求量可以表示為積分 \(\displaystyle\int_a^b f(x)\text{d}x\) 。
\(\displaystyle A=\displaystyle\lim_{\lambda\rightarrow 0}\sum_{i=1}^{n}(f(\xi_i)\Delta x_i+o(\Delta x_i))=\int_a^b f(x)\text{d}x+\displaystyle\lim_{\lambda\rightarrow 0}\sum_{i=1}^n o(\Delta x_i)=\int_a^b f(x)\text{d}x\)
思考:如何證明元素法?
即如何證明 \(\displaystyle\lim_{\lambda \rightarrow 0}\sum_{i=1}^n (o(\Delta x_i))=0\) 。
曲線 \(y=f(x)(f(x)>0)\) 和 \(x\) 軸所圍圖形的面積
微元為矩形,每個小矩形都可以近似表示為 \(f(\xi_i)\Delta x_i\) ,從而面積為積分
\(\displaystyle S=\int_a^b f(x)\text{d}x\)
極坐標曲線 \(r=r(\theta)\) 在兩條射線之間的曲邊扇形的面積
微元為扇形(也可以是三角形),每個扇形的面積為 \(\displaystyle\frac{\Delta \theta}{2\pi}\pi r^2=\frac{1}{2}r^2\Delta \theta\) ,從而面積為積分
\(\displaystyle S=\int_\alpha^\beta\displaystyle\frac{r^2(\theta)}{2}\text{d}\theta\)
平面曲線 \(\begin{cases}x=\varphi(t)\\y=\psi(t)\end{cases},(a<t<b)\) 的長度
對應 \(\Delta t\) ,有 \(\Delta x=\varphi'(t)\Delta t,\Delta y=\psi'(t)\Delta t\) ,微元為直線,長度為 \(\sqrt{\varphi'^2(t)+\psi'^2(t)}\Delta t\) ,從而長度為積分
\(\displaystyle l=\int_a^b\sqrt{\varphi'^2(t)+\psi'^2(t)}\text{d}t\)
當平面曲線以 \(y=f(x)\) 形式表示時,則為 \(\begin{cases}y=f(x)\\x=x\end{cases}\) ,即 \(\displaystyle l=\int_a^b \sqrt{1+y'^2}\text{d}x\)
旋轉體的體積
設為 \(y=f(x)(a<x<b)\) 繞 \(x\) 軸旋轉形成的旋轉體
微元為厚度方向為 \(x\) 軸的圓片,其面積為 \(\pi f^2(x)\) ,厚度為 \(\Delta x\) ,即 \(\Delta V=\pi f^2(x)\Delta x\) ,從而體積為積分
\(\displaystyle V=\int_a^b \pi f^2(x)\text{d}x\)
旋轉體的側面積
設為 \(y=f(x)(a<x<b)\) 繞 \(x\) 軸旋轉形成的旋轉體
微元為環繞 \(x\) 軸的圓環,圓環在 \(xoy\) 平面上的交線的斜率為為 \(f'(x)\) ,圓環在 \(x\) 軸方向上的寬度為 \(\Delta x\) ,也即一個厚度為 \(\Delta x\) ,斜率為 \(f'(x)\) ,小圓半徑為 \(f(x)\) 的圓台。
\(\Delta S=\pi(2f(x)+f'(x)\Delta x)\Delta x=2\pi f(x)\Delta x+o(\Delta x)\)
\(\displaystyle S=\int_a^b 2\pi f(x)\text{d}x\)
截面面積已知的立體體積
設立體截面面積為 \(y=f(x)(a<x<b)\)
以柱為微元,則 \(\Delta V=f(x)\Delta x\)
\(\displaystyle V=\int_a^b f(x)\text{d}x\)
變力沿直線做功
設變力在 \(x\) 正向的分量的模為 \(f(x)\)
\(\displaystyle W=\int_a^b f(x)\text{d}x\)
均勻直線和點的引力
設直線的線密度為 \(\mu\) ,直線在 \(x\) 軸上 ,點的質量為 \(M\) ,點在 \(y\) 軸上,\(y=a\)。
引力公式 \(\displaystyle F=G\frac{m_1m_2}{r^2}\)
\(\Delta F_y=-\displaystyle G\frac{M\cdot \mu\Delta x}{x^2+a^2}\cdot \frac{a}{\sqrt{x^2+a^2}}\)
\(\displaystyle F=-\int_{-l}^{l} \displaystyle \frac{GM\mu a}{(x^2+a^2)^{\frac{3}{2}}}\text{d}x\)
查積分表得,\(F=-GM\mu a \displaystyle \frac{x}{a^2 \sqrt{x^2+a^2}}|_{-l}^{l}=-\frac{-2 GM\mu l}{a\sqrt{l^2+a^2}}\)
\(\displaystyle \lim_{l\rightarrow \infin }F=-\frac{2GM\mu}{a}\)
豎直浸沒在液體中的平板一側受到的壓力
計算一半豎直浸沒入水中的半徑為 \(r\) 的圓板的一側受到的壓力
水的壓強為 \(P=\rho gh\)
\(\Delta F=\Delta S \cdot P=2\sqrt{r^2-y^2}\Delta y \cdot \rho gy\)
\(\displaystyle F=\int_0^r 2\rho gy\sqrt{r^2-y^2}\text{d}y=\int_0^\frac{\pi}{2}2\rho g r\sin\theta r\cos \theta r\cos\theta \text{d}\theta=2\rho gr^3\int_0^{\frac{\pi}{2}}\sin\theta\cos^2\theta\text{d}\theta=\frac{2}{3}\rho gr^3\)
質心、形心
參考多重積分的應用。
若密度均勻,則形心和重心重合。
形心是圖形上的點的平均位置,重心是質量的平均位置。
1.4 向量代數和空間解析幾何
1.4.1 理解空間直角坐標系,理解向量的概念及其表示
空間直角坐標系
在空間取定一點 \(O\) 和三個兩兩垂直的單位向量 \(\boldsymbol{i}\) 、\(\boldsymbol{j}\) 、\(\boldsymbol{k}\) ,就確定了三條以 \(O\) 為原點的兩兩垂直的數軸,依次記為 \(x\) 軸、\(y\) 軸、\(z\) 軸,並構成了一個空間直角坐標系。
空間直角坐標系通常符合右手法則。
向量
既有大小,又有方向的量稱為向量。
向量可以記為 \(\overrightarrow{AB}\) ,\(\boldsymbol{a}\) ,\(\overrightarrow{a}\) 。
向量的夾角
作 \(\overrightarrow{OA}=\boldsymbol{a}\) ,\(\overrightarrow{OB}=\boldsymbol{b}\) , 則 \(\angle AOB\) 稱為兩個向量的夾角,規定 \(0\le \theta\le \pi\) 。
投影
投影是向量在軸上的投影,投影是一個數。
向量 \(\boldsymbol{a}\) 在 \(x\) 軸上的投影記為 \(\text{Prj}_x\boldsymbol{a}\) 。
\(\text{Prj}_x\boldsymbol{a}=|\boldsymbol{a}|\cos \alpha\)
\(\text{Prj}_x(\boldsymbol{a}+\boldsymbol{b})=\text{Prj}_x\boldsymbol{a}+\text{Prj}_x\boldsymbol{b}\)
(容易用幾何證明)
1.4.2 掌握向量的運算(線性運算、數量積、向量積、混合積),了解兩個向量垂直、平行的條件
數量積(內積,點積)
向量的數量積是一個數
\(\boldsymbol{a}\cdot \boldsymbol{b}=|\boldsymbol{a}||\boldsymbol{b}|\cos\theta\)
\(\boldsymbol{a}\cdot \boldsymbol{b}=|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}\)
數量積的一個物理含義是力做的功。
數量積滿足交換律
\(\boldsymbol{a}\cdot \boldsymbol{b}=\boldsymbol{b}\cdot \boldsymbol{a}\)
數量積滿足分配律
\(\boldsymbol{a}\cdot (\boldsymbol{b}+\boldsymbol{c})=\boldsymbol{a}\cdot\boldsymbol{b}+\boldsymbol{a}\cdot \boldsymbol{c}\)
證明:
使用投影來證明,
\(\boldsymbol{a}\cdot (\boldsymbol{b}+\boldsymbol{c})=|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}(\boldsymbol{b}+\boldsymbol{c})=|\boldsymbol{a}|(\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}+\text{Prj}_{\boldsymbol{a}}\boldsymbol{c})=|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}+|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}\boldsymbol{c}=\boldsymbol{a}\cdot\boldsymbol{b}+\boldsymbol{a}\cdot \boldsymbol{c}\)
數量積不滿足結合律
因為數量積是一個數。
數量積的坐標表達式
\(\begin{pmatrix}x_1\\x_2\end{pmatrix}\cdot \begin{pmatrix}y_1\\y_2\end{pmatrix}=x_1y_1+x_2y_2\)
數量積可以擴展到多維,即
\(\begin{pmatrix}...\\x_i\\...\end{pmatrix}\cdot\begin{pmatrix}...\\y_i\\...\end{pmatrix}=\displaystyle\sum_{i=1}^{n}x_iy_i\)
可以化為單位坐標向量之后利用運算律進行證明。
向量積(外積,叉積)
向量的向量積是一個向量
向量積的方向滿足右手規則,大小滿足 \(|\boldsymbol{a}\times \boldsymbol{b}|=|\boldsymbol{a}||\boldsymbol{b}|\sin\theta\)
向量積的一個物理含義是作用在桿上的力矩,大拇指指向力矩的方向,則四指指向桿旋轉的方向。
向量積的大小等於以兩條向量為鄰邊的矩形的面積。
向量積交換順序后大小不變,方向相反
\(\boldsymbol{a}\times\boldsymbol{b}=-\boldsymbol{b}\times\boldsymbol{a}\)
向量積滿足分配律
\(\boldsymbol{a}\times(\boldsymbol{b}+\boldsymbol{c})=\boldsymbol{a}\times\boldsymbol{b}+\boldsymbol{a}\times\boldsymbol{c}\)
(可以用混合積的性質來證明)
向量積不滿足結合律,以正四面體的三條鄰邊為例,得到的結果的方向不一樣。
\(\begin{pmatrix}a_1\\a_2\\a_3\end{pmatrix}\times\begin{pmatrix}b_1\\b_2\\b_3\end{pmatrix}=\begin{vmatrix}\boldsymbol{i} &\boldsymbol{j} &\boldsymbol{k}\\a_1& a_2 & a_3\\b_1&b_2&b_3\end{vmatrix}=\begin{vmatrix}a_1& a_2 & a_3\\b_1&b_2&b_3\\\boldsymbol{i} &\boldsymbol{j} &\boldsymbol{k}\end{vmatrix}\)
(可以化為單位向量后利用向量積的計算法則證明)
混合積
記 \((\boldsymbol{a}\times\boldsymbol{b})\cdot \boldsymbol{c}=[\boldsymbol{a},\boldsymbol{b},\boldsymbol{c}]\) 為三個向量的混合積。
混合積是一個數。
由於 \(|\boldsymbol{a}\times \boldsymbol{b}|=S_{bottom}\) ,\((\boldsymbol{a}\times\boldsymbol{b})\cdot \boldsymbol{c}=S_{bottom}\text{Prj}_{\boldsymbol{h}}\boldsymbol{c}=V\) ,也即混合積表示以三個向量為鄰邊的平行六面體的體積。
由於混合積表示對應的平行六面體的體積,因此有序交換混合積的順序(\(ABC,CAB,BCA\)),混合積的值不變。
三個向量依次組成右手系,則為正,否則為負。
這個性質也可以從行列式的值的角度來理解(交換兩次,符號不變)。
利用混合積的性質證明向量積的分配律
\(((\boldsymbol{a}+\boldsymbol{b})\times \boldsymbol{c})\cdot \boldsymbol{r}\)
\(=(\boldsymbol{c}\times\boldsymbol{r})\cdot (\boldsymbol{a}+\boldsymbol{b})\)
\(=(\boldsymbol{c}\times\boldsymbol{r})\cdot \boldsymbol{a}+(\boldsymbol{c}\times\boldsymbol{r})\cdot \boldsymbol{b}\)
\(=(\boldsymbol{a}\times\boldsymbol{c})\cdot \boldsymbol{r}+(\boldsymbol{b}\times\boldsymbol{c})\cdot \boldsymbol{r}\)
\(=(\boldsymbol{a}\times\boldsymbol{c}+\boldsymbol{b}\times\boldsymbol{c})\cdot \boldsymbol{r}\)
即 \(((\boldsymbol{a}+\boldsymbol{b})\times\boldsymbol{c}-\boldsymbol{a}\times\boldsymbol{c}+\boldsymbol{b}\times\boldsymbol{c})\cdot\boldsymbol{r}=0\)
由於 \(\boldsymbol{r}\) 是任意向量,因此
\((\boldsymbol{a}+\boldsymbol{b})\times\boldsymbol{c}=\boldsymbol{a}\times\boldsymbol{c}+\boldsymbol{b}\times\boldsymbol{c}\)
\([\boldsymbol{a},\boldsymbol{b},\boldsymbol{c}]=\begin{vmatrix}\boldsymbol{i} &\boldsymbol{j} &\boldsymbol{k}\\a_1& a_2 & a_3\\b_1&b_2&b_3\end{vmatrix}\cdot \begin{pmatrix}c_1\\c_2\\c_3\end{pmatrix}\)
\(=c_1\begin{vmatrix}a_2 & a_3\\b_2 & b_3\end{vmatrix}-c_2\begin{vmatrix}a_1&a_3\\b_1&b_3\end{vmatrix}+c_3\begin{vmatrix}a_1&a_2\\b_1&b_2\end{vmatrix}\)
\(=\begin{vmatrix}a_1&a_2&a_3\\b_1&b_2&b_3\\c_1&c_2&c_3\end{vmatrix}\)
(按行展開及其逆運算)
兩個向量垂直 \(\Leftrightarrow\) 兩個向量的數量積為 \(0\)
兩個向量平行 \(\Leftrightarrow\) 存在唯一實數 \(\lambda\) ,使 \(\lambda \boldsymbol{a}=\boldsymbol{b}\)
兩個向量平行 \(\Leftrightarrow\) 兩個向量的各個坐標對應成比例
1.4.3 理解單位向量、方向數與方向余弦、向量的坐標表達式,掌握用坐標表達式進行向量運算的方法
單位向量
模為 \(1\) 的向量。
方向數
直線的任一方向向量的坐標叫做直線的一組方向數。
方向余弦
向量和三條坐標軸的夾角的余弦稱為方向余弦。
\((\cos \alpha, \cos \beta, \cos\gamma)=(\displaystyle \frac{x}{|\boldsymbol{a}|}, \frac{y}{|\boldsymbol{a}|}, \frac{z}{|\boldsymbol{a}|})\)
向量的坐標表達式
若 \(\boldsymbol{a}=x\boldsymbol{i}+y\boldsymbol{j}+z\boldsymbol{k}\) ,則稱向量的坐標為 \((x,y,z)\) 。將向量寫成各個坐標軸的單位向量的和的形式,稱為向量的坐標表達式。
向量的坐標表達式的運算
加、減和 \(k\) 乘運算和矩陣的運算一致,數量積運算即向量的內積,對應相乘並相加(已敘述),向量積即將兩個向量和單位向量組合成一個行列式(已敘述),混合積即將三個向量組合成一個行列式(已敘述)。
1.4.4 掌握平面方程和直線方程及其求法
平面的點法式方程
設法向量為 \((A,B,C)\) ,平面上一點為 \(M(x_0,y_0,z_0)\) ,
\((A,B,C)\cdot(x-x_0,y-y_0,z-z_0)=0\) ,
即 \(A(x-x_0)+B(y-y_0)+C(z-z_0)=0\)
平面的一般方程
\(Ax+By+Cz+D=0\)
空間直線的一般方程
空間直線看作是兩個平面的交線
\(\begin{cases}A_1x+B_1y+C_1z+D_1=0\\A_2x+B_2y+C_2z+D_2=0\end{cases}\)
空間直線的點向式方程
即過一點且與方向向量平行。
\((x-x_0,y-y_0,z-z_0)\) 平行於 \((A,B,C)\) ,
即 \(\displaystyle \frac{x-x_0}{A}=\frac{y-y_0}{B}=\frac{z-z_0}{C}\)
1.4.5 會求平面與平面、平面與直線、直線與直線之間的夾角,並會利用平面、直線的相互關系(平行、垂直、相交等)解決有關問題
平面與平面、平面與直線、直線與直線之間的夾角
都用法向量和方向向量進行計算。
例如兩個平面的法向量分別為 \(\boldsymbol{a},\boldsymbol{b}\) ,則 \(\cos \theta=\displaystyle\frac{|\boldsymbol{a}\cdot\boldsymbol{b}|}{|\boldsymbol{a}||\boldsymbol{b}|}\)
1.4.6 會求點到直線以及點到平面的距離
點到直線的距離
設點為 \(A\) ,直線上一點為 \(O\) ,直線的一個方向向量為 \(\boldsymbol{a}\) ,則 \(\overrightarrow{OA}\times \boldsymbol{a}=|\overrightarrow{OA}||\boldsymbol{a}|\sin\theta\) ,即 \(|\overrightarrow{OA}|\sin\theta=\displaystyle\frac{\overrightarrow{OA}\times \boldsymbol{a}}{|\boldsymbol{a}|}\)
點到平面的距離
和求點到直線的舉例類似,只是需要求余弦,即利用向量的數量積進行計算。
1.4.7 了解曲面方程和空間曲線方程的概念
空間解析幾何的基本問題
(1)已知一個曲面是點的幾何軌跡時,建立這個曲面的方程。
(2)已知坐標 \(x,y,z\) 之間的一個方程時,研究這個方程所表示的曲面的形狀。
空間曲線的一般方程
空間曲線可以看作是兩個曲面的交線
\(\begin{cases}F(x,y,z)=0\\G(x,y,z)=0\end{cases}\)
1.4.8 了解常用二次曲面的方程及其圖形,會求簡單的柱面和旋轉曲面的方程
球面
\(A(x^2+y^2+z^2)+Bx+Cy+Dz+E=0\)
或
\((x-a)^2+(y-b)^2+(z-c)^2=R^2\)
旋轉曲面
以曲線繞 \(z\) 軸旋轉形成的旋轉曲面為例,在 \(xOz\) 平面上,取一點 \((x_0,0,z_0)\) 滿足曲線公式,即 \(f(x_0,z_0)=0\) ,將該點旋轉到平面外一點 \((x,y,z_0)\) ,即 \(|x_0|=\sqrt{x^2+y^2}\) ,即這個旋轉曲面的公式為 \(f(\plusmn\sqrt{x^2+y^2},z)=0\) (繞某個軸旋轉,則這個軸的符號不變,替換另一個符號)
圓錐面
即 \(z=k(\plusmn\sqrt{x^2+y^2})\) ,即 \(z^2=k^2(x^2+y^2)\)
旋轉單葉雙曲面和旋轉雙葉雙曲面
對於焦點在 \(x\) 軸,在坐標面 \(xOz\) 上的雙曲線
\(\displaystyle\frac{x^2}{a^2}-\frac{z^2}{b^2}=1\)
其繞 \(z\) 軸旋轉形成旋轉單葉雙曲面
\(\displaystyle\frac{x^2+y^2}{a^2}-\frac{z^2}{b^2}=1\)
繞 \(x\) 軸旋轉形成旋轉雙葉曲面
\(\displaystyle\frac{x^2}{a^2}-\frac{y^2+z^2}{b^2}=1\)
柱面
沒有參數 \(z\) 的方程表示 \(z\) 軸方向的柱面。
如 \(f(x,y)=0\)
1.4.9 了解空間曲線的參數方程和一般方程,了解空間曲線在坐標平面上的投影,並會求該投影曲線的方程
空間曲線的參數方程
將動點的坐標表示為參數 \(t\) 的函數,即為空間曲線的參數方程
\(\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}\)
空間曲線的一般方程
空間曲線看作是兩個空間曲面的交線
\(\begin{cases}F(x,y,z)=0\\G(x,y,z)=0\end{cases}\)
空間曲線在坐標平面上的投影
空間曲線的一般方程,如果消去兩個聯立方程的 \(z\) ,得到方程 \(f(x,y)=0\) ,由於對於曲線上的一點 \((x_0,y_0,z_0)\) ,一定也滿足 \(f(x_0,y_0)\) ,也即 \(f(x,y)=0\) 就表示空間曲線在 \(xOy\) 平面上的投影。
對於參數方程,則直接去掉參數 \(z\) 的方程得到 \(\begin{cases}x=x(t)\\y=y(t)\end{cases}\) ,同理,就得到了空間曲線在 \(xOy\) 平面上的投影。
1.5 多元函數微分學
1.5.1 理解多元函數的概念,理解二元函數的幾何意義
\(n\) 維空間
設 \(n\) 為一個取定的正整數,用 \(\bold{R}^n\) 表示 \(n\) 元有序數組 \((x_1,x_2,...,x_n)\) 的全體所構成的集合,即
\(\bold{R}^n=\bold{R}\times\bold{R}\times...\times\bold{R}=\{(x_1,x_2,...,x_n)|x_i\in \bold{R},i=1,2,...,n\}\)
注:這里 \(\bold{R}\times\bold{R}\) 是集合的笛卡兒積。
二元函數
設 \(D\) 是 \(\bold{R}^2\) 的一個非空子集,稱映射 \(f:D\rightarrow \bold{R}\) 為定義在 \(D\) 上的二元函數,通常記為
\(z=f(x,y),(x,y)\in D\)
其中,點集 \(P\) 稱為定義域,\(x,y\) 稱為自變量,\(z\) 稱為因變量。
函數 \(f(x,y)\) 的全體稱為函數 \(f\) 的值域。
\(n\) 元函數
將二元函數中的 \(\bold{R}^2\) 替換成 \(\bold{R}^n\) ,對應的映射 \(f:D\rightarrow \bold{R}\) 就稱為定義在 \(D\) 上的 \(n\) 元函數,通常記為
\(z=f(x_1,x_2,...,x_n),(x_1,x_2,...,x_n)\in D\)
注:一元函數、二元函數、多元函數,都是映射到 \(\bold{R}\) 上的函數。
二元函數的幾何圖形
二元函數的幾何圖形是一個曲面。
鄰域(\(\bold{R}^2\))
設 \(P_0(x_0,y_0)\) 是 \(xOy\) 平面上的一個點,\(\delta\) 是某一正數,與點 \(P_0(x_0,y_0)\) 距離小於 \(\delta\) 的點 \(P(x,y)\) 的全體,稱為點 \(P_0\) 的 \(\delta\) 鄰域。
點和點集的關系
內點(存在鄰域在點集內),外點(存在鄰域在點集外),邊界點(任意鄰域既有點集外,也有點集內)
點集的邊界點的全體稱為邊界
聚點
如果對於任意的 \(\delta>0\) ,點 \(P\) 的去心鄰域 \(\overset{\circ}{U}(P,\delta)\) 內總有 \(E\) 中的點,那么稱 \(P\) 是 \(E\) 的聚點。
重要的平面點集
開集
如果點集 \(E\) 的點都是內點
閉集
邊界都是 \(E\) 的元素
連通集
點集內的任意兩點,都可以用折線連接起來,並且折線上的點都屬於 \(E\)
區域(開區域)
連通的開集
閉區域
開區域和其邊界構成的點集
有界集
點集在某一個坐標原點的鄰域內
無界集
非有界集
1.5.2 了解二元函數的極限與連續的概念以及有界閉區間上連續函數的性質
二元函數的極限
在某個聚點上,二元函數和值 \(A\) 的差值的絕對值能夠比任意正數小,則 \(A\) 是二元函數在聚點處的極限。
二元函數的極限可以相應推廣到多元函數上
多元函數的連續性
若多元函數的極限等於多元函數在某個點的值,則連續
有界閉區間上的連續函數的性質
和一元函數一樣,具有有界性、最大值最小值、介值定理性質。
1.5.3 理解多元函數和全微分的概念,會求全微分,了解全微分存在的必要條件和充分條件,了解全微分的形式不變性
全增量
\(\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)\)
全增量的幾何含義即曲面在一個鄰域內的變化量
全微分
若函數 \(z=f(x,y)\) 在某點有全增量 \(\Delta z=A\Delta x+B\Delta y+o(\rho)\) ,其中 \(A,B\) 不與 \(\Delta x,\Delta y\) 相關,\(\rho=\sqrt{(\Delta x)^2+(\Delta y)^2}\) ,則稱 \(z=f(x,y)\) 在該點可微分,記 \(A\Delta x+B\Delta y\) 為全微分,記作 \(\text{d} z\) ,有 \(\text{d}z=A\Delta x+B\Delta y\)
習慣上,將全微分記作 \(\text{d}z=A\text{d}x+B\text{d}y\)
全微分的幾何含義:曲面的切平面近似曲面的的變化值。由於切平面包含了兩個坐標軸上的偏導數對應的切線,因此切平面的變化值即為 \(f_x\Delta x+f_y\Delta y\)
全微分存在等價於存在切平面
全微分存在的必要條件
可微 \(\Rightarrow\) 偏導數存在
不充分性:偏導數只體現了兩個坐標軸方向的可導性,不能描述其它方向上的“均勻”。
例如如果曲面和 \(xOz\) 的交線和 \(yOz\) 交線分別是朝上和朝下的曲線,則在原點處不可能用一個平面逼近。
證:
可微,則不妨取 \(\Delta y=0\) ,此時 \(\Delta z=f(x_0+\Delta x,y_0)-f(x_0,y_0), \Delta\rho=\Delta x\) ,即 \(z_x=A+\displaystyle\frac{o(\Delta x)}{\Delta x}\) 。類似可證 \(z_y=B\)
全微分存在的充分條件
偏導數連續 \(\Rightarrow\) 可微
不必要性:
舉例:
\(\displaystyle z=\begin{cases}(x^2+y^2)\sin(\frac{1}{\sqrt{x^2+y^2}}), &x^2+y^2\not =0\\0, &x^2+y^2=0\end{cases}\)
\(\displaystyle \lim_{\rho\rightarrow 0}z=0\)
\(\displaystyle z|_{y=0}=x^2\sin\frac{1}{x}\)
\(\displaystyle \frac{\partial z|_{y=0}}{\partial x}=2x\sin\frac{1}{x}-\cos\frac{1}{x}\)
也即偏導數在 \((0,0)\) 處不連續。
\(\displaystyle \lim_{\rho\rightarrow 0}\frac{z-0}{\rho}=\lim_{\rho\rightarrow 0}\frac{\Delta z}{\rho}=\lim_{\rho\rightarrow 0}\rho\sin\frac{1}{\rho}=0\) ,也即 \(\Delta z=o(\rho)\) ,或者說 \(\text{d}z=0\) ,即可微分。
全微分的充分條件的不必要性理解:只需要能貼近平面,不需要光滑近似。
證明:
\(\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)\)
\(=f(x+\Delta x,y+\Delta y)-f(x,y+\Delta y)+f(x,y+\Delta y)-f(x,y)\)
看作一元函數,則利用拉格朗日中值定理有
\(=f_x(x+\xi_1 \Delta x,y+\Delta y)\Delta x+f_y(x,y+\xi_2\Delta y)\Delta y\)
由連續,有
\(=f_x(x,y)\Delta x+f_y(x,y)\Delta y+\varepsilon_1\Delta x+\varepsilon_2\Delta y\)
\(\displaystyle|\frac{\varepsilon_1\Delta x+\varepsilon_2\Delta y}{\rho}|\le |\varepsilon_1\frac{\Delta x}{\rho}|+|\varepsilon_2\frac{\Delta y}{\rho}|\le |\varepsilon_1|+|\varepsilon_2|\)
也即為 \(\rho\) 的高階無窮小,得證。
全微分的形式不變性
設 \(z=f(u,v)\) 具有連續偏導數,則有全微分 \(\displaystyle\text{d}z=\frac{\partial z}{\partial u}\text{d}u+\frac{\partial z}{\partial v}\text{d}v\)
如果有 \(u=\varphi(x,y),v=\psi(x,y)\) ,且這兩個函數也有連續的偏導數,則有復合函數
\(z=f(\varphi(x,y),\psi(x,y))\)
此時有全微分為 \(\displaystyle\text{d}z=\frac{\partial z}{\partial x}\text{d}x+\frac{\partial z}{\partial y}\text{d}y\)
利用多元復合函數的求導法則,代換得 \(\displaystyle\text{d}z=\frac{\partial z}{\partial u}\text{d}u+\frac{\partial z}{\partial v}\text{d}v\)
也即無論 \(u,v\) 是自變量還是中間變量,得到的 \(z=f(u,v)\) 全微分得形式是一樣的。
1.5.4 理解方向導數與梯度的概念,並掌握其計算方法
方向導數
\(\displaystyle\frac{\partial f}{\partial l}|_{(x_0,y_0)}=\lim_{\Delta l\rightarrow 0^+}\frac{f(x_0+\Delta l\cos\alpha,y_0+\Delta l\cos\beta)-f(x_0,y_0)}{\Delta l}\)
方向導數和全微分
假設可微,則 \(\Delta z=z_x \Delta x+z_y\Delta y+o(\rho)\) ,而 \(\Delta x=\Delta l\cos\alpha, \Delta y=\Delta l\Delta \cos\beta\) ,即 \(\Delta z=z_x\Delta l\cos \alpha+z_y\Delta l\Delta \cos \beta+o(\rho)\) ,即 \(\displaystyle\frac{\Delta z}{\Delta l}=z_x\cos\alpha+z_y\cos\beta+\frac{o(\rho)}{\Delta l}\)
即 \(\displaystyle\frac{\partial f}{\partial l}=z_x\cos\alpha+z_y\cos\beta\)
梯度
設 \(f(x,y)\) 具有一階連續偏導數,函數在 \((x_0,y_0)\) 處的梯度為 \(\bold{grad} f(x_0,y_0)=f_x \bold{i}+f_y \bold{j}=\begin{pmatrix}f_x\\f_y\end{pmatrix}\) 。
記 \(\displaystyle\nabla =\frac{\partial }{\partial x}\bold{i}+\frac{\partial }{\partial y}\bold{j}\) 為向量微分算子或者 \(\text{Nabla}\) 算子,則有
\(\nabla f(x_0,y_0)=\bold{grad}f(x_0,y_0)\)
梯度與方向導數
由梯度和方向導數的定義有:
\(\displaystyle\frac{\partial f}{\partial l}=\bold{grad}(x_0,y_0)\begin{pmatrix}\cos\alpha\\ \cos\beta\end{pmatrix}\)
考慮 \(\boldsymbol{e}_l=\begin{pmatrix}\cos\alpha\\\cos\beta\end{pmatrix}\)
也即在梯度方向的方向導數最大。
1.5.5 掌握多元復合函數一階、二階偏導數的求法
\(z=f[\varphi(t),\psi(t)]\)
\(\displaystyle\frac{\text{d}z}{\text{d}t}=\frac{\partial f}{\partial \varphi}\frac{\text{d}\varphi}{\text{d}t}+\frac{\partial f}{\partial \psi}\frac{\text{d} \psi}{\text{d} t}\)
可以推廣到中間變量多於兩個的情況。
這種導數稱為全導數。
推導:
\(\Delta z=f_{\varphi}\Delta u+f_{\psi}\Delta v+\varepsilon_1\Delta x+\varepsilon_2\Delta y\)(參考全微分充分條件的證明)
兩邊同除以 \(\Delta t\) ,則有
\(\displaystyle\frac{\Delta z}{\Delta t}=f_\alpha\frac{\Delta u}{\Delta t}+f_\psi\frac{\Delta v}{\Delta t}+\varepsilon_1\frac{\Delta x}{\Delta t}+\varepsilon_2\frac{\Delta y}{\Delta t}\)
取 \(\Delta t\rightarrow 0\) ,則有最后兩項為 \(0\) ,即得證。
\(z=f[\varphi(x,y),\psi(x,y)]\)
\(\displaystyle \frac{\partial z}{\partial x}=\frac{\partial z}{\partial \varphi}\frac{\partial \varphi}{\partial x}+\frac{\partial z}{\partial \psi}\frac{\partial \psi}{\partial x}\)
\(\displaystyle \frac{\partial z}{\partial y}=\frac{\partial z}{\partial \varphi}\frac{\partial \varphi}{\partial y}+\frac{\partial z}{\partial \psi}\frac{\partial \psi}{\partial y}\)
推導:
將 \(y\) 視作常數,即可得出。
1.5.6 了解隱函數存在定理,會求多元隱函數的偏導數
隱函數存在定理
設 \(F(x,y)\) 在 \((x_0,y_0)\) 的某一鄰域內具有連續偏導數,且 \(F(x_0,y_0)=0\) ,\(F_y(x_0,y_0)\not =0\) ,則方程 \(F(x,y)=0\) 在點 \((x_0,y_0)\) 的某一鄰域內恆能唯一確定一個連續且具有連續導數的函數 \(y=f(x)\) ,滿足 \(y_0=f(x_0)\) 。
設函數 \(F(x,y,z)\) 在點 \((x_0,y_0,z_0)\) 的某一鄰域內具有連續偏導數,且 \(F(x_0,y_0,z_0)=0\) ,\(F_z(x_0,y_0,z_0)\not =0\) ,則方程 \(F(x,y,z)=0\) 在點 \((x_0,y_0,z_0)\) 的某一鄰域內恆能確定一個連續且具有連續偏導數的函數 \(z=f(x,y)\) ,它滿足條件 \(z_0=f(x_0,y_0)\) 。
設 \(F(x,y,u,v), G(x,y,u,v)\) 在 \((x_0,y_0,u_0,v_0)\) 的某一鄰域內具有對各個變量的連續偏導數,\(F(x_0,y_0,u_0,v_0)=0, G(x_0,y_0,u_0,v_0)=0\)
\(\displaystyle J=\frac{\partial (F,G)}{\partial (u,v)}=\begin{vmatrix}\frac{\partial F}{\partial u}&\frac{\partial F}{\partial v}\\\frac{\partial G}{\partial u} & \frac{\partial G}{\partial v}\end{vmatrix}\) 在點 \((x_0,y_0,u_0,v_0)\) 處不為 \(0\) ,則 \(F=0,G=0\) 在點的某一鄰域內恆能唯一確定一組具有連續偏導數的函數 \(u=u(x,y),v=v(x,y)\)
注:隱函數存在定理證明較為復雜,這里直接利用結論進行反向推導。
假設隱函數存在,則鄰域內有 \(y=f(x)\) , \(F(x,y(x))\equiv 0\) ,即 \(F_x+F_yy'(x)=0\) ,則 \(\displaystyle y'(x)=-\frac{F_x}{F_y}\)
類似,對於 \(z=f(x,y)\) ,則有 \(F(x,y,z(x,y))\equiv 0\) ,即 \(\displaystyle F_x+F_z \frac{\partial z}{\partial x}=0\) ,且 \(\displaystyle F_y+F_z\frac{\partial z}{\partial y}=0\) ,即有 \(\displaystyle z_x=-\frac{F_x}{F_z}\) ,\(\displaystyle z_y=-\frac{F_y}{F_z}\) 。
類似,\(\begin{cases}F(x,y,u,v)\equiv 0\\G(x,y,u,v)\equiv 0\end{cases}\) ,分別對 \(x,y\) 求偏導數得
\(\begin{cases}F_1+F_3u_x+F_4v_x=0\\G_1+F_3u_x+F_4v_x=0\\F_2+F_3u_y+F_4v_y=0\\G_2+F_3u_y+F_4v_y=0\end{cases}\) ,
利用克拉默法則,即可求出所有 \(u_x,u_y,v_x,v_y\) 。
注:觀察可知,雅可比式就是該公式的矩陣對應的模,模為 \(0\) 則沒有唯一解。
注:隱函數存在定理給出了一個關系式在什么情況下能夠確定一個函數(映射關系)。
以二元方程為例,\(F_y(x_0,y_0)\not =0\) 實際上是要求二元函數所表示的曲線在此點處不能平行於 \(y\) 軸,也即不能垂直於 \(x\) 軸。
對於多元方程,則 \(F_{a_n}(a_1,a_2,...,a_{n-1})\not =0\) 實際上是要求不存在相同的 \(a_1,a_2,...,a_{n-1}\) 對應多個 \(a_n\) 的情況。
1.5.7 了解空間曲線的切線和法平面及曲面的切平面和法線的概念,會求它們的方程
一元向量值函數
設數集 \(D\subset \bold{R}\) ,則稱映射 \(f:D\rightarrow \bold{R}^n\) 為一元向量值函數,通常記為 \(\bold{r}=\bold{f}(t), t\in D\)
記 \(\bold{f}(t)=x\bold{i}+y\bold{j}+z\bold{k}\) ,則 \(\displaystyle \frac{\text{d}\bold{f}}{\text{d}t}=x'\bold{i}+y'\bold{j}+z'\bold{k}\)
向量值函數的導數的幾何意義:
向量值函數的導數,即導向量表示向量值函數的終端曲線在求導點出的一個切向量。
向量值函數的物理意義:
設向量值函數表示質點運動的位置向量,則向量值函數的導數表示質點的速度向量。
空間曲線的切線
設曲線參數方程為 \(\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}\) ,則某點的導向量為 \((x',y',z')\) ,也為切線的方向向量,則得到切線的點向式方程為 \(\displaystyle\frac{x-x_0}{x'}=\frac{y-y_0}{y'}=\frac{z-z_0}{z'}\)
再設曲線的方程為 \(\begin{cases}F(x,y,z)=0\\G(x,y,z)=0\end{cases}\) ,參照參數方程,把 \(y,z\) 看成是 \(x\) 的函數,也即有 \(\begin{cases}F(x,y(x),z(z))=0\\G(x,y(x),z(x))=0\end{cases}\) ,即
\(\begin{cases}F_1+F_2y'_x+F_3z'_x=0\\G_1+G_2y'_x+G_3z'_x=0\end{cases}\)
由克拉默法則,有
\(\displaystyle y'_x=\frac{\begin{vmatrix}-F_1&F_3\\-G_1&G_3\end{vmatrix}}{\begin{vmatrix}F_2&F_3\\G_2&G_3\end{vmatrix}}\) ,\(\displaystyle z'_x=\frac{\begin{vmatrix}F_2&-F_1\\G_2&-G_1\end{vmatrix}}{\begin{vmatrix}F_2&F_3\\G_2&G_3\end{vmatrix}}\)
曲線的法平面
由切線的法向量,以及平面上的一點,即可得空間曲線得法平面。
曲面的法線
記曲面為 \(F(x,y,z)=0\) ,曲面上的一條曲線為 \(\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}\) ,則有 \(F(x(t),y(t),z(t))\equiv 0\) ,兩邊對 \(t\) 求導,則有 \(F_1x'(t)+F_2y'(t)+F_3z'(t)=0\) ,由於曲線的切向量為 \((x',y',z')\) ,即向量 \((F_1,F_2,F_3)\) 始終與曲線的切向量垂直,也即是切點處的法向量。
曲面的切平面
求出曲面的法向量之后,即可得出曲面的切平面的點法式方程。
1.5.8 了解二元函數的二階泰勒公式
\(f(x_0+h,y_0+k)\)
\(=\displaystyle f(x_0,y_0)+(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y})f(x_0,y_0)+...+\frac{1}{n!}(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y})^nf(x_0,y_0)\)
\(\displaystyle +\frac{1}{(n+1)!}(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y})^{n+1}f(x_0+\theta h,y_0+\theta k)\)
1.5.9 理解多元函數極值和條件極值的概念,掌握多元函數極值存在的必要條件,了解二元函數極值存在的充分條件,會求二元函數的極值,會用拉格朗日乘數法求條件極值,會求簡單多元函數的最大值和最小值,並會解決一些簡單的應用問題
多元函數的極值
領域內的最大值和最小值
條件極值
對自變量有附加條件的稱為條件極值
必要條件
\(f_x=0,f_y=0\)
充分條件(二元函數極值存在的判別法)
\(f_x=0,f_y=0\) , \(\begin{cases}A=f_{xx}\\B=f_{xy}\\C=f_{yy}\end{cases}\)
\(AC-B^2>0\) ,有極值,且 \(A<0\) 時有極大值,\(A>0\) 時有極小值;
\(AC-B^2=0\) ,需要進一步討論;
\(AC-B^2<0\) ,無極值。
二元函數的極值求法
先求 \(f_x=0,f_y=0\) ,再利用判別法判斷極值點的類型。
拉格朗日乘數法
求 \(z=f(x,y)\) 在條件 \(g(x,y)=0\) 條件下的條件極值。
不妨假設 \(g(x,y)=0\) 滿足隱函數存在定理的條件(連續偏導數,\(g'_y\not =0\)) ,且確定的函數為 \(y=\varphi(x)\) ,則 \(z=f(x,\varphi(x))\)
\(\displaystyle \frac{\text{d}z}{\text{d}x}=f_1+f_2\varphi'(x)=0\)
而 \(g_1+g_2y'_x=0\) ,即 \(g_1+g_2\varphi'(x)=0\) ,故
\(\displaystyle f_1-f_2\frac{g_1}{g_2}=0\) ,這就是條件極值存在的必要條件。
變換即 \(\displaystyle \frac{f_1}{f_2}=\frac{g_1}{g_2}\) (不考慮為 0 的情況)
引入拉格朗日函數 \(L=f(x,y)+\lambda g(x,y)\) ,則 \(L_1=f_1+\lambda g_1\) ,\(L_2=f_2+\lambda g_2\) ,
則條件極值的存在條件轉化為 \(L_x=0,L_y=0\) 。
根據條件得出的點即為可能的極值點,在此基礎上,結合具體的問題,再分析是否是極值點。
1.6 多元函數積分學
1.6.1 理解二重積分、三重積分的概念,了解重積分的性質,了解二重積分的中值定理
二重積分
\(\displaystyle \underset{D}{\iint}f(x,y)\text{d}\sigma=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\xi_i,\eta_i)\Delta \sigma_i\)
其中 \(D\) 叫做積分區域,\(\text{d}\sigma\) 稱為面積元素。
三重積分
\(\displaystyle \underset{\Omega}{\iiint}f(x,y,z)\text{d}v=\lim\limits_{\lambda\rightarrow 0}f(\xi_i,\eta_i,\zeta_i)\Delta v_i\)
其中 \(\Omega\) 為有界閉區域,叫做積分區域,\(\text{d}v\) 叫做體積元素。
重積分的性質
被積函數可加性;積分區域可加性;二重積分中值定理
1.6.2 掌握二重積分的計算方法(直角坐標、極坐標),會計算三重積分(直角坐標、柱面坐標、球面坐標)
直角坐標計算二重積分
對二重積分 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}\sigma\) ,直角坐標積分法將二重積分轉化為求以 \(D\) 為底,以 \(z=f(x,y)\) 為頂的曲頂柱體。曲頂柱體可以利用一重積分按截面面積已知的立體的體積進行計算。
不妨假設積分區域 \(D\) 為 \(\begin{cases}a\le x\le b\\ m(x)\le y\le n(x)\end{cases}\) ,\(yOz\) 截面面積即為 \(\displaystyle \int_{m(x)}^{n(x)}f(x,y)\text{d}y\) ,則柱體的體積為 \(\displaystyle \int_a^b [\int_{m(x)}^{n(x)}f(x,y)\text{d}y] \text{d}x\) ,這就是直角坐標計算二重積分的公式。
也寫作 \(\displaystyle \int_a^b \text{d}x \int_{m(x)}^{n(x)}f(x,y)\text{d}y\) 。
注:直角坐標下的二重積分可以記為 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}x\text{d}y\)
極坐標計算二重積分
由扇形面積 \(\displaystyle S=\frac{1}{2}\theta \rho^2\) ,得扇形微元為 \(\Delta S=\displaystyle \frac{1}{2}\Delta \theta [(\rho+\Delta \rho)^2-\rho^2]=\rho\Delta \rho\Delta \theta+o(\Delta \rho\Delta \theta)\)
於是二重積分 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}\sigma = \lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\xi_i,\eta_i)\Delta \sigma_i\)
\(=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\rho_i\cos\theta_i,\rho_i\sin\theta_i)\rho_i\text{d}\rho_i\text{d}\theta_i\)
\(\displaystyle = \underset{D}{\iint}f(\rho\cos\theta,\rho\cos\theta)\rho\text{d}\rho\text{d}\theta\)
這個式子相當於利用極坐標對二重積分進行了換元(換元為直角坐標的形式),換元后轉換為二次積分進行計算。
不妨設積分區域為 \(\begin{cases}\alpha\le\theta\le\beta\\\varphi_1(\theta)\le \rho\le\varphi_2(\theta)\end{cases}\) ,
則 \(\displaystyle \underset{D}{\iint}f(\rho\cos\theta,\rho\cos\theta)\rho\text{d}\rho\text{d}\theta=\int_\alpha^\beta\text{d}\theta\int_{\varphi_1(\theta)}^{\varphi_2{\theta}}f(\rho\cos\theta,\rho\cos\theta)\rho\text{d}\rho\)
二重積分的換元法(了解)
若有變換 \(T:x=x(u,v),y=y(u,v)\) ,將 \(D':u,v\) 變換為 \(D:x,y\) ,且滿足
(1)有一階連續偏導數;
(2)雅可比式 \(J(u,v)=\displaystyle\frac{\partial (x,y)}{\partial (u,v)}=\begin{vmatrix}x_u&x_v\\y_u&y_v\end{vmatrix}\not =0\) ;
(3)變換是一對一的;
則 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}x\text{d}y=\underset{D'}{\iint}f(x(u,v),y(u,v))|J(u,v)|\text{d}u\text{d}v\)
注:雅可比式不為 \(0\) 是隱函數存在,即 \(x=x(u,v),y=y(u,v)\) 存在的必要條件。
注:取 \(\begin{cases}x=\rho\cos\theta\\y=\rho\sin\theta\end{cases}\) ,則 \(J(\rho,\theta)=\begin{vmatrix}\cos\theta&-\rho\sin\theta\\\sin\theta&\rho\cos\theta\end{vmatrix}=|\rho|=\rho\) 。
直角坐標計算三重積分
不妨記積分區域為 \(\begin{cases}a\le x\le b\\f_1(x)\le y\le f_2(x)\\g_1(x,y)\le z\le g_2(x,y)\end{cases}\) ,則參照二重積分的形式,將三重積分化為三次積分為 \(\displaystyle\underset{\Omega}{\iiint}f(x,y,z)\text{d}v= \int_a^b\text{d}x\int_{f_1(x)}^{f_2(x)}\text{d}y\int_{g_1(x,y)}^{g_2(x,y)}f(x,y,z)\text{d}z\)
三重積分也可記作 \(\displaystyle \underset{\Omega}{\iiint}f(x,y,z)\text{d}x\text{d}y\text{d}z\)
注:三重積分化為三次積分的形式,可以理解為先進行線積分得到線質量,然后得到面質量,最后得到體質量。
柱面坐標計算三重積分
參考二重積分,則體積元為 \(\text{d}v=\rho\text{d}\rho\text{d}\theta\text{d}z\) 。
球面坐標計算三重積分
記有向線段 \(\overrightarrow{OM}=\boldsymbol{a}\) ,與 \(z\) 軸的夾角為 \(\varphi\) ,在 \(xOy\) 平面上的投影與 \(x\) 軸的夾角為 \(\theta\) ,則有 \(\begin{cases}x=\rho\sin\varphi\cos\theta\\y=\rho\sin\varphi\sin\theta\\z=\rho\cos\varphi\end{cases}\) ,體積元可以近似為一個長方體,即 \(\text{d}v=\rho\sin\varphi\text{d}\theta \cdot \rho\text{d}\varphi \cdot \text{d}\rho=\rho^2\sin\varphi\text{d}\rho\text{d}\varphi\text{d}\theta\)
1.6.3 理解兩類曲線積分的概念,了解兩類曲線積分的性質及兩類曲線積分的關系
兩類曲線積分
分別為對弧長的曲線積分和對坐標的曲線積分
對弧長的曲線積分的概念
\(\displaystyle\int_L f(x,y)\text{d}s=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^n f(\xi_i,\eta_i)\Delta s_i\)
典型的物理含義就是曲線的質量
對弧長的曲線積分也稱為第一類曲線積分,\(L\) 叫做積分弧段。
弧長永遠為正,因此對弧長的曲線積分在不同方向的值相同,或者說積分曲線是一條沒有方向的曲線。
對坐標的曲線積分
\(\displaystyle\int_L P(x,y)\text{d}x=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n} P(\xi_i,\eta_i)\Delta x_i\)
\(\displaystyle\int_L Q(x,y)\text{d}y=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n} Q(\xi_i,\eta_i)\Delta y_i\)
典型的物理含義就是變力沿曲線做的功。
對坐標的曲線積分的積分曲線是一條有向曲線,\(\Delta x_i\) 的正負與曲線的方向有關(朝向 \(x\) 軸正向,為正)。
對坐標的曲線積分也稱為第二類曲線積分。
第二類曲線積分一般出現的形式是 \(\int_L P\text{d}x+Q\text{d}y\)
記 \(\boldsymbol{F}(x,y)=(P(x,y),Q(x,y))\) ,\(\text{d}\boldsymbol{r}=(\text{d}x,\text{d}y)\) ,則有曲線積分的形式為
\(\displaystyle\int_L \boldsymbol{F}(x,y)\cdot\text{d}(\boldsymbol{r})\)
兩類曲線積分的聯系
觀察定義式,不妨設曲線的方向向量為 \((\cos\alpha, \cos\beta)\) ,則有 \(\Delta x_i=\Delta s_i \cos\alpha\) ,\(\Delta y_i=\Delta s_i\cos\theta\) ,因此
\(\displaystyle\int_L P\text{d}x+Q\text{d}y=\int_L(P\cos\alpha+Q\cos\theta)\text{d}s\)
1.6.4 掌握計算兩類曲線積分的方法
設曲線方程為 \(\begin{cases}x=x(t)\\y=y(t)\end{cases}\) ,
第一類曲線積分的計算
\(\Delta s=\sqrt{\Delta^2 x+\Delta^2 y^2}=\sqrt{x'^2+y'^2}\Delta t\)
即
\(\displaystyle\int_L f(x,y)\text{d}s=\int_{t_1}^{t_2}f(x(t),y(t))\sqrt{x'^2+y'^2}\text{d}t\)
第二類曲線積分的計算
由 \(\Delta x=x'\Delta t\) ,\(\Delta y=y'\Delta t\)
\(\displaystyle\int_L P\text{d}x+Q\text{d}y=\int_{t_1}^{t_2}(Px'+Qy')\text{d}t\)
1.6.5 掌握格林公式並會運用平面曲線積分與路徑無關的條件,會求二元函數全微分的原函數
單連通區域
設 \(D\) 內任一閉曲線所圍的部分都屬於 \(D\) ,則稱 \(D\) 為單連通區域。否則稱為復聯通區域。
邊界曲線的正方向
規定沿邊界曲線行走時,區域在左側的方向為正方向。對於單連通區域,正方向為逆時針,對於復連通區域,內側的邊界的方向為順時針。
格林公式
設 \(P,Q\) 在 \(D\) 上具有一階連續偏導數,
\(\displaystyle\underset{D}{\iint}(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y})\text{d}x\text{d}y=\oint_LP\text{d}x+Q\text{d}y\)
其中 \(L\) 是 \(D\) 的取正向的邊界曲線。
證明:
不妨取 \(D\) 為 \(\begin{cases}a < x < b\\f_1(x) < y < f_2(x)\end{cases}\) ,上側曲線為 \(L_2\),下側曲線為 \(L_1\),
則 \(\displaystyle\underset{D}{\iint}\frac{\partial P}{\partial y}\text{d}x\text{d}y=\int_a^b [\int_{f_1(x)}^{f_2(x)}\frac{\partial P}{\partial y}\text{d}y]\text{d}x=\int_a^b(P(x,f_2(x))-P(x,f_1(x)))\text{d}x\)
\(\displaystyle\oint_LP\text{d}x=\int_{L_1}P\text{d}x+\int_{L_2}P\text{d}x=\int_a^bP(x,f_1(x))\text{d}x-\int_a^bP(x,f_2(x))\text{d}x\)
格林公式的理解
格林公式的向量形式:
\(\displaystyle\underset{D}{\iint}\boldsymbol{\nabla}\times\boldsymbol{F}(x,y)\cdot \text{d}\boldsymbol{s}=\oint_L\boldsymbol{F}(x,y)\cdot \text{d}\boldsymbol{r}\)
也即旋度對面積的積分等於向量場對邊界的積分。
平面上曲面積分與路徑無關
一個區域內任意兩點之間的區域內的任意兩條曲線 \(L_1,L_2\) ,若始終有
\(\displaystyle\int_{L_1}P\text{d}x+Q\text{d}y=\int_{L_2}P\text{d}x+Q\text{d}y\)
則稱曲線積分在區域內與路徑無關。
曲線積分與路徑無關的等價條件
區域內任意閉曲線 \(C\) 的曲線積分 \(\oint_{C}P\text{d}x+Q\text{d}y=0\)
聯系格林公式,即 \(\displaystyle\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}=0\)
二元函數全微分的原函數
\(P\text{d}x+Q\text{d}y\) 在單連通域 \(D\) 內為某一函數 \(u(x,y)\) 的全微分的充要條件是 \(\displaystyle\frac{\partial Q}{\partial x}=\frac{\partial P}{\partial y}\) 在 \(D\) 內恆成立。
取函數 \(\displaystyle u(x,y)=\int_{x_0,y_0}^{x,y}P(x,y)\text{d}x+Q(x,y)\text{d}y\)
則有 \(\displaystyle\frac{\partial u}{\partial x}=\lim\limits_{\Delta x\rightarrow 0}\frac{u(x+\Delta x,y)-u(x,y)}{\Delta x}\) ,\(\displaystyle u(x+\Delta x,y)-u(x,y)=\int_{x_0,y_0}^{x+\Delta x,y}-\int_{x_0,y_0}^{x,y}\) ,假設曲線積分與路徑無關,則有 \(\displaystyle =\int_{x_0,y_0}^{x,y}+\int_{x,y}^{x+\Delta x,y}-\int_{x_0,y_0}^{x,y}\) ,即 \(\displaystyle\frac{\partial u}{\partial x}=P(x,y)\) (充分性的證明)。
再取 \(\text{d}u=P\text{d}x+Q\text{d}y\) ,則有 \(\displaystyle\frac{\partial u}{\partial x}=P\) ,\(\displaystyle \frac{\partial^2 u}{\partial x\partial y}=\frac{\partial P}{\partial y}\) ,\(\displaystyle\frac{\partial u}{\partial y}=Q\) ,\(\displaystyle\frac{\partial ^2u}{\partial y\partial x}=\frac{\partial Q}{\partial x}\) ,當一階偏導數連續時,有 \(\displaystyle\frac{\partial^2 u}{\partial x\partial y}=\frac{\partial ^2u}{\partial y\partial x}\) ,因此必要性得證。
證明過程即得,若曲線積分與路徑無關,則 \(\displaystyle u(x,y)=\int_{x_0,y_0}^{x,y}P(x,y)\text{d}x+Q(x,y)\text{d}y\) 即為全微分對應的原函數。
曲線積分 \(\int_LP\text{d}x+Q\text{d}y\) 與路徑無關 \(\Leftrightarrow\) \(\displaystyle \frac{\partial P}{\partial y}=\frac{\partial Q}{\partial x}\) \(\Leftrightarrow\) \(P\text{d}x+Q\text{d}y\) 是某一個函數 \(u(x,y)\) 的全微分
曲線積分的基本定理(了解)
若對場 \(\boldsymbol{F}\) ,存在一個數量函數 \(f\) ,滿足 \(\boldsymbol{F}=\nabla f\) ,則曲線積分 \(\int_L \boldsymbol{F}\cdot\text{d}\boldsymbol{r}=f(B)-f(A)\) 。
也即曲線積分只與勢函數在兩端點的值,而不依賴於兩點間的路徑。這說明勢場是保守場。
擴展
梯度、散度、旋度
1.6.6 了解兩類曲面積分的概念、性質及兩類曲面積分的關系,掌握計算兩類曲面積分的方法,掌握用高斯公式計算曲面積分的方法,並會用斯托克斯公式計算曲線積分
對面積的曲面積分
\(\displaystyle\underset{\Sigma}{\iint}f(x,y,z)\text{d}S=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}f(\xi_i,\eta_i,\zeta_i)\Delta S_i\)
對面積的曲面積分的計算
記 \(\Delta S_i\) 在 \(xOy\) 平面上的投影為 \(\Delta \sigma_i\) ,由曲面的一般方程的法向量為 \((F_x,F_y,F_z)\) ,記曲面方程為 \(z=f(x,y)\) ,則為 \((z_x,z_y,-1)\) ,也即有 \(\Delta S_i=\Delta \sigma_i \sqrt{1+z_x^2+z_y^2}\) ,
記 \(\Sigma\) 在 \(xOy\) 平面上的投影為 \(D\) ,即
\(\displaystyle\underset{\Sigma}{\iint}f(x,y,z)\text{d}S=\underset{D}{\iint}f(x,y,z(x,y))\sqrt{1+z_x^2+z_y^2}\text{d}x\text{d}y\)
有向曲面
取定了法向量,亦即選定了側的曲面,稱為有向曲面。
有向曲面的投影
假設一小塊有向曲面的所有法向量和 \(z\) 軸的夾角 \(\theta\) 均滿足 \(\cos\theta\) > 0 或 \(\cos\theta < 0\) ,記投影的面積為 \(\Delta \sigma\) ,則投影 \(|\Delta S|=\Delta \sigma\) ,符號與 \(\cos\theta\) 相同 。
流向曲面一側的流量
設流體流過平面上的一個閉區域, 且速度處處相等為 \(\boldsymbol{v}\) ,則單位時間內流過區域的流量等於底面積為閉區域面積,斜高為 \(|\boldsymbol{v}|\) 的斜柱體的體積。
設平面的單位法向量為 \(\boldsymbol{n}\) ,且以平面的法向量方向為曲面的正方向,則斜柱體體積為 \(A|\boldsymbol{v}|\cos\theta=A\boldsymbol{v}\cdot\boldsymbol{n}\) 。
對於有向曲面 \(\Sigma\),將其分成 \(n\) 個小塊 \(\Delta S_i\) ,設對應的單位法向量為 \(\boldsymbol{n}_i\) ,速度場為 \(\boldsymbol{v}=(P,Q,R)\) ,則流過曲面的流量可以近似為 \(\displaystyle\Phi=\sum_{i=1}^{n}\boldsymbol{v}_i\cdot\boldsymbol{n}_i\Delta S_i\)
記 \(\boldsymbol{n}_i=(\cos\alpha,\cos\beta,\cos\gamma)\) ,則 \(\Phi=\displaystyle\sum_{i=1}^{n}\Delta S_i(P\cos\alpha+Q\cos\beta+R\cos\gamma)=\sum_{i=1}^{n}P\Delta S_{yz}+Q\Delta S_{xz}+R\Delta S_{xy}\) 。
對坐標的曲面積分
\(\displaystyle\underset{\Sigma}{\iint}P(x,y,z)\text{d}y\text{d}z=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}P(\xi_i,\eta_i,\zeta_i)(\Delta S_i)_{yz}\)
\(\displaystyle\underset{\Sigma}{\iint}Q(x,y,z)\text{d}y\text{d}z=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}P(\xi_i,\eta_i,\zeta_i)(\Delta S_i)_{xz}\)
\(\displaystyle\underset{\Sigma}{\iint}P(x,y,z)\text{d}x\text{d}y=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}P(\xi_i,\eta_i,\zeta_i)(\Delta S_i)_{xy}\)
注:對坐標的曲面積分的符號體現在投影 \(\Delta S\) 上。
按對坐標的曲面積分的定義,則有流過曲面的流量為 \(\displaystyle\Phi=\underset{\Sigma}{\iint}P\text{d}y\text{d}z+Q\text{d}x\text{d}z+R\text{d}x\text{d}y\)
對坐標的曲面積分的計算法
不妨假設 \(\cos\alpha>0\) ,此時有 \((\Delta S_i)_{yz}=(\Delta \sigma)_{yz}\) ,參考二重積分的定義式,記曲面 \(\Sigma\) 在 \(yOz\) 平面上的投影為 \(D_{yz}\) ,也即有
\(\displaystyle\underset{\Sigma}{\iint}P(x,y,z)\text{d}y\text{d}z=\underset{D_{yz}}{\iint}P(x,y,z)\text{d}y\text{d}z=\underset{D_{yz}}{\iint}P(x(y,z),y,z)\text{d}y\text{d}z\)
高斯公式
\(\displaystyle\underset{\Omega}{\iiint}(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z})\text{d}v=\underset{\Sigma}{\oiint}P\text{d}y\text{d}z+Q\text{d}z\text{d}x+R\text{d}x\text{d}y\)
其中 \(\Omega\) 是空間閉區域,其是由分片光滑的閉曲面 \(\Sigma\) 組成。
證:
取一個柱面,則有 \(\displaystyle\underset{\Sigma}{\oiint}R\text{d}x\text{d}y\) 有三個積分面,且側面的積分值為 \(0\) ,記頂面為 \(\Sigma_1\) ,底面為 \(\Sigma_2\) ,則封閉曲面的積分為 \(\displaystyle\underset{\Sigma_1}{\iint}R\cos\alpha\text{d}S+\underset{\Sigma_2}{\iint}R\cos\beta\text{d}S=\underset{D}{\iint}(R(x,y,z_1)-R(x,y,z_2))\text{d}\sigma\) ,
同時 \(\displaystyle\underset{\Omega}{\iiint}\frac{\partial R}{\partial z}\text{d}v=\underset{D}{\iint}\text{d}\sigma\int_{z_1}^{z_2}\frac{\partial R}{\partial z}\text{d}z=\underset{D}{\iint}(R(x,y,z_1)-R(x,y,z_2))\text{d}\sigma\) 。
斯托克斯公式
設 \(\Gamma\) 為分段光滑的空間有向閉曲線,\(\Sigma\) 是以閉曲線為邊界的分片光滑的有向曲面,曲線的正向和曲面的側符合右手規則,則
\(\displaystyle\oint_{\Gamma}P\text{d}x+Q\text{d}y+R\text{d}z=\underset{\Sigma}{\iint}\begin{vmatrix}\text{d}y\text{d}z&\text{d}z\text{d}x&\text{d}x\text{d}y\\\frac{\partial }{\partial x}&\frac{\partial }{\partial y}&\frac{\partial }{\partial z}\\P&Q&R\end{vmatrix}=\underset{\Sigma}{\iint}\begin{vmatrix}\cos\alpha&\cos\beta&\cos\gamma\\\frac{\partial }{\partial x}&\frac{\partial }{\partial y}&\frac{\partial }{\partial z}\\P&Q&R\end{vmatrix}\text{d}S\)
斯托克斯公式即空間上,旋度對面積的積分和場對邊界曲線的積分。
如果曲面退化到 \(xOy\) 平面上,即 \((\cos\alpha,\cos\beta,\cos\gamma)=(0,0,1)\) ,此時斯托克斯公式就變成格林公式。
證:
\(\displaystyle\underset{\Sigma}{\iint}\frac{\partial P}{\partial z}\text{d}z\text{d}x-\frac{\partial P}{\partial y}\text{d}x\text{d}y=\underset{\Sigma}{\iint}(\frac{\partial P}{\partial z}\cos\beta-\frac{\partial P}{\partial y}\cos\gamma)\text{d}S\)
記曲面為 \(z=f(x,y)\) ,則有法向量 \((\cos\alpha,\cos\beta,\cos\gamma)=\lambda(-z_x,-z_y,1)\)
即 \(\displaystyle=\underset{\Sigma}{\iint}(\frac{\partial P}{\partial z}\cos\beta\cdot (-z_y)-\frac{\partial P}{\partial y}\cos\gamma)\text{d}S=-\underset{\Sigma}{\iint}(\frac{\partial }{\partial y}P(x,y,z(x,y)))\text{d}S\)
記 \(D\) 為右手法則的正向投影,利用格林公式,即 \(\displaystyle=\oint_CP\text{d}x\)
1.6.7 了解散度與旋度的概念,並會計算
通量:
設有向量場 \(\boldsymbol{A}=(P,Q,R)\) ,\(\Sigma\) 為場內的一片有向曲面,則通量為
\(\displaystyle\underset{\Sigma}{\iint}\boldsymbol{A}\cdot\boldsymbol{n}\text{d}S\)
通量即對坐標的曲面積分。
環流量:
\(\displaystyle\oint_{\Gamma}\boldsymbol{A}\cdot\boldsymbol{\tau}\text{d}s\)
其中 \(\Gamma\) 是一條分段光滑的有向閉曲線,\(\boldsymbol{\tau}\) 是曲線的單位切向量。
環流量即對坐標的曲線積分。
梯度:
\(\bold{grad}f=\bold{\nabla}f=(f_x,f_y)\)
梯度描述了函數在某點的最陡上升方向。
散度:
\(\text{div}\boldsymbol{f}=\bold{\nabla}\cdot \boldsymbol{f}=f_x+f_y+f_z\)
散度可以看作穩定流動的不可壓縮流體在某點的源頭強度,若散度為零,則表示流體在此點無源,若為正,則有向外發散源,若為負,則有吸收流體的匯聚源。
散度即為通量的密度(利用高斯公式可證)。
高斯公式的通量和散度形式
\(\displaystyle\underset{\Omega}{\iiint}\boldsymbol{\nabla}\cdot \boldsymbol{A}\text{d}v=\underset{\Sigma}{\oiint}\boldsymbol{A}\cdot\boldsymbol{n}\text{d}S\)
即散度對體積的積分等於對應曲面的通量(通量的法向量和曲面的側滿足右手法則)
旋度:
\(\bold{rot}\boldsymbol{f}=\bold{\nabla}\times\boldsymbol{f}=\begin{vmatrix}\boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\\frac{\partial}{\partial x}&\frac{\partial}{\partial y}&\frac{\partial}{\partial z}\\P&Q&R\end{vmatrix}\)
以 \(\boldsymbol{f}\) 表示剛體繞定軸旋轉形成的速度場,則速度場的旋度即為角速度 \(2\boldsymbol{\omega}\) 。
\(\boldsymbol{v}=\boldsymbol{\omega}\times\boldsymbol{r}=(0,0,\omega)\times(x,y,z)\) ,
即 \(\boldsymbol{v}=\begin{vmatrix}\boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\0&0&\omega\\x&y&z\end{vmatrix}=(-y\omega,x\omega,0)\) ,
此時 \(\bold{rot}\boldsymbol{v}=\begin{vmatrix}\boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\\frac{\partial}{\partial x}&\frac{\partial}{\partial y}&\frac{\partial}{\partial z}\\-y\omega&x\omega&0\end{vmatrix}=(0,0,2\omega)=2\boldsymbol{\omega}\)
旋度即為環流量的密度。
斯托克斯公式的旋度形式
\(\displaystyle\underset{\Sigma}{\iint}\boldsymbol{\nabla}\times\boldsymbol{n}\text{d}S=\oint_{\Gamma}\boldsymbol{A}\cdot\boldsymbol{\tau}\text{d}s\)
1.6.8 會用重積分、曲線積分及曲面積分求一些幾何量與物理量(平面圖形的面積、體積、曲面面積、弧長、質量、質心、形心、轉動慣量、引力、功及流量等)
質心
\(\displaystyle x=\frac{\sum x_im_i}{M}\)
或者積分形式
\(\displaystyle x=\frac{\underset{\Omega}{\displaystyle\iiint}x\rho\text{d}v}{\underset{\Omega}{\displaystyle\iiint}\rho\text{d}v}\)
形心
\(\displaystyle x=\frac{\sum x_iv_i}{V}\)
形心即等密度體的質心
轉動慣量
\(\displaystyle I_x=\sum (y^2+z^2)m_i\)
\(\displaystyle I_x=\underset{\Omega}{\iiint}(y^2+z^2)\rho\text{d}v\)
1.7 無窮級數
1.7.1 理解常數項級數收斂、發散以及收斂級數的和的概念,掌握級數的基本性質及收斂的必要條件
常數項級數
給定一個數列 \(u_1,u_2,...,u_n,...\)
由這個數列構成的表達式 \(u_1+u_2+...+u_n+...\) 叫做(常數項)無窮級數,簡稱(常數項)級數,記為 \(\displaystyle\sum_{i=1}^{\infin}u_i\) 。
部分和
作級數的前 \(n\) 項和 \(\displaystyle s_n=\sum_{i=1}^{n}u_i\) 稱為級數的部分和。
級數收斂
即 \(\lim\limits_{n\rightarrow \infin}s_n=s\)
此時,稱級數的和為 \(s\)。
如果沒有極限,則稱級數發散。
級數的基本性質
\(k\) 乘收斂一致
收斂可加減
改變有限項不影響收斂性
任意加括號形成的級數收斂一致
級數收斂的必要條件
若級數 \(\displaystyle \sum_{i=1}^{\infin}u_i\) 收斂,則 \(\lim\limits_{i\rightarrow \infin}u_i=0\)
柯西審斂原理(級數收斂的充要條件)
總存在一個下標下限,其后續的任意一般項之和能任意小。
1.7.2 掌握幾何級數與 p 級數的收斂與發散的條件
幾何級數
即等比級數,\(\displaystyle\sum_{i=0}^{\infin}aq^{i}\)
\(|q|<1\) 時收斂,否則發散。
\(p\) 級數
即 \(\displaystyle\sum_{i=1}^n \frac{1}{i^p}=\frac{1}{1^p}+\frac{1}{2^p}+\frac{1}{3^p}+...\)
\(p\) 級數也稱為超調和級數。
\(p=1\) 時,為調和級數,發散(可利用柯西審斂原理)。
\(p<1\) 時,每個項都變大,則仍然發散。
\(p>1\) 時,利用 \(\displaystyle\frac{1}{i^p}<\frac{1}{x^p}\) ,\(\displaystyle\frac{1}{i^p}=\int_{i-1}^{i}\frac{1}{i^p}\text{d}x<\int_{i-1}^{i}\frac{1}{x^p}\text{d}x\) ,得到右式 \(\displaystyle <1+\int_{1}^\infin\frac{1}{x^p}\text{d}x=1+[\frac{x^{-p+1}}{-p+1}]_{1}^{\infin}=1+\frac{1}{p-1}\) ,即收斂。
1.7.3 掌握正項級數收斂性的比較判別法、比值判別法、根植判別法,會用積分判別法
正項級數比較判別法
若相對小,則同收斂,若相對大,則同發散。
利用有限項不改變斂散性的性質,可以推導出極限形式的正項級數比較判別法。
正項級數比值審斂法
若 \(\displaystyle \lim\limits_{n\rightarrow \infin}\frac{u_{n+1}}{u_n}=\rho\) ,則 \(\rho<1\) 收斂,\(\rho>1\) 發散,\(\rho=1\) 可能收斂也可能發散。
證明:利用極限的定義,將比值擴展到一個確定的界,再根據等比級數的斂散性即可證。
擴展:如果沒有正項的限制,則如果絕對收斂,則必定收斂。
根值審斂法
\(\displaystyle\lim\limits_{n\rightarrow \infin}(u_n)^{\frac{1}{n}}=\rho\)
當 \(\rho < 1\) 時收斂,\(\rho>0\) 時發散,\(\rho=1\) 時可能發散也可能收斂。
證明:和比值審斂法類似。
積分判別法
設級數即其對應的函數是非負減函數,則級數 \(\displaystyle\sum_{i=1}^{\infin}f(i)\) 和 \(\int_{0}^{\infin}f(x)\text{d}x\) 同收斂或發散。
考慮級數 \(\displaystyle s=\sum_{i=1}^{\infin}u_i\) ,改為函數形式,即為 \(\displaystyle s=\sum_{x=1}^{\infin}u(x)=\sum_{x=1}^{\infin}\int_{x-1}^{x}u(x)\text{d}l\) ,由減函數,有 \(\displaystyle s<\sum_{x=1}^{\infin}\int_{x-1}^x u(l)\text{d}l=\int_0^{\infin}u(l)\text{d}l\) ,即可得同收斂。類似可證,同發散。
1.7.4 掌握交錯級數的萊布尼茨判別法
交錯級數
對正項級數 \(\displaystyle\sum_{i=1}^{\infin}u_i\) ,則級數 \(\displaystyle\sum_{i=1}^{\infin} (-1)^n u_i\) ,\(\displaystyle\sum_{i=1}^{\infin}(-1)^{i+1}u_i\) 即為交錯級數。
交錯級數的萊布尼茨判別法
若 \(u_i\ge u_{i+1}\) 且極限為 \(0\) ,則收斂。
證明:將相鄰兩項可以分別組合成正數數列和負數數列,前者遞增,后者遞減,因此必收斂(單調有界必有極限)。
1.7.5 了解任意項級數絕對收斂與條件收斂的概念以及絕對收斂與收斂的關系
絕對收斂
對級數 \(\displaystyle s=\sum_{i=1}^\infin u_i\) ,若 \(\displaystyle \sum_{i=1}^\infin |u_i|\) 收斂,則稱級數 \(s\) 絕對收斂。
條件收斂
如果級數收斂,但不絕對收斂,則稱其條件收斂。
絕對收斂和收斂的關系
若級數絕對收斂,則級數收斂。
證明:
取 \(m_i=u_i+|u_i|\) ,則有 \(m_i \le 2|u_i|\) ,\(m_i\ge 0\) ,故 \(m_i\) 對應級數收斂,而 \(u_i=m_i-|u_i|\) ,故 \(u_i\) 對應級數收斂。
1.7.6 了解函數項級數的收斂域及和函數的概念
函數項級數
由函數列 \(u_1(x),u_2(x),...,x_n(x),...\) 構成的表達式 \(u_1(x)+u_2(x)+...+u_n(x)+...\) 稱為(函數項)無窮級數,簡稱(函數項)級數。
收斂點
若 \(x=x_0\) 使函數項級數收斂,則稱 \(x_0\) 為收斂點。
收斂域
收斂點的全體稱為收斂域。
和函數
在收斂域內,函數項級數的和構成函數 \(s(x)\) ,稱為和函數。
1.7.7 理解冪級數收斂半徑的概念,並掌握冪級數的收斂半徑、收斂區間及收斂域的求法
冪級數
形如 \(\displaystyle\sum_{i=0}^{\infin}a_ix^{i}\) 的級數稱為冪級數。
冪級數的收斂半徑
如果冪級數的收斂域不為點 \(0\) ,也不為全體實數,則存在正數 \(R\) ,當 \(|x|<R\) 時收斂,\(|x|>R\) 時發散。\(R\) 稱為冪級數的收斂半徑。
冪級數收斂半徑的求法
對冪級數 \(\displaystyle\sum_{i=0}^\infin a_ix^i\) ,若有 \(\displaystyle\lim\limits_{i\rightarrow \infin}|\frac{a_{i+1}}{a_i}|=\rho\) ,則收斂半徑 \(\displaystyle R=\frac{1}{\rho}\) (對 \(\rho=0\) 和 \(\rho=+\infin\) 也成立)。
證:取 \(u_i=|a_ix^i|\) ,則 \(\displaystyle \lim\limits_{i\rightarrow \infin}\frac{u_{i+1}}{u_i}=\rho |x|\) ,由正數項級數的比值審斂法,\(\displaystyle |x|<\frac{1}{\rho}\) 時收斂。
若 \(\rho=0\) ,則對任意 \(x\) ,都有比值極限為 \(0\) ,即收斂。
若 \(\rho=+\infin\) ,不滿足級數收斂的必要條件,即僅當 \(x=0\) 時收斂。
1.7.8 了解冪級數在其收斂區間內的基本性質(和函數的連續性、逐項求導和逐項積分),會求一些冪級數在收斂區間內的和函數,並會由此求出某些常數項級數的和
和函數的連續性
冪級數的和函數在其收斂域上連續
冪級數逐項求導公式
冪級數的和函數在其收斂區間內可導。
\(\displaystyle s'(x)=\sum_{i=1}^{\infin}ia_ix^{i-1}(|x|<R)\)
逐項求導后得到的冪級數和原級數有相同的收斂半徑。
推論:冪級數的和函數在其收斂區間內具有任意階導數。
冪級數的逐項積分公式
冪級數的和函數在其收斂區間內可積。
\(\displaystyle\int_0^x s(x)\text{d}x=\sum_{i=1}^{n}\int_0^xa_ix^i=\sum_{i=1}^n \frac{1}{i+1}a_ix^{i+1}(x<R)\)
逐項積分后所得到的冪級數和原級數有相同的收斂半徑。
1.7.9 了解函數展開為泰勒級數的充分必要條件
函數展開為泰勒級數的充要條件
余項 \(R_n(x)\) 當 \(n\rightarrow \infin\) 時為零。
回顧:
泰勒公式
\(\displaystyle f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)^2+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+\frac{f^{(n+1)}(\xi)}{(n+1)!}(x-x_0)^{n+1}\)
其中 \(\xi\) 介於 \(x\) 和 \(x_0\) 之間。
麥克勞林展開
\(\displaystyle f(x)=f(0)+f'(0)x+\frac{f''(0)}{2!}x^2+...+\frac{f^{(n)}(0)}{n!}x^n+\frac{f^{(n+1)}(\xi)}{(n+1)!}x^{n+1}\)
其中 \(\xi\) 介於 \(x\) 和 \(0\) 之間。
也用通項的形式可以寫成 \(\displaystyle f(x)=\sum_{i=0}^{n}\frac{f^{(i)}(0)}{i!}x^{i}+\frac{f^{(n+1)}(\xi)}{(n+1)!}x^{n+1}\)
1.7.10 掌握 \(e^x,\sin x,\cos x,\ln(1+x)\) 及 \((1+x)^a\) 的麥克勞林展開式,會用它們將一些簡單函數間接展開為冪級數
\(e^x\)
\(f^{(n)}(0)=1\) ,即
\(\displaystyle e^x=1+x+\frac{1}{2!}x^2+...+\frac{1}{n!}x^n+...\)
\(-\infin < x < \infin\)
\(\sin x\)
\(f^{(2n+1)}(0)=(-1)^n\) ,即
\(\displaystyle \sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}- ... +\frac{(-1)^n}{(2n+1)!}x^{2n+1}+...\)
\(-\infin < x < \infin\)
\(\cos x\)
\(f^{(2n)}(0)=(-1)^n\) ,即
\(\displaystyle \cos x=1-\frac{x^2}{2!}+\frac{x^4}{4!}-...+\frac{(-1)^n}{(2n)!}x^{2n}+...\)
\(-\infin < x < \infin\)
\(\displaystyle\frac{1}{1+x}\)
\(f^{(n)}(x)=(-1)^n \times n!\times (1+x)^{-(n+1)}\)
\(\displaystyle R_n(x)=\frac{(-1)^n \times n!\times (1+\xi)^{-(n+1)}}{n!}x^n\) ,則有收斂域為 \(-1<x<1\)
\(f^{(n)}(0)=(-1)^n \times n!\)
\(\displaystyle\frac{1}{1+x}=1-x+x^2-...+(-1)^nx^n+...\)
\((1+x)^a\)
\(f^{(n)}(x)=a(a-1)...(a-n+1)(1+x)^{a-n}\)
\(\displaystyle (1+x)^a=1+ax+\frac{a(a-1)}{2!}x^2+...+\frac{a(a-1)...(a-n+1)}{n!}x^n+...\)
由 \(\displaystyle \lim\limits_{n\rightarrow \infin}|\frac{u_{n+1}}{u_n}|=\lim\limits_{n\rightarrow \infin}|\frac{n+1}{a-n}|=1\) ,即 \(\rho=1\) ,即在 \(-1<x<1\) 內收斂。
在收斂域內,記 \(\displaystyle F(x)=1+ax+\frac{a(a-1)}{2!}x^2+...+\frac{a(a-1)...(a-n+1)}{n!}x^n+...\) ,
有 \(\displaystyle F'(x)=a(1+\frac{a}{1}x+...+\frac{(a-1)...(a-n+1)}{(n-1)!}x^{n-1}+...)\)
\(\displaystyle (1+x)F'(x)=a(1+\frac{a}{1}x+...+\frac{(a-1)...(a-n+1)}{(n-1)!}x^{n-1}+...)+a(x+\frac{a}{1}x^2+...+\frac{(a-1)...(a-n+1)}{(n-1)!}x^{n}+...)\)
由 \(\displaystyle \frac{(m-1)...(m-n+1)}{(n-1)!}+\frac{(m-1)...(m-n)}{n!}=\frac{(m-1)...(m-n+1)(n+m-n)}{n!}=\frac{m(m-1)...(m-n+1)}{n!}\) ,
即有 \((1+x)F'(x)=aF(x)\) ,
取 \(\displaystyle \varphi(x)=\frac{F(x)}{(1+x)^a}\) ,有 \(\displaystyle \varphi'(x)=\frac{F'(x)(1+x)^a-aF(x)(1+x)^{a-1}}{(1+x)^{2a}}=0\) ,而 \(\varphi(0)=1\) ,故 \(\varphi(x)=1\) ,即冪級數展開成立。
注:沒有用余項的極限為 \(0\) 來證。
在收斂區間內,\((1+x)^a\) 的冪級數展開稱為二項展開式。
當 \(a\) 為整數時,公式只有有限項,即為二項式定理。
1.7.11 了解傅立葉級數的概念和狄利克雷收斂定理,會將定義在 \([-l,l]\) 上的函數展開為傅立葉級數,會將定義在 \([0,l]\) 上的函數展開為正弦級數與余弦級數,會寫出傅立葉級數的和函數的表達式
三角級數
將周期為 \(\displaystyle T=\frac{2\pi}{\omega}\) 的周期函數用一系列以 \(T\) 為周期的正弦函數組成的級數來表示,即
\(\displaystyle f(t)=A_0+\sum_{i=1}^{\infin}A_i\sin(i\omega t+\varphi_i)\)
其物理含義就是將一個比較復雜的周期運動看成是許多不同頻率的簡諧振動的疊加。在電工學上,這種展開稱為諧波分析,\(A_0\) 稱為直流分量,\(A_1\sin(\omega t+\varphi_1)\) 稱為一次諧波(基波),其余項依次稱為二次諧波、三次諧波等。
將級數進行適當變形,即可得到 \(\displaystyle f=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos ix+b_i\sin ix)\) ,變換得到了以 \(2\pi\) 為周期的三角級數。
三角函數系的正交性
在三角函數系 \(1,\cos x,\sin x,\cos 2x,\sin 2x,...\cos nx,\sin nx,...\) 中任意取兩個不同的函數的乘積在 \([-\pi,\pi]\) 上積分等於 \(0\) 。
傅里葉級數
設函數 \(\displaystyle f(x)=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos ix+b_i\sin ix)\) ,
兩邊直接對 \([-\pi,\pi]\) 積分,得到 \(\displaystyle a_0=\frac{1}{\pi}\int_{-\pi}^{\pi}f(x)\text{d}x\) ,
兩邊同乘 \(\cos ix\) ,再對 \([-\pi,\pi]\) 積分,得到 \(\displaystyle a_i=\frac{1}{\pi}\int_{-\pi}^{\pi}f(x)\cos ix\text{d}x\) ,
兩邊同乘 \(\sin ix\) ,再對 \([-\pi,\pi]\) 積分,得到 \(\displaystyle b_i=\frac{1}{\pi}\int_{-\pi}^{\pi}f(x)\sin ix\text{d}x\) 。
將這些系數代入三角級數,得到的級數稱為傅里葉級數,這些系數稱為傅里葉系數。
狄利克雷收斂定理
設 \(f(x)\) 是周期為 \(2\pi\) 的周期函數,且滿足
(1)在一個周期內連續或只有有限個第一類間斷點
(2)在一個周期內至多只有有限個極值點
則 \(f(x)\) 的傅里葉級數收斂,連續處,收斂於 \(f(x)\) ,間斷點處,收斂於 \(\displaystyle \frac{f(x^-)+f(x^+)}{2}\)
正弦級數
只含有正弦項的三角級數
余弦級數
只含有余弦項的三角級數
由於 \(\cos ix\) 為偶函數,\(\sin ix\) 為奇函數,因此若 \(f(x)\) 為奇函數,則 \(a_i=0\) ,若 \(f(x)\) 為偶函數,則 \(b_i=0\) 。也即奇函數的傅里葉級數是正弦級數,偶函數的傅里葉級數是余弦級數。
對於定義在 \([0,\pi]\) 上的函數 \(f(x)\) ,如果在 \((-\pi,0)\) 上補充定義為一個奇函數(或者偶函數),則可以得到一個正弦級數(或者余弦級數)。這種拓廣函數定義域的過程稱為奇延拓(或者叫做偶延拓)。
傅里葉級數的一般形式
對一般周期函數 \(f(t)\) 的三角級數的一般項進行變形,
\(A_i\sin (i\omega t+\varphi_i)=A_i\sin\varphi_i\cos i\omega t+A_i\cos\varphi_i\sin i\omega t=a_i\cos i\omega t+b_i\sin i\omega t\) ,
要變換成為以 \(2\pi\) 為周期,即變換為 \(x=\omega t\) ,記 \(\displaystyle f(t)=f(\frac{x}{\omega})=F(x)\)。其中 \(F(x)\) 的周期為 \(2\pi\) ,即有
\(\displaystyle F(x)=F(\omega t)=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos i\omega t+b_i\sin i\omega t)=f(t)\)
對應有 \(\displaystyle a_i=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}F(\omega t)\cos i\omega t\cdot \omega\text{d}t=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}f(t)\cos i\omega t\cdot \omega\text{d}t\)
\(\displaystyle b_i=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}F(\omega t)\sin i\omega t\cdot \omega \text{d}t=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}f(t)\sin i\omega t\cdot \omega \text{d}t\)
記周期函數 \(f(t)\) 的周期為 \(2l\) ,\(\displaystyle \omega = \frac{\pi}{l}\) ,則有
\(\displaystyle f(t)=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos \frac{i\pi t}{l}+b_i\sin \frac{i\pi t}{l})\)
\(\displaystyle a_i=\frac{1}{l}\int_{-l}^{l}f(t)\cos \frac{i\pi t}{l}\text{d}t\)
\(\displaystyle b_i=\frac{1}{l}\int_{-l}^{l}f(t)\sin \frac{i\pi t}{l}\text{d}t\)
1.8 常微分方程
1.8.1 了解微分方程及其階、解、通解、初始條件和特解等概念
微分方程
一般地,凡表示未知函數、未知函數的導數與自變量之間的關系的方程,叫做微分方程,有時也簡稱方程。
如 \(F(x,y,y')=0\)
微分方程的階
微分方程中所出現的未知函數的最高階導數的階數,叫做微分方程的階。
\(F(x,y,y')=0\) 即為一階微分方程。
\(F(x,y,y',...,y^{(n)})\) 即為 \(n\) 階微分方程。
微分方程的解
設函數 \(y\varphi(x)\) 在區間 \(I\) 上有 \(n\) 階連續導數,如果在區間 \(I\) 上,\(F(x,\varphi(x),\varphi'(x),...,\varphi^{(n)}(x))\equiv 0\) ,那么函數 \(y\varphi(x)\) 就叫做微分方程在區間 \(I\) 上的解。
微分方程的通解
如果微分方程的解中含有任意常數,且任意常數的個數與微分方程的階數相同,這樣的解叫做微分方程的通解。
注:這里為什么任意常數的個數和階數相同,一方面可以理解為階數對應了求積分的次數,每一次求積分引入一個任意常數,另一方面可以理解為定義如此。
初始條件
用來確定微分方程的通解中的任意常數的條件,稱為初始條件。
特解
通過一個初始條件確定了通解中的任意常數后,就得到了微分方程的特解。
1.8.2 掌握變量可分離的微分方程及一階線性微分方程的解法
可分離變量的微分方程
如果一個一階微分方程能寫成 \(g(y)\text{d}y=f(x)\text{d}x\) 的形式,也即微分方程能寫成一端只含 \(y\) 的函數和 \(\text{d}y\) ,另一端只含 \(x\) 的函數和 \(\text{d}x\) ,那么原方程就稱為可分離變量的微分方程。
可分離變量的微分方程的解法
對一階線性微分方程,設其變換為 \(g(y)\text{d}y=f(x)\text{d}x\) ,假設其有解 \(y=\varphi(x)\) ,則代入得
\(g(\varphi(x))\varphi'(x)\text{d}x=f(x)\text{d}x\) ,由 \(y=\varphi(x)\) 引入 \(y\) ,則有 \(g(y)\text{d}y=f(x)\text{d}x\) ,兩邊積分得 \(\displaystyle \int g(y)\text{d}y=\int f(x)\text{d}x\) ,設對應得原函數分別為 \(G(y),F(x)\) ,則得到 \(G(y)=F(x)+C\) 。
這就是一階微分方程的隱式解,又由於其中含有一個任意常數,因此就叫做微分方程的隱式通解。
一階線性微分方程
方程 \(\displaystyle \frac{\text{d}y}{\text{d}x}+P(x)y=Q(x)\) 叫做一階線性微分方程。
注:一階是指對於 \(y,y'\) 是一次方程,也即 \(y'+Py-Q=0\)。
如果 \(Q(x)\equiv 0\) ,則稱為一階線性齊次微分方程。否則稱為非齊次微分方程。
齊次線性微分方程的解
齊次線性微分方程是可分離變量的,因此按照可分離變量的方程求解即可。
非齊次線性微分方程的解
先求對應的齊次線性微分方程的通解 \(y=f(x)\),再將其中的常數變易為未知函數 \(u(x)\) ,變易后將解代入非齊次線性微分方程,即可求得非齊次線性微分方程的通解。
示例:
\(\displaystyle \frac{\text{d}y}{\text{d}x}=-Py\) ,即 \(\displaystyle \frac{\text{d}y}{y}=-P\text{d}x\) ,\(\displaystyle \ln |y|=-\int P\text{d}x+C\) ,\(\displaystyle y=\pm e^{-\int P\text{d}x+C}=C'e^{-\int P\text{d}x}\)
進行常數變易,得到 \(\displaystyle y=ue^{-\int P\text{d}x}\) ,代入原方程,為 \(\displaystyle u'e^{-\int P\text{d}x}-uPe^{-\int P\text{d}x}+Pue^{-\int P\text{d}x}=Q\) ,剛好消掉 \(u\) 所在的項,得到 \(u'e^{-\int P\text{d}x}=Q\) ,此時即可用分離變量的方式求出 \(u\) ,也即就得到了非齊次線性微分方程的通解。
1.8.3 會解齊次微分方程、伯努利方程和全微分方程,會用簡單的變量代換解某些微分方程
齊次微分方程
如果一階微分方程可以化為 \(\displaystyle \frac{\text{d}y}{\text{d}x}=\varphi(\frac{y}{x})\) 的形式,那么就稱這方程為齊次微分方程。
注:這里的齊次是指每一項關於 \(x,y\) 的次數相等。
齊次微分方程的解法
取 \(\displaystyle u=\frac{y}{x}\) ,則有 \(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\text{d}(ux)}{\text{d}x}=u_xx+u=\varphi(u)\) ,
即 \(\displaystyle \frac{\text{d}u}{\varphi(u)-u}=\frac{\text{d}x}{x}\)
這樣就得到了一個可分離變量的微分方程。
伯努利方程
方程 \(\displaystyle \frac{\text{d}y}{\text{d}x}+P(x)y=Q(x)y^n\) 叫做伯努利方程。
當 \(n=0\) 時,為一階線性非齊次微分方程,當 \(n=1\) 時,為一階線性齊次微分方程,當 \(n\) 取其它值時,可以通過變量的代換化為線性方程。
\(\displaystyle y^{-n}\frac{\text{d}y}{\text{d}x}+Py^{1-n}=Q\)
由 \(\text{d}y^{1-n}=(1-n)y^{-n}\text{d}y\) ,得
\(\displaystyle \frac{1}{1-n}\frac{\text{d}y^{1-n}}{\text{d}x}+Py^{1-n}=Q\)
再用 \(u=y^{1-n}\) 進行替換,即轉換為一階線性非齊次微分方程。
全微分方程
如果一個微分方程能寫成左側是一個函數 \(u(x,y)\) 的全微分,右側為 \(0\) 的形式,那么該方程就稱作全微分方程。
記 \(\text{d}u(x,y)=P\text{d}x+Q\text{d}y=0\)
此時,有 \(u(x,y)=C\) ,這就是全微分方程的隱式方程。
1.8.4 會用降階法解下列形式的微分方程:\(y^{(n)}=f(x),y''=f(x,y')\) 和 \(y''=f(y,y')\)
\(y^{(n)}=f(x)\)
通過兩邊不斷積分的方式降階。
\(y''=f(x,y')\)
取 \(y'=p\) ,則 \(y''=p'\) ,方程變為 \(p'=f(x,p)\) ,為一階微分方程,可求其通解,再根據 \(y'=p\) 即可求得原方程的通解。
\(y''=f(y,y')\)
同樣取 \(y'=p\) ,則有 \(\displaystyle y''=\frac{\text{d}p}{\text{d}x}=\frac{\text{d}p}{\text{d}y}\cdot \frac{\text{d}y}{\text{d}x}=p\frac{\text{d}p}{\text{d}y}\) ,方程即為 \(\displaystyle p\frac{\text{d}p}{\text{d}y}=f(y,p)\) ,就是一個一階微分方程。
1.8.5 理解線性微分方程解的性質及解的結構
\(n\) 階線性微分方程的一般形式
\(y^{(n)}+a_1(x)y^{(n-1)}+...+a_{n-1}(x)y'+a_n(x)y=f(x)\)
當 \(f(x)\equiv 0\) 時,為 \(n\) 階齊次線性微分方程,否則為 \(n\) 階非齊次線性微分方程。
注:這里的齊次是指所有 \(y\) 項的次數都是 \(1\) (也即沒有常數項,不含 \(y\) 的項),所謂線性是指各階導數之間只有加減運算。
二階齊次線性微分方程的解的結構
記二階齊次線性微分方程的一般形式為
\(y''+P(x)y'+Q(x)y=0\)
若 \(y_1(x),y_2(x)\) 是二階齊次方程的解,則 \(y=C_1y_1(x)+C_2y_2(x)\) 也是二階齊次方程的解。
若 \(y_1(x),y_2(x)\) 是二階齊次方程的兩個線性無關的特解,則 \(y=C_1y_1(x)+C_2y_2(x)\) 就是方程的通解。
高階齊次線性方程的解的結構
記 \(n\) 階齊次線性齊次線性方程的一般形式為
\(y^{(n)}+a_1(x)y^{(n-1)}+...+a_{n-1}(x)y'+a_n(x)y=0\)
如果其有 \(y_1(x),y_2(x),...,y_n(x)\) 共 \(n\) 個線性無關的解,則此方程的通解為
\(y=C_1y_1(x)+C_2y_2(x)+...+C_ny_n(x)\)
二階非齊次線性微分方程的通解
二階齊次線性方程的通解和對應的非齊次線性方程的特解的和,是非齊次線性微分方程的通解。
理解:特解是非齊次方程的解,與通解作和仍是解,並且引入了兩個未知數,因此成為通解。
線性微分方程的疊加原理
若非齊次方程的右端是兩個函數之和,且兩個函數分別對應的非齊次方程有兩個特解,則這兩個特解之和構成原方程的一個特解。
注:這里所述的疊加原理是符合線性微分方程的一般形式的疊加原理。對於二階齊次線性微分方程,其解的結構也是一種疊加原理(常系數倍數的兩個特解之和仍然是方程的解)。
1.8.6 掌握二階常系數齊次線性微分方程的解法,並會解某些高於二階的常系數齊次線性微分方程
二階常系數齊次線性微分方程
如果二階齊次線性微分方程的系數均為常數,則為二階常系數齊次線性微分方程,即
\(y''+py'+qy=0\)
二階變系數齊次線性微分方程
如果二階齊次線性微分方程的系數不全為常數,則為二階變系數齊次線性微分方程。
二階常系數齊次線性微分方程的解法
使用 \(y=e^{rx}\) 帶入方程求解。
\(r^2e^{rx}+pre^{rx}+qe^{rx}=0\)
稱 \(r^2+pr+q=0\) 為特征方程。
特征方程有解 \(\displaystyle r_{1,2}=\frac{-p\pm \sqrt{p^2-4q}}{2}\)
倘若特征方程有兩個不相等的實根 \(r_1,r_2\) ,則二階常系數齊次線性微分方程有兩個解
\(y_1=e^{r_1x},y_2=e^{r_2x}\)
即有通解 \(y=C_1e^{r_1x}+C_2e^{r_2x}\)
倘若有兩個相等的實根 \(r\) ,則有一個解為 \(y=e^{rx}\) ,
再設另一個解為 \(y=u(x)e^{rx}\) ,則有
\(y'=u'e^{rx}+ure^{rx}=e^{rx}(u'+ur)\)
\(y''=re^{rx}(u'+ur)+e^{rx}(u''+u'r)=e^{rx}(u''+2u'r+ur^2)\)
代入得 \(e^{rx}(u''+2u'r+ur^2)+pe^{rx}(u'+ur)+que^{rx}=0\)
即 \(u''+u'(2r+p)+u(r^2+pr+q)=0\)
由於 \(\displaystyle r=-\frac{p}{2}\) ,則 \(u''=0\) ,
不妨取 \(u=x\) ,即另一個解為 \(y=xe^{rx}\) ,
此時有通解為 \(y=C_1e^{rx}+C_2xe^{rx}\)
倘若有兩個共軛復根 \(\alpha\pm \beta i\)
則兩個解為 \(y=e^{(\alpha\pm \beta i)x}=e^{\alpha x}\cdot e^{\pm \beta x i}=e^{\alpha x}(\cos \beta x\pm i\sin\beta x)\)
由疊加原理,將兩個解變換成實數形式,即有
\(\displaystyle y_1=\frac{1}{2}e^{\alpha x}(2\cos\beta x)=e^{\alpha x}\cos\beta x\)
\(\displaystyle y_2=\frac{1}{2i}e^{\alpha x}(2i\sin\beta x)=e^{\alpha x}\sin\beta x\)
即有通解 \(y=e^{\alpha x}(C_1\cos\beta x+C_2\sin\beta x)\)
高階常系數齊次線性微分方程的一般形式
\(y^{(n)}+p_1y^{(n-1)}+p_2y^{(n-2)}+...+p_{n-1}y'+p_ny=0\)
高階常系數齊次線性微分方程的解
同樣代入 \(y=e^{rx}\) ,則有
\(e^{rx}(r^n+p_1r^{n-1}+p_2r^{n-2}+...+p_{n-1}r+p_n)=0\)
\(r^n+p_1r^{n-1}+p_2r^{n-2}+...+p_{n-1}r+p_n=0\) 就是高階常系數齊次線性微分方程的特征方程
假設特征方程有單實根 \(r\) ,則解有一項 \(y=Ce^{rx}\)
假設有一對單復根 \(r=\alpha\pm \beta i\) ,則解有一項為 \(y=e^{\alpha x}(C_1\cos\beta x+C_2\sin \beta x)\)
假設有 \(k\) 重實根 \(r\) ,則有 \(k\) 項為 \(e^{rx}(C_1+C_2x+...+C_kx^{k-1})\)
假設有 \(k\) 重復根 \(r=\alpha\pm\beta i\) ,則有 \(2k\) 項為 \(e^{\alpha x}[(C_1+C_2x+...+C_kx^{k-1})\cos\beta x+(D_1+D_2x+...+D_kx^{k-1})\sin\beta x]\)
根據特征方程的解,得到方程的解的所有項,最后有方程的通解為 \(y=C_1y_1+C_2y_2+...+C_ny_n\)
1.8.7 會解自由項為多項式、指數函數、正弦函數余弦函數以及它們的和與積的二階常系數非齊次線性微分方程
由二階常系數非齊次線性方程組的解的結構可知,其通解即為對應的齊次常系數微分方程對應的通解和其一個特解的和。
利用待定系數法可以求出自由項為
\(f(x)=e^{\lambda x}P_m(x)=e^{\lambda x}(a_0x^m+a_1x^{m-1}+...+a_{m-1}x+a_m)\)
或
\(f(x)=e^{\lambda x}(P_l(x)\cos\omega x+Q_n(x)\sin\omega x)\)
時對應的非齊次方程的解。
\(f(x)=e^{\lambda x}P_m(x)\) 型
由於多項式與指數函數的乘積的導數仍然是多項式與指數函數的乘積,因此可以推測,\(y_A=e^{\lambda x}R(x)\) 是原方程的一個特解。
\(y_A'=e^{\lambda x}(\lambda R(x)+R'(x))\)
\(y_A''=e^{\lambda x}(\lambda^2R(x)+\lambda R'(x)+\lambda R'(x)+R''(x))=e^{\lambda x}(\lambda^2R(x)+2\lambda R'(x)+R''(x))\)
代入二階非齊次線性微分方程的一般形式得
\(\lambda^2R(x)+2\lambda R'(x)+R''(x)+p(\lambda R(x)+R'(x))+qR(x)=P_m(x)\)
化簡即得 \(R''(x)+(2\lambda +p)R'(x)+(\lambda^2+p\lambda +q)R(x)=P_m(x)\)
討論:
如果 \(\lambda\) 不是對應的二階齊次線性微分方程的特征方程的根,即 \(\lambda^2+p\lambda+q\not =0\) ,此時可以取 \(R(x)\) 為一個 \(m\) 次多項式,代入方程后,根據對應項系數相等,求得 \(R(x)\) 。
如果 \(\lambda\) 是對應的二階齊次線性微分方程的單根,即 \(\lambda^2+p\lambda+q =0\) ,且 \(\displaystyle \lambda\not =-\frac{p}{2}\) ,此時有 \(R''(x)+(2\lambda +p)R'(x)=P_m(x)\) ,即 \(R'(x)=R_m(x)\) ,不妨取 \(R(x)=xR_m(x)\) ,然后根據對應項系數相等求得 \(R(x)\) 。
如果 \(\lambda\) 是對應的二階齊次線性微分方程的重根,即 \(\lambda^2+p\lambda+q =0\) ,且 \(\displaystyle \lambda=-\frac{p}{2}\) ,此時有 \(R''(x)=P_m(x)\) ,即 \(R''(x)=R_m(x)\) ,此時不妨取 \(R(x)=x^2P_m(x)\) ,然后通過對應項系數相等求 \(R(x)\)
結論:
如果二階非齊次線性微分方程具有形式 \(y''+py'+qy=e^{\lambda x}P_m(x)\) ,則其有特解形如 \(y=x^kR_m(x)e^{\lambda x}\) ,其中 \(k\) 依對應的齊次方程的解可取 \(0,1,2\) 。
推廣:
如果對於 \(n\) 階常系數非齊次線性微分方程仍具有上述形式,則結論可以推廣,且 \(k\) 取特征方程含根 \(\lambda\) 的重復次數。
\(f(x)=e^{\lambda x}[P_l(x)\cos\omega x+Q_n(x)\sin\omega x]\) 型
由歐拉公式,有 \(\displaystyle \cos\theta=\frac{1}{2}(e^{i\theta}+e^{-i\theta}),\sin\theta=\frac{1}{2i}(e^{i\theta}-e^{-i\theta})\) ,
代入得 \(\displaystyle f(x)=e^{\lambda x}[P_l(x)\frac{e^{i\omega x}+e^{-i\omega x}}{2}+Q_n(x)\frac{e^{i\omega x}-e^{i\omega x}}{2i}]\)
\(\displaystyle =e^{\lambda x}[(\frac{P_l}{2}+\frac{Q_n}{2i})e^{i\omega x}+(\frac{P_l}{2}-\frac{Q_n}{2i})e^{-i\omega x}]\)
看作是兩項,則這兩項對應的多項式互成共軛(對應項的系數是共軛復數)。利用 \(f(x)=P_m(x)e^{\lambda x}\) 型二階非齊次線性微分方程的解法,求第一項對應的二階非齊次線性微分方程的解,記為 \(y=x^kR_me^{\lambda x+i\omega x}\) ,由於 \(\lambda+\omega i\) 只能是單根或不是根,因此 \(k\) 取 \(0,1\) ,同時由於共軛,因此解的共軛函數必然是第二項對應的非齊次方程的解,記為 \(y=x^k\overline{R}_me^{\lambda x-i\omega x}\) 。
由疊加原理,有 \(y=x^kR_me^{\lambda x+i\omega x}+x^k\overline{R}_me^{\lambda x-i\omega x}\) 是原非齊次二階線性微分方程的一個特解。
解的化簡:
\(\displaystyle y=x^ke^{\lambda x}(R_m e^{i\omega x}+\overline{R}_me^{-i\omega x})\)
\(=x^ke^{\lambda x}(R_m(\cos\omega x+i\sin\omega x)+\overline{R}_m(\cos\omega x-\sin\omega x))\)
括號內的兩項是互成共軛的,因此相加后和無虛部,即最終可以寫成
\(y=x^ke^{\lambda x}[A_m(x)\cos\omega x+B_m(x)\sin\omega x]\)
其中 \(m=\text{max}(l,n)\)
高階常系數非齊次線性微分方程
相應的 \(k\) 是特征方程中含根 \(\lambda+\omega i\) 或 \(\lambda-\omega i\) 的次數。
1.8.8 會解歐拉方程
歐拉方程
形如
\(x^ny^{(n)}+p_1x^{n-1}y^{(n-1)}+...+p_{n-1}xy'+p_ny=f(x)\)
的方程,叫做歐拉方程。
歐拉方程是一類特殊的變系數線性微分方程。歐拉方程可以通過變量替換的方式,化為常系數線性微分方程:
記 \(x=e^t, t=\ln x\) ,則有
\(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\text{d}y}{\text{d}t}\cdot\frac{\text{d}t}{\text{d}x}=\frac{1}{x}\frac{\text{d}y}{\text{d}t}=\frac{1}{x}D\)
\(\displaystyle \frac{\text{d}^2y}{\text{d}x^2}=\frac{1}{x^2}(\frac{\text{d}^2 y}{\text{d}t^2}-\frac{\text{d}y}{\text{d}t})=\frac{1}{x^2}D(D-1)\)
類似可推導
\(x^ky^{(k)}=D(D-1)...(D-k+1)\)
利用這個變形,就將歐拉方程變換為常系數線性微分方程。
1.8.9 會用微分方程解決一些簡單的應用問題
2 線性代數
2.1 行列式
2.1.1 了解行列式的概念,掌握行列式的性質
二階行列式
把 \(4\) 個數排列成二行二列的數表:
\(\begin{matrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{matrix}\)
表達式 \(a_{11}a_{22}-a_{12}a_{21}\) 稱為這個數表確定的二階行列式,並記作
\(\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}\)
注:行列式是一個數。
行列式的元素
數 \(a_{ij}\) 稱為行列式的元素或元,第一個下標稱為行標,第二個下標稱為列標。該元素稱為行列式的 \((i,j)\) 元。
全排列
把 \(n\) 個不同的元素排成一列,叫做這 \(n\) 個元素的全排列。
全排列也簡稱排列。
逆序
對於 \(n\) 個不同的元素,先規定一個標准次序,如果某一個排列中兩個元素的次序與標准次序不同,就稱這個排列有一個逆序。
逆序數
一個排列的逆序的總數叫做這個排列的逆序數。
有序排列的逆序數為 \(0\) 。
反序排列的逆序數為 \(\displaystyle \frac{n(n-1)}{2}\)
奇排列和偶排列
逆序數為奇數的排列稱為奇排列,為偶數的稱為偶排列。
逆序數的計算方法
從第二個元素開始,依次統計在該元素之前的元素中不滿足先后次序的元素數目並加和,就得到了這個排列的逆序數。
任意交換排列的相鄰兩個元素,排列的奇偶性改變。
任意交換排列的任意兩個元素,排列的奇偶性改變。
\(n\) 階行列式
設有 \(n^2\) 個數排列成 \(n\) 行 \(n\) 列的數表,
\(\begin{matrix}a_{11}& ... &a_{1n}\\...&...&...\\a_{n1}&...&a_{nn}\end{matrix}\)
記數表為 \(\{a_{ij}\}\) ,取 \(p_1,p_2,...,p_n\) 為自然數 \(1,2,...,n\) 的一個排列,\(t\) 為這個排列的逆序數,則所有共 \(n!\) 個排列形成的形如 \(\displaystyle (-1)^t \prod_{i=1}^n a_{ip_i}\) 的 \(n!\) 項的和 \(\displaystyle \sum (-1)^t \prod_{i=1}^n a_{ip_i}\) 稱為這個數表確定的 \(n\) 階行列式,記作
\(\begin{vmatrix}a_{11}& ... &a_{1n}\\...&...&...\\a_{n1}&...&a_{nn}\end{vmatrix}\)
考慮式子 \(V=(-1)^t\prod a_{ip_i}\) ,\(t\) 為第二坐標的排列的逆序數。若任意交換兩個元素的次序,則逆序數的奇偶性改變。以第一坐標為排列的逆序數是奇數,因此以第一坐標為排列和以第二坐標為排列得到的逆序數之和奇偶性是不變的。對於同一個排列,多次交換仍然如此,那么對於一個第一坐標有序的序列,其第一坐標的逆序數是 \(0\) ,第二坐標的逆序數是 \(t\) ,逆序數之和為 \(t\) ,經過多次交換得到一個第二坐標有序的序列,其第一坐標的逆序數是 \(s\) ,第二坐標的逆序數是 \(0\) ,逆序數之和為 \(s\) ,則有 \((-1)^t=(-1)^s\) ,也即 \(V\) 經過多次交換,得到了一個第二坐標有序的序列,其值不變。或者說 \((-1)^t\prod a_{ip_i}=(-1)^s\prod a_{q_i i}\) 。
也因此,行列式可以理解為按行取元素求積再求和,也可以理解為按列取元素求積再求和。
對角行列式
\(\begin{vmatrix}\lambda_1& ... &0\\...&...&...\\0&...&\lambda_n\end{vmatrix}=\prod \lambda_i\)
反對角行列式(自創名字)
\(\begin{vmatrix}0& ... &\lambda_1\\...&...&...\\\lambda_n&...&0\end{vmatrix}=(-1)^t\prod \lambda_i\)
\(\displaystyle t=\frac{n(n-1)}{2}\)
注:\(t\) 即為反序排列的逆序數
上(下)三角行列式
主對角線以上為 \(0\) 元素的行列式稱為下三角行列式。其值與對應的對角行列式相等。
行列式與其轉置行列式相等
直接由行列式的定義以及行列式按行求和按列求相等可證。
互換行列式的兩行,行列式變號
直接由定義式,每個項的逆序數都改變奇偶性,可證。
行列式的某一行中的所有元素數乘 \(k\) ,等於行列式直接數乘 \(k\) 。
直接由定義式可證。
行列式如果有兩行對應成比例,則此行列式等於零。
先將行列式的兩行通過 \(k\) 乘為等值的兩行,則兩行交換后行列式值不變,因此為零。
如果行列式中的某一行是兩個數之和,則這個行列式等於將這一行的兩個數分別分解到兩個行列式的和。
直接由定義可證。
這個性質說明行列式可以對某一行分解(也即可以把一個行列式的某一行拆分成兩部分,生成兩個子行列式)。
把行列式的某一行 \(k\) 數乘后加到另一行,行列式的值不變。
將加和后的行列式分解為兩個行列式之和,其中一個行列式的兩行對應成比例,即為 \(0\) ,因此值不變。
行列式的分塊
記 \(A_{mn}\) 為 \(n\) 列 \(m\) 行的數陣,\(\begin{vmatrix}A_{mn}\end{vmatrix}\) 為數陣對應的行列式,則有 \(\begin{vmatrix}A_{mm}&0_{mn}\\B_{nm}&C_{nn}\end{vmatrix}=|A_{mm}||C_{nn}|\)
推論:
\(\begin{vmatrix}0_{mn}&A_{mm}\\C_{nn}&B_{nm}\end{vmatrix}=(-1)^{t}|A_{mm}||C_{nn}|\) ,其中 \(t=\frac{n(n-1)}{2}\)
余子式
對於 \(n\) 階行列式划去元 \(a_{ij}\) 所在的行和列的所有元素,剩余的元素組成的 \(n-1\) 階行列式成為 \(a_{ij}\) 的余子式,記作 \(M_{ij}\) 。
代數余子式
記 \(A_{ij}=(-1)^{i+j}M_{ij}\) 為元 \(a_{ij}\) 的代數余子式。
注:余子式和代數余子式都是一個數。
定理:如果行列式 \(|A_{nn}|\) 的元 \(a_{ij}\) 所在行的其余元均為 \(0\) ,則有 \(|A_{nn}|=a_{ij}A_{ij}\) 。
證:
對元 \(a_{ij}\) ,通過相鄰行列交換的方式,將 \(a_{ij}\) 交換到第一個元,一共需要交換 \(i+j-2\) 次,交換之后的值為 \(a_{ij}M_{ij}\) ,也即有原來的值為 \(a_{ij}M_{ij}(-1)^{i+j-2}=a_{ij}A_{ij}\)
定理:\(\displaystyle |A_{nn}|=\sum_{i=1}^{n}a_{ki}A_{ki}\)
也即行列式可以表示為其某一行的所有元素與其對應的代數余子式之積的和。
證:
首先將行列式通過 \(n\) 次分解,分解為一行中只有一個非 \(0\) 元素的 \(n\) 個行列式,然后將這些行列式利用代數余子式表示出來即可。
推論:行列式的某一行的代數余子式與另一行的元素的乘積的和為 \(0\) 。
證:由定理,等值於將代數余子式所在的行替換為另一行得到的行列式的值(代數余子式和對應元素的值無關),而這個行列式的值為 \(0\) ,故得證。
定理反過來也可以理解為,將行列式的某一行替換為一組數,則對應的和式中的元素也替換為一組數。行列式的其它行的值不變,和式中的代數余子式的值不變。
克拉默法則
設有行列式 \(A_{nn}\) ,及其對應的矩陣 \(\boldsymbol{A}\) 和方程組
\(\boldsymbol{Ax}=\boldsymbol{b}\)
如果 \(A_{nn}\not =0\) ,則方程組有唯一解 \(\displaystyle x_i=\frac{A_i}{A}\)
其中 \(A_i\) 為將 \(\boldsymbol{b}\) 替換掉 \(A\) 中第 \(i\) 列后形成的行列式。
證:
\(\boldsymbol{Ax}=\boldsymbol{b}\) ,若 \(|\boldsymbol{A}|\not =0\) ,則存在逆矩陣 \(\boldsymbol{A}^{-1}\) ,即有 \(\displaystyle \boldsymbol{x}=\boldsymbol{A}^{-1}\boldsymbol{b}=\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^*\boldsymbol{b}\)
\(\displaystyle x_i=\sum_{k=1}^{n}\frac{1}{|\boldsymbol{A}|}A_{ki}b_k\) ,即得證。
2.1.2 會應用行列式的性質和行列式按行(列)展開定理計算行列式
2.2 矩陣
2.2.1 理解矩陣的概念,了解單位矩陣、數量矩陣、對角矩陣、三角矩陣、對稱矩陣和反對稱矩陣以及它們的性質
矩陣
由數構成的 \(m\) 行 \(n\) 列的數表稱為 \(m\) 行 \(n\) 列矩陣,簡稱 \(m\times n\) 矩陣。表示為
\(\boldsymbol{A}=\begin{pmatrix}a_{11}&...&a_{1n}\\...&...&...\\a_{m1}&...&a_{mn}\end{pmatrix}\)
注意 \(m\times n\) 的前后順序,行數在前,列數在后,或者說是高度在前,寬度在后。
\(n\) 階矩陣
行數與列數都等於 \(n\) 的矩陣稱為 \(n\) 階矩陣或 \(n\) 階方陣,記作 \(\boldsymbol{A}_n\)
行矩陣和列矩陣
只有一行的矩陣成為行矩陣,也稱為行向量。只有一列的矩陣成為列矩陣,也稱為列向量。
同型矩陣
兩個行數和列數都相等的矩陣稱為同型矩陣。
相等矩陣
兩個對應對應元素相等的同型矩陣是相等矩陣。
零矩陣
元素都是零的矩陣稱為零矩陣,記作 \(\boldsymbol{O}\)。
注:零矩陣不是唯一的。
線性變換
\(n\) 個變量 \(\boldsymbol{x}_n=(x_1,x_2,...,x_n)^T\) 與 \(m\) 個變量 \(\boldsymbol{y}_m=(y_1,y_2,...,y_m)^T\) 之間的關系式 \(\boldsymbol{y}_m=\boldsymbol{A}_{mn}\boldsymbol{x}_n\) 表示從變量 \(\boldsymbol{x}_n\) 到 \(\boldsymbol{y}_m\) 的線性變換,\(\boldsymbol{A}_{mn}\) 稱為系數矩陣。
主對角線
從左上角到右下角的直線
單位矩陣
主對角線元素為 \(1\) ,其余元素為 \(0\) 的方陣稱為單位矩陣,簡稱單位陣。
\(n\) 階單位矩陣記為 \(\boldsymbol{E}_n\)
單位陣作為系數矩陣時,對應的線性變換為恆等變換。
數量矩陣
記 \(\lambda \boldsymbol{E}\) 為數量矩陣(純量陣)。
和單位矩陣一樣,數量矩陣也不是唯一的。
對角矩陣
非主對角線上的元素都為 \(0\) 的方陣稱為對角矩陣。
2.2.2 掌握矩陣的線性運算、乘法、轉置以及它們的運算規律,了解方陣的冪與方陣乘積的行列式的性質
矩陣的加法
設有兩個 \(m\times n\) 矩陣 \(\boldsymbol{A}=(a_{ij})\) 和 \(\boldsymbol{B}=(b_{ij})\) ,則矩陣的和為 \(\boldsymbol{A}+\boldsymbol{B}=(a_{ij}+b_{ij})\)
負矩陣
記 \(-\boldsymbol{A}=(-a_{ij})\) 為矩陣 \(\boldsymbol{A}=(a_{ij})\) 的負矩陣
矩陣的減法
規定 \(\boldsymbol{A}-\boldsymbol{B}=\boldsymbol{A}+(-\boldsymbol{B})\) 為矩陣的減法
矩陣的 \(k\) 乘
數 \(\lambda\) 與矩陣 \(\boldsymbol{A}\) 的乘積記作 \(\lambda \boldsymbol{A}\) ,有 \(\lambda \boldsymbol{A}=(\lambda a_{ij})\)
矩陣的乘法
\(\boldsymbol{A}_{m\times s}\times \boldsymbol{B}_{s\times n}=\boldsymbol{C}_{m\times n}\)
\(\displaystyle c_{ij}=\sum_{k=1}^{s}a_{ik}b_{kj}\)
從形式上看,矩陣乘法依照先行后列的規則,也即第一個矩陣的行的長度等於第二個矩陣的列的長度,結果矩陣的元素所在的行與第一個矩陣的行所在的位置對應,所在的列與第二個矩陣的列所在的位置對應。
矩陣乘法的可交換性
若 \(n\) 階方陣 \(\boldsymbol{A}\) ,\(\boldsymbol{B}\) 滿足 \(\boldsymbol{AB}=\boldsymbol{BA}\) ,則稱 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 是可交換的。
\((\boldsymbol{AB})\boldsymbol{C}=\boldsymbol{A}(\boldsymbol{BC})\)
也即矩陣的乘法滿足結合律
證:記 \(\boldsymbol{A}=\boldsymbol{A}_{ab}=(a_{ij})\) ,\(\boldsymbol{B}=\boldsymbol{A}_{bc}=(b_{ij})\) ,\(\boldsymbol{C}=\boldsymbol{C}_{cd}=(c_{ij})\) ,
再記 \(\boldsymbol{AB}=\boldsymbol{M}_{ac}=(m_{ij})\) ,\(\boldsymbol{BC}=\boldsymbol{N}_{bd}=(n_{ij})\) ,則有
\(\displaystyle m_{ij}=\sum_{k=1}^{b}a_{ik}b_{kj}\) ,\(\displaystyle n_{ij}=\sum_{k=1}^{c}b_{ik}c_{kj}\) ,
再記 \(\boldsymbol{M}_{ac}\boldsymbol{C}_{cd}=\boldsymbol{P}_{ad}=(p_{ij})\) ,\(\boldsymbol{A}_{ab}\boldsymbol{N}_{bd}=\boldsymbol{Q}_{ad}=(q_{ij})\)
則有 \(\displaystyle p_{ij}=\sum_{t=1}^{c}m_{it}c_{tj}=\sum_{t=1}^{c}(\sum_{k=1}^{b}a_{ik}b_{kt})c_{tj}\) ,
\(\displaystyle q_{ij}=\sum_{t=1}^{b}a_{it}n_{tj}=\sum_{t=1}^{b}a_{it}(\sum_{k=1}^{c}b_{tk}c_{kj})\)
也即 \(p_{ij}=q_{ij}\)
\(\lambda (\boldsymbol{AB})=(\lambda \boldsymbol{A})\boldsymbol{B}=\boldsymbol{A}(\lambda \boldsymbol{B})\)
直接根據乘法的定義式,可得 \(\lambda\) 放在任意位置均可。
\(\boldsymbol{A}(\boldsymbol{B}+\boldsymbol{C})=\boldsymbol{AB}+\boldsymbol{AC}\)
即矩陣乘法滿足分配律
直接由定義式可得。
\(\boldsymbol{E}_m\boldsymbol{A}_{mn}=\boldsymbol{A}_{mn}\)
\(\boldsymbol{A}_{mn}\boldsymbol{E}_n=\boldsymbol{A}_{mn}\)
簡記為 \(\boldsymbol{EA}=\boldsymbol{AE}=\boldsymbol{A}\)
注:簡單記法中,\(\boldsymbol{E}\) 在不同位置時的含義並不一致。
推論:單位矩陣和方陣是可交換的
推論:數量矩陣和方陣是可交換的
矩陣的冪
對於 \(n\) 階方陣,定義 \(\boldsymbol{A}^1=\boldsymbol{A}\) ,\(\boldsymbol{A}^{k+1}=\boldsymbol{A}^{k}\boldsymbol{A}^1\)
矩陣的轉置
如果有矩陣 \(\boldsymbol{A}_{mn}=(a_{ij}),\boldsymbol{B}_{nm}=(b_{ij})\) ,滿足 \(a_{ij}=b_{ji}\) ,則記 \(\boldsymbol{B}\) 為 \(\boldsymbol{A}\) 的轉置矩陣,記為 \(\boldsymbol{B}=\boldsymbol{A}^{T}\)。
\((\boldsymbol{A}^T)^T=\boldsymbol{A}\)
即矩陣的轉置是可逆的。
\((\boldsymbol{A}+\boldsymbol{B})^T=\boldsymbol{A}^T+\boldsymbol{B}^T\)
\((\lambda \boldsymbol{A})^T=\lambda \boldsymbol{A}^T\)
\((\boldsymbol{AB})^T=\boldsymbol{B}^T\boldsymbol{A}^T\)
證:記 \(\boldsymbol{A}_{ab}\boldsymbol{B}_{bc}=\boldsymbol{M}_{ac}=(m_{ij})\) ,\(\displaystyle m_{ij}=\sum_{k=1}^b a_{ik}b_{kj}\) ,
\(\boldsymbol{M}^T_{ca}=(m'_{ij})\) ,則有 \(\displaystyle m'_{ij}=m_{ji}=\sum_{k=1}^b a_{jk}b_{ki}\) ,
記 \(\boldsymbol{B}^T_{cb}=(b'_{ij})\) ,\(\boldsymbol{A}^T_{ba}=(a'_{ij})\) ,有 \(b'_{ij}=b_{ji}\) ,\(a'_{ij}=a_{ji}\) ,
再記 \(\boldsymbol{B}^T\boldsymbol{A}^T=\boldsymbol{N}_{ca}=(n_{ij})\) ,則有 \(\displaystyle n_{ij}=\sum_{k=1}^b b'_{ik}a'_{kj}=\sum_{k=1}^b b_{ki}a_{jk}\) ,
即得證。
方陣的行列式
由 \(n\) 階方陣的數表構成的行列式,稱為方陣的行列式。對方陣 \(\boldsymbol{A}_n\) ,其行列式記作 \(|\boldsymbol{A}_n|\) 或 \(\text{det}\boldsymbol{A}_n\) 。(行列式單詞為 determinant)
\(|\boldsymbol{A}^T|=|\boldsymbol{A}|\)
由行列式按行取元素與按列取元素進行求積再求和相等可知。
\(|\lambda \boldsymbol{A}|=\lambda^n|\boldsymbol{A}|\)
由行列式的 \(k\) 乘為將某一行 \(k\) 乘的性質可知。
\(|\boldsymbol{AB}|=|\boldsymbol{A}||\boldsymbol{B}|\)
證明:
先構造 \(|\boldsymbol{A}||\boldsymbol{B}|\) ,即
\(|\boldsymbol{A}||\boldsymbol{B}|=\begin{vmatrix}\boldsymbol{A}&\boldsymbol{O}\\-\boldsymbol{E}&\boldsymbol{B}\end{vmatrix}\)
使用列運算,利用 \(-\boldsymbol{E}\) 消去 \(\boldsymbol{B}\) ,此時子矩陣 \(\boldsymbol{O}\) 變換為
\(\boldsymbol{O'}_n=(o'_{ij})\) ,\(\displaystyle o'_{ij}=\sum_{k=1}^n a_{ik}b_{kj}\) (一次消去一列),也即變換為
\(\begin{vmatrix}\boldsymbol{A}&\boldsymbol{AB}\\-\boldsymbol{E}&\boldsymbol{O}\end{vmatrix}\)
為可分塊的反對角行列式,值為 \((-1)^t |\boldsymbol{AB}||\boldsymbol{-E}|=(-1)^{\frac{2n(2n-1)}{2}}(-1)^n|\boldsymbol{AB}|=(-1)^{2n^2}|\boldsymbol{AB}|=|\boldsymbol{AB}|\)
即得證。
推論:對於方陣有 \(|\boldsymbol{AB}|=|\boldsymbol{BA}|\) ,盡管 \(\boldsymbol{AB}=\boldsymbol{BA}\) 不一定成立。
2.2.3 理解逆矩陣的概念,掌握逆矩陣的性質以及矩陣可逆的充分必要條件,理解伴隨矩陣的概念,會用伴隨矩陣求逆矩陣
伴隨矩陣
將矩陣 \(\boldsymbol{A}\) 的各個元素用其對應行列式的元素的代數余子式替代,得到 \(|\boldsymbol{A}'|=(A_{ij})\) ,稱 \(\boldsymbol{A^{'T}}\) 為矩陣 \(\boldsymbol{A}\) 的代數余子式,記為 \(\boldsymbol{A}^*\) ,有 \(\boldsymbol{A}^*=(A_{ij})^T\) ,簡稱伴隨陣。
注:只有方陣有伴隨矩陣。
\(\boldsymbol{A^*A}=\boldsymbol{AA^*}=|\boldsymbol{A}|\boldsymbol{E}\)
也即矩陣和其對應的伴隨陣的乘積是一個純量陣,元素的值為矩陣對應的行列式的值。
證:
記 \(\boldsymbol{B}=(b_{ij})=\boldsymbol{A}^*\) ,則有 \(b_{ij}=A_{ji}\) ,
再記 \(\boldsymbol{A}^*\boldsymbol{A}=\boldsymbol{C}=(c_{ij})\) ,則有 \(\displaystyle c_{ij}=\sum_{k=1}^n b_{ik}a_{kj}=\sum_{k=1}^{n} A_{ki}a_{kj}\) ,
若 \(i\not =j\) ,則有 \(c_{ij}=0\) ,若 \(i=j\) ,則 \(c_{ij}=|\boldsymbol{A}|\) ,即得證。
逆矩陣
對 \(n\) 階矩陣,若有 \(\boldsymbol{AB}=\boldsymbol{BA}=\boldsymbol{E}\) ,則稱 \(\boldsymbol{A}\) 是可逆的,並稱 \(\boldsymbol{B}\) 為 \(\boldsymbol{A}\) 的逆矩陣,記為 \(\boldsymbol{B}=\boldsymbol{A}^{-1}\)。
逆矩陣簡稱逆陣。
逆矩陣的唯一性
如果矩陣有逆矩陣,那么逆矩陣一定是唯一的。
證:假設 \(\boldsymbol{A}\) 有逆陣 \(\boldsymbol{B}\) 和 \(\boldsymbol{C}\) ,則有 \(\boldsymbol{B}=\boldsymbol{BAC}=\boldsymbol{C}\) ,故得證。
矩陣可逆的充要條件
方陣 \(\boldsymbol{A}\) 可逆 \(\Leftrightarrow\) \(|\boldsymbol{A}|\not =0\)
推論:單位矩陣一定是可逆矩陣。
逆矩陣的求法
若方陣 \(\boldsymbol{A}\) 存在逆矩陣 \(\boldsymbol{B}\),則 \(\boldsymbol{AB}=\boldsymbol{E}\) ,兩邊左側同乘 \(\boldsymbol{A}^*\) ,即有 \(|\boldsymbol{A}|\boldsymbol{B}=\boldsymbol{A}^*\) ,即 \(\displaystyle \boldsymbol{B}=\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^*\) ,\(|\boldsymbol{A}|\not =0\)
該求法可逆,因此矩陣可逆的充要條件可證。
奇異矩陣和非奇異矩陣
若 \(|\boldsymbol{A}|=0\) 則稱 \(|\boldsymbol{A}|\) 為奇異矩陣,否則稱為非奇異矩陣。可逆矩陣因此就是非奇異矩陣。
2.2.4 理解矩陣初等變換的概念,了解初等矩陣的性質和矩陣等價的概念,理解矩陣的秩的概念,掌握用初等變換求矩陣的秩和逆矩陣的方法
初等行變換
定義對矩陣的行作以下三種變換
(1)對調兩行
(2)\(k\) 乘某一行並替換該行
(3)\(k\) 乘某一行並加到另一行
為矩陣的初等行變換。
稱初等行變換和初等列變換為初等變換。
行等價、列等價、等價
如果一個矩陣可以通過有限次初等行變換變成另一個矩陣,則稱這兩個矩陣行等價。
如果一個矩陣可以通過有限次初等變換變成另一個矩陣,則稱這兩個矩陣等價。
矩陣的等價關系具有自反性、對稱性和傳遞性。
矩陣和矩陣之間的等價關系可以類比離散數學中二元關系的等價關系。
所有和某個矩陣等價的矩陣構成了這個矩陣的等價類。
初等矩陣
將單位矩陣進行一次初等變換后得到的矩陣稱為初等矩陣。
推論:初等矩陣一定是可逆矩陣。
使用行對調得到的初等矩陣在另一矩陣左側相乘,由於右側矩陣的每一列的同一位置與被交換的元素相乘,因此相當於對右側矩陣進行行對調。
使用行對調得到的初等矩陣在另一矩陣右側相乘,由於左側矩陣的每一行的同一位置與被交換的元素相乘,因此相當於對左側矩陣進行列對調。
結論:使用初等矩陣在另一矩陣左側相乘,相當於進行一次初等行變換;使用初等矩陣在另一矩陣右側相乘,相當於進行一次初等列變換。
推論:初等矩陣一定可逆。
推論:初等變換一定可逆。注:這里的可逆是指能變換過去,也能變換回來。
推論:可逆矩陣一定能表示為有限次的初等變換。
推論:有限次的初等變換一定可逆。
推論:\(\boldsymbol{PA}=\boldsymbol{B},|\boldsymbol{P}|\not = 0\) \(\Leftrightarrow\) \(\boldsymbol{A}\overset{r}{\sim}\boldsymbol{B}\)
推論:\(\boldsymbol{AQ}=\boldsymbol{B},|\boldsymbol{Q}|\not = 0\) \(\Leftrightarrow\) \(\boldsymbol{A}\overset{c}{\sim}\boldsymbol{B}\)
推論:\(\boldsymbol{PAQ}=\boldsymbol{B},|\boldsymbol{P}|\not = 0,|\boldsymbol{Q}|\not = 0\Leftrightarrow \boldsymbol{A}\sim\boldsymbol{B}\)
也即,如果存在一個可逆矩陣在左側和矩陣相乘能得到另一個矩陣,則這兩個矩陣行等價。
注:這里要求變換矩陣必須可逆,因為行變換是初等變換,而初等變換可以看作是初等矩陣的連續疊加乘法,初等矩陣一定是可逆的。
推論:\(\boldsymbol{A}\) 可逆 \(\Leftrightarrow\) \(|\boldsymbol{A}|\not =0\) \(\Leftrightarrow\) \(\boldsymbol{A}\overset{r}{\sim}\boldsymbol{E}\)
證:可逆,則存在可逆矩陣乘積為 \(\boldsymbol{E}\) ,也即有限次初等行變換可以得到 \(\boldsymbol{E}\)。
相反亦可證。
通過初等行(列)變換求變換矩陣的一種方法
如,如何求 \(\boldsymbol{P}\) ,使 \(\boldsymbol{PA}=\boldsymbol{B}\) ?
方法:由於在矩陣左側乘一個矩陣,等價於對矩陣進行有限次確定的初等變換,因此同時對 \(\boldsymbol{A},\boldsymbol{E}\) 進行變換,則有 \(\boldsymbol{P}(\boldsymbol{A},\boldsymbol{E})=(\boldsymbol{B},\boldsymbol{P})\) ,也即 \((\boldsymbol{A},\boldsymbol{E})\overset{r}{\sim}(\boldsymbol{B},\boldsymbol{P})\)。
如果 \(\boldsymbol{B}\) 為單位矩陣,則這種方法就可以通過初等行變換的方法求逆矩陣。
\(k\) 階子式
從矩陣中任取 \(k\) 行和 \(k\) 列,稱這些行列的交叉處的元素按其相對位置構成的數陣對應的行列式為矩陣的一個 \(k\) 階子式。
注:\(k\) 階子式是行列式。
矩陣的秩的一種定義(最大非零子式的階)
如果矩陣存在 \(k\) 階子式不為 \(0\) ,且所有 \(k+1\) 階子式為 \(0\) ,則稱矩陣的秩為 \(k\) 。如果矩陣的最大階子式不為 \(0\) ,則矩陣的秩即為最大階子式的階數。規定零矩陣的秩為 \(0\) (這是因為定義沒有給出 \(0\) 階矩陣的定義)。
注:所有非零矩陣的秩不為必不為 \(0\) ,因為其總存在一個非 \(0\) 元素,構成了一個非 \(0\) 的 \(1\) 階子式。
初等變換不改變矩陣的秩
理解:對於行列式,初等變換不影響行列式是否為零值(行列式為零,則變換后仍為零,行列式不為零,則變換后仍不為零),也即矩陣的最大非零子式在初等變換后仍為最大非零子式,因此初等變換不改變矩陣的秩。
推論:矩陣相似,則秩相等。
行階梯形矩陣 行最簡形矩陣
行階梯形矩陣和行最簡形矩陣,這里以行變換的方式來闡述:
通過初等行變換(交換,\(k\) 乘,\(k\) 加),可以將第一列的第一行以外的元素全部消去,對第二列,將矩陣看作除去第一行和第一列后的一個子矩陣,同樣通過行變換可以消去這個子矩陣的第一列的第一行以外的元素。消去過程中,由於對子矩陣進行行變換時,不會影響上層矩陣的零元素,因此最終一定可以將矩陣消去稱為一個階梯形(如果每一個子矩陣的第一列第一行的元素都不為零,則階梯的步長為 \(1\),否則步長大於 \(1\))。稱這樣的矩陣為行階梯形矩陣。
注:如果(子)矩陣中第一列全部為零,則略過這一列(取子矩陣時,只消去第一列,不再消去第一行)。
由於上述得到行階梯矩陣的方法是可以歸納的,因此任何一個矩陣總可以得到對應的行階梯矩陣。
在行階梯形矩陣的基礎上,利用每一行的第一個非零元素,依次消去這一列的上側的非零元素,由於所在行的左側元素都為零元素,因此不影響已經被消去的列的性質。這樣得到的矩陣稱為行最簡形矩陣。
任何矩陣總可經過初等變換化為標准形 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{O}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) ,且 \(r\) 就是這個矩陣的秩。
證明:將矩陣通過行變換得到行最簡形矩陣,然后將每一行的第一個非零元素所在的列通過相鄰交換按原有順序排列到矩陣的左側,這樣就得到了 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{M}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) 形式的矩陣。再通過初等列變換,可以將 \(\boldsymbol{M}\) 全部消去,此時矩陣的秩就是最小的非零子式 \(|\boldsymbol{E}_r|\) 的階,故得證。
2.2.5 了解分塊矩陣及其運算
矩陣分塊法
矩陣分塊法是指在計算階數較高的矩陣時,將矩陣划分為階數較低的多個子塊,稱這些子塊為分塊矩陣。將矩陣分塊后,可以將矩陣的分塊看作矩陣的基本元素(數)進行運算。
設矩陣分塊為 \(\boldsymbol{A}=(\boldsymbol{A}_{ij})\) ,\(\boldsymbol{B}=(\boldsymbol{B}_{ij})\) ,則
\(\boldsymbol{A}+\boldsymbol{B}=(\boldsymbol{A}_{ij}+\boldsymbol{B}_{ij})\)
\(\lambda \boldsymbol{A}=(\lambda \boldsymbol{A}_{ij})\)
\(\displaystyle \boldsymbol{A}_{ab}\boldsymbol{B}_{bc}=(\boldsymbol{C}_{ij})\) ,\(\boldsymbol{C}_{ij}=\sum_{k=1}^{b}\boldsymbol{A}_{ik}\boldsymbol{B}_{kj}\) ,其中 \(\boldsymbol{A}\) 被分塊為 \(a\) 行 \(b\) 列,\(\boldsymbol{B}\) 被分塊為 \(b\) 行 \(c\) 列。
2.3 向量
2.3.1 理解 \(n\) 維向量、向量的線性組合與線性表示的概念
向量
\(n\) 個有次序的數 \(a_1,a_2,...,a_n\) 組成的數組稱為 \(n\) 維向量,其中第 \(i\) 個數稱為第 \(i\) 個分量。
記列向量為 \(\boldsymbol{a}\) ,即 \(\boldsymbol{a}=\begin{pmatrix}a_1\\a_2\\...\\a_n\end{pmatrix}\) ,行向量相應記為 \(\boldsymbol{a}^T\) 。
規定列向量和行向量均按矩陣的運算規則進行計算,因此列向量和行向量是不同的向量。
向量組
若干個同維列向量(或行向量)組成的集合叫做向量組。
向量的線性組合
給定向量組 \(A:(\boldsymbol{a}_i)\) ,對於一組實數 \((k_i)\) ,表達式 \(\displaystyle \sum k_i\boldsymbol{a}_i\) 稱為向量組 \(A\) 的一個線性組合,\((k_i)\) 稱為這個線性組合的系數。
線性表示
如果向量 \(\boldsymbol{b}\) 能由向量組 \(A=(\boldsymbol{a}_i)\) 的一個線性組合 \(\displaystyle \sum k_i\boldsymbol{a}_i\) 表示,即 \(\displaystyle \boldsymbol{b}=\sum k_i\boldsymbol{a}_i\) ,則稱向量 \(\boldsymbol{b}\) 能由向量組 \(A\) 線性表示。
注:注意區分線性表示和線性相關、線性無關的概念。
線性表示的充要條件
向量 \(\boldsymbol{b}\) 能由 \(A=(\boldsymbol{a}_i)\) 線性表示的充要條件是 \(R(A)=R(A,\boldsymbol{b})\)
證:
由線性表示,則對應的線性方程組有解,即得證。
2.3.2 理解向量組線性相關、線性無關的概念,掌握向量組線性相關、線性無關的有關性質及判別法
線性相關
對於向量組的一個線性組合,若存在一組不全為 \(0\) 的系數使線性組合為 \(\boldsymbol{0}\) ,則稱向量組線性相關。若不存在這樣一組系數,則稱為線性無關。
注:注意區分零向量和零矩陣的表示方法。零矩陣表示為字母 \(\boldsymbol{O}\) 。
理解:系數不全為 \(0\) ,則可以將某個非 \(0\) 的系數消去(為系數 \(1\)),也即這個系數對應的向量能被其它向量線性表示。也即如果向量組線性相關,則至少存在一個向量能被其它向量線性表示。如果線性無關,則所有向量都不能被其它向量線性表示。
向量組線性無關的充要條件
向量組線性相關的充要條件是向量組構成的矩陣的秩小於向量組中向量的個數。
向量組線性無關的充要條件是向量組構成的矩陣的秩等於向量組中向量的個數。
證:
以向量組構成的矩陣構成線性方程組 \(\boldsymbol{Ax}=\boldsymbol{0}\) ,則線性無關等價於存在非零解,也即矩陣的秩小於元的數目。
思考:為何這里只用考慮矩陣的列數(矩陣的秩和向量的個數進行比較)?
理解:向量組對應的矩陣其秩的最大值就是向量的個數。因此若矩陣的秩等於向量組的個數,實際上就是矩陣的秩等於矩陣的最小邊長,也即此時矩陣的秩為同型矩陣的秩的最大值。
推論:
對 \(\boldsymbol{P}=(\boldsymbol{p}_i)\) ,則 \(p_i\) 對應的向量組線性無關,等價於 \(\boldsymbol{P}\) 可逆,等價於 \(|\boldsymbol{P}|\not=0\)
設向量組 \(A:\boldsymbol{a}_1,\boldsymbol{a}_2,...,\boldsymbol{a}_m\) 線性無關,向量組 \(B:\boldsymbol{a}_1,\boldsymbol{a}_2,...,\boldsymbol{a}_m,\boldsymbol{b}\) 線性相關,則向量 \(\boldsymbol{b}\) 必能由向量組 \(A\) 線性表示,且表示式是唯一的。
證:直接構造線性方程組 \(\boldsymbol{Ax}=\boldsymbol{b}\) ,由線性相關的說明,知 \(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})=m\) ,有線性方程組有唯一解。
2.3.3 理解向量組的極大線性無關組和向量組的秩的概念,會求向量組的極大線性無關組及秩
向量組的極大線性無關向量組
對於向量組,若其中能選出 \(r\) 個向量滿足向量無關,並且任意 \(r+1\) 個向量都線性相關,則這 \(r\) 個向量就是向量組的一個極大線性無關向量組。如果向量組本身就是線性無關的,那么向量組本身就是一個極大線性無關向量組。
向量組的極大線性無關組的向量的個數稱為向量組的秩。
若向量組中存在一個部分組,滿足線性無關,且向量組中的所有其它向量均能由這個部分組線性表示,則這個部分組就是向量組的一個極大線性無關組。
也即求向量組的極大無關組,可以分別選擇向量組中的向量到一個部分組中,保持部分組的線性無關性,直到所有向量都被檢查一遍。
證:
由線性表示,則有被表示的向量不影響部分組的秩,也即整個向量組的秩即為部分組的秩,也即任選超過部分組中的向量,其秩為部分組的向量的個數,即線性相關。參考極大線性無關組的定義,即得證。
2.3.4 理解向量組等價的概念,理解矩陣的秩與其行(列)向量組的秩之間的關系
向量組等價
若一個向量組中的所有向量都能由另一個向量組線性表示,則稱這個向量組能由另一個向量組線性表示。如果兩個向量組能相互線性表示,則稱這兩個向量組等價。
矩陣的秩等於它的列向量組的秩,也等於它的行向量組的秩。
也即求一個向量組的秩,可以轉化為求向量組對應的矩陣的秩。
證:
假設矩陣有秩 \(r\) ,且有 \(r\) 階非零子式,則這個非零子式所在列構成的矩陣的秩為 \(r\) ,因此這些列構成的矩陣對應的列向量線性無關,由向量組的秩的定義,即向量組的秩最小為 \(r\) 。任取 \(r+1\) 階子式,必為 \(0\) ,也即這些列構成的矩陣對應的列向量線性相關,也即列向量的秩必然小於 \(r+1\) 。得證。
2.3.5 了解 \(n\) 維向量空間、子空間、基底、維數、坐標等概念
向量空間
對於 \(n\) 維向量的非空集合,若其對向量的加和數乘運算封閉,則稱這個集合為向量空間。
注:某個向量空間的元素都是同維的。
注:向量空間的元素的維數是向量空間的維數的最大值(向量空間的維數不可能超過其元素的維數)。
向量組生成向量空間
一般的,由向量組 \(A=(\boldsymbol{a_i})\) 生成的向量空間為
\(\displaystyle L=\{\boldsymbol{x}=\sum \lambda_i\boldsymbol{a}_i\}\)
證:只需要證明這個集合對加賀數乘運算封閉即可。
齊次線性方程組的解集是一個向量空間
證:
對於線性方程組 \(\boldsymbol{Ax}=\boldsymbol{0}\) ,對於任意解,對其進行加運算和數乘運算,得到的結果仍然是線性方程組的解,也即解集滿足向量空間的定義。
齊次線性方程組的解集稱為解空間。
若兩個向量組等價,則這兩個向量組生成的向量空間相等
證:
由於等價,第一個向量組中的任一向量均能由第二個向量組線性表示,同樣第一個向量組的線性組合均能由第二個向量組線性表示,也即第一個向量組生成的向量空間中的任一元素均在第二個向量組生成的向量空間中,同理有第二個向量組的任一元素均在第一個向量組生成的生成的向量空間中,因此兩個向量空間相等。
子空間
若第一個向量空間中的任一向量均在第二個向量空間中,則第一個向量空間是第二個向量空間的子空間。
向量空間的基,維
對於向量空間,若有一組線性無關的向量,滿足向量空間中的任一向量都能被這組向量線性表示,則稱這一組向量是這個向量空間的一個基,這組向量中向量的個數成為向量空間的維數。記維數為 \(r\) ,則稱為 \(r\) 維向量空間。
注:\(r\) 維空間不是唯一的。
證明:
舉一個反例即可。記一組線性無關的向量組對應的矩陣 \(\begin{pmatrix}\boldsymbol{a}^T\\\boldsymbol{E}\end{pmatrix}\) ,\(\boldsymbol{a}^T=(a,a,...,a)\) , \(a\) 為常數,\(\boldsymbol{E}\) 為 \(r\) 階矩陣,則當 \(a\) 取不同的值時,分別對應不同的 \(r\) 維向量空間。即得證。
注:向量空間的維數為 \(r\) ,向量空間的向量的維數可能大於 \(r\) 。
記 \(n\) 維向量的集合 \(\Reals^n\) 。
推論:\(\Reals^n\) 為 \(n\) 維向量空間。
向量空間的基不唯一。
假設向量空間有基 \(A=(\boldsymbol{a}_i)\) ,則新的一組向量 \(B=(\lambda_i\boldsymbol{a}_i),\lambda_i\not =0\) 同樣也滿足基的條件。
自然基
如果基是一組單位坐標向量,則這一組基成為自然基。
坐標
向量空間中的某一個向量被基線性表示時,和基的順序一一對應的系數構成的數組稱為這個向量的坐標。
對於一個向量空間的一個基,其中任意向量的坐標都是唯一的
證:
記這個向量為 \(\boldsymbol{a}\) ,基為 \(B=(\boldsymbol{b}_i)\) ,有兩個坐標 \((\lambda_i),(\omega_i)\) 同時表示這一個向量,即 \(\displaystyle \boldsymbol{a}=\sum \lambda_i \boldsymbol{b_i}=\sum \omega_i \boldsymbol{b}_i\) ,即 \(\displaystyle \sum (\lambda_i-\omega_i)\boldsymbol{b_i}=\boldsymbol{0}\) 。由於 \((\boldsymbol{b}_i)\) 線性無關,因此不存在一組全不為零的系數使該式成立,也即所有的系數均為零,即 \(\lambda_i=\omega_i\) ,也即這兩個坐標一定相等。
2.3.6 了解基變換和坐標變換公式,會求過渡矩陣
基變換公式
設 \(\Reals^n\) 有兩組基 \((\boldsymbol{a}_i)\) ,\((\boldsymbol{b}_i)\) ,用 一組基表示另一組基的表示式就是基變換公式。
求法:
不妨記 \(\boldsymbol{A}=(\boldsymbol{a}_i)\) ,\(\boldsymbol{B}=(\boldsymbol{b}_i)\) ,取 \(\boldsymbol{B}=\boldsymbol{AP}\) ,即 \(\boldsymbol{P}=\boldsymbol{A}^{-1}\boldsymbol{B}\) ,其中 \(\boldsymbol{P}\) 就是基變換公式對應的過渡矩陣。
坐標變換公式
向量對應兩組基的坐標之間的變換公式稱為坐標變換公式。
求法:
記 \(\displaystyle \boldsymbol{x}=\sum \lambda_i\boldsymbol{a}_i=\sum \omega_i\boldsymbol{b}_i\) ,將其轉換為矩陣形式,即 \(\boldsymbol{x}=(\boldsymbol{a}_i)\begin{pmatrix}\lambda_1\\\lambda_2\\...\\\lambda_n\end{pmatrix}=(\boldsymbol{b}_i)\begin{pmatrix}\omega_1\\\omega_2\\...\\\omega_n\end{pmatrix}\) ,記為 \(\boldsymbol{A\lambda}=\boldsymbol{B\omega}\) ,故 \(\boldsymbol{\omega}=\boldsymbol{B}^{-1}\boldsymbol{A\lambda}=\boldsymbol{P}^{-1}\boldsymbol{\lambda}\) 。
也即基變換矩陣的逆矩陣就是坐標變換的逆矩陣。
2.3.7 了解內積的概念,掌握線性無關向量組正交規范化的施密特方法
向量的內積
有兩個 \(n\) 維向量 \(\boldsymbol{x}=(x_i), \boldsymbol{y}=(y_i)\) ,取 \(\displaystyle [\boldsymbol{x},\boldsymbol{y}]=\sum x_iy_i\) ,稱 \([\boldsymbol{x},\boldsymbol{y}]\) 為向量的內積。
注:線性代數中的內積,就是高等數學中向量的數量積。
推論:
\([\boldsymbol{a},\boldsymbol{b}]=[\boldsymbol{b},\boldsymbol{a}]\)
向量的長度
取 \(||\boldsymbol{x}||=\sqrt{[\boldsymbol{x},\boldsymbol{x}]}\) ,稱 \(||\boldsymbol{x}||\) 為向量的長度。
推論:\([\boldsymbol{x},\boldsymbol{x}]=||\boldsymbol{x}||^2\)
向量的夾角
取 \([\boldsymbol{x},\boldsymbol{y}]=||\boldsymbol{x}||||\boldsymbol{y}||\cos \theta\) ,\(\theta\in [0,\pi]\) ,稱 \(\theta\) 為向量的夾角。
向量正交
若兩個向量的內積為 \(0\) ,則稱這兩個向量正交。
在幾何中,向量正交即向量相互垂直。
單位向量
長度為 \(1\) 的向量稱為單位向量。
推論:與向量 \(\boldsymbol{a}\) 同向的單位向量為 \(\displaystyle \frac{1}{||\boldsymbol{a}||}\boldsymbol{a}=\frac{\boldsymbol{a}}{\sqrt{[\boldsymbol{a},\boldsymbol{a}]}}\)
投影向量
幾何定義:設有向量 \(\boldsymbol{a},\boldsymbol{b}\) ,通過平移將起點移動至同一點 \(O\) ,得到 \(\overrightarrow{OA},\overrightarrow{OB}\) 。設 \(\overrightarrow{OB}\) 在 \(\overrightarrow{OA}\) 上的投影點為 \(C\) ,則稱向量 \(\overrightarrow {OC}\) 為 \(\boldsymbol{b}\) 在 \(\boldsymbol{a}\) 上的投影向量。
由於 \(|\overrightarrow {OC}|=\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}\) ,故投影向量即為投影與投影軸的單位向量的乘積。
注:高等數學中,向量的投影是一個數。
計算:記 \(\boldsymbol{b}\) 在 \(\boldsymbol{a}\) 上的投影向量為 \(\boldsymbol{c}\) ,則 \(\displaystyle \boldsymbol{c}=||\boldsymbol{b}||\cos\theta \frac{\boldsymbol{a}}{||\boldsymbol{a}||}=\frac{[\boldsymbol{a},\boldsymbol{b}]}{||\boldsymbol{a}||^2}\boldsymbol{a}=\frac{[\boldsymbol{a},\boldsymbol{b}]}{[\boldsymbol{a},\boldsymbol{a}]}\boldsymbol{a}\)
正交向量組
若向量組中的向量兩兩正交,則向量組稱為正交向量組。
也即 \(\forall i\not =j, [\boldsymbol{a}_i,\boldsymbol{a}_j]=0,\)
正交向量組線性無關
證明:
不妨假設正交向量組線性相關,即存在非全零的系數使得 \(\displaystyle \sum \lambda_i \boldsymbol{a}_i=\boldsymbol{0}\) ,等式兩邊左側乘以 \(\boldsymbol{a_t}^T\) ,由於正交,故 \(\boldsymbol{a}_t^T\boldsymbol{a}_i=[\boldsymbol{a}_t,\boldsymbol{a}_i]\) ,當 \(t=i\) 時為 \(||\boldsymbol{a}_t||^2\) ,當 \(t\not =i\) 時為 \(0\) ,也即 \(\lambda_t ||\boldsymbol{a}_t||^2=0\) ,故 \(\lambda_t=0\) 。
類似可得,所有系數必為 \(0\) ,也即不存在這樣一組非零的系數,也即向量組線性無關。
規范正交基
如果一組向量是向量空間的一個基,如果這組向量兩兩正交,並且都是單位向量,則稱這個基為這個向量空間的一個規范正交基。
規范正交基下的坐標
設某向量用規范正交基表示為 \(\displaystyle \boldsymbol{a}=\sum \lambda_i\boldsymbol{e}_i\) ,等式兩邊左側同乘 \(\boldsymbol{e}_t\) ,即有 \(\lambda_t=[\boldsymbol{a}, \boldsymbol{e}_t]\) 。
注:顯然,在規范正交基下,很容求某一個向量的坐標。
規范正交化
已知向量空間的一個基,去求這個向量空間的一個規范正交基,也即求一個等價的規范正交基。這個過程就是規范正交化的過程。
施密特規范正交化
先根據給定基求正交基:
首先將所有向量的起點移動到同一點。
以三維空間為例,選定第一個向量,作為第一個結果向量;選定第二個向量,作這個向量在第一個結果向量上的投影向量,用第二個向量減去這個投影向量,則得到第二個結果向量;選定第三個向量,分別作這個向量在第一個結果向量和第二個結果向量的投影向量,用第三個向量減去這兩個投影向量,即得到第三個結果向量;
對於高於三維的向量,也用這個方法進行推廣。
得到了正交基之后,將這些基進行規范化,即得到規范正交基。
正交基計算公式:
\(\boldsymbol{b}_1=\boldsymbol{a}_1\)
\(\displaystyle \boldsymbol{b}_2=\boldsymbol{a}_2-\frac{[\boldsymbol{a}_2,\boldsymbol{b}_1]}{[\boldsymbol{b}_1,\boldsymbol{b}_1]}\boldsymbol{b}_1\)
\(\displaystyle \boldsymbol{b}_3=\boldsymbol{a}_3-\frac{[\boldsymbol{a}_3,\boldsymbol{b}_1]}{[\boldsymbol{b}_1,\boldsymbol{b}_1]}\boldsymbol{b}_1-\frac{[\boldsymbol{a}_3,\boldsymbol{b}_2]}{[\boldsymbol{b}_2,\boldsymbol{b}_2]}\boldsymbol{b}_2\)
依次類推。
\(\displaystyle \boldsymbol{b}_r=\boldsymbol{b}_r-\sum_{k=1}^{r-1}\frac{[\boldsymbol{a}_r,\boldsymbol{b}_k]}{[\boldsymbol{b}_k,\boldsymbol{b}_k]}\boldsymbol{b}_k\)
2.3.8 了解規范正交基、正交矩陣的概念以及它們的性質
正交矩陣
若 \(n\) 階矩陣 \(\boldsymbol{A}\) 滿足 \(\boldsymbol{A}^T\boldsymbol{A}=\boldsymbol{E}\) ,則稱 \(\boldsymbol{A}\) 為正交矩陣,簡稱正交陣。
正交陣可逆,且其逆矩陣是其本身
證:\(|\boldsymbol{A}^T\boldsymbol{A}|=|\boldsymbol{E}|\) ,即 \(|\boldsymbol{A}|\not =0\) ,即可逆。
兩個正交陣的乘積也是正交陣
證:\((\boldsymbol{AB})^T(\boldsymbol{AB})=\boldsymbol{B}^T\boldsymbol{A}^T\boldsymbol{AB}=\boldsymbol{E}\) ,即得證。
正交變換不改變向量的長度
記變換為 \(\boldsymbol{y}=\boldsymbol{Px}\) ,則 \(||\boldsymbol{y}||=||\boldsymbol{Px}||=\sqrt{(\boldsymbol{Px})^T(\boldsymbol{Px})}=\sqrt{\boldsymbol{x}^T\boldsymbol{P}^T\boldsymbol{Px}}=||\boldsymbol{x}||\) ,因此得證。
正交矩陣與列向量
設 \(\boldsymbol{A}\) 為正交矩陣,記 \(\boldsymbol{A}=(\boldsymbol{a}_1,\boldsymbol{a}_2,...,\boldsymbol{a}_n)\) ,則 \(\boldsymbol{A}^T=\begin{pmatrix}\boldsymbol{a}_1^T\\\boldsymbol{a}_2^T\\...\\\boldsymbol{a}_n^T\end{pmatrix}\) ,則 \(\boldsymbol{A}^T\boldsymbol{A}=(c_{ij})\) , \(c_{ij}=(\boldsymbol{a}_i^T\boldsymbol{a}_j)\) ,由正交矩陣定義,有 \(c_{ij}=\begin{cases}0,&i\not =j\\1,&i=j\end{cases}\) ,因此有正交矩陣的一個充分必要條件即所有列向量都是單位向量且兩兩正交。
注:正交矩陣的等價條件是列向量兩兩正交,因此定義式中的順序是不可改變的。
2.4 線性方程組
2.4.1 會用克拉默法則
2.4.2 理解齊次線性方程組有非零解的充分必要條件及非齊次線性方程組有解的充分必要條件
線性方程組
\(\begin{cases} a_{11}x_1+a_{12}x_2+...+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+...+a_{2n}x_n=b_2\\ ...\\ a_{m1}x_1+a_{m2}x_2+...+a_{mn}x_n=b_m \end{cases}\)
可以表示為以 \(\boldsymbol{x}\) 為未知元的向量方程 \(\boldsymbol{Ax}=\boldsymbol{b}\)
線性方程組的解
對 \(n\) 元線性方程組 \(\boldsymbol{Ax}=\boldsymbol{b}\) :
(1)無解:\(R(\boldsymbol{A})<R(\boldsymbol{A},\boldsymbol{b})\)
(2)有唯一解:\(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})=n\)
(2)有無限多解:\(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})<n\)
注:通過初等行變換和列交換(列只能交換),一定可以將系數矩陣變換為 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{M}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) 形式的矩陣。將常數列放到系數矩陣中,則變換之后,常數列的非零元素可能在 \(r\) 下一行,也可能不在 \(r\) 下一行(因為秩可能增加,也可能不增加)。若在下一行,則是 \(0=k\) 的不成立的式子,即無解。若不在 \(r\) 下一行,則可以將 \(\boldsymbol{M}\) 對應的 \(n-r\) 個待求量作為自由未知數,去線性表示 \(\boldsymbol{E}_r\) 對應的 \(r\) 個待求量。也即如果 \(r=n\) ,則只有一個解,如果 \(r<n\) ,則有無數解。
齊次線性方程組的解
對 \(n\) 元齊次線性方程組 \(\boldsymbol{Ax}=\boldsymbol{0}\) :
齊次線性方程組總有一個解 \(x_i=0\)
當 \(R(\boldsymbol{\boldsymbol{A}})<n\) 時,有無限多個非零解(有解)
注:\(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{0})\) 一定成立。
2.4.3 理解齊次線性方程組的基礎解系、通解及解空間的概念,掌握齊次線性方程組的基礎解系和通解的求法
齊次線性方程組的解的可加性
對齊次線性方程組 \(\boldsymbol{Ax}=\boldsymbol{0}\) 有解 \(\boldsymbol{\xi}_1,\boldsymbol{\xi}_2\) ,則 \(\boldsymbol{\xi}_1+\boldsymbol{\xi}_2\) 也是這個線性方程組的解。
證:由矩陣乘法的分配律可證。
齊次線性方程組的解的可倍性
對齊次線性方程組 \(\boldsymbol{Ax}=\boldsymbol{0}\) 有解 \(\boldsymbol{\xi}\) ,則 \(\lambda\boldsymbol{\xi}\) 也是這個線性方程組的解。
證:由 \(\lambda\boldsymbol{0}=\boldsymbol{0}\) 可證。
推論:齊次線性方程組的解的線性組合也是方程組的解
齊次線性方程組的解集
齊次線性方程組的解的集合稱為齊次線性方程組的解集。
齊次線性方程組的基礎解系
齊次線性方程組的解集的最大無關組稱為該齊次線性方程組的基礎解系。
注:由於最大無關組能線性表示解集中所有的其它解向量,同時解滿足可加性和可倍性,因此最大無關組的線性組合即為齊次線性方程組的通解。
設有最大無關組 \((\boldsymbol{\xi}_i)\) ,則有通解 \(\displaystyle \boldsymbol{x}=\sum \lambda_i\boldsymbol{\xi}_i\)
對齊次線性方程組 \(\boldsymbol{A}_{mn}\boldsymbol{x}_n=\boldsymbol{0}_m\) ,對其系數矩陣進行初等行變換和列交換后,得到 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{M}_{r,n-r}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) 形式的矩陣,記 \(\boldsymbol{M}\) 對應的 \(n-r\) 個未知數為自由未知數(因為 \(\boldsymbol{E}_r\) 對應的 \(r\) 個未知數恰能被這 \(n-r\) 個未知數線性表示),並且構成向量 \(\boldsymbol{c}_{n-r}\) ,則有 \(\boldsymbol{x}_r=\boldsymbol{M}_{r,n-r}\boldsymbol{c}_{n-r}\) ,將全部未知數放到一起,則為 \(\boldsymbol{x}_n=\begin{pmatrix}\boldsymbol{M}_{r,n-r}\\\boldsymbol{E}_{n-r}\end{pmatrix}\boldsymbol{c}_{n-r}\) 。將解看成是列向量的線性組合,即 \(\boldsymbol{x}_n=\begin{pmatrix}\boldsymbol{\xi}_{1},\boldsymbol{\xi}_{2},...,\boldsymbol{\xi}_{n-r}\end{pmatrix}\boldsymbol{c}_{n-r}\) ,由於 \((\boldsymbol{\xi}_i)\) 是一個線性無關組,因此這個線性無關組即為齊次線性方程組的解集的一個最大線性無關組,也即 \((\boldsymbol{\xi}_i)\) 就是齊次線性方程組的一個基礎解系。
根據向量組的秩的定義,有這個基礎解系的秩為 \(n-r\) 。
推論:若齊次線性方程組的系數矩陣的秩為 \(r\) ,未知數個數為 \(n\) ,則其解集的秩為 \(n-r\) 。
證明:由於其具有一個秩為 \(n-r\) 的基礎解系,而解集中的所有元素都可以用這個基礎解系線性表示,也即解集的秩為 \(n-r\) 。
2.4.4 理解非齊次線性方程組解的結構及通解的概念
非齊次線性方程組的結構
非齊次線性方程組的兩個解的差為對應的齊次線性方程組的解。
證:對非齊次線性方程組 \(\boldsymbol{Ax}=\boldsymbol{b}\) 和對應的齊次線性方程組 \(\boldsymbol{Ax}=\boldsymbol{0}\) ,若有 \(\boldsymbol{A}\boldsymbol{\xi}_1=\boldsymbol{b}, \boldsymbol{A}\boldsymbol{\xi}_2=\boldsymbol{b}\) ,則 \(\boldsymbol{A}(\boldsymbol{\xi}_1-\boldsymbol{\xi}_2)=\boldsymbol{0}\) ,得證。
非齊次線性方程組的解和其對應的齊次線性方程組的解的和也是這個非齊次線性方程組的解
證:\(\boldsymbol{Ax}=\boldsymbol{b}\) ,\(\boldsymbol{A\xi}=\boldsymbol{0}\) ,則 \(\boldsymbol{A}(\boldsymbol{x}+\boldsymbol{\xi})=\boldsymbol{b}\) ,得證。
非齊次線性方程組得任意解總可以表示為其某一個特解和對應的齊次線性方程組解集中的一個解的和。
注:或者說,已知一個特解,則任意的解,都可以通過和齊次線性方程組中的某個解相加得到。
證:只需要證明,對於任意一個解,其減去這個特解后得到的向量一定是對應的齊次線性方程組的解集中的一個元素(或者說是齊次線性方程組的一個解)。若有特解為 \(\boldsymbol{x}^*(\boldsymbol{A}\boldsymbol{x}^*=\boldsymbol{b})\) , \(\forall \boldsymbol{x}(\boldsymbol{Ax}=\boldsymbol{b})\Rightarrow \boldsymbol{A}(\boldsymbol{x}-\boldsymbol{x}^*)=\boldsymbol{b}-\boldsymbol{b}=\boldsymbol{0}\) ,也即得證。
非齊次線性方程組得通解為其一個特解和對應的齊次線性方程組得通解之和。
2.4.5 掌握用初等行變換求解線性方程組的方法
2.5 矩陣的特征值和特征向量
2.5.1 理解矩陣的特征值和特征向量的概念及性質,會求矩陣的特征值和特征向量
矩陣的特征值和特征向量
如果方陣 \(\boldsymbol{A}\) 有關系式 \(\boldsymbol{Ax}=\lambda\boldsymbol{x}(\boldsymbol{x}\not =\boldsymbol{0})\) 成立,則稱 \(\lambda\) 為矩陣的一個特征值,\(\boldsymbol{x}\) 為對應於特征值 \(\lambda\) 的一個特征向量。
注:特征向量不為零向量,特別注意這個要求。
特征值和特征向量的求法
\((\boldsymbol{A}-\lambda\boldsymbol{E})\boldsymbol{x}=\boldsymbol{0}\) ,這個是一個齊次線性方程組,當 \(R(\boldsymbol{A}-\lambda\boldsymbol{E})<n\) ,即 \(|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) 時,有非零解。求出這個方程,即可求出所有的特征值。根據求出的特征值(可能是單根,也可能是重根,也可能是復根),然后求出對應的特征向量。
注:\(n\) 階矩陣在復數域內一共有 \(n\) 個特征值。
特征方程
\(|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) ,這是一個一元 \(n\) 次方程,稱為對應於矩陣的特征方程。
注:矩陣的特征值就是矩陣的特征方程的解。
在復數范圍內,
特征多項式
記 \(f(\lambda)=|\boldsymbol{A}-\lambda\boldsymbol{E}|\) 為對應與矩陣的特征多項式。
注:矩陣的特征值就是矩陣的特征多項式和 \(x\) 軸的交點。
特征值與特征方程
\(\begin{cases}\displaystyle\sum \lambda_i=\sum a_{ii}\\\displaystyle \prod \lambda_i=|\boldsymbol{A}|\end{cases}\)
即矩陣的特征值的乘積為矩陣對應的行列式的值。矩陣的特征值的和為矩陣對應的行列式的主對角線上的元素之和。
證:
特征方程為 \(\begin{vmatrix}a_{11}-\lambda&a_{12}&...&a_{1n}\\a_{21}&a_{22}-\lambda&...&a_{2n}\\...&...&...&...\\a_{n1}&a_{n2}&...&a_{nn}-\lambda\end{vmatrix}=0\) ,
在復數域內,設有 \(n\) 個解 \((\lambda_i)\),即可記特征方程為 \(\displaystyle f(\lambda)=\prod (\lambda_i-\lambda)\) (注:這里把 \(\lambda\) 寫在后面,是要和行列式形式保持一致),則有 \(\lambda^{0}\) 項的形式為 \(\displaystyle \prod \lambda_i\) ,對應的行列式形式的特征方程中 \(\lambda^{0}\) 的系數為 \(|\boldsymbol{A}|\) (不斷通過行列式按行或列分解,將所有含 \(\lambda\) 的式子分離出去)。\(\lambda^{n-1}\) 項的形式為 \(\displaystyle (-\lambda)^{n-1}\sum \lambda_i\) ,對應的行列式形式的特征方程中 \(\lambda^{n-1}\) 的形式為 \(\displaystyle (-\lambda)^{n-1}\sum a_{ii}\) 。
對角矩陣的特征值
對角矩陣的特征值即為對角矩陣的主對角線上的所有元素。
證:
若 \(\boldsymbol{A}\) 為對角矩陣,則 \(\boldsymbol{A}-\lambda\boldsymbol{E}\) 也為對角矩陣,記其主對角線上的元素為 \(a_{ii}-\lambda_i\) ,則特征方程即為 \(\displaystyle \prod (a_{ii}-\lambda_i)=0\) ,因此得證。
矩陣的多項式的特征值
設多項式 \(\displaystyle f(x)=\sum_{i=0}^{m} a_{i}x^i\) ,若 \(\boldsymbol{A}\) 有特征值 \(\lambda\) ,則 \(f(\boldsymbol{A})\) 有特征值 \(f(\lambda)\) 。
注:為了結論的整潔,這里不妨規定 \(\boldsymbol{A}^{0}=\boldsymbol{E}\) ,盡管這個規定的前提是 \(\boldsymbol{A}\) 可逆,但這個結論並不要求可逆。
證明:
設 \(\boldsymbol{A}\) 對應於特征值 \(\lambda\) 的特征向量為 \(\boldsymbol{p}\)(\(\boldsymbol{p}\not = \boldsymbol{0}\)),則有 \(\boldsymbol{Ap}=\lambda\boldsymbol{p}\) ,\(\boldsymbol{A}^2\boldsymbol{p}=\boldsymbol{A}\lambda\boldsymbol{p}=\lambda\boldsymbol{Ap}=\lambda^2\boldsymbol{p}\) ,依次類推,有 \(\boldsymbol{A}^m\boldsymbol{p}=\boldsymbol{A}^{m-1}\lambda\boldsymbol{p}=\lambda\boldsymbol{A}^{m-1}\boldsymbol{p}=...=\lambda^{m}\boldsymbol{p}\) ,再有 \(\boldsymbol{Ep}=\boldsymbol{p}\) ,將這些式子分別附加一個系數,並合並,即有 \((a_0\boldsymbol{E}+a_1\boldsymbol{A}+a_2\boldsymbol{A}^2+...+a_m\boldsymbol{A}^m)\boldsymbol{p}=(a_0+a_1\lambda+a_2\lambda+...+a_m\lambda)\boldsymbol{p}\) ,即得證。
逆矩陣、伴隨陣的特征值
若 \(\boldsymbol{A}\) 有特征值 \(\lambda\) ,則 \(\boldsymbol{A}^{-1}\) 有特征值 \(\displaystyle \frac{1}{\lambda}\) ,\(\boldsymbol{A}^{*}\) 有特征值 \(\displaystyle |\boldsymbol{A}|\frac{1}{\lambda}\) ,\(\boldsymbol{A}^T\) 有特征值 \(\lambda\) 。
證:
\(\boldsymbol{Ap}=\lambda\boldsymbol{p}\) 。
兩邊左側同乘 \(\boldsymbol{A}^{-1}\) ,即有 \(\boldsymbol{p}=\lambda\boldsymbol{A}^{-1}\boldsymbol{p}\) ,也即 \(\displaystyle \boldsymbol{A}^{-1}\boldsymbol{p}=\frac{1}{\lambda}\boldsymbol{p}\) 。
兩邊左側同乘 \(\boldsymbol{A}^{*}\) ,即有 \(|\boldsymbol{A}|\boldsymbol{p}=\lambda \boldsymbol{A}^*\boldsymbol{p}\) ,也即 \(\displaystyle \boldsymbol{A}^*\boldsymbol{p}=\frac{1}{\lambda}|\boldsymbol{A}|\boldsymbol{p}\)
特征值和特征向量的線性無關性
如果矩陣存在一組互不相等的特征值,則這些特征值對應的特征向量線性無關。
證:
數學歸納法
記這些特征值為 \(\lambda_1,\lambda_2,...,\lambda_m\) 。當 \(m=1\) 時,即一個特征值,此時對應有一個向量,而特征向量不為零向量,因此滿足條件。現在不妨假設當 \(m=r\) 時,對應的特征向量分別線性無關。則當 \(m=r+1\) 時,記對應的 \(r+1\) 個向量為 \(\boldsymbol{p}_1,\boldsymbol{p}_2,...,\boldsymbol{p}_r,\boldsymbol{p}_{r+1}\) ,不妨假設有 \(\displaystyle \sum_{i=1}^{k+1}x_{i}\boldsymbol{p}_{i}=\boldsymbol{0}\) ,用 \(\boldsymbol{A}\) 左側乘以上式 ,則有 \(\displaystyle \sum_{i=1}^{k+1}x_{i}\boldsymbol{A}\boldsymbol{p}_{i}=\sum_{i=1}^{k+1}x_{i}\lambda_i\boldsymbol{p}_i=\boldsymbol{0}\) ,消去 \(\boldsymbol{p}_{k+1}\) 項,則有 \(\displaystyle \sum_{i=1}^{k}x_i(\lambda_i-\lambda_{k+1})\boldsymbol{p}_i=\boldsymbol{0}\) ,而由 \(\boldsymbol{p}_1,\boldsymbol{p}_2,...,\boldsymbol{p}_r\) 線性無關,而 \(\lambda_i\not =\lambda_{k+1}\) ,即有 \(x_i=0\) ,也即可以推得這 \(r+1\) 個向量線性無關。
擴展:
不必要性證明:
對特征值和特征向量的定義式的變形 \((\boldsymbol{A}-\lambda\boldsymbol{E})\boldsymbol{p}=\boldsymbol{0}\),如果取 \(\boldsymbol{A}=\boldsymbol{E}\) ,則特征值全為 \(0\) ,此時特征向量所在的向量空間的秩為 \(n-0=n\) ,也即一定存在 \(n\) 個線性無關的特征向量。此即為不必要性的反例。
2.5.2 理解相似矩陣的概念、性質及矩陣可相似對角化的充分必要條件,掌握將矩陣化為相似對角矩陣的方法
矩陣相似
若 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{B}\) ,則稱 \(\boldsymbol{B}\) 是 \(\boldsymbol{A}\) 的相似矩陣,或者稱 \(\boldsymbol{A}\) 與 \(\boldsymbol{B}\) 相似。
矩陣的相似性具有自反性、對稱性和傳遞性
證明:
由於 \(\boldsymbol{E}^{-1}\boldsymbol{AE}=\boldsymbol{A}\) ,即具有自反性。
左側通過乘法消去 \(\boldsymbol{P}\) ,則有 \(\boldsymbol{A}=\boldsymbol{PB}\boldsymbol{P}^{-1}=(\boldsymbol{P}^{-1})^{-1}\boldsymbol{B}\boldsymbol{P}^{-1}\) ,也即滿足對稱性。
設 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{B}\) ,\(\boldsymbol{Q}^{-1}\boldsymbol{BQ}=\boldsymbol{C}\) ,則 \(\boldsymbol{Q}^{-1}(\boldsymbol{P}^{-1}\boldsymbol{AP})\boldsymbol{Q}=\boldsymbol{C}\) ,即 \((\boldsymbol{PQ})^{-1}\boldsymbol{A}(\boldsymbol{PQ})=\boldsymbol{C}\) ,因此具有傳遞性。
矩陣相似與矩陣的特征值
若矩陣相似,則矩陣具有相同的特征值
注:具有相同的特征值是矩陣相似的必要條件,或者說矩陣相似是矩陣的特征值相同的充分條件。
證明:
充分性證明:
給出 \(\boldsymbol{B}\) 的特征多項式 \(f_{\boldsymbol{B}}(\lambda)=|\boldsymbol{B}-\lambda\boldsymbol{E}|=|\boldsymbol{P}^{-1}\boldsymbol{AP}-\lambda\boldsymbol{P}^{-1}\boldsymbol{EP}|=|\boldsymbol{P}^{-1}||\boldsymbol{P}||\boldsymbol{A}-\lambda\boldsymbol{E}|\) ,由於 \(\boldsymbol{P}\) 可逆,因此 \(f_{\boldsymbol{B}}(\lambda)=0 \Leftrightarrow f_{\boldsymbol{A}}(\lambda)=|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) ,也即兩個矩陣具有相同的特征多項式,也即具有相同的特征值。
非必要性證明:
推論
若矩陣和對角陣相似,則對角陣的主對角線上的元素就是矩陣的特征值。
矩陣對角化的充要條件
矩陣能相似對角化的充分必要條件是矩陣具有 \(n\) 個線性無關的特征向量(或者說矩陣的所有特征向量線性無關)。
證明:
充分性:
記矩陣的所有特征向量組成矩陣 \(\boldsymbol{P}=(\boldsymbol{p}_i)\) ,由特征向量定義有 \(\boldsymbol{A}\boldsymbol{p}_i=\lambda_i\boldsymbol{p}_i\) ,則有 \(\boldsymbol{AP}=\boldsymbol{A}(\boldsymbol{p}_i)=(\lambda_i\boldsymbol{p}_i)=\boldsymbol{P\varLambda}\) ,由於所有特征向量線性無關,因此 \(\boldsymbol{P}\) 可逆,因此即有矩陣能相似對角化。
必要性:
若能夠相似對角化,同充分性證明可逆推。
推論:矩陣相似對角化的充分條件是矩陣的特征值互不相等。
充分性:由於特征值互不相等,因此特征向量線性無關,因此必要性得證。
不必要性:直接由特征值不相等是特征向量線性無關的充分不必要條件可證。
2.5.3 掌握實對稱矩陣的特征值和特征向量的性質
實對陳陣的特征值為實數
證明:不證。
實對稱陣若有兩個不想等的特征值,則這兩個特征值對應的特征向量正交
證明:
\(\boldsymbol{A}\boldsymbol{p}_1=\lambda_1\boldsymbol{p}_1\) ,\(\boldsymbol{A}\boldsymbol{p}_2=\lambda_2\boldsymbol{p}_2\) ,
\((\boldsymbol{A}\boldsymbol{p}_1)^T=\boldsymbol{p}_1^T\boldsymbol{A}^T=\boldsymbol{p}_1^T\boldsymbol{A}\)
\((\boldsymbol{A}\boldsymbol{p}_1)^T=(\lambda_1\boldsymbol{p}_1)^T=\lambda_1\boldsymbol{p}_1^T\)
即有 \(\boldsymbol{p}_1^T\boldsymbol{A}=\lambda_1\boldsymbol{p}_1^T\)
同理有 \(\boldsymbol{p}_2^T\boldsymbol{A}=\lambda_2\boldsymbol{p}_2^T\)
\(\lambda_1\boldsymbol{p}_1^T\boldsymbol{p}_2=\boldsymbol{p}_1^T\boldsymbol{A}\boldsymbol{p}_2=\boldsymbol{p}_1^T(\boldsymbol{A}\boldsymbol{p}_2)=\boldsymbol{p}_1^T\lambda_2\boldsymbol{p}_2\)
因此 \((\lambda_1-\lambda_2)\boldsymbol{p}_1^T\boldsymbol{p}_2=\boldsymbol{0}\)
因此 \(\boldsymbol{p}_1^T\boldsymbol{p}_2=\boldsymbol{0}\) ,即得證。
實對稱陣一定正交相似於以其特征值為主對角元素的對角陣
也即
若有 \(n\) 階實對稱陣 \(\boldsymbol{A}\) ,則必有正交陣 \(\boldsymbol{P}\) ,滿足 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{P}^T\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,其中 \(\boldsymbol{\varLambda}\) 是以 \(\boldsymbol{A}\) 的 \(n\) 個特征值為對角元的對角陣。
證明:不證。
推論:若對稱陣的特征方程對應的某個特征值是多重根,則該特征值對應有對應重數的個數的線性無關的特征向量。
證:
不妨設 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,即有 \(\boldsymbol{P}^{-1}(\boldsymbol{A}-\lambda\boldsymbol{E})\boldsymbol{P}=\boldsymbol{\varLambda}-\lambda\boldsymbol{E}\) ,也即若 \(\lambda\) 為特征方程的多重根,即 \(\boldsymbol{\varLambda}\) 對角元中有對應重數的值為 \(\lambda\) ,設重數為 \(k\) ,也即對角陣 \(\boldsymbol{\varLambda}-\lambda\boldsymbol{E}\) 的秩為 \(n-k\) ,也即 \(\boldsymbol{A}-\lambda\boldsymbol{E}\) 的特征值為 \(n-k\) ,因此特征向量作為特征方程的解集的秩為 \(n-(n-k)=k\) 。
2.6 二次型
2.6.1 掌握二次型及其矩陣表示,了解二次型秩的概念,了解合同變換與合同矩陣的概念,了解二次型的標准形、規范形的概念以及慣性定理
二次型
含有 \(n\) 個變量 \((x_i)\) 的二次齊次函數 \(\displaystyle f(x_1,x_2,...,x_n)\)
\(\displaystyle=\sum_{i=1,j=1}^{n}a_{ij}x_ix_j\)
\(=a_{11}x_1^2+a_{12}x_1x_2+...+a_{1n}x_1x_n+\)
\(a_{21}x_2x_1+a_{22}x_2^2+...+a_{2n}x_2x_n+\)
\(+...\)
\(+a_{n1}x_nx_1+a_{n2}x_nx_2+...+a_{nn}x_n^2\)
\(=(x_1,x_2,...,x_n)\begin{pmatrix}a_{11}x_1+a_{12}x_2+...+a_{1n}x_{n}\\a_{21}x_1+a_{22}x_2+...+a_{2n}x_n\\...\\a_{n1}x_{1}+a_{n2}x_{2}+...+a_{nn}x_{n}\end{pmatrix}\)
\(=\boldsymbol{x}^T(a_{ij})\boldsymbol{x}\)
\(=\boldsymbol{x}^T\boldsymbol{A}\boldsymbol{x}\)
稱為二次型。
注:二次型是一個二次齊次函數;二次型中 \(\boldsymbol{A}\) 是一個對稱陣;二次型一定與一個對角元素為對應特征值的對角陣相似;
二次型的秩
二次型中的對稱陣 \(\boldsymbol{A}\) 的秩就是二次型的秩。
合同矩陣
若有可逆矩陣 \(\boldsymbol{C}\) ,使 \(\boldsymbol{B}=\boldsymbol{C}^T\boldsymbol{AC}\) ,則稱矩陣 \(\boldsymbol{B}\) 與 \(\boldsymbol{A}\) 合同,或者稱 \(\boldsymbol{B}\) 是 \(\boldsymbol{A}\) 的合同矩陣。
推論
若 \(\boldsymbol{B}\) 是 \(\boldsymbol{A}\) 的合同矩陣,則 \(\boldsymbol{B}^T\) 是 \(\boldsymbol{A}^T\) 的合同矩陣。
證:
\(\boldsymbol{B}^T=(\boldsymbol{C}^T\boldsymbol{AC})^T=\boldsymbol{C}^T\boldsymbol{A}^T\boldsymbol{C}\)
推論
若 \(\boldsymbol{A}\) 為對稱陣,則其合同矩陣也為對稱陣。
證明:
\(\boldsymbol{B}^T=(\boldsymbol{C}^T\boldsymbol{AC})^T=\boldsymbol{C}^T\boldsymbol{A}^T\boldsymbol{C}=\boldsymbol{C}^T\boldsymbol{A}\boldsymbol{C}=\boldsymbol{B}\)
注:這個性質首先是從合同矩陣的性質來理解,齊次是可以從矩陣的初等變換的形式來理解,也即使用一個可逆變換矩陣,先按其轉置矩陣進行行變換,然后再用該矩陣進行列變換,則變換不改變矩陣的對稱性。
二次型 \(f(\boldsymbol{x})=\boldsymbol{x}^T\boldsymbol{A}\boldsymbol{x}\) 的合同對角化
取變換 \(\boldsymbol{x}=\boldsymbol{Cy}\) ,代入則有 \(f(\boldsymbol{x})=\boldsymbol{y}^T\boldsymbol{C}^T\boldsymbol{ACy}\) ,記 \(\boldsymbol{M}=\boldsymbol{C}^T\boldsymbol{AC}\) 為 \(\boldsymbol{A}\) 的一個合同矩陣,因此二次型的對角化實際上就是求一個合同矩陣,並使這個矩陣為對角陣。
由於 \(\boldsymbol{A}\) 為對稱陣,因此正交陣 \(\boldsymbol{P}\) ,滿足 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{P}^T\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,因此一定有二次型可以合同對角化。
二次型的標准形
若二次型中 \(a_{ij}=0,i\not=j\) ,則稱為標准形。
二次型的規范形
若標准形中系數全為 \(1\) ,則稱為規范形。
標准形存在定理
通過二次型的合同對角化,不妨記 \(f(\boldsymbol{x})=\boldsymbol{y}^T\boldsymbol{\varLambda}\boldsymbol{y}=a_{11}y_1^2+a_{22}y_2^2+...+a_{nn}y_n^2=\lambda_1y_1^2+\lambda_2y_2^2+...+\lambda_ny_n^2\) 。也即通過合同對角化,就能將二次型變換為標准形。
規范形存在定理
推論:二次型一定可以變換為規范形。
證:在二次型的標准形基礎上,簡單變換一個比例,即可消去系數,成為規范形。
2.6.2 掌握用正交變換化二次型為標准形的方法,會用配方法化二次型為標准形
二次型化為標准形的配方法
拉格朗日配方法
拉格朗日配方法,每次將二次型中的一個變量合並到一個式子中,合並完成后,注意補充項以使變換矩陣為可逆矩陣,然后根據配方式子得到每個變量的表達式,即可得到變換矩陣。
例子:
\(f=a^2+2b^2+5c^2+2ab+2ac+6bc\)
\(=a^2+2ab+2ac+2b^2+5c^2+6bc\)
\(=(a+b+c)^2-2bc-b^2-c^2+2b^2+5c^2+6bc\)
\(=(a+b+c)^2+b^2+4c^2+4bc\)
\(=(a+b+c)^2+(b+2c)^2\)
取 \(\begin{cases}x=a+b+c\\y=b+2c\end{cases}\) ,補全為可逆矩陣形式為
\(\begin{pmatrix}x\\y\\z\end{pmatrix}=\begin{pmatrix}1&1&1\\0&1&2\\0&0&1\end{pmatrix}\begin{pmatrix}a\\b\\c\end{pmatrix}\) ,記為 \(\boldsymbol{y}=\boldsymbol{Cx}\) ,有 \(\boldsymbol{x}=\boldsymbol{C}^{-1}\boldsymbol{y}\) 。
求得 \(\boldsymbol{C}^{-1}=\begin{pmatrix}1&0&0\\-1&1&0\\1&-2&1\end{pmatrix}^T=\begin{pmatrix}1&-1&1\\0&1&-2\\0&0&1\end{pmatrix}\) ,這就是二次型轉換為標准形的可逆變換矩陣。
2.6.3 理解正定二次型、正定矩陣的概念,並掌握其判別法
二次型的所有標准形的系數的正數的個數相等。(慣性定理)
證明:不證。
推論:二次型的所有標准形的系數的負數的個數相等。
證明:由於二次型和標准形相似,因此秩相等。也即對角元素中非零元素的個數相等,而正數系數的個數也相等,因此負數系數的個數也即相等。
二次型的標准形中正系數的個數稱為正慣性指數,負系數的個數稱為負慣性指數。
正定二次型、負定二次型;正定矩陣、負定矩陣
若對任何非零向量,二次型恆為正,則稱為正定二次型,相應的矩陣稱為正定矩陣;若二次型恆為負,則稱為負定二次型,相應的矩陣稱為負定矩陣。
二次型正定的充要條件是其正慣性指數為 \(n\) ;
或者二次型矩陣的特征值全為正;
或者二次型矩陣的各階主子式為正(負定:奇數階為負,偶數階為正):赫爾維茨定理。
證明:
僅就正定的正慣性指數充要條件進行證明。
設二次型為 \(f(\boldsymbol{x})=\boldsymbol{x}^T\boldsymbol{Ax}\) ,有可逆變換 \(\boldsymbol{x}=\boldsymbol{Cy}\) 使 \(\displaystyle f(\boldsymbol{Cy})=\boldsymbol{y}^T\boldsymbol{\varLambda}\boldsymbol{y}=\sum_{i=1}^{n}\lambda_i y_i^2\) 。正慣性指數為 \(n\) 也即 \(\lambda_i>0\) 。
充分性:因為 \(\boldsymbol{x}\not= \boldsymbol{0}\) ,故 \(\boldsymbol{y}\not=\boldsymbol{0}\) ,因此必存在 \(y_k\not= 0\) ,而系數全為正,也即有二次型必為正。
必要性:不妨假設某一個系數不為正,即為零或負值,由慣性定理,則有存在 \(\lambda_k\le 0\) ,此時取 \(\boldsymbol{y}=\boldsymbol{e}_k\) (第 \(k\) 個分量為 \(1\) 的單位向量),則有二次型值為 \(1\times \lambda_k\le 0\) ,與假設矛盾。
3 概率論與數理統計
3.1 隨機事件和概率
3.1.1 了解樣本空間(基本事件空間)的概念,理解隨機事件的概念,掌握事件的關系及運算
隨機現象
在個別試驗中其結果呈現出不確定性,在大量重復試驗中其結果又具有統計規律性的現象,稱為隨機現象。
概率論與數理統計的學科定位
概率論和數理統計是研究和揭示隨機現象統計規律性的數學學科。
隨機試驗
具有以下三個特點的試驗稱為隨機試驗:
(1)可以在相同條件下重復地進行;
(2)每次試驗的可能結果不止一個,並且能事先明確試驗的所有可能結果;
(3)進行一次試驗前不能確定哪一個結果會出現;
也即,可重復性,總體可預知,單體不可預知性。
樣本空間
隨機試驗 \(E\) 的所有可能的結果組成的集合稱為 \(E\) 的樣本空間,記為 \(S\) 。樣本空間的元素,也即隨機試驗 \(E\) 的每個結果,稱為樣本點。
隨機事件
稱試驗 \(E\) 的樣本空間 \(S\) 的子集稱為試驗 \(E\) 的隨機事件,簡稱事件。
注:嚴格而言,事件是樣本空間中滿足某些條件的子集。當 \(S\) 中有不可列的無限個元素時,應該將某些子集排除在外。
注:事件的定義在於對於隨機試驗,我們常常關注滿足某種條件的那些樣本點所組成的集合。
必然事件和不可能事件
事件為空集,稱為不可能事件
樣本空間本身為全集,稱為必然事件
事件發生
當且僅當事件的一個樣本點出現時,稱這個事件發生。
事件包含
事件包含,也即作為集合的事件具有包含關系。
事件 \(A\) 包含事件 \(B\) ,其含義就是若事件 \(B\) 發生,則事件 \(A\) 必然發生。
事件 \(A\) 包含事件 \(B\) ,記為 \(A\subset B\)
事件相等
也即集合相等,或者說兩個集合互相包含。
兩個事件相等,其含義就是某一個事件發生,則另一個事件一定發生。
兩個事件相等,也即兩個事件的樣本點完全相同。
事件 \(A\) 和事件 \(B\) 相等,記為 \(A=B\)
和事件
也即集合的並。
兩個事件至少有一個發生,則兩個事件的和事件發生。
兩個事件的和事件發生,也即兩個事件的並集中有一個樣本點出現。
事件 \(A\) 和事件 \(B\) 的和事件,記為 \(A\cup B\)
有限個事件的和事件記為 \(\displaystyle\bigcup_{k=1}^{n}A_k\)
無限可列個事件的和事件記為 \(\displaystyle \bigcup_{k=1}^{\infin}A_k\)
積事件
也即集合的交。
兩個事件都發生,則兩個事件的積事件發生。
兩個事件的積事件發生,也即兩個事件的交集中有一個樣本點出現。
事件 \(A\) 和事件 \(B\) 的積事件,記為 \(A\cap B\)
有限個事件的積事件記為 \(\displaystyle\bigcap_{k=1}^{n}A_k\)
無限可列個事件的積事件記為 \(\displaystyle \bigcap_{k=1}^{\infin}A_k\)
差事件
也即集合的差。
當且僅當事件 \(A\) 發生,而事件 \(B\) 不發生,事件 \(A\) 與事件 \(B\) 的差事件發生。
事件 \(A\) 與事件 \(B\) 的差事件記為 \(A-B\)
事件互不相容(互斥)
兩個事件互斥,也即兩個事件不可能同時發生。
即 \(A\cap B=\empty\)
事件對立(互逆)
兩個事件對立,也即兩個事件僅有一個發生,並且一定有一個事件發生。
即 \(A\cup B=S,A\cap B=\empty\)
\(A\) 的逆事件記為 \(\overline{A}\)
3.1.2 理解概率、條件概率的概念,掌握概率的基本性質,會計算古典型概率和幾何型概率,掌握概率的加法公式、減法公式、乘法公式、全概率公式以及貝葉斯公式
頻數與頻率
在相同的條件下,進行了 \(n\) 次試驗,事件 \(A\) 發生的次數 \(n_A\) 稱為事件 \(A\) 發生的頻數。
\(n_A/n\) 稱為事件 \(A\) 的頻率,記為 \(f_n(A)=n_A/n\) 。
概率
概率的公理化定義
對隨機試驗 \(E\) ,其樣本空間為 \(S\) ,對隨機試驗 \(E\) 的每個事件 \(A\) 賦予一個實數,記為 \(P(A)\) ,稱為事件 \(A\) 的概率。其中 \(P(A)\) 是一個集合函數,其需要滿足三個條件:
(1)非負性
(2)規范性:\(P(S)=1\)
(3)可列可加性:對於兩兩互不相容的事件 \(A_i\) ,有 \(\displaystyle P(\bigcup_{i=1}^{\infin} A_i)=\sum_{i=1}^{\infin}{P(A_i)}\)
條件概率
設有 \(P(A)>0\) ,稱 \(\displaystyle P(B|A)=\frac{P(AB)}{P(A)}\) 為在事件 \(A\) 發生的條件下事件 \(B\) 發生的條件概率。
推論:
條件概率的集合函數也滿足概率的集合函數的三個條件,因此也具有概率所具有的一些性質。
不可能事件的概率為 \(0\)
證明:
取 \(A_1=S\) ,\(A_2=A_3=...=\empty\) ,則 \(A_i\) 兩兩互斥,同時 \(\displaystyle P(\bigcup_{i=1}^{\infin}A_i)=P(S)=\sum_{i=1}^{\infin}P(A_i)=P(S)+\sum_{i=2}^{\infin}P(\empty)\) ,由非負性,故 \(P(\empty)=0\) 。
有限可加性
\(\displaystyle P(\bigcup_{i=1}^{n}A_i)=\sum_{i=1}^{n}P(A_i)\)
證明:
直接取 \(n+1\) 以后的事件為空集,而空集得概率為 \(0\) ,即得證。
事件的包含關系與概率(減法公式)
設兩個事件 \(A\) 、\(B\) ,滿足 \(A\subset B\) ,也即事件 \(B\) 包含事件 \(A\) ,則有
\(P(B-A)=P(B)-P(A)\) ;\(P(B)\ge P(A)\)
證明:
由集合關系,有 \(A=B\cup (A-B)\) ,再由有限可加性,有 \(P(A)=P(B)+P(A-B)\) ,即證第一個式子,再由非負性,即得證第二個式子。
任意事件的概率不大於 \(1\)
即 \(A\subseteq S\) ,有 \(P(A)\le 1\) 。
證明:
由包含關系,則有 \(P(A)\le P(S)=1\) ,即得證。
逆事件的概率
\(P(\overline{A})=1-P(A)\)
逆事件互斥,也即 \(P(\overline{A}\cup A)=P(A)+P(\overline{A})\) ,即得證。
和事件的概率(加法公式)
\(P(A\cup B)=P(A)+P(B)-P(AB)\)
證明:直接由集合的可列可加性(互斥的事件概率可加)以及減法公式,可證。
推論:任意多個事件的並的概率,等於將這些事件化為互斥事件后的概率的和。
積事件的概率(乘法公式)
\(P(AB)=P(A)P(B|A),P(A)>0\)
證:直接由條件概率的定義得到。
推論:
\(P(ABC)=P(AB)P(C|AB)=P(A)P(B|A)P(C|AB)\)
注:分解時,注意優先將事件的組合分解到非條件型的概率中。
古典型概率
若樣本空間中只有有限個元素,並且每個基本事件發生的可能性相同,則這種試驗稱為等可能概型,也稱作古典概型。
幾何型概率
基本事件的可能性只與某個幾何區域的幾何度量有關,則稱這種試驗稱為幾何型概率。
樣本空間的划分
若樣本空間的一組事件相互獨立,並且這些事件的和等於樣本空間,則稱這組事件為樣本空間的一個划分。
全概率公式(間接求概率)
設 \(M_i\) 為樣本空間 \(S\) 的一個划分,且 \(P(M_i)>0\) ,則
\(\displaystyle P(A)=\sum_{i=1}^n P(A|M_i)P(M_i)\)
證明:
\(\displaystyle \sum_{i=1}^n P(A|M_i)P(M_i)=\sum_{i=1}^n P(AM_i)\) (乘法公式,或者條件概率的定義)
由 \(M_i\) 互斥,故 \(AM_i\) 也互斥,由概率的有限可加性,有
\(\displaystyle \sum_{i=1}^n P(AM_i)=P(\bigcup_{i=1}^{n} AM_i)\)
由集合運算的分配律,有
\(\displaystyle =P(A\bigcup_{i=1}^{n}M_i)=P(AS)=P(A)\) ,即得證。
全概率公式給出了已知事件的一些條件概率的情況下求其概率的方法。
貝葉斯公式(條件概率的逆)
設 \(M_i\) 是樣本空間 \(S\) 的一個划分,且 \(P(M_i)>0,P(A)>0\) ,則有
\(\displaystyle P(M_i|A)=\frac{P(AM_i)}{P(A)}=\frac{P(AM_i)}{\displaystyle \sum_{i=1}^{n} P(A)P(M_i|A)}\)
注:貝葉斯公式利用全概率公式對條件概率定義公式的分母進行分解,實現了通過 \(P(A|B)\) 求 \(P(B|A)\) 。
3.1.3 理解事件獨立性的概念,掌握事件的關系及運算
事件獨立
對兩個事件 \(A,B\) ,若有 \(P(AB)=P(A)P(B)\) ,則稱事件 \(A,B\) 相互獨立,簡稱獨立。
對多個事件,若任取其中幾個事件,均滿足積事件的概率等於概率的積,則稱這些事件相互獨立。
事件的獨立性表示事件之間不存在相互影響。
注:
(1)事件兩兩獨立,不代表事件相互獨立。
例如,從 \(1,2,3,4\) 號球中隨機取一個球,記事件 \(A\) 為取 \(1\) 或 \(2\) 號球,事件 \(B\) 為取 \(1\) 或 \(3\) 號球,事件 \(C\) 為取 \(2\) 或 \(3\) 號球,則有 \(\displaystyle P(A)=P(B)=P(C)=\frac{1}{2}\) ,\(\displaystyle P(AB)=P(BC)=P(AC)=\frac{1}{4}\) ,\(P(ABC)=0\) ,也即事件兩兩獨立,但是並不相互獨立(例如,其中某兩個事件發生了,則另一個事件就一定不會發生,即這兩個事件和另一個事件存在關聯性)。
(2)獨立不互斥,互斥不獨立。(獨立性和互斥性不同時成立)
不考慮不可能事件,則對相互獨立事件,\(P(AB)\not=\empty\) ,即不互斥。
同樣,若互斥,則 \(P(AB)=P(\empty)=0\) ,也即不相互獨立。
理解:互斥表示某個事件發生,則另一個事件一定不發生;獨立表示某個事件發生,從可能性上不影響另一個事件發生;因此若互斥,則通過一個事件的發生就能得到另一個事件是否發生,因此一定不獨立,同樣若獨立,則一個事件發生不能預知另一個事件是否發生,或者說一個事件發生,則另一個事件可能也發生,因此不互斥。
3.2 隨機變量及其分布
3.2.1 理解隨機變量的概念,理解分布函數 \(F(x)=P\{X\le x\}(-\infin < x < \infin)\) 的概念及性質,會計算與隨機變量相聯系的事件的概率
隨機變量
設隨機試驗的樣本空間為 \(S=\{s_i\}\) ,\(X=X(s_i)\) 是定義在樣本空間上的實值單值函數。稱 \(X=X(s_i)\) 為隨機變量。
注:\(s_i\) 是樣本空間上的樣本點,\(\{s_i\}\) 是樣本點的集合。隨機變量 \(X\) 是以樣本點為自變量,實數為因變量的函數。隨機變量將樣本點映射為實數,以便於用數的方法去研究樣本點的性質。
注:隨機變量是函數,是樣本空間的元素的函數。
注:嚴格來說還要求所有樣本點組成的集合具有確定的概率。
分布函數
設 \(X\) 是一個隨機變量,\(x\) 是任意實數,函數 \(F(x)=P\{X\le x\},-\infin < x < \infin\) 稱為 \(X\) 的分布函數。
注:對於連續型隨機變量,由於任一點處的概率為無窮小(可能不嚴謹),因此 \(F(x)=P\{X\le x\}=P\{X < x\}\) ,但是對於離散型隨機變量,其在某點處的概率是存在的,因此為了兩者的統一,這里規定了分布函數是左開右閉的。一般寫成 \(\le\) 。
分布函數的性質
(1)分布函數是一個不減函數
(2)分布函數的值域為 \([0,1]\)
(3)分布函數的負極限為 \(0\) ,正極限為 \(1\)
(4)分布函數右連續(而不一定左連續)
證明:
(1)由於概率一定為非負值,因此得證。
(2)由於分布函數是一個概率,因此其值域一定為 \([0,1]\) 的一個子集。同時,\(F(x)\) 可以達到兩個極限,因此得證。
(3)將隨機變量 \(X\) 視作 \(x\) 軸上的值,則分布函數 \(F(x)\) 表示隨機變量在點 \(x\) 及其左側的概率,因此 \(x\rightarrow -\infin\) 時,概率趨近於 \(0\) ,\(x\rightarrow \infin\) 時,概率趨近於 \(1\) 。
(4)以離散型隨機變量為例,設某點 \(x_m\) 有 \(P(x_{m})\not =0\) ,則 \(\displaystyle F(x^-)=P\{X\le x^-\}=\sum_{1}^{m-1}P(x_i)\) ,\(F(x^+)=P\{X\le x^+\}=F(x)\) ,因此左不連續,右連續。
3.2.2 理解離散型隨機變量及其概率分布的概念,掌握 0-1 分布、二項分布 \(B(n,p)\) 、幾何分布、超幾何分布、泊松分布 \(P(\lambda)\) 及其應用
離散型隨機變量
若隨機變量可能取到的值是有限多個或者可列無限多個,則稱為離散型隨機變量。
離散型隨機變量的分布
記式子 \(P\{X=x_k\}=p_k,k=1,2,...\) 為離散型隨機變量的分布律。
注:注意寫法,\(P(A)\) 表示事件 \(A\) 發生的概率,\(P\{X=k\}\) 表示隨機變量取值為 \(k\) 的概率。前者用小括號,是因為事件發生的概率可以看作是一個以事件元素為自變量的函數,后者用大括號,是因為這是一個隨機變量取某個值的條件。
\(0-1\) 分布
\(P\{X=1\}=p,P\{X=0\}=1-p\)
伯努利試驗
若試驗 \(E\) 只有兩個可能的結果:\(A,\overline{A}\) ,則稱試驗 \(E\) 為伯努利試驗。
記伯努利試驗中事件 \(A\) 發生的次數為隨機變量 \(X\) ,並記 \(P\{A\}=p,P\{\overline{A}\}=1-p\) ,則有伯努利試驗中事件發生的次數滿足 \(0-1\) 分布。
\(n\) 重伯努利試驗
將伯努利試驗獨立重復地進行 \(n\) 次,則稱這一連串重復的獨立試驗為 \(n\) 重伯努利試驗。
二項分布
記 \(n\) 重伯努利試驗中事件 \(A\) 發生的次數為隨機變量 \(X\) ,對於 \(X=k\) ,則 \(n\) 次試驗中,有 \(k\) 個試驗事件 \(A\) 發生,\(n-k\) 個試驗事件 \(A\) 沒有發生(\(\overline{A}\) 發生),由獨立事件的加法公式和乘法公式,有 \(P\{X=k\}=C_n^k p^k(1-p)^{n-k}\) ,其中 \(C_n^k\) 為 \(n\) 個元素中 \(k\) 個元素的一個組合,且 \(\displaystyle C_n^k=\frac{n!}{(n-k)!k!}\) 。
稱 \(n\) 重伯努利試驗中事件 \(A\) 發生的次數 \(X\) 服從參數為 \(n,p\) 的二項分布,記為 \(X\sim b(p,n)\) 。
注:記 \(1-p=q\) ,則有 \(P\{X=k\}\) 恰好就是二項式 \((p+q)^n\) 中的 \(p^k\) 項,也因此被稱為二項分布。
注:也記為 \(B(p,n)\) 。
二項分布:\(\text{binominal distribution}\)
二項分布的圖形:如果不考慮系數,則是一個單調函數(\(p=0.5\) 時為恆值),因此整體上呈現一個兩端低,中間高的趨勢。二項分布是有限項。
幾何分布
記伯努利試驗過程中,事件 \(A\) 第一次發生時總共進行的試驗次數為 \(X\) ,則有 \(P\{X=k\}=q^{k-1}p\) 。稱這個隨機變量 \(X\) 滿足幾何分布。
注:幾何分布的概率是一個幾何級數中的項。
幾何分布的圖形:幾何分布的概率列是一個等比級數,因此是一個單調減函數。幾何分布是無窮項。
超幾何分布
從 \(a\) 個白球和 \(b\) 個黑球中取 \(n\) 個球,記其中白球的個數為隨機變量 \(X\) ,稱這個隨機變量 \(X\) 服從超幾何分布。
\(\displaystyle P\{X=k\}=\frac{C_{a}^kC_{b}^{n-a}}{C_{a+b}^n}\)
理解:把每個球都當作是不同的球,總的取法是從 \(a+b\) 中取 \(n\) 個球,其中有 \(k\) 個白球的取法是先從 \(a\) 個白球中取 \(k\) 個白球,然后再從 \(b\) 個黑球中取 \(n-k\) 個黑球。
注:超幾何分布的概率是一個超幾何級數中的項。
注:所謂超幾何級數,是指 \(A_{n+1}=A_nf(n)\) ,其中 \(f(n)\) 是一個關於 \(n\) 的多項式。
超幾何分布的圖形:超幾何分布的概率值是一個標准的二項分布圖(\(p=0.5\)),因此是一個有限項的兩端低,中間高的圖形。
泊松定理
對二項分布的概率公式 \(P\{X=k\}=C_n^kp^k(1-p)^{n-k}\) ,設 \(np=\lambda\) ,且 \(\lambda\) 為常數,有
\(\displaystyle \lim_{n\rightarrow \infin}C_n^k p^k(1-p)^{n-k}=\frac{\lambda^k e^{-\lambda}}{k!}\)
證明:當 \(n\rightarrow \infin\) 時,\(\displaystyle P\{X=k\}=\frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}=\frac{n(n-1)...(n-k+1)}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}=\frac{\lambda^k}{k!}(1)(1-\frac{1}{n})...(1-\frac{k-1}{n})(1-\frac{\lambda}{n})^{n-k}\) ,而 \(n\rightarrow \infin\) 時, \(\displaystyle (1-\frac{\lambda}{n})^{n-k}=(1-\frac{\lambda}{n})^n=((1-\frac{\lambda}{n})^{-\frac{n}{\lambda}})^{-\lambda}=e^{-\lambda}\) ,也即得證。
泊松分布
若隨機變量 \(X\) 滿足 \(\displaystyle P\{X=k\}=\frac{\lambda^k e^{-\lambda}}{k!}\) ,則稱這個隨機變量滿足泊松分布。
泊松分布記為 \(X\sim \pi(\lambda)\)
理解:有泊松定理的條件 \(np=\lambda\) ,也即如果無窮多次伯努利試驗中事件 \(A\) 的發生次數的期望是一個定值,則無窮多次試驗中事件 \(A\) 總的發生次數就服從泊松分布。
理解:如果二項分布的次數很多,而事件 \(A\) 發生的概率比較小,則二項分布的圖形就接近泊松分布。
理解:比如衰變,我們知道統計上大量的衰變具有一個穩定的半衰期,也即滿足泊松分布的條件(數量很大,並且每一個半衰期衰變的數量是一個定值),那么在一個半衰期內,衰變的原子的數量就基本符合泊松分布。
3.2.3 了解泊松定理的結論和應用條件,會用泊松分布近似表示二項分布
3.2.4 理解連續型隨機變量及其概率密度的概念,掌握均勻分布 \(U(a,b)\) 、正態分布 \(N(\mu,\sigma ^2)\) 、指數分布及其應用,其中參數為 \(\lambda(\lambda > 0)\) 的指數分布 \(E(\lambda)\) 的概率密度為 \(f(x)=\begin{cases}\lambda e^{-\lambda x}, & x>0\\ 0, & x\le 0\end{cases}\)
連續型隨機變量
對於隨機變量 \(X\) 的分布函數 \(F(x)\) ,如果存在非負可積函數 \(f(x)\) ,有 \(\displaystyle F(x)=\int_{-\infin}^x f(t)\text{d}t\) ,則稱隨機變量 \(X\) 為連續型隨機變量,\(f(x)\) 稱為隨機變量 \(X\) 的概率密度函數,簡稱概率密度。
注:與離散型隨機變量不同,連續性隨機變量是無限不可列的。
注:由連續型隨機變量的定義可知,該變量在某一個點上的概率為 \(0\) 。
概率密度與概率之間的關系
在某一個點的鄰域,由函數和原函數之間的關系有 \(\displaystyle f(x)=\lim_{\Delta x\rightarrow 0^+}\frac{F(x+\Delta x)-F(x)}{\Delta x}\) ,也即有 \(P\{x<X\le x+\Delta x\}=f(x)\Delta x\) 。
在某一個區間,\(\displaystyle P\{a<x\le b\}=F(b)-F(a)=(\int_{-\infin}^b -\int_{-\infin}^{a})f(t)\text{d}t=\int_{a}^{b}f(t)\text{d}t\)
結合概率的基本性質,有以下推論:
推論:概率密度不為負值。
推論:\(\displaystyle \int_{-\infin}^{+\infin} f(t)\text{d}t = 1\) 。
均勻分布
若概率密度在某一區間上是一個常數,則稱為均勻分布。
特征:
記區間為 \((a,b)\) ,則由概率性質有 \(\displaystyle \int_a^b f(t)\text{d}t=f(t)(b-a)=1\) ,即 \(\displaystyle f(t)=\frac{1}{b-a}\) 。
稱 \(X\) 在區間 \((a,b)\) 上服從均勻分布,記為 \(X\sim U(a,b)\) 。
均勻分布:\(\text{uniform distribution}\)
指數分布
若概率密度具有 \(f(t)=\begin{cases}c_1e^{c_2x},&x>0\\0,&x\le 0\end{cases}\) 的形式,則稱為指數分布。
特征:
顯然,\(c_1>0,c_2<0\) ,\(\displaystyle \int_{0}^{+\infin}f(t)\text{d}t=\frac{c_1}{c_2}e^{c_2x}|_{0}^{+\infin}=-\frac{c_1}{c_2}=1\) ,也即 \(c_1=-c_2\) 。
取 \(\displaystyle c_1=\lambda,\lambda > 0\) ,則 \(x>0\) 時,\(\displaystyle f(t)=\lambda e^{-\lambda x}\) 。
此時,\(\lambda\) 越大,則概率下降越陡,\(\theta\) 越小,則概率下降越平緩。
稱隨機變量 \(X\) 服從參數為 \(\lambda\) 的指數分布。
注:這里對參數的規定和《概率論和數理統計 浙江大學 第四版》教材中的規定不一致。
指數分布的無記憶性
無記憶性是指 \(P(X>t)=P(X>t+a|X>a)\) 。
以 \(X\) 表示元件的壽命,則元件能使用 \(t\) 小時的概率和元件經過 \(a\) 小時之后繼續使用 \(t\) 小時的概率相等。
相反,如果一個連續型隨機變量具有無記憶性的性質,則可以嘗試推斷該連續型隨機變量服從指數分布。
正態分布
若連續型隨機變量 \(X\) 的概率密度為 \(\displaystyle f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, -\infin < x < +\infin\) ,則稱 \(X\) 服從參數為 \(\mu,\sigma\) 的正態分布或高斯分布,記為 \(X\sim N(\mu,\sigma^2)\) 。
正態分布:\(\text{normal distribution}\)
高斯分布:\(\text{Gaussian distribution}\)
概率密度函數特征:
(1)函數圖形關於 \(x=\mu\) 對稱,並且在 \(x=\mu\) 處取得最大值。
(2)\(\sigma^2\) 表示隨機變量的方差,值越大,則函數圖形越平坦,值越小,則函數圖形越陡峭。
(3)\(x\) 越遠離 \(\mu\) ,函數的值越小。
(4)函數和 \(x\) 軸圍成的面積始終為 \(1\) 。
標准正態分布
若 \(X\sim N(0,1)\) ,則稱 \(X\) 服從標准正態分布。
標准正態分布的概率密度和分布函數分別表示為 \(\varphi(x),\varPhi(x)\) 。
\(\displaystyle \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\)
\(\varPhi(x)\) 可以通過編制的函數表查詢。\(\varPhi(0.5)=0.5\)
一般正態分布和標准正態分布的變換
若 \(X\sim N(\mu,\sigma^2)\) ,則 \(\displaystyle Y=\frac{X-\mu}{\sigma}\sim N(0,1)\) 。
證明:
\(\displaystyle P(Y \le y)=P(\frac{X-\mu}{\sigma} \le y)=P( X \le \sigma y+\mu )=\int_{-\infin}^{\sigma y+\mu} f(x)\text{d}x=\int_{-\infin}^{\sigma y+\mu} \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\text{d}x\)
取積分變換為 \(\displaystyle t=\frac{x-\mu}{\sigma}\) ,則有
\(\displaystyle P(Y \le y)=\int_{-\infin}^{t}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{t^2}{2}}\sigma\text{d}\text{t}=\int_{-\infin}^{t}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}\text{d}t=\int_{-\infin}^{t}\varphi(x)\text{d}t=\varPhi(t)\)
\(3\sigma\) 法則
取 \(Y\sim N(0,1)\) ,則 \(X=\sigma Y+\mu \sim N(\mu,\sigma)\) ,則有
\(\varPhi(3)-\varPhi(-3)=P(X\le 3\sigma+\mu)-P(X\le -3\sigma+\mu)=P(-3\sigma+\mu\le 3\sigma+\mu)=99.74\%\)
也即對於一般正態分布,隨機變量落在期望值左右 \(3\sigma\) 的區間內是一個大概率事件。
標准正態分布的上 \(\alpha\) 分位點
若 \(X\sim N(0,1)\) ,且 \(P(X>z_\alpha)=\alpha\) ,則稱 \(z_\alpha\) 為標准正態分布的上 \(\alpha\) 分位點。
3.2.5 會求隨機變量函數的分布
隨機變量的函數的分布
記 \(Z=f(X)\) ,其中 \(X\) 為隨機變量,則 \(Z\) 稱為隨機變量 \(X\) 的函數,相應的 \(Z\) 的分布即為隨機變量 \(X\) 的函數的分布。
隨機變量函數分布的求法
設隨機變量 \(X\) 具有概率密度 \(f_X(x),-\infin<x<+\infin\) ,又設函數 \(g(x)\) 處處可導且恆有 \(g'(x)>0\) (或恆有 \(g'(x)<0\)),則 \(Y=g(X)\) 也是連續型隨機變量,其概率密度為
\(f_Y(y)=\begin{cases}f_X(h(y))|h'(y)|,&\alpha<y<\beta\\0,&其它\end{cases}\) ,其中 \(h(y)\) 為 \(g(x)\) 的反函數。
證:
先求概率分布,然后通過求導得到概率密度。
\(P(Y\le y)=P(g(X)\le y)\) ,不妨設條件中 \(g'(x)>0\) ,則有 \(g(X)\le y \Leftrightarrow X\le h(y)\) ,也即 \(P(Y\le y)=P(X\le h(y))\) ,表示成分布函數的形式,則有 \(F_Y(y)=F_X(h(y))\) ,兩邊同時對 \(y\) 求導,則有 \(f_Y(y)=f_X(h(y))h'(y)\) 。
再設 \(g'(x)<0\) ,則有 \(P(Y<y)=P(X>h(y))=1-P(X<h(y))\) ,也即有 \(F_Y(y)=1-F_X(h(y))\) ,求導得 \(f_Y(y)=-f_X(h(y))h'(y)\) ,綜合,即得證。
3.3 多維隨機變量及其分布
3.3.1 理解多維隨機變量的概念,理解多維隨機變量的分布的概念和性質,理解二維隨機變量的概率分布、邊緣分布和條件分布,理解二維連續型隨機變量的概率密度、邊緣密度和條件密度,會求與二維隨機變量相關事件的概率
二維隨機變量
設 \(E\) 是一個隨機試驗,其樣本空間是 \(S=\{e\}\) ,設 \(X=X(e)\) 和 \(Y=Y(e)\) 是定義在樣本空間 \(S\) 上的兩個隨機變量,由它們構成的一個向量 \((X,Y)\) ,叫做二維隨機向量或者二維隨機變量。
相應地,單獨的一個隨機變量稱為一維隨機變量,樣本空間上的多個隨機變量構成的向量稱為多維隨機變量。
二維隨機變量的分布函數
對二維隨機變量 \((X,Y)\) ,稱二元函數 \(F(x,y)=P\{(X\le x)\land (Y\le y)\}\) 為二維隨機變量 \((X,Y)\) 的分布函數。記為 \(F(x,y)=P(X\le x,Y\le y)\) 。也稱為隨機變量 \(X\) 和 \(Y\) 的聯合分布函數。
注:如果將兩個隨機變量分別對應兩個坐標軸,即一個二維隨機變量對應一個平面上的點,則二維隨機變量的分布函數在 \((x,y)\) 處的函數值即為這個點對應的第三象限的概率。
二維隨機變量的分布函數的性質
(1)是一個不減函數
(2)\(F(+\infin,+\infin)=1\) ,任意一個參數為 \(-\infin\) 時函數值為 \(0\)
(3)分布函數右連續,左不一定連續
(4)用分布函數計算得到的任意一塊區域的概率為非負值。
二維離散型隨機變量
若二維隨機變量全部可能取到的值是有限對或者可列無限多對,則稱二維隨機變量為離散型隨機變量。
二維離散型隨機變量的分布律
稱 \(P(X=x_i,Y=y_i)=p_{ij}\) 為二維離散型隨機變量 \((X,Y)\) 的分布律。
二維連續型隨機變量的概率密度
若二維隨機變量 \((X,Y)\) 有分布函數 \(F(x,y)\) ,且存在非負可積函數 \(f(x,y)\) 滿足
\(\displaystyle F(x,y)=\int_{-\infin}^{y}\int_{-\infin}^{x}f(u,v)\text{d}u\text{d}v\)
\(f(x,y)\) 稱為二維連續性隨機變量 \((X,Y)\) 的概率密度,或者稱為隨機變量 \(X\) 和 \(Y\) 的聯合概率密度。
二維隨機變量的概率和概率密度之間的關系
設 \(G\) 是 \(xOy\) 平面上的一個區域,則點 \((X,Y)\) 落在區域 \(G\) 內的概率為
\(\displaystyle P\{(X,Y)\in G\}=\underset{G}{\iint} f(x,y)\text{d}s\)
證明:不證。
注:如果 \(X,Y\) 滿足一定的條件,且該條件對應於平面上的一個區域,那么根據這個性質就可以得到滿足這個條件的概率。
二維連續型隨機變量的概率密度和概率分布之間的關系
\(P\{x<X \le x+\Delta x,y<Y \le y+\Delta y\}=f(x,y)\Delta x\Delta y\)
證明:
\(\displaystyle \frac{P\{x<X \le x+\Delta x,y<Y \le y+\Delta y\}}{\Delta x\Delta y}\)
\(\displaystyle =\frac{F(x+\Delta x,y+\Delta y)-F(x+\Delta x,y)-F(x,y+\Delta y)+F(x,y)}{\Delta x\Delta y}\) (由分布函數的定義)
\(\displaystyle =\frac{F_x(x+\Delta x,y)\Delta y-F_x(x,y)\Delta y}{\Delta x\Delta y}\)
\(\displaystyle =\frac{\partial ^2F(x,y)}{\partial x\partial y}=f(x,y)\) (由二維連續型隨機變量的定義)
二維隨機變量的邊緣分布函數
對於二維隨機變量 \((X,Y)\),其中的 \(X,Y\) 分別都是隨機變量,有各自的分布函數,稱為二維隨機變量的分布函數,依次記為 \(F_X(x),F_Y(y)\)。
由隨機變量的值的取值范圍可知 \(F_X(x)=P\{X<x,Y<+\infin\}=F_X(x,+\infin)\)
二維離散型隨機變量的邊緣分布函數即為邊緣分布律,如 \((X,Y)\) 關於 \(X\) 的邊緣分布律為 \(p_{i.}\) ,且有 \(\displaystyle p_{i.}=\sum_{j=1}^\infin p_{ij}\) ,其中 \(p_{ij}=P\{X=x_i,Y=y_j\}\) 。
二維連續型隨機變量的邊緣分布函數即為邊緣概率密度,\(\displaystyle F_X(x)=F_X(x,+\infin)=\int_{-\infin}^{x}\int_{-\infin}^{+\infin}f(x,y)\text{d}y\text{d}x\) ,也即 \(\displaystyle f_X(x)=\int_{-\infin}^{+\infin}f(x,y)\text{d}y\)
離散型隨機變量的條件分布律
稱 \(P\{X=x_i|Y=y_j\}\) 為 \(Y=y_i\) 條件下隨機變量 \(X\) 的條件分布律。
其中,\((X,Y)\) 是二維離散型隨機變量,且假設 \(P(Y=y_i)>0\)。
連續型隨機變量的條件概率密度
在 \(Y=y\) 條件下連續型隨機變量的概率密度記為 \(f_{X|Y}\) ,且有 \(\displaystyle f_{X|Y}=\frac{f(x,y)}{f_Y(y)}\) 。
推導:
雖然這是連續型隨機變量的條件概率密度的定義,但是其和離散型條件變量的條件概率具有一致性。
先給出條件分布函數,然后對條件分布函數求導,即得條件概率密度。
\(\displaystyle P(X \le x|Y=y)=\lim_{\varepsilon \rightarrow 0}P(X<x|y<Y<y+\varepsilon)\)
\(\displaystyle =\lim_{\varepsilon \rightarrow 0}\frac{P\{X<x,y<Y<y+\varepsilon\}}{y<Y<y+\varepsilon}\)
\(\displaystyle =\lim_{\varepsilon \rightarrow 0}\frac{\displaystyle \int_{-\infin}^{x}\int_{y}^{y+\varepsilon}f(x,y)\text{d}y\text{d}x}{\displaystyle \int_{-\infin}^{+\infin}\int_{y}^{y+\varepsilon}f(x,y)\text{d}y\text{d}x}\)
\(\displaystyle =\lim_{\varepsilon \rightarrow 0}\frac{\displaystyle \varepsilon \int_{-\infin}^{x}f(x,y)\text{d}x}{\varepsilon f_Y(y)}\)
關於 \(x\) 求導,即有條件概率密度為 \(\displaystyle f_{X|Y}=\frac{f(x,y)}{f_Y(y)}\)
3.3.2 理解隨機變量的獨立性及不相關性的概念,掌握隨機變量相互獨立的條件
相互獨立的隨機變量
對二維隨機變量 \((X,Y)\) ,若有 \(P\{X \le x,Y \le y\}=P\{X \le x\}P\{Y \le y\}\) ,也即 \(F(x,y)=F_X(x)F_Y(y)\) ,則稱隨機變量 \(X\) 和 \(Y\) 是相互獨立的。
注:這個定義實際上是在定義兩個隨機變量的獨立性。(而不是兩個二維隨機變量的獨立性)
注:
二維隨機變量的獨立性定義和事件的獨立性定義是統一的:
對離散型隨機變量,有 \(\displaystyle P\{\bigcup_{i=1}^{m}X=x_i , \bigcup_{i=1}^{n}Y=y_i\}=P\{\bigcup_{i=1}^{m}X=x_i\}P\{\bigcup_{i=1}^{n}Y=y_i\}\)
為了書寫簡便,這里記為 \(P(\sum m,\sum n)=P(\sum m)P(\sum n)\) ,
由概率的基本性質有 \(P(m,n)=P(\sum m,\sum n)-P(\sum m,\sum n-1)-P(\sum m-1, \sum n)+P(\sum m-1, \sum n-1)\) ,
利用定義進行分解,有
\(P(m,n)=P(\sum m)P(\sum n)-P(\sum m)P(\sum n-1)-P(\sum m-1)P(\sum n)+P(\sum m-1)P(\sum n-1)=P(\sum m)P(n)-P(\sum m-1)P(n)=P(m)P(n)\) ,
即離散型隨機變量的獨立性和事件的獨立性的定義是一致的。
對連續型隨機變量,直接對概率分布求導,有 \(\displaystyle \frac{\partial ^2 F(x,y)}{\partial x\partial y}=f_X(x)f_Y(y)=f(x,y)\) 。
也即連續型隨機變量的獨立性和事件的獨立性的定義也是一致的。(這里事件理解為連續型隨機變量在某一個極小區間內)
注:\(f_X(x)f_Y(y)=f(x,y)\) 同時也是連續型隨機變量獨立性的等價定義。
定義推廣:多個隨機變量相互獨立
若 \(n\) 維隨機變量滿足 \(F(x_1,x_2,...,x_n)=F_{X_1}(x_1)F_{X_2}(x_2)...F_{X_n}(x_n)\) ,則稱 \(X_1,X_2,...,X_n\) 是相互獨立的。
定義推廣:多維隨機變量相互獨立
若 \(F(x_1,x_2,...,x_n,y_1,y_2,...,y_m)=F_1(x_1,x_2,...,x_n)F_2(y_1,y_2,...,y_m)\) ,其中 \(F,F_1,F_2\) 分別為 \((X_i,Y_i),(X_i),(Y_i)\) 的分布函數,則稱這兩個多維隨機變量相互獨立。
注:注意這些定義的形式。
推論:
多維隨機變量相互獨立,則其函數也相互獨立。即若多維隨機變量 \((X_i)\) 和 \((Y_i)\) 相互獨立,則 \(X_i\) 和 \(Y_i\) 相互獨立;若 \(h,g\) 是連續函數,則也有 \(h((X_i))\) 和 \(g((Y_i))\) 相互獨立。
證明:不證。
3.3.3 掌握二維均勻分布,了解二維正態分布 \(N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\) 的概率密度,理解其中參數的概率意義
二維均勻分布
對二維隨機變量 \((X,Y)\) ,若其概率密度 \(f(x,y)\) 是一個常數,則其分布為二維均勻分布。
二維正態分布
若二維隨機變量 \((X,Y)\) 的概率密度函數為
\(\displaystyle f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2 \sqrt{1-\rho^2}} \exp \{\frac{-1}{2(1-\rho)^2}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\}\)
則稱二維隨機變量為服從參數 \(\mu_1,\mu_2\,\sigma_1,\sigma_2,\rho\) 的二維正態分布,記為 \((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\) 。
可以解得,\(\displaystyle f_X(x)=\int_{-\infin}^{+\infin} f(x,y)\text{d}y=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\) ,也即二維正態分布的邊緣分布也是一個正態分布。
注:注意邊緣分布中消去了參數 \(\rho\) ,這說明由邊緣分布,是不能確定聯合分布的。
二維正態分布的參數的含義
\(E(X)=\mu_1,E(Y)=\mu_2,D(X)=\sigma_1,D(Y)=\sigma_2,\rho_{XY}=\rho\)
3.3.4 會求兩個隨機變量簡單函數的分布,會求多個相互獨立隨機變量簡單函數的分布
\(Z=X+Y\) 的分布
已知二維隨機變量 \((X,Y)\) 是二維連續型隨機變量,且具有聯合概率密度 \(f(x,y)\) 。
\(\displaystyle F_Z(z)=P\{X+Y \le z\}=\underset{x+y<z}{\iint} f(x,y)\text{d}x\text{d}y=\int_{-\infin}^{+\infin}\int_{-\infin}^{z-x}f(x,y)\text{d}y\text{d}x\)
當 \(y=z-x\) 時,取 \(u=y+x\) ,即可替換積分限,有
\(\displaystyle F_Z(z)=\int_{-\infin}^{+\infin}\int_{-\infin}^{z}f(u-y,y)\text{d}u\text{d}x\)
注意此時內側積分和外側積分沒有變量關聯,即可交換積分限,有
\(\displaystyle F_Z(z)=\int_{-\infin}^{z}\int_{-\infin}^{+\infin}f(u-y,y)\text{d}x\text{d}u\)
聯系概率分布和概率密度的定義,有
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f(z-y,y)\text{d}y\)
將二重積分化為累次積分時,取另一種轉化方式,則有
\(\displaystyle F_Z(z)=\int_{-\infin}^{+\infin}\int_{-\infin}^{z-y}f(x,y)\text{d}x\text{d}y\) ,按相同的方法,可以得到
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f(x,z-x)\text{d}x\)
綜合有
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f(z-y,y)\text{d}y=\int_{-\infin}^{+\infin} f(x,z-x)\text{d}x\)
卷積公式
對 \(Z=X+Y\) ,若 \(X,Y\) 相互獨立,則
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f_X(z-y)f_Y(y)\text{d}y=\int_{-\infin}^{+\infin} f_X(x)f_Y(z-x)\text{d}x\)
稱為 \(f_X(x),f_Y(y)\) 的卷積公式,記為 \(f_X * f_Y\) 。
或者說,兩個獨立的隨機變量 \(X,Y\) 的和 \(X+Y\) 的概率密度是這兩個隨機變量各自的概率密度的卷積。
有限個相互獨立的正態隨機變量的線性組合仍然服從正態分布。
\(\displaystyle Z=\frac{Y}{X},Z=XY\) 的分布
先上結論,然后對結論進行簡單推導
\(\displaystyle f_{Y/X}(z)=\int_{-\infin}^{+\infin}|x|f(x,xz)\text{d}x\)
\(\displaystyle f_{XY}(z)=\int_{-\infin}^{+\infin}\frac{1}{|x|}f(x,z/x)\text{d}x\)
推導:
對 \(Z=XY\) ,
\(\displaystyle F_Z(z)=\{XY\le z\}=\int_{-\infin}^{0}\int_{z/x}^{+\infin}f(x,y)\text{d}y\text{d}x+\int_{0}^{+\infin}\int_{-\infin}^{z/x}f(x,y)\text{d}y\text{d}x\)
當 \(y=z/x\) 時,取 \(u=yx\) ,則有
\(\displaystyle F_Z(z)=\int_{-\infin}^{0}\int_{z}^{-\infin} f(x,u/x)\text{d}(u/x)\text{d}x+\int_{0}^{+\infin}\int_{-\infin}^{z}f(x,u/x)\text{d}(u/x)\text{d}x=\int_{-\infin}^{0}\frac{1}{x}\int_{-\infin}^{z} -f(x,u/x)\text{d}u\text{d}x+\int_{0}^{+\infin}\frac{1}{x}\int_{-\infin}^{z}f(x,u/x)\text{d}u\text{d}x=\int_{-\infin}^{+\infin}\frac{1}{|x|}\int_{-\infin}^{z}f(x,u/x)\text{d}u\text{d}x=\int_{-\infin}^{z}\int_{-\infin}^{+\infin}\frac{1}{|x|}f(x,u/x)\text{d}x\text{d}u\)
由概率分布和概率密度的定義,即得證。
注:以上求兩個隨機變量的分布時,並不要求獨立。
\(Z=max(X,Y),Z=min(X,Y),Z=max(X_i),Z=min(Y_i)\) 的分布
\(F_{max}(z)=P\{max(X,Y)\le z\}=P\{X\le z,Y\le z\}\)
假設 \(X,Y\) 相互獨立,則有 \(F_{max}(z)=F_X(z)F_Y(z)\)
\(F_{min}(z)=P\{min(X,Y)<z\}=1-P\{min(X,Y)\ge z\}=1-P\{X\ge z,Y\ge z\}\)
假設 \(X,Y\) 相互獨立,則有 \(F_{min}(z)=1-(1-F_X(z))(1-F_Y(z))\)
3.4 隨機變量的數字特征
3.4.1 理解隨機變量的數字特征(數學期望、方差、標准差、矩、協方差、相關系數)的概念,會運用數字特征的基本性質,並掌握常用分布的數字特征
數學期望
對離散型隨機變量 \(X\),若其分布律為 \(P\{X=x_k\}=p_k\) ,且級數 \(\displaystyle \sum_{i=1}^{\infin}p_ix_i\) 絕對收斂,則稱級數的和為隨機變量 \(X\) 的數學期望,記為 \(E(X)\) ,即有 \(\displaystyle E(X)=\sum_{i=1}^{\infin}p_ix_i\) 。
對連續型隨機變量 \(X\),若其概率密度為 \(f(x)\) ,且積分 \(\displaystyle \int_{-\infin}^{+\infin}xf(x)\text{d}x\) 絕對收斂,則稱積分為連續性隨機變量 \(X\) 的數學期望,即有 \(\displaystyle E(X)=\int_{-\infin}^{+\infin} xf(x)\text{d}x\) 。
注:從含義上來講,隨機變量的數學期望就是隨機變量的平均值。
注:數學期望的定義都使用了絕對收斂的概念。首先,如果收斂而不絕對收斂,對於離散型隨機變量,可以通過調整序列的順序和組合方式,使得序列變得不收斂,這不符合數學期望的客觀含義(平均值應該是不變的)。對於離散型隨機變量,更有函數可積當且僅當其絕對值可積。
隨機變量的函數的數學期望
離散型隨機變量的函數的數學期望
對離散型隨機變量 \(X\) ,其分布律為 \(P\{X=x_i\}=p_i\) ,設 \(Y=g(X)\) ,\(g\) 是連續函數,且 \(\displaystyle \sum_{i=1}^{\infin}g(x_i)p_i\) 絕對收斂,則有 \(\displaystyle E(Y)=E(g(X))=\sum_{i=1}^{\infin}g(x_i)p_i\) 。
連續型隨機變量的函數的數學期望
對連續型隨機變量 \(X\) ,其概率密度為 \(f(x)\) ,設 \(Y=g(X)\) ,\(g\) 是連續函數,且 \(\displaystyle \int_{-\infin}^{+\infin}g(x)f(x)\text{d}x\) 絕對收斂,則有 \(\displaystyle E(Y)=E(g(X))=\int_{-\infin}^{+\infin}g(x)f(x)\text{d}x\) 。
記憶:離散型隨機變量和連續型隨機變量的數學期望的定義式,可以看作函數是 \(g(x)=x\) 的期望。也即要求隨機變量的函數的期望,只需要將定義式中的 \(x\) 改為對應的 \(g(x)\) 即可。
注意:和隨機變量的函數的概率密度求法中不同,求隨機變量的期望的時候,並不需要函數單調。也可以理解為結果中並沒有出現反函數。
完整的證明不證。函數單調是一個更為嚴格的條件,在這個條件下對連續型隨機變量可以簡單證明:
假設 \(g'(x)>0\) ,且有反函數 \(x=h(y)\) ,則有 \(Y=g(X)\) 的概率密度為 \(f_Y(x)=f_X(h(x))|h'(x)|\) ,因此有其數學期望為 \(\displaystyle E(Y)=\int_{-\infin}^{+\infin}yf_Y(y)\text{d}y=\int_{-\infin}^{+\infin}yf_X(h(y))h'(y)\text{d}y\) ,由 \(y=g(x),x=h(y)\) ,故有 \(\displaystyle E(Y)=\int_{-\infin}^{+\infin}g(x)f(x)\text{d}x\) 。
二維隨機變量的函數的數學期望
設 \(Z=g(X,Y)\) ,\(g\) 是連續函數
若 \(Z\) 是連續型隨機變量,且 \(X,Y\) 有聯合概率密度 \(f(x,y)\) ,則有 \(\displaystyle E(Z)=E(g(X,Y))=\int_{-\infin}^{+\infin} \int_{-\infin}^{+\infin} g(x,y)f(x,y)\text{d}x\text{d}y\) 。
證明:不證,記住這個形式。
數學期望的幾個運算性質
\(E(C)=C\)
證:常數可以看作是離散型隨機變量,且分布律為 \(P(X=C)=1\) ,因此 \(E(X)=CP\{X=C\}=C\) 。
注:期望是隨機變量的期望,因此這里直接對常數求期望可以理解為一種記法。
\(E(CX)=CE(X)\)
證:理解為隨機變量的函數的期望,以連續型隨機變量為例,即 \(\displaystyle E(CX)=\int_{-\infin}^{+\infin}Cf(x)\text{d}x=CE(X)\) ,即得證。
\(E(X+Y)=E(X)+E(Y)\)
證:由二維隨機變量的函數的期望,只證連續型隨機變量,有 \(\displaystyle E(X+Y)=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}(x+y)f(x,y)\text{d}x\text{d}y=\int_{-\infin}^{+\infin}\int_{-\infin}^{\infin}xf(x,y)\text{d}x\text{d}y+\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}yf(x,y)\text{d}x\text{d}y\) ,對第一個式子,先對 \(y\) 積分,即為 \(\displaystyle A=\int_{-\infin}^{+\infin}x\int_{-\infin}^{+\infin}f(x,y)\text{d}y\text{d}x=\int_{-\infin}^{+\infin}xf_X(x)\text{d}x=E(X)\) ,對第二個式子類似,即得證。
推廣:若函數只包含加減以及常數乘法,則隨機變量的函數的期望就是隨機變量的期望的函數,對一個隨機變量成立,對多個隨機變量也成立。
\(E(XY)=E(X)E(Y)\) ( \(X,Y\) 相互獨立)
證:由二維隨機變量的函數的期望,只證連續型隨機變量,有 \(\displaystyle E(XY)=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf(x,y)\text{d}x\text{d}y\) ,由相互獨立,有 \(f(x,y)=f_X(x)f_Y(y)\) ,即 \(\displaystyle E(XY)=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf_X(x)f_Y(y)\text{d}x\text{d}y=\int_{-\infin}^{+\infin}xf_X(x)\int_{-\infin}^{+\infin}yf_Y(y)\text{d}y\text{d}x=E(X)E(Y)\) 。
方差
方差是隨機變量偏離其均值的偏離程度的均值,記為 \(D(X)\) ,即 \(D(X)=E((X-E(X))^2)\) 。
推論:
\(D(X)=E((X-E(X))^2)=E(X^2-2XE(X)+E^2(X))=E(X^2)-2E^2(X)+E^(X)=E(X^2)-E^2(X)\) 。
標准差
方差開方即為標准差,記為 \(\sigma(X)\) ,有 \(\sigma(X)=\sqrt{D(X)}=E(|X-E(X)|)\) 。
隨機變量的函數的方差
通過方差的定義式計算即可,如對 \(Z=g(X)\) ,有 \(D(Z)=E(Z^2)-E^2(Z)=E(g^2(Z))-E^2(g(Z))\) 。
方差的幾個運算性質
\(D(C)=0\)
證:\(D(C)=E(C^2)-E^2(C)=C^2-C^2=0\) 。
\(D(CX)=C^2D(X)\)
證:\(D(CX)=E(C^2X^2)-E^2(CX)=C^2E(X^2)-C^2E^2(X)=C^2D(X)\) 。
\(D(X+Y)=D(X)+D(Y)+2E((X-E(X))(Y-E(Y)))\)
證:\(D(X+Y)=E(((X+Y)-E(X+Y))^2)=E((X-E(X)+Y-E(Y))^2)=E((X-E(X))^2)+E((Y-E(Y))^2)+E(2(X-E(X))(Y-E(Y)))=D(X)+D(Y)+2E(X-E(X))(Y-E(Y))\)
注:
這里還有另一種變形方法:\(D(X+Y)=E((X+Y)^2)-E^2(X+Y)=E(X^2+2XY+Y^2)-(E(X)+E(Y))^2=E(X^2)-E^2(X)+E(Y^2)-E^2(Y)+2(E(XY)-E(X)E(Y))=D(X)+D(Y)+2(E(XY)-E(X)E(Y))\)
第一種變形再進一步分解,即得到第二種變形的結果。
若 \(X,Y\) 相互獨立,則
\(D(X+Y)=D(X)+D(Y)\)
證:由於 \(X,Y\) 相互獨立時,\(E(XY)=E(X)E(Y)\) ,結合上一個結論,即得證。
\(D(X)=0 \Leftrightarrow P\{X=E(X)\}=1\)
充分性:
由 \(P\{X=E(X)\}=1\) ,故有 \(P\{X^2=E^2(X)\}=1\) ,即 \(E(X^2)=E^2(X)\) ,即 \(D(X)=0\) 。
必要性:
反證法:設 \(D(X)=0\) ,且 \(P\{X=E(X)\}< 1\) ,也即有 \(P\{X\not = E(X)\}\not =0\) ,即有 \(P\{|X-E(X)|>0\}>0\) ,這里不妨確定一個極小的數 \(\varepsilon\) ,同樣滿足 \(P\{|X-E(X)|>\varepsilon\}>0\) ,而由切比雪夫不等式,由於 \(D(X)=0\) ,即有 \(\sigma^2=0\) ,即有 \(P\{|X-E(X)|>\varepsilon\}\le 0\) ,出現了矛盾,即得證。
隨機變量的矩
設 \(X,Y\) 是隨機變量,則有以下定義:
\(E(X^k)\) :\(k\) 階原點矩,簡稱 \(k\) 階矩。
\(E((X-E(X))^k)\) :\(k\) 階中心矩。
\(E(X^mY^n)\) :\(m+n\) 階混合矩。
\(E((X-E(X))^m(Y-E(Y))^n)\) :\(m+n\) 階混合中心矩。
注:一階原點矩就是期望,二階中心矩就是方差。原點矩描述隨機變量的值的大小分布,中心矩描述隨機變量的波動分布(描述不一定准確)。
協方差
對於隨機變量 \(X,Y\) ,稱 \(E[(X-E(X))(Y-E(Y))]\) 為 \(X,Y\) 的協方差,記為 \(Cov(X,Y)\) ,即 \(Cov(X,Y)=E[(X-E(X))(Y-E(Y))]\) 。
協方差的常用運算性質
\(Cov(X,Y)=E(XY)-E(X)E(Y)\)
證明:\(Cov(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY-XE(X)-YE(Y)+E(X)E(Y))=E(XY)-E(X)E(Y)\)
\(Cov(C,X)=0\)
證明:\(Cov(C,X)=E((C-E(C))(X-E(X)))=0\)
\(Cov(X,X)=D(X)\)
證明:\(Cov(X,X)=E((X-E(X))^2)=E(X^2)-E^2(X)=D(X)\)
\(Cov(aX,bY)=abCov(X,Y)\)
證明:\(Cov(aX,bY)=E((aX-E(aX))(bY-E(bY)))\) ,由期望的運算性質,即得證。
\(Cov(aX+c,bY+d)=abCov(X,Y)\)
證明:\(Cov(aX+c,bY+d)=E((aX+c-E(aX+c))(bY+d-E(bY+d)))=E((aX+c)(bY+d)-(bY+d)E(aX+c)-(aX+c)E(bY+d)+E(aX+c)E(bY+d))=abE(XY)+adE(X)+cbE(Y)+cd-(bE(Y)+d)(aE(X)+c)=ab(E(XY)-E(X)E(Y))=abCov(X,Y)\)
這個公式說明,線性運算會改變協方差的大小。
\(Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)\)
證明:\(Cov(X_1+X_2,Y)=E((X_1+X_2-E(X_1+X_2))(Y-E(Y)))=E((X_1-E(X_1)+X_2-E(X_2))(Y-E(Y)))=Cov(X_1,Y)+Cov(X_2,Y)\) ,即得證。
相關系數
稱 \(\displaystyle \rho_{XY}=\frac{Cov(X,Y)}{\sigma(X)\sigma(Y)}\) 為隨機變量 \(X,Y\) 的相關系數,其中 \(Cov(X,Y)\) 為協方差,\(\sigma(X),\sigma(Y)\) 為標准差。
相關系數的性質
相關系數是用來描述兩個隨機變量線性相關的期望。
記 \(f=E((X-(a+bY))^2)\) ,現求出某一組系數 \(a,b\) 使得 \(f\) 的值最小,這樣得到的 \(f\) 即為兩個隨機變量的最大線性相關性。
\(f=E(X^2-2aX-2bXY+a^2+2abY+b^2Y^2)=E(X^2)-2aE(X)-2bE(XY)+a^2+2abE(Y)+b^2E(Y^2)\) ,有
\(\begin{cases}\displaystyle \frac{\partial f}{\partial a}=-2E(X)+2a+2bE(Y) \\\displaystyle \frac{\partial f}{\partial b}=-2E(XY)+2aE(Y)+2bE(Y^2)\end{cases}\)
注意:這里只能用分解后的函數形式來求解。隨機變量的期望是一個常數,但是隨機變量不是。如果把隨機變量看成是一個常數進行運算,就會得到一個拋物線平移形成的曲面,這樣的曲面具有無數個最小值點。
取兩個偏導數均為 \(0\) ,由於函數有最小值,沒有最大值,因此得到的就是最小值點。解為:
\(\begin{cases}\displaystyle a=E(X)-\frac{Cov(X,Y)E(Y)}{D(Y)}\\\displaystyle b=\frac{E(XY)-E(X)E(Y)}{E(Y^2)-E^2(Y)}=\frac{Cov(X,Y)}{D(Y)}\end{cases}\)
對 \(f\) 進行變形,
由於 \(D(X)=E(X^2)-E^2(X)\) ,故 \(f=D(X-a-bY)-E^2(X-a-bY)\) ,而 \(E(X-a-bY)=E(X)-a-bE(Y)\) 和求解方程一致,也即在解的情況下值為 \(0\) ,故
\(\displaystyle f=D(X-a-bY)=D(X)+b^2D(Y)-2bCov(X,Y)=D(X)-\frac{Cov^2(X,Y)}{D(Y)}=D(X)(1-\frac{Cov^2(X,Y)}{D(X)D(Y)})=D(X)(1-\rho_{XY}^2)\)
因此有
相關系數 \(|\rho|\le 1\) ;
\(|\rho_{XY}|=1\) 的充要條件是存在 \(a,b\) 使 \(P\{X=a+bY\}\) ;
相關系數的運算性質
\(\displaystyle \rho(aX+b,cY+d)=\frac{Cov(aX+b,cY+d)}{\sigma(aX+b)\sigma(cY+d)}=\frac{abCov(X,Y)}{ab\sigma(X)\sigma(Y)}=\rho(X,Y)\) ,這個公式反映出,線性運算不改變相關系數的大小。