数学大纲2021复习
本文列举 2021 数学一考研大纲内容,并将不熟悉的、易错题型摘录于本文中,便于复习。
- 数学大纲2021复习
- 1 高等数学
- 1.1 函数、极限、连续
- 1.1.1 理解函数的概念,掌握函数的表示法,会建立应用问题的函数关系
- 1.1.2 了解函数的有界性、单调性、周期性和奇偶性
- 1.1.3 理解复合函数及分段函数的概念,了解反函数及隐函数的概念
- 1.1.4 掌握基本初等函数的性质及其图形,了解初等函数的概念
- 1.1.5 理解极限的概念,理解函数左极限与右极限的概念以及函数极限存在与左极限、右极限之间的关系
- 1.1.6 掌握极限的性质及四则运算法则
- 1.1.7 掌握极限存在的两个准则,并会利用它们求极限,掌握利用两个重要极限求极限的方法
- 1.1.8 理解无穷小量、无穷大量的概念,掌握无穷小量的比较方法,会用等价无穷小量求极限
- 1.1.9 理解函数连续性的概念(含左连续与右连续),会判别函数间断点的类型
- 1.1.10 了解连续函数的性质和初等函数的连续性,理解闭区间上连续函数的性质(有界性、最大值和最小值定理、介值定理),并会应用这些性质
- 1.2 一元函数微分学
- 1.2.1 理解导数和微分的概念,理解导数与微分的关系,理解导数的几何意义,会求平面曲线的切线方程和法线方程,了解导数的物理意义,会用导数描述一些物理量,理解函数的可导性与连续性之间的关系
- 1.2.2 掌握导数的四则运算法则和复合函数的求导法则,掌握基本初等函数的导数公式,了解微分的四则运算和一阶微分形式的不变性,会求函数的微分
- 1.2.3 了解高阶导数的概念,会求简单函数的高阶导数
- 1.2.4 会求分段函数的导数,会求隐函数和由参数方程所确定的函数以及反函数的导数
- 1.2.5 理解并会用罗尔定理、拉格朗日中值定理和泰勒定理,了解并会用柯西中值定理
- 1.2.6 掌握用洛必达法则求未定式极限的方法
- 1.2.7 理解函数的极值概念,掌握用导数判断函数的单调性和求函数极值的方法,掌握函数最大值和最小值的求法及其应用
- 1.2.8 会用导数判断函数图形的凹凸性,会求函数图形的拐点以及水平、铅直和斜渐近线,会描绘函数的图形
- 1.2.9 了解曲率、曲率圆与曲率半径的概念,会计算曲率和曲率半径
- 1.3 一元函数积分学
- 1.4 向量代数和空间解析几何
- 1.4.1 理解空间直角坐标系,理解向量的概念及其表示
- 1.4.2 掌握向量的运算(线性运算、数量积、向量积、混合积),了解两个向量垂直、平行的条件
- 1.4.3 理解单位向量、方向数与方向余弦、向量的坐标表达式,掌握用坐标表达式进行向量运算的方法
- 1.4.4 掌握平面方程和直线方程及其求法
- 1.4.5 会求平面与平面、平面与直线、直线与直线之间的夹角,并会利用平面、直线的相互关系(平行、垂直、相交等)解决有关问题
- 1.4.6 会求点到直线以及点到平面的距离
- 1.4.7 了解曲面方程和空间曲线方程的概念
- 1.4.8 了解常用二次曲面的方程及其图形,会求简单的柱面和旋转曲面的方程
- 1.4.9 了解空间曲线的参数方程和一般方程,了解空间曲线在坐标平面上的投影,并会求该投影曲线的方程
- 1.5 多元函数微分学
- 1.5.1 理解多元函数的概念,理解二元函数的几何意义
- 1.5.2 了解二元函数的极限与连续的概念以及有界闭区间上连续函数的性质
- 1.5.3 理解多元函数和全微分的概念,会求全微分,了解全微分存在的必要条件和充分条件,了解全微分的形式不变性
- 1.5.4 理解方向导数与梯度的概念,并掌握其计算方法
- 1.5.5 掌握多元复合函数一阶、二阶偏导数的求法
- 1.5.6 了解隐函数存在定理,会求多元隐函数的偏导数
- 1.5.7 了解空间曲线的切线和法平面及曲面的切平面和法线的概念,会求它们的方程
- 1.5.8 了解二元函数的二阶泰勒公式
- 1.5.9 理解多元函数极值和条件极值的概念,掌握多元函数极值存在的必要条件,了解二元函数极值存在的充分条件,会求二元函数的极值,会用拉格朗日乘数法求条件极值,会求简单多元函数的最大值和最小值,并会解决一些简单的应用问题
- 1.6 多元函数积分学
- 1.6.1 理解二重积分、三重积分的概念,了解重积分的性质,了解二重积分的中值定理
- 1.6.2 掌握二重积分的计算方法(直角坐标、极坐标),会计算三重积分(直角坐标、柱面坐标、球面坐标)
- 1.6.3 理解两类曲线积分的概念,了解两类曲线积分的性质及两类曲线积分的关系
- 1.6.4 掌握计算两类曲线积分的方法
- 1.6.5 掌握格林公式并会运用平面曲线积分与路径无关的条件,会求二元函数全微分的原函数
- 1.6.6 了解两类曲面积分的概念、性质及两类曲面积分的关系,掌握计算两类曲面积分的方法,掌握用高斯公式计算曲面积分的方法,并会用斯托克斯公式计算曲线积分
- 1.6.7 了解散度与旋度的概念,并会计算
- 1.6.8 会用重积分、曲线积分及曲面积分求一些几何量与物理量(平面图形的面积、体积、曲面面积、弧长、质量、质心、形心、转动惯量、引力、功及流量等)
- 1.7 无穷级数
- 1.7.1 理解常数项级数收敛、发散以及收敛级数的和的概念,掌握级数的基本性质及收敛的必要条件
- 1.7.2 掌握几何级数与 p 级数的收敛与发散的条件
- 1.7.3 掌握正项级数收敛性的比较判别法、比值判别法、根植判别法,会用积分判别法
- 1.7.4 掌握交错级数的莱布尼茨判别法
- 1.7.5 了解任意项级数绝对收敛与条件收敛的概念以及绝对收敛与收敛的关系
- 1.7.6 了解函数项级数的收敛域及和函数的概念
- 1.7.7 理解幂级数收敛半径的概念,并掌握幂级数的收敛半径、收敛区间及收敛域的求法
- 1.7.8 了解幂级数在其收敛区间内的基本性质(和函数的连续性、逐项求导和逐项积分),会求一些幂级数在收敛区间内的和函数,并会由此求出某些常数项级数的和
- 1.7.9 了解函数展开为泰勒级数的充分必要条件
- 1.7.10 掌握 $e^x,\sin x,\cos x,\ln(1+x)$ 及 $(1+x)^a$ 的麦克劳林展开式,会用它们将一些简单函数间接展开为幂级数
- 1.7.11 了解傅立叶级数的概念和狄利克雷收敛定理,会将定义在 $[-l,l]$ 上的函数展开为傅立叶级数,会将定义在 $[0,l]$ 上的函数展开为正弦级数与余弦级数,会写出傅立叶级数的和函数的表达式
- 1.8 常微分方程
- 1.8.1 了解微分方程及其阶、解、通解、初始条件和特解等概念
- 1.8.2 掌握变量可分离的微分方程及一阶线性微分方程的解法
- 1.8.3 会解齐次微分方程、伯努利方程和全微分方程,会用简单的变量代换解某些微分方程
- 1.8.4 会用降阶法解下列形式的微分方程:$y^{(n)}=f(x),y''=f(x,y')$ 和 $y''=f(y,y')$
- 1.8.5 理解线性微分方程解的性质及解的结构
- 1.8.6 掌握二阶常系数齐次线性微分方程的解法,并会解某些高于二阶的常系数齐次线性微分方程
- 1.8.7 会解自由项为多项式、指数函数、正弦函数余弦函数以及它们的和与积的二阶常系数非齐次线性微分方程
- 1.8.8 会解欧拉方程
- 1.8.9 会用微分方程解决一些简单的应用问题
- 1.1 函数、极限、连续
- 2 线性代数
- 3 概率论与数理统计
- 3.1 随机事件和概率
- 3.2 随机变量及其分布
- 3.2.1 理解随机变量的概念,理解分布函数 $F(x)=P{X\le x}(-\infin < x < \infin)$ 的概念及性质,会计算与随机变量相联系的事件的概率
- 3.2.2 理解离散型随机变量及其概率分布的概念,掌握 0-1 分布、二项分布 $B(n,p)$ 、几何分布、超几何分布、泊松分布 $P(\lambda)$ 及其应用
- 3.2.3 了解泊松定理的结论和应用条件,会用泊松分布近似表示二项分布
- 3.2.4 理解连续型随机变量及其概率密度的概念,掌握均匀分布 $U(a,b)$ 、正态分布 $N(\mu,\sigma ^2)$ 、指数分布及其应用,其中参数为 $\lambda(\lambda > 0)$ 的指数分布 $E(\lambda)$ 的概率密度为 $f(x)=\begin{cases}\lambda e^{-\lambda x}, & x>0\ 0, & x\le 0\end{cases}$
- 3.2.5 会求随机变量函数的分布
- 3.3 多维随机变量及其分布
- 3.4 随机变量的数字特征
- 3.5 大数定律和中心极限定理
- 3.6 数理统计的基本概念
- 3.7 参数估计
- 1 高等数学
1 高等数学
1.1 函数、极限、连续
1.1.1 理解函数的概念,掌握函数的表示法,会建立应用问题的函数关系
1.1.2 了解函数的有界性、单调性、周期性和奇偶性
1.1.3 理解复合函数及分段函数的概念,了解反函数及隐函数的概念
显函数
表达式中左侧是因变量的符号,右侧是含有自变量的式子。
隐函数
方程 \(F(x,y)=0\) ,当变量在某一范围内取值时,相应地总有唯一的满足方程的 \(y\) 存在,则说方程在这一范围内确定了一个隐函数。
1.1.4 掌握基本初等函数的性质及其图形,了解初等函数的概念
- 基本初等函数
幂函数、指数函数、对数函数、三角函数、反三角函数五类函数称为基本初等函数。
\(y=x^\mu(\mu\in \boldsymbol{R})\)
\(y=a^x(a>0\land a\not =1)\)
\(y=\log_ax(a>0\land a\not =1)\)
\(y=\sin x,y=\cos x,y=\tan x\) 等
\(y=\arcsin x,y=\arccos x,y=\arctan x\) 等
由常数和基本初等函数经过有限次的四则运算和有限次的函数复合步骤所构成并且可用一个式子表示的函数,称为初等函数。
1.1.5 理解极限的概念,理解函数左极限与右极限的概念以及函数极限存在与左极限、右极限之间的关系
书中介绍了数列的极限和函数的极限,定义方式是“对任意,总存在”,也即当下标足够大,或者自变量足够接近某个数时,能够使数列元素或函数值足够接近。
数列极限的定义
设 \(\{x_n\}\) 为一数列,如果存在常数 \(a\) ,对于任意给定的正数 \(\varepsilon\) (不论这个数多么小),总存在正整数 \(N\) ,使得当 \(n>N\) 时,不等式 \(|x_n-a|<\varepsilon\) 都成立,那么就称常数 \(a\) 是数列 \(\{x_n\}\) 的极限,或者称数列 \(\{x_n\}\) 收敛于 \(a\) ,记为 \(\lim\limits_{n\rightarrow\infin}x_n=a\) 。
注意:
不论是数列的极限,还是函数的极限,都是一个确定的数(或者说,如果这个数不存在,则极限不存在)。因此如果给定了极限的范围,那么极限一定可以取这个范围里的某一个数。
例如:
\(\lim\limits_{n\rightarrow \infin}a_n<h\) ,不妨设为 \(\lim\limits_{n\rightarrow \infin}a_n=t\) ,\(t<h\) ,则一定有一个 \(N\) ,能满足 \(|a_n-t|<\varepsilon\) 。
极限定义的一个应用可以参考等比级数(几何级数)收敛的证明。
1.1.6 掌握极限的性质及四则运算法则
收敛数列的性质
- 极限的唯一性
- 收敛数列的有界性(收敛数列一定有上下界)
- 收敛数列的保号性
如果极限为正,则数列一定在某一个元素之后,保持为正。 - 收敛数列与其子数列间的关系
函数极限的性质
- 函数极限的唯一性
- 函数极限的局部有界性
- 函数极限的局部保号性
同数列极限的保号性。 - 函数极限与数列极限的关系(函数收敛,则相应的函数值数列也收敛同一值)
极限的四则运算
- 极限可以进行四则运算(除运算时除数极限不能为 0)
1.1.7 掌握极限存在的两个准则,并会利用它们求极限,掌握利用两个重要极限求极限的方法
极限存在的准则
- 夹逼准则:适用于数列极限和函数极限。
- 单调有界必有极限:作用于函数时,需要强调某个邻域,并且得到的是一侧的极限。
- 柯西极限存在准则:适用于数列,考察数列下标足够大时,数列的两个元素的值能无限接近。
两个重要极限
- \(\displaystyle\lim_{x\rightarrow 0}\frac{\sin x}{x}=1\)
(使用夹逼准则以及函数几何含义证明) - \(\displaystyle\lim_{x\rightarrow \infin}(1+\frac{1}{x})^x=e\)
(在整数域上,进行二项式分解,比较相邻项得出单调性,然后扩大到等比级数得到上界,利用单调有界必有极限证明整数域极限,再利用夹逼准则求得实数域的极限。对于负数极限,通过公式变形同样可以得到相同的结论)
注:
(1)\(\displaystyle\lim_{x\rightarrow \infin}(1+\frac{1}{x})^x=e\) 对正极限和负极限都成立。
证明:当 \(x\rightarrow -\infin\) 时,\(\displaystyle(1+\frac{1}{x})^x\overset{t=-x,t\rightarrow +\infin}{=}(1-\frac{1}{t})^{-t}=(\frac{t}{t-1})^t=(1+\frac{1}{t-1})^{t-1}(1+\frac{1}{t-1})=e\)
(2)当 \(x\rightarrow 0^+\) 时,设 \(\displaystyle y=(1+\frac{1}{x})^x\) ,则 \(\displaystyle\ln y=x\ln (1+\frac{1}{x})\) 。
取 \(\displaystyle u=\frac{1}{x}\) ,则 \(\ln y=\displaystyle \frac{\ln (1+u)}{u}\) 。
由于 \(\displaystyle\lim_{x\rightarrow 0^+}\ln y=\lim_{u\rightarrow +\infin}\frac{\ln (1+u)}{u}=0\) ,即 \(\displaystyle\lim_{x\rightarrow 0^+}(1+\frac{1}{x})^x=1\) 。
(3)当 \(x\rightarrow 0^-\) 时,\(y\rightarrow +\infin\) (暂不知如何求) 。
\(\displaystyle(1+\frac{1}{x})^x>0,x\in(-\infin,+\infin)\) 。
1.1.8 理解无穷小量、无穷大量的概念,掌握无穷小量的比较方法,会用等价无穷小量求极限
无穷小:极限是 0
无穷大:存在很大的下标或者自变量足够接近某个数,数列或者函数能够大于任何给定的数
无穷小的比较用比值法,有高阶无穷小、低阶无穷小、同阶无穷小、\(k\) 阶无穷小、等价无穷小
记 \(\displaystyle\lim \frac{a}{b}=C\) ,\(c\) 为非 0 常数
\(C\) | 比较 |
---|---|
0 | 高阶 |
\(c\) | 同阶 |
\(\infin\) | 低阶 |
1 | 等价 |
若 \(\displaystyle \lim \frac{a}{b^k}=c\) ,则为 \(k\) 阶无穷小。
注意:无穷小的比较是两个无穷小在同一个无穷小量变化过程中的无穷小。
即 \(\displaystyle\lim_{x\rightarrow x_0}\frac{a(x)}{b(x)}\) 。
等价无穷小的两个定理:
- \(\beta\) 是 \(\alpha\) 的等价无穷小的充要条件为 \(\beta=\alpha + o(\alpha)\)
这个定理给出了等价无穷小的一种判断条件。 - 设 \(\alpha\sim \overset{\sim}{\alpha}\) ,\(\beta\sim \overset{\sim}{\beta}\) ,且 \(\displaystyle\lim \frac{\overset{\sim}{\beta}}{\overset{\sim}{\alpha}}\) 存在,则 \(\displaystyle\lim\frac{\overset{\sim}{\beta}}{\overset{\sim}{\alpha}}=\lim\frac{\beta}{\alpha}\)
这个定理说明,无穷小之比的极限可以进行等价无穷小替换。
1.1.9 理解函数连续性的概念(含左连续与右连续),会判别函数间断点的类型
函数的连续性是用极限定义的(\(\Delta x\rightarrow 0\) 时 \(\Delta y\to 0\))。
第一类间断点:存在左右极限的间断点。
第二类间断点:不是第一类间断点的间断点,如无穷间断点,震荡间断点。
1.1.10 了解连续函数的性质和初等函数的连续性,理解闭区间上连续函数的性质(有界性、最大值和最小值定理、介值定理),并会应用这些性质
连续函数四则运算得到的函数也连续。
连续函数对应的反函数、复合函数也连续。
基本初等函数在它们的定义域内都是连续的。
一切初等函数在其定义区间内都是连续的。
闭区间上连续函数的性质:
- 有界性(函数有界)
- 最大值最小值定理(有最大值与最小值)
- 介值定理(两端函数值之间的任意一个函数值都可以取到,用零点定理证明)
1.2 一元函数微分学
1.2.1 理解导数和微分的概念,理解导数与微分的关系,理解导数的几何意义,会求平面曲线的切线方程和法线方程,了解导数的物理意义,会用导数描述一些物理量,理解函数的可导性与连续性之间的关系
导数
若 \(\displaystyle\frac{\Delta y}{\Delta x}\) 当 \(\Delta x\rightarrow 0\) 时极限存在,则称为可导,相应的极限称为导数。
一元函数导数的几何含义:曲线在某点切线的斜率。
一元函数可导等价于一元函数存在切线。
微分
若 \(\Delta y=A\Delta x+o(\Delta x)\) ,则称为可微,\(A\Delta x\) 称作微分。
微分的几何含义:曲线在某点用切线近似得到的变化量。
导数与微分的关系
函数在某点的可微的充要条件是函数在这点可导。
例如,设微分为 \(A\Delta x\) ,导数为 \(f'(x)\),则有 \(f'(x)=A\) 。
导数的几何含义
函数的导数表示函数的切线的斜率。
函数的切线方程
\(y-y_0=f'(x_0)(x-x_0)\)
函数的法线方程
\(\displaystyle y-y_0=-\frac{1}{f'(x_0)}(x-x_0)\)
连续与可导
可导一定连续,连续不一定可导。
可导从定义上就包含了连续的定义,但是可导在连续的基础上增加了比值的极限存在的条件。
典型例子为:\(y=x^{\frac{1}{3}}\) (\(x\in \boldsymbol{R}\)),\(y'=\frac{1}{3}x^{-\frac{2}{3}}\) ,在 \(x=0\) 处无不可导。
1.2.2 掌握导数的四则运算法则和复合函数的求导法则,掌握基本初等函数的导数公式,了解微分的四则运算和一阶微分形式的不变性,会求函数的微分
四则运算的导数
\((u\plusmn v)'=u'\plusmn v'\)
\((uv)'=u'v+uv'\)
\(\displaystyle (\frac{u}{v})'=\frac{u'v-uv'}{v^2}\)
复合函数的导数
对 \(\begin{cases}y=f(u)\\u=g(x)\end{cases}\)
有复合函数 \(y=f(g(x))\) ,其导数为
\(y'(x)=f'(u)\cdot g'(x)\) 或 \(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\text{d}y}{\text{d}u}\cdot\frac{\text{d}u}{\text{d}x}\)
基本初等函数的导数
- \((C)'=0\)
- \((x^\mu)'=\mu x^{\mu-1}\)
- \((a^x)'=a^x\ln a\)
- \((\log_ax)'=\displaystyle\frac{1}{x\ln a}\)
- \(\sin'x=\cos x,\cos'x=-\sin x\)
- \(\arcsin'x=\displaystyle \frac{1}{\sqrt{1-x^2}}\)
- \(\arccos'x=\displaystyle -\frac{1}{\sqrt{1-x^2}}\)
- \(\arctan'x=\displaystyle \frac{1}{1+x^2}\)
反三角函数导数的推导:
\(y=\arcsin x,x\in (-1,1),y\in(-\frac{\pi}{2},\frac{\pi}{2})\)
\(x=\sin y\)
\(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{1}{\frac{\text{d}x}{\text{d}y}}=\frac{1}{\cos y}\)
\(\cos^2 y=1-x^2\)
\(\cos y> 0\)
\(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{1}{\sqrt{1-x^2}}\)
\(y=\arccos x,x\in (-1,1), y\in(0,\pi)\)
\(x=\cos y\)
\(y'_x=(x'_y)^{-1}=-(\sin y)^{-1}\)
\(\sin y>0\)
\(\sin y=\sqrt{1-x^2}\)
\(\displaystyle y'_x=-(\sqrt{1-x^2})^{-1}=-\frac{1}{\sqrt{1-x^2}}\)
\(y=\arctan x,x\in(-\infin,+\infin),y\in(-\frac{\pi}{2},\frac{\pi}{2})\)
\(x=\tan y\)
\(\displaystyle x'_y=(\frac{\sin y}{\cos y})'=\frac{\cos^2y+\sin^2 y}{\cos ^2y}=\frac{1}{\cos^ 2y}\)
\(\displaystyle y'_x=(x'_y)^{-1}=\cos^2y=\frac{\cos^2 y}{\sin ^2y+\cos ^2y}=\frac{1}{1+\tan^2 y}=\frac{1}{1+x^2}\)
四则运算的微分
\(\text{d}(u\plusmn v)=\text{d}u\plusmn\text{d}v\)
\(\text{d}(uv)=v\text{d}u+u\text{d}v\)
\(\text{d}(\displaystyle\frac{u}{v})=\frac{v\text{d}u-u\text{d}v}{v^2}\)
一阶微分形式的不变性
利用微分和导数的关系,可得复合函数的微分为
\(\text{d}f(g(x))=y'_x\text{d}x=y'_u\cdot u'_x\text{d}x=y'_u\text{d}u\)
这种 \(u\) 无论是自变量还是中间变量,\(\text{d}y=y'_u\text{d}u\) 的形式保持不变的性质称为一阶微分形式的不变性。
微分形式的不变性说明在进行换元时,\(\text{d}y=y'_u\text{d}u\) 的形式并不改变。
1.2.3 了解高阶导数的概念,会求简单函数的高阶导数
1.2.4 会求分段函数的导数,会求隐函数和由参数方程所确定的函数以及反函数的导数
隐函数的求导
可通过对方程两边同时求导得到隐函数的导数。
反函数的求导
记原函数为 \(x=f(y)\) ,则反函数为 \(y=f^{-1}(x)\) ,有 \(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{1}{\frac{\text{d}x}{\text{d}y}}=\frac{1}{f'(y)}\)
由参数方程所确定的函数的导数
\(\begin{cases}x=\varphi(t)\\y=\psi(t)\end{cases}\)
\(\displaystyle\frac{\text{d}y}{\text{d}x}=\frac{\text{d}y}{\text{d}t}\frac{\text{d}t}{\text{d}x}=\frac{\text{d}y}{\text{d}t}\frac{1}{\frac{\text{d}x}{\text{d}t}}=\frac{y'_t}{x'_t}=\frac{\psi'(t)}{\varphi'(t)}\)
注:右式是一个关于 \(t\) 的式子。
1.2.5 理解并会用罗尔定理、拉格朗日中值定理和泰勒定理,了解并会用柯西中值定理
费马引理
如果一个函数在点的某邻域内有定义,可导,且该点是一个极大值点或极小值点,则该点处导数为 \(0\) 。
证:若为极大值点,则左侧导数 \(\le 0\) ,右侧导数 \(\ge 0\) ,由可导,因此两侧导数相等,即为 \(0\) 。
罗尔定理
如果一个可导函数两个端点的值相等,则两个端点之间一定存在导数为 \(0\) 的点。
拉格朗日中值定理
如果一个可导函数两个端点连线的斜率为 \(k\) ,则两个端点之间一定存在导数为 \(k\) 的点。
柯西中值定理
柯西中值定理的几何含义可以理解为拉格朗日中值定理的参数方程形式。
参数方程形式为:\(\begin{cases}x=F(t)\\y=f(t)\end{cases}\)
\(\displaystyle\frac{f(b)-f(a)}{F(b)-F(a)}=\frac{f'(\xi)}{F'(\xi)}\)
左式为参数方程形式的连线的斜率,右式为参数方程形式的导数。
泰勒中值定理
\(\displaystyle f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)^2+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_n(x)\)
\(R_n(x)=o((x-x_0)^n)\)
或者
\(R_n(x)=\displaystyle\frac{f^{(n+1)}(\xi)}{(n+1)!}(x-x_0)^{n+1}\)
1.2.6 掌握用洛必达法则求未定式极限的方法
未定式
两个趋于零或趋于无穷大的函数的比值的极限可能存在,也可能不存在,这种极限称为未定式。
洛必达法则
给出了在一定条件下通过分子分母分别求导再求极限来求未定式的值的方法。
注:
- 洛必达法则可以用柯西中值定理证明。
- 洛必达法则既给出了 \(\displaystyle\frac{0}{0}\) 型未定式的求法,也给出了 \(\displaystyle\frac{\infin}{\infin}\) 的求法。
- 洛必达法则不仅适用于求导后比值存在的情况,也适用于求导后比值为无穷大的情况。
1.2.7 理解函数的极值概念,掌握用导数判断函数的单调性和求函数极值的方法,掌握函数最大值和最小值的求法及其应用
极值
注意极值是邻域里的概念,同时极值不要求连续。
可以通过求导数和二阶导数求函数的极值。
驻点
极值点一定是驻点,驻点不一定是极值点。
最值
对连续的区间,求导数,求所有驻点和不可导点,然后判断导数在驻点和不可导点左右邻近的值。
1.2.8 会用导数判断函数图形的凹凸性,会求函数图形的拐点以及水平、铅直和斜渐近线,会描绘函数的图形
凹凸性
图形如名字。
斜渐近线
设为 \(y=ax+b\)
\(\displaystyle a=\lim_{x\rightarrow \infin}\frac{f(x)}{x}\)
\(\displaystyle b=\lim_{x\rightarrow \infin}(f(x)-ax)\)
函数图形
定义域,特性(对称、奇偶、周期),一阶导数和二阶导数,零点,渐近线。
1.2.9 了解曲率、曲率圆与曲率半径的概念,会计算曲率和曲率半径
曲率
\(\displaystyle K=\lim_{\Delta s\rightarrow 0}|\frac{\Delta \alpha}{\Delta s}|\)
圆的曲率
设圆半径为 \(r\) ,则 \(\Delta s=r\Delta \alpha\) ,即 \(\displaystyle K=\frac{1}{r}\) 。
曲率计算公式
推导过程:
\(\Delta y=y'\Delta x\)
\(\Delta s=\sqrt{1+y'^2}\Delta x\)
\(\text{d}s=\sqrt{1+y'^2}\text{d}x\)
\(\tan \alpha=y'\)
\(\displaystyle\sec^2\alpha \frac{\text{d}\alpha}{\text{d}x}=y''\)
\(\displaystyle\sec^2\alpha\frac{\text{d}\alpha}{\text{d}s}\sqrt{1+y'^2}=y''\)
\(\sec^2\alpha=1+\tan^2\alpha=1+y'^2\)
\(\displaystyle\frac{\text{d}\alpha}{\text{d}s}=\frac{y''}{(1+y'^2)^{\frac{3}{2}}}\)
参数方程形式的曲线的曲率计算公式
记曲线的参数方程为
\(\begin{cases}x=\varphi(t)\\y=\psi(t)\end{cases}\)
\(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\psi'(t)}{\varphi'(t)}\)
\(\displaystyle \frac{\text{d}}{\text{d}x}(\frac{\text{d}y}{\text{d}x})=\frac{\text{d}y'_x}{\text{d}t}\frac{1}{\frac{\text{d}x}{\text{d}t}}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{\varphi'(t)^2}\frac{1}{\varphi'(t)}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{\varphi'(t)^3}\)
\(\displaystyle\frac{\text{d}\alpha}{\text{d}s}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{\varphi'(t)^3}\frac{1}{(1+(\frac{\psi'(t)}{\varphi'(t)})^2)^{\frac{3}{2}}}=\frac{\psi''(t)\varphi'(t)-\psi'(t)\varphi''(t)}{(\varphi'(t)^2+\psi'(t)^2)^{\frac{3}{2}}}\)
1.3 一元函数积分学
1.3.1 理解原函数的概念,理解不定积分和定积分的概念
原函数
原函数和导数是一对概念。
\(F(x)\) 的导数是 \(f(x)\) \(\Leftrightarrow\) \(f(x)\) 的一个原函数是 \(F(x)\)
不定积分
不定积分和求导是一对概念。
对函数进行不定积分得到带有任意常数项的原函数。
\(F(x)\) 的导数是 \(f(x)\) \(\Leftrightarrow\) \(\displaystyle \int f(x)\text{d}x=F(x)+C\)
定积分
定积分是积分和的极限,从函数的几何图形上看,是函数在正向与 \(x\) 轴围成的面积。
\(\displaystyle \int_a^b f(x)\text{d}x=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\xi_i)\Delta x_i\)
1.3.2 掌握不定积分的基本公式,掌握不定积分和定积分的性质及定积分中值定理,掌握换元积分法与分部积分法
不定积分基本公式
\(\displaystyle\int k\text{d}x=kx+C\)
\(\displaystyle\int x^\mu\text{d}x=\frac{1}{\mu+1}x^{\mu+1}+C(\mu\ne -1)\)
\(\displaystyle\int \frac{\text{d}x}{x}=\ln|x|+C\)
\(\displaystyle\int \frac{\text{d}x}{1+x^2}=\arctan x + C\)
\(\displaystyle\int \frac{\text{d}x}{\sqrt{1-x^2}}=\arcsin x+C\)
\(\displaystyle\int \cos \text{d}x=\sin x+C\)
\(\displaystyle\int \sin \text{d}x=-\cos x+C\)
\(\displaystyle\int \frac{\text{d}x}{\cos^2 x}=\tan x+C\)
\(\displaystyle\int \frac{\text{d}x}{\sin^2 x}=-\cot x+C\)
\(\displaystyle\int \sec x\tan x\text{d}x=\sec x+C\)
\(\displaystyle\int \csc x\cot x\text{d}x=-\csc x+C\)
\(\displaystyle\int e^x\text{d}x=e^x+C\)
\(\displaystyle\int a^x\text{d}x=\frac{a^x}{\ln a}+C\)
关于对数函数的导数
\(y=\ln |x|,x<0\)
\(y=\ln (-x)\)
\(y'=\displaystyle\frac{1}{-x}\cdot (-1)=\frac{1}{x}\)
不定积分的性质
\(\displaystyle\int (f(x)+g(x))\text{d}x=\int f(x)\text{d}x+\int g(x)\text{d}x\) (实际就是导数的和运算)
\(\displaystyle\int kf(x)\text{d}x=k\int f(x)\text{d}x\) (实际就是导数的积运算的特殊形式)
定积分的性质
\(\displaystyle\int_a^a f(x)\text{d}x = 0\) (补充规定)
\(\displaystyle\int_a^b f(x)\text{d}x=-\int_b^a f(x)\text{d}x\) (补充规定)
\(\displaystyle\int_a^b[\alpha f(x)+\beta g(x)]\text{d}x=\alpha\int_a^b f(x)\text{d}x+\beta \int_a^b g(x)\text{d}x\) (使用定义证明)
\(\displaystyle\int_a^c f(x)\text{d}x=\int_a^b f(x)\text{d}x+\int_b^c f(x)\text{d}x,(a<b<c)\) (使用定义证明)
\(\displaystyle\int_a^b1\text{d}x=b-a\) (使用定义证明)
若 \(f(x)\ge 0\) ,则 \(\displaystyle\int_a^b f(x)\ge 0\) (使用定义证明)
若 \(f(x)\le g(x)\) ,则 \(\displaystyle\int_a^b f(x)\text{d}x \le \int_a^b g(x)\text{d}x\) (推论)
\(\displaystyle|\int_a^b f(x)\text{d}x|\le\int_a^b |f(x)|\text{d}x\) (推论)
若 \(m\le f(x)\le M\) ,则 \(\displaystyle m(b-a)\le \int_a^b f(x)\text{d}x \le M(b-a)\) (推论)
定积分中值定理
\(\displaystyle\int_a^b f(x)\text{d}x=f(\xi)(b-a), \xi\in [a,b]\) (事实上,\(\xi\in (a,b)\)。利用性质中的推论可以证明 \(\xi\in [a,b]\))
换元积分法
不定积分的第一类换元法
\(\displaystyle\int f(\varphi (x))\varphi' (x)\text{d}x=\int f(\varphi(x))\text{d}\varphi(x)\overset{\varphi(x)=u}{=}\int f(u)\text{d}u\)
第一类换元法是将被积函数分离至积分变量。
不定积分的第二类换元法
\(\displaystyle\int f(x)\text{d}x\overset{x=\varphi(t)}{=}\int f(\varphi(t))\text{d}\varphi(t)=\int f(\varphi(t))\varphi'(t)\text{d}t\)
第二类换元法是将积分变量直接换元,达到化简被积函数的目的。
第一类换元法和第二类换元法是对称的换元方式。
不定积分的分部积分法
利用导数的乘法法则,可得积分的分部积分法。
\(\displaystyle\int uv'\text{d}x=uv-\int u'v\text{d}x\)
分部积分法适用于被积函数是一个乘积,其中一部分不容易求积分,另一部分容易求积分的情况。
定积分的换元法
\(\displaystyle\varphi(\alpha)=a,\varphi(\beta)=b\)
\(\displaystyle\int_a^b f(x)\text{d}x\overset{x=\varphi(t)}{=}\int_\alpha^\beta f(\varphi(t))\varphi'(t)\text{d}t\)
定积分换元时要同时调整积分限。
定积分的换元法通过牛顿-莱布尼茨公式证明。
定积分的分部积分法
\(\displaystyle\int_a^b uv'\text{d}x=[\int uv'\text{d}x]_a^b=[uv-\int u'v\text{d}x]_a^b=[uv]_a^b-\int_a^bu'v\text{d}x\)
定积分的分布积分法可以通过牛顿-莱布尼茨公式和不定积分的分布积分法证明。
1.3.3 会求有理函数、三角函数有理式和简单无理函数的积分
有理函数
两个多项式的商 \(\displaystyle\frac{P(x)}{Q(x)}\) 称为有理函数。
有理函数的积分方法是将有理函数分解为多个部分分式之和。
三角函数的有理式
三角函数的有理式的一个通用积分方法是将三角函数换元为正切形式。
\(\displaystyle\sin x=2\sin \frac{x}{2}\cos\frac{x}{2}=\frac{2\tan \frac{x}{2}}{\sec ^2\frac{x}{2}}=\frac{2\tan \frac{x}{2}}{1+\tan^2 \frac{x}{2}}\)
\(\displaystyle\cos x=\cos^2\frac{x}{2}-\sin^2\frac{x}{2}=\frac{1-\tan^2\frac{x}{2}}{\sec^2\frac{x}{2}}=\frac{1-\tan^2\frac{x}{2}}{1+\tan^2\frac{x}{2}}\)
取 \(\displaystyle u=\tan\frac{x}{2}\) ,
则 \(x=2\arctan u\) ,\(\displaystyle \text{d}x=\frac{2}{1+u^2}\text{d}u\) 。
也即 \(\displaystyle\int F(\sin x,\cos x)\text{d}x=\int \displaystyle F(\frac{2u}{1+u^2},\frac{1-u^2}{1+u^2})\frac{2}{1+u^2}\text{d}u\)
无理函数
不是有理函数的代数函数就是无理函数。
无理函数一般都含有根式。
无理函数的积分可以通过换元去掉根号。
1.3.4 理解积分上限的函数,会求它的导数,掌握牛顿-莱布尼茨公式
积分上限的函数
称 \(\displaystyle\int_a^x f(x)\text{d}x\) 是 \(f(x)\) 的积分上限的函数。
\(f(x)\) 的积分上限的函数是 \(f(x)\) 的一个原函数。
证:
\(\displaystyle\varPhi(x+\Delta x)=\int_a^{x+\Delta x}f(t)\text{d}t\)
\(\displaystyle\Delta \varPhi=\varPhi(x+\Delta x)-\varPhi(x)\)
\(\displaystyle=\int_a^{x+\Delta x}f(t)\text{d}t-\int_a^{x}f(t)\text{d}t\)
\(\displaystyle=\int_a^x f(t)\text{d}t+\int_{x}^{x+\Delta x}f(t)\text{d}t-\int_a^{x}f(t)\text{d}t\) (积分区间的可加性)
\(\displaystyle=\int_x^{x+\Delta x}f(t)\text{d}t\)
即 \(\Delta \varPhi=f(\xi)\Delta x\) (积分中值定理)
即 \(\displaystyle \frac{\Delta \varPhi}{\Delta x}=f(\xi)\)
牛顿-莱布尼茨公式
\(\displaystyle\int_a^b f(x)\text{d}x=F(b)-F(a)\) ,其中 \(F(x)\) 是 \(f(x)\) 在 \([a,b]\) 上的一个原函数。
牛顿-莱布尼茨公式给出了通过原函数求积分的方法,也即通过不定积分求定积分的方法,简化了定积分的计算。
1.3.5 理解反常积分的概念,了解反常积分收敛的比较判别法,会计算反常积分
反常积分
被积函数为无界函数,或者积分区间为无穷区间的积分,称为反常积分。
反常积分的比较判别法
如果 \(0<f(x)<g(x)\) ,且 \(\displaystyle\int_a^{+\infin}g(x)\text{d}x\) 收敛,则 \(\displaystyle\int_a^{+\infin}f(x)\text{d}x\) 收敛。
反之如果 \(\displaystyle\int_a^{+\infin}f(x)\text{d}x\) 发散,则 \(\displaystyle\int_a^{+\infin}g(x)\text{d}x\) 也发散。
一个重要的反常积分
\(\displaystyle\int_{-\infin}^{+\infin}e^{-x^2}\text{d}x=\sqrt{\pi}\)
推导:
记 \(\displaystyle y=\int_{-\infin}^{+\infin}e^{-x^2}\text{d}x=2\int_0^{+\infin}e^{-x^2}\text{d}x\) ,
\(y^2=4(\int_0^{+\infin}e^{-x^2}\text{d}x)^2=4\int_0^{+\infin}e^{-x^2}\text{d}x\int_0^{+\infin}e^{-y^2}\text{d}y\)
\(\displaystyle=4\int_0^{+\infin}\int_0^{+\infin}e^{-(x^2+y^2)}\text{d}x\text{d}y\)
\(\displaystyle=4\int_0^{\frac{\pi}{2}}\int_0^{+\infin}re^{-r^2}\text{d}r\text{d}\theta\)
\(\displaystyle=2\pi\int_0^{+\infin}\frac{1}{2}e^{-u}\text{d}u\)
\(=\pi\)
而 \(y>0\) ,则 \(y=\sqrt{\pi}\) 。
1.3.6 掌握用定积分表达和计算一些几何量与物理量(平面图形的面积、平面曲线的弧长、旋转体的体积及侧面积、平行截面面积为已知的立体体积、功、引力、压力、质心、形心等)及函数的平均值
元素法
由定积分定义:\(\displaystyle\int_a^b f(x)\text{d}x=\displaystyle\lim_{\lambda\rightarrow 0}\sum_{i=1}^{n}f(\xi_i)\Delta x_i\) ,如果所求量可以分成许多部分,每个部分可以近似表达为 \(f(\xi_i)\Delta x_i\) ,并且差值是比 \(\Delta x_i\) 的高阶无穷小,即所求量是所有部分的和的极限,则所求量可以表示为积分 \(\displaystyle\int_a^b f(x)\text{d}x\) 。
\(\displaystyle A=\displaystyle\lim_{\lambda\rightarrow 0}\sum_{i=1}^{n}(f(\xi_i)\Delta x_i+o(\Delta x_i))=\int_a^b f(x)\text{d}x+\displaystyle\lim_{\lambda\rightarrow 0}\sum_{i=1}^n o(\Delta x_i)=\int_a^b f(x)\text{d}x\)
思考:如何证明元素法?
即如何证明 \(\displaystyle\lim_{\lambda \rightarrow 0}\sum_{i=1}^n (o(\Delta x_i))=0\) 。
曲线 \(y=f(x)(f(x)>0)\) 和 \(x\) 轴所围图形的面积
微元为矩形,每个小矩形都可以近似表示为 \(f(\xi_i)\Delta x_i\) ,从而面积为积分
\(\displaystyle S=\int_a^b f(x)\text{d}x\)
极坐标曲线 \(r=r(\theta)\) 在两条射线之间的曲边扇形的面积
微元为扇形(也可以是三角形),每个扇形的面积为 \(\displaystyle\frac{\Delta \theta}{2\pi}\pi r^2=\frac{1}{2}r^2\Delta \theta\) ,从而面积为积分
\(\displaystyle S=\int_\alpha^\beta\displaystyle\frac{r^2(\theta)}{2}\text{d}\theta\)
平面曲线 \(\begin{cases}x=\varphi(t)\\y=\psi(t)\end{cases},(a<t<b)\) 的长度
对应 \(\Delta t\) ,有 \(\Delta x=\varphi'(t)\Delta t,\Delta y=\psi'(t)\Delta t\) ,微元为直线,长度为 \(\sqrt{\varphi'^2(t)+\psi'^2(t)}\Delta t\) ,从而长度为积分
\(\displaystyle l=\int_a^b\sqrt{\varphi'^2(t)+\psi'^2(t)}\text{d}t\)
当平面曲线以 \(y=f(x)\) 形式表示时,则为 \(\begin{cases}y=f(x)\\x=x\end{cases}\) ,即 \(\displaystyle l=\int_a^b \sqrt{1+y'^2}\text{d}x\)
旋转体的体积
设为 \(y=f(x)(a<x<b)\) 绕 \(x\) 轴旋转形成的旋转体
微元为厚度方向为 \(x\) 轴的圆片,其面积为 \(\pi f^2(x)\) ,厚度为 \(\Delta x\) ,即 \(\Delta V=\pi f^2(x)\Delta x\) ,从而体积为积分
\(\displaystyle V=\int_a^b \pi f^2(x)\text{d}x\)
旋转体的侧面积
设为 \(y=f(x)(a<x<b)\) 绕 \(x\) 轴旋转形成的旋转体
微元为环绕 \(x\) 轴的圆环,圆环在 \(xoy\) 平面上的交线的斜率为为 \(f'(x)\) ,圆环在 \(x\) 轴方向上的宽度为 \(\Delta x\) ,也即一个厚度为 \(\Delta x\) ,斜率为 \(f'(x)\) ,小圆半径为 \(f(x)\) 的圆台。
\(\Delta S=\pi(2f(x)+f'(x)\Delta x)\Delta x=2\pi f(x)\Delta x+o(\Delta x)\)
\(\displaystyle S=\int_a^b 2\pi f(x)\text{d}x\)
截面面积已知的立体体积
设立体截面面积为 \(y=f(x)(a<x<b)\)
以柱为微元,则 \(\Delta V=f(x)\Delta x\)
\(\displaystyle V=\int_a^b f(x)\text{d}x\)
变力沿直线做功
设变力在 \(x\) 正向的分量的模为 \(f(x)\)
\(\displaystyle W=\int_a^b f(x)\text{d}x\)
均匀直线和点的引力
设直线的线密度为 \(\mu\) ,直线在 \(x\) 轴上 ,点的质量为 \(M\) ,点在 \(y\) 轴上,\(y=a\)。
引力公式 \(\displaystyle F=G\frac{m_1m_2}{r^2}\)
\(\Delta F_y=-\displaystyle G\frac{M\cdot \mu\Delta x}{x^2+a^2}\cdot \frac{a}{\sqrt{x^2+a^2}}\)
\(\displaystyle F=-\int_{-l}^{l} \displaystyle \frac{GM\mu a}{(x^2+a^2)^{\frac{3}{2}}}\text{d}x\)
查积分表得,\(F=-GM\mu a \displaystyle \frac{x}{a^2 \sqrt{x^2+a^2}}|_{-l}^{l}=-\frac{-2 GM\mu l}{a\sqrt{l^2+a^2}}\)
\(\displaystyle \lim_{l\rightarrow \infin }F=-\frac{2GM\mu}{a}\)
竖直浸没在液体中的平板一侧受到的压力
计算一半竖直浸没入水中的半径为 \(r\) 的圆板的一侧受到的压力
水的压强为 \(P=\rho gh\)
\(\Delta F=\Delta S \cdot P=2\sqrt{r^2-y^2}\Delta y \cdot \rho gy\)
\(\displaystyle F=\int_0^r 2\rho gy\sqrt{r^2-y^2}\text{d}y=\int_0^\frac{\pi}{2}2\rho g r\sin\theta r\cos \theta r\cos\theta \text{d}\theta=2\rho gr^3\int_0^{\frac{\pi}{2}}\sin\theta\cos^2\theta\text{d}\theta=\frac{2}{3}\rho gr^3\)
质心、形心
参考多重积分的应用。
若密度均匀,则形心和重心重合。
形心是图形上的点的平均位置,重心是质量的平均位置。
1.4 向量代数和空间解析几何
1.4.1 理解空间直角坐标系,理解向量的概念及其表示
空间直角坐标系
在空间取定一点 \(O\) 和三个两两垂直的单位向量 \(\boldsymbol{i}\) 、\(\boldsymbol{j}\) 、\(\boldsymbol{k}\) ,就确定了三条以 \(O\) 为原点的两两垂直的数轴,依次记为 \(x\) 轴、\(y\) 轴、\(z\) 轴,并构成了一个空间直角坐标系。
空间直角坐标系通常符合右手法则。
向量
既有大小,又有方向的量称为向量。
向量可以记为 \(\overrightarrow{AB}\) ,\(\boldsymbol{a}\) ,\(\overrightarrow{a}\) 。
向量的夹角
作 \(\overrightarrow{OA}=\boldsymbol{a}\) ,\(\overrightarrow{OB}=\boldsymbol{b}\) , 则 \(\angle AOB\) 称为两个向量的夹角,规定 \(0\le \theta\le \pi\) 。
投影
投影是向量在轴上的投影,投影是一个数。
向量 \(\boldsymbol{a}\) 在 \(x\) 轴上的投影记为 \(\text{Prj}_x\boldsymbol{a}\) 。
\(\text{Prj}_x\boldsymbol{a}=|\boldsymbol{a}|\cos \alpha\)
\(\text{Prj}_x(\boldsymbol{a}+\boldsymbol{b})=\text{Prj}_x\boldsymbol{a}+\text{Prj}_x\boldsymbol{b}\)
(容易用几何证明)
1.4.2 掌握向量的运算(线性运算、数量积、向量积、混合积),了解两个向量垂直、平行的条件
数量积(内积,点积)
向量的数量积是一个数
\(\boldsymbol{a}\cdot \boldsymbol{b}=|\boldsymbol{a}||\boldsymbol{b}|\cos\theta\)
\(\boldsymbol{a}\cdot \boldsymbol{b}=|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}\)
数量积的一个物理含义是力做的功。
数量积满足交换律
\(\boldsymbol{a}\cdot \boldsymbol{b}=\boldsymbol{b}\cdot \boldsymbol{a}\)
数量积满足分配律
\(\boldsymbol{a}\cdot (\boldsymbol{b}+\boldsymbol{c})=\boldsymbol{a}\cdot\boldsymbol{b}+\boldsymbol{a}\cdot \boldsymbol{c}\)
证明:
使用投影来证明,
\(\boldsymbol{a}\cdot (\boldsymbol{b}+\boldsymbol{c})=|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}(\boldsymbol{b}+\boldsymbol{c})=|\boldsymbol{a}|(\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}+\text{Prj}_{\boldsymbol{a}}\boldsymbol{c})=|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}+|\boldsymbol{a}|\text{Prj}_{\boldsymbol{a}}\boldsymbol{c}=\boldsymbol{a}\cdot\boldsymbol{b}+\boldsymbol{a}\cdot \boldsymbol{c}\)
数量积不满足结合律
因为数量积是一个数。
数量积的坐标表达式
\(\begin{pmatrix}x_1\\x_2\end{pmatrix}\cdot \begin{pmatrix}y_1\\y_2\end{pmatrix}=x_1y_1+x_2y_2\)
数量积可以扩展到多维,即
\(\begin{pmatrix}...\\x_i\\...\end{pmatrix}\cdot\begin{pmatrix}...\\y_i\\...\end{pmatrix}=\displaystyle\sum_{i=1}^{n}x_iy_i\)
可以化为单位坐标向量之后利用运算律进行证明。
向量积(外积,叉积)
向量的向量积是一个向量
向量积的方向满足右手规则,大小满足 \(|\boldsymbol{a}\times \boldsymbol{b}|=|\boldsymbol{a}||\boldsymbol{b}|\sin\theta\)
向量积的一个物理含义是作用在杆上的力矩,大拇指指向力矩的方向,则四指指向杆旋转的方向。
向量积的大小等于以两条向量为邻边的矩形的面积。
向量积交换顺序后大小不变,方向相反
\(\boldsymbol{a}\times\boldsymbol{b}=-\boldsymbol{b}\times\boldsymbol{a}\)
向量积满足分配律
\(\boldsymbol{a}\times(\boldsymbol{b}+\boldsymbol{c})=\boldsymbol{a}\times\boldsymbol{b}+\boldsymbol{a}\times\boldsymbol{c}\)
(可以用混合积的性质来证明)
向量积不满足结合律,以正四面体的三条邻边为例,得到的结果的方向不一样。
\(\begin{pmatrix}a_1\\a_2\\a_3\end{pmatrix}\times\begin{pmatrix}b_1\\b_2\\b_3\end{pmatrix}=\begin{vmatrix}\boldsymbol{i} &\boldsymbol{j} &\boldsymbol{k}\\a_1& a_2 & a_3\\b_1&b_2&b_3\end{vmatrix}=\begin{vmatrix}a_1& a_2 & a_3\\b_1&b_2&b_3\\\boldsymbol{i} &\boldsymbol{j} &\boldsymbol{k}\end{vmatrix}\)
(可以化为单位向量后利用向量积的计算法则证明)
混合积
记 \((\boldsymbol{a}\times\boldsymbol{b})\cdot \boldsymbol{c}=[\boldsymbol{a},\boldsymbol{b},\boldsymbol{c}]\) 为三个向量的混合积。
混合积是一个数。
由于 \(|\boldsymbol{a}\times \boldsymbol{b}|=S_{bottom}\) ,\((\boldsymbol{a}\times\boldsymbol{b})\cdot \boldsymbol{c}=S_{bottom}\text{Prj}_{\boldsymbol{h}}\boldsymbol{c}=V\) ,也即混合积表示以三个向量为邻边的平行六面体的体积。
由于混合积表示对应的平行六面体的体积,因此有序交换混合积的顺序(\(ABC,CAB,BCA\)),混合积的值不变。
三个向量依次组成右手系,则为正,否则为负。
这个性质也可以从行列式的值的角度来理解(交换两次,符号不变)。
利用混合积的性质证明向量积的分配律
\(((\boldsymbol{a}+\boldsymbol{b})\times \boldsymbol{c})\cdot \boldsymbol{r}\)
\(=(\boldsymbol{c}\times\boldsymbol{r})\cdot (\boldsymbol{a}+\boldsymbol{b})\)
\(=(\boldsymbol{c}\times\boldsymbol{r})\cdot \boldsymbol{a}+(\boldsymbol{c}\times\boldsymbol{r})\cdot \boldsymbol{b}\)
\(=(\boldsymbol{a}\times\boldsymbol{c})\cdot \boldsymbol{r}+(\boldsymbol{b}\times\boldsymbol{c})\cdot \boldsymbol{r}\)
\(=(\boldsymbol{a}\times\boldsymbol{c}+\boldsymbol{b}\times\boldsymbol{c})\cdot \boldsymbol{r}\)
即 \(((\boldsymbol{a}+\boldsymbol{b})\times\boldsymbol{c}-\boldsymbol{a}\times\boldsymbol{c}+\boldsymbol{b}\times\boldsymbol{c})\cdot\boldsymbol{r}=0\)
由于 \(\boldsymbol{r}\) 是任意向量,因此
\((\boldsymbol{a}+\boldsymbol{b})\times\boldsymbol{c}=\boldsymbol{a}\times\boldsymbol{c}+\boldsymbol{b}\times\boldsymbol{c}\)
\([\boldsymbol{a},\boldsymbol{b},\boldsymbol{c}]=\begin{vmatrix}\boldsymbol{i} &\boldsymbol{j} &\boldsymbol{k}\\a_1& a_2 & a_3\\b_1&b_2&b_3\end{vmatrix}\cdot \begin{pmatrix}c_1\\c_2\\c_3\end{pmatrix}\)
\(=c_1\begin{vmatrix}a_2 & a_3\\b_2 & b_3\end{vmatrix}-c_2\begin{vmatrix}a_1&a_3\\b_1&b_3\end{vmatrix}+c_3\begin{vmatrix}a_1&a_2\\b_1&b_2\end{vmatrix}\)
\(=\begin{vmatrix}a_1&a_2&a_3\\b_1&b_2&b_3\\c_1&c_2&c_3\end{vmatrix}\)
(按行展开及其逆运算)
两个向量垂直 \(\Leftrightarrow\) 两个向量的数量积为 \(0\)
两个向量平行 \(\Leftrightarrow\) 存在唯一实数 \(\lambda\) ,使 \(\lambda \boldsymbol{a}=\boldsymbol{b}\)
两个向量平行 \(\Leftrightarrow\) 两个向量的各个坐标对应成比例
1.4.3 理解单位向量、方向数与方向余弦、向量的坐标表达式,掌握用坐标表达式进行向量运算的方法
单位向量
模为 \(1\) 的向量。
方向数
直线的任一方向向量的坐标叫做直线的一组方向数。
方向余弦
向量和三条坐标轴的夹角的余弦称为方向余弦。
\((\cos \alpha, \cos \beta, \cos\gamma)=(\displaystyle \frac{x}{|\boldsymbol{a}|}, \frac{y}{|\boldsymbol{a}|}, \frac{z}{|\boldsymbol{a}|})\)
向量的坐标表达式
若 \(\boldsymbol{a}=x\boldsymbol{i}+y\boldsymbol{j}+z\boldsymbol{k}\) ,则称向量的坐标为 \((x,y,z)\) 。将向量写成各个坐标轴的单位向量的和的形式,称为向量的坐标表达式。
向量的坐标表达式的运算
加、减和 \(k\) 乘运算和矩阵的运算一致,数量积运算即向量的内积,对应相乘并相加(已叙述),向量积即将两个向量和单位向量组合成一个行列式(已叙述),混合积即将三个向量组合成一个行列式(已叙述)。
1.4.4 掌握平面方程和直线方程及其求法
平面的点法式方程
设法向量为 \((A,B,C)\) ,平面上一点为 \(M(x_0,y_0,z_0)\) ,
\((A,B,C)\cdot(x-x_0,y-y_0,z-z_0)=0\) ,
即 \(A(x-x_0)+B(y-y_0)+C(z-z_0)=0\)
平面的一般方程
\(Ax+By+Cz+D=0\)
空间直线的一般方程
空间直线看作是两个平面的交线
\(\begin{cases}A_1x+B_1y+C_1z+D_1=0\\A_2x+B_2y+C_2z+D_2=0\end{cases}\)
空间直线的点向式方程
即过一点且与方向向量平行。
\((x-x_0,y-y_0,z-z_0)\) 平行于 \((A,B,C)\) ,
即 \(\displaystyle \frac{x-x_0}{A}=\frac{y-y_0}{B}=\frac{z-z_0}{C}\)
1.4.5 会求平面与平面、平面与直线、直线与直线之间的夹角,并会利用平面、直线的相互关系(平行、垂直、相交等)解决有关问题
平面与平面、平面与直线、直线与直线之间的夹角
都用法向量和方向向量进行计算。
例如两个平面的法向量分别为 \(\boldsymbol{a},\boldsymbol{b}\) ,则 \(\cos \theta=\displaystyle\frac{|\boldsymbol{a}\cdot\boldsymbol{b}|}{|\boldsymbol{a}||\boldsymbol{b}|}\)
1.4.6 会求点到直线以及点到平面的距离
点到直线的距离
设点为 \(A\) ,直线上一点为 \(O\) ,直线的一个方向向量为 \(\boldsymbol{a}\) ,则 \(\overrightarrow{OA}\times \boldsymbol{a}=|\overrightarrow{OA}||\boldsymbol{a}|\sin\theta\) ,即 \(|\overrightarrow{OA}|\sin\theta=\displaystyle\frac{\overrightarrow{OA}\times \boldsymbol{a}}{|\boldsymbol{a}|}\)
点到平面的距离
和求点到直线的举例类似,只是需要求余弦,即利用向量的数量积进行计算。
1.4.7 了解曲面方程和空间曲线方程的概念
空间解析几何的基本问题
(1)已知一个曲面是点的几何轨迹时,建立这个曲面的方程。
(2)已知坐标 \(x,y,z\) 之间的一个方程时,研究这个方程所表示的曲面的形状。
空间曲线的一般方程
空间曲线可以看作是两个曲面的交线
\(\begin{cases}F(x,y,z)=0\\G(x,y,z)=0\end{cases}\)
1.4.8 了解常用二次曲面的方程及其图形,会求简单的柱面和旋转曲面的方程
球面
\(A(x^2+y^2+z^2)+Bx+Cy+Dz+E=0\)
或
\((x-a)^2+(y-b)^2+(z-c)^2=R^2\)
旋转曲面
以曲线绕 \(z\) 轴旋转形成的旋转曲面为例,在 \(xOz\) 平面上,取一点 \((x_0,0,z_0)\) 满足曲线公式,即 \(f(x_0,z_0)=0\) ,将该点旋转到平面外一点 \((x,y,z_0)\) ,即 \(|x_0|=\sqrt{x^2+y^2}\) ,即这个旋转曲面的公式为 \(f(\plusmn\sqrt{x^2+y^2},z)=0\) (绕某个轴旋转,则这个轴的符号不变,替换另一个符号)
圆锥面
即 \(z=k(\plusmn\sqrt{x^2+y^2})\) ,即 \(z^2=k^2(x^2+y^2)\)
旋转单叶双曲面和旋转双叶双曲面
对于焦点在 \(x\) 轴,在坐标面 \(xOz\) 上的双曲线
\(\displaystyle\frac{x^2}{a^2}-\frac{z^2}{b^2}=1\)
其绕 \(z\) 轴旋转形成旋转单叶双曲面
\(\displaystyle\frac{x^2+y^2}{a^2}-\frac{z^2}{b^2}=1\)
绕 \(x\) 轴旋转形成旋转双叶曲面
\(\displaystyle\frac{x^2}{a^2}-\frac{y^2+z^2}{b^2}=1\)
柱面
没有参数 \(z\) 的方程表示 \(z\) 轴方向的柱面。
如 \(f(x,y)=0\)
1.4.9 了解空间曲线的参数方程和一般方程,了解空间曲线在坐标平面上的投影,并会求该投影曲线的方程
空间曲线的参数方程
将动点的坐标表示为参数 \(t\) 的函数,即为空间曲线的参数方程
\(\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}\)
空间曲线的一般方程
空间曲线看作是两个空间曲面的交线
\(\begin{cases}F(x,y,z)=0\\G(x,y,z)=0\end{cases}\)
空间曲线在坐标平面上的投影
空间曲线的一般方程,如果消去两个联立方程的 \(z\) ,得到方程 \(f(x,y)=0\) ,由于对于曲线上的一点 \((x_0,y_0,z_0)\) ,一定也满足 \(f(x_0,y_0)\) ,也即 \(f(x,y)=0\) 就表示空间曲线在 \(xOy\) 平面上的投影。
对于参数方程,则直接去掉参数 \(z\) 的方程得到 \(\begin{cases}x=x(t)\\y=y(t)\end{cases}\) ,同理,就得到了空间曲线在 \(xOy\) 平面上的投影。
1.5 多元函数微分学
1.5.1 理解多元函数的概念,理解二元函数的几何意义
\(n\) 维空间
设 \(n\) 为一个取定的正整数,用 \(\bold{R}^n\) 表示 \(n\) 元有序数组 \((x_1,x_2,...,x_n)\) 的全体所构成的集合,即
\(\bold{R}^n=\bold{R}\times\bold{R}\times...\times\bold{R}=\{(x_1,x_2,...,x_n)|x_i\in \bold{R},i=1,2,...,n\}\)
注:这里 \(\bold{R}\times\bold{R}\) 是集合的笛卡儿积。
二元函数
设 \(D\) 是 \(\bold{R}^2\) 的一个非空子集,称映射 \(f:D\rightarrow \bold{R}\) 为定义在 \(D\) 上的二元函数,通常记为
\(z=f(x,y),(x,y)\in D\)
其中,点集 \(P\) 称为定义域,\(x,y\) 称为自变量,\(z\) 称为因变量。
函数 \(f(x,y)\) 的全体称为函数 \(f\) 的值域。
\(n\) 元函数
将二元函数中的 \(\bold{R}^2\) 替换成 \(\bold{R}^n\) ,对应的映射 \(f:D\rightarrow \bold{R}\) 就称为定义在 \(D\) 上的 \(n\) 元函数,通常记为
\(z=f(x_1,x_2,...,x_n),(x_1,x_2,...,x_n)\in D\)
注:一元函数、二元函数、多元函数,都是映射到 \(\bold{R}\) 上的函数。
二元函数的几何图形
二元函数的几何图形是一个曲面。
邻域(\(\bold{R}^2\))
设 \(P_0(x_0,y_0)\) 是 \(xOy\) 平面上的一个点,\(\delta\) 是某一正数,与点 \(P_0(x_0,y_0)\) 距离小于 \(\delta\) 的点 \(P(x,y)\) 的全体,称为点 \(P_0\) 的 \(\delta\) 邻域。
点和点集的关系
内点(存在邻域在点集内),外点(存在邻域在点集外),边界点(任意邻域既有点集外,也有点集内)
点集的边界点的全体称为边界
聚点
如果对于任意的 \(\delta>0\) ,点 \(P\) 的去心邻域 \(\overset{\circ}{U}(P,\delta)\) 内总有 \(E\) 中的点,那么称 \(P\) 是 \(E\) 的聚点。
重要的平面点集
开集
如果点集 \(E\) 的点都是内点
闭集
边界都是 \(E\) 的元素
连通集
点集内的任意两点,都可以用折线连接起来,并且折线上的点都属于 \(E\)
区域(开区域)
连通的开集
闭区域
开区域和其边界构成的点集
有界集
点集在某一个坐标原点的邻域内
无界集
非有界集
1.5.2 了解二元函数的极限与连续的概念以及有界闭区间上连续函数的性质
二元函数的极限
在某个聚点上,二元函数和值 \(A\) 的差值的绝对值能够比任意正数小,则 \(A\) 是二元函数在聚点处的极限。
二元函数的极限可以相应推广到多元函数上
多元函数的连续性
若多元函数的极限等于多元函数在某个点的值,则连续
有界闭区间上的连续函数的性质
和一元函数一样,具有有界性、最大值最小值、介值定理性质。
1.5.3 理解多元函数和全微分的概念,会求全微分,了解全微分存在的必要条件和充分条件,了解全微分的形式不变性
全增量
\(\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)\)
全增量的几何含义即曲面在一个邻域内的变化量
全微分
若函数 \(z=f(x,y)\) 在某点有全增量 \(\Delta z=A\Delta x+B\Delta y+o(\rho)\) ,其中 \(A,B\) 不与 \(\Delta x,\Delta y\) 相关,\(\rho=\sqrt{(\Delta x)^2+(\Delta y)^2}\) ,则称 \(z=f(x,y)\) 在该点可微分,记 \(A\Delta x+B\Delta y\) 为全微分,记作 \(\text{d} z\) ,有 \(\text{d}z=A\Delta x+B\Delta y\)
习惯上,将全微分记作 \(\text{d}z=A\text{d}x+B\text{d}y\)
全微分的几何含义:曲面的切平面近似曲面的的变化值。由于切平面包含了两个坐标轴上的偏导数对应的切线,因此切平面的变化值即为 \(f_x\Delta x+f_y\Delta y\)
全微分存在等价于存在切平面
全微分存在的必要条件
可微 \(\Rightarrow\) 偏导数存在
不充分性:偏导数只体现了两个坐标轴方向的可导性,不能描述其它方向上的“均匀”。
例如如果曲面和 \(xOz\) 的交线和 \(yOz\) 交线分别是朝上和朝下的曲线,则在原点处不可能用一个平面逼近。
证:
可微,则不妨取 \(\Delta y=0\) ,此时 \(\Delta z=f(x_0+\Delta x,y_0)-f(x_0,y_0), \Delta\rho=\Delta x\) ,即 \(z_x=A+\displaystyle\frac{o(\Delta x)}{\Delta x}\) 。类似可证 \(z_y=B\)
全微分存在的充分条件
偏导数连续 \(\Rightarrow\) 可微
不必要性:
举例:
\(\displaystyle z=\begin{cases}(x^2+y^2)\sin(\frac{1}{\sqrt{x^2+y^2}}), &x^2+y^2\not =0\\0, &x^2+y^2=0\end{cases}\)
\(\displaystyle \lim_{\rho\rightarrow 0}z=0\)
\(\displaystyle z|_{y=0}=x^2\sin\frac{1}{x}\)
\(\displaystyle \frac{\partial z|_{y=0}}{\partial x}=2x\sin\frac{1}{x}-\cos\frac{1}{x}\)
也即偏导数在 \((0,0)\) 处不连续。
\(\displaystyle \lim_{\rho\rightarrow 0}\frac{z-0}{\rho}=\lim_{\rho\rightarrow 0}\frac{\Delta z}{\rho}=\lim_{\rho\rightarrow 0}\rho\sin\frac{1}{\rho}=0\) ,也即 \(\Delta z=o(\rho)\) ,或者说 \(\text{d}z=0\) ,即可微分。
全微分的充分条件的不必要性理解:只需要能贴近平面,不需要光滑近似。
证明:
\(\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)\)
\(=f(x+\Delta x,y+\Delta y)-f(x,y+\Delta y)+f(x,y+\Delta y)-f(x,y)\)
看作一元函数,则利用拉格朗日中值定理有
\(=f_x(x+\xi_1 \Delta x,y+\Delta y)\Delta x+f_y(x,y+\xi_2\Delta y)\Delta y\)
由连续,有
\(=f_x(x,y)\Delta x+f_y(x,y)\Delta y+\varepsilon_1\Delta x+\varepsilon_2\Delta y\)
\(\displaystyle|\frac{\varepsilon_1\Delta x+\varepsilon_2\Delta y}{\rho}|\le |\varepsilon_1\frac{\Delta x}{\rho}|+|\varepsilon_2\frac{\Delta y}{\rho}|\le |\varepsilon_1|+|\varepsilon_2|\)
也即为 \(\rho\) 的高阶无穷小,得证。
全微分的形式不变性
设 \(z=f(u,v)\) 具有连续偏导数,则有全微分 \(\displaystyle\text{d}z=\frac{\partial z}{\partial u}\text{d}u+\frac{\partial z}{\partial v}\text{d}v\)
如果有 \(u=\varphi(x,y),v=\psi(x,y)\) ,且这两个函数也有连续的偏导数,则有复合函数
\(z=f(\varphi(x,y),\psi(x,y))\)
此时有全微分为 \(\displaystyle\text{d}z=\frac{\partial z}{\partial x}\text{d}x+\frac{\partial z}{\partial y}\text{d}y\)
利用多元复合函数的求导法则,代换得 \(\displaystyle\text{d}z=\frac{\partial z}{\partial u}\text{d}u+\frac{\partial z}{\partial v}\text{d}v\)
也即无论 \(u,v\) 是自变量还是中间变量,得到的 \(z=f(u,v)\) 全微分得形式是一样的。
1.5.4 理解方向导数与梯度的概念,并掌握其计算方法
方向导数
\(\displaystyle\frac{\partial f}{\partial l}|_{(x_0,y_0)}=\lim_{\Delta l\rightarrow 0^+}\frac{f(x_0+\Delta l\cos\alpha,y_0+\Delta l\cos\beta)-f(x_0,y_0)}{\Delta l}\)
方向导数和全微分
假设可微,则 \(\Delta z=z_x \Delta x+z_y\Delta y+o(\rho)\) ,而 \(\Delta x=\Delta l\cos\alpha, \Delta y=\Delta l\Delta \cos\beta\) ,即 \(\Delta z=z_x\Delta l\cos \alpha+z_y\Delta l\Delta \cos \beta+o(\rho)\) ,即 \(\displaystyle\frac{\Delta z}{\Delta l}=z_x\cos\alpha+z_y\cos\beta+\frac{o(\rho)}{\Delta l}\)
即 \(\displaystyle\frac{\partial f}{\partial l}=z_x\cos\alpha+z_y\cos\beta\)
梯度
设 \(f(x,y)\) 具有一阶连续偏导数,函数在 \((x_0,y_0)\) 处的梯度为 \(\bold{grad} f(x_0,y_0)=f_x \bold{i}+f_y \bold{j}=\begin{pmatrix}f_x\\f_y\end{pmatrix}\) 。
记 \(\displaystyle\nabla =\frac{\partial }{\partial x}\bold{i}+\frac{\partial }{\partial y}\bold{j}\) 为向量微分算子或者 \(\text{Nabla}\) 算子,则有
\(\nabla f(x_0,y_0)=\bold{grad}f(x_0,y_0)\)
梯度与方向导数
由梯度和方向导数的定义有:
\(\displaystyle\frac{\partial f}{\partial l}=\bold{grad}(x_0,y_0)\begin{pmatrix}\cos\alpha\\ \cos\beta\end{pmatrix}\)
考虑 \(\boldsymbol{e}_l=\begin{pmatrix}\cos\alpha\\\cos\beta\end{pmatrix}\)
也即在梯度方向的方向导数最大。
1.5.5 掌握多元复合函数一阶、二阶偏导数的求法
\(z=f[\varphi(t),\psi(t)]\)
\(\displaystyle\frac{\text{d}z}{\text{d}t}=\frac{\partial f}{\partial \varphi}\frac{\text{d}\varphi}{\text{d}t}+\frac{\partial f}{\partial \psi}\frac{\text{d} \psi}{\text{d} t}\)
可以推广到中间变量多于两个的情况。
这种导数称为全导数。
推导:
\(\Delta z=f_{\varphi}\Delta u+f_{\psi}\Delta v+\varepsilon_1\Delta x+\varepsilon_2\Delta y\)(参考全微分充分条件的证明)
两边同除以 \(\Delta t\) ,则有
\(\displaystyle\frac{\Delta z}{\Delta t}=f_\alpha\frac{\Delta u}{\Delta t}+f_\psi\frac{\Delta v}{\Delta t}+\varepsilon_1\frac{\Delta x}{\Delta t}+\varepsilon_2\frac{\Delta y}{\Delta t}\)
取 \(\Delta t\rightarrow 0\) ,则有最后两项为 \(0\) ,即得证。
\(z=f[\varphi(x,y),\psi(x,y)]\)
\(\displaystyle \frac{\partial z}{\partial x}=\frac{\partial z}{\partial \varphi}\frac{\partial \varphi}{\partial x}+\frac{\partial z}{\partial \psi}\frac{\partial \psi}{\partial x}\)
\(\displaystyle \frac{\partial z}{\partial y}=\frac{\partial z}{\partial \varphi}\frac{\partial \varphi}{\partial y}+\frac{\partial z}{\partial \psi}\frac{\partial \psi}{\partial y}\)
推导:
将 \(y\) 视作常数,即可得出。
1.5.6 了解隐函数存在定理,会求多元隐函数的偏导数
隐函数存在定理
设 \(F(x,y)\) 在 \((x_0,y_0)\) 的某一邻域内具有连续偏导数,且 \(F(x_0,y_0)=0\) ,\(F_y(x_0,y_0)\not =0\) ,则方程 \(F(x,y)=0\) 在点 \((x_0,y_0)\) 的某一邻域内恒能唯一确定一个连续且具有连续导数的函数 \(y=f(x)\) ,满足 \(y_0=f(x_0)\) 。
设函数 \(F(x,y,z)\) 在点 \((x_0,y_0,z_0)\) 的某一邻域内具有连续偏导数,且 \(F(x_0,y_0,z_0)=0\) ,\(F_z(x_0,y_0,z_0)\not =0\) ,则方程 \(F(x,y,z)=0\) 在点 \((x_0,y_0,z_0)\) 的某一邻域内恒能确定一个连续且具有连续偏导数的函数 \(z=f(x,y)\) ,它满足条件 \(z_0=f(x_0,y_0)\) 。
设 \(F(x,y,u,v), G(x,y,u,v)\) 在 \((x_0,y_0,u_0,v_0)\) 的某一邻域内具有对各个变量的连续偏导数,\(F(x_0,y_0,u_0,v_0)=0, G(x_0,y_0,u_0,v_0)=0\)
\(\displaystyle J=\frac{\partial (F,G)}{\partial (u,v)}=\begin{vmatrix}\frac{\partial F}{\partial u}&\frac{\partial F}{\partial v}\\\frac{\partial G}{\partial u} & \frac{\partial G}{\partial v}\end{vmatrix}\) 在点 \((x_0,y_0,u_0,v_0)\) 处不为 \(0\) ,则 \(F=0,G=0\) 在点的某一邻域内恒能唯一确定一组具有连续偏导数的函数 \(u=u(x,y),v=v(x,y)\)
注:隐函数存在定理证明较为复杂,这里直接利用结论进行反向推导。
假设隐函数存在,则邻域内有 \(y=f(x)\) , \(F(x,y(x))\equiv 0\) ,即 \(F_x+F_yy'(x)=0\) ,则 \(\displaystyle y'(x)=-\frac{F_x}{F_y}\)
类似,对于 \(z=f(x,y)\) ,则有 \(F(x,y,z(x,y))\equiv 0\) ,即 \(\displaystyle F_x+F_z \frac{\partial z}{\partial x}=0\) ,且 \(\displaystyle F_y+F_z\frac{\partial z}{\partial y}=0\) ,即有 \(\displaystyle z_x=-\frac{F_x}{F_z}\) ,\(\displaystyle z_y=-\frac{F_y}{F_z}\) 。
类似,\(\begin{cases}F(x,y,u,v)\equiv 0\\G(x,y,u,v)\equiv 0\end{cases}\) ,分别对 \(x,y\) 求偏导数得
\(\begin{cases}F_1+F_3u_x+F_4v_x=0\\G_1+F_3u_x+F_4v_x=0\\F_2+F_3u_y+F_4v_y=0\\G_2+F_3u_y+F_4v_y=0\end{cases}\) ,
利用克拉默法则,即可求出所有 \(u_x,u_y,v_x,v_y\) 。
注:观察可知,雅可比式就是该公式的矩阵对应的模,模为 \(0\) 则没有唯一解。
注:隐函数存在定理给出了一个关系式在什么情况下能够确定一个函数(映射关系)。
以二元方程为例,\(F_y(x_0,y_0)\not =0\) 实际上是要求二元函数所表示的曲线在此点处不能平行于 \(y\) 轴,也即不能垂直于 \(x\) 轴。
对于多元方程,则 \(F_{a_n}(a_1,a_2,...,a_{n-1})\not =0\) 实际上是要求不存在相同的 \(a_1,a_2,...,a_{n-1}\) 对应多个 \(a_n\) 的情况。
1.5.7 了解空间曲线的切线和法平面及曲面的切平面和法线的概念,会求它们的方程
一元向量值函数
设数集 \(D\subset \bold{R}\) ,则称映射 \(f:D\rightarrow \bold{R}^n\) 为一元向量值函数,通常记为 \(\bold{r}=\bold{f}(t), t\in D\)
记 \(\bold{f}(t)=x\bold{i}+y\bold{j}+z\bold{k}\) ,则 \(\displaystyle \frac{\text{d}\bold{f}}{\text{d}t}=x'\bold{i}+y'\bold{j}+z'\bold{k}\)
向量值函数的导数的几何意义:
向量值函数的导数,即导向量表示向量值函数的终端曲线在求导点出的一个切向量。
向量值函数的物理意义:
设向量值函数表示质点运动的位置向量,则向量值函数的导数表示质点的速度向量。
空间曲线的切线
设曲线参数方程为 \(\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}\) ,则某点的导向量为 \((x',y',z')\) ,也为切线的方向向量,则得到切线的点向式方程为 \(\displaystyle\frac{x-x_0}{x'}=\frac{y-y_0}{y'}=\frac{z-z_0}{z'}\)
再设曲线的方程为 \(\begin{cases}F(x,y,z)=0\\G(x,y,z)=0\end{cases}\) ,参照参数方程,把 \(y,z\) 看成是 \(x\) 的函数,也即有 \(\begin{cases}F(x,y(x),z(z))=0\\G(x,y(x),z(x))=0\end{cases}\) ,即
\(\begin{cases}F_1+F_2y'_x+F_3z'_x=0\\G_1+G_2y'_x+G_3z'_x=0\end{cases}\)
由克拉默法则,有
\(\displaystyle y'_x=\frac{\begin{vmatrix}-F_1&F_3\\-G_1&G_3\end{vmatrix}}{\begin{vmatrix}F_2&F_3\\G_2&G_3\end{vmatrix}}\) ,\(\displaystyle z'_x=\frac{\begin{vmatrix}F_2&-F_1\\G_2&-G_1\end{vmatrix}}{\begin{vmatrix}F_2&F_3\\G_2&G_3\end{vmatrix}}\)
曲线的法平面
由切线的法向量,以及平面上的一点,即可得空间曲线得法平面。
曲面的法线
记曲面为 \(F(x,y,z)=0\) ,曲面上的一条曲线为 \(\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}\) ,则有 \(F(x(t),y(t),z(t))\equiv 0\) ,两边对 \(t\) 求导,则有 \(F_1x'(t)+F_2y'(t)+F_3z'(t)=0\) ,由于曲线的切向量为 \((x',y',z')\) ,即向量 \((F_1,F_2,F_3)\) 始终与曲线的切向量垂直,也即是切点处的法向量。
曲面的切平面
求出曲面的法向量之后,即可得出曲面的切平面的点法式方程。
1.5.8 了解二元函数的二阶泰勒公式
\(f(x_0+h,y_0+k)\)
\(=\displaystyle f(x_0,y_0)+(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y})f(x_0,y_0)+...+\frac{1}{n!}(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y})^nf(x_0,y_0)\)
\(\displaystyle +\frac{1}{(n+1)!}(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y})^{n+1}f(x_0+\theta h,y_0+\theta k)\)
1.5.9 理解多元函数极值和条件极值的概念,掌握多元函数极值存在的必要条件,了解二元函数极值存在的充分条件,会求二元函数的极值,会用拉格朗日乘数法求条件极值,会求简单多元函数的最大值和最小值,并会解决一些简单的应用问题
多元函数的极值
领域内的最大值和最小值
条件极值
对自变量有附加条件的称为条件极值
必要条件
\(f_x=0,f_y=0\)
充分条件(二元函数极值存在的判别法)
\(f_x=0,f_y=0\) , \(\begin{cases}A=f_{xx}\\B=f_{xy}\\C=f_{yy}\end{cases}\)
\(AC-B^2>0\) ,有极值,且 \(A<0\) 时有极大值,\(A>0\) 时有极小值;
\(AC-B^2=0\) ,需要进一步讨论;
\(AC-B^2<0\) ,无极值。
二元函数的极值求法
先求 \(f_x=0,f_y=0\) ,再利用判别法判断极值点的类型。
拉格朗日乘数法
求 \(z=f(x,y)\) 在条件 \(g(x,y)=0\) 条件下的条件极值。
不妨假设 \(g(x,y)=0\) 满足隐函数存在定理的条件(连续偏导数,\(g'_y\not =0\)) ,且确定的函数为 \(y=\varphi(x)\) ,则 \(z=f(x,\varphi(x))\)
\(\displaystyle \frac{\text{d}z}{\text{d}x}=f_1+f_2\varphi'(x)=0\)
而 \(g_1+g_2y'_x=0\) ,即 \(g_1+g_2\varphi'(x)=0\) ,故
\(\displaystyle f_1-f_2\frac{g_1}{g_2}=0\) ,这就是条件极值存在的必要条件。
变换即 \(\displaystyle \frac{f_1}{f_2}=\frac{g_1}{g_2}\) (不考虑为 0 的情况)
引入拉格朗日函数 \(L=f(x,y)+\lambda g(x,y)\) ,则 \(L_1=f_1+\lambda g_1\) ,\(L_2=f_2+\lambda g_2\) ,
则条件极值的存在条件转化为 \(L_x=0,L_y=0\) 。
根据条件得出的点即为可能的极值点,在此基础上,结合具体的问题,再分析是否是极值点。
1.6 多元函数积分学
1.6.1 理解二重积分、三重积分的概念,了解重积分的性质,了解二重积分的中值定理
二重积分
\(\displaystyle \underset{D}{\iint}f(x,y)\text{d}\sigma=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\xi_i,\eta_i)\Delta \sigma_i\)
其中 \(D\) 叫做积分区域,\(\text{d}\sigma\) 称为面积元素。
三重积分
\(\displaystyle \underset{\Omega}{\iiint}f(x,y,z)\text{d}v=\lim\limits_{\lambda\rightarrow 0}f(\xi_i,\eta_i,\zeta_i)\Delta v_i\)
其中 \(\Omega\) 为有界闭区域,叫做积分区域,\(\text{d}v\) 叫做体积元素。
重积分的性质
被积函数可加性;积分区域可加性;二重积分中值定理
1.6.2 掌握二重积分的计算方法(直角坐标、极坐标),会计算三重积分(直角坐标、柱面坐标、球面坐标)
直角坐标计算二重积分
对二重积分 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}\sigma\) ,直角坐标积分法将二重积分转化为求以 \(D\) 为底,以 \(z=f(x,y)\) 为顶的曲顶柱体。曲顶柱体可以利用一重积分按截面面积已知的立体的体积进行计算。
不妨假设积分区域 \(D\) 为 \(\begin{cases}a\le x\le b\\ m(x)\le y\le n(x)\end{cases}\) ,\(yOz\) 截面面积即为 \(\displaystyle \int_{m(x)}^{n(x)}f(x,y)\text{d}y\) ,则柱体的体积为 \(\displaystyle \int_a^b [\int_{m(x)}^{n(x)}f(x,y)\text{d}y] \text{d}x\) ,这就是直角坐标计算二重积分的公式。
也写作 \(\displaystyle \int_a^b \text{d}x \int_{m(x)}^{n(x)}f(x,y)\text{d}y\) 。
注:直角坐标下的二重积分可以记为 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}x\text{d}y\)
极坐标计算二重积分
由扇形面积 \(\displaystyle S=\frac{1}{2}\theta \rho^2\) ,得扇形微元为 \(\Delta S=\displaystyle \frac{1}{2}\Delta \theta [(\rho+\Delta \rho)^2-\rho^2]=\rho\Delta \rho\Delta \theta+o(\Delta \rho\Delta \theta)\)
于是二重积分 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}\sigma = \lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\xi_i,\eta_i)\Delta \sigma_i\)
\(=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n}f(\rho_i\cos\theta_i,\rho_i\sin\theta_i)\rho_i\text{d}\rho_i\text{d}\theta_i\)
\(\displaystyle = \underset{D}{\iint}f(\rho\cos\theta,\rho\cos\theta)\rho\text{d}\rho\text{d}\theta\)
这个式子相当于利用极坐标对二重积分进行了换元(换元为直角坐标的形式),换元后转换为二次积分进行计算。
不妨设积分区域为 \(\begin{cases}\alpha\le\theta\le\beta\\\varphi_1(\theta)\le \rho\le\varphi_2(\theta)\end{cases}\) ,
则 \(\displaystyle \underset{D}{\iint}f(\rho\cos\theta,\rho\cos\theta)\rho\text{d}\rho\text{d}\theta=\int_\alpha^\beta\text{d}\theta\int_{\varphi_1(\theta)}^{\varphi_2{\theta}}f(\rho\cos\theta,\rho\cos\theta)\rho\text{d}\rho\)
二重积分的换元法(了解)
若有变换 \(T:x=x(u,v),y=y(u,v)\) ,将 \(D':u,v\) 变换为 \(D:x,y\) ,且满足
(1)有一阶连续偏导数;
(2)雅可比式 \(J(u,v)=\displaystyle\frac{\partial (x,y)}{\partial (u,v)}=\begin{vmatrix}x_u&x_v\\y_u&y_v\end{vmatrix}\not =0\) ;
(3)变换是一对一的;
则 \(\displaystyle \underset{D}{\iint}f(x,y)\text{d}x\text{d}y=\underset{D'}{\iint}f(x(u,v),y(u,v))|J(u,v)|\text{d}u\text{d}v\)
注:雅可比式不为 \(0\) 是隐函数存在,即 \(x=x(u,v),y=y(u,v)\) 存在的必要条件。
注:取 \(\begin{cases}x=\rho\cos\theta\\y=\rho\sin\theta\end{cases}\) ,则 \(J(\rho,\theta)=\begin{vmatrix}\cos\theta&-\rho\sin\theta\\\sin\theta&\rho\cos\theta\end{vmatrix}=|\rho|=\rho\) 。
直角坐标计算三重积分
不妨记积分区域为 \(\begin{cases}a\le x\le b\\f_1(x)\le y\le f_2(x)\\g_1(x,y)\le z\le g_2(x,y)\end{cases}\) ,则参照二重积分的形式,将三重积分化为三次积分为 \(\displaystyle\underset{\Omega}{\iiint}f(x,y,z)\text{d}v= \int_a^b\text{d}x\int_{f_1(x)}^{f_2(x)}\text{d}y\int_{g_1(x,y)}^{g_2(x,y)}f(x,y,z)\text{d}z\)
三重积分也可记作 \(\displaystyle \underset{\Omega}{\iiint}f(x,y,z)\text{d}x\text{d}y\text{d}z\)
注:三重积分化为三次积分的形式,可以理解为先进行线积分得到线质量,然后得到面质量,最后得到体质量。
柱面坐标计算三重积分
参考二重积分,则体积元为 \(\text{d}v=\rho\text{d}\rho\text{d}\theta\text{d}z\) 。
球面坐标计算三重积分
记有向线段 \(\overrightarrow{OM}=\boldsymbol{a}\) ,与 \(z\) 轴的夹角为 \(\varphi\) ,在 \(xOy\) 平面上的投影与 \(x\) 轴的夹角为 \(\theta\) ,则有 \(\begin{cases}x=\rho\sin\varphi\cos\theta\\y=\rho\sin\varphi\sin\theta\\z=\rho\cos\varphi\end{cases}\) ,体积元可以近似为一个长方体,即 \(\text{d}v=\rho\sin\varphi\text{d}\theta \cdot \rho\text{d}\varphi \cdot \text{d}\rho=\rho^2\sin\varphi\text{d}\rho\text{d}\varphi\text{d}\theta\)
1.6.3 理解两类曲线积分的概念,了解两类曲线积分的性质及两类曲线积分的关系
两类曲线积分
分别为对弧长的曲线积分和对坐标的曲线积分
对弧长的曲线积分的概念
\(\displaystyle\int_L f(x,y)\text{d}s=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^n f(\xi_i,\eta_i)\Delta s_i\)
典型的物理含义就是曲线的质量
对弧长的曲线积分也称为第一类曲线积分,\(L\) 叫做积分弧段。
弧长永远为正,因此对弧长的曲线积分在不同方向的值相同,或者说积分曲线是一条没有方向的曲线。
对坐标的曲线积分
\(\displaystyle\int_L P(x,y)\text{d}x=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n} P(\xi_i,\eta_i)\Delta x_i\)
\(\displaystyle\int_L Q(x,y)\text{d}y=\lim\limits_{\lambda\rightarrow 0}\displaystyle\sum_{i=1}^{n} Q(\xi_i,\eta_i)\Delta y_i\)
典型的物理含义就是变力沿曲线做的功。
对坐标的曲线积分的积分曲线是一条有向曲线,\(\Delta x_i\) 的正负与曲线的方向有关(朝向 \(x\) 轴正向,为正)。
对坐标的曲线积分也称为第二类曲线积分。
第二类曲线积分一般出现的形式是 \(\int_L P\text{d}x+Q\text{d}y\)
记 \(\boldsymbol{F}(x,y)=(P(x,y),Q(x,y))\) ,\(\text{d}\boldsymbol{r}=(\text{d}x,\text{d}y)\) ,则有曲线积分的形式为
\(\displaystyle\int_L \boldsymbol{F}(x,y)\cdot\text{d}(\boldsymbol{r})\)
两类曲线积分的联系
观察定义式,不妨设曲线的方向向量为 \((\cos\alpha, \cos\beta)\) ,则有 \(\Delta x_i=\Delta s_i \cos\alpha\) ,\(\Delta y_i=\Delta s_i\cos\theta\) ,因此
\(\displaystyle\int_L P\text{d}x+Q\text{d}y=\int_L(P\cos\alpha+Q\cos\theta)\text{d}s\)
1.6.4 掌握计算两类曲线积分的方法
设曲线方程为 \(\begin{cases}x=x(t)\\y=y(t)\end{cases}\) ,
第一类曲线积分的计算
\(\Delta s=\sqrt{\Delta^2 x+\Delta^2 y^2}=\sqrt{x'^2+y'^2}\Delta t\)
即
\(\displaystyle\int_L f(x,y)\text{d}s=\int_{t_1}^{t_2}f(x(t),y(t))\sqrt{x'^2+y'^2}\text{d}t\)
第二类曲线积分的计算
由 \(\Delta x=x'\Delta t\) ,\(\Delta y=y'\Delta t\)
\(\displaystyle\int_L P\text{d}x+Q\text{d}y=\int_{t_1}^{t_2}(Px'+Qy')\text{d}t\)
1.6.5 掌握格林公式并会运用平面曲线积分与路径无关的条件,会求二元函数全微分的原函数
单连通区域
设 \(D\) 内任一闭曲线所围的部分都属于 \(D\) ,则称 \(D\) 为单连通区域。否则称为复联通区域。
边界曲线的正方向
规定沿边界曲线行走时,区域在左侧的方向为正方向。对于单连通区域,正方向为逆时针,对于复连通区域,内侧的边界的方向为顺时针。
格林公式
设 \(P,Q\) 在 \(D\) 上具有一阶连续偏导数,
\(\displaystyle\underset{D}{\iint}(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y})\text{d}x\text{d}y=\oint_LP\text{d}x+Q\text{d}y\)
其中 \(L\) 是 \(D\) 的取正向的边界曲线。
证明:
不妨取 \(D\) 为 \(\begin{cases}a < x < b\\f_1(x) < y < f_2(x)\end{cases}\) ,上侧曲线为 \(L_2\),下侧曲线为 \(L_1\),
则 \(\displaystyle\underset{D}{\iint}\frac{\partial P}{\partial y}\text{d}x\text{d}y=\int_a^b [\int_{f_1(x)}^{f_2(x)}\frac{\partial P}{\partial y}\text{d}y]\text{d}x=\int_a^b(P(x,f_2(x))-P(x,f_1(x)))\text{d}x\)
\(\displaystyle\oint_LP\text{d}x=\int_{L_1}P\text{d}x+\int_{L_2}P\text{d}x=\int_a^bP(x,f_1(x))\text{d}x-\int_a^bP(x,f_2(x))\text{d}x\)
格林公式的理解
格林公式的向量形式:
\(\displaystyle\underset{D}{\iint}\boldsymbol{\nabla}\times\boldsymbol{F}(x,y)\cdot \text{d}\boldsymbol{s}=\oint_L\boldsymbol{F}(x,y)\cdot \text{d}\boldsymbol{r}\)
也即旋度对面积的积分等于向量场对边界的积分。
平面上曲面积分与路径无关
一个区域内任意两点之间的区域内的任意两条曲线 \(L_1,L_2\) ,若始终有
\(\displaystyle\int_{L_1}P\text{d}x+Q\text{d}y=\int_{L_2}P\text{d}x+Q\text{d}y\)
则称曲线积分在区域内与路径无关。
曲线积分与路径无关的等价条件
区域内任意闭曲线 \(C\) 的曲线积分 \(\oint_{C}P\text{d}x+Q\text{d}y=0\)
联系格林公式,即 \(\displaystyle\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}=0\)
二元函数全微分的原函数
\(P\text{d}x+Q\text{d}y\) 在单连通域 \(D\) 内为某一函数 \(u(x,y)\) 的全微分的充要条件是 \(\displaystyle\frac{\partial Q}{\partial x}=\frac{\partial P}{\partial y}\) 在 \(D\) 内恒成立。
取函数 \(\displaystyle u(x,y)=\int_{x_0,y_0}^{x,y}P(x,y)\text{d}x+Q(x,y)\text{d}y\)
则有 \(\displaystyle\frac{\partial u}{\partial x}=\lim\limits_{\Delta x\rightarrow 0}\frac{u(x+\Delta x,y)-u(x,y)}{\Delta x}\) ,\(\displaystyle u(x+\Delta x,y)-u(x,y)=\int_{x_0,y_0}^{x+\Delta x,y}-\int_{x_0,y_0}^{x,y}\) ,假设曲线积分与路径无关,则有 \(\displaystyle =\int_{x_0,y_0}^{x,y}+\int_{x,y}^{x+\Delta x,y}-\int_{x_0,y_0}^{x,y}\) ,即 \(\displaystyle\frac{\partial u}{\partial x}=P(x,y)\) (充分性的证明)。
再取 \(\text{d}u=P\text{d}x+Q\text{d}y\) ,则有 \(\displaystyle\frac{\partial u}{\partial x}=P\) ,\(\displaystyle \frac{\partial^2 u}{\partial x\partial y}=\frac{\partial P}{\partial y}\) ,\(\displaystyle\frac{\partial u}{\partial y}=Q\) ,\(\displaystyle\frac{\partial ^2u}{\partial y\partial x}=\frac{\partial Q}{\partial x}\) ,当一阶偏导数连续时,有 \(\displaystyle\frac{\partial^2 u}{\partial x\partial y}=\frac{\partial ^2u}{\partial y\partial x}\) ,因此必要性得证。
证明过程即得,若曲线积分与路径无关,则 \(\displaystyle u(x,y)=\int_{x_0,y_0}^{x,y}P(x,y)\text{d}x+Q(x,y)\text{d}y\) 即为全微分对应的原函数。
曲线积分 \(\int_LP\text{d}x+Q\text{d}y\) 与路径无关 \(\Leftrightarrow\) \(\displaystyle \frac{\partial P}{\partial y}=\frac{\partial Q}{\partial x}\) \(\Leftrightarrow\) \(P\text{d}x+Q\text{d}y\) 是某一个函数 \(u(x,y)\) 的全微分
曲线积分的基本定理(了解)
若对场 \(\boldsymbol{F}\) ,存在一个数量函数 \(f\) ,满足 \(\boldsymbol{F}=\nabla f\) ,则曲线积分 \(\int_L \boldsymbol{F}\cdot\text{d}\boldsymbol{r}=f(B)-f(A)\) 。
也即曲线积分只与势函数在两端点的值,而不依赖于两点间的路径。这说明势场是保守场。
扩展
梯度、散度、旋度
1.6.6 了解两类曲面积分的概念、性质及两类曲面积分的关系,掌握计算两类曲面积分的方法,掌握用高斯公式计算曲面积分的方法,并会用斯托克斯公式计算曲线积分
对面积的曲面积分
\(\displaystyle\underset{\Sigma}{\iint}f(x,y,z)\text{d}S=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}f(\xi_i,\eta_i,\zeta_i)\Delta S_i\)
对面积的曲面积分的计算
记 \(\Delta S_i\) 在 \(xOy\) 平面上的投影为 \(\Delta \sigma_i\) ,由曲面的一般方程的法向量为 \((F_x,F_y,F_z)\) ,记曲面方程为 \(z=f(x,y)\) ,则为 \((z_x,z_y,-1)\) ,也即有 \(\Delta S_i=\Delta \sigma_i \sqrt{1+z_x^2+z_y^2}\) ,
记 \(\Sigma\) 在 \(xOy\) 平面上的投影为 \(D\) ,即
\(\displaystyle\underset{\Sigma}{\iint}f(x,y,z)\text{d}S=\underset{D}{\iint}f(x,y,z(x,y))\sqrt{1+z_x^2+z_y^2}\text{d}x\text{d}y\)
有向曲面
取定了法向量,亦即选定了侧的曲面,称为有向曲面。
有向曲面的投影
假设一小块有向曲面的所有法向量和 \(z\) 轴的夹角 \(\theta\) 均满足 \(\cos\theta\) > 0 或 \(\cos\theta < 0\) ,记投影的面积为 \(\Delta \sigma\) ,则投影 \(|\Delta S|=\Delta \sigma\) ,符号与 \(\cos\theta\) 相同 。
流向曲面一侧的流量
设流体流过平面上的一个闭区域, 且速度处处相等为 \(\boldsymbol{v}\) ,则单位时间内流过区域的流量等于底面积为闭区域面积,斜高为 \(|\boldsymbol{v}|\) 的斜柱体的体积。
设平面的单位法向量为 \(\boldsymbol{n}\) ,且以平面的法向量方向为曲面的正方向,则斜柱体体积为 \(A|\boldsymbol{v}|\cos\theta=A\boldsymbol{v}\cdot\boldsymbol{n}\) 。
对于有向曲面 \(\Sigma\),将其分成 \(n\) 个小块 \(\Delta S_i\) ,设对应的单位法向量为 \(\boldsymbol{n}_i\) ,速度场为 \(\boldsymbol{v}=(P,Q,R)\) ,则流过曲面的流量可以近似为 \(\displaystyle\Phi=\sum_{i=1}^{n}\boldsymbol{v}_i\cdot\boldsymbol{n}_i\Delta S_i\)
记 \(\boldsymbol{n}_i=(\cos\alpha,\cos\beta,\cos\gamma)\) ,则 \(\Phi=\displaystyle\sum_{i=1}^{n}\Delta S_i(P\cos\alpha+Q\cos\beta+R\cos\gamma)=\sum_{i=1}^{n}P\Delta S_{yz}+Q\Delta S_{xz}+R\Delta S_{xy}\) 。
对坐标的曲面积分
\(\displaystyle\underset{\Sigma}{\iint}P(x,y,z)\text{d}y\text{d}z=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}P(\xi_i,\eta_i,\zeta_i)(\Delta S_i)_{yz}\)
\(\displaystyle\underset{\Sigma}{\iint}Q(x,y,z)\text{d}y\text{d}z=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}P(\xi_i,\eta_i,\zeta_i)(\Delta S_i)_{xz}\)
\(\displaystyle\underset{\Sigma}{\iint}P(x,y,z)\text{d}x\text{d}y=\lim\limits_{\lambda\rightarrow 0}\sum_{i=1}^{n}P(\xi_i,\eta_i,\zeta_i)(\Delta S_i)_{xy}\)
注:对坐标的曲面积分的符号体现在投影 \(\Delta S\) 上。
按对坐标的曲面积分的定义,则有流过曲面的流量为 \(\displaystyle\Phi=\underset{\Sigma}{\iint}P\text{d}y\text{d}z+Q\text{d}x\text{d}z+R\text{d}x\text{d}y\)
对坐标的曲面积分的计算法
不妨假设 \(\cos\alpha>0\) ,此时有 \((\Delta S_i)_{yz}=(\Delta \sigma)_{yz}\) ,参考二重积分的定义式,记曲面 \(\Sigma\) 在 \(yOz\) 平面上的投影为 \(D_{yz}\) ,也即有
\(\displaystyle\underset{\Sigma}{\iint}P(x,y,z)\text{d}y\text{d}z=\underset{D_{yz}}{\iint}P(x,y,z)\text{d}y\text{d}z=\underset{D_{yz}}{\iint}P(x(y,z),y,z)\text{d}y\text{d}z\)
高斯公式
\(\displaystyle\underset{\Omega}{\iiint}(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z})\text{d}v=\underset{\Sigma}{\oiint}P\text{d}y\text{d}z+Q\text{d}z\text{d}x+R\text{d}x\text{d}y\)
其中 \(\Omega\) 是空间闭区域,其是由分片光滑的闭曲面 \(\Sigma\) 组成。
证:
取一个柱面,则有 \(\displaystyle\underset{\Sigma}{\oiint}R\text{d}x\text{d}y\) 有三个积分面,且侧面的积分值为 \(0\) ,记顶面为 \(\Sigma_1\) ,底面为 \(\Sigma_2\) ,则封闭曲面的积分为 \(\displaystyle\underset{\Sigma_1}{\iint}R\cos\alpha\text{d}S+\underset{\Sigma_2}{\iint}R\cos\beta\text{d}S=\underset{D}{\iint}(R(x,y,z_1)-R(x,y,z_2))\text{d}\sigma\) ,
同时 \(\displaystyle\underset{\Omega}{\iiint}\frac{\partial R}{\partial z}\text{d}v=\underset{D}{\iint}\text{d}\sigma\int_{z_1}^{z_2}\frac{\partial R}{\partial z}\text{d}z=\underset{D}{\iint}(R(x,y,z_1)-R(x,y,z_2))\text{d}\sigma\) 。
斯托克斯公式
设 \(\Gamma\) 为分段光滑的空间有向闭曲线,\(\Sigma\) 是以闭曲线为边界的分片光滑的有向曲面,曲线的正向和曲面的侧符合右手规则,则
\(\displaystyle\oint_{\Gamma}P\text{d}x+Q\text{d}y+R\text{d}z=\underset{\Sigma}{\iint}\begin{vmatrix}\text{d}y\text{d}z&\text{d}z\text{d}x&\text{d}x\text{d}y\\\frac{\partial }{\partial x}&\frac{\partial }{\partial y}&\frac{\partial }{\partial z}\\P&Q&R\end{vmatrix}=\underset{\Sigma}{\iint}\begin{vmatrix}\cos\alpha&\cos\beta&\cos\gamma\\\frac{\partial }{\partial x}&\frac{\partial }{\partial y}&\frac{\partial }{\partial z}\\P&Q&R\end{vmatrix}\text{d}S\)
斯托克斯公式即空间上,旋度对面积的积分和场对边界曲线的积分。
如果曲面退化到 \(xOy\) 平面上,即 \((\cos\alpha,\cos\beta,\cos\gamma)=(0,0,1)\) ,此时斯托克斯公式就变成格林公式。
证:
\(\displaystyle\underset{\Sigma}{\iint}\frac{\partial P}{\partial z}\text{d}z\text{d}x-\frac{\partial P}{\partial y}\text{d}x\text{d}y=\underset{\Sigma}{\iint}(\frac{\partial P}{\partial z}\cos\beta-\frac{\partial P}{\partial y}\cos\gamma)\text{d}S\)
记曲面为 \(z=f(x,y)\) ,则有法向量 \((\cos\alpha,\cos\beta,\cos\gamma)=\lambda(-z_x,-z_y,1)\)
即 \(\displaystyle=\underset{\Sigma}{\iint}(\frac{\partial P}{\partial z}\cos\beta\cdot (-z_y)-\frac{\partial P}{\partial y}\cos\gamma)\text{d}S=-\underset{\Sigma}{\iint}(\frac{\partial }{\partial y}P(x,y,z(x,y)))\text{d}S\)
记 \(D\) 为右手法则的正向投影,利用格林公式,即 \(\displaystyle=\oint_CP\text{d}x\)
1.6.7 了解散度与旋度的概念,并会计算
通量:
设有向量场 \(\boldsymbol{A}=(P,Q,R)\) ,\(\Sigma\) 为场内的一片有向曲面,则通量为
\(\displaystyle\underset{\Sigma}{\iint}\boldsymbol{A}\cdot\boldsymbol{n}\text{d}S\)
通量即对坐标的曲面积分。
环流量:
\(\displaystyle\oint_{\Gamma}\boldsymbol{A}\cdot\boldsymbol{\tau}\text{d}s\)
其中 \(\Gamma\) 是一条分段光滑的有向闭曲线,\(\boldsymbol{\tau}\) 是曲线的单位切向量。
环流量即对坐标的曲线积分。
梯度:
\(\bold{grad}f=\bold{\nabla}f=(f_x,f_y)\)
梯度描述了函数在某点的最陡上升方向。
散度:
\(\text{div}\boldsymbol{f}=\bold{\nabla}\cdot \boldsymbol{f}=f_x+f_y+f_z\)
散度可以看作稳定流动的不可压缩流体在某点的源头强度,若散度为零,则表示流体在此点无源,若为正,则有向外发散源,若为负,则有吸收流体的汇聚源。
散度即为通量的密度(利用高斯公式可证)。
高斯公式的通量和散度形式
\(\displaystyle\underset{\Omega}{\iiint}\boldsymbol{\nabla}\cdot \boldsymbol{A}\text{d}v=\underset{\Sigma}{\oiint}\boldsymbol{A}\cdot\boldsymbol{n}\text{d}S\)
即散度对体积的积分等于对应曲面的通量(通量的法向量和曲面的侧满足右手法则)
旋度:
\(\bold{rot}\boldsymbol{f}=\bold{\nabla}\times\boldsymbol{f}=\begin{vmatrix}\boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\\frac{\partial}{\partial x}&\frac{\partial}{\partial y}&\frac{\partial}{\partial z}\\P&Q&R\end{vmatrix}\)
以 \(\boldsymbol{f}\) 表示刚体绕定轴旋转形成的速度场,则速度场的旋度即为角速度 \(2\boldsymbol{\omega}\) 。
\(\boldsymbol{v}=\boldsymbol{\omega}\times\boldsymbol{r}=(0,0,\omega)\times(x,y,z)\) ,
即 \(\boldsymbol{v}=\begin{vmatrix}\boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\0&0&\omega\\x&y&z\end{vmatrix}=(-y\omega,x\omega,0)\) ,
此时 \(\bold{rot}\boldsymbol{v}=\begin{vmatrix}\boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\\frac{\partial}{\partial x}&\frac{\partial}{\partial y}&\frac{\partial}{\partial z}\\-y\omega&x\omega&0\end{vmatrix}=(0,0,2\omega)=2\boldsymbol{\omega}\)
旋度即为环流量的密度。
斯托克斯公式的旋度形式
\(\displaystyle\underset{\Sigma}{\iint}\boldsymbol{\nabla}\times\boldsymbol{n}\text{d}S=\oint_{\Gamma}\boldsymbol{A}\cdot\boldsymbol{\tau}\text{d}s\)
1.6.8 会用重积分、曲线积分及曲面积分求一些几何量与物理量(平面图形的面积、体积、曲面面积、弧长、质量、质心、形心、转动惯量、引力、功及流量等)
质心
\(\displaystyle x=\frac{\sum x_im_i}{M}\)
或者积分形式
\(\displaystyle x=\frac{\underset{\Omega}{\displaystyle\iiint}x\rho\text{d}v}{\underset{\Omega}{\displaystyle\iiint}\rho\text{d}v}\)
形心
\(\displaystyle x=\frac{\sum x_iv_i}{V}\)
形心即等密度体的质心
转动惯量
\(\displaystyle I_x=\sum (y^2+z^2)m_i\)
\(\displaystyle I_x=\underset{\Omega}{\iiint}(y^2+z^2)\rho\text{d}v\)
1.7 无穷级数
1.7.1 理解常数项级数收敛、发散以及收敛级数的和的概念,掌握级数的基本性质及收敛的必要条件
常数项级数
给定一个数列 \(u_1,u_2,...,u_n,...\)
由这个数列构成的表达式 \(u_1+u_2+...+u_n+...\) 叫做(常数项)无穷级数,简称(常数项)级数,记为 \(\displaystyle\sum_{i=1}^{\infin}u_i\) 。
部分和
作级数的前 \(n\) 项和 \(\displaystyle s_n=\sum_{i=1}^{n}u_i\) 称为级数的部分和。
级数收敛
即 \(\lim\limits_{n\rightarrow \infin}s_n=s\)
此时,称级数的和为 \(s\)。
如果没有极限,则称级数发散。
级数的基本性质
\(k\) 乘收敛一致
收敛可加减
改变有限项不影响收敛性
任意加括号形成的级数收敛一致
级数收敛的必要条件
若级数 \(\displaystyle \sum_{i=1}^{\infin}u_i\) 收敛,则 \(\lim\limits_{i\rightarrow \infin}u_i=0\)
柯西审敛原理(级数收敛的充要条件)
总存在一个下标下限,其后续的任意一般项之和能任意小。
1.7.2 掌握几何级数与 p 级数的收敛与发散的条件
几何级数
即等比级数,\(\displaystyle\sum_{i=0}^{\infin}aq^{i}\)
\(|q|<1\) 时收敛,否则发散。
\(p\) 级数
即 \(\displaystyle\sum_{i=1}^n \frac{1}{i^p}=\frac{1}{1^p}+\frac{1}{2^p}+\frac{1}{3^p}+...\)
\(p\) 级数也称为超调和级数。
\(p=1\) 时,为调和级数,发散(可利用柯西审敛原理)。
\(p<1\) 时,每个项都变大,则仍然发散。
\(p>1\) 时,利用 \(\displaystyle\frac{1}{i^p}<\frac{1}{x^p}\) ,\(\displaystyle\frac{1}{i^p}=\int_{i-1}^{i}\frac{1}{i^p}\text{d}x<\int_{i-1}^{i}\frac{1}{x^p}\text{d}x\) ,得到右式 \(\displaystyle <1+\int_{1}^\infin\frac{1}{x^p}\text{d}x=1+[\frac{x^{-p+1}}{-p+1}]_{1}^{\infin}=1+\frac{1}{p-1}\) ,即收敛。
1.7.3 掌握正项级数收敛性的比较判别法、比值判别法、根植判别法,会用积分判别法
正项级数比较判别法
若相对小,则同收敛,若相对大,则同发散。
利用有限项不改变敛散性的性质,可以推导出极限形式的正项级数比较判别法。
正项级数比值审敛法
若 \(\displaystyle \lim\limits_{n\rightarrow \infin}\frac{u_{n+1}}{u_n}=\rho\) ,则 \(\rho<1\) 收敛,\(\rho>1\) 发散,\(\rho=1\) 可能收敛也可能发散。
证明:利用极限的定义,将比值扩展到一个确定的界,再根据等比级数的敛散性即可证。
扩展:如果没有正项的限制,则如果绝对收敛,则必定收敛。
根值审敛法
\(\displaystyle\lim\limits_{n\rightarrow \infin}(u_n)^{\frac{1}{n}}=\rho\)
当 \(\rho < 1\) 时收敛,\(\rho>0\) 时发散,\(\rho=1\) 时可能发散也可能收敛。
证明:和比值审敛法类似。
积分判别法
设级数即其对应的函数是非负减函数,则级数 \(\displaystyle\sum_{i=1}^{\infin}f(i)\) 和 \(\int_{0}^{\infin}f(x)\text{d}x\) 同收敛或发散。
考虑级数 \(\displaystyle s=\sum_{i=1}^{\infin}u_i\) ,改为函数形式,即为 \(\displaystyle s=\sum_{x=1}^{\infin}u(x)=\sum_{x=1}^{\infin}\int_{x-1}^{x}u(x)\text{d}l\) ,由减函数,有 \(\displaystyle s<\sum_{x=1}^{\infin}\int_{x-1}^x u(l)\text{d}l=\int_0^{\infin}u(l)\text{d}l\) ,即可得同收敛。类似可证,同发散。
1.7.4 掌握交错级数的莱布尼茨判别法
交错级数
对正项级数 \(\displaystyle\sum_{i=1}^{\infin}u_i\) ,则级数 \(\displaystyle\sum_{i=1}^{\infin} (-1)^n u_i\) ,\(\displaystyle\sum_{i=1}^{\infin}(-1)^{i+1}u_i\) 即为交错级数。
交错级数的莱布尼茨判别法
若 \(u_i\ge u_{i+1}\) 且极限为 \(0\) ,则收敛。
证明:将相邻两项可以分别组合成正数数列和负数数列,前者递增,后者递减,因此必收敛(单调有界必有极限)。
1.7.5 了解任意项级数绝对收敛与条件收敛的概念以及绝对收敛与收敛的关系
绝对收敛
对级数 \(\displaystyle s=\sum_{i=1}^\infin u_i\) ,若 \(\displaystyle \sum_{i=1}^\infin |u_i|\) 收敛,则称级数 \(s\) 绝对收敛。
条件收敛
如果级数收敛,但不绝对收敛,则称其条件收敛。
绝对收敛和收敛的关系
若级数绝对收敛,则级数收敛。
证明:
取 \(m_i=u_i+|u_i|\) ,则有 \(m_i \le 2|u_i|\) ,\(m_i\ge 0\) ,故 \(m_i\) 对应级数收敛,而 \(u_i=m_i-|u_i|\) ,故 \(u_i\) 对应级数收敛。
1.7.6 了解函数项级数的收敛域及和函数的概念
函数项级数
由函数列 \(u_1(x),u_2(x),...,x_n(x),...\) 构成的表达式 \(u_1(x)+u_2(x)+...+u_n(x)+...\) 称为(函数项)无穷级数,简称(函数项)级数。
收敛点
若 \(x=x_0\) 使函数项级数收敛,则称 \(x_0\) 为收敛点。
收敛域
收敛点的全体称为收敛域。
和函数
在收敛域内,函数项级数的和构成函数 \(s(x)\) ,称为和函数。
1.7.7 理解幂级数收敛半径的概念,并掌握幂级数的收敛半径、收敛区间及收敛域的求法
幂级数
形如 \(\displaystyle\sum_{i=0}^{\infin}a_ix^{i}\) 的级数称为幂级数。
幂级数的收敛半径
如果幂级数的收敛域不为点 \(0\) ,也不为全体实数,则存在正数 \(R\) ,当 \(|x|<R\) 时收敛,\(|x|>R\) 时发散。\(R\) 称为幂级数的收敛半径。
幂级数收敛半径的求法
对幂级数 \(\displaystyle\sum_{i=0}^\infin a_ix^i\) ,若有 \(\displaystyle\lim\limits_{i\rightarrow \infin}|\frac{a_{i+1}}{a_i}|=\rho\) ,则收敛半径 \(\displaystyle R=\frac{1}{\rho}\) (对 \(\rho=0\) 和 \(\rho=+\infin\) 也成立)。
证:取 \(u_i=|a_ix^i|\) ,则 \(\displaystyle \lim\limits_{i\rightarrow \infin}\frac{u_{i+1}}{u_i}=\rho |x|\) ,由正数项级数的比值审敛法,\(\displaystyle |x|<\frac{1}{\rho}\) 时收敛。
若 \(\rho=0\) ,则对任意 \(x\) ,都有比值极限为 \(0\) ,即收敛。
若 \(\rho=+\infin\) ,不满足级数收敛的必要条件,即仅当 \(x=0\) 时收敛。
1.7.8 了解幂级数在其收敛区间内的基本性质(和函数的连续性、逐项求导和逐项积分),会求一些幂级数在收敛区间内的和函数,并会由此求出某些常数项级数的和
和函数的连续性
幂级数的和函数在其收敛域上连续
幂级数逐项求导公式
幂级数的和函数在其收敛区间内可导。
\(\displaystyle s'(x)=\sum_{i=1}^{\infin}ia_ix^{i-1}(|x|<R)\)
逐项求导后得到的幂级数和原级数有相同的收敛半径。
推论:幂级数的和函数在其收敛区间内具有任意阶导数。
幂级数的逐项积分公式
幂级数的和函数在其收敛区间内可积。
\(\displaystyle\int_0^x s(x)\text{d}x=\sum_{i=1}^{n}\int_0^xa_ix^i=\sum_{i=1}^n \frac{1}{i+1}a_ix^{i+1}(x<R)\)
逐项积分后所得到的幂级数和原级数有相同的收敛半径。
1.7.9 了解函数展开为泰勒级数的充分必要条件
函数展开为泰勒级数的充要条件
余项 \(R_n(x)\) 当 \(n\rightarrow \infin\) 时为零。
回顾:
泰勒公式
\(\displaystyle f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)^2+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+\frac{f^{(n+1)}(\xi)}{(n+1)!}(x-x_0)^{n+1}\)
其中 \(\xi\) 介于 \(x\) 和 \(x_0\) 之间。
麦克劳林展开
\(\displaystyle f(x)=f(0)+f'(0)x+\frac{f''(0)}{2!}x^2+...+\frac{f^{(n)}(0)}{n!}x^n+\frac{f^{(n+1)}(\xi)}{(n+1)!}x^{n+1}\)
其中 \(\xi\) 介于 \(x\) 和 \(0\) 之间。
也用通项的形式可以写成 \(\displaystyle f(x)=\sum_{i=0}^{n}\frac{f^{(i)}(0)}{i!}x^{i}+\frac{f^{(n+1)}(\xi)}{(n+1)!}x^{n+1}\)
1.7.10 掌握 \(e^x,\sin x,\cos x,\ln(1+x)\) 及 \((1+x)^a\) 的麦克劳林展开式,会用它们将一些简单函数间接展开为幂级数
\(e^x\)
\(f^{(n)}(0)=1\) ,即
\(\displaystyle e^x=1+x+\frac{1}{2!}x^2+...+\frac{1}{n!}x^n+...\)
\(-\infin < x < \infin\)
\(\sin x\)
\(f^{(2n+1)}(0)=(-1)^n\) ,即
\(\displaystyle \sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}- ... +\frac{(-1)^n}{(2n+1)!}x^{2n+1}+...\)
\(-\infin < x < \infin\)
\(\cos x\)
\(f^{(2n)}(0)=(-1)^n\) ,即
\(\displaystyle \cos x=1-\frac{x^2}{2!}+\frac{x^4}{4!}-...+\frac{(-1)^n}{(2n)!}x^{2n}+...\)
\(-\infin < x < \infin\)
\(\displaystyle\frac{1}{1+x}\)
\(f^{(n)}(x)=(-1)^n \times n!\times (1+x)^{-(n+1)}\)
\(\displaystyle R_n(x)=\frac{(-1)^n \times n!\times (1+\xi)^{-(n+1)}}{n!}x^n\) ,则有收敛域为 \(-1<x<1\)
\(f^{(n)}(0)=(-1)^n \times n!\)
\(\displaystyle\frac{1}{1+x}=1-x+x^2-...+(-1)^nx^n+...\)
\((1+x)^a\)
\(f^{(n)}(x)=a(a-1)...(a-n+1)(1+x)^{a-n}\)
\(\displaystyle (1+x)^a=1+ax+\frac{a(a-1)}{2!}x^2+...+\frac{a(a-1)...(a-n+1)}{n!}x^n+...\)
由 \(\displaystyle \lim\limits_{n\rightarrow \infin}|\frac{u_{n+1}}{u_n}|=\lim\limits_{n\rightarrow \infin}|\frac{n+1}{a-n}|=1\) ,即 \(\rho=1\) ,即在 \(-1<x<1\) 内收敛。
在收敛域内,记 \(\displaystyle F(x)=1+ax+\frac{a(a-1)}{2!}x^2+...+\frac{a(a-1)...(a-n+1)}{n!}x^n+...\) ,
有 \(\displaystyle F'(x)=a(1+\frac{a}{1}x+...+\frac{(a-1)...(a-n+1)}{(n-1)!}x^{n-1}+...)\)
\(\displaystyle (1+x)F'(x)=a(1+\frac{a}{1}x+...+\frac{(a-1)...(a-n+1)}{(n-1)!}x^{n-1}+...)+a(x+\frac{a}{1}x^2+...+\frac{(a-1)...(a-n+1)}{(n-1)!}x^{n}+...)\)
由 \(\displaystyle \frac{(m-1)...(m-n+1)}{(n-1)!}+\frac{(m-1)...(m-n)}{n!}=\frac{(m-1)...(m-n+1)(n+m-n)}{n!}=\frac{m(m-1)...(m-n+1)}{n!}\) ,
即有 \((1+x)F'(x)=aF(x)\) ,
取 \(\displaystyle \varphi(x)=\frac{F(x)}{(1+x)^a}\) ,有 \(\displaystyle \varphi'(x)=\frac{F'(x)(1+x)^a-aF(x)(1+x)^{a-1}}{(1+x)^{2a}}=0\) ,而 \(\varphi(0)=1\) ,故 \(\varphi(x)=1\) ,即幂级数展开成立。
注:没有用余项的极限为 \(0\) 来证。
在收敛区间内,\((1+x)^a\) 的幂级数展开称为二项展开式。
当 \(a\) 为整数时,公式只有有限项,即为二项式定理。
1.7.11 了解傅立叶级数的概念和狄利克雷收敛定理,会将定义在 \([-l,l]\) 上的函数展开为傅立叶级数,会将定义在 \([0,l]\) 上的函数展开为正弦级数与余弦级数,会写出傅立叶级数的和函数的表达式
三角级数
将周期为 \(\displaystyle T=\frac{2\pi}{\omega}\) 的周期函数用一系列以 \(T\) 为周期的正弦函数组成的级数来表示,即
\(\displaystyle f(t)=A_0+\sum_{i=1}^{\infin}A_i\sin(i\omega t+\varphi_i)\)
其物理含义就是将一个比较复杂的周期运动看成是许多不同频率的简谐振动的叠加。在电工学上,这种展开称为谐波分析,\(A_0\) 称为直流分量,\(A_1\sin(\omega t+\varphi_1)\) 称为一次谐波(基波),其余项依次称为二次谐波、三次谐波等。
将级数进行适当变形,即可得到 \(\displaystyle f=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos ix+b_i\sin ix)\) ,变换得到了以 \(2\pi\) 为周期的三角级数。
三角函数系的正交性
在三角函数系 \(1,\cos x,\sin x,\cos 2x,\sin 2x,...\cos nx,\sin nx,...\) 中任意取两个不同的函数的乘积在 \([-\pi,\pi]\) 上积分等于 \(0\) 。
傅里叶级数
设函数 \(\displaystyle f(x)=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos ix+b_i\sin ix)\) ,
两边直接对 \([-\pi,\pi]\) 积分,得到 \(\displaystyle a_0=\frac{1}{\pi}\int_{-\pi}^{\pi}f(x)\text{d}x\) ,
两边同乘 \(\cos ix\) ,再对 \([-\pi,\pi]\) 积分,得到 \(\displaystyle a_i=\frac{1}{\pi}\int_{-\pi}^{\pi}f(x)\cos ix\text{d}x\) ,
两边同乘 \(\sin ix\) ,再对 \([-\pi,\pi]\) 积分,得到 \(\displaystyle b_i=\frac{1}{\pi}\int_{-\pi}^{\pi}f(x)\sin ix\text{d}x\) 。
将这些系数代入三角级数,得到的级数称为傅里叶级数,这些系数称为傅里叶系数。
狄利克雷收敛定理
设 \(f(x)\) 是周期为 \(2\pi\) 的周期函数,且满足
(1)在一个周期内连续或只有有限个第一类间断点
(2)在一个周期内至多只有有限个极值点
则 \(f(x)\) 的傅里叶级数收敛,连续处,收敛于 \(f(x)\) ,间断点处,收敛于 \(\displaystyle \frac{f(x^-)+f(x^+)}{2}\)
正弦级数
只含有正弦项的三角级数
余弦级数
只含有余弦项的三角级数
由于 \(\cos ix\) 为偶函数,\(\sin ix\) 为奇函数,因此若 \(f(x)\) 为奇函数,则 \(a_i=0\) ,若 \(f(x)\) 为偶函数,则 \(b_i=0\) 。也即奇函数的傅里叶级数是正弦级数,偶函数的傅里叶级数是余弦级数。
对于定义在 \([0,\pi]\) 上的函数 \(f(x)\) ,如果在 \((-\pi,0)\) 上补充定义为一个奇函数(或者偶函数),则可以得到一个正弦级数(或者余弦级数)。这种拓广函数定义域的过程称为奇延拓(或者叫做偶延拓)。
傅里叶级数的一般形式
对一般周期函数 \(f(t)\) 的三角级数的一般项进行变形,
\(A_i\sin (i\omega t+\varphi_i)=A_i\sin\varphi_i\cos i\omega t+A_i\cos\varphi_i\sin i\omega t=a_i\cos i\omega t+b_i\sin i\omega t\) ,
要变换成为以 \(2\pi\) 为周期,即变换为 \(x=\omega t\) ,记 \(\displaystyle f(t)=f(\frac{x}{\omega})=F(x)\)。其中 \(F(x)\) 的周期为 \(2\pi\) ,即有
\(\displaystyle F(x)=F(\omega t)=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos i\omega t+b_i\sin i\omega t)=f(t)\)
对应有 \(\displaystyle a_i=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}F(\omega t)\cos i\omega t\cdot \omega\text{d}t=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}f(t)\cos i\omega t\cdot \omega\text{d}t\)
\(\displaystyle b_i=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}F(\omega t)\sin i\omega t\cdot \omega \text{d}t=\frac{1}{\pi}\int_{-\frac{\pi}{\omega}}^{\frac{\pi}{\omega}}f(t)\sin i\omega t\cdot \omega \text{d}t\)
记周期函数 \(f(t)\) 的周期为 \(2l\) ,\(\displaystyle \omega = \frac{\pi}{l}\) ,则有
\(\displaystyle f(t)=\frac{a_0}{2}+\sum_{i=1}^{\infin}(a_i\cos \frac{i\pi t}{l}+b_i\sin \frac{i\pi t}{l})\)
\(\displaystyle a_i=\frac{1}{l}\int_{-l}^{l}f(t)\cos \frac{i\pi t}{l}\text{d}t\)
\(\displaystyle b_i=\frac{1}{l}\int_{-l}^{l}f(t)\sin \frac{i\pi t}{l}\text{d}t\)
1.8 常微分方程
1.8.1 了解微分方程及其阶、解、通解、初始条件和特解等概念
微分方程
一般地,凡表示未知函数、未知函数的导数与自变量之间的关系的方程,叫做微分方程,有时也简称方程。
如 \(F(x,y,y')=0\)
微分方程的阶
微分方程中所出现的未知函数的最高阶导数的阶数,叫做微分方程的阶。
\(F(x,y,y')=0\) 即为一阶微分方程。
\(F(x,y,y',...,y^{(n)})\) 即为 \(n\) 阶微分方程。
微分方程的解
设函数 \(y\varphi(x)\) 在区间 \(I\) 上有 \(n\) 阶连续导数,如果在区间 \(I\) 上,\(F(x,\varphi(x),\varphi'(x),...,\varphi^{(n)}(x))\equiv 0\) ,那么函数 \(y\varphi(x)\) 就叫做微分方程在区间 \(I\) 上的解。
微分方程的通解
如果微分方程的解中含有任意常数,且任意常数的个数与微分方程的阶数相同,这样的解叫做微分方程的通解。
注:这里为什么任意常数的个数和阶数相同,一方面可以理解为阶数对应了求积分的次数,每一次求积分引入一个任意常数,另一方面可以理解为定义如此。
初始条件
用来确定微分方程的通解中的任意常数的条件,称为初始条件。
特解
通过一个初始条件确定了通解中的任意常数后,就得到了微分方程的特解。
1.8.2 掌握变量可分离的微分方程及一阶线性微分方程的解法
可分离变量的微分方程
如果一个一阶微分方程能写成 \(g(y)\text{d}y=f(x)\text{d}x\) 的形式,也即微分方程能写成一端只含 \(y\) 的函数和 \(\text{d}y\) ,另一端只含 \(x\) 的函数和 \(\text{d}x\) ,那么原方程就称为可分离变量的微分方程。
可分离变量的微分方程的解法
对一阶线性微分方程,设其变换为 \(g(y)\text{d}y=f(x)\text{d}x\) ,假设其有解 \(y=\varphi(x)\) ,则代入得
\(g(\varphi(x))\varphi'(x)\text{d}x=f(x)\text{d}x\) ,由 \(y=\varphi(x)\) 引入 \(y\) ,则有 \(g(y)\text{d}y=f(x)\text{d}x\) ,两边积分得 \(\displaystyle \int g(y)\text{d}y=\int f(x)\text{d}x\) ,设对应得原函数分别为 \(G(y),F(x)\) ,则得到 \(G(y)=F(x)+C\) 。
这就是一阶微分方程的隐式解,又由于其中含有一个任意常数,因此就叫做微分方程的隐式通解。
一阶线性微分方程
方程 \(\displaystyle \frac{\text{d}y}{\text{d}x}+P(x)y=Q(x)\) 叫做一阶线性微分方程。
注:一阶是指对于 \(y,y'\) 是一次方程,也即 \(y'+Py-Q=0\)。
如果 \(Q(x)\equiv 0\) ,则称为一阶线性齐次微分方程。否则称为非齐次微分方程。
齐次线性微分方程的解
齐次线性微分方程是可分离变量的,因此按照可分离变量的方程求解即可。
非齐次线性微分方程的解
先求对应的齐次线性微分方程的通解 \(y=f(x)\),再将其中的常数变易为未知函数 \(u(x)\) ,变易后将解代入非齐次线性微分方程,即可求得非齐次线性微分方程的通解。
示例:
\(\displaystyle \frac{\text{d}y}{\text{d}x}=-Py\) ,即 \(\displaystyle \frac{\text{d}y}{y}=-P\text{d}x\) ,\(\displaystyle \ln |y|=-\int P\text{d}x+C\) ,\(\displaystyle y=\pm e^{-\int P\text{d}x+C}=C'e^{-\int P\text{d}x}\)
进行常数变易,得到 \(\displaystyle y=ue^{-\int P\text{d}x}\) ,代入原方程,为 \(\displaystyle u'e^{-\int P\text{d}x}-uPe^{-\int P\text{d}x}+Pue^{-\int P\text{d}x}=Q\) ,刚好消掉 \(u\) 所在的项,得到 \(u'e^{-\int P\text{d}x}=Q\) ,此时即可用分离变量的方式求出 \(u\) ,也即就得到了非齐次线性微分方程的通解。
1.8.3 会解齐次微分方程、伯努利方程和全微分方程,会用简单的变量代换解某些微分方程
齐次微分方程
如果一阶微分方程可以化为 \(\displaystyle \frac{\text{d}y}{\text{d}x}=\varphi(\frac{y}{x})\) 的形式,那么就称这方程为齐次微分方程。
注:这里的齐次是指每一项关于 \(x,y\) 的次数相等。
齐次微分方程的解法
取 \(\displaystyle u=\frac{y}{x}\) ,则有 \(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\text{d}(ux)}{\text{d}x}=u_xx+u=\varphi(u)\) ,
即 \(\displaystyle \frac{\text{d}u}{\varphi(u)-u}=\frac{\text{d}x}{x}\)
这样就得到了一个可分离变量的微分方程。
伯努利方程
方程 \(\displaystyle \frac{\text{d}y}{\text{d}x}+P(x)y=Q(x)y^n\) 叫做伯努利方程。
当 \(n=0\) 时,为一阶线性非齐次微分方程,当 \(n=1\) 时,为一阶线性齐次微分方程,当 \(n\) 取其它值时,可以通过变量的代换化为线性方程。
\(\displaystyle y^{-n}\frac{\text{d}y}{\text{d}x}+Py^{1-n}=Q\)
由 \(\text{d}y^{1-n}=(1-n)y^{-n}\text{d}y\) ,得
\(\displaystyle \frac{1}{1-n}\frac{\text{d}y^{1-n}}{\text{d}x}+Py^{1-n}=Q\)
再用 \(u=y^{1-n}\) 进行替换,即转换为一阶线性非齐次微分方程。
全微分方程
如果一个微分方程能写成左侧是一个函数 \(u(x,y)\) 的全微分,右侧为 \(0\) 的形式,那么该方程就称作全微分方程。
记 \(\text{d}u(x,y)=P\text{d}x+Q\text{d}y=0\)
此时,有 \(u(x,y)=C\) ,这就是全微分方程的隐式方程。
1.8.4 会用降阶法解下列形式的微分方程:\(y^{(n)}=f(x),y''=f(x,y')\) 和 \(y''=f(y,y')\)
\(y^{(n)}=f(x)\)
通过两边不断积分的方式降阶。
\(y''=f(x,y')\)
取 \(y'=p\) ,则 \(y''=p'\) ,方程变为 \(p'=f(x,p)\) ,为一阶微分方程,可求其通解,再根据 \(y'=p\) 即可求得原方程的通解。
\(y''=f(y,y')\)
同样取 \(y'=p\) ,则有 \(\displaystyle y''=\frac{\text{d}p}{\text{d}x}=\frac{\text{d}p}{\text{d}y}\cdot \frac{\text{d}y}{\text{d}x}=p\frac{\text{d}p}{\text{d}y}\) ,方程即为 \(\displaystyle p\frac{\text{d}p}{\text{d}y}=f(y,p)\) ,就是一个一阶微分方程。
1.8.5 理解线性微分方程解的性质及解的结构
\(n\) 阶线性微分方程的一般形式
\(y^{(n)}+a_1(x)y^{(n-1)}+...+a_{n-1}(x)y'+a_n(x)y=f(x)\)
当 \(f(x)\equiv 0\) 时,为 \(n\) 阶齐次线性微分方程,否则为 \(n\) 阶非齐次线性微分方程。
注:这里的齐次是指所有 \(y\) 项的次数都是 \(1\) (也即没有常数项,不含 \(y\) 的项),所谓线性是指各阶导数之间只有加减运算。
二阶齐次线性微分方程的解的结构
记二阶齐次线性微分方程的一般形式为
\(y''+P(x)y'+Q(x)y=0\)
若 \(y_1(x),y_2(x)\) 是二阶齐次方程的解,则 \(y=C_1y_1(x)+C_2y_2(x)\) 也是二阶齐次方程的解。
若 \(y_1(x),y_2(x)\) 是二阶齐次方程的两个线性无关的特解,则 \(y=C_1y_1(x)+C_2y_2(x)\) 就是方程的通解。
高阶齐次线性方程的解的结构
记 \(n\) 阶齐次线性齐次线性方程的一般形式为
\(y^{(n)}+a_1(x)y^{(n-1)}+...+a_{n-1}(x)y'+a_n(x)y=0\)
如果其有 \(y_1(x),y_2(x),...,y_n(x)\) 共 \(n\) 个线性无关的解,则此方程的通解为
\(y=C_1y_1(x)+C_2y_2(x)+...+C_ny_n(x)\)
二阶非齐次线性微分方程的通解
二阶齐次线性方程的通解和对应的非齐次线性方程的特解的和,是非齐次线性微分方程的通解。
理解:特解是非齐次方程的解,与通解作和仍是解,并且引入了两个未知数,因此成为通解。
线性微分方程的叠加原理
若非齐次方程的右端是两个函数之和,且两个函数分别对应的非齐次方程有两个特解,则这两个特解之和构成原方程的一个特解。
注:这里所述的叠加原理是符合线性微分方程的一般形式的叠加原理。对于二阶齐次线性微分方程,其解的结构也是一种叠加原理(常系数倍数的两个特解之和仍然是方程的解)。
1.8.6 掌握二阶常系数齐次线性微分方程的解法,并会解某些高于二阶的常系数齐次线性微分方程
二阶常系数齐次线性微分方程
如果二阶齐次线性微分方程的系数均为常数,则为二阶常系数齐次线性微分方程,即
\(y''+py'+qy=0\)
二阶变系数齐次线性微分方程
如果二阶齐次线性微分方程的系数不全为常数,则为二阶变系数齐次线性微分方程。
二阶常系数齐次线性微分方程的解法
使用 \(y=e^{rx}\) 带入方程求解。
\(r^2e^{rx}+pre^{rx}+qe^{rx}=0\)
称 \(r^2+pr+q=0\) 为特征方程。
特征方程有解 \(\displaystyle r_{1,2}=\frac{-p\pm \sqrt{p^2-4q}}{2}\)
倘若特征方程有两个不相等的实根 \(r_1,r_2\) ,则二阶常系数齐次线性微分方程有两个解
\(y_1=e^{r_1x},y_2=e^{r_2x}\)
即有通解 \(y=C_1e^{r_1x}+C_2e^{r_2x}\)
倘若有两个相等的实根 \(r\) ,则有一个解为 \(y=e^{rx}\) ,
再设另一个解为 \(y=u(x)e^{rx}\) ,则有
\(y'=u'e^{rx}+ure^{rx}=e^{rx}(u'+ur)\)
\(y''=re^{rx}(u'+ur)+e^{rx}(u''+u'r)=e^{rx}(u''+2u'r+ur^2)\)
代入得 \(e^{rx}(u''+2u'r+ur^2)+pe^{rx}(u'+ur)+que^{rx}=0\)
即 \(u''+u'(2r+p)+u(r^2+pr+q)=0\)
由于 \(\displaystyle r=-\frac{p}{2}\) ,则 \(u''=0\) ,
不妨取 \(u=x\) ,即另一个解为 \(y=xe^{rx}\) ,
此时有通解为 \(y=C_1e^{rx}+C_2xe^{rx}\)
倘若有两个共轭复根 \(\alpha\pm \beta i\)
则两个解为 \(y=e^{(\alpha\pm \beta i)x}=e^{\alpha x}\cdot e^{\pm \beta x i}=e^{\alpha x}(\cos \beta x\pm i\sin\beta x)\)
由叠加原理,将两个解变换成实数形式,即有
\(\displaystyle y_1=\frac{1}{2}e^{\alpha x}(2\cos\beta x)=e^{\alpha x}\cos\beta x\)
\(\displaystyle y_2=\frac{1}{2i}e^{\alpha x}(2i\sin\beta x)=e^{\alpha x}\sin\beta x\)
即有通解 \(y=e^{\alpha x}(C_1\cos\beta x+C_2\sin\beta x)\)
高阶常系数齐次线性微分方程的一般形式
\(y^{(n)}+p_1y^{(n-1)}+p_2y^{(n-2)}+...+p_{n-1}y'+p_ny=0\)
高阶常系数齐次线性微分方程的解
同样代入 \(y=e^{rx}\) ,则有
\(e^{rx}(r^n+p_1r^{n-1}+p_2r^{n-2}+...+p_{n-1}r+p_n)=0\)
\(r^n+p_1r^{n-1}+p_2r^{n-2}+...+p_{n-1}r+p_n=0\) 就是高阶常系数齐次线性微分方程的特征方程
假设特征方程有单实根 \(r\) ,则解有一项 \(y=Ce^{rx}\)
假设有一对单复根 \(r=\alpha\pm \beta i\) ,则解有一项为 \(y=e^{\alpha x}(C_1\cos\beta x+C_2\sin \beta x)\)
假设有 \(k\) 重实根 \(r\) ,则有 \(k\) 项为 \(e^{rx}(C_1+C_2x+...+C_kx^{k-1})\)
假设有 \(k\) 重复根 \(r=\alpha\pm\beta i\) ,则有 \(2k\) 项为 \(e^{\alpha x}[(C_1+C_2x+...+C_kx^{k-1})\cos\beta x+(D_1+D_2x+...+D_kx^{k-1})\sin\beta x]\)
根据特征方程的解,得到方程的解的所有项,最后有方程的通解为 \(y=C_1y_1+C_2y_2+...+C_ny_n\)
1.8.7 会解自由项为多项式、指数函数、正弦函数余弦函数以及它们的和与积的二阶常系数非齐次线性微分方程
由二阶常系数非齐次线性方程组的解的结构可知,其通解即为对应的齐次常系数微分方程对应的通解和其一个特解的和。
利用待定系数法可以求出自由项为
\(f(x)=e^{\lambda x}P_m(x)=e^{\lambda x}(a_0x^m+a_1x^{m-1}+...+a_{m-1}x+a_m)\)
或
\(f(x)=e^{\lambda x}(P_l(x)\cos\omega x+Q_n(x)\sin\omega x)\)
时对应的非齐次方程的解。
\(f(x)=e^{\lambda x}P_m(x)\) 型
由于多项式与指数函数的乘积的导数仍然是多项式与指数函数的乘积,因此可以推测,\(y_A=e^{\lambda x}R(x)\) 是原方程的一个特解。
\(y_A'=e^{\lambda x}(\lambda R(x)+R'(x))\)
\(y_A''=e^{\lambda x}(\lambda^2R(x)+\lambda R'(x)+\lambda R'(x)+R''(x))=e^{\lambda x}(\lambda^2R(x)+2\lambda R'(x)+R''(x))\)
代入二阶非齐次线性微分方程的一般形式得
\(\lambda^2R(x)+2\lambda R'(x)+R''(x)+p(\lambda R(x)+R'(x))+qR(x)=P_m(x)\)
化简即得 \(R''(x)+(2\lambda +p)R'(x)+(\lambda^2+p\lambda +q)R(x)=P_m(x)\)
讨论:
如果 \(\lambda\) 不是对应的二阶齐次线性微分方程的特征方程的根,即 \(\lambda^2+p\lambda+q\not =0\) ,此时可以取 \(R(x)\) 为一个 \(m\) 次多项式,代入方程后,根据对应项系数相等,求得 \(R(x)\) 。
如果 \(\lambda\) 是对应的二阶齐次线性微分方程的单根,即 \(\lambda^2+p\lambda+q =0\) ,且 \(\displaystyle \lambda\not =-\frac{p}{2}\) ,此时有 \(R''(x)+(2\lambda +p)R'(x)=P_m(x)\) ,即 \(R'(x)=R_m(x)\) ,不妨取 \(R(x)=xR_m(x)\) ,然后根据对应项系数相等求得 \(R(x)\) 。
如果 \(\lambda\) 是对应的二阶齐次线性微分方程的重根,即 \(\lambda^2+p\lambda+q =0\) ,且 \(\displaystyle \lambda=-\frac{p}{2}\) ,此时有 \(R''(x)=P_m(x)\) ,即 \(R''(x)=R_m(x)\) ,此时不妨取 \(R(x)=x^2P_m(x)\) ,然后通过对应项系数相等求 \(R(x)\)
结论:
如果二阶非齐次线性微分方程具有形式 \(y''+py'+qy=e^{\lambda x}P_m(x)\) ,则其有特解形如 \(y=x^kR_m(x)e^{\lambda x}\) ,其中 \(k\) 依对应的齐次方程的解可取 \(0,1,2\) 。
推广:
如果对于 \(n\) 阶常系数非齐次线性微分方程仍具有上述形式,则结论可以推广,且 \(k\) 取特征方程含根 \(\lambda\) 的重复次数。
\(f(x)=e^{\lambda x}[P_l(x)\cos\omega x+Q_n(x)\sin\omega x]\) 型
由欧拉公式,有 \(\displaystyle \cos\theta=\frac{1}{2}(e^{i\theta}+e^{-i\theta}),\sin\theta=\frac{1}{2i}(e^{i\theta}-e^{-i\theta})\) ,
代入得 \(\displaystyle f(x)=e^{\lambda x}[P_l(x)\frac{e^{i\omega x}+e^{-i\omega x}}{2}+Q_n(x)\frac{e^{i\omega x}-e^{i\omega x}}{2i}]\)
\(\displaystyle =e^{\lambda x}[(\frac{P_l}{2}+\frac{Q_n}{2i})e^{i\omega x}+(\frac{P_l}{2}-\frac{Q_n}{2i})e^{-i\omega x}]\)
看作是两项,则这两项对应的多项式互成共轭(对应项的系数是共轭复数)。利用 \(f(x)=P_m(x)e^{\lambda x}\) 型二阶非齐次线性微分方程的解法,求第一项对应的二阶非齐次线性微分方程的解,记为 \(y=x^kR_me^{\lambda x+i\omega x}\) ,由于 \(\lambda+\omega i\) 只能是单根或不是根,因此 \(k\) 取 \(0,1\) ,同时由于共轭,因此解的共轭函数必然是第二项对应的非齐次方程的解,记为 \(y=x^k\overline{R}_me^{\lambda x-i\omega x}\) 。
由叠加原理,有 \(y=x^kR_me^{\lambda x+i\omega x}+x^k\overline{R}_me^{\lambda x-i\omega x}\) 是原非齐次二阶线性微分方程的一个特解。
解的化简:
\(\displaystyle y=x^ke^{\lambda x}(R_m e^{i\omega x}+\overline{R}_me^{-i\omega x})\)
\(=x^ke^{\lambda x}(R_m(\cos\omega x+i\sin\omega x)+\overline{R}_m(\cos\omega x-\sin\omega x))\)
括号内的两项是互成共轭的,因此相加后和无虚部,即最终可以写成
\(y=x^ke^{\lambda x}[A_m(x)\cos\omega x+B_m(x)\sin\omega x]\)
其中 \(m=\text{max}(l,n)\)
高阶常系数非齐次线性微分方程
相应的 \(k\) 是特征方程中含根 \(\lambda+\omega i\) 或 \(\lambda-\omega i\) 的次数。
1.8.8 会解欧拉方程
欧拉方程
形如
\(x^ny^{(n)}+p_1x^{n-1}y^{(n-1)}+...+p_{n-1}xy'+p_ny=f(x)\)
的方程,叫做欧拉方程。
欧拉方程是一类特殊的变系数线性微分方程。欧拉方程可以通过变量替换的方式,化为常系数线性微分方程:
记 \(x=e^t, t=\ln x\) ,则有
\(\displaystyle \frac{\text{d}y}{\text{d}x}=\frac{\text{d}y}{\text{d}t}\cdot\frac{\text{d}t}{\text{d}x}=\frac{1}{x}\frac{\text{d}y}{\text{d}t}=\frac{1}{x}D\)
\(\displaystyle \frac{\text{d}^2y}{\text{d}x^2}=\frac{1}{x^2}(\frac{\text{d}^2 y}{\text{d}t^2}-\frac{\text{d}y}{\text{d}t})=\frac{1}{x^2}D(D-1)\)
类似可推导
\(x^ky^{(k)}=D(D-1)...(D-k+1)\)
利用这个变形,就将欧拉方程变换为常系数线性微分方程。
1.8.9 会用微分方程解决一些简单的应用问题
2 线性代数
2.1 行列式
2.1.1 了解行列式的概念,掌握行列式的性质
二阶行列式
把 \(4\) 个数排列成二行二列的数表:
\(\begin{matrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{matrix}\)
表达式 \(a_{11}a_{22}-a_{12}a_{21}\) 称为这个数表确定的二阶行列式,并记作
\(\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}\)
注:行列式是一个数。
行列式的元素
数 \(a_{ij}\) 称为行列式的元素或元,第一个下标称为行标,第二个下标称为列标。该元素称为行列式的 \((i,j)\) 元。
全排列
把 \(n\) 个不同的元素排成一列,叫做这 \(n\) 个元素的全排列。
全排列也简称排列。
逆序
对于 \(n\) 个不同的元素,先规定一个标准次序,如果某一个排列中两个元素的次序与标准次序不同,就称这个排列有一个逆序。
逆序数
一个排列的逆序的总数叫做这个排列的逆序数。
有序排列的逆序数为 \(0\) 。
反序排列的逆序数为 \(\displaystyle \frac{n(n-1)}{2}\)
奇排列和偶排列
逆序数为奇数的排列称为奇排列,为偶数的称为偶排列。
逆序数的计算方法
从第二个元素开始,依次统计在该元素之前的元素中不满足先后次序的元素数目并加和,就得到了这个排列的逆序数。
任意交换排列的相邻两个元素,排列的奇偶性改变。
任意交换排列的任意两个元素,排列的奇偶性改变。
\(n\) 阶行列式
设有 \(n^2\) 个数排列成 \(n\) 行 \(n\) 列的数表,
\(\begin{matrix}a_{11}& ... &a_{1n}\\...&...&...\\a_{n1}&...&a_{nn}\end{matrix}\)
记数表为 \(\{a_{ij}\}\) ,取 \(p_1,p_2,...,p_n\) 为自然数 \(1,2,...,n\) 的一个排列,\(t\) 为这个排列的逆序数,则所有共 \(n!\) 个排列形成的形如 \(\displaystyle (-1)^t \prod_{i=1}^n a_{ip_i}\) 的 \(n!\) 项的和 \(\displaystyle \sum (-1)^t \prod_{i=1}^n a_{ip_i}\) 称为这个数表确定的 \(n\) 阶行列式,记作
\(\begin{vmatrix}a_{11}& ... &a_{1n}\\...&...&...\\a_{n1}&...&a_{nn}\end{vmatrix}\)
考虑式子 \(V=(-1)^t\prod a_{ip_i}\) ,\(t\) 为第二坐标的排列的逆序数。若任意交换两个元素的次序,则逆序数的奇偶性改变。以第一坐标为排列的逆序数是奇数,因此以第一坐标为排列和以第二坐标为排列得到的逆序数之和奇偶性是不变的。对于同一个排列,多次交换仍然如此,那么对于一个第一坐标有序的序列,其第一坐标的逆序数是 \(0\) ,第二坐标的逆序数是 \(t\) ,逆序数之和为 \(t\) ,经过多次交换得到一个第二坐标有序的序列,其第一坐标的逆序数是 \(s\) ,第二坐标的逆序数是 \(0\) ,逆序数之和为 \(s\) ,则有 \((-1)^t=(-1)^s\) ,也即 \(V\) 经过多次交换,得到了一个第二坐标有序的序列,其值不变。或者说 \((-1)^t\prod a_{ip_i}=(-1)^s\prod a_{q_i i}\) 。
也因此,行列式可以理解为按行取元素求积再求和,也可以理解为按列取元素求积再求和。
对角行列式
\(\begin{vmatrix}\lambda_1& ... &0\\...&...&...\\0&...&\lambda_n\end{vmatrix}=\prod \lambda_i\)
反对角行列式(自创名字)
\(\begin{vmatrix}0& ... &\lambda_1\\...&...&...\\\lambda_n&...&0\end{vmatrix}=(-1)^t\prod \lambda_i\)
\(\displaystyle t=\frac{n(n-1)}{2}\)
注:\(t\) 即为反序排列的逆序数
上(下)三角行列式
主对角线以上为 \(0\) 元素的行列式称为下三角行列式。其值与对应的对角行列式相等。
行列式与其转置行列式相等
直接由行列式的定义以及行列式按行求和按列求相等可证。
互换行列式的两行,行列式变号
直接由定义式,每个项的逆序数都改变奇偶性,可证。
行列式的某一行中的所有元素数乘 \(k\) ,等于行列式直接数乘 \(k\) 。
直接由定义式可证。
行列式如果有两行对应成比例,则此行列式等于零。
先将行列式的两行通过 \(k\) 乘为等值的两行,则两行交换后行列式值不变,因此为零。
如果行列式中的某一行是两个数之和,则这个行列式等于将这一行的两个数分别分解到两个行列式的和。
直接由定义可证。
这个性质说明行列式可以对某一行分解(也即可以把一个行列式的某一行拆分成两部分,生成两个子行列式)。
把行列式的某一行 \(k\) 数乘后加到另一行,行列式的值不变。
将加和后的行列式分解为两个行列式之和,其中一个行列式的两行对应成比例,即为 \(0\) ,因此值不变。
行列式的分块
记 \(A_{mn}\) 为 \(n\) 列 \(m\) 行的数阵,\(\begin{vmatrix}A_{mn}\end{vmatrix}\) 为数阵对应的行列式,则有 \(\begin{vmatrix}A_{mm}&0_{mn}\\B_{nm}&C_{nn}\end{vmatrix}=|A_{mm}||C_{nn}|\)
推论:
\(\begin{vmatrix}0_{mn}&A_{mm}\\C_{nn}&B_{nm}\end{vmatrix}=(-1)^{t}|A_{mm}||C_{nn}|\) ,其中 \(t=\frac{n(n-1)}{2}\)
余子式
对于 \(n\) 阶行列式划去元 \(a_{ij}\) 所在的行和列的所有元素,剩余的元素组成的 \(n-1\) 阶行列式成为 \(a_{ij}\) 的余子式,记作 \(M_{ij}\) 。
代数余子式
记 \(A_{ij}=(-1)^{i+j}M_{ij}\) 为元 \(a_{ij}\) 的代数余子式。
注:余子式和代数余子式都是一个数。
定理:如果行列式 \(|A_{nn}|\) 的元 \(a_{ij}\) 所在行的其余元均为 \(0\) ,则有 \(|A_{nn}|=a_{ij}A_{ij}\) 。
证:
对元 \(a_{ij}\) ,通过相邻行列交换的方式,将 \(a_{ij}\) 交换到第一个元,一共需要交换 \(i+j-2\) 次,交换之后的值为 \(a_{ij}M_{ij}\) ,也即有原来的值为 \(a_{ij}M_{ij}(-1)^{i+j-2}=a_{ij}A_{ij}\)
定理:\(\displaystyle |A_{nn}|=\sum_{i=1}^{n}a_{ki}A_{ki}\)
也即行列式可以表示为其某一行的所有元素与其对应的代数余子式之积的和。
证:
首先将行列式通过 \(n\) 次分解,分解为一行中只有一个非 \(0\) 元素的 \(n\) 个行列式,然后将这些行列式利用代数余子式表示出来即可。
推论:行列式的某一行的代数余子式与另一行的元素的乘积的和为 \(0\) 。
证:由定理,等值于将代数余子式所在的行替换为另一行得到的行列式的值(代数余子式和对应元素的值无关),而这个行列式的值为 \(0\) ,故得证。
定理反过来也可以理解为,将行列式的某一行替换为一组数,则对应的和式中的元素也替换为一组数。行列式的其它行的值不变,和式中的代数余子式的值不变。
克拉默法则
设有行列式 \(A_{nn}\) ,及其对应的矩阵 \(\boldsymbol{A}\) 和方程组
\(\boldsymbol{Ax}=\boldsymbol{b}\)
如果 \(A_{nn}\not =0\) ,则方程组有唯一解 \(\displaystyle x_i=\frac{A_i}{A}\)
其中 \(A_i\) 为将 \(\boldsymbol{b}\) 替换掉 \(A\) 中第 \(i\) 列后形成的行列式。
证:
\(\boldsymbol{Ax}=\boldsymbol{b}\) ,若 \(|\boldsymbol{A}|\not =0\) ,则存在逆矩阵 \(\boldsymbol{A}^{-1}\) ,即有 \(\displaystyle \boldsymbol{x}=\boldsymbol{A}^{-1}\boldsymbol{b}=\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^*\boldsymbol{b}\)
\(\displaystyle x_i=\sum_{k=1}^{n}\frac{1}{|\boldsymbol{A}|}A_{ki}b_k\) ,即得证。
2.1.2 会应用行列式的性质和行列式按行(列)展开定理计算行列式
2.2 矩阵
2.2.1 理解矩阵的概念,了解单位矩阵、数量矩阵、对角矩阵、三角矩阵、对称矩阵和反对称矩阵以及它们的性质
矩阵
由数构成的 \(m\) 行 \(n\) 列的数表称为 \(m\) 行 \(n\) 列矩阵,简称 \(m\times n\) 矩阵。表示为
\(\boldsymbol{A}=\begin{pmatrix}a_{11}&...&a_{1n}\\...&...&...\\a_{m1}&...&a_{mn}\end{pmatrix}\)
注意 \(m\times n\) 的前后顺序,行数在前,列数在后,或者说是高度在前,宽度在后。
\(n\) 阶矩阵
行数与列数都等于 \(n\) 的矩阵称为 \(n\) 阶矩阵或 \(n\) 阶方阵,记作 \(\boldsymbol{A}_n\)
行矩阵和列矩阵
只有一行的矩阵成为行矩阵,也称为行向量。只有一列的矩阵成为列矩阵,也称为列向量。
同型矩阵
两个行数和列数都相等的矩阵称为同型矩阵。
相等矩阵
两个对应对应元素相等的同型矩阵是相等矩阵。
零矩阵
元素都是零的矩阵称为零矩阵,记作 \(\boldsymbol{O}\)。
注:零矩阵不是唯一的。
线性变换
\(n\) 个变量 \(\boldsymbol{x}_n=(x_1,x_2,...,x_n)^T\) 与 \(m\) 个变量 \(\boldsymbol{y}_m=(y_1,y_2,...,y_m)^T\) 之间的关系式 \(\boldsymbol{y}_m=\boldsymbol{A}_{mn}\boldsymbol{x}_n\) 表示从变量 \(\boldsymbol{x}_n\) 到 \(\boldsymbol{y}_m\) 的线性变换,\(\boldsymbol{A}_{mn}\) 称为系数矩阵。
主对角线
从左上角到右下角的直线
单位矩阵
主对角线元素为 \(1\) ,其余元素为 \(0\) 的方阵称为单位矩阵,简称单位阵。
\(n\) 阶单位矩阵记为 \(\boldsymbol{E}_n\)
单位阵作为系数矩阵时,对应的线性变换为恒等变换。
数量矩阵
记 \(\lambda \boldsymbol{E}\) 为数量矩阵(纯量阵)。
和单位矩阵一样,数量矩阵也不是唯一的。
对角矩阵
非主对角线上的元素都为 \(0\) 的方阵称为对角矩阵。
2.2.2 掌握矩阵的线性运算、乘法、转置以及它们的运算规律,了解方阵的幂与方阵乘积的行列式的性质
矩阵的加法
设有两个 \(m\times n\) 矩阵 \(\boldsymbol{A}=(a_{ij})\) 和 \(\boldsymbol{B}=(b_{ij})\) ,则矩阵的和为 \(\boldsymbol{A}+\boldsymbol{B}=(a_{ij}+b_{ij})\)
负矩阵
记 \(-\boldsymbol{A}=(-a_{ij})\) 为矩阵 \(\boldsymbol{A}=(a_{ij})\) 的负矩阵
矩阵的减法
规定 \(\boldsymbol{A}-\boldsymbol{B}=\boldsymbol{A}+(-\boldsymbol{B})\) 为矩阵的减法
矩阵的 \(k\) 乘
数 \(\lambda\) 与矩阵 \(\boldsymbol{A}\) 的乘积记作 \(\lambda \boldsymbol{A}\) ,有 \(\lambda \boldsymbol{A}=(\lambda a_{ij})\)
矩阵的乘法
\(\boldsymbol{A}_{m\times s}\times \boldsymbol{B}_{s\times n}=\boldsymbol{C}_{m\times n}\)
\(\displaystyle c_{ij}=\sum_{k=1}^{s}a_{ik}b_{kj}\)
从形式上看,矩阵乘法依照先行后列的规则,也即第一个矩阵的行的长度等于第二个矩阵的列的长度,结果矩阵的元素所在的行与第一个矩阵的行所在的位置对应,所在的列与第二个矩阵的列所在的位置对应。
矩阵乘法的可交换性
若 \(n\) 阶方阵 \(\boldsymbol{A}\) ,\(\boldsymbol{B}\) 满足 \(\boldsymbol{AB}=\boldsymbol{BA}\) ,则称 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 是可交换的。
\((\boldsymbol{AB})\boldsymbol{C}=\boldsymbol{A}(\boldsymbol{BC})\)
也即矩阵的乘法满足结合律
证:记 \(\boldsymbol{A}=\boldsymbol{A}_{ab}=(a_{ij})\) ,\(\boldsymbol{B}=\boldsymbol{A}_{bc}=(b_{ij})\) ,\(\boldsymbol{C}=\boldsymbol{C}_{cd}=(c_{ij})\) ,
再记 \(\boldsymbol{AB}=\boldsymbol{M}_{ac}=(m_{ij})\) ,\(\boldsymbol{BC}=\boldsymbol{N}_{bd}=(n_{ij})\) ,则有
\(\displaystyle m_{ij}=\sum_{k=1}^{b}a_{ik}b_{kj}\) ,\(\displaystyle n_{ij}=\sum_{k=1}^{c}b_{ik}c_{kj}\) ,
再记 \(\boldsymbol{M}_{ac}\boldsymbol{C}_{cd}=\boldsymbol{P}_{ad}=(p_{ij})\) ,\(\boldsymbol{A}_{ab}\boldsymbol{N}_{bd}=\boldsymbol{Q}_{ad}=(q_{ij})\)
则有 \(\displaystyle p_{ij}=\sum_{t=1}^{c}m_{it}c_{tj}=\sum_{t=1}^{c}(\sum_{k=1}^{b}a_{ik}b_{kt})c_{tj}\) ,
\(\displaystyle q_{ij}=\sum_{t=1}^{b}a_{it}n_{tj}=\sum_{t=1}^{b}a_{it}(\sum_{k=1}^{c}b_{tk}c_{kj})\)
也即 \(p_{ij}=q_{ij}\)
\(\lambda (\boldsymbol{AB})=(\lambda \boldsymbol{A})\boldsymbol{B}=\boldsymbol{A}(\lambda \boldsymbol{B})\)
直接根据乘法的定义式,可得 \(\lambda\) 放在任意位置均可。
\(\boldsymbol{A}(\boldsymbol{B}+\boldsymbol{C})=\boldsymbol{AB}+\boldsymbol{AC}\)
即矩阵乘法满足分配律
直接由定义式可得。
\(\boldsymbol{E}_m\boldsymbol{A}_{mn}=\boldsymbol{A}_{mn}\)
\(\boldsymbol{A}_{mn}\boldsymbol{E}_n=\boldsymbol{A}_{mn}\)
简记为 \(\boldsymbol{EA}=\boldsymbol{AE}=\boldsymbol{A}\)
注:简单记法中,\(\boldsymbol{E}\) 在不同位置时的含义并不一致。
推论:单位矩阵和方阵是可交换的
推论:数量矩阵和方阵是可交换的
矩阵的幂
对于 \(n\) 阶方阵,定义 \(\boldsymbol{A}^1=\boldsymbol{A}\) ,\(\boldsymbol{A}^{k+1}=\boldsymbol{A}^{k}\boldsymbol{A}^1\)
矩阵的转置
如果有矩阵 \(\boldsymbol{A}_{mn}=(a_{ij}),\boldsymbol{B}_{nm}=(b_{ij})\) ,满足 \(a_{ij}=b_{ji}\) ,则记 \(\boldsymbol{B}\) 为 \(\boldsymbol{A}\) 的转置矩阵,记为 \(\boldsymbol{B}=\boldsymbol{A}^{T}\)。
\((\boldsymbol{A}^T)^T=\boldsymbol{A}\)
即矩阵的转置是可逆的。
\((\boldsymbol{A}+\boldsymbol{B})^T=\boldsymbol{A}^T+\boldsymbol{B}^T\)
\((\lambda \boldsymbol{A})^T=\lambda \boldsymbol{A}^T\)
\((\boldsymbol{AB})^T=\boldsymbol{B}^T\boldsymbol{A}^T\)
证:记 \(\boldsymbol{A}_{ab}\boldsymbol{B}_{bc}=\boldsymbol{M}_{ac}=(m_{ij})\) ,\(\displaystyle m_{ij}=\sum_{k=1}^b a_{ik}b_{kj}\) ,
\(\boldsymbol{M}^T_{ca}=(m'_{ij})\) ,则有 \(\displaystyle m'_{ij}=m_{ji}=\sum_{k=1}^b a_{jk}b_{ki}\) ,
记 \(\boldsymbol{B}^T_{cb}=(b'_{ij})\) ,\(\boldsymbol{A}^T_{ba}=(a'_{ij})\) ,有 \(b'_{ij}=b_{ji}\) ,\(a'_{ij}=a_{ji}\) ,
再记 \(\boldsymbol{B}^T\boldsymbol{A}^T=\boldsymbol{N}_{ca}=(n_{ij})\) ,则有 \(\displaystyle n_{ij}=\sum_{k=1}^b b'_{ik}a'_{kj}=\sum_{k=1}^b b_{ki}a_{jk}\) ,
即得证。
方阵的行列式
由 \(n\) 阶方阵的数表构成的行列式,称为方阵的行列式。对方阵 \(\boldsymbol{A}_n\) ,其行列式记作 \(|\boldsymbol{A}_n|\) 或 \(\text{det}\boldsymbol{A}_n\) 。(行列式单词为 determinant)
\(|\boldsymbol{A}^T|=|\boldsymbol{A}|\)
由行列式按行取元素与按列取元素进行求积再求和相等可知。
\(|\lambda \boldsymbol{A}|=\lambda^n|\boldsymbol{A}|\)
由行列式的 \(k\) 乘为将某一行 \(k\) 乘的性质可知。
\(|\boldsymbol{AB}|=|\boldsymbol{A}||\boldsymbol{B}|\)
证明:
先构造 \(|\boldsymbol{A}||\boldsymbol{B}|\) ,即
\(|\boldsymbol{A}||\boldsymbol{B}|=\begin{vmatrix}\boldsymbol{A}&\boldsymbol{O}\\-\boldsymbol{E}&\boldsymbol{B}\end{vmatrix}\)
使用列运算,利用 \(-\boldsymbol{E}\) 消去 \(\boldsymbol{B}\) ,此时子矩阵 \(\boldsymbol{O}\) 变换为
\(\boldsymbol{O'}_n=(o'_{ij})\) ,\(\displaystyle o'_{ij}=\sum_{k=1}^n a_{ik}b_{kj}\) (一次消去一列),也即变换为
\(\begin{vmatrix}\boldsymbol{A}&\boldsymbol{AB}\\-\boldsymbol{E}&\boldsymbol{O}\end{vmatrix}\)
为可分块的反对角行列式,值为 \((-1)^t |\boldsymbol{AB}||\boldsymbol{-E}|=(-1)^{\frac{2n(2n-1)}{2}}(-1)^n|\boldsymbol{AB}|=(-1)^{2n^2}|\boldsymbol{AB}|=|\boldsymbol{AB}|\)
即得证。
推论:对于方阵有 \(|\boldsymbol{AB}|=|\boldsymbol{BA}|\) ,尽管 \(\boldsymbol{AB}=\boldsymbol{BA}\) 不一定成立。
2.2.3 理解逆矩阵的概念,掌握逆矩阵的性质以及矩阵可逆的充分必要条件,理解伴随矩阵的概念,会用伴随矩阵求逆矩阵
伴随矩阵
将矩阵 \(\boldsymbol{A}\) 的各个元素用其对应行列式的元素的代数余子式替代,得到 \(|\boldsymbol{A}'|=(A_{ij})\) ,称 \(\boldsymbol{A^{'T}}\) 为矩阵 \(\boldsymbol{A}\) 的代数余子式,记为 \(\boldsymbol{A}^*\) ,有 \(\boldsymbol{A}^*=(A_{ij})^T\) ,简称伴随阵。
注:只有方阵有伴随矩阵。
\(\boldsymbol{A^*A}=\boldsymbol{AA^*}=|\boldsymbol{A}|\boldsymbol{E}\)
也即矩阵和其对应的伴随阵的乘积是一个纯量阵,元素的值为矩阵对应的行列式的值。
证:
记 \(\boldsymbol{B}=(b_{ij})=\boldsymbol{A}^*\) ,则有 \(b_{ij}=A_{ji}\) ,
再记 \(\boldsymbol{A}^*\boldsymbol{A}=\boldsymbol{C}=(c_{ij})\) ,则有 \(\displaystyle c_{ij}=\sum_{k=1}^n b_{ik}a_{kj}=\sum_{k=1}^{n} A_{ki}a_{kj}\) ,
若 \(i\not =j\) ,则有 \(c_{ij}=0\) ,若 \(i=j\) ,则 \(c_{ij}=|\boldsymbol{A}|\) ,即得证。
逆矩阵
对 \(n\) 阶矩阵,若有 \(\boldsymbol{AB}=\boldsymbol{BA}=\boldsymbol{E}\) ,则称 \(\boldsymbol{A}\) 是可逆的,并称 \(\boldsymbol{B}\) 为 \(\boldsymbol{A}\) 的逆矩阵,记为 \(\boldsymbol{B}=\boldsymbol{A}^{-1}\)。
逆矩阵简称逆阵。
逆矩阵的唯一性
如果矩阵有逆矩阵,那么逆矩阵一定是唯一的。
证:假设 \(\boldsymbol{A}\) 有逆阵 \(\boldsymbol{B}\) 和 \(\boldsymbol{C}\) ,则有 \(\boldsymbol{B}=\boldsymbol{BAC}=\boldsymbol{C}\) ,故得证。
矩阵可逆的充要条件
方阵 \(\boldsymbol{A}\) 可逆 \(\Leftrightarrow\) \(|\boldsymbol{A}|\not =0\)
推论:单位矩阵一定是可逆矩阵。
逆矩阵的求法
若方阵 \(\boldsymbol{A}\) 存在逆矩阵 \(\boldsymbol{B}\),则 \(\boldsymbol{AB}=\boldsymbol{E}\) ,两边左侧同乘 \(\boldsymbol{A}^*\) ,即有 \(|\boldsymbol{A}|\boldsymbol{B}=\boldsymbol{A}^*\) ,即 \(\displaystyle \boldsymbol{B}=\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^*\) ,\(|\boldsymbol{A}|\not =0\)
该求法可逆,因此矩阵可逆的充要条件可证。
奇异矩阵和非奇异矩阵
若 \(|\boldsymbol{A}|=0\) 则称 \(|\boldsymbol{A}|\) 为奇异矩阵,否则称为非奇异矩阵。可逆矩阵因此就是非奇异矩阵。
2.2.4 理解矩阵初等变换的概念,了解初等矩阵的性质和矩阵等价的概念,理解矩阵的秩的概念,掌握用初等变换求矩阵的秩和逆矩阵的方法
初等行变换
定义对矩阵的行作以下三种变换
(1)对调两行
(2)\(k\) 乘某一行并替换该行
(3)\(k\) 乘某一行并加到另一行
为矩阵的初等行变换。
称初等行变换和初等列变换为初等变换。
行等价、列等价、等价
如果一个矩阵可以通过有限次初等行变换变成另一个矩阵,则称这两个矩阵行等价。
如果一个矩阵可以通过有限次初等变换变成另一个矩阵,则称这两个矩阵等价。
矩阵的等价关系具有自反性、对称性和传递性。
矩阵和矩阵之间的等价关系可以类比离散数学中二元关系的等价关系。
所有和某个矩阵等价的矩阵构成了这个矩阵的等价类。
初等矩阵
将单位矩阵进行一次初等变换后得到的矩阵称为初等矩阵。
推论:初等矩阵一定是可逆矩阵。
使用行对调得到的初等矩阵在另一矩阵左侧相乘,由于右侧矩阵的每一列的同一位置与被交换的元素相乘,因此相当于对右侧矩阵进行行对调。
使用行对调得到的初等矩阵在另一矩阵右侧相乘,由于左侧矩阵的每一行的同一位置与被交换的元素相乘,因此相当于对左侧矩阵进行列对调。
结论:使用初等矩阵在另一矩阵左侧相乘,相当于进行一次初等行变换;使用初等矩阵在另一矩阵右侧相乘,相当于进行一次初等列变换。
推论:初等矩阵一定可逆。
推论:初等变换一定可逆。注:这里的可逆是指能变换过去,也能变换回来。
推论:可逆矩阵一定能表示为有限次的初等变换。
推论:有限次的初等变换一定可逆。
推论:\(\boldsymbol{PA}=\boldsymbol{B},|\boldsymbol{P}|\not = 0\) \(\Leftrightarrow\) \(\boldsymbol{A}\overset{r}{\sim}\boldsymbol{B}\)
推论:\(\boldsymbol{AQ}=\boldsymbol{B},|\boldsymbol{Q}|\not = 0\) \(\Leftrightarrow\) \(\boldsymbol{A}\overset{c}{\sim}\boldsymbol{B}\)
推论:\(\boldsymbol{PAQ}=\boldsymbol{B},|\boldsymbol{P}|\not = 0,|\boldsymbol{Q}|\not = 0\Leftrightarrow \boldsymbol{A}\sim\boldsymbol{B}\)
也即,如果存在一个可逆矩阵在左侧和矩阵相乘能得到另一个矩阵,则这两个矩阵行等价。
注:这里要求变换矩阵必须可逆,因为行变换是初等变换,而初等变换可以看作是初等矩阵的连续叠加乘法,初等矩阵一定是可逆的。
推论:\(\boldsymbol{A}\) 可逆 \(\Leftrightarrow\) \(|\boldsymbol{A}|\not =0\) \(\Leftrightarrow\) \(\boldsymbol{A}\overset{r}{\sim}\boldsymbol{E}\)
证:可逆,则存在可逆矩阵乘积为 \(\boldsymbol{E}\) ,也即有限次初等行变换可以得到 \(\boldsymbol{E}\)。
相反亦可证。
通过初等行(列)变换求变换矩阵的一种方法
如,如何求 \(\boldsymbol{P}\) ,使 \(\boldsymbol{PA}=\boldsymbol{B}\) ?
方法:由于在矩阵左侧乘一个矩阵,等价于对矩阵进行有限次确定的初等变换,因此同时对 \(\boldsymbol{A},\boldsymbol{E}\) 进行变换,则有 \(\boldsymbol{P}(\boldsymbol{A},\boldsymbol{E})=(\boldsymbol{B},\boldsymbol{P})\) ,也即 \((\boldsymbol{A},\boldsymbol{E})\overset{r}{\sim}(\boldsymbol{B},\boldsymbol{P})\)。
如果 \(\boldsymbol{B}\) 为单位矩阵,则这种方法就可以通过初等行变换的方法求逆矩阵。
\(k\) 阶子式
从矩阵中任取 \(k\) 行和 \(k\) 列,称这些行列的交叉处的元素按其相对位置构成的数阵对应的行列式为矩阵的一个 \(k\) 阶子式。
注:\(k\) 阶子式是行列式。
矩阵的秩的一种定义(最大非零子式的阶)
如果矩阵存在 \(k\) 阶子式不为 \(0\) ,且所有 \(k+1\) 阶子式为 \(0\) ,则称矩阵的秩为 \(k\) 。如果矩阵的最大阶子式不为 \(0\) ,则矩阵的秩即为最大阶子式的阶数。规定零矩阵的秩为 \(0\) (这是因为定义没有给出 \(0\) 阶矩阵的定义)。
注:所有非零矩阵的秩不为必不为 \(0\) ,因为其总存在一个非 \(0\) 元素,构成了一个非 \(0\) 的 \(1\) 阶子式。
初等变换不改变矩阵的秩
理解:对于行列式,初等变换不影响行列式是否为零值(行列式为零,则变换后仍为零,行列式不为零,则变换后仍不为零),也即矩阵的最大非零子式在初等变换后仍为最大非零子式,因此初等变换不改变矩阵的秩。
推论:矩阵相似,则秩相等。
行阶梯形矩阵 行最简形矩阵
行阶梯形矩阵和行最简形矩阵,这里以行变换的方式来阐述:
通过初等行变换(交换,\(k\) 乘,\(k\) 加),可以将第一列的第一行以外的元素全部消去,对第二列,将矩阵看作除去第一行和第一列后的一个子矩阵,同样通过行变换可以消去这个子矩阵的第一列的第一行以外的元素。消去过程中,由于对子矩阵进行行变换时,不会影响上层矩阵的零元素,因此最终一定可以将矩阵消去称为一个阶梯形(如果每一个子矩阵的第一列第一行的元素都不为零,则阶梯的步长为 \(1\),否则步长大于 \(1\))。称这样的矩阵为行阶梯形矩阵。
注:如果(子)矩阵中第一列全部为零,则略过这一列(取子矩阵时,只消去第一列,不再消去第一行)。
由于上述得到行阶梯矩阵的方法是可以归纳的,因此任何一个矩阵总可以得到对应的行阶梯矩阵。
在行阶梯形矩阵的基础上,利用每一行的第一个非零元素,依次消去这一列的上侧的非零元素,由于所在行的左侧元素都为零元素,因此不影响已经被消去的列的性质。这样得到的矩阵称为行最简形矩阵。
任何矩阵总可经过初等变换化为标准形 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{O}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) ,且 \(r\) 就是这个矩阵的秩。
证明:将矩阵通过行变换得到行最简形矩阵,然后将每一行的第一个非零元素所在的列通过相邻交换按原有顺序排列到矩阵的左侧,这样就得到了 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{M}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) 形式的矩阵。再通过初等列变换,可以将 \(\boldsymbol{M}\) 全部消去,此时矩阵的秩就是最小的非零子式 \(|\boldsymbol{E}_r|\) 的阶,故得证。
2.2.5 了解分块矩阵及其运算
矩阵分块法
矩阵分块法是指在计算阶数较高的矩阵时,将矩阵划分为阶数较低的多个子块,称这些子块为分块矩阵。将矩阵分块后,可以将矩阵的分块看作矩阵的基本元素(数)进行运算。
设矩阵分块为 \(\boldsymbol{A}=(\boldsymbol{A}_{ij})\) ,\(\boldsymbol{B}=(\boldsymbol{B}_{ij})\) ,则
\(\boldsymbol{A}+\boldsymbol{B}=(\boldsymbol{A}_{ij}+\boldsymbol{B}_{ij})\)
\(\lambda \boldsymbol{A}=(\lambda \boldsymbol{A}_{ij})\)
\(\displaystyle \boldsymbol{A}_{ab}\boldsymbol{B}_{bc}=(\boldsymbol{C}_{ij})\) ,\(\boldsymbol{C}_{ij}=\sum_{k=1}^{b}\boldsymbol{A}_{ik}\boldsymbol{B}_{kj}\) ,其中 \(\boldsymbol{A}\) 被分块为 \(a\) 行 \(b\) 列,\(\boldsymbol{B}\) 被分块为 \(b\) 行 \(c\) 列。
2.3 向量
2.3.1 理解 \(n\) 维向量、向量的线性组合与线性表示的概念
向量
\(n\) 个有次序的数 \(a_1,a_2,...,a_n\) 组成的数组称为 \(n\) 维向量,其中第 \(i\) 个数称为第 \(i\) 个分量。
记列向量为 \(\boldsymbol{a}\) ,即 \(\boldsymbol{a}=\begin{pmatrix}a_1\\a_2\\...\\a_n\end{pmatrix}\) ,行向量相应记为 \(\boldsymbol{a}^T\) 。
规定列向量和行向量均按矩阵的运算规则进行计算,因此列向量和行向量是不同的向量。
向量组
若干个同维列向量(或行向量)组成的集合叫做向量组。
向量的线性组合
给定向量组 \(A:(\boldsymbol{a}_i)\) ,对于一组实数 \((k_i)\) ,表达式 \(\displaystyle \sum k_i\boldsymbol{a}_i\) 称为向量组 \(A\) 的一个线性组合,\((k_i)\) 称为这个线性组合的系数。
线性表示
如果向量 \(\boldsymbol{b}\) 能由向量组 \(A=(\boldsymbol{a}_i)\) 的一个线性组合 \(\displaystyle \sum k_i\boldsymbol{a}_i\) 表示,即 \(\displaystyle \boldsymbol{b}=\sum k_i\boldsymbol{a}_i\) ,则称向量 \(\boldsymbol{b}\) 能由向量组 \(A\) 线性表示。
注:注意区分线性表示和线性相关、线性无关的概念。
线性表示的充要条件
向量 \(\boldsymbol{b}\) 能由 \(A=(\boldsymbol{a}_i)\) 线性表示的充要条件是 \(R(A)=R(A,\boldsymbol{b})\)
证:
由线性表示,则对应的线性方程组有解,即得证。
2.3.2 理解向量组线性相关、线性无关的概念,掌握向量组线性相关、线性无关的有关性质及判别法
线性相关
对于向量组的一个线性组合,若存在一组不全为 \(0\) 的系数使线性组合为 \(\boldsymbol{0}\) ,则称向量组线性相关。若不存在这样一组系数,则称为线性无关。
注:注意区分零向量和零矩阵的表示方法。零矩阵表示为字母 \(\boldsymbol{O}\) 。
理解:系数不全为 \(0\) ,则可以将某个非 \(0\) 的系数消去(为系数 \(1\)),也即这个系数对应的向量能被其它向量线性表示。也即如果向量组线性相关,则至少存在一个向量能被其它向量线性表示。如果线性无关,则所有向量都不能被其它向量线性表示。
向量组线性无关的充要条件
向量组线性相关的充要条件是向量组构成的矩阵的秩小于向量组中向量的个数。
向量组线性无关的充要条件是向量组构成的矩阵的秩等于向量组中向量的个数。
证:
以向量组构成的矩阵构成线性方程组 \(\boldsymbol{Ax}=\boldsymbol{0}\) ,则线性无关等价于存在非零解,也即矩阵的秩小于元的数目。
思考:为何这里只用考虑矩阵的列数(矩阵的秩和向量的个数进行比较)?
理解:向量组对应的矩阵其秩的最大值就是向量的个数。因此若矩阵的秩等于向量组的个数,实际上就是矩阵的秩等于矩阵的最小边长,也即此时矩阵的秩为同型矩阵的秩的最大值。
推论:
对 \(\boldsymbol{P}=(\boldsymbol{p}_i)\) ,则 \(p_i\) 对应的向量组线性无关,等价于 \(\boldsymbol{P}\) 可逆,等价于 \(|\boldsymbol{P}|\not=0\)
设向量组 \(A:\boldsymbol{a}_1,\boldsymbol{a}_2,...,\boldsymbol{a}_m\) 线性无关,向量组 \(B:\boldsymbol{a}_1,\boldsymbol{a}_2,...,\boldsymbol{a}_m,\boldsymbol{b}\) 线性相关,则向量 \(\boldsymbol{b}\) 必能由向量组 \(A\) 线性表示,且表示式是唯一的。
证:直接构造线性方程组 \(\boldsymbol{Ax}=\boldsymbol{b}\) ,由线性相关的说明,知 \(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})=m\) ,有线性方程组有唯一解。
2.3.3 理解向量组的极大线性无关组和向量组的秩的概念,会求向量组的极大线性无关组及秩
向量组的极大线性无关向量组
对于向量组,若其中能选出 \(r\) 个向量满足向量无关,并且任意 \(r+1\) 个向量都线性相关,则这 \(r\) 个向量就是向量组的一个极大线性无关向量组。如果向量组本身就是线性无关的,那么向量组本身就是一个极大线性无关向量组。
向量组的极大线性无关组的向量的个数称为向量组的秩。
若向量组中存在一个部分组,满足线性无关,且向量组中的所有其它向量均能由这个部分组线性表示,则这个部分组就是向量组的一个极大线性无关组。
也即求向量组的极大无关组,可以分别选择向量组中的向量到一个部分组中,保持部分组的线性无关性,直到所有向量都被检查一遍。
证:
由线性表示,则有被表示的向量不影响部分组的秩,也即整个向量组的秩即为部分组的秩,也即任选超过部分组中的向量,其秩为部分组的向量的个数,即线性相关。参考极大线性无关组的定义,即得证。
2.3.4 理解向量组等价的概念,理解矩阵的秩与其行(列)向量组的秩之间的关系
向量组等价
若一个向量组中的所有向量都能由另一个向量组线性表示,则称这个向量组能由另一个向量组线性表示。如果两个向量组能相互线性表示,则称这两个向量组等价。
矩阵的秩等于它的列向量组的秩,也等于它的行向量组的秩。
也即求一个向量组的秩,可以转化为求向量组对应的矩阵的秩。
证:
假设矩阵有秩 \(r\) ,且有 \(r\) 阶非零子式,则这个非零子式所在列构成的矩阵的秩为 \(r\) ,因此这些列构成的矩阵对应的列向量线性无关,由向量组的秩的定义,即向量组的秩最小为 \(r\) 。任取 \(r+1\) 阶子式,必为 \(0\) ,也即这些列构成的矩阵对应的列向量线性相关,也即列向量的秩必然小于 \(r+1\) 。得证。
2.3.5 了解 \(n\) 维向量空间、子空间、基底、维数、坐标等概念
向量空间
对于 \(n\) 维向量的非空集合,若其对向量的加和数乘运算封闭,则称这个集合为向量空间。
注:某个向量空间的元素都是同维的。
注:向量空间的元素的维数是向量空间的维数的最大值(向量空间的维数不可能超过其元素的维数)。
向量组生成向量空间
一般的,由向量组 \(A=(\boldsymbol{a_i})\) 生成的向量空间为
\(\displaystyle L=\{\boldsymbol{x}=\sum \lambda_i\boldsymbol{a}_i\}\)
证:只需要证明这个集合对加贺数乘运算封闭即可。
齐次线性方程组的解集是一个向量空间
证:
对于线性方程组 \(\boldsymbol{Ax}=\boldsymbol{0}\) ,对于任意解,对其进行加运算和数乘运算,得到的结果仍然是线性方程组的解,也即解集满足向量空间的定义。
齐次线性方程组的解集称为解空间。
若两个向量组等价,则这两个向量组生成的向量空间相等
证:
由于等价,第一个向量组中的任一向量均能由第二个向量组线性表示,同样第一个向量组的线性组合均能由第二个向量组线性表示,也即第一个向量组生成的向量空间中的任一元素均在第二个向量组生成的向量空间中,同理有第二个向量组的任一元素均在第一个向量组生成的生成的向量空间中,因此两个向量空间相等。
子空间
若第一个向量空间中的任一向量均在第二个向量空间中,则第一个向量空间是第二个向量空间的子空间。
向量空间的基,维
对于向量空间,若有一组线性无关的向量,满足向量空间中的任一向量都能被这组向量线性表示,则称这一组向量是这个向量空间的一个基,这组向量中向量的个数成为向量空间的维数。记维数为 \(r\) ,则称为 \(r\) 维向量空间。
注:\(r\) 维空间不是唯一的。
证明:
举一个反例即可。记一组线性无关的向量组对应的矩阵 \(\begin{pmatrix}\boldsymbol{a}^T\\\boldsymbol{E}\end{pmatrix}\) ,\(\boldsymbol{a}^T=(a,a,...,a)\) , \(a\) 为常数,\(\boldsymbol{E}\) 为 \(r\) 阶矩阵,则当 \(a\) 取不同的值时,分别对应不同的 \(r\) 维向量空间。即得证。
注:向量空间的维数为 \(r\) ,向量空间的向量的维数可能大于 \(r\) 。
记 \(n\) 维向量的集合 \(\Reals^n\) 。
推论:\(\Reals^n\) 为 \(n\) 维向量空间。
向量空间的基不唯一。
假设向量空间有基 \(A=(\boldsymbol{a}_i)\) ,则新的一组向量 \(B=(\lambda_i\boldsymbol{a}_i),\lambda_i\not =0\) 同样也满足基的条件。
自然基
如果基是一组单位坐标向量,则这一组基成为自然基。
坐标
向量空间中的某一个向量被基线性表示时,和基的顺序一一对应的系数构成的数组称为这个向量的坐标。
对于一个向量空间的一个基,其中任意向量的坐标都是唯一的
证:
记这个向量为 \(\boldsymbol{a}\) ,基为 \(B=(\boldsymbol{b}_i)\) ,有两个坐标 \((\lambda_i),(\omega_i)\) 同时表示这一个向量,即 \(\displaystyle \boldsymbol{a}=\sum \lambda_i \boldsymbol{b_i}=\sum \omega_i \boldsymbol{b}_i\) ,即 \(\displaystyle \sum (\lambda_i-\omega_i)\boldsymbol{b_i}=\boldsymbol{0}\) 。由于 \((\boldsymbol{b}_i)\) 线性无关,因此不存在一组全不为零的系数使该式成立,也即所有的系数均为零,即 \(\lambda_i=\omega_i\) ,也即这两个坐标一定相等。
2.3.6 了解基变换和坐标变换公式,会求过渡矩阵
基变换公式
设 \(\Reals^n\) 有两组基 \((\boldsymbol{a}_i)\) ,\((\boldsymbol{b}_i)\) ,用 一组基表示另一组基的表示式就是基变换公式。
求法:
不妨记 \(\boldsymbol{A}=(\boldsymbol{a}_i)\) ,\(\boldsymbol{B}=(\boldsymbol{b}_i)\) ,取 \(\boldsymbol{B}=\boldsymbol{AP}\) ,即 \(\boldsymbol{P}=\boldsymbol{A}^{-1}\boldsymbol{B}\) ,其中 \(\boldsymbol{P}\) 就是基变换公式对应的过渡矩阵。
坐标变换公式
向量对应两组基的坐标之间的变换公式称为坐标变换公式。
求法:
记 \(\displaystyle \boldsymbol{x}=\sum \lambda_i\boldsymbol{a}_i=\sum \omega_i\boldsymbol{b}_i\) ,将其转换为矩阵形式,即 \(\boldsymbol{x}=(\boldsymbol{a}_i)\begin{pmatrix}\lambda_1\\\lambda_2\\...\\\lambda_n\end{pmatrix}=(\boldsymbol{b}_i)\begin{pmatrix}\omega_1\\\omega_2\\...\\\omega_n\end{pmatrix}\) ,记为 \(\boldsymbol{A\lambda}=\boldsymbol{B\omega}\) ,故 \(\boldsymbol{\omega}=\boldsymbol{B}^{-1}\boldsymbol{A\lambda}=\boldsymbol{P}^{-1}\boldsymbol{\lambda}\) 。
也即基变换矩阵的逆矩阵就是坐标变换的逆矩阵。
2.3.7 了解内积的概念,掌握线性无关向量组正交规范化的施密特方法
向量的内积
有两个 \(n\) 维向量 \(\boldsymbol{x}=(x_i), \boldsymbol{y}=(y_i)\) ,取 \(\displaystyle [\boldsymbol{x},\boldsymbol{y}]=\sum x_iy_i\) ,称 \([\boldsymbol{x},\boldsymbol{y}]\) 为向量的内积。
注:线性代数中的内积,就是高等数学中向量的数量积。
推论:
\([\boldsymbol{a},\boldsymbol{b}]=[\boldsymbol{b},\boldsymbol{a}]\)
向量的长度
取 \(||\boldsymbol{x}||=\sqrt{[\boldsymbol{x},\boldsymbol{x}]}\) ,称 \(||\boldsymbol{x}||\) 为向量的长度。
推论:\([\boldsymbol{x},\boldsymbol{x}]=||\boldsymbol{x}||^2\)
向量的夹角
取 \([\boldsymbol{x},\boldsymbol{y}]=||\boldsymbol{x}||||\boldsymbol{y}||\cos \theta\) ,\(\theta\in [0,\pi]\) ,称 \(\theta\) 为向量的夹角。
向量正交
若两个向量的内积为 \(0\) ,则称这两个向量正交。
在几何中,向量正交即向量相互垂直。
单位向量
长度为 \(1\) 的向量称为单位向量。
推论:与向量 \(\boldsymbol{a}\) 同向的单位向量为 \(\displaystyle \frac{1}{||\boldsymbol{a}||}\boldsymbol{a}=\frac{\boldsymbol{a}}{\sqrt{[\boldsymbol{a},\boldsymbol{a}]}}\)
投影向量
几何定义:设有向量 \(\boldsymbol{a},\boldsymbol{b}\) ,通过平移将起点移动至同一点 \(O\) ,得到 \(\overrightarrow{OA},\overrightarrow{OB}\) 。设 \(\overrightarrow{OB}\) 在 \(\overrightarrow{OA}\) 上的投影点为 \(C\) ,则称向量 \(\overrightarrow {OC}\) 为 \(\boldsymbol{b}\) 在 \(\boldsymbol{a}\) 上的投影向量。
由于 \(|\overrightarrow {OC}|=\text{Prj}_{\boldsymbol{a}}\boldsymbol{b}\) ,故投影向量即为投影与投影轴的单位向量的乘积。
注:高等数学中,向量的投影是一个数。
计算:记 \(\boldsymbol{b}\) 在 \(\boldsymbol{a}\) 上的投影向量为 \(\boldsymbol{c}\) ,则 \(\displaystyle \boldsymbol{c}=||\boldsymbol{b}||\cos\theta \frac{\boldsymbol{a}}{||\boldsymbol{a}||}=\frac{[\boldsymbol{a},\boldsymbol{b}]}{||\boldsymbol{a}||^2}\boldsymbol{a}=\frac{[\boldsymbol{a},\boldsymbol{b}]}{[\boldsymbol{a},\boldsymbol{a}]}\boldsymbol{a}\)
正交向量组
若向量组中的向量两两正交,则向量组称为正交向量组。
也即 \(\forall i\not =j, [\boldsymbol{a}_i,\boldsymbol{a}_j]=0,\)
正交向量组线性无关
证明:
不妨假设正交向量组线性相关,即存在非全零的系数使得 \(\displaystyle \sum \lambda_i \boldsymbol{a}_i=\boldsymbol{0}\) ,等式两边左侧乘以 \(\boldsymbol{a_t}^T\) ,由于正交,故 \(\boldsymbol{a}_t^T\boldsymbol{a}_i=[\boldsymbol{a}_t,\boldsymbol{a}_i]\) ,当 \(t=i\) 时为 \(||\boldsymbol{a}_t||^2\) ,当 \(t\not =i\) 时为 \(0\) ,也即 \(\lambda_t ||\boldsymbol{a}_t||^2=0\) ,故 \(\lambda_t=0\) 。
类似可得,所有系数必为 \(0\) ,也即不存在这样一组非零的系数,也即向量组线性无关。
规范正交基
如果一组向量是向量空间的一个基,如果这组向量两两正交,并且都是单位向量,则称这个基为这个向量空间的一个规范正交基。
规范正交基下的坐标
设某向量用规范正交基表示为 \(\displaystyle \boldsymbol{a}=\sum \lambda_i\boldsymbol{e}_i\) ,等式两边左侧同乘 \(\boldsymbol{e}_t\) ,即有 \(\lambda_t=[\boldsymbol{a}, \boldsymbol{e}_t]\) 。
注:显然,在规范正交基下,很容求某一个向量的坐标。
规范正交化
已知向量空间的一个基,去求这个向量空间的一个规范正交基,也即求一个等价的规范正交基。这个过程就是规范正交化的过程。
施密特规范正交化
先根据给定基求正交基:
首先将所有向量的起点移动到同一点。
以三维空间为例,选定第一个向量,作为第一个结果向量;选定第二个向量,作这个向量在第一个结果向量上的投影向量,用第二个向量减去这个投影向量,则得到第二个结果向量;选定第三个向量,分别作这个向量在第一个结果向量和第二个结果向量的投影向量,用第三个向量减去这两个投影向量,即得到第三个结果向量;
对于高于三维的向量,也用这个方法进行推广。
得到了正交基之后,将这些基进行规范化,即得到规范正交基。
正交基计算公式:
\(\boldsymbol{b}_1=\boldsymbol{a}_1\)
\(\displaystyle \boldsymbol{b}_2=\boldsymbol{a}_2-\frac{[\boldsymbol{a}_2,\boldsymbol{b}_1]}{[\boldsymbol{b}_1,\boldsymbol{b}_1]}\boldsymbol{b}_1\)
\(\displaystyle \boldsymbol{b}_3=\boldsymbol{a}_3-\frac{[\boldsymbol{a}_3,\boldsymbol{b}_1]}{[\boldsymbol{b}_1,\boldsymbol{b}_1]}\boldsymbol{b}_1-\frac{[\boldsymbol{a}_3,\boldsymbol{b}_2]}{[\boldsymbol{b}_2,\boldsymbol{b}_2]}\boldsymbol{b}_2\)
依次类推。
\(\displaystyle \boldsymbol{b}_r=\boldsymbol{b}_r-\sum_{k=1}^{r-1}\frac{[\boldsymbol{a}_r,\boldsymbol{b}_k]}{[\boldsymbol{b}_k,\boldsymbol{b}_k]}\boldsymbol{b}_k\)
2.3.8 了解规范正交基、正交矩阵的概念以及它们的性质
正交矩阵
若 \(n\) 阶矩阵 \(\boldsymbol{A}\) 满足 \(\boldsymbol{A}^T\boldsymbol{A}=\boldsymbol{E}\) ,则称 \(\boldsymbol{A}\) 为正交矩阵,简称正交阵。
正交阵可逆,且其逆矩阵是其本身
证:\(|\boldsymbol{A}^T\boldsymbol{A}|=|\boldsymbol{E}|\) ,即 \(|\boldsymbol{A}|\not =0\) ,即可逆。
两个正交阵的乘积也是正交阵
证:\((\boldsymbol{AB})^T(\boldsymbol{AB})=\boldsymbol{B}^T\boldsymbol{A}^T\boldsymbol{AB}=\boldsymbol{E}\) ,即得证。
正交变换不改变向量的长度
记变换为 \(\boldsymbol{y}=\boldsymbol{Px}\) ,则 \(||\boldsymbol{y}||=||\boldsymbol{Px}||=\sqrt{(\boldsymbol{Px})^T(\boldsymbol{Px})}=\sqrt{\boldsymbol{x}^T\boldsymbol{P}^T\boldsymbol{Px}}=||\boldsymbol{x}||\) ,因此得证。
正交矩阵与列向量
设 \(\boldsymbol{A}\) 为正交矩阵,记 \(\boldsymbol{A}=(\boldsymbol{a}_1,\boldsymbol{a}_2,...,\boldsymbol{a}_n)\) ,则 \(\boldsymbol{A}^T=\begin{pmatrix}\boldsymbol{a}_1^T\\\boldsymbol{a}_2^T\\...\\\boldsymbol{a}_n^T\end{pmatrix}\) ,则 \(\boldsymbol{A}^T\boldsymbol{A}=(c_{ij})\) , \(c_{ij}=(\boldsymbol{a}_i^T\boldsymbol{a}_j)\) ,由正交矩阵定义,有 \(c_{ij}=\begin{cases}0,&i\not =j\\1,&i=j\end{cases}\) ,因此有正交矩阵的一个充分必要条件即所有列向量都是单位向量且两两正交。
注:正交矩阵的等价条件是列向量两两正交,因此定义式中的顺序是不可改变的。
2.4 线性方程组
2.4.1 会用克拉默法则
2.4.2 理解齐次线性方程组有非零解的充分必要条件及非齐次线性方程组有解的充分必要条件
线性方程组
\(\begin{cases} a_{11}x_1+a_{12}x_2+...+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+...+a_{2n}x_n=b_2\\ ...\\ a_{m1}x_1+a_{m2}x_2+...+a_{mn}x_n=b_m \end{cases}\)
可以表示为以 \(\boldsymbol{x}\) 为未知元的向量方程 \(\boldsymbol{Ax}=\boldsymbol{b}\)
线性方程组的解
对 \(n\) 元线性方程组 \(\boldsymbol{Ax}=\boldsymbol{b}\) :
(1)无解:\(R(\boldsymbol{A})<R(\boldsymbol{A},\boldsymbol{b})\)
(2)有唯一解:\(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})=n\)
(2)有无限多解:\(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{b})<n\)
注:通过初等行变换和列交换(列只能交换),一定可以将系数矩阵变换为 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{M}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) 形式的矩阵。将常数列放到系数矩阵中,则变换之后,常数列的非零元素可能在 \(r\) 下一行,也可能不在 \(r\) 下一行(因为秩可能增加,也可能不增加)。若在下一行,则是 \(0=k\) 的不成立的式子,即无解。若不在 \(r\) 下一行,则可以将 \(\boldsymbol{M}\) 对应的 \(n-r\) 个待求量作为自由未知数,去线性表示 \(\boldsymbol{E}_r\) 对应的 \(r\) 个待求量。也即如果 \(r=n\) ,则只有一个解,如果 \(r<n\) ,则有无数解。
齐次线性方程组的解
对 \(n\) 元齐次线性方程组 \(\boldsymbol{Ax}=\boldsymbol{0}\) :
齐次线性方程组总有一个解 \(x_i=0\)
当 \(R(\boldsymbol{\boldsymbol{A}})<n\) 时,有无限多个非零解(有解)
注:\(R(\boldsymbol{A})=R(\boldsymbol{A},\boldsymbol{0})\) 一定成立。
2.4.3 理解齐次线性方程组的基础解系、通解及解空间的概念,掌握齐次线性方程组的基础解系和通解的求法
齐次线性方程组的解的可加性
对齐次线性方程组 \(\boldsymbol{Ax}=\boldsymbol{0}\) 有解 \(\boldsymbol{\xi}_1,\boldsymbol{\xi}_2\) ,则 \(\boldsymbol{\xi}_1+\boldsymbol{\xi}_2\) 也是这个线性方程组的解。
证:由矩阵乘法的分配律可证。
齐次线性方程组的解的可倍性
对齐次线性方程组 \(\boldsymbol{Ax}=\boldsymbol{0}\) 有解 \(\boldsymbol{\xi}\) ,则 \(\lambda\boldsymbol{\xi}\) 也是这个线性方程组的解。
证:由 \(\lambda\boldsymbol{0}=\boldsymbol{0}\) 可证。
推论:齐次线性方程组的解的线性组合也是方程组的解
齐次线性方程组的解集
齐次线性方程组的解的集合称为齐次线性方程组的解集。
齐次线性方程组的基础解系
齐次线性方程组的解集的最大无关组称为该齐次线性方程组的基础解系。
注:由于最大无关组能线性表示解集中所有的其它解向量,同时解满足可加性和可倍性,因此最大无关组的线性组合即为齐次线性方程组的通解。
设有最大无关组 \((\boldsymbol{\xi}_i)\) ,则有通解 \(\displaystyle \boldsymbol{x}=\sum \lambda_i\boldsymbol{\xi}_i\)
对齐次线性方程组 \(\boldsymbol{A}_{mn}\boldsymbol{x}_n=\boldsymbol{0}_m\) ,对其系数矩阵进行初等行变换和列交换后,得到 \(\begin{pmatrix}\boldsymbol{E}_r & \boldsymbol{M}_{r,n-r}\\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}\) 形式的矩阵,记 \(\boldsymbol{M}\) 对应的 \(n-r\) 个未知数为自由未知数(因为 \(\boldsymbol{E}_r\) 对应的 \(r\) 个未知数恰能被这 \(n-r\) 个未知数线性表示),并且构成向量 \(\boldsymbol{c}_{n-r}\) ,则有 \(\boldsymbol{x}_r=\boldsymbol{M}_{r,n-r}\boldsymbol{c}_{n-r}\) ,将全部未知数放到一起,则为 \(\boldsymbol{x}_n=\begin{pmatrix}\boldsymbol{M}_{r,n-r}\\\boldsymbol{E}_{n-r}\end{pmatrix}\boldsymbol{c}_{n-r}\) 。将解看成是列向量的线性组合,即 \(\boldsymbol{x}_n=\begin{pmatrix}\boldsymbol{\xi}_{1},\boldsymbol{\xi}_{2},...,\boldsymbol{\xi}_{n-r}\end{pmatrix}\boldsymbol{c}_{n-r}\) ,由于 \((\boldsymbol{\xi}_i)\) 是一个线性无关组,因此这个线性无关组即为齐次线性方程组的解集的一个最大线性无关组,也即 \((\boldsymbol{\xi}_i)\) 就是齐次线性方程组的一个基础解系。
根据向量组的秩的定义,有这个基础解系的秩为 \(n-r\) 。
推论:若齐次线性方程组的系数矩阵的秩为 \(r\) ,未知数个数为 \(n\) ,则其解集的秩为 \(n-r\) 。
证明:由于其具有一个秩为 \(n-r\) 的基础解系,而解集中的所有元素都可以用这个基础解系线性表示,也即解集的秩为 \(n-r\) 。
2.4.4 理解非齐次线性方程组解的结构及通解的概念
非齐次线性方程组的结构
非齐次线性方程组的两个解的差为对应的齐次线性方程组的解。
证:对非齐次线性方程组 \(\boldsymbol{Ax}=\boldsymbol{b}\) 和对应的齐次线性方程组 \(\boldsymbol{Ax}=\boldsymbol{0}\) ,若有 \(\boldsymbol{A}\boldsymbol{\xi}_1=\boldsymbol{b}, \boldsymbol{A}\boldsymbol{\xi}_2=\boldsymbol{b}\) ,则 \(\boldsymbol{A}(\boldsymbol{\xi}_1-\boldsymbol{\xi}_2)=\boldsymbol{0}\) ,得证。
非齐次线性方程组的解和其对应的齐次线性方程组的解的和也是这个非齐次线性方程组的解
证:\(\boldsymbol{Ax}=\boldsymbol{b}\) ,\(\boldsymbol{A\xi}=\boldsymbol{0}\) ,则 \(\boldsymbol{A}(\boldsymbol{x}+\boldsymbol{\xi})=\boldsymbol{b}\) ,得证。
非齐次线性方程组得任意解总可以表示为其某一个特解和对应的齐次线性方程组解集中的一个解的和。
注:或者说,已知一个特解,则任意的解,都可以通过和齐次线性方程组中的某个解相加得到。
证:只需要证明,对于任意一个解,其减去这个特解后得到的向量一定是对应的齐次线性方程组的解集中的一个元素(或者说是齐次线性方程组的一个解)。若有特解为 \(\boldsymbol{x}^*(\boldsymbol{A}\boldsymbol{x}^*=\boldsymbol{b})\) , \(\forall \boldsymbol{x}(\boldsymbol{Ax}=\boldsymbol{b})\Rightarrow \boldsymbol{A}(\boldsymbol{x}-\boldsymbol{x}^*)=\boldsymbol{b}-\boldsymbol{b}=\boldsymbol{0}\) ,也即得证。
非齐次线性方程组得通解为其一个特解和对应的齐次线性方程组得通解之和。
2.4.5 掌握用初等行变换求解线性方程组的方法
2.5 矩阵的特征值和特征向量
2.5.1 理解矩阵的特征值和特征向量的概念及性质,会求矩阵的特征值和特征向量
矩阵的特征值和特征向量
如果方阵 \(\boldsymbol{A}\) 有关系式 \(\boldsymbol{Ax}=\lambda\boldsymbol{x}(\boldsymbol{x}\not =\boldsymbol{0})\) 成立,则称 \(\lambda\) 为矩阵的一个特征值,\(\boldsymbol{x}\) 为对应于特征值 \(\lambda\) 的一个特征向量。
注:特征向量不为零向量,特别注意这个要求。
特征值和特征向量的求法
\((\boldsymbol{A}-\lambda\boldsymbol{E})\boldsymbol{x}=\boldsymbol{0}\) ,这个是一个齐次线性方程组,当 \(R(\boldsymbol{A}-\lambda\boldsymbol{E})<n\) ,即 \(|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) 时,有非零解。求出这个方程,即可求出所有的特征值。根据求出的特征值(可能是单根,也可能是重根,也可能是复根),然后求出对应的特征向量。
注:\(n\) 阶矩阵在复数域内一共有 \(n\) 个特征值。
特征方程
\(|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) ,这是一个一元 \(n\) 次方程,称为对应于矩阵的特征方程。
注:矩阵的特征值就是矩阵的特征方程的解。
在复数范围内,
特征多项式
记 \(f(\lambda)=|\boldsymbol{A}-\lambda\boldsymbol{E}|\) 为对应与矩阵的特征多项式。
注:矩阵的特征值就是矩阵的特征多项式和 \(x\) 轴的交点。
特征值与特征方程
\(\begin{cases}\displaystyle\sum \lambda_i=\sum a_{ii}\\\displaystyle \prod \lambda_i=|\boldsymbol{A}|\end{cases}\)
即矩阵的特征值的乘积为矩阵对应的行列式的值。矩阵的特征值的和为矩阵对应的行列式的主对角线上的元素之和。
证:
特征方程为 \(\begin{vmatrix}a_{11}-\lambda&a_{12}&...&a_{1n}\\a_{21}&a_{22}-\lambda&...&a_{2n}\\...&...&...&...\\a_{n1}&a_{n2}&...&a_{nn}-\lambda\end{vmatrix}=0\) ,
在复数域内,设有 \(n\) 个解 \((\lambda_i)\),即可记特征方程为 \(\displaystyle f(\lambda)=\prod (\lambda_i-\lambda)\) (注:这里把 \(\lambda\) 写在后面,是要和行列式形式保持一致),则有 \(\lambda^{0}\) 项的形式为 \(\displaystyle \prod \lambda_i\) ,对应的行列式形式的特征方程中 \(\lambda^{0}\) 的系数为 \(|\boldsymbol{A}|\) (不断通过行列式按行或列分解,将所有含 \(\lambda\) 的式子分离出去)。\(\lambda^{n-1}\) 项的形式为 \(\displaystyle (-\lambda)^{n-1}\sum \lambda_i\) ,对应的行列式形式的特征方程中 \(\lambda^{n-1}\) 的形式为 \(\displaystyle (-\lambda)^{n-1}\sum a_{ii}\) 。
对角矩阵的特征值
对角矩阵的特征值即为对角矩阵的主对角线上的所有元素。
证:
若 \(\boldsymbol{A}\) 为对角矩阵,则 \(\boldsymbol{A}-\lambda\boldsymbol{E}\) 也为对角矩阵,记其主对角线上的元素为 \(a_{ii}-\lambda_i\) ,则特征方程即为 \(\displaystyle \prod (a_{ii}-\lambda_i)=0\) ,因此得证。
矩阵的多项式的特征值
设多项式 \(\displaystyle f(x)=\sum_{i=0}^{m} a_{i}x^i\) ,若 \(\boldsymbol{A}\) 有特征值 \(\lambda\) ,则 \(f(\boldsymbol{A})\) 有特征值 \(f(\lambda)\) 。
注:为了结论的整洁,这里不妨规定 \(\boldsymbol{A}^{0}=\boldsymbol{E}\) ,尽管这个规定的前提是 \(\boldsymbol{A}\) 可逆,但这个结论并不要求可逆。
证明:
设 \(\boldsymbol{A}\) 对应于特征值 \(\lambda\) 的特征向量为 \(\boldsymbol{p}\)(\(\boldsymbol{p}\not = \boldsymbol{0}\)),则有 \(\boldsymbol{Ap}=\lambda\boldsymbol{p}\) ,\(\boldsymbol{A}^2\boldsymbol{p}=\boldsymbol{A}\lambda\boldsymbol{p}=\lambda\boldsymbol{Ap}=\lambda^2\boldsymbol{p}\) ,依次类推,有 \(\boldsymbol{A}^m\boldsymbol{p}=\boldsymbol{A}^{m-1}\lambda\boldsymbol{p}=\lambda\boldsymbol{A}^{m-1}\boldsymbol{p}=...=\lambda^{m}\boldsymbol{p}\) ,再有 \(\boldsymbol{Ep}=\boldsymbol{p}\) ,将这些式子分别附加一个系数,并合并,即有 \((a_0\boldsymbol{E}+a_1\boldsymbol{A}+a_2\boldsymbol{A}^2+...+a_m\boldsymbol{A}^m)\boldsymbol{p}=(a_0+a_1\lambda+a_2\lambda+...+a_m\lambda)\boldsymbol{p}\) ,即得证。
逆矩阵、伴随阵的特征值
若 \(\boldsymbol{A}\) 有特征值 \(\lambda\) ,则 \(\boldsymbol{A}^{-1}\) 有特征值 \(\displaystyle \frac{1}{\lambda}\) ,\(\boldsymbol{A}^{*}\) 有特征值 \(\displaystyle |\boldsymbol{A}|\frac{1}{\lambda}\) ,\(\boldsymbol{A}^T\) 有特征值 \(\lambda\) 。
证:
\(\boldsymbol{Ap}=\lambda\boldsymbol{p}\) 。
两边左侧同乘 \(\boldsymbol{A}^{-1}\) ,即有 \(\boldsymbol{p}=\lambda\boldsymbol{A}^{-1}\boldsymbol{p}\) ,也即 \(\displaystyle \boldsymbol{A}^{-1}\boldsymbol{p}=\frac{1}{\lambda}\boldsymbol{p}\) 。
两边左侧同乘 \(\boldsymbol{A}^{*}\) ,即有 \(|\boldsymbol{A}|\boldsymbol{p}=\lambda \boldsymbol{A}^*\boldsymbol{p}\) ,也即 \(\displaystyle \boldsymbol{A}^*\boldsymbol{p}=\frac{1}{\lambda}|\boldsymbol{A}|\boldsymbol{p}\)
特征值和特征向量的线性无关性
如果矩阵存在一组互不相等的特征值,则这些特征值对应的特征向量线性无关。
证:
数学归纳法
记这些特征值为 \(\lambda_1,\lambda_2,...,\lambda_m\) 。当 \(m=1\) 时,即一个特征值,此时对应有一个向量,而特征向量不为零向量,因此满足条件。现在不妨假设当 \(m=r\) 时,对应的特征向量分别线性无关。则当 \(m=r+1\) 时,记对应的 \(r+1\) 个向量为 \(\boldsymbol{p}_1,\boldsymbol{p}_2,...,\boldsymbol{p}_r,\boldsymbol{p}_{r+1}\) ,不妨假设有 \(\displaystyle \sum_{i=1}^{k+1}x_{i}\boldsymbol{p}_{i}=\boldsymbol{0}\) ,用 \(\boldsymbol{A}\) 左侧乘以上式 ,则有 \(\displaystyle \sum_{i=1}^{k+1}x_{i}\boldsymbol{A}\boldsymbol{p}_{i}=\sum_{i=1}^{k+1}x_{i}\lambda_i\boldsymbol{p}_i=\boldsymbol{0}\) ,消去 \(\boldsymbol{p}_{k+1}\) 项,则有 \(\displaystyle \sum_{i=1}^{k}x_i(\lambda_i-\lambda_{k+1})\boldsymbol{p}_i=\boldsymbol{0}\) ,而由 \(\boldsymbol{p}_1,\boldsymbol{p}_2,...,\boldsymbol{p}_r\) 线性无关,而 \(\lambda_i\not =\lambda_{k+1}\) ,即有 \(x_i=0\) ,也即可以推得这 \(r+1\) 个向量线性无关。
扩展:
不必要性证明:
对特征值和特征向量的定义式的变形 \((\boldsymbol{A}-\lambda\boldsymbol{E})\boldsymbol{p}=\boldsymbol{0}\),如果取 \(\boldsymbol{A}=\boldsymbol{E}\) ,则特征值全为 \(0\) ,此时特征向量所在的向量空间的秩为 \(n-0=n\) ,也即一定存在 \(n\) 个线性无关的特征向量。此即为不必要性的反例。
2.5.2 理解相似矩阵的概念、性质及矩阵可相似对角化的充分必要条件,掌握将矩阵化为相似对角矩阵的方法
矩阵相似
若 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{B}\) ,则称 \(\boldsymbol{B}\) 是 \(\boldsymbol{A}\) 的相似矩阵,或者称 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 相似。
矩阵的相似性具有自反性、对称性和传递性
证明:
由于 \(\boldsymbol{E}^{-1}\boldsymbol{AE}=\boldsymbol{A}\) ,即具有自反性。
左侧通过乘法消去 \(\boldsymbol{P}\) ,则有 \(\boldsymbol{A}=\boldsymbol{PB}\boldsymbol{P}^{-1}=(\boldsymbol{P}^{-1})^{-1}\boldsymbol{B}\boldsymbol{P}^{-1}\) ,也即满足对称性。
设 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{B}\) ,\(\boldsymbol{Q}^{-1}\boldsymbol{BQ}=\boldsymbol{C}\) ,则 \(\boldsymbol{Q}^{-1}(\boldsymbol{P}^{-1}\boldsymbol{AP})\boldsymbol{Q}=\boldsymbol{C}\) ,即 \((\boldsymbol{PQ})^{-1}\boldsymbol{A}(\boldsymbol{PQ})=\boldsymbol{C}\) ,因此具有传递性。
矩阵相似与矩阵的特征值
若矩阵相似,则矩阵具有相同的特征值
注:具有相同的特征值是矩阵相似的必要条件,或者说矩阵相似是矩阵的特征值相同的充分条件。
证明:
充分性证明:
给出 \(\boldsymbol{B}\) 的特征多项式 \(f_{\boldsymbol{B}}(\lambda)=|\boldsymbol{B}-\lambda\boldsymbol{E}|=|\boldsymbol{P}^{-1}\boldsymbol{AP}-\lambda\boldsymbol{P}^{-1}\boldsymbol{EP}|=|\boldsymbol{P}^{-1}||\boldsymbol{P}||\boldsymbol{A}-\lambda\boldsymbol{E}|\) ,由于 \(\boldsymbol{P}\) 可逆,因此 \(f_{\boldsymbol{B}}(\lambda)=0 \Leftrightarrow f_{\boldsymbol{A}}(\lambda)=|\boldsymbol{A}-\lambda\boldsymbol{E}|=0\) ,也即两个矩阵具有相同的特征多项式,也即具有相同的特征值。
非必要性证明:
推论
若矩阵和对角阵相似,则对角阵的主对角线上的元素就是矩阵的特征值。
矩阵对角化的充要条件
矩阵能相似对角化的充分必要条件是矩阵具有 \(n\) 个线性无关的特征向量(或者说矩阵的所有特征向量线性无关)。
证明:
充分性:
记矩阵的所有特征向量组成矩阵 \(\boldsymbol{P}=(\boldsymbol{p}_i)\) ,由特征向量定义有 \(\boldsymbol{A}\boldsymbol{p}_i=\lambda_i\boldsymbol{p}_i\) ,则有 \(\boldsymbol{AP}=\boldsymbol{A}(\boldsymbol{p}_i)=(\lambda_i\boldsymbol{p}_i)=\boldsymbol{P\varLambda}\) ,由于所有特征向量线性无关,因此 \(\boldsymbol{P}\) 可逆,因此即有矩阵能相似对角化。
必要性:
若能够相似对角化,同充分性证明可逆推。
推论:矩阵相似对角化的充分条件是矩阵的特征值互不相等。
充分性:由于特征值互不相等,因此特征向量线性无关,因此必要性得证。
不必要性:直接由特征值不相等是特征向量线性无关的充分不必要条件可证。
2.5.3 掌握实对称矩阵的特征值和特征向量的性质
实对陈阵的特征值为实数
证明:不证。
实对称阵若有两个不想等的特征值,则这两个特征值对应的特征向量正交
证明:
\(\boldsymbol{A}\boldsymbol{p}_1=\lambda_1\boldsymbol{p}_1\) ,\(\boldsymbol{A}\boldsymbol{p}_2=\lambda_2\boldsymbol{p}_2\) ,
\((\boldsymbol{A}\boldsymbol{p}_1)^T=\boldsymbol{p}_1^T\boldsymbol{A}^T=\boldsymbol{p}_1^T\boldsymbol{A}\)
\((\boldsymbol{A}\boldsymbol{p}_1)^T=(\lambda_1\boldsymbol{p}_1)^T=\lambda_1\boldsymbol{p}_1^T\)
即有 \(\boldsymbol{p}_1^T\boldsymbol{A}=\lambda_1\boldsymbol{p}_1^T\)
同理有 \(\boldsymbol{p}_2^T\boldsymbol{A}=\lambda_2\boldsymbol{p}_2^T\)
\(\lambda_1\boldsymbol{p}_1^T\boldsymbol{p}_2=\boldsymbol{p}_1^T\boldsymbol{A}\boldsymbol{p}_2=\boldsymbol{p}_1^T(\boldsymbol{A}\boldsymbol{p}_2)=\boldsymbol{p}_1^T\lambda_2\boldsymbol{p}_2\)
因此 \((\lambda_1-\lambda_2)\boldsymbol{p}_1^T\boldsymbol{p}_2=\boldsymbol{0}\)
因此 \(\boldsymbol{p}_1^T\boldsymbol{p}_2=\boldsymbol{0}\) ,即得证。
实对称阵一定正交相似于以其特征值为主对角元素的对角阵
也即
若有 \(n\) 阶实对称阵 \(\boldsymbol{A}\) ,则必有正交阵 \(\boldsymbol{P}\) ,满足 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{P}^T\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,其中 \(\boldsymbol{\varLambda}\) 是以 \(\boldsymbol{A}\) 的 \(n\) 个特征值为对角元的对角阵。
证明:不证。
推论:若对称阵的特征方程对应的某个特征值是多重根,则该特征值对应有对应重数的个数的线性无关的特征向量。
证:
不妨设 \(\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,即有 \(\boldsymbol{P}^{-1}(\boldsymbol{A}-\lambda\boldsymbol{E})\boldsymbol{P}=\boldsymbol{\varLambda}-\lambda\boldsymbol{E}\) ,也即若 \(\lambda\) 为特征方程的多重根,即 \(\boldsymbol{\varLambda}\) 对角元中有对应重数的值为 \(\lambda\) ,设重数为 \(k\) ,也即对角阵 \(\boldsymbol{\varLambda}-\lambda\boldsymbol{E}\) 的秩为 \(n-k\) ,也即 \(\boldsymbol{A}-\lambda\boldsymbol{E}\) 的特征值为 \(n-k\) ,因此特征向量作为特征方程的解集的秩为 \(n-(n-k)=k\) 。
2.6 二次型
2.6.1 掌握二次型及其矩阵表示,了解二次型秩的概念,了解合同变换与合同矩阵的概念,了解二次型的标准形、规范形的概念以及惯性定理
二次型
含有 \(n\) 个变量 \((x_i)\) 的二次齐次函数 \(\displaystyle f(x_1,x_2,...,x_n)\)
\(\displaystyle=\sum_{i=1,j=1}^{n}a_{ij}x_ix_j\)
\(=a_{11}x_1^2+a_{12}x_1x_2+...+a_{1n}x_1x_n+\)
\(a_{21}x_2x_1+a_{22}x_2^2+...+a_{2n}x_2x_n+\)
\(+...\)
\(+a_{n1}x_nx_1+a_{n2}x_nx_2+...+a_{nn}x_n^2\)
\(=(x_1,x_2,...,x_n)\begin{pmatrix}a_{11}x_1+a_{12}x_2+...+a_{1n}x_{n}\\a_{21}x_1+a_{22}x_2+...+a_{2n}x_n\\...\\a_{n1}x_{1}+a_{n2}x_{2}+...+a_{nn}x_{n}\end{pmatrix}\)
\(=\boldsymbol{x}^T(a_{ij})\boldsymbol{x}\)
\(=\boldsymbol{x}^T\boldsymbol{A}\boldsymbol{x}\)
称为二次型。
注:二次型是一个二次齐次函数;二次型中 \(\boldsymbol{A}\) 是一个对称阵;二次型一定与一个对角元素为对应特征值的对角阵相似;
二次型的秩
二次型中的对称阵 \(\boldsymbol{A}\) 的秩就是二次型的秩。
合同矩阵
若有可逆矩阵 \(\boldsymbol{C}\) ,使 \(\boldsymbol{B}=\boldsymbol{C}^T\boldsymbol{AC}\) ,则称矩阵 \(\boldsymbol{B}\) 与 \(\boldsymbol{A}\) 合同,或者称 \(\boldsymbol{B}\) 是 \(\boldsymbol{A}\) 的合同矩阵。
推论
若 \(\boldsymbol{B}\) 是 \(\boldsymbol{A}\) 的合同矩阵,则 \(\boldsymbol{B}^T\) 是 \(\boldsymbol{A}^T\) 的合同矩阵。
证:
\(\boldsymbol{B}^T=(\boldsymbol{C}^T\boldsymbol{AC})^T=\boldsymbol{C}^T\boldsymbol{A}^T\boldsymbol{C}\)
推论
若 \(\boldsymbol{A}\) 为对称阵,则其合同矩阵也为对称阵。
证明:
\(\boldsymbol{B}^T=(\boldsymbol{C}^T\boldsymbol{AC})^T=\boldsymbol{C}^T\boldsymbol{A}^T\boldsymbol{C}=\boldsymbol{C}^T\boldsymbol{A}\boldsymbol{C}=\boldsymbol{B}\)
注:这个性质首先是从合同矩阵的性质来理解,齐次是可以从矩阵的初等变换的形式来理解,也即使用一个可逆变换矩阵,先按其转置矩阵进行行变换,然后再用该矩阵进行列变换,则变换不改变矩阵的对称性。
二次型 \(f(\boldsymbol{x})=\boldsymbol{x}^T\boldsymbol{A}\boldsymbol{x}\) 的合同对角化
取变换 \(\boldsymbol{x}=\boldsymbol{Cy}\) ,代入则有 \(f(\boldsymbol{x})=\boldsymbol{y}^T\boldsymbol{C}^T\boldsymbol{ACy}\) ,记 \(\boldsymbol{M}=\boldsymbol{C}^T\boldsymbol{AC}\) 为 \(\boldsymbol{A}\) 的一个合同矩阵,因此二次型的对角化实际上就是求一个合同矩阵,并使这个矩阵为对角阵。
由于 \(\boldsymbol{A}\) 为对称阵,因此正交阵 \(\boldsymbol{P}\) ,满足 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{P}^T\boldsymbol{AP}=\boldsymbol{\varLambda}\) ,因此一定有二次型可以合同对角化。
二次型的标准形
若二次型中 \(a_{ij}=0,i\not=j\) ,则称为标准形。
二次型的规范形
若标准形中系数全为 \(1\) ,则称为规范形。
标准形存在定理
通过二次型的合同对角化,不妨记 \(f(\boldsymbol{x})=\boldsymbol{y}^T\boldsymbol{\varLambda}\boldsymbol{y}=a_{11}y_1^2+a_{22}y_2^2+...+a_{nn}y_n^2=\lambda_1y_1^2+\lambda_2y_2^2+...+\lambda_ny_n^2\) 。也即通过合同对角化,就能将二次型变换为标准形。
规范形存在定理
推论:二次型一定可以变换为规范形。
证:在二次型的标准形基础上,简单变换一个比例,即可消去系数,成为规范形。
2.6.2 掌握用正交变换化二次型为标准形的方法,会用配方法化二次型为标准形
二次型化为标准形的配方法
拉格朗日配方法
拉格朗日配方法,每次将二次型中的一个变量合并到一个式子中,合并完成后,注意补充项以使变换矩阵为可逆矩阵,然后根据配方式子得到每个变量的表达式,即可得到变换矩阵。
例子:
\(f=a^2+2b^2+5c^2+2ab+2ac+6bc\)
\(=a^2+2ab+2ac+2b^2+5c^2+6bc\)
\(=(a+b+c)^2-2bc-b^2-c^2+2b^2+5c^2+6bc\)
\(=(a+b+c)^2+b^2+4c^2+4bc\)
\(=(a+b+c)^2+(b+2c)^2\)
取 \(\begin{cases}x=a+b+c\\y=b+2c\end{cases}\) ,补全为可逆矩阵形式为
\(\begin{pmatrix}x\\y\\z\end{pmatrix}=\begin{pmatrix}1&1&1\\0&1&2\\0&0&1\end{pmatrix}\begin{pmatrix}a\\b\\c\end{pmatrix}\) ,记为 \(\boldsymbol{y}=\boldsymbol{Cx}\) ,有 \(\boldsymbol{x}=\boldsymbol{C}^{-1}\boldsymbol{y}\) 。
求得 \(\boldsymbol{C}^{-1}=\begin{pmatrix}1&0&0\\-1&1&0\\1&-2&1\end{pmatrix}^T=\begin{pmatrix}1&-1&1\\0&1&-2\\0&0&1\end{pmatrix}\) ,这就是二次型转换为标准形的可逆变换矩阵。
2.6.3 理解正定二次型、正定矩阵的概念,并掌握其判别法
二次型的所有标准形的系数的正数的个数相等。(惯性定理)
证明:不证。
推论:二次型的所有标准形的系数的负数的个数相等。
证明:由于二次型和标准形相似,因此秩相等。也即对角元素中非零元素的个数相等,而正数系数的个数也相等,因此负数系数的个数也即相等。
二次型的标准形中正系数的个数称为正惯性指数,负系数的个数称为负惯性指数。
正定二次型、负定二次型;正定矩阵、负定矩阵
若对任何非零向量,二次型恒为正,则称为正定二次型,相应的矩阵称为正定矩阵;若二次型恒为负,则称为负定二次型,相应的矩阵称为负定矩阵。
二次型正定的充要条件是其正惯性指数为 \(n\) ;
或者二次型矩阵的特征值全为正;
或者二次型矩阵的各阶主子式为正(负定:奇数阶为负,偶数阶为正):赫尔维茨定理。
证明:
仅就正定的正惯性指数充要条件进行证明。
设二次型为 \(f(\boldsymbol{x})=\boldsymbol{x}^T\boldsymbol{Ax}\) ,有可逆变换 \(\boldsymbol{x}=\boldsymbol{Cy}\) 使 \(\displaystyle f(\boldsymbol{Cy})=\boldsymbol{y}^T\boldsymbol{\varLambda}\boldsymbol{y}=\sum_{i=1}^{n}\lambda_i y_i^2\) 。正惯性指数为 \(n\) 也即 \(\lambda_i>0\) 。
充分性:因为 \(\boldsymbol{x}\not= \boldsymbol{0}\) ,故 \(\boldsymbol{y}\not=\boldsymbol{0}\) ,因此必存在 \(y_k\not= 0\) ,而系数全为正,也即有二次型必为正。
必要性:不妨假设某一个系数不为正,即为零或负值,由惯性定理,则有存在 \(\lambda_k\le 0\) ,此时取 \(\boldsymbol{y}=\boldsymbol{e}_k\) (第 \(k\) 个分量为 \(1\) 的单位向量),则有二次型值为 \(1\times \lambda_k\le 0\) ,与假设矛盾。
3 概率论与数理统计
3.1 随机事件和概率
3.1.1 了解样本空间(基本事件空间)的概念,理解随机事件的概念,掌握事件的关系及运算
随机现象
在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。
概率论与数理统计的学科定位
概率论和数理统计是研究和揭示随机现象统计规律性的数学学科。
随机试验
具有以下三个特点的试验称为随机试验:
(1)可以在相同条件下重复地进行;
(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;
(3)进行一次试验前不能确定哪一个结果会出现;
也即,可重复性,总体可预知,单体不可预知性。
样本空间
随机试验 \(E\) 的所有可能的结果组成的集合称为 \(E\) 的样本空间,记为 \(S\) 。样本空间的元素,也即随机试验 \(E\) 的每个结果,称为样本点。
随机事件
称试验 \(E\) 的样本空间 \(S\) 的子集称为试验 \(E\) 的随机事件,简称事件。
注:严格而言,事件是样本空间中满足某些条件的子集。当 \(S\) 中有不可列的无限个元素时,应该将某些子集排除在外。
注:事件的定义在于对于随机试验,我们常常关注满足某种条件的那些样本点所组成的集合。
必然事件和不可能事件
事件为空集,称为不可能事件
样本空间本身为全集,称为必然事件
事件发生
当且仅当事件的一个样本点出现时,称这个事件发生。
事件包含
事件包含,也即作为集合的事件具有包含关系。
事件 \(A\) 包含事件 \(B\) ,其含义就是若事件 \(B\) 发生,则事件 \(A\) 必然发生。
事件 \(A\) 包含事件 \(B\) ,记为 \(A\subset B\)
事件相等
也即集合相等,或者说两个集合互相包含。
两个事件相等,其含义就是某一个事件发生,则另一个事件一定发生。
两个事件相等,也即两个事件的样本点完全相同。
事件 \(A\) 和事件 \(B\) 相等,记为 \(A=B\)
和事件
也即集合的并。
两个事件至少有一个发生,则两个事件的和事件发生。
两个事件的和事件发生,也即两个事件的并集中有一个样本点出现。
事件 \(A\) 和事件 \(B\) 的和事件,记为 \(A\cup B\)
有限个事件的和事件记为 \(\displaystyle\bigcup_{k=1}^{n}A_k\)
无限可列个事件的和事件记为 \(\displaystyle \bigcup_{k=1}^{\infin}A_k\)
积事件
也即集合的交。
两个事件都发生,则两个事件的积事件发生。
两个事件的积事件发生,也即两个事件的交集中有一个样本点出现。
事件 \(A\) 和事件 \(B\) 的积事件,记为 \(A\cap B\)
有限个事件的积事件记为 \(\displaystyle\bigcap_{k=1}^{n}A_k\)
无限可列个事件的积事件记为 \(\displaystyle \bigcap_{k=1}^{\infin}A_k\)
差事件
也即集合的差。
当且仅当事件 \(A\) 发生,而事件 \(B\) 不发生,事件 \(A\) 与事件 \(B\) 的差事件发生。
事件 \(A\) 与事件 \(B\) 的差事件记为 \(A-B\)
事件互不相容(互斥)
两个事件互斥,也即两个事件不可能同时发生。
即 \(A\cap B=\empty\)
事件对立(互逆)
两个事件对立,也即两个事件仅有一个发生,并且一定有一个事件发生。
即 \(A\cup B=S,A\cap B=\empty\)
\(A\) 的逆事件记为 \(\overline{A}\)
3.1.2 理解概率、条件概率的概念,掌握概率的基本性质,会计算古典型概率和几何型概率,掌握概率的加法公式、减法公式、乘法公式、全概率公式以及贝叶斯公式
频数与频率
在相同的条件下,进行了 \(n\) 次试验,事件 \(A\) 发生的次数 \(n_A\) 称为事件 \(A\) 发生的频数。
\(n_A/n\) 称为事件 \(A\) 的频率,记为 \(f_n(A)=n_A/n\) 。
概率
概率的公理化定义
对随机试验 \(E\) ,其样本空间为 \(S\) ,对随机试验 \(E\) 的每个事件 \(A\) 赋予一个实数,记为 \(P(A)\) ,称为事件 \(A\) 的概率。其中 \(P(A)\) 是一个集合函数,其需要满足三个条件:
(1)非负性
(2)规范性:\(P(S)=1\)
(3)可列可加性:对于两两互不相容的事件 \(A_i\) ,有 \(\displaystyle P(\bigcup_{i=1}^{\infin} A_i)=\sum_{i=1}^{\infin}{P(A_i)}\)
条件概率
设有 \(P(A)>0\) ,称 \(\displaystyle P(B|A)=\frac{P(AB)}{P(A)}\) 为在事件 \(A\) 发生的条件下事件 \(B\) 发生的条件概率。
推论:
条件概率的集合函数也满足概率的集合函数的三个条件,因此也具有概率所具有的一些性质。
不可能事件的概率为 \(0\)
证明:
取 \(A_1=S\) ,\(A_2=A_3=...=\empty\) ,则 \(A_i\) 两两互斥,同时 \(\displaystyle P(\bigcup_{i=1}^{\infin}A_i)=P(S)=\sum_{i=1}^{\infin}P(A_i)=P(S)+\sum_{i=2}^{\infin}P(\empty)\) ,由非负性,故 \(P(\empty)=0\) 。
有限可加性
\(\displaystyle P(\bigcup_{i=1}^{n}A_i)=\sum_{i=1}^{n}P(A_i)\)
证明:
直接取 \(n+1\) 以后的事件为空集,而空集得概率为 \(0\) ,即得证。
事件的包含关系与概率(减法公式)
设两个事件 \(A\) 、\(B\) ,满足 \(A\subset B\) ,也即事件 \(B\) 包含事件 \(A\) ,则有
\(P(B-A)=P(B)-P(A)\) ;\(P(B)\ge P(A)\)
证明:
由集合关系,有 \(A=B\cup (A-B)\) ,再由有限可加性,有 \(P(A)=P(B)+P(A-B)\) ,即证第一个式子,再由非负性,即得证第二个式子。
任意事件的概率不大于 \(1\)
即 \(A\subseteq S\) ,有 \(P(A)\le 1\) 。
证明:
由包含关系,则有 \(P(A)\le P(S)=1\) ,即得证。
逆事件的概率
\(P(\overline{A})=1-P(A)\)
逆事件互斥,也即 \(P(\overline{A}\cup A)=P(A)+P(\overline{A})\) ,即得证。
和事件的概率(加法公式)
\(P(A\cup B)=P(A)+P(B)-P(AB)\)
证明:直接由集合的可列可加性(互斥的事件概率可加)以及减法公式,可证。
推论:任意多个事件的并的概率,等于将这些事件化为互斥事件后的概率的和。
积事件的概率(乘法公式)
\(P(AB)=P(A)P(B|A),P(A)>0\)
证:直接由条件概率的定义得到。
推论:
\(P(ABC)=P(AB)P(C|AB)=P(A)P(B|A)P(C|AB)\)
注:分解时,注意优先将事件的组合分解到非条件型的概率中。
古典型概率
若样本空间中只有有限个元素,并且每个基本事件发生的可能性相同,则这种试验称为等可能概型,也称作古典概型。
几何型概率
基本事件的可能性只与某个几何区域的几何度量有关,则称这种试验称为几何型概率。
样本空间的划分
若样本空间的一组事件相互独立,并且这些事件的和等于样本空间,则称这组事件为样本空间的一个划分。
全概率公式(间接求概率)
设 \(M_i\) 为样本空间 \(S\) 的一个划分,且 \(P(M_i)>0\) ,则
\(\displaystyle P(A)=\sum_{i=1}^n P(A|M_i)P(M_i)\)
证明:
\(\displaystyle \sum_{i=1}^n P(A|M_i)P(M_i)=\sum_{i=1}^n P(AM_i)\) (乘法公式,或者条件概率的定义)
由 \(M_i\) 互斥,故 \(AM_i\) 也互斥,由概率的有限可加性,有
\(\displaystyle \sum_{i=1}^n P(AM_i)=P(\bigcup_{i=1}^{n} AM_i)\)
由集合运算的分配律,有
\(\displaystyle =P(A\bigcup_{i=1}^{n}M_i)=P(AS)=P(A)\) ,即得证。
全概率公式给出了已知事件的一些条件概率的情况下求其概率的方法。
贝叶斯公式(条件概率的逆)
设 \(M_i\) 是样本空间 \(S\) 的一个划分,且 \(P(M_i)>0,P(A)>0\) ,则有
\(\displaystyle P(M_i|A)=\frac{P(AM_i)}{P(A)}=\frac{P(AM_i)}{\displaystyle \sum_{i=1}^{n} P(A)P(M_i|A)}\)
注:贝叶斯公式利用全概率公式对条件概率定义公式的分母进行分解,实现了通过 \(P(A|B)\) 求 \(P(B|A)\) 。
3.1.3 理解事件独立性的概念,掌握事件的关系及运算
事件独立
对两个事件 \(A,B\) ,若有 \(P(AB)=P(A)P(B)\) ,则称事件 \(A,B\) 相互独立,简称独立。
对多个事件,若任取其中几个事件,均满足积事件的概率等于概率的积,则称这些事件相互独立。
事件的独立性表示事件之间不存在相互影响。
注:
(1)事件两两独立,不代表事件相互独立。
例如,从 \(1,2,3,4\) 号球中随机取一个球,记事件 \(A\) 为取 \(1\) 或 \(2\) 号球,事件 \(B\) 为取 \(1\) 或 \(3\) 号球,事件 \(C\) 为取 \(2\) 或 \(3\) 号球,则有 \(\displaystyle P(A)=P(B)=P(C)=\frac{1}{2}\) ,\(\displaystyle P(AB)=P(BC)=P(AC)=\frac{1}{4}\) ,\(P(ABC)=0\) ,也即事件两两独立,但是并不相互独立(例如,其中某两个事件发生了,则另一个事件就一定不会发生,即这两个事件和另一个事件存在关联性)。
(2)独立不互斥,互斥不独立。(独立性和互斥性不同时成立)
不考虑不可能事件,则对相互独立事件,\(P(AB)\not=\empty\) ,即不互斥。
同样,若互斥,则 \(P(AB)=P(\empty)=0\) ,也即不相互独立。
理解:互斥表示某个事件发生,则另一个事件一定不发生;独立表示某个事件发生,从可能性上不影响另一个事件发生;因此若互斥,则通过一个事件的发生就能得到另一个事件是否发生,因此一定不独立,同样若独立,则一个事件发生不能预知另一个事件是否发生,或者说一个事件发生,则另一个事件可能也发生,因此不互斥。
3.2 随机变量及其分布
3.2.1 理解随机变量的概念,理解分布函数 \(F(x)=P\{X\le x\}(-\infin < x < \infin)\) 的概念及性质,会计算与随机变量相联系的事件的概率
随机变量
设随机试验的样本空间为 \(S=\{s_i\}\) ,\(X=X(s_i)\) 是定义在样本空间上的实值单值函数。称 \(X=X(s_i)\) 为随机变量。
注:\(s_i\) 是样本空间上的样本点,\(\{s_i\}\) 是样本点的集合。随机变量 \(X\) 是以样本点为自变量,实数为因变量的函数。随机变量将样本点映射为实数,以便于用数的方法去研究样本点的性质。
注:随机变量是函数,是样本空间的元素的函数。
注:严格来说还要求所有样本点组成的集合具有确定的概率。
分布函数
设 \(X\) 是一个随机变量,\(x\) 是任意实数,函数 \(F(x)=P\{X\le x\},-\infin < x < \infin\) 称为 \(X\) 的分布函数。
注:对于连续型随机变量,由于任一点处的概率为无穷小(可能不严谨),因此 \(F(x)=P\{X\le x\}=P\{X < x\}\) ,但是对于离散型随机变量,其在某点处的概率是存在的,因此为了两者的统一,这里规定了分布函数是左开右闭的。一般写成 \(\le\) 。
分布函数的性质
(1)分布函数是一个不减函数
(2)分布函数的值域为 \([0,1]\)
(3)分布函数的负极限为 \(0\) ,正极限为 \(1\)
(4)分布函数右连续(而不一定左连续)
证明:
(1)由于概率一定为非负值,因此得证。
(2)由于分布函数是一个概率,因此其值域一定为 \([0,1]\) 的一个子集。同时,\(F(x)\) 可以达到两个极限,因此得证。
(3)将随机变量 \(X\) 视作 \(x\) 轴上的值,则分布函数 \(F(x)\) 表示随机变量在点 \(x\) 及其左侧的概率,因此 \(x\rightarrow -\infin\) 时,概率趋近于 \(0\) ,\(x\rightarrow \infin\) 时,概率趋近于 \(1\) 。
(4)以离散型随机变量为例,设某点 \(x_m\) 有 \(P(x_{m})\not =0\) ,则 \(\displaystyle F(x^-)=P\{X\le x^-\}=\sum_{1}^{m-1}P(x_i)\) ,\(F(x^+)=P\{X\le x^+\}=F(x)\) ,因此左不连续,右连续。
3.2.2 理解离散型随机变量及其概率分布的概念,掌握 0-1 分布、二项分布 \(B(n,p)\) 、几何分布、超几何分布、泊松分布 \(P(\lambda)\) 及其应用
离散型随机变量
若随机变量可能取到的值是有限多个或者可列无限多个,则称为离散型随机变量。
离散型随机变量的分布
记式子 \(P\{X=x_k\}=p_k,k=1,2,...\) 为离散型随机变量的分布律。
注:注意写法,\(P(A)\) 表示事件 \(A\) 发生的概率,\(P\{X=k\}\) 表示随机变量取值为 \(k\) 的概率。前者用小括号,是因为事件发生的概率可以看作是一个以事件元素为自变量的函数,后者用大括号,是因为这是一个随机变量取某个值的条件。
\(0-1\) 分布
\(P\{X=1\}=p,P\{X=0\}=1-p\)
伯努利试验
若试验 \(E\) 只有两个可能的结果:\(A,\overline{A}\) ,则称试验 \(E\) 为伯努利试验。
记伯努利试验中事件 \(A\) 发生的次数为随机变量 \(X\) ,并记 \(P\{A\}=p,P\{\overline{A}\}=1-p\) ,则有伯努利试验中事件发生的次数满足 \(0-1\) 分布。
\(n\) 重伯努利试验
将伯努利试验独立重复地进行 \(n\) 次,则称这一连串重复的独立试验为 \(n\) 重伯努利试验。
二项分布
记 \(n\) 重伯努利试验中事件 \(A\) 发生的次数为随机变量 \(X\) ,对于 \(X=k\) ,则 \(n\) 次试验中,有 \(k\) 个试验事件 \(A\) 发生,\(n-k\) 个试验事件 \(A\) 没有发生(\(\overline{A}\) 发生),由独立事件的加法公式和乘法公式,有 \(P\{X=k\}=C_n^k p^k(1-p)^{n-k}\) ,其中 \(C_n^k\) 为 \(n\) 个元素中 \(k\) 个元素的一个组合,且 \(\displaystyle C_n^k=\frac{n!}{(n-k)!k!}\) 。
称 \(n\) 重伯努利试验中事件 \(A\) 发生的次数 \(X\) 服从参数为 \(n,p\) 的二项分布,记为 \(X\sim b(p,n)\) 。
注:记 \(1-p=q\) ,则有 \(P\{X=k\}\) 恰好就是二项式 \((p+q)^n\) 中的 \(p^k\) 项,也因此被称为二项分布。
注:也记为 \(B(p,n)\) 。
二项分布:\(\text{binominal distribution}\)
二项分布的图形:如果不考虑系数,则是一个单调函数(\(p=0.5\) 时为恒值),因此整体上呈现一个两端低,中间高的趋势。二项分布是有限项。
几何分布
记伯努利试验过程中,事件 \(A\) 第一次发生时总共进行的试验次数为 \(X\) ,则有 \(P\{X=k\}=q^{k-1}p\) 。称这个随机变量 \(X\) 满足几何分布。
注:几何分布的概率是一个几何级数中的项。
几何分布的图形:几何分布的概率列是一个等比级数,因此是一个单调减函数。几何分布是无穷项。
超几何分布
从 \(a\) 个白球和 \(b\) 个黑球中取 \(n\) 个球,记其中白球的个数为随机变量 \(X\) ,称这个随机变量 \(X\) 服从超几何分布。
\(\displaystyle P\{X=k\}=\frac{C_{a}^kC_{b}^{n-a}}{C_{a+b}^n}\)
理解:把每个球都当作是不同的球,总的取法是从 \(a+b\) 中取 \(n\) 个球,其中有 \(k\) 个白球的取法是先从 \(a\) 个白球中取 \(k\) 个白球,然后再从 \(b\) 个黑球中取 \(n-k\) 个黑球。
注:超几何分布的概率是一个超几何级数中的项。
注:所谓超几何级数,是指 \(A_{n+1}=A_nf(n)\) ,其中 \(f(n)\) 是一个关于 \(n\) 的多项式。
超几何分布的图形:超几何分布的概率值是一个标准的二项分布图(\(p=0.5\)),因此是一个有限项的两端低,中间高的图形。
泊松定理
对二项分布的概率公式 \(P\{X=k\}=C_n^kp^k(1-p)^{n-k}\) ,设 \(np=\lambda\) ,且 \(\lambda\) 为常数,有
\(\displaystyle \lim_{n\rightarrow \infin}C_n^k p^k(1-p)^{n-k}=\frac{\lambda^k e^{-\lambda}}{k!}\)
证明:当 \(n\rightarrow \infin\) 时,\(\displaystyle P\{X=k\}=\frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}=\frac{n(n-1)...(n-k+1)}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}=\frac{\lambda^k}{k!}(1)(1-\frac{1}{n})...(1-\frac{k-1}{n})(1-\frac{\lambda}{n})^{n-k}\) ,而 \(n\rightarrow \infin\) 时, \(\displaystyle (1-\frac{\lambda}{n})^{n-k}=(1-\frac{\lambda}{n})^n=((1-\frac{\lambda}{n})^{-\frac{n}{\lambda}})^{-\lambda}=e^{-\lambda}\) ,也即得证。
泊松分布
若随机变量 \(X\) 满足 \(\displaystyle P\{X=k\}=\frac{\lambda^k e^{-\lambda}}{k!}\) ,则称这个随机变量满足泊松分布。
泊松分布记为 \(X\sim \pi(\lambda)\)
理解:有泊松定理的条件 \(np=\lambda\) ,也即如果无穷多次伯努利试验中事件 \(A\) 的发生次数的期望是一个定值,则无穷多次试验中事件 \(A\) 总的发生次数就服从泊松分布。
理解:如果二项分布的次数很多,而事件 \(A\) 发生的概率比较小,则二项分布的图形就接近泊松分布。
理解:比如衰变,我们知道统计上大量的衰变具有一个稳定的半衰期,也即满足泊松分布的条件(数量很大,并且每一个半衰期衰变的数量是一个定值),那么在一个半衰期内,衰变的原子的数量就基本符合泊松分布。
3.2.3 了解泊松定理的结论和应用条件,会用泊松分布近似表示二项分布
3.2.4 理解连续型随机变量及其概率密度的概念,掌握均匀分布 \(U(a,b)\) 、正态分布 \(N(\mu,\sigma ^2)\) 、指数分布及其应用,其中参数为 \(\lambda(\lambda > 0)\) 的指数分布 \(E(\lambda)\) 的概率密度为 \(f(x)=\begin{cases}\lambda e^{-\lambda x}, & x>0\\ 0, & x\le 0\end{cases}\)
连续型随机变量
对于随机变量 \(X\) 的分布函数 \(F(x)\) ,如果存在非负可积函数 \(f(x)\) ,有 \(\displaystyle F(x)=\int_{-\infin}^x f(t)\text{d}t\) ,则称随机变量 \(X\) 为连续型随机变量,\(f(x)\) 称为随机变量 \(X\) 的概率密度函数,简称概率密度。
注:与离散型随机变量不同,连续性随机变量是无限不可列的。
注:由连续型随机变量的定义可知,该变量在某一个点上的概率为 \(0\) 。
概率密度与概率之间的关系
在某一个点的邻域,由函数和原函数之间的关系有 \(\displaystyle f(x)=\lim_{\Delta x\rightarrow 0^+}\frac{F(x+\Delta x)-F(x)}{\Delta x}\) ,也即有 \(P\{x<X\le x+\Delta x\}=f(x)\Delta x\) 。
在某一个区间,\(\displaystyle P\{a<x\le b\}=F(b)-F(a)=(\int_{-\infin}^b -\int_{-\infin}^{a})f(t)\text{d}t=\int_{a}^{b}f(t)\text{d}t\)
结合概率的基本性质,有以下推论:
推论:概率密度不为负值。
推论:\(\displaystyle \int_{-\infin}^{+\infin} f(t)\text{d}t = 1\) 。
均匀分布
若概率密度在某一区间上是一个常数,则称为均匀分布。
特征:
记区间为 \((a,b)\) ,则由概率性质有 \(\displaystyle \int_a^b f(t)\text{d}t=f(t)(b-a)=1\) ,即 \(\displaystyle f(t)=\frac{1}{b-a}\) 。
称 \(X\) 在区间 \((a,b)\) 上服从均匀分布,记为 \(X\sim U(a,b)\) 。
均匀分布:\(\text{uniform distribution}\)
指数分布
若概率密度具有 \(f(t)=\begin{cases}c_1e^{c_2x},&x>0\\0,&x\le 0\end{cases}\) 的形式,则称为指数分布。
特征:
显然,\(c_1>0,c_2<0\) ,\(\displaystyle \int_{0}^{+\infin}f(t)\text{d}t=\frac{c_1}{c_2}e^{c_2x}|_{0}^{+\infin}=-\frac{c_1}{c_2}=1\) ,也即 \(c_1=-c_2\) 。
取 \(\displaystyle c_1=\lambda,\lambda > 0\) ,则 \(x>0\) 时,\(\displaystyle f(t)=\lambda e^{-\lambda x}\) 。
此时,\(\lambda\) 越大,则概率下降越陡,\(\theta\) 越小,则概率下降越平缓。
称随机变量 \(X\) 服从参数为 \(\lambda\) 的指数分布。
注:这里对参数的规定和《概率论和数理统计 浙江大学 第四版》教材中的规定不一致。
指数分布的无记忆性
无记忆性是指 \(P(X>t)=P(X>t+a|X>a)\) 。
以 \(X\) 表示元件的寿命,则元件能使用 \(t\) 小时的概率和元件经过 \(a\) 小时之后继续使用 \(t\) 小时的概率相等。
相反,如果一个连续型随机变量具有无记忆性的性质,则可以尝试推断该连续型随机变量服从指数分布。
正态分布
若连续型随机变量 \(X\) 的概率密度为 \(\displaystyle f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, -\infin < x < +\infin\) ,则称 \(X\) 服从参数为 \(\mu,\sigma\) 的正态分布或高斯分布,记为 \(X\sim N(\mu,\sigma^2)\) 。
正态分布:\(\text{normal distribution}\)
高斯分布:\(\text{Gaussian distribution}\)
概率密度函数特征:
(1)函数图形关于 \(x=\mu\) 对称,并且在 \(x=\mu\) 处取得最大值。
(2)\(\sigma^2\) 表示随机变量的方差,值越大,则函数图形越平坦,值越小,则函数图形越陡峭。
(3)\(x\) 越远离 \(\mu\) ,函数的值越小。
(4)函数和 \(x\) 轴围成的面积始终为 \(1\) 。
标准正态分布
若 \(X\sim N(0,1)\) ,则称 \(X\) 服从标准正态分布。
标准正态分布的概率密度和分布函数分别表示为 \(\varphi(x),\varPhi(x)\) 。
\(\displaystyle \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\)
\(\varPhi(x)\) 可以通过编制的函数表查询。\(\varPhi(0.5)=0.5\)
一般正态分布和标准正态分布的变换
若 \(X\sim N(\mu,\sigma^2)\) ,则 \(\displaystyle Y=\frac{X-\mu}{\sigma}\sim N(0,1)\) 。
证明:
\(\displaystyle P(Y \le y)=P(\frac{X-\mu}{\sigma} \le y)=P( X \le \sigma y+\mu )=\int_{-\infin}^{\sigma y+\mu} f(x)\text{d}x=\int_{-\infin}^{\sigma y+\mu} \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\text{d}x\)
取积分变换为 \(\displaystyle t=\frac{x-\mu}{\sigma}\) ,则有
\(\displaystyle P(Y \le y)=\int_{-\infin}^{t}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{t^2}{2}}\sigma\text{d}\text{t}=\int_{-\infin}^{t}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}\text{d}t=\int_{-\infin}^{t}\varphi(x)\text{d}t=\varPhi(t)\)
\(3\sigma\) 法则
取 \(Y\sim N(0,1)\) ,则 \(X=\sigma Y+\mu \sim N(\mu,\sigma)\) ,则有
\(\varPhi(3)-\varPhi(-3)=P(X\le 3\sigma+\mu)-P(X\le -3\sigma+\mu)=P(-3\sigma+\mu\le 3\sigma+\mu)=99.74\%\)
也即对于一般正态分布,随机变量落在期望值左右 \(3\sigma\) 的区间内是一个大概率事件。
标准正态分布的上 \(\alpha\) 分位点
若 \(X\sim N(0,1)\) ,且 \(P(X>z_\alpha)=\alpha\) ,则称 \(z_\alpha\) 为标准正态分布的上 \(\alpha\) 分位点。
3.2.5 会求随机变量函数的分布
随机变量的函数的分布
记 \(Z=f(X)\) ,其中 \(X\) 为随机变量,则 \(Z\) 称为随机变量 \(X\) 的函数,相应的 \(Z\) 的分布即为随机变量 \(X\) 的函数的分布。
随机变量函数分布的求法
设随机变量 \(X\) 具有概率密度 \(f_X(x),-\infin<x<+\infin\) ,又设函数 \(g(x)\) 处处可导且恒有 \(g'(x)>0\) (或恒有 \(g'(x)<0\)),则 \(Y=g(X)\) 也是连续型随机变量,其概率密度为
\(f_Y(y)=\begin{cases}f_X(h(y))|h'(y)|,&\alpha<y<\beta\\0,&其它\end{cases}\) ,其中 \(h(y)\) 为 \(g(x)\) 的反函数。
证:
先求概率分布,然后通过求导得到概率密度。
\(P(Y\le y)=P(g(X)\le y)\) ,不妨设条件中 \(g'(x)>0\) ,则有 \(g(X)\le y \Leftrightarrow X\le h(y)\) ,也即 \(P(Y\le y)=P(X\le h(y))\) ,表示成分布函数的形式,则有 \(F_Y(y)=F_X(h(y))\) ,两边同时对 \(y\) 求导,则有 \(f_Y(y)=f_X(h(y))h'(y)\) 。
再设 \(g'(x)<0\) ,则有 \(P(Y<y)=P(X>h(y))=1-P(X<h(y))\) ,也即有 \(F_Y(y)=1-F_X(h(y))\) ,求导得 \(f_Y(y)=-f_X(h(y))h'(y)\) ,综合,即得证。
3.3 多维随机变量及其分布
3.3.1 理解多维随机变量的概念,理解多维随机变量的分布的概念和性质,理解二维随机变量的概率分布、边缘分布和条件分布,理解二维连续型随机变量的概率密度、边缘密度和条件密度,会求与二维随机变量相关事件的概率
二维随机变量
设 \(E\) 是一个随机试验,其样本空间是 \(S=\{e\}\) ,设 \(X=X(e)\) 和 \(Y=Y(e)\) 是定义在样本空间 \(S\) 上的两个随机变量,由它们构成的一个向量 \((X,Y)\) ,叫做二维随机向量或者二维随机变量。
相应地,单独的一个随机变量称为一维随机变量,样本空间上的多个随机变量构成的向量称为多维随机变量。
二维随机变量的分布函数
对二维随机变量 \((X,Y)\) ,称二元函数 \(F(x,y)=P\{(X\le x)\land (Y\le y)\}\) 为二维随机变量 \((X,Y)\) 的分布函数。记为 \(F(x,y)=P(X\le x,Y\le y)\) 。也称为随机变量 \(X\) 和 \(Y\) 的联合分布函数。
注:如果将两个随机变量分别对应两个坐标轴,即一个二维随机变量对应一个平面上的点,则二维随机变量的分布函数在 \((x,y)\) 处的函数值即为这个点对应的第三象限的概率。
二维随机变量的分布函数的性质
(1)是一个不减函数
(2)\(F(+\infin,+\infin)=1\) ,任意一个参数为 \(-\infin\) 时函数值为 \(0\)
(3)分布函数右连续,左不一定连续
(4)用分布函数计算得到的任意一块区域的概率为非负值。
二维离散型随机变量
若二维随机变量全部可能取到的值是有限对或者可列无限多对,则称二维随机变量为离散型随机变量。
二维离散型随机变量的分布律
称 \(P(X=x_i,Y=y_i)=p_{ij}\) 为二维离散型随机变量 \((X,Y)\) 的分布律。
二维连续型随机变量的概率密度
若二维随机变量 \((X,Y)\) 有分布函数 \(F(x,y)\) ,且存在非负可积函数 \(f(x,y)\) 满足
\(\displaystyle F(x,y)=\int_{-\infin}^{y}\int_{-\infin}^{x}f(u,v)\text{d}u\text{d}v\)
\(f(x,y)\) 称为二维连续性随机变量 \((X,Y)\) 的概率密度,或者称为随机变量 \(X\) 和 \(Y\) 的联合概率密度。
二维随机变量的概率和概率密度之间的关系
设 \(G\) 是 \(xOy\) 平面上的一个区域,则点 \((X,Y)\) 落在区域 \(G\) 内的概率为
\(\displaystyle P\{(X,Y)\in G\}=\underset{G}{\iint} f(x,y)\text{d}s\)
证明:不证。
注:如果 \(X,Y\) 满足一定的条件,且该条件对应于平面上的一个区域,那么根据这个性质就可以得到满足这个条件的概率。
二维连续型随机变量的概率密度和概率分布之间的关系
\(P\{x<X \le x+\Delta x,y<Y \le y+\Delta y\}=f(x,y)\Delta x\Delta y\)
证明:
\(\displaystyle \frac{P\{x<X \le x+\Delta x,y<Y \le y+\Delta y\}}{\Delta x\Delta y}\)
\(\displaystyle =\frac{F(x+\Delta x,y+\Delta y)-F(x+\Delta x,y)-F(x,y+\Delta y)+F(x,y)}{\Delta x\Delta y}\) (由分布函数的定义)
\(\displaystyle =\frac{F_x(x+\Delta x,y)\Delta y-F_x(x,y)\Delta y}{\Delta x\Delta y}\)
\(\displaystyle =\frac{\partial ^2F(x,y)}{\partial x\partial y}=f(x,y)\) (由二维连续型随机变量的定义)
二维随机变量的边缘分布函数
对于二维随机变量 \((X,Y)\),其中的 \(X,Y\) 分别都是随机变量,有各自的分布函数,称为二维随机变量的分布函数,依次记为 \(F_X(x),F_Y(y)\)。
由随机变量的值的取值范围可知 \(F_X(x)=P\{X<x,Y<+\infin\}=F_X(x,+\infin)\)
二维离散型随机变量的边缘分布函数即为边缘分布律,如 \((X,Y)\) 关于 \(X\) 的边缘分布律为 \(p_{i.}\) ,且有 \(\displaystyle p_{i.}=\sum_{j=1}^\infin p_{ij}\) ,其中 \(p_{ij}=P\{X=x_i,Y=y_j\}\) 。
二维连续型随机变量的边缘分布函数即为边缘概率密度,\(\displaystyle F_X(x)=F_X(x,+\infin)=\int_{-\infin}^{x}\int_{-\infin}^{+\infin}f(x,y)\text{d}y\text{d}x\) ,也即 \(\displaystyle f_X(x)=\int_{-\infin}^{+\infin}f(x,y)\text{d}y\)
离散型随机变量的条件分布律
称 \(P\{X=x_i|Y=y_j\}\) 为 \(Y=y_i\) 条件下随机变量 \(X\) 的条件分布律。
其中,\((X,Y)\) 是二维离散型随机变量,且假设 \(P(Y=y_i)>0\)。
连续型随机变量的条件概率密度
在 \(Y=y\) 条件下连续型随机变量的概率密度记为 \(f_{X|Y}\) ,且有 \(\displaystyle f_{X|Y}=\frac{f(x,y)}{f_Y(y)}\) 。
推导:
虽然这是连续型随机变量的条件概率密度的定义,但是其和离散型条件变量的条件概率具有一致性。
先给出条件分布函数,然后对条件分布函数求导,即得条件概率密度。
\(\displaystyle P(X \le x|Y=y)=\lim_{\varepsilon \rightarrow 0}P(X<x|y<Y<y+\varepsilon)\)
\(\displaystyle =\lim_{\varepsilon \rightarrow 0}\frac{P\{X<x,y<Y<y+\varepsilon\}}{y<Y<y+\varepsilon}\)
\(\displaystyle =\lim_{\varepsilon \rightarrow 0}\frac{\displaystyle \int_{-\infin}^{x}\int_{y}^{y+\varepsilon}f(x,y)\text{d}y\text{d}x}{\displaystyle \int_{-\infin}^{+\infin}\int_{y}^{y+\varepsilon}f(x,y)\text{d}y\text{d}x}\)
\(\displaystyle =\lim_{\varepsilon \rightarrow 0}\frac{\displaystyle \varepsilon \int_{-\infin}^{x}f(x,y)\text{d}x}{\varepsilon f_Y(y)}\)
关于 \(x\) 求导,即有条件概率密度为 \(\displaystyle f_{X|Y}=\frac{f(x,y)}{f_Y(y)}\)
3.3.2 理解随机变量的独立性及不相关性的概念,掌握随机变量相互独立的条件
相互独立的随机变量
对二维随机变量 \((X,Y)\) ,若有 \(P\{X \le x,Y \le y\}=P\{X \le x\}P\{Y \le y\}\) ,也即 \(F(x,y)=F_X(x)F_Y(y)\) ,则称随机变量 \(X\) 和 \(Y\) 是相互独立的。
注:这个定义实际上是在定义两个随机变量的独立性。(而不是两个二维随机变量的独立性)
注:
二维随机变量的独立性定义和事件的独立性定义是统一的:
对离散型随机变量,有 \(\displaystyle P\{\bigcup_{i=1}^{m}X=x_i , \bigcup_{i=1}^{n}Y=y_i\}=P\{\bigcup_{i=1}^{m}X=x_i\}P\{\bigcup_{i=1}^{n}Y=y_i\}\)
为了书写简便,这里记为 \(P(\sum m,\sum n)=P(\sum m)P(\sum n)\) ,
由概率的基本性质有 \(P(m,n)=P(\sum m,\sum n)-P(\sum m,\sum n-1)-P(\sum m-1, \sum n)+P(\sum m-1, \sum n-1)\) ,
利用定义进行分解,有
\(P(m,n)=P(\sum m)P(\sum n)-P(\sum m)P(\sum n-1)-P(\sum m-1)P(\sum n)+P(\sum m-1)P(\sum n-1)=P(\sum m)P(n)-P(\sum m-1)P(n)=P(m)P(n)\) ,
即离散型随机变量的独立性和事件的独立性的定义是一致的。
对连续型随机变量,直接对概率分布求导,有 \(\displaystyle \frac{\partial ^2 F(x,y)}{\partial x\partial y}=f_X(x)f_Y(y)=f(x,y)\) 。
也即连续型随机变量的独立性和事件的独立性的定义也是一致的。(这里事件理解为连续型随机变量在某一个极小区间内)
注:\(f_X(x)f_Y(y)=f(x,y)\) 同时也是连续型随机变量独立性的等价定义。
定义推广:多个随机变量相互独立
若 \(n\) 维随机变量满足 \(F(x_1,x_2,...,x_n)=F_{X_1}(x_1)F_{X_2}(x_2)...F_{X_n}(x_n)\) ,则称 \(X_1,X_2,...,X_n\) 是相互独立的。
定义推广:多维随机变量相互独立
若 \(F(x_1,x_2,...,x_n,y_1,y_2,...,y_m)=F_1(x_1,x_2,...,x_n)F_2(y_1,y_2,...,y_m)\) ,其中 \(F,F_1,F_2\) 分别为 \((X_i,Y_i),(X_i),(Y_i)\) 的分布函数,则称这两个多维随机变量相互独立。
注:注意这些定义的形式。
推论:
多维随机变量相互独立,则其函数也相互独立。即若多维随机变量 \((X_i)\) 和 \((Y_i)\) 相互独立,则 \(X_i\) 和 \(Y_i\) 相互独立;若 \(h,g\) 是连续函数,则也有 \(h((X_i))\) 和 \(g((Y_i))\) 相互独立。
证明:不证。
3.3.3 掌握二维均匀分布,了解二维正态分布 \(N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\) 的概率密度,理解其中参数的概率意义
二维均匀分布
对二维随机变量 \((X,Y)\) ,若其概率密度 \(f(x,y)\) 是一个常数,则其分布为二维均匀分布。
二维正态分布
若二维随机变量 \((X,Y)\) 的概率密度函数为
\(\displaystyle f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2 \sqrt{1-\rho^2}} \exp \{\frac{-1}{2(1-\rho)^2}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\}\)
则称二维随机变量为服从参数 \(\mu_1,\mu_2\,\sigma_1,\sigma_2,\rho\) 的二维正态分布,记为 \((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\) 。
可以解得,\(\displaystyle f_X(x)=\int_{-\infin}^{+\infin} f(x,y)\text{d}y=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\) ,也即二维正态分布的边缘分布也是一个正态分布。
注:注意边缘分布中消去了参数 \(\rho\) ,这说明由边缘分布,是不能确定联合分布的。
二维正态分布的参数的含义
\(E(X)=\mu_1,E(Y)=\mu_2,D(X)=\sigma_1,D(Y)=\sigma_2,\rho_{XY}=\rho\)
3.3.4 会求两个随机变量简单函数的分布,会求多个相互独立随机变量简单函数的分布
\(Z=X+Y\) 的分布
已知二维随机变量 \((X,Y)\) 是二维连续型随机变量,且具有联合概率密度 \(f(x,y)\) 。
\(\displaystyle F_Z(z)=P\{X+Y \le z\}=\underset{x+y<z}{\iint} f(x,y)\text{d}x\text{d}y=\int_{-\infin}^{+\infin}\int_{-\infin}^{z-x}f(x,y)\text{d}y\text{d}x\)
当 \(y=z-x\) 时,取 \(u=y+x\) ,即可替换积分限,有
\(\displaystyle F_Z(z)=\int_{-\infin}^{+\infin}\int_{-\infin}^{z}f(u-y,y)\text{d}u\text{d}x\)
注意此时内侧积分和外侧积分没有变量关联,即可交换积分限,有
\(\displaystyle F_Z(z)=\int_{-\infin}^{z}\int_{-\infin}^{+\infin}f(u-y,y)\text{d}x\text{d}u\)
联系概率分布和概率密度的定义,有
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f(z-y,y)\text{d}y\)
将二重积分化为累次积分时,取另一种转化方式,则有
\(\displaystyle F_Z(z)=\int_{-\infin}^{+\infin}\int_{-\infin}^{z-y}f(x,y)\text{d}x\text{d}y\) ,按相同的方法,可以得到
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f(x,z-x)\text{d}x\)
综合有
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f(z-y,y)\text{d}y=\int_{-\infin}^{+\infin} f(x,z-x)\text{d}x\)
卷积公式
对 \(Z=X+Y\) ,若 \(X,Y\) 相互独立,则
\(\displaystyle f_{Z}(z)=\int_{-\infin}^{+\infin} f_X(z-y)f_Y(y)\text{d}y=\int_{-\infin}^{+\infin} f_X(x)f_Y(z-x)\text{d}x\)
称为 \(f_X(x),f_Y(y)\) 的卷积公式,记为 \(f_X * f_Y\) 。
或者说,两个独立的随机变量 \(X,Y\) 的和 \(X+Y\) 的概率密度是这两个随机变量各自的概率密度的卷积。
有限个相互独立的正态随机变量的线性组合仍然服从正态分布。
\(\displaystyle Z=\frac{Y}{X},Z=XY\) 的分布
先上结论,然后对结论进行简单推导
\(\displaystyle f_{Y/X}(z)=\int_{-\infin}^{+\infin}|x|f(x,xz)\text{d}x\)
\(\displaystyle f_{XY}(z)=\int_{-\infin}^{+\infin}\frac{1}{|x|}f(x,z/x)\text{d}x\)
推导:
对 \(Z=XY\) ,
\(\displaystyle F_Z(z)=\{XY\le z\}=\int_{-\infin}^{0}\int_{z/x}^{+\infin}f(x,y)\text{d}y\text{d}x+\int_{0}^{+\infin}\int_{-\infin}^{z/x}f(x,y)\text{d}y\text{d}x\)
当 \(y=z/x\) 时,取 \(u=yx\) ,则有
\(\displaystyle F_Z(z)=\int_{-\infin}^{0}\int_{z}^{-\infin} f(x,u/x)\text{d}(u/x)\text{d}x+\int_{0}^{+\infin}\int_{-\infin}^{z}f(x,u/x)\text{d}(u/x)\text{d}x=\int_{-\infin}^{0}\frac{1}{x}\int_{-\infin}^{z} -f(x,u/x)\text{d}u\text{d}x+\int_{0}^{+\infin}\frac{1}{x}\int_{-\infin}^{z}f(x,u/x)\text{d}u\text{d}x=\int_{-\infin}^{+\infin}\frac{1}{|x|}\int_{-\infin}^{z}f(x,u/x)\text{d}u\text{d}x=\int_{-\infin}^{z}\int_{-\infin}^{+\infin}\frac{1}{|x|}f(x,u/x)\text{d}x\text{d}u\)
由概率分布和概率密度的定义,即得证。
注:以上求两个随机变量的分布时,并不要求独立。
\(Z=max(X,Y),Z=min(X,Y),Z=max(X_i),Z=min(Y_i)\) 的分布
\(F_{max}(z)=P\{max(X,Y)\le z\}=P\{X\le z,Y\le z\}\)
假设 \(X,Y\) 相互独立,则有 \(F_{max}(z)=F_X(z)F_Y(z)\)
\(F_{min}(z)=P\{min(X,Y)<z\}=1-P\{min(X,Y)\ge z\}=1-P\{X\ge z,Y\ge z\}\)
假设 \(X,Y\) 相互独立,则有 \(F_{min}(z)=1-(1-F_X(z))(1-F_Y(z))\)
3.4 随机变量的数字特征
3.4.1 理解随机变量的数字特征(数学期望、方差、标准差、矩、协方差、相关系数)的概念,会运用数字特征的基本性质,并掌握常用分布的数字特征
数学期望
对离散型随机变量 \(X\),若其分布律为 \(P\{X=x_k\}=p_k\) ,且级数 \(\displaystyle \sum_{i=1}^{\infin}p_ix_i\) 绝对收敛,则称级数的和为随机变量 \(X\) 的数学期望,记为 \(E(X)\) ,即有 \(\displaystyle E(X)=\sum_{i=1}^{\infin}p_ix_i\) 。
对连续型随机变量 \(X\),若其概率密度为 \(f(x)\) ,且积分 \(\displaystyle \int_{-\infin}^{+\infin}xf(x)\text{d}x\) 绝对收敛,则称积分为连续性随机变量 \(X\) 的数学期望,即有 \(\displaystyle E(X)=\int_{-\infin}^{+\infin} xf(x)\text{d}x\) 。
注:从含义上来讲,随机变量的数学期望就是随机变量的平均值。
注:数学期望的定义都使用了绝对收敛的概念。首先,如果收敛而不绝对收敛,对于离散型随机变量,可以通过调整序列的顺序和组合方式,使得序列变得不收敛,这不符合数学期望的客观含义(平均值应该是不变的)。对于离散型随机变量,更有函数可积当且仅当其绝对值可积。
随机变量的函数的数学期望
离散型随机变量的函数的数学期望
对离散型随机变量 \(X\) ,其分布律为 \(P\{X=x_i\}=p_i\) ,设 \(Y=g(X)\) ,\(g\) 是连续函数,且 \(\displaystyle \sum_{i=1}^{\infin}g(x_i)p_i\) 绝对收敛,则有 \(\displaystyle E(Y)=E(g(X))=\sum_{i=1}^{\infin}g(x_i)p_i\) 。
连续型随机变量的函数的数学期望
对连续型随机变量 \(X\) ,其概率密度为 \(f(x)\) ,设 \(Y=g(X)\) ,\(g\) 是连续函数,且 \(\displaystyle \int_{-\infin}^{+\infin}g(x)f(x)\text{d}x\) 绝对收敛,则有 \(\displaystyle E(Y)=E(g(X))=\int_{-\infin}^{+\infin}g(x)f(x)\text{d}x\) 。
记忆:离散型随机变量和连续型随机变量的数学期望的定义式,可以看作函数是 \(g(x)=x\) 的期望。也即要求随机变量的函数的期望,只需要将定义式中的 \(x\) 改为对应的 \(g(x)\) 即可。
注意:和随机变量的函数的概率密度求法中不同,求随机变量的期望的时候,并不需要函数单调。也可以理解为结果中并没有出现反函数。
完整的证明不证。函数单调是一个更为严格的条件,在这个条件下对连续型随机变量可以简单证明:
假设 \(g'(x)>0\) ,且有反函数 \(x=h(y)\) ,则有 \(Y=g(X)\) 的概率密度为 \(f_Y(x)=f_X(h(x))|h'(x)|\) ,因此有其数学期望为 \(\displaystyle E(Y)=\int_{-\infin}^{+\infin}yf_Y(y)\text{d}y=\int_{-\infin}^{+\infin}yf_X(h(y))h'(y)\text{d}y\) ,由 \(y=g(x),x=h(y)\) ,故有 \(\displaystyle E(Y)=\int_{-\infin}^{+\infin}g(x)f(x)\text{d}x\) 。
二维随机变量的函数的数学期望
设 \(Z=g(X,Y)\) ,\(g\) 是连续函数
若 \(Z\) 是连续型随机变量,且 \(X,Y\) 有联合概率密度 \(f(x,y)\) ,则有 \(\displaystyle E(Z)=E(g(X,Y))=\int_{-\infin}^{+\infin} \int_{-\infin}^{+\infin} g(x,y)f(x,y)\text{d}x\text{d}y\) 。
证明:不证,记住这个形式。
数学期望的几个运算性质
\(E(C)=C\)
证:常数可以看作是离散型随机变量,且分布律为 \(P(X=C)=1\) ,因此 \(E(X)=CP\{X=C\}=C\) 。
注:期望是随机变量的期望,因此这里直接对常数求期望可以理解为一种记法。
\(E(CX)=CE(X)\)
证:理解为随机变量的函数的期望,以连续型随机变量为例,即 \(\displaystyle E(CX)=\int_{-\infin}^{+\infin}Cf(x)\text{d}x=CE(X)\) ,即得证。
\(E(X+Y)=E(X)+E(Y)\)
证:由二维随机变量的函数的期望,只证连续型随机变量,有 \(\displaystyle E(X+Y)=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}(x+y)f(x,y)\text{d}x\text{d}y=\int_{-\infin}^{+\infin}\int_{-\infin}^{\infin}xf(x,y)\text{d}x\text{d}y+\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}yf(x,y)\text{d}x\text{d}y\) ,对第一个式子,先对 \(y\) 积分,即为 \(\displaystyle A=\int_{-\infin}^{+\infin}x\int_{-\infin}^{+\infin}f(x,y)\text{d}y\text{d}x=\int_{-\infin}^{+\infin}xf_X(x)\text{d}x=E(X)\) ,对第二个式子类似,即得证。
推广:若函数只包含加减以及常数乘法,则随机变量的函数的期望就是随机变量的期望的函数,对一个随机变量成立,对多个随机变量也成立。
\(E(XY)=E(X)E(Y)\) ( \(X,Y\) 相互独立)
证:由二维随机变量的函数的期望,只证连续型随机变量,有 \(\displaystyle E(XY)=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf(x,y)\text{d}x\text{d}y\) ,由相互独立,有 \(f(x,y)=f_X(x)f_Y(y)\) ,即 \(\displaystyle E(XY)=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf_X(x)f_Y(y)\text{d}x\text{d}y=\int_{-\infin}^{+\infin}xf_X(x)\int_{-\infin}^{+\infin}yf_Y(y)\text{d}y\text{d}x=E(X)E(Y)\) 。
方差
方差是随机变量偏离其均值的偏离程度的均值,记为 \(D(X)\) ,即 \(D(X)=E((X-E(X))^2)\) 。
推论:
\(D(X)=E((X-E(X))^2)=E(X^2-2XE(X)+E^2(X))=E(X^2)-2E^2(X)+E^(X)=E(X^2)-E^2(X)\) 。
标准差
方差开方即为标准差,记为 \(\sigma(X)\) ,有 \(\sigma(X)=\sqrt{D(X)}=E(|X-E(X)|)\) 。
随机变量的函数的方差
通过方差的定义式计算即可,如对 \(Z=g(X)\) ,有 \(D(Z)=E(Z^2)-E^2(Z)=E(g^2(Z))-E^2(g(Z))\) 。
方差的几个运算性质
\(D(C)=0\)
证:\(D(C)=E(C^2)-E^2(C)=C^2-C^2=0\) 。
\(D(CX)=C^2D(X)\)
证:\(D(CX)=E(C^2X^2)-E^2(CX)=C^2E(X^2)-C^2E^2(X)=C^2D(X)\) 。
\(D(X+Y)=D(X)+D(Y)+2E((X-E(X))(Y-E(Y)))\)
证:\(D(X+Y)=E(((X+Y)-E(X+Y))^2)=E((X-E(X)+Y-E(Y))^2)=E((X-E(X))^2)+E((Y-E(Y))^2)+E(2(X-E(X))(Y-E(Y)))=D(X)+D(Y)+2E(X-E(X))(Y-E(Y))\)
注:
这里还有另一种变形方法:\(D(X+Y)=E((X+Y)^2)-E^2(X+Y)=E(X^2+2XY+Y^2)-(E(X)+E(Y))^2=E(X^2)-E^2(X)+E(Y^2)-E^2(Y)+2(E(XY)-E(X)E(Y))=D(X)+D(Y)+2(E(XY)-E(X)E(Y))\)
第一种变形再进一步分解,即得到第二种变形的结果。
若 \(X,Y\) 相互独立,则
\(D(X+Y)=D(X)+D(Y)\)
证:由于 \(X,Y\) 相互独立时,\(E(XY)=E(X)E(Y)\) ,结合上一个结论,即得证。
\(D(X)=0 \Leftrightarrow P\{X=E(X)\}=1\)
充分性:
由 \(P\{X=E(X)\}=1\) ,故有 \(P\{X^2=E^2(X)\}=1\) ,即 \(E(X^2)=E^2(X)\) ,即 \(D(X)=0\) 。
必要性:
反证法:设 \(D(X)=0\) ,且 \(P\{X=E(X)\}< 1\) ,也即有 \(P\{X\not = E(X)\}\not =0\) ,即有 \(P\{|X-E(X)|>0\}>0\) ,这里不妨确定一个极小的数 \(\varepsilon\) ,同样满足 \(P\{|X-E(X)|>\varepsilon\}>0\) ,而由切比雪夫不等式,由于 \(D(X)=0\) ,即有 \(\sigma^2=0\) ,即有 \(P\{|X-E(X)|>\varepsilon\}\le 0\) ,出现了矛盾,即得证。
随机变量的矩
设 \(X,Y\) 是随机变量,则有以下定义:
\(E(X^k)\) :\(k\) 阶原点矩,简称 \(k\) 阶矩。
\(E((X-E(X))^k)\) :\(k\) 阶中心矩。
\(E(X^mY^n)\) :\(m+n\) 阶混合矩。
\(E((X-E(X))^m(Y-E(Y))^n)\) :\(m+n\) 阶混合中心矩。
注:一阶原点矩就是期望,二阶中心矩就是方差。原点矩描述随机变量的值的大小分布,中心矩描述随机变量的波动分布(描述不一定准确)。
协方差
对于随机变量 \(X,Y\) ,称 \(E[(X-E(X))(Y-E(Y))]\) 为 \(X,Y\) 的协方差,记为 \(Cov(X,Y)\) ,即 \(Cov(X,Y)=E[(X-E(X))(Y-E(Y))]\) 。
协方差的常用运算性质
\(Cov(X,Y)=E(XY)-E(X)E(Y)\)
证明:\(Cov(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY-XE(X)-YE(Y)+E(X)E(Y))=E(XY)-E(X)E(Y)\)
\(Cov(C,X)=0\)
证明:\(Cov(C,X)=E((C-E(C))(X-E(X)))=0\)
\(Cov(X,X)=D(X)\)
证明:\(Cov(X,X)=E((X-E(X))^2)=E(X^2)-E^2(X)=D(X)\)
\(Cov(aX,bY)=abCov(X,Y)\)
证明:\(Cov(aX,bY)=E((aX-E(aX))(bY-E(bY)))\) ,由期望的运算性质,即得证。
\(Cov(aX+c,bY+d)=abCov(X,Y)\)
证明:\(Cov(aX+c,bY+d)=E((aX+c-E(aX+c))(bY+d-E(bY+d)))=E((aX+c)(bY+d)-(bY+d)E(aX+c)-(aX+c)E(bY+d)+E(aX+c)E(bY+d))=abE(XY)+adE(X)+cbE(Y)+cd-(bE(Y)+d)(aE(X)+c)=ab(E(XY)-E(X)E(Y))=abCov(X,Y)\)
这个公式说明,线性运算会改变协方差的大小。
\(Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)\)
证明:\(Cov(X_1+X_2,Y)=E((X_1+X_2-E(X_1+X_2))(Y-E(Y)))=E((X_1-E(X_1)+X_2-E(X_2))(Y-E(Y)))=Cov(X_1,Y)+Cov(X_2,Y)\) ,即得证。
相关系数
称 \(\displaystyle \rho_{XY}=\frac{Cov(X,Y)}{\sigma(X)\sigma(Y)}\) 为随机变量 \(X,Y\) 的相关系数,其中 \(Cov(X,Y)\) 为协方差,\(\sigma(X),\sigma(Y)\) 为标准差。
相关系数的性质
相关系数是用来描述两个随机变量线性相关的期望。
记 \(f=E((X-(a+bY))^2)\) ,现求出某一组系数 \(a,b\) 使得 \(f\) 的值最小,这样得到的 \(f\) 即为两个随机变量的最大线性相关性。
\(f=E(X^2-2aX-2bXY+a^2+2abY+b^2Y^2)=E(X^2)-2aE(X)-2bE(XY)+a^2+2abE(Y)+b^2E(Y^2)\) ,有
\(\begin{cases}\displaystyle \frac{\partial f}{\partial a}=-2E(X)+2a+2bE(Y) \\\displaystyle \frac{\partial f}{\partial b}=-2E(XY)+2aE(Y)+2bE(Y^2)\end{cases}\)
注意:这里只能用分解后的函数形式来求解。随机变量的期望是一个常数,但是随机变量不是。如果把随机变量看成是一个常数进行运算,就会得到一个抛物线平移形成的曲面,这样的曲面具有无数个最小值点。
取两个偏导数均为 \(0\) ,由于函数有最小值,没有最大值,因此得到的就是最小值点。解为:
\(\begin{cases}\displaystyle a=E(X)-\frac{Cov(X,Y)E(Y)}{D(Y)}\\\displaystyle b=\frac{E(XY)-E(X)E(Y)}{E(Y^2)-E^2(Y)}=\frac{Cov(X,Y)}{D(Y)}\end{cases}\)
对 \(f\) 进行变形,
由于 \(D(X)=E(X^2)-E^2(X)\) ,故 \(f=D(X-a-bY)-E^2(X-a-bY)\) ,而 \(E(X-a-bY)=E(X)-a-bE(Y)\) 和求解方程一致,也即在解的情况下值为 \(0\) ,故
\(\displaystyle f=D(X-a-bY)=D(X)+b^2D(Y)-2bCov(X,Y)=D(X)-\frac{Cov^2(X,Y)}{D(Y)}=D(X)(1-\frac{Cov^2(X,Y)}{D(X)D(Y)})=D(X)(1-\rho_{XY}^2)\)
因此有
相关系数 \(|\rho|\le 1\) ;
\(|\rho_{XY}|=1\) 的充要条件是存在 \(a,b\) 使 \(P\{X=a+bY\}\) ;
相关系数的运算性质
\(\displaystyle \rho(aX+b,cY+d)=\frac{Cov(aX+b,cY+d)}{\sigma(aX+b)\sigma(cY+d)}=\frac{abCov(X,Y)}{ab\sigma(X)\sigma(Y)}=\rho(X,Y)\) ,这个公式反映出,线性运算不改变相关系数的大小。