本文原载于微信公众号"小朱的读书笔记", 作者:`陈跃`$^{[1]}$,`朱善军`$^{[2]}$. [1]上海师范大学数学系副教授; [2]同济大学数学系研究生在读. ------------ 为了与线性代数的历史发展尽量相吻合,我们先在本章讲矩阵的特征值与对角化,然后在后面的第八章再来讲线性变换的特征值与对角化。这样的安排在总体上有不少好处,首先矩阵的特征值对学生来说比较容易理解,而线性变换的特征值则比较难理解。其次是这样可以避免传统高等代数课程中将配方法化简二次型与主轴定理化简二次型分开来讲的弊端。 实际上,先讲矩阵的特征值和对角化的做法也为学生顺利理解后面的线性变换的特征值与对角化作好了充分的准备。由于求解特征向量要用到行列式、线性方程组和多项式等多方面的相关知识,我们也可以将矩阵的特征值与对角化看成是联系整个高等代数(或线性代数)课程各部分内容的一个中心纽带。 本章先引入矩阵特征值与特征向量的概念,然后着重给出$n$阶方阵可对角化的充要条件,即具备$n$个线性无关的特征向量。接下来讲解矩阵特征值的基本性质,然后再引出相似矩阵的概念,并讨论它们的基本性质。 学习要点23:矩阵的特征值与特征向量 - 对于矩阵的乘法来说,和对角矩阵作乘法是最容易计算的。矩阵的对角化就是试图将所有的方阵都尽量与一个对角矩阵联系起来。此时就需要矩阵的特征值与特征向量的概念。若对$n$阶方阵$A$,存在数$\lambda$和向量$\alpha$满足$A\alpha=\lambda \alpha$ ,则称$\lambda$是$A$的一个特征值,$\alpha$是$A$的属于$\lambda$的一个特征向量。 计算矩阵$A$的特征值与特征向量的基本方法是: - (1)求出特征方程$|\lambda I- A|=0$的全部根,这些根就是$A$的全部特征值; - (2)对每个特征值$\lambda$,求出齐次线性方程组$(\lambda I- A)X=0$的基础解系,它们就是$A$的属于特征值$\lambda$的线性无关的特征向量。 >习题5.1 已知矩阵 >$$A=\left( \begin{array}{ccc} 3 & 2 & -1 \\ -2 & -2 & 2 \\ 3 & 6 & -1 \\ \end{array} \right),$$ >求$A^{100}$. `提示`:为了将矩阵$A$进行对角化,我们需要先求出方阵$A$的特征值和特征向量.不难计算,矩阵$A$的属于特征值$\lambda_{1}=-4$的特征向量$\alpha_{1}=(1,-2,3)^{T}$,属于特征值$\lambda_{2}=2$的特征向量$\alpha_{2}=(-2,1,0)^{T},\alpha_{3}=(1,0,1)^{T}$. 由此三个特征向量作列向量的三阶矩阵记为 $$P=\left( \begin{array}{ccc} 1 & -2 & 1 \\ -2 & 1 & 0 \\ 3 & 0 & 1 \\ \end{array} \right).$$ 由此可知 $$P^{-1}AP=\left( \begin{array}{ccc} -4 & & \\ & 2 & \\ & & 2 \\ \end{array} \right).$$ 再对上述等式作100次乘积,立得结果. 学习要点24:矩阵可对角化的条件 - 对于$n$阶方阵$A$来说,如果存在可逆矩阵$P$,使得 $$P^{-1}AP=diag(\lambda_{1},\cdots,\lambda_{n}) .$$ 那么就称$A$可对角化。上式右边对角矩阵的对角线元素都是$A$的特征值,并且可逆矩阵$P$的所有$n$个列向量都是$A$的特征向量。并不是所有的方阵都是可以对角化的,学生们至少应该找出一个不能对角化的矩阵。 关于矩阵可对角化的条件,有以下常用的结论: - (1)如果$n$阶矩阵$A$有$n$个不同的特征值,则$A$可以对角化; - (2)$n$阶矩阵$A$可对角化的充要条件是$A$有$n$个线性无关的特征向量; - (3)$n$阶矩阵$A$可对角化的充要条件是:对每个$k$重特征值$\lambda$来说, $$rank(\lambda I- A)=n-k.$$ >习题5.2 已知矩阵 >$$A=\left( \begin{array}{ccc} 1 & -1 & 1 \\ a & 4 & b \\ -3 & -3 & 5 \\ \end{array} \right),$$ >有3个线性无关的特征向量,$\lambda_{0}=2 $是$A$的2重特征值,求$a,b$的值. `提示`:由于三阶方阵$A$有3个线性无关的特征向量,因此$A$必可对角化.其次,$\lambda_{0}=2 $是$A$的2重特征值,可推知$rank(2I-A)=1$(想想为什么?),从而$a=2,b=-2$. >习题5.3 设$A$是$n$阶方阵,并且$A^{2}=I$,证明:$A$可对角化. `提示`:(1)先判断出$A$的特征值只能是$1$或者$-1$; (2)考虑特征值对应的几何重数,并且结合结论 $$rank(A+I)+ran(A-I)=n,$$ 由此说明$A$的特征多项式可以分解为一次因式乘积的形式,因此$A$是对角化矩阵. 学习要点25:特征多项式的基本性质 - 矩阵$A$的特征多项式是$f(\lambda)=|\lambda I- A|$,当把这个等式右边的行列式展开后,得到关于$\lambda$的一个$n$次的多项式。由此可知,$A$的$n$个特征值的乘积等于$|A|$,$A$的$n$个特征值的和等于$A$的迹。此外还成立凯莱-哈密尔顿定理,即有矩阵等式$f(A)=0$。 >习题5.4 证明:设$n$阶可逆矩阵$A$的全部特征根是$\lambda_{1},\cdots,\lambda_{n}$,则$A^{-1}$的全部特征根是$\lambda_{1}^{-1},\cdots,\lambda_{n}^{-1}.$ `提示`:由于矩阵的行列式恰好等于特征根的乘积,因此由$A$的可逆性可知每个$\lambda_{i}$均不为0.据此,可得 $$|\lambda E-A^{-1}|=|\lambda A^{-1}|·|\frac{1}{\lambda}E-A|.$$ 更一般地,若$g(x)$为任一多项式,则矩阵$g(A)$的特征值是多少呢?(你猜!!!) >习题5.5 设$n$阶方阵$A$是可逆的,证明它的逆矩阵$A^{-1}$与伴随矩阵$A^{\*} $都可以表示为$A$的行列式. `提示`:考虑设$A$的特征多项式为 $$f(\lambda)=|\lambda E-A|=\lambda^{n}+a_{1}\lambda^{n-1}+\cdots+a_{n}.$$ 由$A$可逆可知$A$的特征多项式的常数项$a_{n}$非0.考虑利用哈密顿-凯莱定理,可知 $$A^{-1}=-\frac{1}{a_{n}}(A^{n-1}+a_{1}A^{n-2}+\cdots+a_{n-1}E).$$ 那么,你可以写出$A^{\*} $吗? 学习要点26:相似矩阵 - 由矩阵可对角化的概念,可以引入两个矩阵$A$与$B$相似的定义:如果存在可逆矩阵$P$,使得 $$P^{-1}AP=B,$$ 那么$A$与$B$相似。两个相似的矩阵具有完全相同的特征多项式,从而有完全相同的特征值。 >习题5.6 设$A$和$B$是任意两个$n$阶方阵,证明:如果$A$与$B$相似,则$A^{\*} $与$B^{\*} $也相似. `提示`:运用相似矩阵和伴随矩阵的性质,显然. 学习要点27:施密特正交化方法 - 施密特正交化方法是用来构造正交矩阵的主要方法。它从一组线性无关的向量出发,逐步得到一组正交向量组。 >习题6.1 求与齐次线性方程组 >$$\left\{ \begin{array}{ll} 2x+y-z+w-3u=0, \\ x+y-z+u=0 \end{array} \right.$$ >的基础解系等价的正交向量组. `提示`:先将方程组的增广矩阵作行初等变换,得到它的简化阶梯矩阵.然后解对应的同解线性方程组 $$\left\{ \begin{array}{ll} x+w-4u=0, \\ y-z-w+5u=0 \end{array} \right. $$ 最后得到的正交向量组为$\beta_{1}=(0,1,1,0,0)^{T}$,$\beta_{2}=(-1,\frac{1}{2},-\frac{1}{2},1,0)^{T}$,$\beta_{3}=(\frac{7}{5},-\frac{6}{5},\frac{6}{5},\frac{13}{5},1)^{T}.$ 学习要点28:用正交线性替换来化简二次型与主轴定理 - 用正交线性替换来化简二次型,相当于是对二次型的矩阵实施对角化。主轴定理的矩阵形式是: >若$A$是一个$n$阶实对称矩阵,则存在一个正交矩阵$Q$,使得 >$$Q^{-1}AQ=Q^{T}AQ=diag(\lambda_{1},\cdots,\lambda_{n}).$$ >其中$\lambda_{1},\cdots,\lambda_{n}$是$A$的$n$个实特征值。 对实对称矩阵$A$实施对角化的步骤是: - (1)求出特征方程$|\lambda I- A|=0$的全部特征值$\lambda_{1},\cdots,\lambda_{n}$; - (2)对每个特征值$\lambda$,求出齐次线性方程组$(\lambda I- A)X=0$的基础解系,得到$A$的属于特征值$\lambda$的线性无关的特征向量。然后用施密特正交化方法将其正交化,即得属于特征值$\lambda$的两两正交的特征向量。再进行标准化,得到两两正交的单位特征向量组。 - (3)以所得全部的两两正交的单位特征向量作为列向量,合成一个正交矩阵$Q$,由主轴定理得到。 $$Q^{-1}AQ=Q^{T}AQ=diag(\lambda_{1},\cdots,\lambda_{n}).$$ >习题6.2 用主轴定理将实二次型$$f(x,y,z)=2x^{2}+2y^{2}+2z^{2}+2xy+2xz+2yz$$化成标准形. `提示`:二次型矩阵为 $$A=\left( \begin{array}{ccc} 2 & 1 & 1 \\ 1 & 2 & 1 \\ 1 & 1 & 2 \\ \end{array} \right),$$ $A$的特征值是1(2重),4.最终标准形可化为$f(x,y,z)=(x')^{2}+(y')^{2}+4(z')^{2}$. 学习要点29:用非退化线性替换(即配方法)化简二次型 - 非退化线性替换(即配方法)是化简n元二次型的经典方法,要熟练掌握这个方法。 >习题6.3 用配方法化二次型$$f(x,y,z)=x^{2}+2y^{2}-z^{2}+4xy-4xz-4yz$$为标准形,并写出所用的非退化线性变换. `提示`:先以第一个平方项的变元$x$作为关注点来构造完全平方式,即对所有含$x$的项配方(运用"加一项,减一项"技巧),得到 $$f(x,y,z)=(x+2y-2z)^{2}-2y^{2}+4yz-5z^{2}.$$ 再以第二个平方项的变元$y$作为关注点继续配方,之后再作线性替换式即可. 学习要点30:复二次型与实二次型的标准形 - 任何一个复二次型总可以经过一个非退化线性替换后化为唯一的典范形: $$y_{1}^{2}+y_{2}^{2}+\cdots+y_{r}^{2},$$ 其中的$r$是这个复二次型的矩阵的秩。 任何一个实二次型总可以经过一个非退化线性替换后化为唯一的典范形: $$y_{1}^{2}+\cdots+y_{p}^{2}-y_{p+1}^{2}-\cdots-y_{r}^{2},$$ 其中的$r$是这个实二次型的矩阵的秩。 (`惯性定理`)在任何一个实二次型的典范形中,正平方项的个数(即正惯性指数)$p$ 和负平方项的个数$r-p$是由该二次型唯一确定的非退化线性替换下的不变量。 >习题6.4 证明:实二次型的秩$r$与符号差$s$有相同的奇偶性,并且$-r\leq s \leq r$. `提示`:设实二次型$f$的正负惯性指数分别是$p$与$q$,则 $$p+q=r,p-q=s.$$ 从而$r+s=2p$为偶数,故$r$与$s$有相同的奇偶性.又由于$r+s\geq 0$,$s-r=-2q\leq 0$,所以$-r\leq s \leq r$. 学习要点31:实正定二次型(正定矩阵)的判定 - $n$元实正定二次型$f(X)=X^{T}AX$有以下的判定充要条件: - (1)正惯性指数等于$n$; - (2)典范形是$y_{1}^{2}+y_{2}^{2}+\cdots+y_{n}^{2}$ ; - (3)$A$的各阶顺序主子式都大于零; - (4)$A$的特征值都是正数; - (5)$A$与单位矩阵合同。 >习题6.5 设$n$阶实矩阵$A$写成了分块矩阵的形式: >$$A=\left( \begin{array}{cc} Q & \alpha \\ \alpha^{T} & r \\ \end{array} \right),$$ >其中$Q$是$n-1$阶正定矩阵,$\alpha\in \mathbb{R}^{n-1}$,证明:$A$正定的充要条件是$r>\alpha^{T}Q^{-1}\alpha$. `提示`:考虑将矩阵$A$打洞,再根据顺序主子式进行判别. 学习要点32:矩阵的合同标准形 - 如果用矩阵的语言来重新描写非退化线性替换(即配方法)化简$n$元二次型的方法,就能得到两个矩阵合同的基本概念。 两个矩阵$A$与$B$合同的定义是:如果存在可逆矩阵 $P$,使得 $$P^{T}AP=B,$$ 则称$A$与$B$ 合同。 任何一个$n$阶方阵都与一个对角阵合同。 >习题6.6 若把实$n$阶对称方阵按照合同分类,即两个实$n$阶对称方阵属于同一类当且仅当它们在实数域上合同,问:共几类? `提示`:$\frac{1}{2}(n+1)(n+2)$.想知道为什么吗?请参看相关教材.