5.3 对角化和谱分解
5.3.1
$\\$
略.$\\$
5.3.2 $\quad$ 判断下列方阵是否可对角化:
$\\$
1. $\begin{bmatrix}
1&2&3\\
4&5&6\\
7&8&9\\
\end{bmatrix}\\$
解:直接算出特征多项式可以发现方程有3个不同的实数根,于是可对角化.$\\$
2. $\begin{bmatrix}
0&1&1\\
0&0&1\\
0&0&0\\
\end{bmatrix}\\$
解:直接算出特征多项式可以发现代数重数是3,而$\dim(\mathcal{N}(\lambda_0I_3-A))$一定小于3,即几何重数小于3.几何重数不等于代数重数,不可对角化.$\\$
5.3.3
$\\$
直接谱分解,利用$A^n=X\varLambda^{n}X^{-1}$可得.$\\$
5.3.4-5.3.5
$\\$
略.$\\$
5.3.6 $\quad$ 利用矩阵,求下列数列的通项公式和极限.
$\\$
1. (Lucas数)$L_1=1, L_2=3, L_{n+2}=L_{n+1}+L_n (n=1,2,\cdots).\\$
2. $a_0=0,a_1=1,a_{n+2}=\frac{1}{2}a_{n+1}+\frac{1}{2}a_n (n=0,1,2,\cdots).\\$
3. $a_0=a_1=0,a_2=1,a_{n+3}=\frac{1}{2}a_{n+2}+\frac{1}{4}a_{n+1}+\frac{1}{4}a_n (n=0,1,2,\cdots).\\$
4. $a_0=1,a_{n+1}=a_n+2 \times 3^n (n=0,1,2,\cdots).\\$
5. $a_0=0,b_0=1,a_{n+1}=a_n+b_n,b_{n+1}=3a_n+3b_n (n=0,1,2,\cdots).\\$
解:$\\$
1. 显然$\begin{bmatrix}
L_{n+2}\\
L_{n+1}\\
\end{bmatrix}
=
\begin{bmatrix}
1&1\\
1&0\\
\end{bmatrix}
\begin{bmatrix}
L_{n+1}\\
L_n
\end{bmatrix}.$于是$\begin{bmatrix}
L_{n+1}\\
L_{n}\\
\end{bmatrix}
=
\begin{bmatrix}
1&1\\
1&0\\
\end{bmatrix}^{n-1}
\begin{bmatrix}
L_{2}\\
L_1
\end{bmatrix}.\\$
仿造例5.3.12用谱分解展开得,$\\$
$$\begin{align*}
L_n &=\bm{e}_2^{\mathrm{T}}\frac{1}{\lambda_1-\lambda_2}\begin{bmatrix}
\lambda_1&\lambda_2\\
1&1\\
\end{bmatrix}\begin{bmatrix}
\lambda_1^{n-1}&\\
&\lambda_2^{n-1}\\
\end{bmatrix}\begin{bmatrix}
1&-\lambda_2\\
-1&\lambda_1\\
\end{bmatrix}\begin{bmatrix}
3\\
1\\
\end{bmatrix}\\ &=\frac{3(\lambda_1^{n-1}-\lambda_2^{n-1})-\lambda_1\lambda_2(\lambda_1^{n-2}-\lambda_2^{n-2})}{\lambda_1-\lambda_2}
\end{align*}$$
其中$\lambda_1=\frac{1+\sqrt{5}}{2},\lambda_2=\frac{1-\sqrt{5}}{2},n=1,2,\cdots.\\$
这个数列显然是发散的。$\\$
2. 显然$\begin{bmatrix}
a_{n+2}\\
a_{n+1}\\
\end{bmatrix}
=
\begin{bmatrix}
\frac{1}{2}&\frac{1}{2}\\
1&0\\
\end{bmatrix}
\begin{bmatrix}
a_{n+1}\\
a_n
\end{bmatrix}.$于是$\begin{bmatrix}
a_{n+1}\\
a_{n}\\
\end{bmatrix}
=
\begin{bmatrix}
\frac{1}{2}&\frac{1}{2}\\
1&0\\
\end{bmatrix}^{n}
\begin{bmatrix}
a_1\\
a_0
\end{bmatrix}.\\$
用谱分解展开:$\\$
$$\begin{align*}
a_n &=\bm{e}_2^{\mathrm{T}}\frac{1}{3}\begin{bmatrix}
-1&1\\
2&1\\
\end{bmatrix}\begin{bmatrix}
(-\frac{1}{2})^{n}&\\
&1^{n}\\
\end{bmatrix}\begin{bmatrix}
-1&1\\
2&1\\
\end{bmatrix}\begin{bmatrix}
1\\
0\\
\end{bmatrix}\\ &=\frac{2}{3}(1-\frac{1}{(-2)^n})
\end{align*}$$
数列极限为$\frac{2}{3}.\\$
3. 略。$\\$
4. 显然$\begin{bmatrix}
a_{n+1}\\
3^{n+1}\\
\end{bmatrix}
=
\begin{bmatrix}
1&2\\
0&3\\
\end{bmatrix}
\begin{bmatrix}
a_{n}\\
3^n
\end{bmatrix}.$即$\begin{bmatrix}
a_{n}\\
3^{n}\\
\end{bmatrix}
=
\begin{bmatrix}
1&2\\
0&3\\
\end{bmatrix}^n
\begin{bmatrix}
1\\
1
\end{bmatrix}.$谱分解后立得$a_n=3^n$,数列发散。$\\$
5. 显然$\begin{bmatrix}
a_{n+1}\\
b_{n+1}\\
\end{bmatrix}
=
\begin{bmatrix}
1&1\\
3&3\\
\end{bmatrix}
\begin{bmatrix}
a_{n}\\
b_n
\end{bmatrix}.$即$\begin{bmatrix}
a_{n}\\
b_{n}\\
\end{bmatrix}
=
\begin{bmatrix}
1&1\\
3&3\\
\end{bmatrix}^n
\begin{bmatrix}
0\\
1
\end{bmatrix}.\\$
用谱分解展开后立得$a_n=4^{n-1}, b_n=3\cdot 4^{n-1}. (n \geq 1).$数列显然也是发散的。$\\$
5.3.7
$\\$
略.$\\$
5.3.8 $\quad$ 设有谱分解$A=X\varLambda X^{-1}$,求下列矩阵的谱分解:
$\\$
1.$A^{-1}\\$
解:显然,$A^{-1}=X\varLambda^{-1}X^{-1}\\$
2.$A^{\mathrm{T}}\\$
解:显然,$A^{\mathrm{T}}=X^{-\mathrm{T}}\varLambda X^{\mathrm{T}}\\$
3. $\begin{bmatrix}
A&O\\
O&2A\\
\end{bmatrix}\\$
解:显然,$\begin{bmatrix}
A&O\\
O&2A\\
\end{bmatrix}=
\begin{bmatrix}
X&\\
&X\\
\end{bmatrix}
\begin{bmatrix}
\varLambda&\\
&2\varLambda\\
\end{bmatrix}
\begin{bmatrix}
X^{-1}&\\
&X^{-1}\\
\end{bmatrix}
\\$
4.$\begin{bmatrix}
O&A\\
A&O\\
\end{bmatrix}\\$
解:注意到$$\begin{bmatrix}
O&I_n\\
I_n&O\\
\end{bmatrix}=
\frac{\sqrt{2}}{2}\begin{bmatrix}
-I_n&I_n\\
I_n&I_n\\
\end{bmatrix}
\begin{bmatrix}
-I_n&O\\
O&I_n\\
\end{bmatrix}
\begin{bmatrix}
-I_n&I_n\\
I_n&I_n\\
\end{bmatrix}\frac{\sqrt{2}}{2}.$$
于是$$\begin{bmatrix}
O&A\\
A&O\\
\end{bmatrix}=
\frac{\sqrt{2}}{2}\begin{bmatrix}
-X&X\\
X&X\\
\end{bmatrix}
\begin{bmatrix}
-\varLambda&O\\
O&\varLambda\\
\end{bmatrix}
\begin{bmatrix}
-X&X\\
X&X\\
\end{bmatrix}\frac{\sqrt{2}}{2}.$$
5.3.9 $\quad$ 利用特征值计算下列$n$阶矩阵的行列式:
$\\$
1.$\begin{vmatrix}
a&b&\cdots&b\\
b&a&\ddots&\vdots\\
\vdots&\ddots&\ddots&b\\
b&\cdots&b&a\\
\end{vmatrix}\\$
解:$\\$
显然矩阵有$n-1$重特征值$a-b$,由$\operatorname{trace}(A)=na$可得还有单特征值$a+(n-1)b$.所以原式=$(a-b)^{n-1}(a-b+nb).\\$
$2.\begin{vmatrix}
1+a_1b_1&a_1b_2&\cdots&a_1b_n\\
a_2b_1&1+a_2b_2&\ddots&\vdots\\
\vdots&\ddots&\ddots&a_{n-1}b_n\\
a_nb_1&\cdots&a_nb_{n-1}&1+a_nb_n\\
\end{vmatrix}\\$
解:$\\$
显然矩阵有$n-1$重特征值1,由$\operatorname{trace}(A)=n+\sum_{i=1}^na_ib_i$可得还有单特征值$1+\sum_{i=1}^na_ib_i$.所以原式=$1+\sum_{i=1}^na_ib_i.\\$
5.3.10 $\quad$ 证明:
$\\$
1.$\quad$ $n$阶方阵$J_n(\lambda_0)=\begin{bmatrix}
\lambda_0&1&&\\
&\lambda_0&\ddots&\\
&&\ddots&1\\
&&&\lambda_0\\
\end{bmatrix}$只有一个特征值$\lambda_0$,其代数重数是$n$,几何重数是1.$\\$
2.$\quad$ 分块对角矩阵$A=\begin{bmatrix}
J_{n_1}(\lambda_0)&O\\
O&J_{n_2}(\lambda_0)
\end{bmatrix}$只有一个特征值$\lambda_0$,其代数重数是$n_1+n_2$,几何重数是2.$\\$
1.证明:$\\$
方阵$J_n$的特征多项式为$p(\lambda)=(\lambda-\lambda_0)^n.$显然只有一个特征值$\lambda_0$,代数重数为$n$.$\\$
又因为$\operatorname{rank}(\lambda_0I_n-J_n(\lambda_0))=\operatorname{rank}(\begin{bmatrix}
0&-1&&\\
&0&\ddots&\\
&&\ddots&-1\\
&&&0
\end{bmatrix})=n-1.$所以其零空间维度为1,几何重数是1.$\\$
2.证明:$\\$
由(1)立得,特征多项式为$p(\lambda)=(\lambda-\lambda_0)^{n_1+n_2}.$显然只有一个特征值$\lambda_0$,代数重数为$n_1+n_2$.$\\$
设$n$阶方阵$C_n=\begin{bmatrix}
0&-1&&\\
&0&\ddots&\\
&&\ddots&-1\\
&&&0
\end{bmatrix},$则$\operatorname{rank}(\lambda_0I_{n_1+n_2}-A)=\operatorname{rank}(\begin{bmatrix}
C_{n_1}&O\\
O&C_{n_2}
\end{bmatrix})=n-2.$所以其零空间维度为2,几何重数是2.$\\$
5.3.11 $\quad$ 试分析秩为1的方阵何时可对角化.
$\\$
秩为1的方阵$A$可对角化当且仅当$\operatorname{trace}(A)\neq 0.\\$
证明:$\\$
先证秩为1的方阵$A$可对角化$\Rightarrow$$\operatorname{trace}(A)\neq 0.\\$
$\operatorname{rank}(A)=1$且$A$可对角化$\Rightarrow \mathcal{N}(A)$的维度为$n-1$,$A$有一个重数是$n-1$的特征值0$\Rightarrow \operatorname{trace}(A)\neq 0.\\$
再证秩为1的方阵$A$满足$\operatorname{trace}(A)\neq 0 \Rightarrow$$A$可对角化。$\\$
$\operatorname{rank}(A)=1\Rightarrow \mathcal{N}(A)$的维度为$n-1$,$A$有一个几何重数是$n-1$的特征值0,其代数重数至少是$n-1$。又因为$\operatorname{trace}(A)\neq 0$,所以$A$至少有1个非零特征值。由此可得$A$有一个非零特征值,几何重数和代数重数均为1,另一个特征值是0,几何重数和代数重数都是$n-1$.$\Rightarrow A$可对角化。$\\$
5.3.12 $\quad$ 设$A$为实二阶方阵,且$\det(A)<0$,证明$A$在$\mathbb{R}$上可对角化.
$\\$
解:$\\$
$A$为实二阶方阵,且$\det(A)<0$$\Rightarrow A$有一正一负两个特征值$\Rightarrow A$可对角化。$\\$
5.3.13 $\quad$ 证明$A=\begin{bmatrix}
I_r&O\\
B&-I_{n-r}
\end{bmatrix}$可对角化.
$\\$
证明:
$$p_A(\lambda)=\det(\lambda I_n-A)=\begin{vmatrix}\lambda I_r-I_r&O\\-B&\lambda I_{n-r}+I_{n-r}\end{vmatrix}=(\lambda-1)^r(\lambda+1)^{n-r}$$
这说明$A$有两个特征值。$\lambda_1=1$,代数重数是$r$,$\lambda_2=-1$,代数重数是$n-r$。$\\$
当$\lambda=1$时,$\operatorname{rank}(\lambda I_n-A)=\operatorname{rank}(\begin{bmatrix}
O&O\\
-B&2I_{n-r}
\end{bmatrix})=n-r \Rightarrow $几何重数为$r$.$\\$
当$\lambda=-1$时,$\operatorname{rank}(\lambda I_n-A)=\operatorname{rank}(\begin{bmatrix}
-2I_r&O\\
-B&O
\end{bmatrix})=r \Rightarrow $几何重数为$n-r$.$\\$
即对所有特征值,几何重数和代数重数都相等。所以$A$可对角化。$\\$
5.3.14 $\quad$ 证明:
$\\$
1. 若$A^2=A$,则$A$可对角化.$\\$
2. 若$A^2=O$,且$A\neq O$,则$A$不可对角化.$\\$
3. 若$A^2+A+I_n=O$,则$A$在$\mathbb{R}$上不可对角化.$\\$
1. 证明:$\\$
$A^2=A \Rightarrow \lambda_1=0,\lambda_2=1\\$
注意到$A^2-A=0 \Rightarrow A(I_n-A)=0 \Rightarrow \mathcal{R}(I_n-A) \subseteq \mathcal{N}(A) \Rightarrow \operatorname{rank}(A)+\operatorname{rank}(I_n-A) \leq n\\$
而$\operatorname{rank}(A)+\operatorname{rank}(I_n-A) \geq \operatorname{rank}(A+I_n-A)=n$,
所以$\operatorname{rank}(A)+\operatorname{rank}(I_n-A)=n\\$
设$\operatorname{rank}(A)=r, \operatorname{rank}(I_n-A)=n-r$。当$\lambda=0$时,$\dim(\mathcal{N}(A))=n-r$,几何重数是$n-r$,当$\lambda=1$时,$\dim(\mathcal{N}(I_n-A))=r$,几何重数是$r$.$\\$特征值的几何重数之和是$n$,说明$A$有$n$个线性无关的特征向量,所以可对角化。$\\$
2. 证明:$\\$
$A^2=O \Rightarrow \lambda=0.$显然只有一个特征值,其代数重数是$n$.$\\$
而$A \neq O \Rightarrow \operatorname{rank}(A) \geq 1 \Rightarrow \operatorname{rank}(\lambda I_n-A)\geq 1.$即几何重数小于$n$.$\\$
几何重数和代数重数不相等,$A$不可对角化。$\\$
3. 证明:$\\$
$A^2+A+I_n=O \Rightarrow \lambda^2+\lambda+1=0.$显然方程没有实数解,所以特征值为复数$\Rightarrow A$在实数域不可对角化。$\\$
5.3.15 $\quad$ 证明或举出反例:
$\\$
1. 如果$A$所有的特征向量是$k\begin{bmatrix}
1\\
4\\
\end{bmatrix},k\neq 0$,则$A$一定有不单的特征值.$\\$
2. 如果$A$所有的特征向量是$k\begin{bmatrix}
1\\
4\\
\end{bmatrix},k\neq 0$,则$A$一定有不可对角化.$\\$
3. 如果$A$是上三角矩阵但不是对角矩阵,则$A$不可对角化.$\\$
4. 如果$A$是上三角矩阵但不是对角矩阵,则存在对角矩阵$D$,使得$A-D$不可对角化.$\\$
5. 如果$A$可以被对角矩阵对角化,则$A$也是对角矩阵.$\\$
1.2. 证明:$\\$
显然$A$是二阶方阵,且特征向量只有一组,几何重数是1。特征值也只有一个,代数重数是2。所以$A$特征值一定不单且不可对角化。$\\$
3. 不正确$\\$
设$A=\begin{bmatrix}
1&1\\
0&0
\end{bmatrix}$,是上三角矩阵但是可以对角化。$\\$
4. 证明:$\\$
不妨设$D$的对角元和$A$的对角元相同,则$A-D$是严格上三角阵。于是$A-D$的特征多项式是$\lambda^n$,即只有一个特征值0,代数重数是$n$。而$A$不是对角矩阵,$\operatorname{rank}(A-D)\geq 1$,所以特征值的几何重数一定小于$n$。几何重数不等于代数重数,不可对角化。$\\$
4. 证明:$\\$
显然对角矩阵的乘积和逆也是对角矩阵,所以$A=X\varLambda X^{-1}$是对角矩阵。$\\$
5.3.16
$\\$
略$\\$
5.3.17 $\quad$ 证明,对反射矩阵$H_v=I_n-2\bm{v}\bm{v}^\mathrm{T}$,其中$\Vert\bm{v}\Vert=1$,存在正交矩阵$Q$,使得$Q^{-1}H_vQ=\operatorname{diag}(-1,1,1,\cdots,1)$.
$\\$
证明:$\\$
$Q^{-1}H_vQ=Q^{\mathrm{T}}I_nQ-2Q^{\mathrm{T}}\bm{v}\bm{v}^{\mathrm{T}}Q=I_n-2(Q^{\mathrm{T}}\bm{v})(Q^{\mathrm{T}}\bm{v})^{\mathrm{T}}.\\$
可以看出若要让命题成立,只需要让$Q^{\mathrm{T}}\bm{v}=\bm{e}_1=\begin{bmatrix}
1\\
0\\
\vdots\\
0
\end{bmatrix}.$由于$\Vert\bm{v}\Vert=1$,所以一定存在旋转变换$Q^{\mathrm{T}}$使$Q^{\mathrm{T}}\bm{v}=\bm{e}_1$,而旋转变换的表示矩阵都是正交矩阵。即存在正交矩阵$Q$,使得$Q^{-1}H_vQ=\operatorname{diag}(-1,1,1,\cdots,1).\\$
5.3.18 (Householder矩阵的推广) $\quad$ 设$\mathcal{M}$是$\mathbb{R}^{n}$的子空间,对任意$\bm{v} \in \mathbb{R}^{n}$,存在唯一的分解$\bm{v}=\bm{v}_1+\bm{v}_2$,其中$\bm{v}_1 \in \mathcal{M}, \bm{v}_2 \in \mathcal{M}^{\bot}$.定义$\mathbb{R}^{n}$上的变换$\bm{H}$,使得$\bm{H}(\bm{v}_1+\bm{v}_2)=\bm{v}_1-\bm{v}_2.\\$
1.证明$\bm{H}$是线性变换。$\\$
2. 设$H$是该线性变换的表示矩阵,证明$H^2=I_n.\\$
3. 求$H$的特征值,代数重数及特征子空间。$H$能否被对角化?$\\$
4. 证明,存在矩阵$A$,使得$H=I_n-2AA^{\mathrm{T}}\\$
1. 证明是显然的,略。$\\$
2. 证明:
$$\bm{H}(\bm{H}(\bm{v}_1+\bm{v}_2))=\bm{H}(\bm{v}_1-\bm{v}_2)=\bm{v}_1+\bm{v}_2.$$
于是$H^2=I_n.\\$
3.解:$\\$
注意到$H\bm{v}_1=\bm{v}_1, H\bm{v}_2=-\bm{v}_2.$所以$H$有两个特征值:$\\$
$\lambda_1=1$,特征子空间是$\mathcal{M}$,代数重数是$\dim(\mathcal{M}).\\$
$\lambda_1=-1$,特征子空间是$\mathcal{M}^{\bot}$,代数重数是$\dim(\mathcal{M}^{\bot}).\\$
$H$代数重数之和等于$n$,于是$H$可以对角化。$\\$
4. 证明:$\\$
注意到$H\bm{v}=(I_n-2AA^{\mathrm{T}})\bm{v}=(I_n-AA^{\mathrm{T}})\bm{v}-AA^{\mathrm{T}}\bm{v}$.这意味着只要找到矩阵$A$满足$(I_n-AA^{\mathrm{T}})\bm{v}=\bm{v}_1, AA^{\mathrm{T}}\bm{v}=\bm{v}_2$即可。立刻联想到正交投影矩阵。$\\$
设$A$是关于$\mathcal{M}^{\bot}$的正交投影矩阵,则:$$\begin{align*}
H\bm{v}&=H(\bm{v}_1+\bm{v}_2)=(I_n-2AA^{\mathrm{T}})(\bm{v}_1+\bm{v}_2)\\&=(I_n-2A)(\bm{v}_1+\bm{v}_2)\\&=\bm{v}_1+\bm{v}_2-2A\bm{v}_1-2A\bm{v}_2\\&=\bm{v}_1-\bm{v}_2
\end{align*}$$
所以存在矩阵$A$,使得$H=I_n-2AA^{\mathrm{T}}\\$
5.3.19 $\quad$ 设$A$是$n$阶实方阵,满足$A^2=I_n$,证明$A$在$\mathbb{R}$上可对角化,并判断$A$是否为关于某个子空间的反射变换。
$\\$
证明:$\\$
$A^2=I_n\Rightarrow \lambda=\pm 1$,即$\lambda=1$对应的特征向量子空间是$\mathcal{N}(I_n-A)$,$\lambda=-1$对应的特征向量子空间是$\mathcal{N}(I_n+A)$。
$$\operatorname{rank}(I_n-A)+\operatorname{rank}(I_n+A)\geq \operatorname{rank}(I_n-A+I_n+A)=n.\quad (1)$$
而$$\begin{align*}
(I_n-A)(I_n+A)=(I_n+A)(I_n-A)=0 \\\Rightarrow (I_n-A) \subseteq \mathcal{N}(I_n-A) \\\Rightarrow \operatorname{rank}(I_n-A) \leq n-\operatorname{rank}(I_n+A) \\\Rightarrow \operatorname{rank}(I_n-A)+\operatorname{rank}(I_n+A) \leq n \quad (2)
\end{align*}$$
由(1)(2)得$\operatorname{rank}(I_n-A)+\operatorname{rank}(I_n+A)=n$,即$\dim(\mathcal{N}(I_n-A))+\dim(\mathcal{N}(I_n+A))=n.$所以$A$有$n$个线性无关的特征向量,可以对角化。$\\$
5.3.20-21
$\\$
略。