5.2 基本概念
5.2.1-5.2.2
$\\$
略.$\\$
5.2.3 $\quad$ 设$A=\begin{bmatrix}
2&-2&0\\
-2&x&-2\\
-2&-2&0
\end{bmatrix}$,$B=\begin{bmatrix}
2&&\\
&2&\\
&&y
\end{bmatrix}$,已知$A,B$特征多项式相同,求$x,y$.
$\\$
解:$\\$
由$\det(A)=\det(B),\operatorname{trace}(A)=\operatorname{trace}(B)$立得$x=-2,y=-4.\\$
5.2.4-5.2.5
$\\$
略.$\\$
5.2.6 $\quad$ 给定向量$\bm{a},\bm{b}\in\mathbb{R}^n$计算$A=\bm{a}\bm{b}^\mathrm{T}$的所有特征对
$\\$
解:$\\$
显然,$\operatorname{rank}(A)=1$,所以$n-1$重特征值是0,特征向量是$\mathcal{N}(A)$的基。又注意到$\operatorname{trace}(A)=\bm{b}^\mathrm{T}\bm{a}$,于是$A$还有一个单特征值$\bm{b}^\mathrm{T}\bm{a}$,对应的特征向量是$k\bm{a},k\neq0.\\$
5.2.7
$\\$
略.$\\$
5.2.8 $\quad$ 证明,如果$(\lambda,\bm{x})$是$A$的特征对,则$(f(\lambda),\bm{x})$是$f(A)$的特征对,其中$f(x)$任意多项式.
$\\$
结论是显然的.$\\$
5.2.9 $\quad$ 设$A$是可逆矩阵,证明$A$的特征值都不为0;若$\lambda_0$是$A$的一个特征值,则$\frac{1}{\lambda_0}$是$A^{-1}$的一个特征值.
$\\$
证明:$\\$
$A$是可逆矩阵$\Rightarrow \det(A)\neq0 \Rightarrow$$A$的特征值都不为0.$\\$
若$\lambda_0$是$A$的一个特征值,则$A\bm{x}=\lambda_0\bm{x}\Rightarrow A^{-1}A\bm{x}=\lambda_0A^{-1}\bm{x}\Rightarrow \bm{x}=\lambda_0A^{-1}\bm{x}\Rightarrow A^{-1}\bm{x}=\frac{1}{\lambda_0}\bm{x}.$即$\frac{1}{\lambda_0}$是$A^{-1}$的一个特征值.$\\$
5.2.10 $\quad$ 设$\bm{q}_1,\bm{q}_2,\bm{q}_3\in\mathbb{R}^3$为一组标准正交基,分别求$\bm{q}_1\bm{q}_1^{\mathrm{T}},\bm{q}_1\bm{q}_1^{\mathrm{T}}+\bm{q}_2\bm{q}_2^{\mathrm{T}},\bm{q}_1\bm{q}_1^{\mathrm{T}}+\bm{q}_2\bm{q}_2^{\mathrm{T}}+\bm{q}_3\bm{q}_3^{\mathrm{T}}$的所有特征值和特征向量.
$\\$
解:$\\$
$\bm{q}_1\bm{q}_1^{\mathrm{T}}$的特征对是$(0,k\bm{q}_2),(0,k\bm{q}_3),(1,k\bm{q}_1).\\$
$\bm{q}_1\bm{q}_1^{\mathrm{T}}+\bm{q}_2\bm{q}_2^{\mathrm{T}}$的特征对是$(0,k\bm{q}_3),(1,k\bm{q}_1),(1,k\bm{q}_2).\\$
$\bm{q}_1\bm{q}_1^{\mathrm{T}}+\bm{q}_2\bm{q}_2^{\mathrm{T}}+\bm{q}_3\bm{q}_3^{\mathrm{T}}$的特征对是$(1,k\bm{q}_3),(1,k\bm{q}_2),(1,k\bm{q}_1).\\$
其中$k\neq0.\\$
5.2.11 $\quad$ 设$n$阶实方阵$A$满足$A^{\mathrm{T}}\bm{v}=\lambda\bm{v}$,其中$\bm{v}\in\mathbb{R}^{n},\bm{v}\neq\bm{0}.$
$\\$
1.设$A\bm{w}=\mu\bm{w}$,且$\bm{w}\in\mathbb{R}^n,\lambda\neq\mu$,证明$\bm{v},\bm{w}$正交.$\\$
2.证明,实对称矩阵的属于不同特征值的实特征向量正交.$\\$
1.证明:$\\$
$A^{\mathrm{T}}\bm{v}=\lambda\bm{v}\Rightarrow\bm{v}^{\mathrm{T}}A=\lambda\bm{v}^{\mathrm{T}}\Rightarrow\bm{v}^{\mathrm{T}}A^2\bm{w}=\mu\lambda\bm{v}^{\mathrm{T}}\bm{w}\Rightarrow\mu^2\bm{v}^{\mathrm{T}}\bm{w}=\mu\lambda\bm{v}^{\mathrm{T}}\bm{w}.$
而$\mu\neq\lambda$,于是$\bm{v}^{\mathrm{T}}\bm{w}=0.\\$
2.$\\$由1中结论立得.$\\$
5.2.12 $\quad$ 证明:
$\\$
1.若存在正整数$k$使得$A^k=O$,则$A$的特征值只能是0.$\\$
2.若$A^2=I_n$,则$A$的特征值只能是1或-1.$\\$
3.若$A^2=A$,则$A$的特征值只能是1或0.$\\$
证明:由5.2.8中结论,$\\$
1.$A^k=O\Rightarrow\lambda^k=0\Rightarrow\lambda=0.\\$
2.$A^2=I_n\Rightarrow\lambda^2=1\Rightarrow\lambda=\pm1.\\$
3.$A^2=A\Rightarrow\lambda^2=\lambda\Rightarrow\lambda=1,0.\\$
5.2.13
$\\$
略.$\\$
5.2.14 $\quad$ 设方阵$A,B$可交换,$\lambda_0$是$A$的一个特征值,$V_{\lambda_0}$是$A$的特征值为$\lambda_0$的特征子空间,证明,对任意$\bm{x}\in V_{\lambda_0}$都有$B\bm{x}\in V_{\lambda_0}$.当$A,B$不可交换时,结论是否成立?
$\\$
证明:$A\bm{x}=\lambda_0\bm{x}\Rightarrow BA\bm{x}=\lambda_0B\bm{x}\Rightarrow AB\bm{x}=\lambda_0\bm{x}.$所以$B\bm{x}\in V_{\lambda_0}.\\$
$A,B$不可交换时结论不成立。$\\$
5.2.15 $\quad$ 证明,$A$和$T^{-1}AT$具有相同的特征多项式.
$\\$
证明:$\\$
$$\det(\lambda I_n-A)=\det(\lambda T^{-1}I_nT-T^{-1}AT)=\det(\lambda I_n-T^{-1}AT).$$所以特征多项式相同.$\\$
实际上利用后面的知识可以知道,相似变换不改变特征多项式.$\\$
5.2.16 $\quad$ 设$\lambda_1,\lambda_2$是$A$的两个不同特征值,$\bm{x}_1,\bm{x}_2$是分别属于$\lambda_1,\lambda_2$的特征向量。证明,$\bm{x}_1+\bm{x}_2$不是$A$的特征向量。
$\\$
证明:$\\$
利用不同特征值对应的特征向量线性无关立得.$\\$
5.2.17 $\quad$ 证明或举出反例:
$\\$
1.如果$A$和$B$有相同的特征值、代数重数和特征向量,则$A=B.$
$\\$
不正确。$A\bm{x}=\lambda\bm{x},B\bm{x}=\lambda\bm{x}\Rightarrow(A-B)\bm{x}=0.$只需要A-B不可逆即可。$\\$
2.如果$A$和$B$有相同的特征值和代数重数,则$A-B$所有特征值之和为零.
$\\$
证明:显然$\operatorname{trace}(A)=\operatorname{trace}(B)\Rightarrow\operatorname{trace}(A-B)=0.\\$
3.$A+B$的特征值之和等于$A$的特征值之和与$B$的特征值之和的和.
$\\$
证明:$\operatorname{trace}(A+B)=\operatorname{trace}(A)+\operatorname{trace}(B).\\$
4.$A+B$的特征值之积等于$A$的特征值之积与$B$的特征值之积的积.
$\\$
不正确。$\det(A+B) \neq \det(A)\det(B).\\$
5.$AB$的特征值之积等于$A$的特征值之积与$B$的特征值之积的积.
$\\$
证明:显然$\det(AB)=\det(A)\det(B)\\$
6.$AB$和$BA$具有相同的特征值和代数重数.
$\\$
显然不正确。$AB$和$BA$形状可能都不同.$\\$
7.如果$A$的特征值全为零,则A是零矩阵.
$\\$
显然不正确。如$\begin{bmatrix}
0&1\\
0&0
\end{bmatrix}$.实际上,特征值全为0意味着$A^m=O.\\$
8.将$A$的第$i$行加到第$j$行上,再将第$i$列从第$j$列减去,得到的矩阵$B$和$A$有相同的特征值。若正确,则对应的特征向量有何联系?
$\\$
不正确。如$A=\begin{bmatrix}
0&1\\
0&0
\end{bmatrix}$.将第2行加到第1行上,再将第2列从第1列减去,得到$B=\begin{bmatrix}
-1&1\\
0&0
\end{bmatrix}$,显然$A,B$特征值不同。$\\$
9.将$A$的第$i$行加到第$j$行上,再将第$j$列从第$i$列减去,得到的矩阵$B$和$A$有相同的特征值。若正确,则对应的特征向量有何联系?
$\\$
证明:显然$B=P^{-1}AP$,所以$B\bm{x}_B=\lambda\bm{x}_B\Rightarrow P^{-1}AP=\lambda\bm{x}_B\Rightarrow AP\bm{x}_B=\lambda P\bm{x}_B\Rightarrow \bm{x}_A=P\bm{x}_B.$即$\bm{x}_B=P^{-1}\bm{x}_A.\\$
10.将$A$的第$i,j$行交换,再将第$i,j$列交换,得到的矩阵$B$和$A$有相同的特征值。若正确,则对应的特征向量有何联系?
$\\$
证明同9.$\\$
11.对角矩阵的特征向量一定是标准坐标向量.
$\\$
不正确。如$\begin{bmatrix}
1&&\\
&1&\\
&&0
\end{bmatrix}.$其特征值为1对应的特征向量不是标准坐标向量.$\\$
12.正交矩阵的特征值都是绝对值等于1的复数.
$\\$
证明:$$A\bm{x}=\lambda\bm{x}\Rightarrow\overline{\bm{x}}^{\mathrm{T}}\overline{A}^{\mathrm{T}}=\overline{\lambda}\overline{\bm{x}}^{\mathrm{T}}\Rightarrow\overline{\bm{x}}^{\mathrm{T}}\overline{A}^{\mathrm{T}}A\bm{x}=\overline{\lambda}\overline{\bm{x}}^{\mathrm{T}}A\bm{x}\Rightarrow\overline{\bm{x}}^{\mathrm{T}}\bm{x}=\lambda\overline{\lambda}\overline{\bm{x}}^{\mathrm{T}}\bm{x}.$$
即$\lambda\overline{\lambda}=1$,而$\overline{\bm{x}}^{\mathrm{T}}\bm{x}\neq0$,所以$\lambda$的模是1.$\\$
13.所有n阶置换矩阵都有一个共同的特征向量.
$\\$
正确,共同的特征向量是$k\begin{bmatrix}
1\\
1\\
\vdots\\
1
\end{bmatrix}.(k\neq 0)$$\\$
5.2.18 $\quad$ 设$A,B$分别为$m\times n,n\times m$矩阵,证明
$$\lambda^n\det(\lambda I_m-AB)=\lambda^m\det(\lambda I_n-BA).$$
特别地,当$m=n$时,$\det(\lambda I_m-AB)=\det(\lambda I_n-BA).$
$\\$
证明:模仿4.2.23证明$\\$
注意到$$\begin{bmatrix}
\sqrt{\lambda}I_n&-B\\
-A&\sqrt{\lambda}I_m
\end{bmatrix}
\begin{bmatrix}
\sqrt{\lambda}I_n&B\\
O&\sqrt{\lambda}I_m
\end{bmatrix}
=
\begin{bmatrix}
\lambda I_n&O\\
-\sqrt{\lambda}A&\lambda I_m-AB
\end{bmatrix},
$$
$$
\begin{bmatrix}
\sqrt{\lambda}I_n&B\\
O&\sqrt{\lambda}I_m
\end{bmatrix}
\begin{bmatrix}
\sqrt{\lambda}I_n&-B\\
-A&\sqrt{\lambda}I_m
\end{bmatrix}
=
\begin{bmatrix}
\lambda I_n-BA&O\\
-\sqrt{\lambda} A&\lambda I_m
\end{bmatrix}.
$$
于是
$$
\begin{align*}
\det(\begin{bmatrix}
\sqrt{\lambda}I_n&-B\\
A&\sqrt{\lambda}I_m
\end{bmatrix})
\cdot
\det(\begin{bmatrix}
\sqrt{\lambda}I_n&B\\
O&\sqrt{\lambda}I_m
\end{bmatrix})
&=
\det(\begin{bmatrix}
\lambda I_n&O\\
-\sqrt{\lambda}A&\lambda I_m-AB
\end{bmatrix})\\
&=
\lambda^n\det(I_m-AB).
\end{align*}
$$
$$
\begin{align*}
\det(\begin{bmatrix}
\sqrt{\lambda}I_n&B\\
O&\sqrt{\lambda}I_m
\end{bmatrix})
\cdot
\det(\begin{bmatrix}
\sqrt{\lambda}I_n&-B\\
-A&\sqrt{\lambda}I_m
\end{bmatrix})
&=
\det(\begin{bmatrix}
\lambda{I_n}-BA&O\\
-\sqrt{\lambda}A&\lambda I_m
\end{bmatrix})
\\&=
\lambda^m\det(\lambda I_n-BA).
\end{align*}
$$
即$$\lambda^n\det(\lambda I_m-AB)=\lambda^m\det(\lambda I_n-BA).$$
5.2.19 $\quad$ 如果复矩阵$A,B$可交换,证明$A,B$至少有一个公共的特征向量.
$\\$
证明:$\\$
法一:
$\\$
设$\bm{x}$是$A$关于$\lambda$的特征向量,$V_{\lambda}$是$A$关于$\lambda$的特征向量子空间.由于$AB$可交换,所以
$$A\bm{x}=\lambda\bm{x}\Rightarrow BA\bm{x}=\lambda B\bm{x}\Rightarrow AB\bm{x}=\lambda B\bm{x}$$
这表明$B\bm{x}$也是$A$关于$\lambda$的特征向量,即对任意$\bm{x}\in V_{\lambda},B^m\bm{x}\in V_{\lambda}.$其中$m$是任意正整数.$\\$
容易地,我们可以构造子空间$\operatorname{span}(\bm{x},B\bm{x},\cdots,B^k\bm{x})$,使得$\bm{x},B\bm{x},\cdots,B^k\bm{x}$线性无关但$B^{k+1}\bm{x}$在子空间中,显然$\operatorname{span}(\bm{x},B\bm{x},\cdots,B^k\bm{x})\subseteq V_{\lambda}.\\$
设$\lambda_B$是$B$的一个特征值,则
$$
\begin{align*}
(B-\lambda_BI_n)(\beta_0\bm{x}+\beta_1B\bm{x}+\cdots+\beta_kB^k\bm{x})=0.\\ \Rightarrow \beta_kB^{k+1}\bm{x}+(\beta_{k-1}-\lambda_B\beta_{k})B^{k}\bm{x}+\cdots-\lambda_B\beta_0\bm{x}=0
\end{align*}
$$
因为$\bm{x},B\bm{x},\cdots,B^k\bm{x},B^{k+1}\bm{x}$线性相关,所以一定存在不全为零的一组$\beta_0,\cdots,\beta_k$使$(B-\lambda_BI_n)(\beta_0\bm{x}+\beta_1B\bm{x}+\cdots+\beta_kB^k\bm{x})=0$成立。这表明$\beta_0\bm{x}+\beta_1B\bm{x}+\cdots+\beta_kB^k\bm{x}\in \operatorname{span}(\bm{x},B\bm{x},\cdots,B^k\bm{x})$是$B$的一个特征向量。$\\$
又因为$\operatorname{span}(\bm{x},B\bm{x},\cdots,B^k\bm{x})\subseteq V_{\lambda}.$所以$\operatorname{span}(\bm{x},B\bm{x},\cdots,B^k\bm{x})$中一定有$A,B$公共的特征向量。$\\$
法二:
$\\$
设$\bm{x}$是$A$关于$\lambda$的特征向量,$V_{\lambda}$是$A$关于$\lambda$的特征向量子空间.由于$AB$可交换,所以
$$A\bm{x}=\lambda\bm{x}\Rightarrow BA\bm{x}=\lambda B\bm{x}\Rightarrow AB\bm{x}=\lambda B\bm{x}$$
这表明$B\bm{x}$也是$A$关于$\lambda$的特征向量,即对任意$\bm{x}\in V_{\lambda},B^m\bm{x} \in V_{\lambda}, f(B)\bm{x} \in V_{\lambda}.$其中$m$是任意正整数,$f(\cdot)$是任意次多项式.$\\$
由Hamilton-Cayley定理,$(B-\lambda_1I_n)(B-\lambda_2I_n)\cdots(B-\lambda_nI_n)=O.$所以对任意$\bm{x} \in V_{\lambda}$有$ (B-\lambda_1I_n)(B-\lambda_2I_n)\cdots(B-\lambda_nI_n)\bm{x}=\bm{0}$。若$(B-\lambda_2I_n)\cdots(B-\lambda_nI_n)\bm{x}\neq \bm{0}$,则$(B-\lambda_2I_n)\cdots(B-\lambda_nI_n)\bm{x}$是$B$的一个特征向量。而$(B-\lambda_2I_n)\cdots(B-\lambda_nI_n)\bm{x} \in V_{\lambda}$,所以他是$A,B$共同的特征向量。$\\$
若$(B-\lambda_2I_n)(B-\lambda_3I_n)\cdots(B-\lambda_nI_n)\bm{x}=\bm{0}$(这是可能的,因为矩阵不可逆),我们需要继续考察向量$(B-\lambda_3I_n)\cdots(B-\lambda_nI_n)\bm{x}$是否是零向量。如果不是,那么$(B-\lambda_3I_n)\cdots(B-\lambda_nI_n)\bm{x}$是$B$的一个特征向量,同时$(B-\lambda_3I_n)\cdots(B-\lambda_nI_n)\bm{x}$显然也是$A$的一个特征向量。如果向量是零向量,就需要继续拆分。以此类推,直到$(B-\lambda_nI_n)\bm{x}=\bm{0}$,由于$\bm{x}\neq\bm{0}$,所以$\bm{x}$是$B$的一个特征向量,显然也是$A$的一个特征向量。$\\$
即若$A,B$可交换,则$A,B$至少有一个公共的特征向量。$\\$
5.2.20
$\\$
略.$\\$
5.2.21 $\quad$ 设方阵$A$的每个元素都是整数,证明$\frac{1}{2}$一定不是$A$的特征值.
$\\$
证明:$\\$
因为方阵所有元素均为整数,所以特征多项式的所有系数也为整数。而根据数论结论,首项系数为1的整系数多项式的根是整数,所以$\frac{1}{2}$一定不是$A$的特征值.$\\$
5.2.22
$\\$
略.$\\$
5.2.23 $\quad$ 给定$m$阶方阵$A_1$,$n$阶上三角矩阵$A_2$和$m\times n$矩阵B。证明如果$A_1$和$A_2$没有相同的特征值,关于$m\times n$矩阵$X$的矩阵方程$A_1X-XA_2=B$有唯一解.矩阵方程$A_1X-XA_2=B$称为Sylvester方程,在控制论中有不少应用.
$\\$
证明:$\\$
$A_1X-XA_2=B$有唯一解等价于$A_1X-XA_2=O$只有零解.$\\$
设$A_2=\begin{bmatrix}
b_{11}&b_{12}&\cdots&b_{1n}\\
&b_{22}&\cdots&b_{2n}\\
&&\ddots&\vdots\\
&&&b_{nn}\\
\end{bmatrix}$.$X=\begin{bmatrix}
x_{11}&x_{12}&\cdots&x_{1n}\\
x_{21}&x_{22}&\cdots&x_{2n}\\
\vdots&\vdots&&\vdots\\
x_{m1}&x_{m2}&\cdots&x_{mn}\\
\end{bmatrix}.\\$
将$X$按列排列成列向量得,
$$\begin{bmatrix}
A_1-b_{11}I_m&\\
-b_{12}I_m&A_1-b_{22}I_m&\\
\vdots&&\ddots&\\
-b_{1n}I_m&-b_{2n}I_m&\cdots&A_1-b_{nn}I_m
\end{bmatrix}
\begin{bmatrix}
x_{11}\\
x_{21}\\
\vdots\\
x_{m1}\\
\vdots\\
x_{mn}
\end{bmatrix}=O.$$
由于左边矩阵是分块下三角阵,其行列式显然为$$\det(A_1-b_{11}I_m)\det(A_1-b_{22}I_m)\cdots\det(A_1-b_{nn}I_m).$$
显然方程只有零解当且仅当矩阵行列式不为0,即特征值$\lambda\neq b_{11},b_{22},\cdots,b_{nn}.$而$A_2$的特征值恰好是$b_{11},b_{22},\cdots,b_{nn}$。所以若$A_1$和$A_2$没有相同的特征值,Sylvester方程有唯一解。