5.4 相似
5.4.1 $\quad$ 设$A,B$是$n$阶方阵,且满足$AB=BA.$
$\\$
1. 证明,若$A$有$n$个不同的特征值,则$B$可对角化。$\\$
2. 若$A$有代数重数大于1的特征值,则$B$是否一定可对角化?$\\$
1. 证明:$\\$
先证引理:与对角元素均不同的对角矩阵可交换的矩阵一定是对角矩阵。$\\$
设$n$阶方阵$S$和对角元素均不同的对角矩阵$\varLambda$滿足$S\varLambda=\varLambda S$,即
$$
\begin{bmatrix}
\lambda_1&&&\\
&\lambda_2&&\\
&&\ddots&\\
&&&\lambda_n
\end{bmatrix}
\begin{bmatrix}
s_{11}&s_{12}&\cdots&s_{1n}\\
s_{21}&s_{22}&\cdots&s_{2n}\\
\vdots&\vdots&&\vdots\\
s_{n1}&s_{n2}&\cdots&s_{nn}\\
\end{bmatrix}
=
\begin{bmatrix}
s_{11}&s_{12}&\cdots&s_{1n}\\
s_{21}&s_{22}&\cdots&s_{2n}\\
\vdots&\vdots&&\vdots\\
s_{n1}&s_{n2}&\cdots&s_{nn}\\
\end{bmatrix}
\begin{bmatrix}
\lambda_1&&&\\
&\lambda_2&&\\
&&\ddots&\\
&&&\lambda_n
\end{bmatrix}
$$
化简后得,$(\lambda_i-\lambda_j)s_{ij}=0$。而当$i \neq j$时,$(\lambda_i-\lambda_j)\neq 0$,所以$s_{ij}=0 (i\neq j)$。即$S$是对角矩阵。$\\$
引理证毕。$\\$
$A$有$n$个不同的特征值$\implies$ $A$可对角化,即存在可逆矩阵$X$使得$A=X \varLambda X^{-1}$,其中$\varLambda$是对角元素均不同的对角矩阵。$\\$
$AB=BA \implies X \varLambda X^{-1}B=BX \varLambda X^{-1} \implies \varLambda X^{-1}BX=X^{-1}BX \varLambda \implies X^{-1}BX$是对角矩阵。所以$B$可对角化。$\\$
2. 解:$\\$
不一定。若$A=I_n$,则对任意的$n$阶矩阵$B$都有$AB=BA$。$\\$
5.4.2 $\quad$ 对下列矩阵$A,B$,求$X$使得$A=XBX^{-1}.$
$\\$
1. $A=MN,B=NM$,其中$M,N$是方阵,且$M$可逆。$\\$
2. $A=\begin{bmatrix}
MN&O\\
N&O
\end{bmatrix}, B=\begin{bmatrix}
O&O\\
N&NM
\end{bmatrix},$其中$M,N$不必是方阵。$\\$
3. $A=\begin{bmatrix}
M&-N\\
N&M
\end{bmatrix}, B=\begin{bmatrix}
M+iN&O\\
O&M-iN
\end{bmatrix},$其中$M,N$是方阵。$\\$
1.$X=M.\quad $
2.$X=\begin{bmatrix}
I_m&M\\
O&I_n\\
\end{bmatrix} \quad $
3.$X=\begin{bmatrix}
I_n&I_n\\
-iI_n&iI_n\\
\end{bmatrix}\\$
5.4.3 $\quad$ 给定$n$阶方阵$A,B$满足$AB=BA.$
$\\$
1. 证明,若$A$有$n$个不同的特征值,则存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A).$$\\$
2. 证明,若$A=J_n(\lambda)$,则存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A).$$\\$
3. 举例说明,存在$A,B$满足$AB=BA$,但不存在多项式$f(x)$,使得$B=f(A).$$\\$
1. 证明:$\\$
因为$A$有$n$个不同的特征值,且$AB=BA$,则根据5.4.1中结论可知,$A,B$可以同时对角化。即存在$X$使$A=X\varLambda_AX^{-1},B=X\varLambda_BX^{-1}$。其中$\varLambda_A=\operatorname{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n),\lambda_1\neq\lambda_2\neq\cdots\neq\lambda_n. \varLambda_B=\operatorname{diag}(b_1,b_2,\cdots,b_n).\\$
又因为Vandermonde矩阵$\begin{bmatrix}
1&\lambda_1&\lambda_1^2&\cdots&\lambda_1^{n-1}\\
1&\lambda_2&\lambda_2^2&\cdots&\lambda_2^{n-1}\\
\vdots&\vdots&\vdots&&\vdots\\
1&\lambda_n&\lambda_n^2&\cdots&\lambda_n^{n-1}\\
\end{bmatrix}$可逆,所以方程$$
\begin{bmatrix}
1&\lambda_1&\lambda_1^2&\cdots&\lambda_1^{n-1}\\
1&\lambda_2&\lambda_2^2&\cdots&\lambda_2^{n-1}\\
\vdots&\vdots&\vdots&&\vdots\\
1&\lambda_n&\lambda_n^2&\cdots&\lambda_n^{n-1}\\
\end{bmatrix}
\begin{bmatrix}
k_0\\
k_1\\
\vdots\\
k_{n-1}\\
\end{bmatrix}=
\begin{bmatrix}
b_1\\
b_2\\
\vdots\\
b_n\\
\end{bmatrix}
$$一定有解。即存在一组$k_1,k_2,\cdots,k_n$,使得$\varLambda_B=k_0I_n+k_1\varLambda_A+\cdots+k_{n-1}\varLambda_A^{n-1}$成立。等式两边同时左乘$X$,右乘$X^{-1}$得$B=k_0I_n+k_1A+\cdots+k_{n-1}A^{n-1}$。即存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A)$。$\\$
2. 证明:$\\$
设$A=\lambda I_n+S$,其中$S=\begin{bmatrix}
0&1&&&\\
&0&1&&\\
&&\ddots&\ddots&\\
&&&\ddots&1\\
&&&&0\\
\end{bmatrix}.\\$
而$AB=BA \implies (\lambda I_n+S)B=B(\lambda I_n+S) \implies SB=BS.$这表明$B$所有行向量上移一格和$B$所有列向量右移一格得到的矩阵相同。于是$B$可以被表示为:$$
B=\begin{bmatrix}
b_1&b_2&\cdots&b_n\\
&b_1&\ddots&\vdots\\
&&\ddots&b_2\\
&&&b_1\\
\end{bmatrix}
$$
注意到,$$
A^k=\begin{bmatrix}
\lambda^k&C^1_k\lambda^{k-1}&C^2_k\lambda^{k-2}&\cdots&1&&\\
&\lambda^k&C^1_k\lambda^{k-1}&C^2_k\lambda^{k-2}&&\ddots&&\\
&&\lambda^k&C^1_k\lambda^{k-1}&\ddots&&1\\
&&&\lambda^k&\ddots&\ddots&\vdots\\
&&&&\ddots&\ddots&C^2_k\lambda^{k-2}\\
&&&&&\ddots&C^1_k\lambda^{k-1}\\
&&&&&&\lambda^k
\end{bmatrix}
$$其中$k \leq n.$ $\\$
可以发现$A^k$和$B$具有相同的形式。于是原命题(存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A)$)等价于下列方程有解。
$$
\begin{bmatrix}
1&\lambda&\lambda^2&\cdots&\lambda^{n-1}\\
&1&2\lambda&\cdots&C^2_{n-1}\lambda^{n-1}\\
&&1&&\vdots\\
&&&\ddots&\vdots\\
&&&&1
\end{bmatrix}
\begin{bmatrix}
k_1\\
k_2\\
\vdots\\
\vdots\\
k_n
\end{bmatrix}
=
\begin{bmatrix}
b_1\\
b_2\\
\vdots\\
\vdots\\
b_n
\end{bmatrix}
$$
左侧矩阵行列式为1,所以矩阵可逆,方程有唯一解,命题成立。$\\$
3. 解:$\\$
设$A=I_n$,$B$是任意不是对角阵的矩阵。显然有$AB=I_nB=BI_n=BA.$但不存在多项式$f(x)$使$B=f(A)$。$\\$
5.4.4 $\quad$ 证明,任意迹为0的方阵相似于一个对角元素全为0的方阵。
$\\$
证明:$\\$
用数学归纳法。当阶数为$1$时,显然成立。$\\$
现假设阶数为$n-1$时命题成立,考虑$n$阶方阵$A$。在$\mathbb{R}^n$中取一向量$\bm{q}$,但$\bm{q}$不是$A$的特征向量(若不存在这样的$\bm{q}$,说明$A$是零矩阵,命题显然成立。)此时$\bm{q},A\bm{q}$线性无关。将$\bm{q},A\bm{q}$张成$\mathbb{R}^n$的一组基$(\bm{q},A\bm{q},\bm{b}_3,\bm{b}_4,\cdots,\bm{b}_n)$。设$B=\begin{bmatrix}
\bm{q}&A\bm{q}&\bm{b}_3&\cdots&\bm{b}_n
\end{bmatrix}$,显然$B$是$n$阶可逆矩阵。$\\$
注意到$AB=\begin{bmatrix}
A\bm{q}&A^2\bm{q}&\cdots&A\bm{b}_n
\end{bmatrix}$,即$B$的第二列在左乘$A$之后被移到了第一列。于是$$AB=B\begin{bmatrix}
\bm{e}_2&\cdots&\cdots
\end{bmatrix}=B\begin{bmatrix}
0&\bm{x}^{\mathrm{T}}\\
\bm{s}&C
\end{bmatrix}$$
其中$\bm{x}\in\mathbb{R}^{n-1},C\in\mathbb{R}^{(n-1)\times(n-1)},\bm{s}=\begin{bmatrix}
1\\
0\\
\vdots\\
0
\end{bmatrix}.$ $\\$
等式两边左乘$B^{-1}$得,$A$相似于$\begin{bmatrix}
0&\bm{x}^{\mathrm{T}}\\
\bm{s}&C
\end{bmatrix}$。因为相似不改变特征值且$\operatorname{trace}(A)=0$,所以$\operatorname{trace}(C)=0$。$\\$
根据归纳假设,对$n-1$阶方阵$C$,若$\operatorname{trace}(C)=0$,则存在可逆矩阵$Z$使得$Z^{-1}CZ$的对角元全是$0$. $\\$
于是
$$
\begin{bmatrix}
1&O\\
O&Z
\end{bmatrix}^{-1}
\begin{bmatrix}
0&\bm{x}^{\mathrm{T}}\\
\bm{s}&C
\end{bmatrix}
\begin{bmatrix}
1&O\\
O&Z
\end{bmatrix}
=
\begin{bmatrix}
0&\bm{x}^{\mathrm{T}}Z\\
Z^{-1}\bm{s}&Z^{-1}CZ
\end{bmatrix}
$$
根据相似的传递性,$A$也相似于一个对角元全是$0$的矩阵。由阶数为$n-1$时命题成立可推出阶数为$n$时也成立,所以阶数为$n \geq 1$时均成立。$\\$
5.4.5 $\quad$ 利用Jordan标准型证明,$A$与$A^{\mathrm{T}}$相似。
$\\$
证明:$\\$
显然$A$和$A^{\mathrm{T}}$具有相同的特征值,代数重数,几何重数。所以他们相似于同一个Jordan标准型。由相似的传递性和对称性可知$A$和$A^{\mathrm{T}}$相似。$\\$
5.4.6 (Jordan链) $\quad$ 对任意$n$阶方阵$A$,一组向量$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s$,如果存在$\lambda \in \mathbb{C}$,使得$x_1 \neq 0, (A-\lambda I)\bm{x}_1=\bm{0},(A-\lambda I)\bm{x}_2=\bm{x}_1,\cdots,(A-\lambda I)\bm{x}_s=\bm{x}_{s-1}$,而$(A-\lambda I)\bm{y}=\bm{x}_s$无解,就称其为$A$的一个关于$\lambda$长度为$s$的Jordan链。$\\$显然$\bm{x}_1 \in \mathcal{N}(A-\lambda I)$是特征向量,$\bm{x}_2 \in \mathcal{N}((A-\lambda I)^2),\cdots,\bm{x}_s \in \mathcal{N}((A-\lambda I)^s)$,但$\bm{x}_s \notin \mathcal{R}(A-\lambda I).\\$求证:
$\\$
1. $\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s$线性无关。$\\$
2. 令$X_1=\begin{bmatrix}\bm{x}_1&\bm{x}_2&\cdots&\bm{x}_s\end{bmatrix}$,则$AX_1=X_1J_s(\lambda)$。 $\\$
3. 若$A$只有一个特征值,且其几何重数是1,则$A$相似于$J_n(\lambda)$,且有一个关于$\lambda$的长度为$n$的Jordan链$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n$。$\\$
1. 证明:$\\$
设$k_1\bm{x}_1+k_2\bm{x}_2+\cdots+k_s\bm{x}_s=0$,$\\$两边同时左乘$(A-\lambda I)^{s-1}$得$k_1(A-\lambda I)^{s-1}\bm{x}_1+k_2(A-\lambda I)^{s-1}\bm{x}_2+\cdots+k_s(A-\lambda I)^{s-1}\bm{x}_s=0 \implies k_s\bm{x}_1=0 \implies k_s=0 \\$
两边同时左乘$(A-\lambda I)^{s-2}$得$k_1(A-\lambda I)^{s-2}\bm{x}_1+k_2(A-\lambda I)^{s-2}\bm{x}_2+\cdots+k_{s-1}(A-\lambda I)^{s-2}\bm{x}_{s-1}=0 \implies k_{s-1}\bm{x}_1=0 \implies k_{s-1}=0 \\$
同理可得$k_1=k_2=\cdots=k_s=0$,所以$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s$线性无关。$\\$
2. 证明:$\\$
显然$A\bm{x}_1=\lambda\bm{x}_1,A\bm{x}_2=\lambda\bm{x}_2+\bm{x}_1,\cdots,A\bm{x}_s=\lambda\bm{x}_s+\bm{x}_{s-1}. \\$
即$$
AX_1=\begin{bmatrix}
A\bm{x}_1&A\bm{x}_2&\cdots&A\bm{x}_s
\end{bmatrix}=
\begin{bmatrix}
\bm{x}_1&\bm{x}_2&\cdots&\bm{x}_s
\end{bmatrix}
\begin{bmatrix}
\lambda&1&&\\
&\lambda&\ddots&\\
&&\ddots&1\\
&&&\lambda
\end{bmatrix}=
X_1J_s(\lambda)
$$证毕。$\\$
3. 证明:$\\$
由Jordan标准型立得,$A$相似于$J_n(\lambda)$,即存在可逆矩阵$X$,使得$A=XJ_n(\lambda)X^{-1}\implies AX=XJ_n(\lambda).\\ $
设$X=\begin{bmatrix}
\bm{x}_1&\bm{x}_2&\cdots&\bm{x}_n
\end{bmatrix}$,由第(2)小问可以知道$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n$是Jordan链。因为Jordan链长度最多只能是n,所以$A$有一个关于$\lambda$的长度为$n$的Jordan链$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n$。$\\$
5.4.7 $\quad$ 给定$m$阶方阵$A_1$,$n$阶方阵$A_2$和$m \times n$矩阵$B$,证明:
$\\$
1. 如果$A_1$和$A_2$没有相同的特征值,则关于$m \times n$矩阵$X$的Sylvester方程$A_1X-XA_2=B$有唯一解。$\\$
证明:$\\$
$A_1X-XA_2=B$有唯一解等价于$A_1X-XA_2=O$只有零解。$\\$
$A_1X-XA_2=O\implies A_1X=XA_2\implies$等式两边左乘$A_1$得$A_1^2X=A_1XA_2\implies A_1^2X=XA_2^2.$以此类推,可以得到$A_1^kX=XA_2^k$,其中$k$是正整数。设$A_1$的特征多项式是$p(x)$,于是有$$p(A_1)X=Xp(A_2)$$由Hamilton-Cayley定理,$p(A_1)=O \implies Xp(A_2)=O.\\$
$p(A_2)$显然是个$n$阶方阵,下面我们证明其可逆。$\\$
设$A_2=Z^{-1}JZ$,其中$J$是Jordan标准型,则
$$\det(p(A_2))=\det(p(J))=\det(J-\lambda_1I_{n_1})\det(J-\lambda_2I_{n_2})\cdots\det(J-\lambda_sI_{n_s})$$
其中$\lambda_1,\lambda_2,\cdots,\lambda_s$是$A_1$的特征值。$\\$
因为$A_1,A_2$没有共同的特征值,所以$\det(J-\lambda_1I_{n_1}),\cdots,\det(J-\lambda_sI_{n_s})$均不为$0$,即$\det(p(A_2))\neq 0$,$p(A_2)$可逆。$\\$
而$Xp(A_2)=O$,这说明$\mathcal{N}(X)=\mathbb{R}^n$,即$X=O$。所以若$A_1$和$A_2$没有相同的特征值,则关于$m \times n$矩阵$X$的Sylvester方程$A_1X-XA_2=B$有唯一解。$\\$
2. 如果$A_1$和$A_2$没有相同的特征值,则存在唯一的矩阵$X$满足
$$
\begin{bmatrix}
I_m&X\\
O&I_n
\end{bmatrix}
\begin{bmatrix}
A_1&B\\
O&A_2
\end{bmatrix}
\begin{bmatrix}
I_m&X\\
O&I_n
\end{bmatrix}^{-1}=
\begin{bmatrix}
A_1&O\\
O&A_2
\end{bmatrix}.
$$
证明:$\\$
注意到$\begin{bmatrix}
I_m&X\\
O&I_n\\
\end{bmatrix}^{-1}=\begin{bmatrix}
I_m&-X\\
O&I_n\\
\end{bmatrix}$,于是等式左边用矩阵乘法展开得到
$$
\begin{bmatrix}
A_1&B+XA_2-A_1X\\
O&A_2\\
\end{bmatrix}
=
\begin{bmatrix}
A_1&O\\
O&A_2
\end{bmatrix}.
$$
所以原命题等价于:如果$A_1$和$A_2$没有相同的特征值,则存在唯一的矩阵$X$满足$A_1X-XA_2=B$。这正是第(1)问已经证明的结论。$\\$
3.对$n$阶方阵$A$,存在可逆矩阵$X$,使得
$$
X^{-1}AX=\begin{bmatrix}
\lambda_1I+N_1&&&\\
&\lambda_2I+N_2&&\\
&&\ddots&\\
&&&\lambda_sI+N_s
\end{bmatrix},
$$
其中$N_1,N_2,\cdots,N_s$是严格上三角阵。$\\$
证明:$\\$
由Jordan标准型立得。$\\$
4. 如果$m>n$且$A_1=J_m(0),A_2=J_n(0),B=\bm{e}_1\bm{b}^{\mathrm{T}}$,即$B$除第一行外元素全为0,则关于$m \times n$矩阵$X$的Sylvester方程$A_1X-XA_2=B$有解,于是存在矩阵$X$满足
$$
\begin{bmatrix}
I_m&X\\
O&I_n
\end{bmatrix}
\begin{bmatrix}
A_1&B\\
O&A_2
\end{bmatrix}
\begin{bmatrix}
I_m&X\\
O&I_n
\end{bmatrix}^{-1}=
\begin{bmatrix}
A_1&O\\
O&A_2
\end{bmatrix}.
$$
证明:$\\$
设$X=\begin{bmatrix}
\bm{x}_1^{\mathrm{T}}\\
\bm{x}_2^{\mathrm{T}}\\
\vdots\\
\bm{x}_m^{\mathrm{T}}\\
\end{bmatrix}
=
\begin{bmatrix}
x_{11}&x_{12}&\cdots&x_{1n}\\
x_{21}&x_{22}&\cdots&x_{2n}\\
\vdots&\vdots&&\vdots\\
x_{m1}&x_{m2}&\cdots&x_{mn}\\
\end{bmatrix},
B=\begin{bmatrix}
\bm{b}^{\mathrm{T}}\\
\bm{0}^{\mathrm{T}}\\
\vdots\\
\bm{0}^{\mathrm{T}}\\
\end{bmatrix}
=
\begin{bmatrix}
b_1&b_2&\cdots&b_n\\
0&0&\cdots&0\\
\vdots&\vdots&&\vdots\\
0&0&\cdots&0
\end{bmatrix} \\$
直接用矩阵乘法计算$A_1X-XA_2=B$得,
$$
\begin{bmatrix}
x_{21}&x_{22}-x_{11}&x_{23}-x_{12}&\cdots&x_{2n}-x_{1,n-1}\\
x_{31}&x_{32}-x_{21}&x_{33}-x_{22}&\cdots&x_{3n}-x_{2,n-1}\\
\vdots&\vdots&\vdots&&\vdots \\
x_{m1}&x_{m2}-x_{m-1,1}&x_{m3}-x_{m-1,2}&\cdots&x_{mn}-x_{m-1,n-1}\\
0&-x_{m1}&-x_{m2}&\cdots&-x_{m,n-1}
\end{bmatrix}
=
\begin{bmatrix}
b_1&b_2&\cdots&b_n\\
0&0&\cdots&0\\
\vdots&\vdots&&\vdots \\
0&0&\cdots&0\\
0&0&\cdots&0
\end{bmatrix}
$$
将$X$按行排列成列向量,
$$
\begin{bmatrix}
-J_n^{\mathrm{T}}(0)&I_n&&\\
&-J_n^{\mathrm{T}}(0)&\ddots&\\
&&\ddots&I_n\\
&&&-J_n^{\mathrm{T}}(0)
\end{bmatrix}
\begin{bmatrix}
\bm{x}_1\\
\bm{x}_2\\
\vdots\\
\bm{x}_m\\
\end{bmatrix}
=
\begin{bmatrix}
\bm{b}\\
\bm{0}\\
\vdots\\
\bm{0}
\end{bmatrix}
$$
显然系数矩阵的秩和增广矩阵秩相等,方程有解。$\\$
5. 对$n$阶方阵$A=\begin{bmatrix}
J_{k_1}(0)&\bm{e}_1\bm{a}_2^{\mathrm{T}}&\cdots&\bm{e}_1\bm{a}_r^{\mathrm{T}}\\
&J_{k_2}(0)&&\\
&&\ddots&\\
&&&J_{k_r}(0)
\end{bmatrix}$,其中$k_1>k_2\geq\cdots\geq k_r$(即$A$是一个Jordan标准型与除第一行外元素全为0矩阵的和),存在可逆矩阵$X$,使得
$$
X^{-1}AX=\begin{bmatrix}
J_{k_1}(0)&&&\\
&J_{k_2}(0)&&\\
&&\ddots&\\
&&&J_{k_r}(0)
\end{bmatrix}.
$$
证明:$\\$
设$J=\begin{bmatrix}
J_{k_2}(0)&&\\
&\ddots&\\
&&J_{k_n}(0)
\end{bmatrix},B=\begin{bmatrix}
\bm{e}_1\bm{a}_2^{\mathrm{T}}&\cdots&\bm{e}_1\bm{a}_r^{\mathrm{T}}
\end{bmatrix}\\$
则$A=\begin{bmatrix}
J_{k_1}(0)&B\\
O&J
\end{bmatrix}.\\$由(2)(4)小问结论可知,命题显然成立。