当前位置:HOME - 线性代数入门答案 - 5.4 相似

5.4 相似

5.4.1 $\quad$ 设$A,B$是$n$阶方阵,且满足$AB=BA.$
$\\$ 1. 证明,若$A$有$n$个不同的特征值,则$B$可对角化。$\\$ 2. 若$A$有代数重数大于1的特征值,则$B$是否一定可对角化?$\\$ 1. 证明:$\\$ 先证引理:与对角元素均不同的对角矩阵可交换的矩阵一定是对角矩阵。$\\$ 设$n$阶方阵$S$和对角元素均不同的对角矩阵$\varLambda$滿足$S\varLambda=\varLambda S$,即 $$ \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n \end{bmatrix} \begin{bmatrix} s_{11}&s_{12}&\cdots&s_{1n}\\ s_{21}&s_{22}&\cdots&s_{2n}\\ \vdots&\vdots&&\vdots\\ s_{n1}&s_{n2}&\cdots&s_{nn}\\ \end{bmatrix} = \begin{bmatrix} s_{11}&s_{12}&\cdots&s_{1n}\\ s_{21}&s_{22}&\cdots&s_{2n}\\ \vdots&\vdots&&\vdots\\ s_{n1}&s_{n2}&\cdots&s_{nn}\\ \end{bmatrix} \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n \end{bmatrix} $$ 化简后得,$(\lambda_i-\lambda_j)s_{ij}=0$。而当$i \neq j$时,$(\lambda_i-\lambda_j)\neq 0$,所以$s_{ij}=0 (i\neq j)$。即$S$是对角矩阵。$\\$ 引理证毕。$\\$ $A$有$n$个不同的特征值$\implies$ $A$可对角化,即存在可逆矩阵$X$使得$A=X \varLambda X^{-1}$,其中$\varLambda$是对角元素均不同的对角矩阵。$\\$ $AB=BA \implies X \varLambda X^{-1}B=BX \varLambda X^{-1} \implies \varLambda X^{-1}BX=X^{-1}BX \varLambda \implies X^{-1}BX$是对角矩阵。所以$B$可对角化。$\\$ 2. 解:$\\$ 不一定。若$A=I_n$,则对任意的$n$阶矩阵$B$都有$AB=BA$。$\\$
5.4.2 $\quad$ 对下列矩阵$A,B$,求$X$使得$A=XBX^{-1}.$
$\\$ 1. $A=MN,B=NM$,其中$M,N$是方阵,且$M$可逆。$\\$ 2. $A=\begin{bmatrix} MN&O\\ N&O \end{bmatrix}, B=\begin{bmatrix} O&O\\ N&NM \end{bmatrix},$其中$M,N$不必是方阵。$\\$ 3. $A=\begin{bmatrix} M&-N\\ N&M \end{bmatrix}, B=\begin{bmatrix} M+iN&O\\ O&M-iN \end{bmatrix},$其中$M,N$是方阵。$\\$ 1.$X=M.\quad $ 2.$X=\begin{bmatrix} I_m&M\\ O&I_n\\ \end{bmatrix} \quad $ 3.$X=\begin{bmatrix} I_n&I_n\\ -iI_n&iI_n\\ \end{bmatrix}\\$
5.4.3 $\quad$ 给定$n$阶方阵$A,B$满足$AB=BA.$
$\\$ 1. 证明,若$A$有$n$个不同的特征值,则存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A).$$\\$ 2. 证明,若$A=J_n(\lambda)$,则存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A).$$\\$ 3. 举例说明,存在$A,B$满足$AB=BA$,但不存在多项式$f(x)$,使得$B=f(A).$$\\$ 1. 证明:$\\$ 因为$A$有$n$个不同的特征值,且$AB=BA$,则根据5.4.1中结论可知,$A,B$可以同时对角化。即存在$X$使$A=X\varLambda_AX^{-1},B=X\varLambda_BX^{-1}$。其中$\varLambda_A=\operatorname{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n),\lambda_1\neq\lambda_2\neq\cdots\neq\lambda_n. \varLambda_B=\operatorname{diag}(b_1,b_2,\cdots,b_n).\\$ 又因为Vandermonde矩阵$\begin{bmatrix} 1&\lambda_1&\lambda_1^2&\cdots&\lambda_1^{n-1}\\ 1&\lambda_2&\lambda_2^2&\cdots&\lambda_2^{n-1}\\ \vdots&\vdots&\vdots&&\vdots\\ 1&\lambda_n&\lambda_n^2&\cdots&\lambda_n^{n-1}\\ \end{bmatrix}$可逆,所以方程$$ \begin{bmatrix} 1&\lambda_1&\lambda_1^2&\cdots&\lambda_1^{n-1}\\ 1&\lambda_2&\lambda_2^2&\cdots&\lambda_2^{n-1}\\ \vdots&\vdots&\vdots&&\vdots\\ 1&\lambda_n&\lambda_n^2&\cdots&\lambda_n^{n-1}\\ \end{bmatrix} \begin{bmatrix} k_0\\ k_1\\ \vdots\\ k_{n-1}\\ \end{bmatrix}= \begin{bmatrix} b_1\\ b_2\\ \vdots\\ b_n\\ \end{bmatrix} $$一定有解。即存在一组$k_1,k_2,\cdots,k_n$,使得$\varLambda_B=k_0I_n+k_1\varLambda_A+\cdots+k_{n-1}\varLambda_A^{n-1}$成立。等式两边同时左乘$X$,右乘$X^{-1}$得$B=k_0I_n+k_1A+\cdots+k_{n-1}A^{n-1}$。即存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A)$。$\\$ 2. 证明:$\\$ 设$A=\lambda I_n+S$,其中$S=\begin{bmatrix} 0&1&&&\\ &0&1&&\\ &&\ddots&\ddots&\\ &&&\ddots&1\\ &&&&0\\ \end{bmatrix}.\\$ 而$AB=BA \implies (\lambda I_n+S)B=B(\lambda I_n+S) \implies SB=BS.$这表明$B$所有行向量上移一格和$B$所有列向量右移一格得到的矩阵相同。于是$B$可以被表示为:$$ B=\begin{bmatrix} b_1&b_2&\cdots&b_n\\ &b_1&\ddots&\vdots\\ &&\ddots&b_2\\ &&&b_1\\ \end{bmatrix} $$ 注意到,$$ A^k=\begin{bmatrix} \lambda^k&C^1_k\lambda^{k-1}&C^2_k\lambda^{k-2}&\cdots&1&&\\ &\lambda^k&C^1_k\lambda^{k-1}&C^2_k\lambda^{k-2}&&\ddots&&\\ &&\lambda^k&C^1_k\lambda^{k-1}&\ddots&&1\\ &&&\lambda^k&\ddots&\ddots&\vdots\\ &&&&\ddots&\ddots&C^2_k\lambda^{k-2}\\ &&&&&\ddots&C^1_k\lambda^{k-1}\\ &&&&&&\lambda^k \end{bmatrix} $$其中$k \leq n.$ $\\$ 可以发现$A^k$和$B$具有相同的形式。于是原命题(存在次数不超过$n-1$的多项式$f(x)$,使得$B=f(A)$)等价于下列方程有解。 $$ \begin{bmatrix} 1&\lambda&\lambda^2&\cdots&\lambda^{n-1}\\ &1&2\lambda&\cdots&C^2_{n-1}\lambda^{n-1}\\ &&1&&\vdots\\ &&&\ddots&\vdots\\ &&&&1 \end{bmatrix} \begin{bmatrix} k_1\\ k_2\\ \vdots\\ \vdots\\ k_n \end{bmatrix} = \begin{bmatrix} b_1\\ b_2\\ \vdots\\ \vdots\\ b_n \end{bmatrix} $$ 左侧矩阵行列式为1,所以矩阵可逆,方程有唯一解,命题成立。$\\$ 3. 解:$\\$ 设$A=I_n$,$B$是任意不是对角阵的矩阵。显然有$AB=I_nB=BI_n=BA.$但不存在多项式$f(x)$使$B=f(A)$。$\\$
5.4.4 $\quad$ 证明,任意迹为0的方阵相似于一个对角元素全为0的方阵。
$\\$ 证明:$\\$ 用数学归纳法。当阶数为$1$时,显然成立。$\\$ 现假设阶数为$n-1$时命题成立,考虑$n$阶方阵$A$。在$\mathbb{R}^n$中取一向量$\bm{q}$,但$\bm{q}$不是$A$的特征向量(若不存在这样的$\bm{q}$,说明$A$是零矩阵,命题显然成立。)此时$\bm{q},A\bm{q}$线性无关。将$\bm{q},A\bm{q}$张成$\mathbb{R}^n$的一组基$(\bm{q},A\bm{q},\bm{b}_3,\bm{b}_4,\cdots,\bm{b}_n)$。设$B=\begin{bmatrix} \bm{q}&A\bm{q}&\bm{b}_3&\cdots&\bm{b}_n \end{bmatrix}$,显然$B$是$n$阶可逆矩阵。$\\$ 注意到$AB=\begin{bmatrix} A\bm{q}&A^2\bm{q}&\cdots&A\bm{b}_n \end{bmatrix}$,即$B$的第二列在左乘$A$之后被移到了第一列。于是$$AB=B\begin{bmatrix} \bm{e}_2&\cdots&\cdots \end{bmatrix}=B\begin{bmatrix} 0&\bm{x}^{\mathrm{T}}\\ \bm{s}&C \end{bmatrix}$$ 其中$\bm{x}\in\mathbb{R}^{n-1},C\in\mathbb{R}^{(n-1)\times(n-1)},\bm{s}=\begin{bmatrix} 1\\ 0\\ \vdots\\ 0 \end{bmatrix}.$ $\\$ 等式两边左乘$B^{-1}$得,$A$相似于$\begin{bmatrix} 0&\bm{x}^{\mathrm{T}}\\ \bm{s}&C \end{bmatrix}$。因为相似不改变特征值且$\operatorname{trace}(A)=0$,所以$\operatorname{trace}(C)=0$。$\\$ 根据归纳假设,对$n-1$阶方阵$C$,若$\operatorname{trace}(C)=0$,则存在可逆矩阵$Z$使得$Z^{-1}CZ$的对角元全是$0$. $\\$ 于是 $$ \begin{bmatrix} 1&O\\ O&Z \end{bmatrix}^{-1} \begin{bmatrix} 0&\bm{x}^{\mathrm{T}}\\ \bm{s}&C \end{bmatrix} \begin{bmatrix} 1&O\\ O&Z \end{bmatrix} = \begin{bmatrix} 0&\bm{x}^{\mathrm{T}}Z\\ Z^{-1}\bm{s}&Z^{-1}CZ \end{bmatrix} $$ 根据相似的传递性,$A$也相似于一个对角元全是$0$的矩阵。由阶数为$n-1$时命题成立可推出阶数为$n$时也成立,所以阶数为$n \geq 1$时均成立。$\\$
5.4.5 $\quad$ 利用Jordan标准型证明,$A$与$A^{\mathrm{T}}$相似。
$\\$ 证明:$\\$ 显然$A$和$A^{\mathrm{T}}$具有相同的特征值,代数重数,几何重数。所以他们相似于同一个Jordan标准型。由相似的传递性和对称性可知$A$和$A^{\mathrm{T}}$相似。$\\$
5.4.6 (Jordan链) $\quad$ 对任意$n$阶方阵$A$,一组向量$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s$,如果存在$\lambda \in \mathbb{C}$,使得$x_1 \neq 0, (A-\lambda I)\bm{x}_1=\bm{0},(A-\lambda I)\bm{x}_2=\bm{x}_1,\cdots,(A-\lambda I)\bm{x}_s=\bm{x}_{s-1}$,而$(A-\lambda I)\bm{y}=\bm{x}_s$无解,就称其为$A$的一个关于$\lambda$长度为$s$的Jordan链。$\\$显然$\bm{x}_1 \in \mathcal{N}(A-\lambda I)$是特征向量,$\bm{x}_2 \in \mathcal{N}((A-\lambda I)^2),\cdots,\bm{x}_s \in \mathcal{N}((A-\lambda I)^s)$,但$\bm{x}_s \notin \mathcal{R}(A-\lambda I).\\$求证:
$\\$ 1. $\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s$线性无关。$\\$ 2. 令$X_1=\begin{bmatrix}\bm{x}_1&\bm{x}_2&\cdots&\bm{x}_s\end{bmatrix}$,则$AX_1=X_1J_s(\lambda)$。 $\\$ 3. 若$A$只有一个特征值,且其几何重数是1,则$A$相似于$J_n(\lambda)$,且有一个关于$\lambda$的长度为$n$的Jordan链$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n$。$\\$ 1. 证明:$\\$ 设$k_1\bm{x}_1+k_2\bm{x}_2+\cdots+k_s\bm{x}_s=0$,$\\$两边同时左乘$(A-\lambda I)^{s-1}$得$k_1(A-\lambda I)^{s-1}\bm{x}_1+k_2(A-\lambda I)^{s-1}\bm{x}_2+\cdots+k_s(A-\lambda I)^{s-1}\bm{x}_s=0 \implies k_s\bm{x}_1=0 \implies k_s=0 \\$ 两边同时左乘$(A-\lambda I)^{s-2}$得$k_1(A-\lambda I)^{s-2}\bm{x}_1+k_2(A-\lambda I)^{s-2}\bm{x}_2+\cdots+k_{s-1}(A-\lambda I)^{s-2}\bm{x}_{s-1}=0 \implies k_{s-1}\bm{x}_1=0 \implies k_{s-1}=0 \\$ 同理可得$k_1=k_2=\cdots=k_s=0$,所以$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s$线性无关。$\\$ 2. 证明:$\\$ 显然$A\bm{x}_1=\lambda\bm{x}_1,A\bm{x}_2=\lambda\bm{x}_2+\bm{x}_1,\cdots,A\bm{x}_s=\lambda\bm{x}_s+\bm{x}_{s-1}. \\$ 即$$ AX_1=\begin{bmatrix} A\bm{x}_1&A\bm{x}_2&\cdots&A\bm{x}_s \end{bmatrix}= \begin{bmatrix} \bm{x}_1&\bm{x}_2&\cdots&\bm{x}_s \end{bmatrix} \begin{bmatrix} \lambda&1&&\\ &\lambda&\ddots&\\ &&\ddots&1\\ &&&\lambda \end{bmatrix}= X_1J_s(\lambda) $$证毕。$\\$ 3. 证明:$\\$ 由Jordan标准型立得,$A$相似于$J_n(\lambda)$,即存在可逆矩阵$X$,使得$A=XJ_n(\lambda)X^{-1}\implies AX=XJ_n(\lambda).\\ $ 设$X=\begin{bmatrix} \bm{x}_1&\bm{x}_2&\cdots&\bm{x}_n \end{bmatrix}$,由第(2)小问可以知道$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n$是Jordan链。因为Jordan链长度最多只能是n,所以$A$有一个关于$\lambda$的长度为$n$的Jordan链$\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n$。$\\$
5.4.7 $\quad$ 给定$m$阶方阵$A_1$,$n$阶方阵$A_2$和$m \times n$矩阵$B$,证明:
$\\$
1. 如果$A_1$和$A_2$没有相同的特征值,则关于$m \times n$矩阵$X$的Sylvester方程$A_1X-XA_2=B$有唯一解。$\\$
证明:$\\$ $A_1X-XA_2=B$有唯一解等价于$A_1X-XA_2=O$只有零解。$\\$ $A_1X-XA_2=O\implies A_1X=XA_2\implies$等式两边左乘$A_1$得$A_1^2X=A_1XA_2\implies A_1^2X=XA_2^2.$以此类推,可以得到$A_1^kX=XA_2^k$,其中$k$是正整数。设$A_1$的特征多项式是$p(x)$,于是有$$p(A_1)X=Xp(A_2)$$由Hamilton-Cayley定理,$p(A_1)=O \implies Xp(A_2)=O.\\$ $p(A_2)$显然是个$n$阶方阵,下面我们证明其可逆。$\\$ 设$A_2=Z^{-1}JZ$,其中$J$是Jordan标准型,则 $$\det(p(A_2))=\det(p(J))=\det(J-\lambda_1I_{n_1})\det(J-\lambda_2I_{n_2})\cdots\det(J-\lambda_sI_{n_s})$$ 其中$\lambda_1,\lambda_2,\cdots,\lambda_s$是$A_1$的特征值。$\\$ 因为$A_1,A_2$没有共同的特征值,所以$\det(J-\lambda_1I_{n_1}),\cdots,\det(J-\lambda_sI_{n_s})$均不为$0$,即$\det(p(A_2))\neq 0$,$p(A_2)$可逆。$\\$ 而$Xp(A_2)=O$,这说明$\mathcal{N}(X)=\mathbb{R}^n$,即$X=O$。所以若$A_1$和$A_2$没有相同的特征值,则关于$m \times n$矩阵$X$的Sylvester方程$A_1X-XA_2=B$有唯一解。$\\$
2. 如果$A_1$和$A_2$没有相同的特征值,则存在唯一的矩阵$X$满足
$$ \begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix} \begin{bmatrix} A_1&B\\ O&A_2 \end{bmatrix} \begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix}^{-1}= \begin{bmatrix} A_1&O\\ O&A_2 \end{bmatrix}. $$ 证明:$\\$ 注意到$\begin{bmatrix} I_m&X\\ O&I_n\\ \end{bmatrix}^{-1}=\begin{bmatrix} I_m&-X\\ O&I_n\\ \end{bmatrix}$,于是等式左边用矩阵乘法展开得到 $$ \begin{bmatrix} A_1&B+XA_2-A_1X\\ O&A_2\\ \end{bmatrix} = \begin{bmatrix} A_1&O\\ O&A_2 \end{bmatrix}. $$ 所以原命题等价于:如果$A_1$和$A_2$没有相同的特征值,则存在唯一的矩阵$X$满足$A_1X-XA_2=B$。这正是第(1)问已经证明的结论。$\\$
3.对$n$阶方阵$A$,存在可逆矩阵$X$,使得
$$ X^{-1}AX=\begin{bmatrix} \lambda_1I+N_1&&&\\ &\lambda_2I+N_2&&\\ &&\ddots&\\ &&&\lambda_sI+N_s \end{bmatrix}, $$ 其中$N_1,N_2,\cdots,N_s$是严格上三角阵。$\\$ 证明:$\\$ 由Jordan标准型立得。$\\$
4. 如果$m>n$且$A_1=J_m(0),A_2=J_n(0),B=\bm{e}_1\bm{b}^{\mathrm{T}}$,即$B$除第一行外元素全为0,则关于$m \times n$矩阵$X$的Sylvester方程$A_1X-XA_2=B$有解,于是存在矩阵$X$满足
$$ \begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix} \begin{bmatrix} A_1&B\\ O&A_2 \end{bmatrix} \begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix}^{-1}= \begin{bmatrix} A_1&O\\ O&A_2 \end{bmatrix}. $$ 证明:$\\$ 设$X=\begin{bmatrix} \bm{x}_1^{\mathrm{T}}\\ \bm{x}_2^{\mathrm{T}}\\ \vdots\\ \bm{x}_m^{\mathrm{T}}\\ \end{bmatrix} = \begin{bmatrix} x_{11}&x_{12}&\cdots&x_{1n}\\ x_{21}&x_{22}&\cdots&x_{2n}\\ \vdots&\vdots&&\vdots\\ x_{m1}&x_{m2}&\cdots&x_{mn}\\ \end{bmatrix}, B=\begin{bmatrix} \bm{b}^{\mathrm{T}}\\ \bm{0}^{\mathrm{T}}\\ \vdots\\ \bm{0}^{\mathrm{T}}\\ \end{bmatrix} = \begin{bmatrix} b_1&b_2&\cdots&b_n\\ 0&0&\cdots&0\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&0 \end{bmatrix} \\$ 直接用矩阵乘法计算$A_1X-XA_2=B$得, $$ \begin{bmatrix} x_{21}&x_{22}-x_{11}&x_{23}-x_{12}&\cdots&x_{2n}-x_{1,n-1}\\ x_{31}&x_{32}-x_{21}&x_{33}-x_{22}&\cdots&x_{3n}-x_{2,n-1}\\ \vdots&\vdots&\vdots&&\vdots \\ x_{m1}&x_{m2}-x_{m-1,1}&x_{m3}-x_{m-1,2}&\cdots&x_{mn}-x_{m-1,n-1}\\ 0&-x_{m1}&-x_{m2}&\cdots&-x_{m,n-1} \end{bmatrix} = \begin{bmatrix} b_1&b_2&\cdots&b_n\\ 0&0&\cdots&0\\ \vdots&\vdots&&\vdots \\ 0&0&\cdots&0\\ 0&0&\cdots&0 \end{bmatrix} $$ 将$X$按行排列成列向量, $$ \begin{bmatrix} -J_n^{\mathrm{T}}(0)&I_n&&\\ &-J_n^{\mathrm{T}}(0)&\ddots&\\ &&\ddots&I_n\\ &&&-J_n^{\mathrm{T}}(0) \end{bmatrix} \begin{bmatrix} \bm{x}_1\\ \bm{x}_2\\ \vdots\\ \bm{x}_m\\ \end{bmatrix} = \begin{bmatrix} \bm{b}\\ \bm{0}\\ \vdots\\ \bm{0} \end{bmatrix} $$ 显然系数矩阵的秩和增广矩阵秩相等,方程有解。$\\$
5. 对$n$阶方阵$A=\begin{bmatrix} J_{k_1}(0)&\bm{e}_1\bm{a}_2^{\mathrm{T}}&\cdots&\bm{e}_1\bm{a}_r^{\mathrm{T}}\\ &J_{k_2}(0)&&\\ &&\ddots&\\ &&&J_{k_r}(0) \end{bmatrix}$,其中$k_1>k_2\geq\cdots\geq k_r$(即$A$是一个Jordan标准型与除第一行外元素全为0矩阵的和),存在可逆矩阵$X$,使得 $$ X^{-1}AX=\begin{bmatrix} J_{k_1}(0)&&&\\ &J_{k_2}(0)&&\\ &&\ddots&\\ &&&J_{k_r}(0) \end{bmatrix}. $$
证明:$\\$ 设$J=\begin{bmatrix} J_{k_2}(0)&&\\ &\ddots&\\ &&J_{k_n}(0) \end{bmatrix},B=\begin{bmatrix} \bm{e}_1\bm{a}_2^{\mathrm{T}}&\cdots&\bm{e}_1\bm{a}_r^{\mathrm{T}} \end{bmatrix}\\$ 则$A=\begin{bmatrix} J_{k_1}(0)&B\\ O&J \end{bmatrix}.\\$由(2)(4)小问结论可知,命题显然成立。