WeHUSTER
LOG IN
Open main menu
Home
四级真题
六级真题
《线性代数入门》答案
微积分考试真题
About
5.4 相似
5.4.1
\quad
设
A
,
B
A,B
A
,
B
是
n
n
n
阶方阵,且满足
A
B
=
B
A
.
AB=BA.
A
B
=
B
A
.
\\
1. 证明,若
A
A
A
有
n
n
n
个不同的特征值,则
B
B
B
可对角化。
\\
2. 若
A
A
A
有代数重数大于1的特征值,则
B
B
B
是否一定可对角化?
\\
1. 证明:
\\
先证引理:与对角元素均不同的对角矩阵可交换的矩阵一定是对角矩阵。
\\
设
n
n
n
阶方阵
S
S
S
和对角元素均不同的对角矩阵
Λ
\varLambda
Λ
滿足
S
Λ
=
Λ
S
S\varLambda=\varLambda S
S
Λ
=
Λ
S
,即
[
λ
1
λ
2
⋱
λ
n
]
[
s
11
s
12
⋯
s
1
n
s
21
s
22
⋯
s
2
n
⋮
⋮
⋮
s
n
1
s
n
2
⋯
s
n
n
]
=
[
s
11
s
12
⋯
s
1
n
s
21
s
22
⋯
s
2
n
⋮
⋮
⋮
s
n
1
s
n
2
⋯
s
n
n
]
[
λ
1
λ
2
⋱
λ
n
]
\begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n \end{bmatrix} \begin{bmatrix} s_{11}&s_{12}&\cdots&s_{1n}\\ s_{21}&s_{22}&\cdots&s_{2n}\\ \vdots&\vdots&&\vdots\\ s_{n1}&s_{n2}&\cdots&s_{nn}\\ \end{bmatrix} = \begin{bmatrix} s_{11}&s_{12}&\cdots&s_{1n}\\ s_{21}&s_{22}&\cdots&s_{2n}\\ \vdots&\vdots&&\vdots\\ s_{n1}&s_{n2}&\cdots&s_{nn}\\ \end{bmatrix} \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n \end{bmatrix}
λ
1
λ
2
⋱
λ
n
s
11
s
21
⋮
s
n
1
s
12
s
22
⋮
s
n
2
⋯
⋯
⋯
s
1
n
s
2
n
⋮
s
nn
=
s
11
s
21
⋮
s
n
1
s
12
s
22
⋮
s
n
2
⋯
⋯
⋯
s
1
n
s
2
n
⋮
s
nn
λ
1
λ
2
⋱
λ
n
化简后得,
(
λ
i
−
λ
j
)
s
i
j
=
0
(\lambda_i-\lambda_j)s_{ij}=0
(
λ
i
−
λ
j
)
s
ij
=
0
。而当
i
≠
j
i \neq j
i
=
j
时,
(
λ
i
−
λ
j
)
≠
0
(\lambda_i-\lambda_j)\neq 0
(
λ
i
−
λ
j
)
=
0
,所以
s
i
j
=
0
(
i
≠
j
)
s_{ij}=0 (i\neq j)
s
ij
=
0
(
i
=
j
)
。即
S
S
S
是对角矩阵。
\\
引理证毕。
\\
A
A
A
有
n
n
n
个不同的特征值
⟹
\implies
⟹
A
A
A
可对角化,即存在可逆矩阵
X
X
X
使得
A
=
X
Λ
X
−
1
A=X \varLambda X^{-1}
A
=
X
Λ
X
−
1
,其中
Λ
\varLambda
Λ
是对角元素均不同的对角矩阵。
\\
A
B
=
B
A
⟹
X
Λ
X
−
1
B
=
B
X
Λ
X
−
1
⟹
Λ
X
−
1
B
X
=
X
−
1
B
X
Λ
⟹
X
−
1
B
X
AB=BA \implies X \varLambda X^{-1}B=BX \varLambda X^{-1} \implies \varLambda X^{-1}BX=X^{-1}BX \varLambda \implies X^{-1}BX
A
B
=
B
A
⟹
X
Λ
X
−
1
B
=
BX
Λ
X
−
1
⟹
Λ
X
−
1
BX
=
X
−
1
BX
Λ
⟹
X
−
1
BX
是对角矩阵。所以
B
B
B
可对角化。
\\
2. 解:
\\
不一定。若
A
=
I
n
A=I_n
A
=
I
n
,则对任意的
n
n
n
阶矩阵
B
B
B
都有
A
B
=
B
A
AB=BA
A
B
=
B
A
。
\\
5.4.2
\quad
对下列矩阵
A
,
B
A,B
A
,
B
,求
X
X
X
使得
A
=
X
B
X
−
1
.
A=XBX^{-1}.
A
=
XB
X
−
1
.
\\
1.
A
=
M
N
,
B
=
N
M
A=MN,B=NM
A
=
MN
,
B
=
NM
,其中
M
,
N
M,N
M
,
N
是方阵,且
M
M
M
可逆。
\\
2.
A
=
[
M
N
O
N
O
]
,
B
=
[
O
O
N
N
M
]
,
A=\begin{bmatrix} MN&O\\ N&O \end{bmatrix}, B=\begin{bmatrix} O&O\\ N&NM \end{bmatrix},
A
=
[
MN
N
O
O
]
,
B
=
[
O
N
O
NM
]
,
其中
M
,
N
M,N
M
,
N
不必是方阵。
\\
3.
A
=
[
M
−
N
N
M
]
,
B
=
[
M
+
i
N
O
O
M
−
i
N
]
,
A=\begin{bmatrix} M&-N\\ N&M \end{bmatrix}, B=\begin{bmatrix} M+iN&O\\ O&M-iN \end{bmatrix},
A
=
[
M
N
−
N
M
]
,
B
=
[
M
+
i
N
O
O
M
−
i
N
]
,
其中
M
,
N
M,N
M
,
N
是方阵。
\\
1.
X
=
M
.
X=M.\quad
X
=
M
.
2.
X
=
[
I
m
M
O
I
n
]
X=\begin{bmatrix} I_m&M\\ O&I_n\\ \end{bmatrix} \quad
X
=
[
I
m
O
M
I
n
]
3.
X
=
[
I
n
I
n
−
i
I
n
i
I
n
]
X=\begin{bmatrix} I_n&I_n\\ -iI_n&iI_n\\ \end{bmatrix}\\
X
=
[
I
n
−
i
I
n
I
n
i
I
n
]
5.4.3
\quad
给定
n
n
n
阶方阵
A
,
B
A,B
A
,
B
满足
A
B
=
B
A
.
AB=BA.
A
B
=
B
A
.
\\
1. 证明,若
A
A
A
有
n
n
n
个不同的特征值,则存在次数不超过
n
−
1
n-1
n
−
1
的多项式
f
(
x
)
f(x)
f
(
x
)
,使得
B
=
f
(
A
)
.
B=f(A).
B
=
f
(
A
)
.
\\
2. 证明,若
A
=
J
n
(
λ
)
A=J_n(\lambda)
A
=
J
n
(
λ
)
,则存在次数不超过
n
−
1
n-1
n
−
1
的多项式
f
(
x
)
f(x)
f
(
x
)
,使得
B
=
f
(
A
)
.
B=f(A).
B
=
f
(
A
)
.
\\
3. 举例说明,存在
A
,
B
A,B
A
,
B
满足
A
B
=
B
A
AB=BA
A
B
=
B
A
,但不存在多项式
f
(
x
)
f(x)
f
(
x
)
,使得
B
=
f
(
A
)
.
B=f(A).
B
=
f
(
A
)
.
\\
1. 证明:
\\
因为
A
A
A
有
n
n
n
个不同的特征值,且
A
B
=
B
A
AB=BA
A
B
=
B
A
,则根据5.4.1中结论可知,
A
,
B
A,B
A
,
B
可以同时对角化。即存在
X
X
X
使
A
=
X
Λ
A
X
−
1
,
B
=
X
Λ
B
X
−
1
A=X\varLambda_AX^{-1},B=X\varLambda_BX^{-1}
A
=
X
Λ
A
X
−
1
,
B
=
X
Λ
B
X
−
1
。其中
Λ
A
=
diag
(
λ
1
,
λ
2
,
⋯
,
λ
n
)
,
λ
1
≠
λ
2
≠
⋯
≠
λ
n
.
Λ
B
=
diag
(
b
1
,
b
2
,
⋯
,
b
n
)
.
\varLambda_A=\operatorname{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n),\lambda_1\neq\lambda_2\neq\cdots\neq\lambda_n. \varLambda_B=\operatorname{diag}(b_1,b_2,\cdots,b_n).\\
Λ
A
=
diag
(
λ
1
,
λ
2
,
⋯
,
λ
n
)
,
λ
1
=
λ
2
=
⋯
=
λ
n
.
Λ
B
=
diag
(
b
1
,
b
2
,
⋯
,
b
n
)
.
又因为Vandermonde矩阵
[
1
λ
1
λ
1
2
⋯
λ
1
n
−
1
1
λ
2
λ
2
2
⋯
λ
2
n
−
1
⋮
⋮
⋮
⋮
1
λ
n
λ
n
2
⋯
λ
n
n
−
1
]
\begin{bmatrix} 1&\lambda_1&\lambda_1^2&\cdots&\lambda_1^{n-1}\\ 1&\lambda_2&\lambda_2^2&\cdots&\lambda_2^{n-1}\\ \vdots&\vdots&\vdots&&\vdots\\ 1&\lambda_n&\lambda_n^2&\cdots&\lambda_n^{n-1}\\ \end{bmatrix}
1
1
⋮
1
λ
1
λ
2
⋮
λ
n
λ
1
2
λ
2
2
⋮
λ
n
2
⋯
⋯
⋯
λ
1
n
−
1
λ
2
n
−
1
⋮
λ
n
n
−
1
可逆,所以方程
[
1
λ
1
λ
1
2
⋯
λ
1
n
−
1
1
λ
2
λ
2
2
⋯
λ
2
n
−
1
⋮
⋮
⋮
⋮
1
λ
n
λ
n
2
⋯
λ
n
n
−
1
]
[
k
0
k
1
⋮
k
n
−
1
]
=
[
b
1
b
2
⋮
b
n
]
\begin{bmatrix} 1&\lambda_1&\lambda_1^2&\cdots&\lambda_1^{n-1}\\ 1&\lambda_2&\lambda_2^2&\cdots&\lambda_2^{n-1}\\ \vdots&\vdots&\vdots&&\vdots\\ 1&\lambda_n&\lambda_n^2&\cdots&\lambda_n^{n-1}\\ \end{bmatrix} \begin{bmatrix} k_0\\ k_1\\ \vdots\\ k_{n-1}\\ \end{bmatrix}= \begin{bmatrix} b_1\\ b_2\\ \vdots\\ b_n\\ \end{bmatrix}
1
1
⋮
1
λ
1
λ
2
⋮
λ
n
λ
1
2
λ
2
2
⋮
λ
n
2
⋯
⋯
⋯
λ
1
n
−
1
λ
2
n
−
1
⋮
λ
n
n
−
1
k
0
k
1
⋮
k
n
−
1
=
b
1
b
2
⋮
b
n
一定有解。即存在一组
k
1
,
k
2
,
⋯
,
k
n
k_1,k_2,\cdots,k_n
k
1
,
k
2
,
⋯
,
k
n
,使得
Λ
B
=
k
0
I
n
+
k
1
Λ
A
+
⋯
+
k
n
−
1
Λ
A
n
−
1
\varLambda_B=k_0I_n+k_1\varLambda_A+\cdots+k_{n-1}\varLambda_A^{n-1}
Λ
B
=
k
0
I
n
+
k
1
Λ
A
+
⋯
+
k
n
−
1
Λ
A
n
−
1
成立。等式两边同时左乘
X
X
X
,右乘
X
−
1
X^{-1}
X
−
1
得
B
=
k
0
I
n
+
k
1
A
+
⋯
+
k
n
−
1
A
n
−
1
B=k_0I_n+k_1A+\cdots+k_{n-1}A^{n-1}
B
=
k
0
I
n
+
k
1
A
+
⋯
+
k
n
−
1
A
n
−
1
。即存在次数不超过
n
−
1
n-1
n
−
1
的多项式
f
(
x
)
f(x)
f
(
x
)
,使得
B
=
f
(
A
)
B=f(A)
B
=
f
(
A
)
。
\\
2. 证明:
\\
设
A
=
λ
I
n
+
S
A=\lambda I_n+S
A
=
λ
I
n
+
S
,其中
S
=
[
0
1
0
1
⋱
⋱
⋱
1
0
]
.
S=\begin{bmatrix} 0&1&&&\\ &0&1&&\\ &&\ddots&\ddots&\\ &&&\ddots&1\\ &&&&0\\ \end{bmatrix}.\\
S
=
0
1
0
1
⋱
⋱
⋱
1
0
.
而
A
B
=
B
A
⟹
(
λ
I
n
+
S
)
B
=
B
(
λ
I
n
+
S
)
⟹
S
B
=
B
S
.
AB=BA \implies (\lambda I_n+S)B=B(\lambda I_n+S) \implies SB=BS.
A
B
=
B
A
⟹
(
λ
I
n
+
S
)
B
=
B
(
λ
I
n
+
S
)
⟹
SB
=
BS
.
这表明
B
B
B
所有行向量上移一格和
B
B
B
所有列向量右移一格得到的矩阵相同。于是
B
B
B
可以被表示为:
B
=
[
b
1
b
2
⋯
b
n
b
1
⋱
⋮
⋱
b
2
b
1
]
B=\begin{bmatrix} b_1&b_2&\cdots&b_n\\ &b_1&\ddots&\vdots\\ &&\ddots&b_2\\ &&&b_1\\ \end{bmatrix}
B
=
b
1
b
2
b
1
⋯
⋱
⋱
b
n
⋮
b
2
b
1
注意到,
A
k
=
[
λ
k
C
k
1
λ
k
−
1
C
k
2
λ
k
−
2
⋯
1
λ
k
C
k
1
λ
k
−
1
C
k
2
λ
k
−
2
⋱
λ
k
C
k
1
λ
k
−
1
⋱
1
λ
k
⋱
⋱
⋮
⋱
⋱
C
k
2
λ
k
−
2
⋱
C
k
1
λ
k
−
1
λ
k
]
A^k=\begin{bmatrix} \lambda^k&C^1_k\lambda^{k-1}&C^2_k\lambda^{k-2}&\cdots&1&&\\ &\lambda^k&C^1_k\lambda^{k-1}&C^2_k\lambda^{k-2}&&\ddots&&\\ &&\lambda^k&C^1_k\lambda^{k-1}&\ddots&&1\\ &&&\lambda^k&\ddots&\ddots&\vdots\\ &&&&\ddots&\ddots&C^2_k\lambda^{k-2}\\ &&&&&\ddots&C^1_k\lambda^{k-1}\\ &&&&&&\lambda^k \end{bmatrix}
A
k
=
λ
k
C
k
1
λ
k
−
1
λ
k
C
k
2
λ
k
−
2
C
k
1
λ
k
−
1
λ
k
⋯
C
k
2
λ
k
−
2
C
k
1
λ
k
−
1
λ
k
1
⋱
⋱
⋱
⋱
⋱
⋱
⋱
1
⋮
C
k
2
λ
k
−
2
C
k
1
λ
k
−
1
λ
k
其中
k
≤
n
.
k \leq n.
k
≤
n
.
\\
可以发现
A
k
A^k
A
k
和
B
B
B
具有相同的形式。于是原命题(存在次数不超过
n
−
1
n-1
n
−
1
的多项式
f
(
x
)
f(x)
f
(
x
)
,使得
B
=
f
(
A
)
B=f(A)
B
=
f
(
A
)
)等价于下列方程有解。
[
1
λ
λ
2
⋯
λ
n
−
1
1
2
λ
⋯
C
n
−
1
2
λ
n
−
1
1
⋮
⋱
⋮
1
]
[
k
1
k
2
⋮
⋮
k
n
]
=
[
b
1
b
2
⋮
⋮
b
n
]
\begin{bmatrix} 1&\lambda&\lambda^2&\cdots&\lambda^{n-1}\\ &1&2\lambda&\cdots&C^2_{n-1}\lambda^{n-1}\\ &&1&&\vdots\\ &&&\ddots&\vdots\\ &&&&1 \end{bmatrix} \begin{bmatrix} k_1\\ k_2\\ \vdots\\ \vdots\\ k_n \end{bmatrix} = \begin{bmatrix} b_1\\ b_2\\ \vdots\\ \vdots\\ b_n \end{bmatrix}
1
λ
1
λ
2
2
λ
1
⋯
⋯
⋱
λ
n
−
1
C
n
−
1
2
λ
n
−
1
⋮
⋮
1
k
1
k
2
⋮
⋮
k
n
=
b
1
b
2
⋮
⋮
b
n
左侧矩阵行列式为1,所以矩阵可逆,方程有唯一解,命题成立。
\\
3. 解:
\\
设
A
=
I
n
A=I_n
A
=
I
n
,
B
B
B
是任意不是对角阵的矩阵。显然有
A
B
=
I
n
B
=
B
I
n
=
B
A
.
AB=I_nB=BI_n=BA.
A
B
=
I
n
B
=
B
I
n
=
B
A
.
但不存在多项式
f
(
x
)
f(x)
f
(
x
)
使
B
=
f
(
A
)
B=f(A)
B
=
f
(
A
)
。
\\
5.4.4
\quad
证明,任意迹为0的方阵相似于一个对角元素全为0的方阵。
\\
证明:
\\
用数学归纳法。当阶数为
1
1
1
时,显然成立。
\\
现假设阶数为
n
−
1
n-1
n
−
1
时命题成立,考虑
n
n
n
阶方阵
A
A
A
。在
R
n
\mathbb{R}^n
R
n
中取一向量
q
\bm{q}
q
,但
q
\bm{q}
q
不是
A
A
A
的特征向量(若不存在这样的
q
\bm{q}
q
,说明
A
A
A
是零矩阵,命题显然成立。)此时
q
,
A
q
\bm{q},A\bm{q}
q
,
A
q
线性无关。将
q
,
A
q
\bm{q},A\bm{q}
q
,
A
q
张成
R
n
\mathbb{R}^n
R
n
的一组基
(
q
,
A
q
,
b
3
,
b
4
,
⋯
,
b
n
)
(\bm{q},A\bm{q},\bm{b}_3,\bm{b}_4,\cdots,\bm{b}_n)
(
q
,
A
q
,
b
3
,
b
4
,
⋯
,
b
n
)
。设
B
=
[
q
A
q
b
3
⋯
b
n
]
B=\begin{bmatrix} \bm{q}&A\bm{q}&\bm{b}_3&\cdots&\bm{b}_n \end{bmatrix}
B
=
[
q
A
q
b
3
⋯
b
n
]
,显然
B
B
B
是
n
n
n
阶可逆矩阵。
\\
注意到
A
B
=
[
A
q
A
2
q
⋯
A
b
n
]
AB=\begin{bmatrix} A\bm{q}&A^2\bm{q}&\cdots&A\bm{b}_n \end{bmatrix}
A
B
=
[
A
q
A
2
q
⋯
A
b
n
]
,即
B
B
B
的第二列在左乘
A
A
A
之后被移到了第一列。于是
A
B
=
B
[
e
2
⋯
⋯
]
=
B
[
0
x
T
s
C
]
AB=B\begin{bmatrix} \bm{e}_2&\cdots&\cdots \end{bmatrix}=B\begin{bmatrix} 0&\bm{x}^{\mathrm{T}}\\ \bm{s}&C \end{bmatrix}
A
B
=
B
[
e
2
⋯
⋯
]
=
B
[
0
s
x
T
C
]
其中
x
∈
R
n
−
1
,
C
∈
R
(
n
−
1
)
×
(
n
−
1
)
,
s
=
[
1
0
⋮
0
]
.
\bm{x}\in\mathbb{R}^{n-1},C\in\mathbb{R}^{(n-1)\times(n-1)},\bm{s}=\begin{bmatrix} 1\\ 0\\ \vdots\\ 0 \end{bmatrix}.
x
∈
R
n
−
1
,
C
∈
R
(
n
−
1
)
×
(
n
−
1
)
,
s
=
1
0
⋮
0
.
\\
等式两边左乘
B
−
1
B^{-1}
B
−
1
得,
A
A
A
相似于
[
0
x
T
s
C
]
\begin{bmatrix} 0&\bm{x}^{\mathrm{T}}\\ \bm{s}&C \end{bmatrix}
[
0
s
x
T
C
]
。因为相似不改变特征值且
trace
(
A
)
=
0
\operatorname{trace}(A)=0
trace
(
A
)
=
0
,所以
trace
(
C
)
=
0
\operatorname{trace}(C)=0
trace
(
C
)
=
0
。
\\
根据归纳假设,对
n
−
1
n-1
n
−
1
阶方阵
C
C
C
,若
trace
(
C
)
=
0
\operatorname{trace}(C)=0
trace
(
C
)
=
0
,则存在可逆矩阵
Z
Z
Z
使得
Z
−
1
C
Z
Z^{-1}CZ
Z
−
1
CZ
的对角元全是
0
0
0
.
\\
于是
[
1
O
O
Z
]
−
1
[
0
x
T
s
C
]
[
1
O
O
Z
]
=
[
0
x
T
Z
Z
−
1
s
Z
−
1
C
Z
]
\begin{bmatrix} 1&O\\ O&Z \end{bmatrix}^{-1} \begin{bmatrix} 0&\bm{x}^{\mathrm{T}}\\ \bm{s}&C \end{bmatrix} \begin{bmatrix} 1&O\\ O&Z \end{bmatrix} = \begin{bmatrix} 0&\bm{x}^{\mathrm{T}}Z\\ Z^{-1}\bm{s}&Z^{-1}CZ \end{bmatrix}
[
1
O
O
Z
]
−
1
[
0
s
x
T
C
]
[
1
O
O
Z
]
=
[
0
Z
−
1
s
x
T
Z
Z
−
1
CZ
]
根据相似的传递性,
A
A
A
也相似于一个对角元全是
0
0
0
的矩阵。由阶数为
n
−
1
n-1
n
−
1
时命题成立可推出阶数为
n
n
n
时也成立,所以阶数为
n
≥
1
n \geq 1
n
≥
1
时均成立。
\\
5.4.5
\quad
利用Jordan标准型证明,
A
A
A
与
A
T
A^{\mathrm{T}}
A
T
相似。
\\
证明:
\\
显然
A
A
A
和
A
T
A^{\mathrm{T}}
A
T
具有相同的特征值,代数重数,几何重数。所以他们相似于同一个Jordan标准型。由相似的传递性和对称性可知
A
A
A
和
A
T
A^{\mathrm{T}}
A
T
相似。
\\
5.4.6 (Jordan链)
\quad
对任意
n
n
n
阶方阵
A
A
A
,一组向量
x
1
,
x
2
,
⋯
,
x
s
\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s
x
1
,
x
2
,
⋯
,
x
s
,如果存在
λ
∈
C
\lambda \in \mathbb{C}
λ
∈
C
,使得
x
1
≠
0
,
(
A
−
λ
I
)
x
1
=
0
,
(
A
−
λ
I
)
x
2
=
x
1
,
⋯
,
(
A
−
λ
I
)
x
s
=
x
s
−
1
x_1 \neq 0, (A-\lambda I)\bm{x}_1=\bm{0},(A-\lambda I)\bm{x}_2=\bm{x}_1,\cdots,(A-\lambda I)\bm{x}_s=\bm{x}_{s-1}
x
1
=
0
,
(
A
−
λ
I
)
x
1
=
0
,
(
A
−
λ
I
)
x
2
=
x
1
,
⋯
,
(
A
−
λ
I
)
x
s
=
x
s
−
1
,而
(
A
−
λ
I
)
y
=
x
s
(A-\lambda I)\bm{y}=\bm{x}_s
(
A
−
λ
I
)
y
=
x
s
无解,就称其为
A
A
A
的一个关于
λ
\lambda
λ
长度为
s
s
s
的Jordan链。
\\
显然
x
1
∈
N
(
A
−
λ
I
)
\bm{x}_1 \in \mathcal{N}(A-\lambda I)
x
1
∈
N
(
A
−
λ
I
)
是特征向量,
x
2
∈
N
(
(
A
−
λ
I
)
2
)
,
⋯
,
x
s
∈
N
(
(
A
−
λ
I
)
s
)
\bm{x}_2 \in \mathcal{N}((A-\lambda I)^2),\cdots,\bm{x}_s \in \mathcal{N}((A-\lambda I)^s)
x
2
∈
N
((
A
−
λ
I
)
2
)
,
⋯
,
x
s
∈
N
((
A
−
λ
I
)
s
)
,但
x
s
∉
R
(
A
−
λ
I
)
.
\bm{x}_s \notin \mathcal{R}(A-\lambda I).\\
x
s
∈
/
R
(
A
−
λ
I
)
.
求证:
\\
1.
x
1
,
x
2
,
⋯
,
x
s
\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s
x
1
,
x
2
,
⋯
,
x
s
线性无关。
\\
2. 令
X
1
=
[
x
1
x
2
⋯
x
s
]
X_1=\begin{bmatrix}\bm{x}_1&\bm{x}_2&\cdots&\bm{x}_s\end{bmatrix}
X
1
=
[
x
1
x
2
⋯
x
s
]
,则
A
X
1
=
X
1
J
s
(
λ
)
AX_1=X_1J_s(\lambda)
A
X
1
=
X
1
J
s
(
λ
)
。
\\
3. 若
A
A
A
只有一个特征值,且其几何重数是1,则
A
A
A
相似于
J
n
(
λ
)
J_n(\lambda)
J
n
(
λ
)
,且有一个关于
λ
\lambda
λ
的长度为
n
n
n
的Jordan链
x
1
,
x
2
,
⋯
,
x
n
\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n
x
1
,
x
2
,
⋯
,
x
n
。
\\
1. 证明:
\\
设
k
1
x
1
+
k
2
x
2
+
⋯
+
k
s
x
s
=
0
k_1\bm{x}_1+k_2\bm{x}_2+\cdots+k_s\bm{x}_s=0
k
1
x
1
+
k
2
x
2
+
⋯
+
k
s
x
s
=
0
,
\\
两边同时左乘
(
A
−
λ
I
)
s
−
1
(A-\lambda I)^{s-1}
(
A
−
λ
I
)
s
−
1
得
k
1
(
A
−
λ
I
)
s
−
1
x
1
+
k
2
(
A
−
λ
I
)
s
−
1
x
2
+
⋯
+
k
s
(
A
−
λ
I
)
s
−
1
x
s
=
0
⟹
k
s
x
1
=
0
⟹
k
s
=
0
k_1(A-\lambda I)^{s-1}\bm{x}_1+k_2(A-\lambda I)^{s-1}\bm{x}_2+\cdots+k_s(A-\lambda I)^{s-1}\bm{x}_s=0 \implies k_s\bm{x}_1=0 \implies k_s=0 \\
k
1
(
A
−
λ
I
)
s
−
1
x
1
+
k
2
(
A
−
λ
I
)
s
−
1
x
2
+
⋯
+
k
s
(
A
−
λ
I
)
s
−
1
x
s
=
0
⟹
k
s
x
1
=
0
⟹
k
s
=
0
两边同时左乘
(
A
−
λ
I
)
s
−
2
(A-\lambda I)^{s-2}
(
A
−
λ
I
)
s
−
2
得
k
1
(
A
−
λ
I
)
s
−
2
x
1
+
k
2
(
A
−
λ
I
)
s
−
2
x
2
+
⋯
+
k
s
−
1
(
A
−
λ
I
)
s
−
2
x
s
−
1
=
0
⟹
k
s
−
1
x
1
=
0
⟹
k
s
−
1
=
0
k_1(A-\lambda I)^{s-2}\bm{x}_1+k_2(A-\lambda I)^{s-2}\bm{x}_2+\cdots+k_{s-1}(A-\lambda I)^{s-2}\bm{x}_{s-1}=0 \implies k_{s-1}\bm{x}_1=0 \implies k_{s-1}=0 \\
k
1
(
A
−
λ
I
)
s
−
2
x
1
+
k
2
(
A
−
λ
I
)
s
−
2
x
2
+
⋯
+
k
s
−
1
(
A
−
λ
I
)
s
−
2
x
s
−
1
=
0
⟹
k
s
−
1
x
1
=
0
⟹
k
s
−
1
=
0
同理可得
k
1
=
k
2
=
⋯
=
k
s
=
0
k_1=k_2=\cdots=k_s=0
k
1
=
k
2
=
⋯
=
k
s
=
0
,所以
x
1
,
x
2
,
⋯
,
x
s
\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_s
x
1
,
x
2
,
⋯
,
x
s
线性无关。
\\
2. 证明:
\\
显然
A
x
1
=
λ
x
1
,
A
x
2
=
λ
x
2
+
x
1
,
⋯
,
A
x
s
=
λ
x
s
+
x
s
−
1
.
A\bm{x}_1=\lambda\bm{x}_1,A\bm{x}_2=\lambda\bm{x}_2+\bm{x}_1,\cdots,A\bm{x}_s=\lambda\bm{x}_s+\bm{x}_{s-1}. \\
A
x
1
=
λ
x
1
,
A
x
2
=
λ
x
2
+
x
1
,
⋯
,
A
x
s
=
λ
x
s
+
x
s
−
1
.
即
A
X
1
=
[
A
x
1
A
x
2
⋯
A
x
s
]
=
[
x
1
x
2
⋯
x
s
]
[
λ
1
λ
⋱
⋱
1
λ
]
=
X
1
J
s
(
λ
)
AX_1=\begin{bmatrix} A\bm{x}_1&A\bm{x}_2&\cdots&A\bm{x}_s \end{bmatrix}= \begin{bmatrix} \bm{x}_1&\bm{x}_2&\cdots&\bm{x}_s \end{bmatrix} \begin{bmatrix} \lambda&1&&\\ &\lambda&\ddots&\\ &&\ddots&1\\ &&&\lambda \end{bmatrix}= X_1J_s(\lambda)
A
X
1
=
[
A
x
1
A
x
2
⋯
A
x
s
]
=
[
x
1
x
2
⋯
x
s
]
λ
1
λ
⋱
⋱
1
λ
=
X
1
J
s
(
λ
)
证毕。
\\
3. 证明:
\\
由Jordan标准型立得,
A
A
A
相似于
J
n
(
λ
)
J_n(\lambda)
J
n
(
λ
)
,即存在可逆矩阵
X
X
X
,使得
A
=
X
J
n
(
λ
)
X
−
1
⟹
A
X
=
X
J
n
(
λ
)
.
A=XJ_n(\lambda)X^{-1}\implies AX=XJ_n(\lambda).\\
A
=
X
J
n
(
λ
)
X
−
1
⟹
A
X
=
X
J
n
(
λ
)
.
设
X
=
[
x
1
x
2
⋯
x
n
]
X=\begin{bmatrix} \bm{x}_1&\bm{x}_2&\cdots&\bm{x}_n \end{bmatrix}
X
=
[
x
1
x
2
⋯
x
n
]
,由第(2)小问可以知道
x
1
,
x
2
,
⋯
,
x
n
\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n
x
1
,
x
2
,
⋯
,
x
n
是Jordan链。因为Jordan链长度最多只能是n,所以
A
A
A
有一个关于
λ
\lambda
λ
的长度为
n
n
n
的Jordan链
x
1
,
x
2
,
⋯
,
x
n
\bm{x}_1,\bm{x}_2,\cdots,\bm{x}_n
x
1
,
x
2
,
⋯
,
x
n
。
\\
5.4.7
\quad
给定
m
m
m
阶方阵
A
1
A_1
A
1
,
n
n
n
阶方阵
A
2
A_2
A
2
和
m
×
n
m \times n
m
×
n
矩阵
B
B
B
,证明:
\\
1. 如果
A
1
A_1
A
1
和
A
2
A_2
A
2
没有相同的特征值,则关于
m
×
n
m \times n
m
×
n
矩阵
X
X
X
的Sylvester方程
A
1
X
−
X
A
2
=
B
A_1X-XA_2=B
A
1
X
−
X
A
2
=
B
有唯一解。
\\
证明:
\\
A
1
X
−
X
A
2
=
B
A_1X-XA_2=B
A
1
X
−
X
A
2
=
B
有唯一解等价于
A
1
X
−
X
A
2
=
O
A_1X-XA_2=O
A
1
X
−
X
A
2
=
O
只有零解。
\\
A
1
X
−
X
A
2
=
O
⟹
A
1
X
=
X
A
2
⟹
A_1X-XA_2=O\implies A_1X=XA_2\implies
A
1
X
−
X
A
2
=
O
⟹
A
1
X
=
X
A
2
⟹
等式两边左乘
A
1
A_1
A
1
得
A
1
2
X
=
A
1
X
A
2
⟹
A
1
2
X
=
X
A
2
2
.
A_1^2X=A_1XA_2\implies A_1^2X=XA_2^2.
A
1
2
X
=
A
1
X
A
2
⟹
A
1
2
X
=
X
A
2
2
.
以此类推,可以得到
A
1
k
X
=
X
A
2
k
A_1^kX=XA_2^k
A
1
k
X
=
X
A
2
k
,其中
k
k
k
是正整数。设
A
1
A_1
A
1
的特征多项式是
p
(
x
)
p(x)
p
(
x
)
,于是有
p
(
A
1
)
X
=
X
p
(
A
2
)
p(A_1)X=Xp(A_2)
p
(
A
1
)
X
=
Xp
(
A
2
)
由Hamilton-Cayley定理,
p
(
A
1
)
=
O
⟹
X
p
(
A
2
)
=
O
.
p(A_1)=O \implies Xp(A_2)=O.\\
p
(
A
1
)
=
O
⟹
Xp
(
A
2
)
=
O
.
p
(
A
2
)
p(A_2)
p
(
A
2
)
显然是个
n
n
n
阶方阵,下面我们证明其可逆。
\\
设
A
2
=
Z
−
1
J
Z
A_2=Z^{-1}JZ
A
2
=
Z
−
1
J
Z
,其中
J
J
J
是Jordan标准型,则
det
(
p
(
A
2
)
)
=
det
(
p
(
J
)
)
=
det
(
J
−
λ
1
I
n
1
)
det
(
J
−
λ
2
I
n
2
)
⋯
det
(
J
−
λ
s
I
n
s
)
\det(p(A_2))=\det(p(J))=\det(J-\lambda_1I_{n_1})\det(J-\lambda_2I_{n_2})\cdots\det(J-\lambda_sI_{n_s})
det
(
p
(
A
2
))
=
det
(
p
(
J
))
=
det
(
J
−
λ
1
I
n
1
)
det
(
J
−
λ
2
I
n
2
)
⋯
det
(
J
−
λ
s
I
n
s
)
其中
λ
1
,
λ
2
,
⋯
,
λ
s
\lambda_1,\lambda_2,\cdots,\lambda_s
λ
1
,
λ
2
,
⋯
,
λ
s
是
A
1
A_1
A
1
的特征值。
\\
因为
A
1
,
A
2
A_1,A_2
A
1
,
A
2
没有共同的特征值,所以
det
(
J
−
λ
1
I
n
1
)
,
⋯
,
det
(
J
−
λ
s
I
n
s
)
\det(J-\lambda_1I_{n_1}),\cdots,\det(J-\lambda_sI_{n_s})
det
(
J
−
λ
1
I
n
1
)
,
⋯
,
det
(
J
−
λ
s
I
n
s
)
均不为
0
0
0
,即
det
(
p
(
A
2
)
)
≠
0
\det(p(A_2))\neq 0
det
(
p
(
A
2
))
=
0
,
p
(
A
2
)
p(A_2)
p
(
A
2
)
可逆。
\\
而
X
p
(
A
2
)
=
O
Xp(A_2)=O
Xp
(
A
2
)
=
O
,这说明
N
(
X
)
=
R
n
\mathcal{N}(X)=\mathbb{R}^n
N
(
X
)
=
R
n
,即
X
=
O
X=O
X
=
O
。所以若
A
1
A_1
A
1
和
A
2
A_2
A
2
没有相同的特征值,则关于
m
×
n
m \times n
m
×
n
矩阵
X
X
X
的Sylvester方程
A
1
X
−
X
A
2
=
B
A_1X-XA_2=B
A
1
X
−
X
A
2
=
B
有唯一解。
\\
2. 如果
A
1
A_1
A
1
和
A
2
A_2
A
2
没有相同的特征值,则存在唯一的矩阵
X
X
X
满足
[
I
m
X
O
I
n
]
[
A
1
B
O
A
2
]
[
I
m
X
O
I
n
]
−
1
=
[
A
1
O
O
A
2
]
.
\begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix} \begin{bmatrix} A_1&B\\ O&A_2 \end{bmatrix} \begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix}^{-1}= \begin{bmatrix} A_1&O\\ O&A_2 \end{bmatrix}.
[
I
m
O
X
I
n
]
[
A
1
O
B
A
2
]
[
I
m
O
X
I
n
]
−
1
=
[
A
1
O
O
A
2
]
.
证明:
\\
注意到
[
I
m
X
O
I
n
]
−
1
=
[
I
m
−
X
O
I
n
]
\begin{bmatrix} I_m&X\\ O&I_n\\ \end{bmatrix}^{-1}=\begin{bmatrix} I_m&-X\\ O&I_n\\ \end{bmatrix}
[
I
m
O
X
I
n
]
−
1
=
[
I
m
O
−
X
I
n
]
,于是等式左边用矩阵乘法展开得到
[
A
1
B
+
X
A
2
−
A
1
X
O
A
2
]
=
[
A
1
O
O
A
2
]
.
\begin{bmatrix} A_1&B+XA_2-A_1X\\ O&A_2\\ \end{bmatrix} = \begin{bmatrix} A_1&O\\ O&A_2 \end{bmatrix}.
[
A
1
O
B
+
X
A
2
−
A
1
X
A
2
]
=
[
A
1
O
O
A
2
]
.
所以原命题等价于:如果
A
1
A_1
A
1
和
A
2
A_2
A
2
没有相同的特征值,则存在唯一的矩阵
X
X
X
满足
A
1
X
−
X
A
2
=
B
A_1X-XA_2=B
A
1
X
−
X
A
2
=
B
。这正是第(1)问已经证明的结论。
\\
3.对
n
n
n
阶方阵
A
A
A
,存在可逆矩阵
X
X
X
,使得
X
−
1
A
X
=
[
λ
1
I
+
N
1
λ
2
I
+
N
2
⋱
λ
s
I
+
N
s
]
,
X^{-1}AX=\begin{bmatrix} \lambda_1I+N_1&&&\\ &\lambda_2I+N_2&&\\ &&\ddots&\\ &&&\lambda_sI+N_s \end{bmatrix},
X
−
1
A
X
=
λ
1
I
+
N
1
λ
2
I
+
N
2
⋱
λ
s
I
+
N
s
,
其中
N
1
,
N
2
,
⋯
,
N
s
N_1,N_2,\cdots,N_s
N
1
,
N
2
,
⋯
,
N
s
是严格上三角阵。
\\
证明:
\\
由Jordan标准型立得。
\\
4. 如果
m
>
n
m>n
m
>
n
且
A
1
=
J
m
(
0
)
,
A
2
=
J
n
(
0
)
,
B
=
e
1
b
T
A_1=J_m(0),A_2=J_n(0),B=\bm{e}_1\bm{b}^{\mathrm{T}}
A
1
=
J
m
(
0
)
,
A
2
=
J
n
(
0
)
,
B
=
e
1
b
T
,即
B
B
B
除第一行外元素全为0,则关于
m
×
n
m \times n
m
×
n
矩阵
X
X
X
的Sylvester方程
A
1
X
−
X
A
2
=
B
A_1X-XA_2=B
A
1
X
−
X
A
2
=
B
有解,于是存在矩阵
X
X
X
满足
[
I
m
X
O
I
n
]
[
A
1
B
O
A
2
]
[
I
m
X
O
I
n
]
−
1
=
[
A
1
O
O
A
2
]
.
\begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix} \begin{bmatrix} A_1&B\\ O&A_2 \end{bmatrix} \begin{bmatrix} I_m&X\\ O&I_n \end{bmatrix}^{-1}= \begin{bmatrix} A_1&O\\ O&A_2 \end{bmatrix}.
[
I
m
O
X
I
n
]
[
A
1
O
B
A
2
]
[
I
m
O
X
I
n
]
−
1
=
[
A
1
O
O
A
2
]
.
证明:
\\
设
X
=
[
x
1
T
x
2
T
⋮
x
m
T
]
=
[
x
11
x
12
⋯
x
1
n
x
21
x
22
⋯
x
2
n
⋮
⋮
⋮
x
m
1
x
m
2
⋯
x
m
n
]
,
B
=
[
b
T
0
T
⋮
0
T
]
=
[
b
1
b
2
⋯
b
n
0
0
⋯
0
⋮
⋮
⋮
0
0
⋯
0
]
X=\begin{bmatrix} \bm{x}_1^{\mathrm{T}}\\ \bm{x}_2^{\mathrm{T}}\\ \vdots\\ \bm{x}_m^{\mathrm{T}}\\ \end{bmatrix} = \begin{bmatrix} x_{11}&x_{12}&\cdots&x_{1n}\\ x_{21}&x_{22}&\cdots&x_{2n}\\ \vdots&\vdots&&\vdots\\ x_{m1}&x_{m2}&\cdots&x_{mn}\\ \end{bmatrix}, B=\begin{bmatrix} \bm{b}^{\mathrm{T}}\\ \bm{0}^{\mathrm{T}}\\ \vdots\\ \bm{0}^{\mathrm{T}}\\ \end{bmatrix} = \begin{bmatrix} b_1&b_2&\cdots&b_n\\ 0&0&\cdots&0\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&0 \end{bmatrix} \\
X
=
x
1
T
x
2
T
⋮
x
m
T
=
x
11
x
21
⋮
x
m
1
x
12
x
22
⋮
x
m
2
⋯
⋯
⋯
x
1
n
x
2
n
⋮
x
mn
,
B
=
b
T
0
T
⋮
0
T
=
b
1
0
⋮
0
b
2
0
⋮
0
⋯
⋯
⋯
b
n
0
⋮
0
直接用矩阵乘法计算
A
1
X
−
X
A
2
=
B
A_1X-XA_2=B
A
1
X
−
X
A
2
=
B
得,
[
x
21
x
22
−
x
11
x
23
−
x
12
⋯
x
2
n
−
x
1
,
n
−
1
x
31
x
32
−
x
21
x
33
−
x
22
⋯
x
3
n
−
x
2
,
n
−
1
⋮
⋮
⋮
⋮
x
m
1
x
m
2
−
x
m
−
1
,
1
x
m
3
−
x
m
−
1
,
2
⋯
x
m
n
−
x
m
−
1
,
n
−
1
0
−
x
m
1
−
x
m
2
⋯
−
x
m
,
n
−
1
]
=
[
b
1
b
2
⋯
b
n
0
0
⋯
0
⋮
⋮
⋮
0
0
⋯
0
0
0
⋯
0
]
\begin{bmatrix} x_{21}&x_{22}-x_{11}&x_{23}-x_{12}&\cdots&x_{2n}-x_{1,n-1}\\ x_{31}&x_{32}-x_{21}&x_{33}-x_{22}&\cdots&x_{3n}-x_{2,n-1}\\ \vdots&\vdots&\vdots&&\vdots \\ x_{m1}&x_{m2}-x_{m-1,1}&x_{m3}-x_{m-1,2}&\cdots&x_{mn}-x_{m-1,n-1}\\ 0&-x_{m1}&-x_{m2}&\cdots&-x_{m,n-1} \end{bmatrix} = \begin{bmatrix} b_1&b_2&\cdots&b_n\\ 0&0&\cdots&0\\ \vdots&\vdots&&\vdots \\ 0&0&\cdots&0\\ 0&0&\cdots&0 \end{bmatrix}
x
21
x
31
⋮
x
m
1
0
x
22
−
x
11
x
32
−
x
21
⋮
x
m
2
−
x
m
−
1
,
1
−
x
m
1
x
23
−
x
12
x
33
−
x
22
⋮
x
m
3
−
x
m
−
1
,
2
−
x
m
2
⋯
⋯
⋯
⋯
x
2
n
−
x
1
,
n
−
1
x
3
n
−
x
2
,
n
−
1
⋮
x
mn
−
x
m
−
1
,
n
−
1
−
x
m
,
n
−
1
=
b
1
0
⋮
0
0
b
2
0
⋮
0
0
⋯
⋯
⋯
⋯
b
n
0
⋮
0
0
将
X
X
X
按行排列成列向量,
[
−
J
n
T
(
0
)
I
n
−
J
n
T
(
0
)
⋱
⋱
I
n
−
J
n
T
(
0
)
]
[
x
1
x
2
⋮
x
m
]
=
[
b
0
⋮
0
]
\begin{bmatrix} -J_n^{\mathrm{T}}(0)&I_n&&\\ &-J_n^{\mathrm{T}}(0)&\ddots&\\ &&\ddots&I_n\\ &&&-J_n^{\mathrm{T}}(0) \end{bmatrix} \begin{bmatrix} \bm{x}_1\\ \bm{x}_2\\ \vdots\\ \bm{x}_m\\ \end{bmatrix} = \begin{bmatrix} \bm{b}\\ \bm{0}\\ \vdots\\ \bm{0} \end{bmatrix}
−
J
n
T
(
0
)
I
n
−
J
n
T
(
0
)
⋱
⋱
I
n
−
J
n
T
(
0
)
x
1
x
2
⋮
x
m
=
b
0
⋮
0
显然系数矩阵的秩和增广矩阵秩相等,方程有解。
\\
5. 对
n
n
n
阶方阵
A
=
[
J
k
1
(
0
)
e
1
a
2
T
⋯
e
1
a
r
T
J
k
2
(
0
)
⋱
J
k
r
(
0
)
]
A=\begin{bmatrix} J_{k_1}(0)&\bm{e}_1\bm{a}_2^{\mathrm{T}}&\cdots&\bm{e}_1\bm{a}_r^{\mathrm{T}}\\ &J_{k_2}(0)&&\\ &&\ddots&\\ &&&J_{k_r}(0) \end{bmatrix}
A
=
J
k
1
(
0
)
e
1
a
2
T
J
k
2
(
0
)
⋯
⋱
e
1
a
r
T
J
k
r
(
0
)
,其中
k
1
>
k
2
≥
⋯
≥
k
r
k_1>k_2\geq\cdots\geq k_r
k
1
>
k
2
≥
⋯
≥
k
r
(即
A
A
A
是一个Jordan标准型与除第一行外元素全为0矩阵的和),存在可逆矩阵
X
X
X
,使得
X
−
1
A
X
=
[
J
k
1
(
0
)
J
k
2
(
0
)
⋱
J
k
r
(
0
)
]
.
X^{-1}AX=\begin{bmatrix} J_{k_1}(0)&&&\\ &J_{k_2}(0)&&\\ &&\ddots&\\ &&&J_{k_r}(0) \end{bmatrix}.
X
−
1
A
X
=
J
k
1
(
0
)
J
k
2
(
0
)
⋱
J
k
r
(
0
)
.
证明:
\\
设
J
=
[
J
k
2
(
0
)
⋱
J
k
n
(
0
)
]
,
B
=
[
e
1
a
2
T
⋯
e
1
a
r
T
]
J=\begin{bmatrix} J_{k_2}(0)&&\\ &\ddots&\\ &&J_{k_n}(0) \end{bmatrix},B=\begin{bmatrix} \bm{e}_1\bm{a}_2^{\mathrm{T}}&\cdots&\bm{e}_1\bm{a}_r^{\mathrm{T}} \end{bmatrix}\\
J
=
J
k
2
(
0
)
⋱
J
k
n
(
0
)
,
B
=
[
e
1
a
2
T
⋯
e
1
a
r
T
]
则
A
=
[
J
k
1
(
0
)
B
O
J
]
.
A=\begin{bmatrix} J_{k_1}(0)&B\\ O&J \end{bmatrix}.\\
A
=
[
J
k
1
(
0
)
O
B
J
]
.
由(2)(4)小问结论可知,命题显然成立。