5.4.1 设A,B是n阶方阵,且满足AB=BA.
1. 证明,若
A有
n个不同的特征值,则
B可对角化。
2. 若
A有代数重数大于1的特征值,则
B是否一定可对角化?
1. 证明:
先证引理:与对角元素均不同的对角矩阵可交换的矩阵一定是对角矩阵。
设
n阶方阵
S和对角元素均不同的对角矩阵
Λ滿足
SΛ=ΛS,即
λ1λ2⋱λns11s21⋮sn1s12s22⋮sn2⋯⋯⋯s1ns2n⋮snn=s11s21⋮sn1s12s22⋮sn2⋯⋯⋯s1ns2n⋮snnλ1λ2⋱λn
化简后得,
(λi−λj)sij=0。而当
i=j时,
(λi−λj)=0,所以
sij=0(i=j)。即
S是对角矩阵。
引理证毕。
A有
n个不同的特征值
⟹ A可对角化,即存在可逆矩阵
X使得
A=XΛX−1,其中
Λ是对角元素均不同的对角矩阵。
AB=BA⟹XΛX−1B=BXΛX−1⟹ΛX−1BX=X−1BXΛ⟹X−1BX是对角矩阵。所以
B可对角化。
2. 解:
不一定。若
A=In,则对任意的
n阶矩阵
B都有
AB=BA。
5.4.2 对下列矩阵A,B,求X使得A=XBX−1.
1.
A=MN,B=NM,其中
M,N是方阵,且
M可逆。
2.
A=[MNNOO],B=[ONONM],其中
M,N不必是方阵。
3.
A=[MN−NM],B=[M+iNOOM−iN],其中
M,N是方阵。
1.
X=M.
2.
X=[ImOMIn]
3.
X=[In−iInIniIn]
5.4.3 给定n阶方阵A,B满足AB=BA.
1. 证明,若
A有
n个不同的特征值,则存在次数不超过
n−1的多项式
f(x),使得
B=f(A).
2. 证明,若
A=Jn(λ),则存在次数不超过
n−1的多项式
f(x),使得
B=f(A).
3. 举例说明,存在
A,B满足
AB=BA,但不存在多项式
f(x),使得
B=f(A).
1. 证明:
因为
A有
n个不同的特征值,且
AB=BA,则根据5.4.1中结论可知,
A,B可以同时对角化。即存在
X使
A=XΛAX−1,B=XΛBX−1。其中
ΛA=diag(λ1,λ2,⋯,λn),λ1=λ2=⋯=λn.ΛB=diag(b1,b2,⋯,bn).
又因为Vandermonde矩阵
11⋮1λ1λ2⋮λnλ12λ22⋮λn2⋯⋯⋯λ1n−1λ2n−1⋮λnn−1可逆,所以方程
11⋮1λ1λ2⋮λnλ12λ22⋮λn2⋯⋯⋯λ1n−1λ2n−1⋮λnn−1k0k1⋮kn−1=b1b2⋮bn一定有解。即存在一组
k1,k2,⋯,kn,使得
ΛB=k0In+k1ΛA+⋯+kn−1ΛAn−1成立。等式两边同时左乘
X,右乘
X−1得
B=k0In+k1A+⋯+kn−1An−1。即存在次数不超过
n−1的多项式
f(x),使得
B=f(A)。
2. 证明:
设
A=λIn+S,其中
S=0101⋱⋱⋱10.
而
AB=BA⟹(λIn+S)B=B(λIn+S)⟹SB=BS.这表明
B所有行向量上移一格和
B所有列向量右移一格得到的矩阵相同。于是
B可以被表示为:
B=b1b2b1⋯⋱⋱bn⋮b2b1
注意到,
Ak=λkCk1λk−1λkCk2λk−2Ck1λk−1λk⋯Ck2λk−2Ck1λk−1λk1⋱⋱⋱⋱⋱⋱⋱1⋮Ck2λk−2Ck1λk−1λk其中
k≤n.
可以发现
Ak和
B具有相同的形式。于是原命题(存在次数不超过
n−1的多项式
f(x),使得
B=f(A))等价于下列方程有解。
1λ1λ22λ1⋯⋯⋱λn−1Cn−12λn−1⋮⋮1k1k2⋮⋮kn=b1b2⋮⋮bn
左侧矩阵行列式为1,所以矩阵可逆,方程有唯一解,命题成立。
3. 解:
设
A=In,
B是任意不是对角阵的矩阵。显然有
AB=InB=BIn=BA.但不存在多项式
f(x)使
B=f(A)。
5.4.4 证明,任意迹为0的方阵相似于一个对角元素全为0的方阵。
证明:
用数学归纳法。当阶数为
1时,显然成立。
现假设阶数为
n−1时命题成立,考虑
n阶方阵
A。在
Rn中取一向量
q,但
q不是
A的特征向量(若不存在这样的
q,说明
A是零矩阵,命题显然成立。)此时
q,Aq线性无关。将
q,Aq张成
Rn的一组基
(q,Aq,b3,b4,⋯,bn)。设
B=[qAqb3⋯bn],显然
B是
n阶可逆矩阵。
注意到
AB=[AqA2q⋯Abn],即
B的第二列在左乘
A之后被移到了第一列。于是
AB=B[e2⋯⋯]=B[0sxTC]
其中
x∈Rn−1,C∈R(n−1)×(n−1),s=10⋮0.
等式两边左乘
B−1得,
A相似于
[0sxTC]。因为相似不改变特征值且
trace(A)=0,所以
trace(C)=0。
根据归纳假设,对
n−1阶方阵
C,若
trace(C)=0,则存在可逆矩阵
Z使得
Z−1CZ的对角元全是
0.
于是
[1OOZ]−1[0sxTC][1OOZ]=[0Z−1sxTZZ−1CZ]
根据相似的传递性,
A也相似于一个对角元全是
0的矩阵。由阶数为
n−1时命题成立可推出阶数为
n时也成立,所以阶数为
n≥1时均成立。
5.4.5 利用Jordan标准型证明,A与AT相似。
证明:
显然
A和
AT具有相同的特征值,代数重数,几何重数。所以他们相似于同一个Jordan标准型。由相似的传递性和对称性可知
A和
AT相似。
5.4.6 (Jordan链) 对任意n阶方阵A,一组向量x1,x2,⋯,xs,如果存在λ∈C,使得x1=0,(A−λI)x1=0,(A−λI)x2=x1,⋯,(A−λI)xs=xs−1,而(A−λI)y=xs无解,就称其为A的一个关于λ长度为s的Jordan链。显然x1∈N(A−λI)是特征向量,x2∈N((A−λI)2),⋯,xs∈N((A−λI)s),但xs∈/R(A−λI).求证:
1.
x1,x2,⋯,xs线性无关。
2. 令
X1=[x1x2⋯xs],则
AX1=X1Js(λ)。
3. 若
A只有一个特征值,且其几何重数是1,则
A相似于
Jn(λ),且有一个关于
λ的长度为
n的Jordan链
x1,x2,⋯,xn。
1. 证明:
设
k1x1+k2x2+⋯+ksxs=0,
两边同时左乘
(A−λI)s−1得
k1(A−λI)s−1x1+k2(A−λI)s−1x2+⋯+ks(A−λI)s−1xs=0⟹ksx1=0⟹ks=0
两边同时左乘
(A−λI)s−2得
k1(A−λI)s−2x1+k2(A−λI)s−2x2+⋯+ks−1(A−λI)s−2xs−1=0⟹ks−1x1=0⟹ks−1=0
同理可得
k1=k2=⋯=ks=0,所以
x1,x2,⋯,xs线性无关。
2. 证明:
显然
Ax1=λx1,Ax2=λx2+x1,⋯,Axs=λxs+xs−1.
即
AX1=[Ax1Ax2⋯Axs]=[x1x2⋯xs]λ1λ⋱⋱1λ=X1Js(λ)证毕。
3. 证明:
由Jordan标准型立得,
A相似于
Jn(λ),即存在可逆矩阵
X,使得
A=XJn(λ)X−1⟹AX=XJn(λ).
设
X=[x1x2⋯xn],由第(2)小问可以知道
x1,x2,⋯,xn是Jordan链。因为Jordan链长度最多只能是n,所以
A有一个关于
λ的长度为
n的Jordan链
x1,x2,⋯,xn。
5.4.7 给定m阶方阵A1,n阶方阵A2和m×n矩阵B,证明:
1. 如果A1和A2没有相同的特征值,则关于m×n矩阵X的Sylvester方程A1X−XA2=B有唯一解。
证明:
A1X−XA2=B有唯一解等价于
A1X−XA2=O只有零解。
A1X−XA2=O⟹A1X=XA2⟹等式两边左乘
A1得
A12X=A1XA2⟹A12X=XA22.以此类推,可以得到
A1kX=XA2k,其中
k是正整数。设
A1的特征多项式是
p(x),于是有
p(A1)X=Xp(A2)由Hamilton-Cayley定理,
p(A1)=O⟹Xp(A2)=O.
p(A2)显然是个
n阶方阵,下面我们证明其可逆。
设
A2=Z−1JZ,其中
J是Jordan标准型,则
det(p(A2))=det(p(J))=det(J−λ1In1)det(J−λ2In2)⋯det(J−λsIns)
其中
λ1,λ2,⋯,λs是
A1的特征值。
因为
A1,A2没有共同的特征值,所以
det(J−λ1In1),⋯,det(J−λsIns)均不为
0,即
det(p(A2))=0,
p(A2)可逆。
而
Xp(A2)=O,这说明
N(X)=Rn,即
X=O。所以若
A1和
A2没有相同的特征值,则关于
m×n矩阵
X的Sylvester方程
A1X−XA2=B有唯一解。
2. 如果A1和A2没有相同的特征值,则存在唯一的矩阵X满足
[ImOXIn][A1OBA2][ImOXIn]−1=[A1OOA2].
证明:
注意到
[ImOXIn]−1=[ImO−XIn],于是等式左边用矩阵乘法展开得到
[A1OB+XA2−A1XA2]=[A1OOA2].
所以原命题等价于:如果
A1和
A2没有相同的特征值,则存在唯一的矩阵
X满足
A1X−XA2=B。这正是第(1)问已经证明的结论。
3.对n阶方阵A,存在可逆矩阵X,使得
X−1AX=λ1I+N1λ2I+N2⋱λsI+Ns,
其中
N1,N2,⋯,Ns是严格上三角阵。
证明:
由Jordan标准型立得。
4. 如果m>n且A1=Jm(0),A2=Jn(0),B=e1bT,即B除第一行外元素全为0,则关于m×n矩阵X的Sylvester方程A1X−XA2=B有解,于是存在矩阵X满足
[ImOXIn][A1OBA2][ImOXIn]−1=[A1OOA2].
证明:
设
X=x1Tx2T⋮xmT=x11x21⋮xm1x12x22⋮xm2⋯⋯⋯x1nx2n⋮xmn,B=bT0T⋮0T=b10⋮0b20⋮0⋯⋯⋯bn0⋮0
直接用矩阵乘法计算
A1X−XA2=B得,
x21x31⋮xm10x22−x11x32−x21⋮xm2−xm−1,1−xm1x23−x12x33−x22⋮xm3−xm−1,2−xm2⋯⋯⋯⋯x2n−x1,n−1x3n−x2,n−1⋮xmn−xm−1,n−1−xm,n−1=b10⋮00b20⋮00⋯⋯⋯⋯bn0⋮00
将
X按行排列成列向量,
−JnT(0)In−JnT(0)⋱⋱In−JnT(0)x1x2⋮xm=b0⋮0
显然系数矩阵的秩和增广矩阵秩相等,方程有解。
5. 对n阶方阵A=Jk1(0)e1a2TJk2(0)⋯⋱e1arTJkr(0),其中k1>k2≥⋯≥kr(即A是一个Jordan标准型与除第一行外元素全为0矩阵的和),存在可逆矩阵X,使得
X−1AX=Jk1(0)Jk2(0)⋱Jkr(0).
证明:
设
J=Jk2(0)⋱Jkn(0),B=[e1a2T⋯e1arT]
则
A=[Jk1(0)OBJ].由(2)(4)小问结论可知,命题显然成立。