6.3.1
略。
6.3.2 矩阵A的 QR 分解A=QR,且R有奇异值分解R=UΣVT,求A的奇异值分解。
解:
显然矩阵
QU也是正交矩阵,于是
A的奇异值分解是
A=QUΣVT.
6.3.3 设A的奇异值分解为A=UΣVT,求矩阵[OAATO]的谱分解。
解:
注意
A不一定是方阵且可能不满秩。
设
rank(A)=r,则
U=[u1⋯urur+1⋯un],V=[v1⋯vrvr+1⋯vn]。
A的简化奇异值分解为
A=σ1u1v1T+⋯+σrurvrT,其中
u1⋯ur正交,
v1⋯vr正交。
先考虑
1≤i≤r的情况,此时
Avi=σiui,ATui=σivi,于是
[OAATO][viui]=[ATuiAvi]=σi[viui]
[OAATO][vi−ui]=[−ATuiAvi]=−σi[vi−ui]
所以
σi是特征值,对应的特征向量是
[viui],
−σi也是特征值,对应的特征向量是
[vi−ui]。这里有
2r个特征值。
再考虑
r<i≤n,显然此时
Avi=ATui=0,于是
[OAATO][0ui]=[ATui0]=0
[OAATO][vi0]=[0Avi]=0
所以
0是特征值,对应的特征向量是
[0ui]和
[vi0]。这里有
2(n−r)个特征值。
设
U1=[u1⋯ur],U2=[ur+1⋯un],V1=[v1⋯vr],V2=[vr+1⋯vn],则
U=[U1U2],V=[V1V2],所以谱分解为
[OAATO]=[V1U1V1−U1OU2V2O]σ1⋱σr−σ1⋱−σr0⋱0V1TV1TOV2TU1T−U1TU2TO
6.3.4 设矩阵A=[1−101],考虑单位圆C={v∈R2∣∥v∥=1}及其在A对应的线性变换A下的像A(C)={Av∈R2∣∥v∥=1}.
1.设
w∈A(C),证明
wT(AAT)−1w=1.
证明:
设
w=Av,∥v∥=1,则
wT(AAT)−1w=vTATA−TA−1Av=vTv=1.
2.求
A的奇异值分解
A=UΣVT.
解:
A=10−251−510−25210+251+510+25225+125−110+25−1−510+25−1+510+25210−252
3. 注意
V,U 为二阶正交矩阵,对应的线性变换是旋转或反射,而
Σ 是对角矩阵,对应伸缩变换。从几何上看,曲线
VT(C),ΣVT(C),UΣVT(C) 分别是什么形状?
解:
圆,椭圆,椭圆。
6.3.5 设矩阵A的奇异值分解是A=UΣVT.
1. 证明AAT=U(ΣΣT)UT,ATA=V(ΣTΣ)VT分别是这两个对称矩阵的谱分解,并得到AAT和ATA的非零特征值相同。
2. 对任意A的奇异值σ=0,设v和w分别是ATA和AAT的属于σ2的特征向量,证明Av
和ATw分别是AAT和ATA的属于σ2的特征向量.
1.
略。
2. 证明:
ATAv=σ2v⟹AATAv=σ2Av⟹Av是
AAT属于
σ2的特征向量。
AATw=σ2w⟹ATAATw=σ2ATw⟹ATw是
ATA属于
σ2的特征向量。
6.3.6 (极分解) 对n阶方阵A,存在正交矩阵Q和对称半正定矩阵S,使得A=QS.
分解式
A=QS称为
A的极分解. 容易看到,
A=S1Q1,即方阵分解为对称半正定矩阵和正交
矩阵的乘积,也存在。
证明:
A=UΣVT=UVTVΣVT。显然
Q=UVT是正交矩阵,
S=VΣVT是半正定的对称矩阵,所以
A存在极分解
A=QS。同理,
A=UΣVT=UΣUTUVT,其中
S1=UΣUT是对称半正定矩阵,
Q1=UVT是正交矩阵,所以分解
A=S1Q1也存在。
6.3.7 证明矩阵的广义逆唯一。
证明:
由广义逆的性质,有
AA+A=A,A+AA+=A+,
AA+和
A+A均为对称矩阵。设
A有两个不同的广义逆
X1,X2,则
X1=X1AX1=X1AX2AX1=(X1A)T(X2A)TX1=(X2AX1A)TX1=(X2A)TX1=X2AX1=X2AX2AX1=X2(AX2)T(AX1)T=X2(AX1AX2)T=X2(AX2)T=X2AX2=X2
即
X1=X2,于是矩阵的广义逆唯一。
6.3.8 (谱范数的性质) 证明命题 6.3.7. 矩阵的谱范数满足:
1. ∥A∥≥0,且∥A∥=0当且仅当A=O;
2. ∥kA∥=∣k∣∥A∥;
3. ∥A+B∥≤∥A∥+∥B∥;
4. ∥AB∥≤∥A∥∥B∥;
5. 如果U,V是正交矩阵,则∥UAVT∥=∥A∥.
1.证明:
∥A∥=x=0max∥x∥∥Ax∥≥0,而
∥A∥=0⟺∀x=0,∥Ax∥=0⟺N(A)=Rn⟺A=O.
2.证明:
∥kA∥=x=0max∥x∥∥kAx∥=∣k∣∥A∥.
3.证明:
由谱范数定义,
∥A+B∥=x=0max∥x∥∥Ax+Bx∥≤x=0max∥x∥∥Ax∥+∥Bx∥(由三角不等式)≤x=0maxx∥Ax∥+x=0maxx∥Bx∥(因为最大值不一定同时取到)=∥A∥+∥B∥.
即
∥A+B∥≤∥A∥+∥B∥.
4.证明:
由谱范数定义,
∥AB∥=x=0max∥x∥∥ABx∥=Bx=0max∥Bx∥∥ABx∥∥x∥∥Bx∥≤y∈R(B),y=0max∥y∥∥Ay∥x=0max∥x∥∥Bx∥(因为最大值不一定同时取到)≤y=0max∥y∥∥Ay∥x=0max∥x∥∥Bx∥(因为y的取值范围变大了)=∥A∥∥B∥.
即
∥AB∥≤∥A∥∥B∥.
5. 证明:
正交矩阵不改变向量的长度,于是
∥UA∥=x=0max∥x∥∥UAx∥=x=0max∥x∥∥Ax∥=∥A∥
∥AVT∥=x=0max∥x∥∥AVTx∥=x=0max∥VTx∥∥AVTx∥=y=0max∥y∥∥Ay∥=∥A∥
所以
∥UAVT∥=∥AVT∥=∥UA∥=∥A∥.
6.3.9 证明矩阵任意特征值的绝对值不大于其最大的奇异值。
证明:
σmax=x=0max∥x∥∥Ax∥,而对任意特征值
λ都有
∥Av∥=∥λv∥=∣λ∣∥v∥⟹∣λ∣=∥v∥∥Av∥,其中
v是是对应的特征向量。即
∣λ∣≤σmax.
6.3.10证明或者举出反例。
1. n阶方阵A为正交矩阵当且仅当它的n个奇异值都是1。
2. n阶方阵的n个奇异值的乘积等于所有特征值的乘积。
3.设n阶方阵A和A+In的奇异值分解分别为A=UΣVT,A+In=U(Σ+In)VT.证明A是对称矩阵。
4. 如果n阶方阵A的n个奇异值就是它的n个特征值,则A是对称矩阵。
1.证明:
A为正交矩阵
⟺ATA=AAT=In⟺n个奇异值都是1。
2.
显然不正确,奇异值乘积不小于0,而特征值的乘积可以为任意实数。
3.证明:
A+In=U(Σ+In)VT=UΣVT+UVT⟹UVT=In⟹U=V⟹A=UΣUT⟹A是对称矩阵。
4.证明:
要证
A是对称矩阵,只需要证
A−AT=O。由Frobenius范数性质可得
trace(ATA)=O⟺A=O.所以
trace((A−AT)T(A−AT))=trace(AAT+ATA−A2−(AT)2)=trace(AAT)+trace(ATA)−trace(A2)−trace((AT)2)=2trace(ATA)−2trace(A2)=2i=1∑nσi2−2i=1∑nλi2=0
于是
A−AT=O⟹A是对称矩阵。
6.3.11 (Frobenius范数的性质) 证明命题 6.3.15. 矩阵的Frobenius范数满足:
1. ∥A∥F≥0,且∥A∥F=0当且仅当A=O;
2. ∥kA∥F=∣k∣∥A∥F;
3. ∥A+B∥F≤∥A∥F+∥B∥F;
4. ∥AB∥F≤∥A∥∥B∥F,∥AB∥F≤∥A∥F∥B∥;
5. 如果U,V是正交矩阵,则∥UAVT∥F=∥A∥F.
1. 证明:
由Frobenius范数定义
∥A∥F=trace(ATA)=i=1∑mj=1∑n∣aij∣2立得。
2. 证明:
∥kA∥F=k2trace(ATA)=∣k∣trace(ATA)=∣k∣∥A∥F.
3. 证明:
由三角不等式,
∥A+B∥F=i=1∑mj=1∑n∣aij+bij∣2≤i=1∑m∣aij∣2+j=1∑n∣bij∣2=∥A∥F+∥B∥F.
4. 证明:
∥A∥=max∥x∥∥Ax∥⟹∥A∥≥∥x∥∥Ax∥⟹∥Ax∥≤∥A∥∥x∥.
设
B=[b1b2⋯bn],则
AB=[Ab1Ab2⋯Abn],由Frobenius范数定义有
∥AB∥F2=i=1∑n∥Abi∥2≤∥A∥2i=1∑n∥bi∥2=∥A∥2∥B∥F2.即
∥AB∥F≤∥A∥∥B∥F.
同理,设
A=a1Ta2T⋮anT可得
∥AB∥F≤∥A∥F∥B∥.
5. 证明:
∥UA∥F=trace(ATUTUA)=trace(ATA)=∥A∥F
∥AVT∥F=trace(VATAVT)=trace(VTVATA)=trace(ATA)=∥A∥F
于是
∥UAVT∥F=∥UA∥F=∥A∥F.
6.3.12 证明命题 6.3.16. 对任意矩阵A,其Frobenius范数平方∥A∥F2等于A所有奇异值的平方和。因此∥A∥F≥∥A∥
证明:
∥A∥F2=trace(ATA)=i=1∑nσi2≥σmax2=∥A∥2.
6.3.13 (樊畿迹定理) 对任意n阶对称矩阵A∈Rn×n ,假设特征值为λ1⩾λ2⩾...⩾λn,对应特征向量为u1,u2,⋯,un,则n×m矩阵Q:QTQ=Imaxtrace(QTAQ)=i=1∑mλi,且Q=[u1u2⋯um]时取得最大值。
证明:
设
Q=[q1q2⋯qm],且列向量两两正交。则
trace(QTAQ)=q1TAq1+q2TAq2+⋯+qmTAqm.
注意到
qiTAqi=qiTqiqiTAqi是
qi关于
A的Rayleigh商。于是
qiTqi=1maxqiTAqi=λ1,k≤i≤mmaxqiTAqi=λk,当且仅当
qi为对应特征值时取得最大值。
所以
n×m矩阵Q:QTQ=Imaxtrace(QTAQ)=i=1∑mλi,当且仅当
Q=[u1u2⋯um]时取得最大值。
6.3.14
略。唯一需要注意的是不要浪费时间去算第四问
B的最佳秩1逼近。这里直接给出
B的奇异值分解,供读者观摩。
显然
B=[−2−9−1−11−1211],于是
B的奇异值分解为
[−2−9−1−11−1211]=UΣVT
其中
U=−440369409+21440369409+21−440369409+21−440369409+21
Σ=[11009+10700−11009+1070000]
VT=−0.633−0.081−0.0542131342400176066361+4401330.1480.546−0.816−2131342400176066361+44013387−1741741117417471740957010347859570−478595703147851104785T
用numpy进行奇异值分解后计算秩一逼近
B1=σ1u1v1T=[−1.7910−9.0413−0.2283−1.1528−0.1528−0.77162.172210.9658]
可以看到秩一逼近已经很接近真实值了。
6.3.15 考虑子空间M,N,其对应的正交投影矩阵为P,Q.我们想要研究矩阵
H=P(P+Q)+Q+Q(P+Q)+P.
1.计算(P+Q)(P+Q)+的列空间和零空间,该矩阵是否为一个正交投影矩阵?
2.计算(P+Q)+(P+Q)的列空间和零空间,该矩阵是否为一个正交投影矩阵?和前一矩阵有何关联?
3.证明Q(P+Q)+(P+Q)=Q,(P+Q)(P+Q)+Q=Q.
4.证明H=2P(P+Q)+Q=2Q(P+Q)+P.
5.假设T是 M∩N上的正交投影矩阵,证明HP=HQ=HT=H.
6.证明HT=T.
于是H=T,由此即得M∩N的正交投影矩阵的表达式。
1.解:
设
P+Q=A,由广义逆性质可知
AA+=UrUrT,其中
Ur是
R(A)的一组标准正交基,于是
R(AA+)=R(A)=R(P+Q)。同理可得
N(AA+)=N(P+Q)。
接下来我们将证明,
R(P+Q)=M+N,N(P+Q)=(M+N)⊥。
对
∀x∈N(P+Q),(P+Q)x=0⟹Px+Qx=0⟹Px=−Qx。而
P是
M的正交投影矩阵,
Q是
N的正交投影矩阵,
Px∈M,Qx∈N,这说明
∀x∈N(P+Q),Px∈M∩N,Qx∈M∩N。
设
M∩N的正交投影矩阵是
T,则
PT=QT=T=TT=(PT)T=(QT)T=TP=TQ于是
Px=−Qx⟹TPx=−TQx⟹Tx=−Tx⟹Tx=0⟹TPx=TQx=0
又因为
Px∈M∩N,Qx∈M∩N,且
T是
M∩N的正交投影矩阵,所以
TPx=Px=0,TQx=Qx=0⟹N(P+Q)⊆N(P)∩N(Q)。显然
N(P)∩N(Q)⊆N(P+Q)也成立,于是
N(P+Q)=N(P)∩N(Q)=M⊥∩N⊥.
由De Morgan定律 (见练习3.3.8),
M⊥∩N⊥=(M+N)⊥,即
N(AA+)=N(P+Q)=M⊥∩N⊥=(M+N)⊥。由正交补的性质可得,
R(AA+)=R(P+Q)=M+N.
(AA+)2=(AA+)T=AA+,所以
AA+是正交投影矩阵。
2.解:
设
P+Q=A,由于
A是对称矩阵,由广义逆性质和前面讨论可知
AA+和
A+A有相同的零空间和列空间。即
R(A+A)=R(P+Q)=M+N,N(AA+)=N(P+Q)=(M+N)⊥.
(A+A)2=(A+A)T=A+A,所以
AA+是正交投影矩阵,且
A+A=AA+.
3.证明:
由前面讨论可知,
AA+=A+A是
M+N上的正交投影矩阵,而
R(Q)⊆M+N,所以
AA+Q=Q,等号两侧取转置立得
QA+A=Q.
4.证明:
由第(3)小问结论
Q=Q(P+Q)+(P+Q)=Q(P+Q)+P+Q(P+Q)+Q
Q=(P+Q)(P+Q)+Q=P(P+Q)+Q+Q(P+Q)+Q
于是
Q(P+Q)+P=P(P+Q)+Q⟹H=2P(P+Q)+Q=2Q(P+Q)+P.
5.证明:
HP=2Q(P+Q)+P2=2Q(P+Q)+P=H.
HQ=2P(P+Q)+Q2=2P(P+Q)+Q=H.
由De Morgan定律 (见练习3.3.8),
(M∩N)⊥=M⊥+N⊥。设
P(M∩N)⊥表示
(M∩N)⊥上的正交投影矩阵,
PM⊥,PN⊥分别表示
M⊥,N⊥上的正交投影矩阵,则
T=PM∩N=I−P(M∩N)⊥=I−PM⊥+N⊥
设
B=PM⊥+PN⊥=I−P+I−Q=2I−P−Q。由第(2)问结论可得
PM⊥+N⊥=BB+,即
BB+是
R(B)=M⊥+N⊥上的正交投影矩阵。因此
HT=H(I−PM⊥+N⊥)=H(I−BB+)=H−HBB+=H−H(2I−P−Q)B+=H−(2H−H−H)B+=H
6.证明:
考虑矩阵
HT−T的零空间。设
x∈Rn,分两种情况讨论:
(a)若
x∈(M∩N)⊥,
(HT−T)x=HTx−Tx=0−0=0。所以
(M∩N)⊥⊆N(HT−T)。
(b)若
x∈(M∩N),
则
(HT−T)x=Hx−x=P(P+Q)+Qx+Q(P+Q)+Px−x=P(P+Q)+x+Q(P+Q)+x−x=(P+Q)(P+Q)+x−x=AA+x−x
注意到
AA+是
M+N上的正交投影矩阵,而
x∈(M∩N)⊆(M+N),于是
AA+x−x=x−x=0。即
(M∩N)⊆N(HT−T)。
这表明
N(HT−T)=Rn⟺HT−T=O⟺HT=T.