第5章 特征值的估计与广义逆矩阵
矩阵论简明教程第二版(张凯院著)课后答案下载

矩阵论简明教程第二版(张凯院著)课后答案下载《矩阵论简明教程》是xx年科学出版社出版的图书。
以下是要与大家分享的矩阵论简明教程第二版(张凯院著),供大家参考!点击此处下载???矩阵论简明教程第二版(张凯院著)课后答案???矩阵的相似变换,范数理论,矩阵分析,矩阵分解,特征值的估计与表示,广义逆矩阵,矩阵的直积以及线性空间与线性变换。
各章均配有习题,书末有习题解答与提示。
与传统矩阵论教材不同的是,《矩阵论简明教程》不是从较抽象的线性空间与线性变换开始,而是以较具体的矩阵相似变换理论作为基础来介绍矩阵理论的主要内容,以达到由浅入深的目的,并使读者在较短时间内掌握近现代矩阵理论相当广泛而又很基本的内容。
学习过工科线性代数课程的读者均可阅读《矩阵论简明教程》。
[1]第一章矩阵的相似变换1.1特征值与特征向量1.2相似对角化1.3Jordan标准形介绍1.4IHamilton-CayIey定理1.5向量的内积1.6酉相似下的标准形习题1第2章范数理论2.1向量范数2.2矩阵范数2.2.1方阵的范数2.2.2与向量范数的相容性2.2.3从属范数2.2.4长方阵的范数2.3范数应用举例2.3.1矩阵的谱半径2.3.2矩阵的条件数习题2第3章矩阵第4章矩阵分解第5章特征值的估计与表示第6章广义逆矩阵第7章矩阵的直积第8章线性空间与线性变换习题解答与提示参考文献1.实分析与复分析WalterRudin著课后习题答案机械工业出版社2.计算机专业英语教程第4版金志权课后习题答案电子工业出版社3.矩阵论简明教程第二版徐仲张凯院著课后答案科学出版社。
矩阵特征值的估计

解
A
m∞
= n max aij = 3 × 2 = 6,
1≤i , j ≤ n
1 A + AH 2 1 A − AH 2
m∞
m∞
1 0 m = 0, = ∞ 2 1 1 H = A− A = 2A m∞ 2 2
m∞
6, =
由定理2知, λ ≤ 6,Re λ = 0,Im λ ≤ 6.
由此可知,A的特征值为0或纯虚数.
= i 1= j 1
证
∑∑ a η η
ij i
n
n
j
≤ ∑∑ aij ηi η j
= i 1= j 1
n
n
≤ max aij
1≤i , j ≤ n
= i 1= j 1
∑∑ η
n
n
i
ηj
n n 1 2 ≤ max aij ∑∑ ηi + η j 2 1≤i , j ≤ n = i 1= j 1
(
2
)
G′j = z ∈ C z − a jj ≤ R′j 为A的第j个列盖尔圆.
{
} ( j =1, 2, , n )
0.02 0.11 1 0.14 如A = 0.01 i 0.02 0.01 0.5 的三个盖尔圆为: G1 = G2 G3
i
R2 = 0.15
于是 AF =
n 2 = i 1 2
R F tr ( R H R ) =
2 1≤i < j ≤ n = i 1
= ∑ λi +
∑
rij ≥ ∑ λi .
2 2
n
§5.2 矩阵特征值的分布区域
一、圆盘定理 1. Gerschgorin圆(盖尔圆) 定义1
广义逆矩阵

广义逆矩阵矩阵是数学中的一种重要的概念,矩阵的逆矩阵也是非常重要的概念。
它们是数学中通常用来解决一些复杂问题的有效工具,而广义逆矩阵(Generalized Inverse Matrix)则是在这一领域中一种更加复杂的概念。
在本文中,我将对广义逆矩阵的定义,性质,求解方法等内容进行详细的介绍。
一、定义广义逆矩阵是在数学的线性代数中使用的一种概念,它是一种用于求解矩阵的新概念,它是一种非可逆矩阵。
首先,它是一种可以逆矩阵,但不能逆矩阵,它不能通过乘法求解,而是通过复合函数求解。
在定义广义逆矩阵之前,我们必须先定义矩阵和普通逆矩阵,因为广义逆矩阵是基于矩阵和普通逆矩阵所定义的。
矩阵是数学中的一种重要的概念,它是一种用数字表示空间或者抽象概念的表示方法,矩阵的相反数是普通逆矩阵,它具有与矩阵相反的定义,可以把矩阵的表达式变换为普通逆矩阵的形式。
而定义广义逆矩阵的免则如下:如果A是矩阵,那么A的广义逆矩阵记为A1,是满足以下条件的非可逆矩阵:AA1A=A。
二、性质研究广义逆矩阵的性质是必不可少的,因为它在数学上具有很多重要的性质。
(1)具有不可逆性:只有当矩阵A是可逆的时候,才能确定其广义逆矩阵;(2)具有自反性:设A为矩阵,则A1是A的广义逆矩阵,而A1的广义逆矩阵却是A本身;(3)具有可转性:设A和B分别为两个矩阵,则AB的广义逆矩阵等于B的广义逆矩阵乘以A的广义逆矩阵。
(4)具有保持秩性:设A为矩阵,则A的广义逆矩阵A1具有与A相同的秩。
三、求解方法由于广义逆矩阵是一种特殊的矩阵,其解决方案也是复杂的,因此,在求解广义逆矩阵时,我们可以使用一些特殊的方法。
(1)谱分解法:谱分解法是求解广义逆矩阵的一种有效的方法,它是把矩阵A分解成三个矩阵的乘积,即A=UDUT,其中U和D的元素分别为A的奇异值和奇异值的平方根。
由于A的特征值是不变的,而特征向量是可变的,因此矩阵D的逆矩阵可以由特征向量得到,并且可以得到A1=UD1UT。
矩阵分析lecture7特征值与广义逆

第七讲 特征值的估计与广义逆矩阵一、特征值界的估计设为一给定的复数矩阵,则A 可以表示成一个厄米特矩阵与一个反厄米特矩阵的和,即 ()ij n n A a ×= A B C =+ ()()22H jiij ij n n ij a a A A B b b ×++===()()22H jiij ij n nij a a A A C c c ×−−===设A,B,C 的特征值的集合为:121212{,,,},{,,,},{,,,}n n i i i n λλλμμμννν这里每个,j j μν均为实数.并假设:121212||||||,,n n n λλλμμμνν≥≥≥≥≥≥≥≥≥ ν1 定理:若n 阶矩阵()ij n n A a ×=的特征值的集合为12{,,,}n λλλ ,则有不等式22111||||n n nii i i j aλ===≤∑∑∑j等号成立当且仅当A 为正规矩阵时成立。
证明:由Schur 定理,存在酉矩阵U 及上三角矩阵T ,使得 H U AU T =因此,H H H U A U T =从而,H H H U AA U TT = tr()tr()tr()H H H H AA U AA U TT == (1)由于矩阵T 的对角线上的元素全为A 之特征值,所以,(2)221111||||||n nn niiii i i j tλ=====≤∑∑∑∑2ij t 2a j 而(2)式的右端为矩阵Tde Frobenius 范数的平方,由于A 与T 是酉相似,而酉相似保持F 范数不变,故(3)21111||||n nn nijij i j i j t=====∑∑∑∑综合(2),(3)便得所需证之不灯式。
又不等式(2)取等号当且仅当。
即A 酉相似于对角形矩阵,也就是A 为正规矩阵。
得证。
0()ij t i =≠注:该定理的一个直接推论为: ||,1,,i F A i n λ≤=推论1:若,,A B C 如前所述,则有 (1) 1,||max |i i i j nn a |j λ≤≤≤⋅;(2) 1,|Re()|max ||i i i j nn b j λ≤≤≤⋅(3) 1,|Im()|max ||i i i j nn c j λ≤≤≤⋅证明:由定理(1)之证明,知, H U AU T =H H H U A U T =得1()(22H )HHH A A U BU U U T T +==+ 1()(22H )HHH A A U CU U U T T −==−注意到T 为上三角阵,T 之主对角上元素为A 的特征值,又在酉相似下矩阵的F 范数保持不变,所以, 22221,11,||||||max |2nii ij ij ij i j ni i ji j nt b n λλ≤≤=≠≤≤++=≤∑∑∑i 2|b22221,11,||||||max |2nii ij ij ij i j ni i ji j nt c n λλ≤≤=≠≤≤−+=≤∑∑∑i 2|c于是, 221,11|Re()|||max ||2n nii ii i j ni i n b λλλ≤≤==+=≤∑∑i 2j221,11|Im()|||max ||2nnii i i i j ni i n c λλλ≤≤==−=≤∑∑i 2j n 2j 2j 2ij |j当然对任一,都有 {1,2,,}i ∈221,|Re()|max ||i i i j nn b λ≤≤≤i221,|Im()|max ||i i i j nn c λ≤≤≤i 由此得(2),(3),再由Th1,2221,111||||max ||n n niiji j ni i j an a λ≤≤===≤≤∑∑∑i 所以,1,||max |i i i j nn a λ≤≤≤i即(1)式成立。
矩阵论-第五章-广义逆及最小二乘

第五章 广义逆及最小二乘解在应用上见得最频繁的、大约莫过于线性方程组了。
作一番调查或整理一批实验数据,常常归结为一个线性方程组:Ax b =然而是否是相容方程呢?倘若不是,又如何处理呢?最小二乘解是常见的一种处理方法。
其实它不过是最小二乘法的代数形式而已。
广义逆从1935年Moore 提出以后,未得响应。
据说: (S.L.Campbell & C.D.Meyer.Jr Generalized Inverses of Linear Transformations 1979 P9)原因之一,可能是他给出的定义,有点晦涩。
其后,1955年Penrose 给出了现在大都采用的定义以后,对广义逆的研究起了影响,三十年来,广义逆无论在理论还是应用上都有了巨大发展,一直成为了线性代数中不可缺少的内容之一。
为了讨论的顺利进行,我们在第一节中先给出点准备,作出矩阵的奇值分解。
§5.1 矩阵的酉交分解、满秩分解和奇值分解在线行空间中,知道一个线性变换在不同基偶下的矩阵表示是相抵的或等价的。
用矩阵的语言来说,就是:若 ,m n A B C ×∈,倘有非异矩阵()P m n ×,()Q n n ×存在,使B PAQ =则称A 与B 相抵的或等价的。
利用初等变换容易证明m n A C ×∈,秩为r ,则必有P ,Q ,使000r m nI PAQ C ×⎛⎞=∈⎜⎟⎝⎠(5.1-1) 其中r I 是r 阶单位阵。
在酉空间中,上面的说法,当然也成立,如果加上P ,Q 是酉交阵的要求,情形又如何呢?下面就来讨论这个问题。
定理 5.1.1 (酉交分解) m n A C ×∈,且秩为r ,则(),(),,H H m n U m n V n n U U I V V I ∃××==,使00r HU AV Δ⎛⎞=×⎜⎟⎝⎠(m n) (5.1-2) 其中r Δ为r 阶非异下三角阵。
第五章 特征值估计及对称矩阵的极性-1

三,广义特征值分解算法
3. GEVD的总体最小二乘算法: 步一,对阵A进行SVD: A=U∑VH≈U1∑1V1H , 其中∑1是的主奇异值阵; 步 二 , 把 A-λB 左 乘 U1H 并 右 乘 V1 , 得 ∑ 1λU1HBV1 , 从 而 转 化 成 新 的 矩 阵 束 (∑1 , λU1HBV1)的GEVD问题. 该方法适合于有噪情况下的主特征对的计算. 参见张贤达的《矩阵分析与应用》的第8 参见张贤达的《矩阵分析与应用》的第8.8节.
§5.2 广义特征值问题
定义 称Ax=λBx的特征值问题为矩阵 相 定义: 矩阵A相 矩阵 对于矩阵B的广义特征值问题 的广义特征值问题,称数λ为矩 对于矩阵 的广义特征值问题 矩 相对于矩阵B的特征值 阵A相对于矩阵 的特征值 相对于矩阵 的特征值;而与λ相对应 的非零解x称之为属于λ的特征向量 属于 的特征向量. 广义特征值由det(A-λB)=0的根给出. 一,广义特征值问题的等价形式 1. 等价形式1:B可逆时B-1Ax=λx,等价地化 为非对称阵B-1A的普通特征值问题. 2. 等价形式2:B正定时B =GGT使得Sy=λy, 其中y=GTx, 对称阵S=G-1AG-T.等价地转 化为对称矩阵S的普通特征值问题
二,特征值的包含区域
1. 定义 设A=(aij)∈Cn×n,称区域Gi:|z-aii|≤Ri 为矩阵 A 的第 i 个盖尔圆 第 个盖尔圆,其中 Ri=∑j≠i|aij| 称为盖尔圆Gi的半径(i=l,…,n) . 盖尔圆 2. 定理 矩阵 A=(aij)∈Cn×n 的一切特征值都 在它的n个盖尔圆的并集之内. 3.定理 由矩阵A的所有盖尔圆组成的连通 定理 部分中任取一个,如果它是由k个盖尔圆 构成的,则在这个连通部分中有且仅有A 的k个特征值(盖尔圆相重时重复计数.特 征但相同时也重复计数)..
第五章 特征值的估计与表示

* 图论法 aij 0 Pi到Pj画箭头,a ji 0 Pj 到Pi画箭头, 若强连通则 不可约,否则可约.
4 1 1 0 1 0 2 1 4 0 (不可约), C 2 1 2(可约) B . 1 0 4 1 1 0 3 0 1 1 4
T
例
考察矩阵(不可约)
b1 c1 4 1 1 0 a b c2 2 1 4 2 0 1 , , B A 1 0 4 1 an 1 bn 1 cn 1 0 1 1 4 an bn (ai , bi , ci都不为零),
解:A的盖尔圆分别为|z-10|≤8和|z|≤5,这两个
盖尔圆为连通的,因此包含两个特征值。其特征值为 都在盖尔圆 |z-10|≤8 中,而不在盖尔圆|z|≤5内。
1,2 5 i 15)
特征值的隔离
1 a11 a12 2 a21 a22 1 DAD n an1 an 2 a11 a12 1 a1n 1 2 n 2 a21 a22 a2 n 2 1 n a1n 11 1 a2 n 2 1 ann n
j 1 j i
n
(2)按行弱对角占优: | aii | | aij |, (i 1,2,, n) 上式至少有一个不等号严格成立。
j 1 j i
n
定义 设矩阵A R nn (n 2), 如果存在置换阵P使得
A11 A12 P AP , A11 , A 22为方阵, 0 A 22 ( PT AP ) PT x PT b 则称A为可约矩阵; 否则为不可约矩阵. A11 A12 y1 d1 定义 每行每列只有一个元素是1,其余 0 A y d 22 2 2 元素是零的方阵称为置换阵(或排列阵).
矩阵理论课件 第五章 特征值的估计与广义逆矩阵

0 2
1
0
0 1
1 0 0
1 2y
y
x1 2z1 z1
x2
2z2 z2
0 2
1 0
0
1
A
1
2
y
y
2( x2 2z2
2z2 )
x1 2z1 z1
x2 2z2
z2
A
A
1 2
y
y
2(1 2 y)
2y
( A A)H
1 2y
2(1
2
y)
y
2
y
2
2(1 2 y) y y
设 A (aij )nn Rnn(n阶实矩阵),则
Im i
n(n 1)
2
max
1i , jn
cij
例1 估计下面矩阵的特征值的界:
0 0.2 0.1 1 0
A
0.2
0
0.2
2 0.3i
解:
0.1 0.2 0 3 0.3i
B 1 ( A AT ) 0,C 1 ( A AT ) A
4个盖尔圆中只有 G4 是孤立的, G1,G2 ,G3 是连通
的,故结论成立。
定义1 (严格对角占优矩阵)
设 A (aij ),若C满n足n
n
aii aij , i 1, 2, n j 1 ji
则称 A 为(行)对角占优矩阵,若不等式严格成立, 则称 为A(行)严格对角占优矩阵;若 为A行T (严格)对角占优矩阵,则称 A列(严格)对角占
5
A
1 5
2( x2
2z2 )
x1 2z1
x2
2
z2
2 5 2z2
z1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章要讨论的另一个问题是广义逆矩阵方面的问题. 我 们知道,若方阵A的行列式不等于零,则存在唯一的方阵B, 满足AB=BA=E,并称B为A的逆矩阵,记为A-1. 当A不是方 阵,或方阵A的行列式等于零时,则上述的逆矩阵就不存在. Moore在1920年将逆矩阵的概念推广到任意矩阵上,他是用 正交投影算子来定义逆矩阵的,人们把他定义的广义逆矩
切特征值都在它的 n 个盖尔圆的并集之内,即 A 的任一特征值
满足
n
S Si . i 1
证明 设 为 A 的特征值,其对应的特征向量为 x (x 0) ,即 Ax x ,写成分量形式为
n
aij x j xi , ( i 1,2, , n )
j1
n
或
( aii )xi aij x j .( i 1,2, , n )
定理 5-2 表明对于矩阵 A 的任一特征值 ,总存在盖尔圆 Si , 使得 Si .
1 0.2 0.1 0.3
例 5-2
估计矩阵
A
0.1 0.3 0.2
0 0.2 0.3
0.3 3 0.1
0.4 0.5 2i
的特征值的分布范围.
解 A 的四个盖尔圆为
S1 : | z 1| 0.6 , S2 : | z | 0.8 ,
i 1
i, j1
故| 2 | 5 .同理可得 | 3 | 5 .
事实上,由| E A | ( 1)( 2)( i) 知 A 的其它两个特
征值为 1, i .
推论 1 设 A, B,C 如前所设,则有
(1)
|
k
|
n max | i, j
aij
|,
(2)
|
Re k
|
n max i, j
|
bij
|
其中T 为上三角矩阵,T 的对角线元素 tii (i 1,2, n) 为 A 的特征值,
以及 B,C 的定义,可得
于是有
U H BU U H A AH U T T H ,
2
2
U H CU U H A AH U T T H ,
2
2
| Re k
|2
n
| Re i
i 1
|2
n
|
,
(3)
|
Imk
|
n max i, j
|
cij
|
.
证明 (1) 由定理 5-1 得
n
n
| k
|2
| i
i 1
|2
| aij
i, j 1
|2
n2 max i, j
| aij
|2 ,
即得
|
k
|
nmax | i, j
aij
|.
(2) (3) 由舒尔定理,存在酉矩阵U 使得
U H AU T , U H AHU T H ,
|
cij
|
0.3464
.
故所给矩阵 A (实反对称矩阵)的特征值的模不超过 0.3464,由此知
道用推论 2 得到的估计值要比推论 1 得到的更好些.
0.2 0.1 实际上,由| E A | 0.2 0.2 3 0.09 ,得到
0.1 0..2
矩阵 A 的特征值为 1 0 , 2 0.3i , 3 0.3i .
i1
i
i
2
|2
n
|
i1
tii
t ii 2
|2
,
| Imk
|2
n
| Im i
i 1
|2
n
|
i1
i
i
2
|2
n
|
i1
tii
t ii 2
|2 .
由于在酉相似下矩阵的 F 范数不变,所以
n | tii t ii |2
i1
2
n | tij |2 2 i, j1
T TH 2
2
F
B
2 F
n2
|
Re k
|
n max i, j
|
bij
|
,
证毕.
|
Imk
|
nmax | i, j
cij
|
.
推论 2 设 A 为 n 阶实矩阵,则 A 的任一特征值 k (k 1,2, , n) 的虚 部 Im k 满足 (这里 cij (aij a ji ) / 2 为前面所设)
| Im k |
n(n 1) 2
0,
C A AH A .则由推论 1 得 2
|
k
|
3
max i, j
|
aij
|
0.6
,
|
Re k
|
3
max i, j
|
bij
|
0
,
|
Imk
|
3
max i, j
|
cij
|
0.6 .
所以, Re k 0 ,| Im k | 0.6 .
若用推论 2 可得
| Im k |
3
(3 2
1)
max i, j
例 已知矩阵
3 i 2 3i 2i A 1 0 0
0
1 0
的一个特征值为 2,估计其它两个特征值的上界.
解 记 1 2 , A 的其它两个特征值为 2 ,3 ,由定理 5-1 得
3
3
| 2 |2 | i |2 | 1 |2 | aij |2 | 1 |2 29 4 25,
k
G(t) {z | | z aii | tRi (A), z C} , i1
n
G(t) {z | | z aii | tRi (A), z C}. ik 1
则有
G(t) G(1) G , G(t) G(1) G . (0 t 1) 因而对一切 t [0,1] , G(t) 与 G(t) 不相交.特别地, G(0) 恰含 有 A(0) D 的 k 个特征值 a11, a22 , , akk .
矩阵特征值的计算与估计在理论上和实际应用中 都是重要的,但要精确计算特征值并非总是可能的, 即使在某些特殊情况下有可能,可是付出的代价也是 很大的.好在许多应用中并不需要精确计算矩阵的特 征值,而只需要有一个粗略的估计就够了. 例如,在线 性系统理论中,通过估计系统矩阵A的特征值是否有负 实部,便可判定系统的稳定性;当研究一个迭代法的 收敛性时便要判断迭代矩阵的特征值是否都落在单位 圆内;在差分方法的稳定性理论以及自控理论中都需 要估计矩阵的特征值是否在复数平面上的某一确定的 区域中.
tr( AAH ) tr(U H AAHU ) tr(TT H ) , (5-1)
由于T 的对角线元素 tii (i 1,2, , n) 为 A 的特征值,得
n
n
n
| i |2
| tii |2
| tii |2
| tij
|2
T
2.
F
i 1
i 1
i 1
i j
(5-2)
由于在酉相似下矩阵的 F 范数不变,即
5.1 特征值的界的估计
下面给出一些利用矩阵元素直接估计矩阵特征值上下界的方法,
为便于表达,对于 A (aij ) C nn ,记矩阵
B (bij )
A AH 2
, bij
aij
a ji 2
C
(cij )
A AH 2
, cij
aij
a ji 2
则 B 为 Hermite矩阵, C 为反 Hermite矩阵,且 A B C .
圆盘定理 1 只说明矩阵的特征值均在其全部盖尔圆的并集内,并没有明
确指出哪个盖尔圆中有多少个特征值,圆盘定理 2 能更准确地说明特征值的
分布情况.
定理 5-3 (圆盘定理 2) 设矩阵 A 的 n 个盖尔圆中有 k 个互相 连通且与其余 n k 个不相交,则这个连通区域中恰有 A 的 k 个 特征值(当 A 的主对角线上有相同元素时,则按重复次数计算,有
S3 : | z 3 | 1,
S4 : | z 2i | 0.6 .
所以 A 的特征值都落在这四个盖尔圆的并集内.
在例 5-2 中,圆盘 S1 与 S 2 相交,S1 S2 构成一个连通区域,而 S 3 与 S 4
是孤立的.
一般地,由矩阵的 k 个相交的盖尔圆的并集构成的连通区域称为一个连
通部分,并说它是由 k 个盖尔圆组成.一个孤立的盖尔圆组成一个连通部分.
j 1
ji
设 xt 为 x 的各分量中模最大的一个,则 xt 0 ,在上式中当 i t 时
有
n
( att )xt atj x j , j 1 jt
式的两边除以 xt 并取模得
| att |
n
|
j 1
atj
|
xj xt
n
| atj | Rt ,
j 1
jt
jt
n
所以 S t ,即 S Si .证毕. i 1
max i, j
|
cij
|
.
证明 因为 A 为 n 阶实矩阵,所以 cii 0 (i 1,2, , n) .且 k 为实数
时,则 Im k 0 ,结论显然成立. 当 k 不为实数时,由定理 5-1 的证明有
n
n
n
| Im i
i 1
|2
| cij
i, j 1
|2
| cij
i, j1
|2
max i, j
| bij
|2 ,
i j
n | tii t ii
i1 2
|2
n | tij |2 2 i, j1