特征值与特征向量计算第六章
6.1.1 特征值和特征向量的概念

6.1.1 特征值和特征向量的概念
小结 (1) 特征值、特征向量、特征子空间、特征多 项式的概念 (2) 计算特征值和特征向量的方法
即是对应于特征值 λ0 的全部特征向量,
其中ci为F上不全为零的常数.
6.1.1 特征值和特征向量的概念
−2
例1
设
A
=
0
−4
1 1
2
0
,
求A的特征值与特征向量.
1 3
λ 2 1 1
解 det( λE A) 0 λ 2 0
4 1 λ 3
( λ+1)λ 22 ,
从而 A的特征值为 λ1 1, λ2 λ3 2.
6.1.1 特征值和特征向量的概念
对于特征值λ1= − 1, 解线性方程组(− E − A)X =0,
即求解
1
0
−1 −3
−1 0
x1 x2
0 = 0
4 −1 −4 x3 0
得到一个基础解系 X1=(1, 0,1)T .
所以属于λ1 1的全部特征向量为
c1 X1 , 其中c1为F中非零常数.
得到一个基础解系X1 =(1, i)T .
所以属于λ1 2i 的全部特征向量为
c1 X1 , 其中c1为非零复数.
6.1.1 特征值和特征向量的概念
对于特征值λ2 = − 2i, 解线性方程组(−2iE − A)X = 0,
得到一个基础解系 X2 =(1,i)T . 所以属于λ2 = 2i 的全部特征向量为 c2 X2 (其中c2是非零复数).
6.1.1 特征值和特征向量的概念
定义 设 λ0是 A 的一个特征值, 则 Vλ0 = { X ∈ F n | AX = λ0 X }
特征值与特征向量计算第六章

其对应的特征向量为
因为 A xk = k xk
x1 x2 , x3 ,
, xn
所以 A-1 xk = k-1 xk
故k-1就是矩阵A-1的特征值,它们满足
n
1
n1
1
1
1
对应的特征向量仍为 x k 。因此,求矩阵 A 的按模最小特征 值,就相当于求其逆阵A-1的按模最大特征值n-1 ,这只需应用 幂法即可求得。
i
, n , B
1
的特征向量与矩阵
A
相 同 。 为 了 加 速 求 得 , 应 使 1 q 模 最 大 , 且 。
q
2 q 2 1 q 1
易求得,
2 n
2
是一个很好的选择.可以验证,
2 q
1
此时 B 的模最大的特征根仍为 1 q , 且模第二大的特 征根为 2 q 或 n q , 由于 q q 2
i [1 1 i ( ) i ] 1 i 2 n i k k max{ 1 [1 1 i ( ) i ]} 1 i 2
k 1 n
i k ) i 1 i 2 n i k m ax [ 1 1 i ( ) i ] 1 i 2 1 1 i (
1 1 2
n q
2 n
n
2 1
, 因而,
过程可以加速。
这个办法也可用来求按模最小的特征值及相应 特征向量,只需令
1 n1 q 2
即可。
上述加速办法也称为移位法 .由于特征值分布 范围预先可由定理 6.1 先限定一个范围,但此范围 往往太大,实际使用时一般是通过多次实验找到合 适的 q 值使迭代过程有明显加速为止。
厦大《高代》讲义第6章+特征值

3. 对每个特征值0, 求齐次线性方程组 (0In A)X 0
的基础解系, Xs. 则k1 X1 +
k即2X20+的…特+征k子sX空s,即间是V对0的应基于, 特X1征, X值2, …λ0 ,
的全部特征向量, 其中ki为K上不全为零的数.
厦门大学数学科学学院 网址:
• 掌握复数域上的矩阵可以相似于上三角矩 阵并应用于讨论问题;
• 掌握判断和计算特征值和特征向量的方法; • 注意矩阵与线性变换的对应结论; • 注意特征值的概念与数域有关.
厦门大学数学科学学院 网址:
IP: http://59.77.1.116
特征值和特征向量_1
厦门大学数学科学学院 网址:
IP: http://59.77.1.116
例子
例5:设A Knn , g( x) K[x],
(1) 若 是A的特征值, 则 g( )是 g( A)的特征值.
(2) 若1, 2 , ..., n是A的全部特征值, 则g(1 ),
厦门大学数学科学学院 网址:
IP: http://59.77.1.116
特征值和特征向量_2
定义: 设λ是 的一个特征值, 则 V { V | ( ) }
是V的子空间, 且是称为 子空间, 称为 的
属于特征值λ的 特征子空间.
注: 设α是 的关于λ的特征向量, β是 的关于
IP: http://59.77.1.116
例子
1
例2:
求
a
b
的特征值与特征向量,
其中
d
a d,b 0,a 1,d 1.
3 1 1
例3:
求
2
2
1的特征值与特征向量.
6.第六章特征值和特征向量应用例子

第六章 特征值和特征向量应用例子方阵的特征值和特征向量是两个应用十分广泛的概念,利用特征值和特征向量可以把变换AX X →表示成简单而易于想象的形式,利用特征值和特征向量可以求解工程技术中控制论的系统稳定问题、空间曲面和空间曲线的化简问题、微分方程组及差分方程组的求解等问题. 事实上,特征值和特征向量的应用是十分广泛的,远不止这些. 本章主要介绍特征值和特征向量在动力系统、人口流动、污染、遗传及微分方程组求解等方面的应用.例1 动力系统发展趋势设0.950.030.050.97A ⎡⎤=⎢⎥⎣⎦,分析由100.6(0,1,2,),0.4k k k +⎡⎤===⎢⎥⎣⎦ x Ax x 所确定的动力系统的长期发展趋势.解 第1步求A 的特征值,并找出每个特征空间的基. A 的特征方程是0.950.030(0.95)(0.97)(0.03)(0.05)0.050.97λλλλ-==----2 1.920.92λλ=-+由二次方程的求根公式得11λ=,20.92λ=.容易验证对应11λ=和20.92λ=的特征向量分别是135⎡⎤=⎢⎥⎣⎦v 和211⎡⎤=⎢⎥-⎣⎦v 的非零倍数.下一步把给定的0x 表示为1v 和2v 的线性组合,显然12{,}v v 是2R 的基,因此存在系数1c 和2c ,使得101122122[]c c c c ⎡⎤=+=⎢⎥⎣⎦x v v v v (1)事实上1111202310.60[]510.40c c --⎡⎤⎡⎤⎡⎤==⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦v v x 110.600.1251530.400.2258--⎡⎤⎡⎤⎡⎤==⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦(2) 因为,式(1)的1v 和2v 是A 的特征向量,故1122,(0.92)A A ==v v v v ,容易算出每个k x :101122A c A c A ==+x x v v 1122(0.92)c c =+v v 211122(0.92)A c A c A ==+x x v v 21122(0.92)c c =+v v 继续下去,有1122(0.92)(0,1,2,)k k c c k =+= x v v把式(2)的1c 和2c 代入上式,得310.1250.225(0.92)(0,1,2,)51kk k ⎡⎤⎡⎤=+=⎢⎥⎢⎥-⎣⎦⎣⎦x当k →∞时,10.375(0.92)0,0.125.0.625kk ⎡⎤→→=⎢⎥⎣⎦x v例2 幂方法求矩阵的特征值和特征向量求方阵A 的特征向量要先解一元n 次方程||0λ-=I A 以求出特征根. 解一元n 次方程一般是很困难的,这就给求特征向量带来困难.幂方法求矩阵的特征向量的方法:从任何一个非零向量0X 出发(例如取0(1,,1))'= X ,不断地用A 左乘,得到0(1,2,)n n n == X A X ,并且用与n X 方向相同的某个n Y 代替(例如,将n X 除以它的各分量绝对值之和得到n Y ,则n Y 的各分量绝对值之和为1.)当n 无限增大时,如果nY 趋于一个极限位置 Y,则 Y 就是A 的特征向量(所属特征值通常是A 的所有特征值中绝对值最大的.)例如:10.50.40.3210.70.6,2.5 1.42 1.30.30.40.51⎛⎫ ⎪⎪= ⎪ ⎪ ⎪⎝⎭A 从0(1,1,1,1)'=X 开始,将10=X AX 除以各分量之和得到121,=Y X AY 除以各分量之和得到2Y . 一般地,如果已经得到k Y ,将k AY 除以各分量之和得到1k +Y . 这样就得到一系列的列向量1,,,n Y Y ,直到某个1||m m +-Y Y 小到可以忽略不计的程度,可以近似地认为1m m +=Y Y ,m m λ=AY Y ,则m Y 是特征向量,所属的特征值λ等于m AY 各分量之和. 这个过程很容易用计算机实现. 具体计算出各k Y 如下(为节省篇幅写成行向量形式):(0.138365,0.27044,0.45283,0.138365),(0.131698,0.251377,0.480387,0.136538),(0.130463,0.248149,0.483933,0.137455),(0.130229,0.247579,0.484386,0.137806), (0.130184,0.247475,0.484443,0.137899),(0.130175,0.247456,0.484449,0.13792),(0.130173,0.247452,0.48445,0.137924),(0.130173,0.247451,0.48445,0.137925), (0.130173,0.247451,0.48445,0.137926),(0.130173,0.247451,0.48445,0.137926), 其中9Y 与10Y 已经看不出差别,可以认为是特征向量. 99λ=AY Y ,其中3.75697λ=是9AY 的各分量和,就是9Y 所属于的特征值.这个方法求出的是绝对值最大的特征值的特征向量.在科学计算中,这个方法叫做幂方法. 什么样的方阵可以用这个方法来求特征向量,是值得探讨的理论问题. 不过,只要计算机做出来的结果收敛,n Y 与1n +Y 的差别趋于零,就求出了一个特征向量.例3 人口流动模型假设一个大城市的总人口是固定的,人口的分布因居民在市区和郊区之间迁徒而变化,每年有6%的市区居民搬到效区去住,而有2%的效区居民搬到市区居住,假如开始时有30%的居民住在市区,70%的居民住在效区,问10年后市区和效区的居民人口比例是多少?50年后又如何?这个问题可以用矩阵乘法来描述,把人口变量用市区和效区两个分量表示,即k k c k s x x ⎛⎫= ⎪⎝⎭x ,其中k c x 为市区人口所占比例,k s x 为效区人口所占比例,k 表示年份的次序,0k =时的初始状态的人口变量为0000.3.0.7c s x x ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭x一年后,市区人口为100(10.06)0.02c c s x x x =-+,效区人口1000.06(10.02)s c s x x x =+-,用矩阵表示为11100.940.020.30.2960.0.060.980.70.7040c s x x ⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭x Ax 从初始时间到k 年,此关系保持不变,因此上述算式可扩展为2120.k k k k --==== x Ax A x A x 可算出11030500.29600.27170.25410.2508,,,.0.70400.72830.74590.7492⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭x x x x事实上,无限增加时间k ,市区和效区人口之比将趋向于一组常数0.25/0.75. 为了弄清为什么这个过程趋于一个稳态值,用MA TLAB 程序先求出A 特征值12=0.9200=1.0000λλ,,特征向量分别为10.70710.7071ξ-⎡⎤=⎢⎥⎣⎦和20.31620.9487ξ-⎡⎤=⎢⎥-⎣⎦. 令1211,13-⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭u u ,它们分别与两个特征向量12,ξξ成比例并构成整数,由于110.940.0210.920.920.060.9810.92--⎛⎫⎛⎫⎛⎫===⎪⎪ ⎪⎝⎭⎝⎭⎝⎭Au u , 220.940.02110.060.9833⎛⎫⎛⎫⎛⎫===⎪⎪ ⎪⎝⎭⎝⎭⎝⎭Au u ,由于1u 和2u 是属于不同特征值的特征向量,所以它们线性无关,因此是二维向量空间的基.初始向量0x 可以写成基向量1u 和2u 的线性组合0210.3110.250.050.250.05.0.731-⎛⎫⎛⎫⎛⎫==-=- ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭x u u因此0210.250.05(0.92).k k k ==-x A x u u式中的第二项会随着k 的增大趋于零,如果只取小数点后两位,则只要27k >,这第二项就可以忽略不计而得到27020.25|0.25.0.75k k k >⎛⎫=== ⎪⎝⎭x A x u。
线性代数第六章 矩阵的相似变换

第六章 矩阵的相似变换本章主要讨论方阵的特征值和特征向量、方阵的相似变换和对角化等问题.第一节 方阵的特征值和特征向量一、特征值与特征向量定义1 设A 是n 阶方阵,如果存在数λ和n 维非零向量X 使关系式λ=AX X (6.1)成立,则称数λ为方阵A 的特征值;非零列向量X 称为A 对应于特征值λ的特征向量.将式(6.1)改写成()λ−=A E X 0, (6.2) 将(6.2)看成关于X 的齐次线性方程组,它有非零解当且仅当其系数行列式满足 0λ−=A E , (6.3)即1112121222120λλλ−−=−n nn n nn a a a a a a a a a , (6.4)这是以λ为未知数的一元n 次方程,称为A 的特征方程,其左端λ−A E 是λ的n 次多项式,记作()λf ,称为A 的特征多项式,特征方程的根就是A 的特征值.根据代数基本定理,在复数范围内,n 阶方阵A 有n 个特征值(重根按重数计算),记作12,,,λλλ n .求出特征值λi 后,将λi 代入齐次线性方程组(6.2)中,求解方程组()λ−=i A E X 0 (6.5) 的所有非零解向量,就是属于λi 的特征向量。
对不同的特征值逐个计算,可求得属于各特征值的全部特征向量.若非零向量X 是方阵A 的特征向量,则由(6.1)式可知,对任意实数0k ≠,有()()k k λ=A X X ,(6.6) 这表明k X 也是方阵A 的特征向量,因此属于同一特征值的特征向量有无穷多个;反之,不同特征值对应的特征向量必不相同,即一个特征向量只能属于一个特征值(证明留给读者作为练习).由齐次线性方程组解的性质容易证得如下定理.定理1 设λ是方阵A 的特征值,12,,,s p p p 是属于λ的特征向量,则12,,,s p p p 的任意非零线性组合仍是属于λ的特征向量.例1 求141130002−−=A 的特征值和特征向量. 解 A 的特征多项式2141()130(2)(1)002λλλλλλλ−−−=−=−=−−−f A E ,所以A 的特征值为12λ=,231λλ==. 对于12λ=,解齐次方程组(2)−=A E X 0.由3411012110011000000−−−=→−A E ,得基础解系 1111−=p ,所以111(0)≠k k p 是对应于12λ=的全部特征向量.对于231λλ==,解齐次方程组()−=A E X 0.由 241120120001001000−−−=→A E ,得基础解系 2210−=p ,所以222(0)≠k k p 是对应于231λλ==的全部特征向量. 例2 求204121103−−=A 的特征值和特征向量.解 A 的特征多项式2204()121(1)(2)13λλλλλλλ−−−=−=−=−+−−f A E ,所以A 的特征值为11λ=−,232λλ==. 对于11λ=−,解齐次方程组()+=A E X 0.由104104131011104000−−+=→−A E ,得基础解系 1411−=p ,所以111(0)≠k k p 是对应于11λ=−的全部特征向量.对于232λλ==,解齐次方程组(2)−=A E X 0.由 4041012101000101000−−−=→A E ,得基础解系 2010=p ,3101− = p ,所以2233+k k p p (2k ,3k 不同时为0)是对应于232λλ==的全部特征向量.二、特征值和特征向量的性质定理2* 设12,,,λλλ n 是n 阶方阵()=ij a A 的n 个特征值,则有(1)11n n i ii i i a λ==∑∑; (2)1ni i λ==∏A .其中1niii a=∑是A 的主对角元之和,称为方阵A 的迹,记作tr()A .证明 见附录六例3 设7414744y x −= −−A 的特征值为123λλ==,312λ=,求,x y 的值. 解 由定理2可得123123tr()7718331212108x x y λλλλλλ=++=++=+− A A 解之得4,1x y ==−.定理3 设λ是方阵A 的特征值,p 是A 的属于λ的任一特征向量,则有: (1)k R ∀∈,k λ是k A 的特征值,p 是k A 的属于k λ的特征向量;(2)对任意非负整数k ,k λ是k A 的特征值,p 是k A 的属于k λ的特征向量; (3)若()ϕA 是A 的m (m 为任意非负整数)次多项式,即01()m m a a a ϕ=+++A E A A ,则()ϕλ是()ϕA 的特征值,p 是()ϕA 的属于()ϕλ的特征向量;(4)若A 可逆,则0λ≠,且1λ是1−A 的特征值,p 是1−A 的属于1λ的特征向量;(5)若A 可逆,则λA是*A 的特征值,p 是*A 的属于λA的特征向量;(6)λ也是T A 的特征值.证明 (1)由λ=Ap p ,有k k λ=Ap p 成立。
高等结构振动学-第6章-结构振动特征值问题的矩阵摄动法

)
({u0(s)}T [K1]{u1(i)} (0i){u0(s)}T [M1]{u1(i)}
1(i){u0(s)}T [M 0 ]{u1(i)} 1(i){u0(s)}T [M1]{u0(i)})
(6-29)
当 i s 时, ci(2) 的确定如下:
n
以
{u
(i 0
)
}T
)}
所以,代入(6-8)式得:
{u1(i)}
n s 1
(i ) 0
1
( s ) 0
({u0(s)}T [K1]{u0(i)} (0i){u0(s)}T [M1]{u0(i)}){u0(s)}
si
1 2
({u0(i)}T
[M1]{u0(i)}){u0(i)}
故一阶摄动解为:
(6-22) (6-23)
)}
{u0(i
)
}T
[M1
]{u1(i)
}
{u1(i
)}T
[
M
1
]{u0(i
)})
(6-32)
故特征向量的二阶摄动解为:
{u2(i)}
n s 1
(i) 0
1
( s ) 0
({u0(s)}T [K1]{u1(i)}
si
(i 0
){u0( s
)}T
[
M
1]{u1(i
)}
{u (i) (s) 10
n
(i 0
)
[
M
0
]
c (1) s
{u 0( s
)
}
(i) 0
矩阵特征值与特征向量的计算方法
,
x2
,,
xn,
对A1应用幂法即可!
24
反幂法的迭代公式
设u0 v0 0(n 0)
迭代:vk A1uk1
k max(vk )
规范:uk vk / k
Avk uk1
k 1,2,
综合得到:
25
Th8’(反幂法)
(1)设A (aij ) Rnn有n个线性无关的特征向量;
(2)设A的特征值满足:| 1 | | n1 || n | 0
(1) P()为P( A)的特征值,即P( A)x P()x; (2) P()且x为P( A)的特征向量。 Th2 设A与B为相似矩阵,即B P1AP,则
(1) A与B有相同的特征值; (2) 若y是B的特征向量,则Py是A的特征向量。
3
Th3 (Gerschgorin圆盘定理)
(1)设A (aij )nn , 则A的每一个特征值必属于下述
(1) | 1 p || i p | (i 2,3,, n)
(2)
max
2 jn
|
j
p
|
|
2
|
| 1 p |
| 1 |
20
A (aij ) Rnn,其特征值是实数,如何选择 p ?
设1 2 n
则B A pI的主特征值为1 p或n p
为计算1、x1 要求p满足 | 1 p || n p | 且 max{| 2 p | , | n p |} min 即求极值问题 | 1 p | | 1 p |
(2)
lim
k
k
1
j
p
p
1
k
j
r | j p | 确定。
min i j
特征值与特征向量 计算
特征值与特征向量计算
特征值与特征向量是线性代数中重要的概念,它们在矩阵运算、物理学、工程学等领域都有广泛的应用。
特征值与特征向量的计算能够帮助我们理解线性系统的性质,从而更好地分析和解决问题。
特征值可以理解为矩阵在某个方向上的伸缩因子,而特征向量则表示在该方向上的运动方向。
可以将特征值与特征向量类比为一个人在不同方向上的运动,特征值相当于移动的速度,而特征向量则是移动的方向。
举个例子来说,假设有一个二维平面上的矩阵A,它可以表示一个变换。
如果我们找到了矩阵A的特征值和特征向量,那么就可以知道在哪个方向上变换的速度最快,以及在哪个方向上变换的方向是怎样的。
特征值与特征向量的计算方法有多种,最常见的是通过求解矩阵的特征方程来得到。
特征方程是一个关于特征值的方程,解方程可以得到特征值的值。
然后,将每个特征值代入到矩阵方程(A-λI)x=0中,可以求得对应的特征向量。
特征值与特征向量的计算不仅可以帮助我们理解线性系统的性质,还可以在实际问题中发挥重要作用。
比如,在物理学中,特征值与特征向量可以用来描述振动系统的固有频率和振动模态;在工程学中,特征值与特征向量可以用来分析结构的稳定性和响应特性。
特征值与特征向量的计算是一种重要的数学工具,它能够帮助我们理解线性系统的性质,并在实际问题中发挥重要作用。
通过计算特征值与特征向量,我们能够更好地分析和解决问题,为科学研究和工程实践提供有力支持。
第六章特征值
第六章 特征值我们接着第四章进行讨论. 我们已经知道,对于n 维线性空间V 的一个线性变换A 来说,如果V 可以分解为一些不变子空间的直和,则可以通过选择适当的基12,,,n εεε,使得A 在这组基下的矩阵为准对角阵. 当然,这种分解是越细越好. 即各不变子空间的维数是越小越好. 最为理想的是能将V 分解为n 个一维不变子空间的直和, 这样可通过选择适当的基,A 在这组基下的矩阵为对角阵:12n a a a ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭此时,线性变换A 的许多性质便能一目了然. 例如,若12,,,r a a a 均不为零,但1,,r n a a +全为零,则A 的秩为r ,12Im (,,,)r L =A εεε,而1Ker (,,)r n L +=A εε.但能否这样分解,完全取决于所给的线性变换. 本章将对此展开讨论.§6.1 特征值和特征向量1. 特征值与特征向量概念定义 6.1.1 设A 是数域P 上n 维线性空间V 的一个线性变换. 如果对于数域P 中一个数0λ,在V 中存在一个非零向量ξ,使得0()λ=A ξξ, (1.1) 则称0λ是线性变换A 的一个特征值,向量ξ称为A 的属于特征值0λ的特征向量.说明 从几何上来看,在经过线性变换后,特征向量的方向保持在同一条直线上,若00λ>,保持方向不变;若00λ<,保持方向相反;若00λ=,特征向量就变为了零向量.现在设A 在某组基下的矩阵是A ,向量ξ在这组基下可以表示为一个列向量α,此时(1.1)式等价于0λ=A αα.从而等价于0()n λ-=0E A α.定义6.1.2 设A 是数域P 上的n 阶方阵,如果存在0P λ∈及n 维非零列向量α,使得0λ=A αα,则称0λ是矩阵A 的一个特征值, α称为A 的属于特征值0λ的特征向量.关于特征值与特征向量,我们有下面三个命题:命题6.1.3 如果ξ是A 的属于特征值0λ的特征向量. 则对P 的任意数0k ≠,k ξ都是属于特征值0λ的特征向量.证明 由于0()λ=A ξξ,≠0ξ,所以对0k ≠有k ≠0ξ,且00()()()()k k k k λλ===A A ξξξξ.故k ξ是属于特征值0λ的特征向量. 证毕 命题6.1.4 一个特征向量只能属于一个特征值. 证明 设≠0ξ是A 的一个特征向量,且0()λ=A ξξ, 0()λ'=A ξξ, 则00λλ'=ξξ. 而≠0ξ,所以00λλ'=. 证毕. 命题6.1.5 向量≠0ξ生成的子空间()L ξ对A 不变⇔ξ是A 的一个特征向量. 证明 若()L ξ对A 不变,则()()L ∈A ξξ. 所以存在0P λ∈,使得0()λ=A ξξ. 即ξ是A 的一个特征向量.反过来,若ξ是A 的一个特征向量. 则≠0ξ,且有0()λ=A ξξ,则由命题6.1.3,对于()L ξ的任意向量k ξ有00()()()()k k k L λλ==∈A ξξξξ,即()L ξ对A 不变,从而是关于A 的一维不变子空间. 证毕.2. 特征值与特征向量的求法读者自然会问:如何判断一个向量是不是特征向量呢?如果是,又如何求相应的特征值呢?下面对有限维线性空间来进行讨论.设A 是数域P 上n 维线性空间V 的一个线性变换,12,,,n εεε是V 的一组基,A 在这组基下的矩阵是A . ξ是A 的属于特征值0λ的一个特征向量,即0()λ=A ξξ,≠0ξ,0P λ∈.设ξ在基12,,,n εεε下的坐标为12(,,,)n k k k ,则11221212()(,,,)(,,,)n n n n k k kkk k ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A A A ξεεεεεε,11220012120(,,,)(,,,)n n n n k k k k k k λλλ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ξεεεεεε. 所以11220n n k k k k k k λ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A , 即12000()0n n k k k λ⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪-= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭E A . 这就表明:12(,,,)T n k k k 是系数矩阵为0n λ-E A 的齐次线性方程组0()n λ-=0E A x的一个非零解. 因此,系数矩阵的行列式等于零,即00n λ-=E A .这也说明了特征值0λ是关于λ的n 次多项式()n f λλ=-E A 的一个根.反过来,坐标为0()n λ-=0E A x 的非零解的向量便是A 的属于特征值0λ的特征向量.我们引入下面的定义. 定义6.1.6 设111212122212n n n n nn a a a a a a a a a ⎛⎫ ⎪ ⎪= ⎪⎪⎝⎭A λ是一个符号或文字,则称矩阵111212122212n n n n nn a a a a a a a a a λλλλ---⎛⎫⎪---⎪-= ⎪⎪---⎝⎭E A 为A 的特征矩阵. 称()f λλ=-E A为A 的特征行列式或特征多项式.于是上面的分析可以归纳为下面的定理.定理6.1.7 设A 是数域P 上的n 维线性空间V 的一个线性变换,A 在V 的基12,,,n εεε下的矩阵是A . 若ξ是A 的属于特征值0λ的一个特征向量,即0()λ=A ξξ,≠0ξ,0P λ∈,则A 的特征值0λ是特征多项式()f λλ=-E A 的根,而属于0λ的特征向量ξ的坐标就是齐次线性方程组0()λ-=0E A x 的非零解. 反之,如果0λ是多项式()f λλ=-E A 的根,且0P λ∈,则0λ是线性变换A 的一个特征值. 而以0()λ-=0E A x 的非零解为坐标的向量便是A 的属于特征值0λ的特征向量.把上面的分析逆推回去即得定理的后一部分的证明.例6.1.8 设A 是数域P 上3维线性空间V 的一个线性变换,123,,εεε是V 的一组基,A 在这组基下的矩阵是122212221⎛⎫ ⎪= ⎪ ⎪⎝⎭A ,求A 的特征值及相应的特征向量.(分析)先求出特征值,即求出()f λλ=-E A 的根0λ; 再将0λ代入到0()λ-=0E A x 中,求0()λ-=0E A x 的非零解,这非零解便是属于0λ的特征向量的坐标.解 1)先求特征值. 由于2122()212(1)(5)221f λλλλλλλ---=-=---=+----E A ,所以11λ=-(二重根),25λ=. 由于任何数域都包含有理数域,所以12,P λλ∈,从而1,5-都是A 的特征值.2)求属于特征值11λ=-的特征向量. 解方程组1()λ-=0E A x ,即112311231213(1)220,2(1)20,22(1)0.x x x x x x x x x λλλ---=⎧⎪-+--=⎨⎪--+-=⎩得到1231231232220,2220,2220.x x x x x x x x x ---=⎧⎪---=⎨⎪---=⎩容易求得它的基础解系是100,111⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭. 所以113=-ξεε,223=ξε-ε是属于特征值11λ=-的特征向量. 因而属于特征值11λ=-的全部特征向量为1122k k +ξξ. 其中12,k k P ∈,且不全为零.同样的,可以求得3123=++ξεεε是属于特征值25λ=的特征向量. 因而属于特征值25λ=的全部特征向量为3k ξ. 其中k P ∈,且不为零.例6.1.9 在n 维线性空间中数乘变换k A 在任一组基下的矩阵都是k E ,它的特征多项式是()n k k λλ-=-E E . 所以k A 的特征值只有k . 由数乘变换k A 的定义可知,每个非零向量都是属于k 的特征向量.例6.1.10设A 是实数域R 上3维线性空间V 的一个线性变换,123,,εεε是V 的一组基,A 在这组基下的矩阵是332112310⎛⎫⎪=- ⎪ ⎪--⎝⎭A ,求A 的特征值及相应的特征向量. 解 1)先求特征值. 由于2332()112(4)(4)31f λλλλλλλ---=-=--=+-E A ,所以特征多项式的根为2i ±,4. 但2i ±不属于实数域R ,故不是特征值,所以只有4是A 的特征值.2)求属于特征值14λ=的特征向量. 解方程组1()λ-=0E A x ,即112311231213(3)320,(1)20,30.x x x x x x x x x λλλ---=⎧⎪-+-+=⎨⎪++=⎩ 得到123123123220,320,340.x x x x x x x x x --=⎧⎪-++=⎨⎪++=⎩ 容易求得它的基础解系是11,1⎛⎫ ⎪ ⎪ ⎪-⎝⎭.所以123=+-ξεεε,是属于特征值14λ=的特征向量. 因而属于特征值14λ=的全部特征向量为k ξ. 其中k P ∈,且不为零.我们再来介绍特征向量的一个重要性质. 定理6.1.11 属于不同特征值的特征向量线性无关.证明 设A 是数域P 上n 维线性空间V 的一个线性变换,12,,,m λλλ是A 的m个互异的特征值,如果i ≠0ξ是属于(1,2,,)i i m λ=的特征向量,即()(,,1,2,,)i i ii i P i m λλ=≠∈=0A ξξξ.我们需要证明12,,,m ξξξ在P 上线性无关. 对m 用数学归纳法.当1m =时,因为1≠0ξ,所以1ξ线性无关,定理成立. 假设定理对1(1)m m ->成立,现在考虑m 的情形. 设112211m m m m k k k k --++++=0ξξξξ. (1.1)(1.1)式两边同乘以m λ有 112211m m m m m m m m k k k k λλλλ--++++=0ξξξξ. (1.2) 再对(1.1)的两边同时作用线性变换A ,则有 111222111m m m m m m k k k k λλλλ---++++=0ξξξξ. (1.3)所以(1.2)-(1.3)有111222111()()()m m m m m m k k k λλλλλλ----+-++-=0ξξξ. 由归纳假设121,,,m -ξξξ线性无关,而12,,,m λλλ互异,所以1210m k k k -====.因而,再由(1.1)式有m m k =0ξ,而m ≠0ξ,故0m k =. 所以12,,,m ξξξ线性无关. 证毕.§6.2 特征多项式在上节里,我们介绍了特征多项式概念,本节我们要进一步讨论它. 设111212122212n n n n nn a a a a a a a a a ⎛⎫⎪ ⎪= ⎪⎪⎝⎭A 则A 的特征多项式为111212122212()n nn n nna a a a a a f a a a λλλλλ------=-=---E A11122()(1)n n n nn a a a λλ-=-+++++-A .因此我们有下面的结论.命题6.2.1 n 阶方阵A 的特征多项式是一个首项为1的n 次多项式.定义6.2.2 n 阶方阵A 的特征多项式()f λ在复数域内的根,称为A 的特征根.设A 的特征根为12,,,n λλλ,则由Vieta 定理我们又有下面的结论.命题6.2.3 设n 阶方阵()ij n na ⨯=A 的特征根为12,,,n λλλ,则1)112212Tr()nn n a a a λλλ=+++=+++A ;2)12n λλλ=A .注意,命题6.2.3中的1)并不意味着一定有111222,,,nn n a a a λλλ===.我们知道同一个线性变换在不同基下的矩阵是相似的,那么相似的矩阵是否有相同的特征值呢?下面的定理作出了肯定的回答. 定理6.2.4 相似阵有相同的特征多项式. 证明 设方阵,A B 相似,即存在满秩方阵P 使得1-=B PAP .所以,111λλλ----=-=-E B E PAP PP PAP11()λλλ--=-=-=-P E A P P E A P E A .证毕.说明 1)相似的方阵既然有相同的特征多项式,当然也就有相同的特征根. 因而结合命题6.2.3,相似的矩阵就有相同的行列式.2)定理6.2.4的逆不成立,即有相同特征多项式的矩阵却未必相似.如1011,0101⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭E A .有相同的特征根,但并不相似. 因为和E 相似的矩阵只有它自身.3)由于一个线性变换A 在不同基下的矩阵是相似的,则由定理6.2.4,A 在任何基下的矩阵的特征多项式都是相同的. 于是我们给出下面的定义.定义6.2.5 设A 有限维线性空间V 的一个线性变换,A 在V 的任意一组基下的矩阵的特征多项式就称为线性变换A 的特征多项式,而其在复数域内的根称为A 的特征根.说明 如果A 是数域P 上的有限维线性空间V 的一个线性变换,那么A 的特征值必是A 的特征根. 但A 的特征根未必是A 的特征值,只有属于P 的特征根才是A 的特征值. 对于矩阵的特征值与特征根的情形是相似的(如本章第一节例6.1.10).最后,我们指出特征多项式的一个重要性质. 定理6.2.6(Hamilton-Caylay 定理)设()ij n na ⨯=A 是数域P 上的一个n 阶方阵,()f λλ=-E A 是A 的特征多项式,则11122()()(1)n n n nn f a a a -=-+++++-=0A A A A E .证明 设()()λλ*=-B E A 是λ-E A 的伴随矩阵. 由伴随矩阵的性质,有()()()f λλλλ-=-=B E A E A E E .由于伴随矩阵()λB 中的元素都是λ-E A 的各个元素的代数余子式,因而也都是次数不超过1n -的多项式. 于是由矩阵的运算性质,可以把()λB 写成:120121()n n n n λλλλ----=++++B B B B B ,其中0121,,,,n n --B B B B 都是n n ⨯数字矩阵.设111()n n n n f a a a λλλλ--=-+++,则111()n n n n f a a a λλλλ--=-+++E E E E E . (2.1)又()()()120121()n n n n λλλλλλ-----=++++-B E A B B B B E A()()()1201021121n n n n n n B λλλλ-----=+-+-++--B B A B B A B B A B A . (2.2)将(2.1)与(2.2)进行比较得01012121211,,,,.n n n n n a a a a ----=⎧⎪-=⎪⎪-=⎪⎨⎪⎪-=⎪-=⎪⎩B E B B A E B B A E B B A E B A E (2.3)用1,,,,n n -A A A E 依次从右边乘(2.3)的第一式,第二式,,第n 式,第1n +式,得0111101121222122212111,,,,.n n n n n n n n n n n n n n n n n a a a a a a a ------------⎧==⎪-==⎪⎪-==⎪⎨⎪⎪-==⎪⎪-=⎩B A EA A B A B A EA A B A B A EA A B A B A EA A B A E (2.4)把(2.4)的1n +个式子左边与右边分别相加,左边就变为了零,而右边即为()f A . 所以()f =0A . 证毕.设A 是数域P 上的n 维线性空间V 的一个线性变换,由于P 上的线性变换的集合()M V 与n n P ⨯同构,又当A 在某组基下的矩阵为A 时,mA 的矩阵为m A ,从而由Hamilton-Caylay 定理有下面的推论.推论6.2.7 设A 是数域P 上的n 维线性空间V 的一个线性变换,()f λ是A 的特征多项式,则()f =A 0. 其中0是零变换.例6.2.8 设,A B 是两个n 阶方阵,则AB 与BA 有相同的特征多项式,从而有相同的特征根. 证明 由于,λλλλ--⎛⎫⎛⎫⎛⎫= ⎪⎪⎪⎝⎭⎝⎭⎝⎭00E A E A E AB E B E B E 上式两边取行列式,并利用Laplace 定理有nn λλλλ=-EA E AB BE.又,λλλλ⎛⎫⎛⎫⎛⎫= ⎪⎪ ⎪--⎝⎭⎝⎭⎝⎭00EE A E A B E BE E AB 同理有nn λλλλ=-EA E BA BE.因而有n n λλλλ-=-E AB E BA .故λλ-=-E AB E BA .§6.3 对角化对于某个线性空间一个线性变换,我们关心的是:能否找到一组基,使得这个线性变换在这组基下的矩阵具有特别简单的形状?对角矩阵可以认为是最为简单的一种矩阵. 而同一线性变换在不同基下的矩阵是相似的. 那么我们的问题就是:是否所有线性变换的矩阵都相似于对角阵呢?如果不然,哪些线性变换的矩阵可以相似于对角阵呢?在这一节里,我们主要讨论这个问题.1. 方阵的对角化定义6.3.1 如果数域P 上的方阵A 与P 上的一个对角矩阵相似,则称方阵A 在P 上可以对角化. 如果数域P 上的有限维线性空间V 的线性变换A 的矩阵在P 上可以对角化,则称线性变换A 可以对角化.说明 从上面的定义可以看出,如果线性变换A 可对角化,那么通过选择适当的基,A 在这组基下的矩阵是对角阵.定理6.3.2 设A 是n 维线性空间V 的一个线性变换,那么A 可以对角化的充分必要条件是A 有n 个线性无关的特征向量. 证明 设A 在基12,,,n εεε下的矩阵是A ,即1212(,,,)(,,,)n n =A A εεεεεε.如果A 可以对角化,即存在可逆阵P 使得121n λλλ-⎛⎫⎪⎪= ⎪ ⎪⎝⎭P AP , 则1212(,,,)(,,,)n n =P αααεεε也是V 的一组基,且11212(,,,)(,,,)n n -=P AP A αααααα1212(,,,)n n λλλ⎛⎫⎪⎪= ⎪ ⎪⎝⎭ααα, 则有 (),1,2,,i i i i n λ==A αα.这说明12,,,n ααα是A 特征向量,而它们显然是线性无关的.反过来,如果12,,,n ααα是A 的n 个线性无关的特征向量. 则它同时可以认为就是V 的一组基,而A 在12,,,n ααα下的矩阵是对角阵,即A 可以对角化. 证毕.说明 定理6.3.2可以用矩阵的语言叙述:如果A 是n 阶方阵,则A 相似于对角阵的充分必要条件是A 有n 个线性无关的特征向量(这样的矩阵A 称为可对角化矩阵).推论6.3.3设A 是数域P 上的n 维线性空间V 的一个线性变换. 如果A 的特征多项式在P 中有n 个单根,则A 在P 上可以对角化.证明 由于A 的特征多项式在P 上有n 个单根,即A 在P 上有n 个互异的特征值,而属于不同的特征值的特征向量都是线性无关的,所以A 有n 个线性无关的特征向量,从而由定理6.3.2知,A 在P 上可以对角化.推论6.3.4 设A 是复数域上的n 维线性空间V 的一个线性变换. 如果A 的特征多项式没有重根,则A 可以对角化.说明 上面的两个推论可以用矩阵语言来叙述. 即1)如果复数域上的矩阵A 有n 个单根,则A 在P 上可以对角化.2)如果复数域上的矩阵A 的特征多项式没有重根,则A 在P 上可以对角化.2. 特征子空间下面我们进一步讨论对角化定义6.3.5设A 是数域P 上的n 维线性空间V 的一个线性变换,0λ是A 的一个特征值,则称{}00,()V V λλ=∈=A αααα为A 的属于特征值0λ的特征子空间.因为0()λ=A αα等价于0()()λ-=0E A α,则00Ker()V λλ=-E A . 所以0V λ的确是V 的子空间. 又因为00()()λλ-=-A E A E A A ,则再由第四章§4.4的例4.4.6,我们有下面的命题.命题6.3.6 特征子空间0V λ是A 的不变子空间.现在我们讨论特征值0λ的重数与特征子空间0V λ的维数之间的关系. 定理6.3.7设A 是数域P 上的n 维线性空间V 的一个线性变换,0λ是A 的一个特征值,0V λ是属于A 的特征子空间,则00dim V λλ≤的重数.证明 设0dim V m λ=,且12,,,m ααα是0V λ的一组基,现在将它扩充为V 的一组基:121,,,,,,m m n +ααααα.因为0V λ是属于A 的特征子空间,则0V λ是V 的不变子空间. 因而可设101202011,112,12,11122(),(),(),(),().m m m m m n m n n n n nn n a a a a a a λλλ++++====+++=+++A A A A A αααααααααααααα于是A 在基121,,,,,,m m n +ααααα下的矩阵为01,110,1m n n m nn a a a a λλλ++⎛⎫⎪ ⎪ ⎪ ⎪=⎪ ⎪ ⎪ ⎪ ⎪⎝⎭A . 于是有0()()m g λλλλ-=-E A ,其中()g λ为A 中右下角小块的特征多项式. 故0λ在特征多项式()f λλ=-E A中的重数m ≥,亦即00dim V λλ≤的重数.证毕.定理6.3.8 如果12,,,k λλλ是线性变换A 的不同的特征值,而1,,i i ir αα是属于特征值(1,2,,)i i k λ=的线性无关的特征向量,那么向量组11111,,,,,,k r k kr αααα线性无关.(分析)根据线性无关的定义进行证明. 证明 设1111111111k k r r k k kr kr l l l l ++++++=0αααα令11,1,2,,i i i i i i ir ir l l V i k λ=++∈=ααα. 则上式即为12k +++=0ααα.所以i α只可能是0,或者是属于i λ的特征向量. 如果12,,,k ααα不全为0,我们不妨设12,,,()s s k ≤ααα都不是0,即它们分别是属于12,,,s λλλ的特征向量,而其余的都是0,则有12s +++=0ααα.这说明12,,,s ααα线性相关,而属于不同特征值的特征向量线性无关,从而引出矛盾. 所以12,,,k ααα全为0,亦即11,1,2,,i i i i i ir ir l l i k =++==0ααα.又1,,i i ir αα线性无关,所以10,1,2,,i i ir l l i k ====.故向量组11111,,,,,,k r k kr αααα线性无关. 证毕.定理6.3.9设A 是数域P 上的n 维线性空间V 的一个线性变换. 则A 可以对角化的充分必要条件是,A 的特征根都是特征值,而且对每个特征值i λ都有dim i i V λλ=的重数.证明 充分性. 设A 的特征根都是特征值,也就是说A 的特征根都在P 中. 令12,,,k λλλ是A 的全部互异的特征根,重数依次为12,,,k r r r . 则12k r r r n +++=.又dim ,(1,,)i i V r i k λ==,则可设1,,i i ir αα是i V λ的一组基. 所以由定理3.8,这n 个特征向量11111,,,,,,k r k kr αααα线性无关. 于是由定理6.3.2,A 可以对角化.必要性. 设A 可以对角化,即A 在某组基下的矩阵是对角阵,则A 有n 个线性无关的特征向量. 这些特征向量经过适当的排列为:11111,,,,,,t s t ts εεεε.其中1,,i i is εε是同一个特征值(1,,)i i t λ=的特征向量.显然,11111,,,,,,t s t ts εεεε也是V 的一组基. 那么A 在这组基下的矩阵为 111ttt s s λλλλ⎛⎫⎫ ⎪⎪⎬ ⎪⎪ ⎪⎭⎪ ⎪ ⎪⎫ ⎪⎪ ⎪⎬ ⎪⎪ ⎪⎭⎝⎭, 则A 的特征多项式为1212()()()()t s s s t f λλλλλλλ=---,由于1t s s n ++=,这说明A 的特征根都是特征值. 而(1,,)i i t λ=互异,则i λ的重数为i s . 又由于11111,,,,,,t s t ts εεεε是V 的一组基,线性无关,所以dim i i V s λ≥.而由定理6.3.7,dim i i V s λ≤. 故dim i i V λλ=的重数.证毕 .说明 1)用矩阵语言来叙述:设A 是数域P 上的n 阶方阵. 则A 可以对角化的充分必要条件是,A 的特征根都是特征值,而且对每个特征值i λ都有dim i i V λλ=的重数.2)这个定理给出了一个线性变换A 可对角化的充分必要条件.对于可对角化矩阵A ,现在我们来详细讨论如何求出P ,使得1-P AP 为对角阵.由于A 可对角化,则可设A 的特征值为12,,,n λλλ. 因为P 是可逆阵,不妨设12(,,,)n =P ααα是对P 按列进行分块. 由于121n λλλ-⎛⎫⎪⎪= ⎪ ⎪⎝⎭P AP , 所以12n λλλ⎛⎫⎪⎪= ⎪ ⎪⎝⎭AP P . 因此121122(,,,)(,,,)n n n λλλ=A A A αααααα.即有,i i i λ=A αα所以,可以认为i α就是属于特征值i λ的特征向量. 因此P 的n 个列向量就是A 的n 个线性无关的特征向量. 这表明只要我们求出A 的n 个线性无关特征向量,将它们放在一起组成的矩阵就是所要求的P .说明 因为特征向量不唯一,所以P 不唯一. 另外第i 个列向量对应于第i 个特征值.例6.3.10 判断矩阵100252241⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭A是否相似于对角阵,如果是,求出可逆矩阵P ,使得1-P AP 为对角阵. (分析)首先需要求出特征值,并根据相应的特征向量来判断A 是否相似于对角阵. 解 由于23100252(1)(3)241λλλλλλ--=--=--+E A .所以A 特征根1(二重)及3(一重),并且都是特征值. 将1λ=代入()3λ-=0E A x 有1231232420,2420.x x x x x x -+=⎧⎨-+=⎩ 容易求得该齐次线性方程组的基础解系为12211,001-⎛⎫⎛⎫ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭εε.将3λ=代入()3λ-=0E A x 后,容易求出这个方程组的基础解系为301.1⎛⎫⎪= ⎪ ⎪⎝⎭ε这说明A 有3个线性无关的特征向量,则它可以对角化. 因而根据上面的讨论有1210100101,010011003--⎛⎫⎛⎫ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭P P AP .推论6.3.11 设A 是数域P 上的n 阶方阵. 则A 在P 上可对角化的充分必要条件是A 的特征根都在P 中,并且对每个特征根i λ都有()i i R n r λ-=-E A ,其中i r 是特征根i λ的重数.证明 对于A 的每个特征根i λ,齐次线性方程组()i λ-=0E A x的解空间的维数为()i n R λ--E A . 而该齐次线性方程组的解空间实际上就是相应于i λ的特征子空间i V λ,所以dim ()i i V n R λλ=--E A .又由定理6.3.9,A 可对角化的充分必要条件是,每个特征根i P λ∈,且dim i i V λλ=的重数i r =.故()i i R n r λ-=-E A . 证毕.例6.3.12 判断下面方阵能否对角化:452221111-⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭A .解 容易求得1是A 的三重特征根;又容易看出(1)033R ⋅-≠=-E A .故A 在任何数域上都不能对角化. 习题A1. 求下列矩阵的特征值与特征向量:1)110143202⎛⎫ ⎪ ⎪ ⎪⎝⎭; 2)010100001⎛⎫ ⎪⎪ ⎪⎝⎭; 3)1100230000230014-⎛⎫⎪⎪⎪ ⎪⎝⎭. 2. 已知()()1212,,,,,,,n n a a a b b b ==αβ是两个非零向量且'=0αβ,求矩阵'=αβA 的全部特征值.3. 设A 使线性空间V 上的线性变换,V 有一个直和分解:12m V V V V =⊕⊕⊕,其中每个i V 是A 的不变子空间. 设A 限制在i V 上的特征多项式为()i f λ,求证:A 的特征多项式12()()()()m f f f f λλλλ=.4. 证明:n 阶矩阵A 以任一非零n 列向量为特征向量的充分必要条件是c =A E ,其中c 是常数.5. 设15310ac b c a -⎛⎫ ⎪= ⎪ ⎪--⎝⎭A .如果1=-A ,*A 有一个特征值0λ且属于0λ的一个特征向量为()1,1,1T--. 求0,,,a b c λ的值.6.判断下列矩阵是否相似于对角阵,如果是,求出可逆矩阵P ,使得1-P AP 为对角阵.1)212533102-⎛⎫⎪=- ⎪ ⎪--⎝⎭A ;2)142340313--⎛⎫ ⎪=- ⎪ ⎪-⎝⎭A .7. 矩阵A 是3阶方阵,其特征值为1,1,3,对应的特征向量依次为()()()2,1,0,1,0,1,0,1,1T T T -,求出矩阵A .8. 设3221423kk -⎛⎫ ⎪=-- ⎪ ⎪-⎝⎭A 当k 为何值时,存在可逆矩阵P ,使得1-P AP 为对角阵. 求出P 和对角阵.9. 设12,λλ是A 的两个不同的特征值,12,ξξ分别是12,λλ的特征值,则12+ξξ必不是A 的特征向量.10. 设V 使复数域上的n 维线性空间,A 与B 是V 的两个线性变换,且=A B B A .证明:1)如果0λ是A 的一个特征值,那么0V λ是B 的不变子空间.2)A 与B 至少有一个公共的特征向量.习题B1. 设T =B AA ,其中12(,,,)T n a a a =A ,且(1,2,,)i a i n =为非零实数.1)证明:k l =B B ,并求出数l ,这里k 是正整数;2)求可逆阵C ,使得1-C BC 为对角阵,并写出该对角阵.2. 设A 是m n ⨯矩阵,B 是n m ⨯矩阵,且m n ≥. 求证:m n m n λλλ--=-E AB E BA .3. 设A 是数域P 上n 维线性空间V 的线性变换且可逆. 证明:1)A 的特征值不为零;2)如果0λ是A 的特征值,则10λ-是1-A 的特征值.4. 设A 是数域P 上n 维线性空间V 的线性变换,证明:A 的行列式为零的充分必要条件是A 的一个特征值为零.5. 设A 是一个n 阶下三角阵,证明:1)如果当i j ≠时,ii jj a a ≠,,1,2,,i j n =,那么A 相似于一个对角阵. 2)如果1122nn a a a ===,而至少有一个00000,()i j a i j ≠>,那么A 不相似于对角阵.6. 证明:对任一n 阶复方阵A ,存在可逆矩阵P ,使得1-P AP 为上三角矩阵.。
特征值与特征向量6.ppt
例
求A
3 1
31的特征值和特征向量.
解 A的特征多项式为
(2次多项式)
3
I A 1
1
3
(
3)2
1
2
6
8
( 4)( 2) 0
所以A的特征值为 1 2, 2 4.
当1 2时, 解方程(2I A)X 0.由
2I
A
2
1
3
2
1
3
1 1
11
1 0
01
11
特征值为 1 2, 2 4.
1 , 1 ,
1
1
1 . 0
A
2 2
2
,3 k .
1
2,4是A的特征值, , 分别是A对应于特征值
2,4的特征向量, 不是A的特征向量.
4
定义 设A是n阶方阵,
若数 和n维非零列向量 ,使得 A 成立,
则称 是方阵A的一个特征值,
是方阵A的对应于特征值 的一个特征向量.
2 0
2 0
2 4 4 0 0 0
2
2
x1 2x2 2x3 基础解系
1 1 , 2 0.
对应特征值2的全部特征向量
0
1
k11 k22 (k1, k2不全为0)
16
1 2 2 2 2 4
当3 7时, 解 方程(7I A)X 0 2 4 2
I
A
1
3
1
3
1 1
0 0 x1 x2 ,
基础解系 1 11
对应特征值1 2的全部特征向量k11 (k1 0)
当2 4时, 解方程(4I A)X 0.由
4I
A
4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i [11 i ( ) i ] 1 i 2 mk max( Vk ) max{ } n i k 1 k max{ 1 [1 1 i ( ) i ]} 1 i 2
k 1 n
lim uk
k
max( 1 )
1
i max[ 11 i ( ) i ] 1 i 2 1 n i k 1 max[ 11 i ( ) i ] 1 i 2
由上可见经过7次迭代, m7的值已稳定到小数后5位, 故所求的按模最大特征值和对应的特征向量可取作:
1 44 .9995 , x1 (1,0.333 ,0.6667 )
T
注:1、归一化例题6-2
2、幂法的加速:原点平移法; Aitken加速法;Rayleigh商加速法
(1)原点平移法 最简单的加速办法是以 B A qI 来代替矩阵 A 进 行迭代, 此时适当选取平移量 q 可使过程得以加速。 易知 B 的特征值为 q, i 1,
V
(k )
,V ( k )
因为:
r (V
(k )
AV ) V
,V ( k ) A K 1V ( 0) , A K V ( 0) (k ) (k ) K ( 0) K (0) ,V A V ,A V
(k )
2k
2 2 k 1 a i i i 1 n
n
a12 a1n a11 a a a 22 2n f x det A I 21 a a a n1 n2 nn
令f﹙x﹚﹦0。 通过求解上述高次多项式方程,所得根λ即为矩阵A 的特征值,然后求解方程组﹙A﹣λI﹚X﹦0,就可得 出特征值λ对应的特征向量X。
…………..
k k Vk AVk 1 AkV0 11 1 2 k 2 2 n nn
i k [1 1 i ( ) i ] 1 i 2
k 1 n
同理可得: k 1 Vk 1 1 [1 1
i 假定 ( 1 ) j 0 ,因为 1(i 2,3,, n ) ,故得 1
一、幂法 定理:设矩阵A的特征值为
1 2 n
并设A有完全的特征向量系 1 , 2 ,, n (它们线性无关), 则对任意一个非零向量V0Rn 所构造的向量序列 Vk AVk1 有
(Vk ) j lim 1 k (V k 1 ) j
其中表示向量的第j个分量.
i
, n , B
1
的特征向量与矩阵
A
相 同 。 为 了 加 速 求 得 , 应 使 1 q 模 最 大 , 且 。
q
2 q 2 1 q 1
易求得,
2 n
2
是一个很好的选择.可以验证,
2 q
1
此时 B 的模最大的特征根仍为 1 q , 且模第二大的特 征根为 2 q 或 n q , 由于 q q 2
T T
和对合性( H I )以及 H H 。
2 T
1
P136定义6-1,定理6-4
构造一个 Householder 矩阵H主要是确定向 量u
v u n 。对任意非零向量 v R ,可令 v 2 ,此时
矩阵特征值 与特征向量的计算主要内容
一、幂法 二、反幂法 三、幂法、反幂法小结 四、QR算法 五、Jacobi方法
问题的提出: 工程技术的许多实际问题,例如振动问题,稳定问题的 求解,有时会归结成求矩阵的特征值λ和对应的特征向量χ。 学过线性代数后,我们已知求矩阵A的特征值λ和特征向量χ 的解法,即先求出A的特征多项式:
但众所周知,高次多项式求根是相当困难的,而且重根 的计算精度较低。同时,矩阵A求特征多项式系数的过程对舍 入误差十分敏感,这对最后计算结果影响很大。因此,从数 值计算角度来看,上述方法缺乏实用价值。 目前,求矩阵特征值问题实际采用的是迭代法和变换法。 这里将介绍通过求矩阵特征向量求出特征值的一种迭代法---幂法,而后再介绍一些反幂法的内容。
(2)Aitken 加速方法 易知
mk max(V
(k )
2 ) 1 C 1
k
于是有: mk 2 1 mk 1 1 mk 1 1 mk 1 便可得到
1 1( k )
2 mk 2 mk mk 1 mk 2 2mk 1 mk
a
i 1
2 i
i2 k
2 (k ) r ( V ) [ 1 O ( 1 所以: 1
)]
其近似程度比 Atiken 加速方法好。
二、反幂法: 基本思路:设 A没有零特征值,则 A非奇异,即 A的逆矩 阵存在,设的特征值为 0
1 2 n
其对应的特征向量为
因为 A xk = k xk
x1 x2 , x3 ,
, xn
所以 A-1 xk = k-1 xk
故k-1就是矩阵A-1的特征值,它们满足
n
1
n1
1
1
1
对应的特征向量仍为 x k 。因此,求矩阵 A 的按模最小特征 值,就相当于求其逆阵A-1的按模最大特征值n-1 ,这只需应用 幂法即可求得。
lim uk
k
max( 1 )
1
lim mk 1
k
证: V1 Au0 AV0 , u1
V1 AV0 max( V1 ) max( AV0 )
AkV0 Vk Auk 1 max( Ak 1V0 ) Vk AkV0 uk mk max ( AkV0 )
n
从上述证明过程可得出计算矩阵A的按模最大特征值的方 法,具体步骤如下: (1)任取一非零向量V0Rn,一般可取V0=(1,1,.…,1)T (2)计算Vk=AVk-1 (Vk ) j (3)当k足够大时,即可得到:1
(Vk 1 ) j
若按上述计算过程,有一严重缺点,当|1|>1 (或| 1 |<1时){Vk}中不为零的分量将随K的增大而无限增大,计 算机就可能出现上溢(或随K的增大而很快出现下溢), 因此,在实际计算时,须按规范法计算,每步先对向量 Vk进行“规范化”,即取Vk中绝对值最大的一个分量记作 mk =max(Vk ),用mk遍除的所有向量Vk ,得到规范化向 量。 为说明上述算法的正确性,我们证明下述定理 定理二:在定理一的条件下,规范化向量序列{uk}收敛于 矩阵A按模最大的特征值1对应的特征向量,而向量序列 {Vk}的绝对值最大的分量mk收敛于1,即
P129:定理6-2;归一化幂 法是定理6-3。
证明: 仅就为实数的情况来证明.假定
V0 11 2 2 n n (1 0)
于是,由矩阵特征值定义知 i i i ,得
V1 AV0 1 A1 2 A2 n An 111 22 2 nn n 2 2 V2 AV1 A2V0 11 1 2 2 2 2 n nn
i [1 1 i ( ) i ] 1 i 2 n i k k max{ 1 [1 1 i ( ) i ]} 1 i 2
k 1 n
i k ) i 1 i 2 n i k m ax [ 1 1 i ( ) i ] 1 i 2 1 1 i (
注意点: 由于求逆非常费时。故在用迭代向量 Vk A1uk 1 由uk-1求Vk时,可采用解方程组
AVk uk 1
的办法。由于每次解方程组的系数矩阵都相同,故 计算并不复杂。如果预先将作三角分解,这样使每 次迭代仅仅求解两个三角方程组就更省时了。特别 当n较大时,将大大地节省计算量。 三、幂法小结: 幂法适用范围为求矩阵的按模最大特征值及相 应的特征向量,其优点是算法简单,容易编写程序 在计算机上实现,缺点是收敛速度慢,其有效性依 赖于矩阵特征值的分布情况。反幂法的适用范围是 求矩阵的按模最小特征值及对应的特征向量。
1 1 2
n q
2 n
n
2 1
, 因而,
过程可以加速。
这个办法也可用来求按模最小的特征值及相应 特征向量,只需令
1 n1 q 2
即可。
上述加速办法也称为移位法 .由于特征值分布 范围预先可由定理 6.1 先限定一个范围,但此范围 往往太大,实际使用时一般是通过多次实验找到合 适的 q 值使迭代过程有明显加速为止。
1、Householder矩阵
定 义 : 设 向 量 u u1 , u2 , , un
H I 2uuT , 称为
T
,且
uT u u
2 2
1 ,则
Householder 矩阵, 简称H矩阵。
根据定义可以看出,Householder 矩阵 具有良好的性质: 对称性( H H ) ,正交性( H H I )
n
k
lim mk 1
例: 用44 5 46 88 6 90
按模最大特征值1和对应的特征向量x1
解:
k 0 1 2 3 4 5 6 7
取初始向量V0= u0=(1,1,1)T ,计算出Vk,uk和mk,迭代 7次的结果列于下表
(3)Rayleigh 商加速 设对称矩阵 A 的特征值满足 1 2 n , 且含 有相互正交的特征向量 x1 , x 2 , , xn ,则在幂法迭代的 每一步可进一步计算 V( k ) 的 Rayleigh 商
r (V ( k ) )
(k ) (k ) AV , V
uk
1 -0.67153 -0.66727 -0.66670 -0.66667 -0.66667 -0.66667 -0.66667