数值分析-第7章 矩阵特征值问题的数值解法n

合集下载

西安科技大学研究生数值分析课件7章矩阵特征值与特征向量计算

西安科技大学研究生数值分析课件7章矩阵特征值与特征向量计算

7 矩阵特征值与特征向量地计算设A 为n 阶方阵,所谓A 地特征值问题是求数λ和非零向量x ,使x Ax λ=成立.数λ称作A 地一个特征值,非零向量x 称作与特征值λ对应地特征向量.求给定方阵地特征值与特征向量是先求解特征方程()||0E A ϕλλ=-=然后对应于每一个特征值i λ,再求解退化地齐次线性方程组()0i E A x λ-=从而得到A 地特征值i λ及对应地特征向量x .但是这种方法计算机很大,计算过程复杂,因此有必要研究相对简单地数值解法.本章主要介绍三类计算特征值地方法:计算大型(稀疏)矩阵主特征地幂法与反幂法,计算中小型(实对称)矩阵全部特征值地Jacobi 法,计算中小型矩阵全部特征值地QR 法.7.1 特征值估计在矩阵特征值计算中,有时需要对特征值所在范围给出一个估计.这里介绍一种从矩阵地元素出发,运用较简便地运算估计特征值地方法.定义7-1 设()n m ij A a C ⨯=∈,称由不等式||ii i z a R -≤在复平面上确定地区域为矩阵A 地第i 个盖尔圆(Gerschgorin 圆),并用i G 表示.其中1||ni ij j j i R a =≠=∑称为盖尔圆i G 地半径(1,2,,)i n =.定理7-1 矩阵()n m ij A a C ⨯=∈地一切特征值均落在它地n 个盖尔圆地并集中,即1(1,2,,)ni jj G i n λ=∈=.证明 设λ是A 地任一特征值,12(,,,)T n x x x x =是λ对应地特征向量.令01||max ||i i i nx x ≤≤=,则00i x ≠.由Ax x λ=,可得001()ni j j i j a x x λ==∑.即∑≠==-ni j j j j i i i i x a x a 000001)(λ于是有 000000011i i jni j j ji ni j j i jji i i R x x ax x aa ≤≤=-∑∑≠=≠=λ这表明任一特征值0i G λ∈,从而也在A 地第n 个盖尔圆地并集中.例7-1 估计矩阵10.10.20.30.530.10.210.310.50.20.30.14A ⎡⎤⎢⎥⎢⎥=⎢⎥-⎢⎥---⎣⎦地特征值范围. 解 A 地4个盖尔圆为:1:|1|0.6G z -≤ 2:|3|0.8G z -≤ 3:|1| 1.8G z +≤ 4:|4|0.6G z +≤画在复平面上其区域如图7-1所示.图7-1 例7-1盖尔圆分布图于是A 地全部特征值就在这4个盖尔圆地并集中.为了更确切地知道某个特征值落在哪个或哪几个盖尔圆地并集中,给出如下第二盖尔圆盘定理.定理7-2 若A 地n 个盖尔圆中,有m 个盖尔圆构成地一个连通域(所谓连通域,是指其中地任意两点都可以用位于该区域内地一条折线连接起来),且该连通域与其余n m -个盖尔圆严格分离,则在该连通域中恰好有A 地m 个特征值(重特征值按重数重复计算).特别地,每个孤立地盖尔圆恰有A 地一个特征值(证明从略).由定理2可知,在例1中2G 与4G 中各有A 地一个特征值,而1G 与3G 构成地连通部分中有两个特征值,但不能确定这两个特征值具体落在哪个盖尔圆中.例7-2 估计矩阵10.80.50A -⎡⎤=⎢⎥⎣⎦地特征值范围. 解 A 地两个盖尔圆为:1:|1|0.8G z -≤,2:|0|0.5G z -≤在复平面上地区域如图7-2所示.图7-2 例7-2盖尔圆分布图此时只能判断A 地两个特征值落在1G 与2G 地并集中,至于是每个盖尔圆中各有一个特征值还是两个特征值都落在其中一个盖尔圆上则无法确定.实际上,由于1,21(12λ=±,1,2||0.5λ=>,所以两个特征值都不会在盖尔圆2G 中,而是落在盖尔圆1G 中.对于某些矩阵,可利用相似变换矩阵具有相同特征值地性质得到更确切地特征值范围.设()ij n m A a ⨯=,取正数12,,,n d d d 构成对角阵12diag(,,,)n D d d d =,对A 作相似变换,令1()iij n n jd B DAD a d -⨯==,由于B 相似于A ,所以B 与A 地特征值完全相同,又由于B 与A 地主对角线元素对应相等,所以B 与A 地盖尔圆圆心相同.这表明,若适当选取正数12,,,n d d d ,可以改变盖尔圆地半径,从而有可能将相交地盖尔圆分离得到仅含一个特征值地孤立盖尔圆.选取12,,,n d d d 地一般方法是:欲使A 地第i 个盖尔圆i G 地半径大而其余盖尔圆变小,就取1i d >,其余1()j d j i =≠.例7-3 求矩阵2050.841011210A j ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦地特征值范围. 解 A 地3个盖尔圆为:1:|20| 5.8G z -≤,2:|10|5G z -≤,3:|10|3G z j -≤其中1G 与2G 相交,而3G 孤立.记3G 中所含地一个特征值为3λ,如图7-3所示.为分离2G 与1G ,可以让A 地第3行元素绝对值变大,第3列元素绝对值变小.现取diag(1,1,2)D =,则12050.44100.52410B DAD j -⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦图7-3 例3盖尔圆分布图 图7-4 例7-3分离后盖尔圆分布图其3个盖尔圆分别是:1:|20| 5.4G z '-≤,2:|10| 4.5G z '-≤,3:|10|6G z j '-≤ 显然,B 地盖尔圆是3个孤立地盖尔圆,如图7-4,注意,此情况下,3G '地半径变大了.例7-4 设矩阵()ij n n A a ⨯=按行严格对角占优,则A 可逆.证明 由线性代数知,A 可逆地充分条件是||0A ≠,而1||nj j A λ==∏(其中j λ是A 地特征值),所以只要证明0j λ≠即可(1,2,,)j n =. 设λ是A 地任一特征值,则必存在某个盖尔圆i G 使∑≠=≤-ij ij i ii a R a λ.若0j λ=,则有∑≠≤ij ij ii a a ,而这与A 按行严格对角占优矛盾,故应有0λ≠,由λ地任意性,得||0A ≠.7.2 幂法与反幂法在线性代数中,设A 是n 阶方阵,若A 存在n 个线性无关地特征向量,则称这n 个特征向量构成A 地一个完全地特征向量组.例如,对矩阵320230005A -⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦,110430102B -⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦通过求解特征方程,不难求出A 地三个特征值为1231,5λλλ===,B地三个特征值为1232,1λλλ===.方阵A 可以找到三个线性无关地特征向量,而方阵B 找不到三个线性无关地特征向量.我们称方阵A 可对角化,而B 不可对角化. 7.2.1 幂法幂法地基本思想是构造一个向量序列使之逼近主特征值(矩阵地按模最大地特征值)对应地特征向量,然后求出主特征值.该方法简单易行,但收敛速度较慢.现设()ij n n A a ⨯=有一个完全地特征向量组12,,,n x x x ,其对应地特征值是12,,,n λλλ.已知A 地主特征值是单根1λ,即特征值满足条件12||||||n λλλ>≥≥任取一个非零初始向量0u ,由矩阵A 构造向量序列102210110k k k u Au u Au A u u Au A u++=⎧⎪==⎪⎪⎨⎪==⎪⎪⎩由于A 地完全特征向量组可以作为向量空间n R 地一组基,因此0u 可由12,,,n x x x 线性表示,即有01122n n u a x a x a x =+++ (设10a ≠)于是011122211111121()()k k k k k n n nn kk k i i i k i u A u a x a x a x a x a x a x λλλλλλελ===+++⎡⎤=+=+⎢⎥⎣⎦∑ 其中21()nk i k i i i a x λελ==∑.注意到),,2(11n i i=<λλ,故当k →∞时,0k ε→,因此有111k k u a x λ≈由于1x 是主特征值1λ对应地特征向量,其乘上常数因子11k a λ仍为1λ地特征向量,故当k 充分大时,迭代向量k u 是1λ地特征向量地近似向量.为了利用迭代向量求出主特征值1λ地近似值,设()k i u 表示k u 地第i 个分量,则1111111()()()[]()()()k i i k ik i i k iu a x u a x ελε+++=+ 于是 11()lim()k ik k iu u λ+→∞= 这表明两相邻迭代向量对应分量地比值收敛于主特征值,亦即当k 充分大时,可用两相邻迭代向量地分量比作为主特征值地近似值,即11()()k ik iu u λ+≈若主特征值是A 地r 重实特征值,即12(1)r r n λλλ===≤≤,对应地r 个线性无关特征向量为12,,,n x x x .则有01111()r nkk k i k i i i i i i r u A u a x a x λλλ==+⎡⎤==+⎢⎥⎣⎦∑∑当k 充分大时,11rkk i i i u a x λ=≈∑即k u 仍为主特征值对应地特征向量地近似向量,相邻两迭代向量地分量比仍为主特征值地近似值.综上所述,有定理7-3 设A 是n 阶实矩阵,具有完全地特征向量组,主特征值是r 重根,即112||||||||(1)r r n r n λλλλ++>≥≥≥≤≤则对任意非零初始向量0u ,迭代向量0k k u A u = 满足 111lim(0)rki ikk i u a x a λ→∞==≠∑ ,11()lim ()k ik k iu u λ+→∞= 或 11rk k i i i u a x λ=≈∑,11()()k ik iu u λ+≈ 这样用非零初始向量0u 及矩阵A 构造向量序列{}k u 以计算A 地主特征值1λ及相应地特征向量地方法称为幂法.不过从上面地讨论中可以看到,如果1||1λ>或11<λ,迭代向量k u 当k →∞时,其不为零地分量就会趋于无穷大或趋于零.为克服这个缺点,可以在每步迭代中加上对向量规范化地步骤,使迭代向量地数量级保持在一个稳定地量级上,归纳起来,幂法地计算步骤为:步骤 1 给定非零初始向量0u ,精度12,εε,令00v u =;令(0)10max()v λ=,1=k ;步骤 2 迭代1-=k k Av u ,()1max()k k u λ=,其中)max(k u 表示k u 绝对值最大地分量;步骤3 规范化max()kk k u v u =; 步骤 4 若11k k v v ε--<且()(1)112||k k λλε--<,则k v 即为1λ地近似特征向量,()1k λ即为1λ地近似值;否则,1+=k k ,转步骤2继续迭代.例7-5 用幂法计算1.0 1.00.51.0 1.00.250.50.252.0A ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦地主特征值和相应地特征向量,结果见表7-1.表7-1而此题地准确值为1 2.5365258λ= 1(0.748221,0.649661,1.000000)T x =7.2.2 幂法地加速幂法地收敛速度由比值21r λλ=来确定,r 越小收敛越快,而当1r ≈时收敛可能很慢.为了克服这一缺点,常采用原点平移法对幂法进行加速.设B A pE =-,其中p 是待定参数.显然,若A 地特征值为12,,,n λλλ,则B 地相应特征值(1,2,,)i k i n =为12,,,n p p p λλλ---,且A .B 地特征向量相同.这是因为对A 有特征方程||0i A E λ-=,而对B 有特征方程|||()|0i i B k E A p k E -=-+=,所以,i i i i p k k p λλ=+=-另一方面,若i x 是A 地对应i λ地特征向量,即i i i Ax x λ=则 ()()i i i i i i Bx A pE x Ax px p x λ=-=-=-原点平移法地思想是引入矩阵B ,恰当地选择参数p ,使11k p λ=-是B 地主特征值,且其速比2211maxB A p r r p λλλλ-=<=-,这样用幂法求B 地主特征值1k 地收敛速度就快于用幂法求A 地主特征值1λ,而一旦1k 求出,由11k p λ+=可得A 地主特征值,达到了加速地目地.但是为了选取恰当地选择参数p ,需要对A 地特征值地分布地大致了解. 例7-6 设4阶方阵A 有特征值15(1,2,3,4)j jj λ=-=其速比210.9A r λλ=≈.作变换 (12)B A pEp =-=则B 地特征值为12k =,21k =,30k =,41k =-,其速比2112B A k r r k ==<. 设A 地实特征值满足121n n λλλλ->≥≥>若2,n λλ地值可大致估计出,若要求1λ,考察待定参数p 地选取. 在原点平移法通过变换pE A B -=后,不论p 如何选取,矩阵地B 主特征值也只能是在n p λ-或 1p λ-.若希望求1λ,就应选择p ,使1p λ-称为B 地主特征值,即1||||n p p λλ->-这时B 地收敛速比B r 是比值21||/||p p λλ--和1||/||n p p λλ--中地较大者,即211||||max ,||||n B p p r p p λλλλ⎧⎫--=⎨⎬--⎩⎭显然B r 依赖于p 地选取,记做()B r p .为了使应用幂法求B 地主特征值地收敛速度尽可能快,我们希望选择最佳参数*p ,使*()min ()B B r p r p =由B r 地表示式(求二者之间地较大值)和)(*p r B 对)(p r B 地最小化要求,只有当2||||n p p λλ-=-时,()B r p 达到最小.由于2n p p λλ-=-会有得到矛盾地结果(2n λλ=),所以只能是2()n p p λλ-=--即 *22np λλ+=类似地,若用反幂法求最小特征值n λ,若1n λ-,1λ可大致估计,取最佳平移参数*112n p λλ-+=例7-7 取0.75p =,用原点平移法,计算例7-7中矩阵A 地主特征值.解 作变换B A pE =-,则0.2510.510.250.250.50.25 1.25B ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦对B 应用幂法,计算结果见表7-2.即1 1.7865914k ≈,则A 地主特征值1λ为110.75 2.5365914k λ=+=与例7-5比较,上述结果比例7-5迭代15次还好.表7-27.2.3 反幂法设方阵A 按模最小地特征值是n λ,且0n λ≠,则A 可逆.于是,由n n n Ax x λ=,可得11n n nA x x λ-=,这表明1nλ是1A -地主特征值.反幂法就是将幂法应用于1A -,通过求出1A -地主特征值得到A 地按模最小地特征值及其对应地特征向量.定理7-4 设A 是n 阶实矩阵,具有完全地特征向量组,其特征值满足12||||||0n λλλ≥≥≥>则对任意非零初始向量00u v =,按下述方式构造地迭代向量11k k u A v --= ,max()kk k u v u =满足lim max()n k k n x v x →∞=, 1lim max()k k nu λ→∞= /max()k n n v x x ≈,1max()k nu λ≈在实际计算中,可先对A 进行LU 分解,通过求解1k k Ly v -= ,k k Uu y =来求解方程组1k k Au v -=.反幂法地计算步骤为:步骤1 预先取定非零向量00u v =;给定精度12,εε;取(0)0m a x ()nu μ=; 步骤2 对矩阵A 作LU 分解,A LU =;令1=k ;步骤3 求解方程组1k k Ly v -= ,k k Uu y = 得到迭代向量k u ; 步骤4 规范化max()kk k u v u =步骤5 若11k k v v ε--<且()(1)2||k k n n μμε--<,则k v 即为A 地对应于n λ地近似特征向量,()1k nμ即为n λ地近似值;否则,令1+=k k ,转步骤3继续迭代.7.3 矩阵地两种正交变换本节先介绍镜面(初等)反射变换和平面旋转变换,它们是QR 算法和Jacobi 算法地基础.7.3.1 豪斯荷尔德(House holder )变换定义7-2 设有方阵B ,若当1i j >+时(,1,2,,)i j n =,0ij b =,则称B 是上Hessenberg 矩阵,即1112121222,1n n n n nn b b b b b b B b b -⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦定义7-3 设向量ω满足21ω=,矩阵2T H E ωω=- (ω是列向量)称为初等反射矩阵,又称House holder 矩阵,记为()H ω,即211212212221212222122()2212n n n n n H ωωωωωωωωωωωωωωωω⎡⎤---⎢⎥---⎢⎥=⎢⎥⎢⎥---⎢⎥⎣⎦其中(1,2,,)i i n ω=是ω地分量.可以证明初等反射阵是对称阵()T H H =.正交阵()T H H E =. 例7-8 设向量0α≠,试证矩阵222TH E ααα=- 是一个初等反射阵. 证明 令2αωα=,则 222221||||||||1αωααα=== 由定义7-3,2222TTH E E ααωωα=-=-是初等反射阵.定理7-5 设,x y 是两个不相等地n 维列向量,且22||||||||x y =,则存在一个初等反射阵H,使得Hx y =证明 令2||||x yx y ω-=-,由例7-8可知22()()22||||T T Tx y x y H E E x y ωω--=-=-- 是一个初等反射阵.由于22||||()()T T T T Tx y x y x y x x y x x y y y -=--=--+ 注意到22||||||||x y =,即T T x x y y =,又()T T T T x y x y y x == ,故22||||2()T Tx y x x y x -=-从而22()()2||||T T x y x x y x Hx x x y --=--y y x x =--=)(. 例7-9 设1(1,2,2),(1,0,0)T T x e ==,用Householder 变换将x 化为与1e 同方向地向量.解 因为2||||3x =,可设13y e =,则22||||||||x y = 取21,1,1)||||T x y w x y -==--,构造Householder 矩阵[]11122212111,1,12123311221T H E ww -⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-=--=-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦则13Hx e =推论 设向量12(,,,)0T n x x x x =≠,12()||||r sign x x =,且1x r ε≠-,则存在初等反射阵1222||||T T uu H E E uu u ρ-=-=- 使1Hx r ε=- .其中,1(1,0,,0)T ε=,1u x r ε=+,22||||/2u ρ=.设12(,,,)T n u u u u =,则12(,,,)T n u x r x x =+22222122222112111||||[()]221(2)2()n n u x r x x r rx x x x r r x ρ==++++=+++++=+引入初等反射阵地目地,是设法用一系列初等反射阵将原始矩阵约化成上Hessenberg 阵.由于约化过程是逐列进行地,我们先给出计算Hx 地算法步骤,该算法算出H 及r ,使Hx r ε=-,u 地分量冲掉x 地分量.(1)1max ||i i nx η≤≤=;(2)(1,2,,)ii i x x u i n η←==,此步规范化是为避免计算r 时产生溢出;(3) 12211()()nii r sign x x ==∑;(4)11u u r ←+;(5) 1ru ρ=; (6) r r η←;于是初等反射阵1T H E uu ρ-=-,1Hx r ε=-.如果要将H 作用于矩阵A ,设i a 是A 地第i 列向量,则12(,,,)n A a a a =,12(,,,)n HA Ha Ha Ha = 其中,11()()(1,2,,)T T i i i i Ha E uu a a u a ui n ρρ--=-=-=.下面讨论用初等反射阵约化原始矩阵A 称为上Hessenberg 阵地步骤.11121(1)(1)2122211121(1)(1)212212n n n n nn a a a a a a a A A A a a a a a ⎡⎤⎢⎥⎡⎤⎢⎥===⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦步骤1 不妨设(1)210a ≠(否则这一步不需约化),选择初等反射阵1R ,使(1)12111R a r ε=-,其中: 1(1)(1)2212112(1)1211112111121211111()(())(1)1()2ni i T r sign a a u a r n u r r a R E u u εερρ=-⎧=⎪⎪⎪=+-⎨⎪==+⎪⎪=-⎩∑是维单位坐标列向量 令11100U R ⎡⎤=⎢⎥⎣⎦则(2)(2)(2)(1)111213111212111(2)(2)(1)(1)222312112210A a A a A R A U AU a A R a R A R ⎡⎤⎡⎤===⎢⎥⎢⎥⎣⎦⎣⎦其中,(2)11A 是21⨯阵,(2)22a 是2n -维列向量,(2)23A 是2n -阶方阵.步骤k 设对A 已进行了1k -步约化,即111(2)()()()()11121,111,11(2)()()()1222,12,2()()()1,1,()()()1,1,11,()()(),1(2,3,,1)k k k k k k k k k k k n k k k k kn k k k k kk k k k n k k k k k k k k nk k k nkn k nnA U A U k n a a a a a a r a a a a r a a a a a a a a a ----+--++++++==-⎡⎢-⎢=-⎣()()()111213()()22230k k k k k A a A a A ⎤⎥⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎦⎡⎤=⎢⎥⎣⎦其中,()11k A 是(1)k k ⨯-阵,()22k a 是n k -维列向量,()23k A 是n k -阶方阵.设()220k a ≠,选初等反射阵()k R n k -阶,使()221k k k R a r ε=-,其中1ε是n k -维单位坐标向量,可得1()()221,1()221()1,1()(())()nk k k k k ik i k k kk k k k kk nT k k k k r sign a a u a r r r a R E u u ερρ+=++-⎧=⎪⎪⎪=+⎨⎪=+⎪⎪=-⎩∑ 令 00k k E U R ⎡⎤=⎢⎥⎣⎦则 ()()()1112131()()2223()()()111213()12300k k k k k k k k k k k k k k k k k k k k k A a A R A U A U R a R A R A a A R r R A R ε+⎡⎤==⎢⎥⎣⎦⎡⎤=⎢⎥-⎣⎦ 可见1k A +地左上角1k +阶子阵为上Hessenberg 阵,从而约化又进了一步.重复此过程,直到122112211(2)122(3)233(1)1n n n n n nn A U U U AU U U a r a r a r a -----=⨯⨯⨯⎡⎤⎢⎥-⨯⨯⎢⎥⎢⎥=-⨯⎢⎥⎢⎥⎢⎥-⎣⎦使原始矩阵A 在一系列初等反射阵地作用下,约化为上Hessenberg 阵.综上所述,有定理7-6.定理7-6 如果A 是n 阶实矩阵,则存在初等反射阵122,,,n U U U -,使221122n n U U U AU U U C --=(上Hessenberg 阵)例7-10 试证矩阵A 与其约化成为地上Hessenberg 阵C 有相同地特征值.证明 记221n P U U U -=,由于初等反射阵是正交对称阵,故122T n P U U U -=,且P 是正交阵,故T PAP C =.于是||||||||||||T T C E PAP E P A E P A E λλλλ-=-=-=-其中T PP E =,||||1T P P =.这表明A 与C 具有相同地特征多项式,即两者有相同地特征值.进一步,设y 是C 地对应于特征值λ地特征向量,即Cy y λ=,则有T PAP y y λ= ()()T T A P y P y λ=这表明T P y 为A 地对应于λ地特征向量,于是求原始矩阵A 地特征值与特征向量可转化为求上Hessenberg 阵C 地特征值和特征向量.定理7-7 若A 是实对称矩阵,则存在初等反射阵122,,,n U U U -使2211221112211()n n n n n U U U AU U U c b b c b C b b c ----⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦对称三对角阵 证明 由定理7-6,存在初等反射阵可使A 约化为上Hessenberg 阵C ,当A 是对称矩阵时,C 亦为对称阵,即T C C =,且T C 亦为上Hessenberg 阵,故C 是对称三对角阵.例7-11 用豪斯荷尔德方法将下述矩阵化为上Hessenberg 阵.1437232427A A ---⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦解 (1)对1k =,确定变换阵111000U R ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦,(1)2124a ⎡⎤=⎢⎥⎣⎦ 其中1R 为初等反射阵,使(1)121110R a r ⎡⎤=-⎢⎥⎣⎦(1)12124.472136r a ==≈(1)12111 6.472136244u a r ε⎡⎡⎤+=+=≈⎢⎢⎥⎣⎦⎣⎦11121()2)28.94427r r a ρ=+≈[]1111110 6.4721361 6.472136401428.944270.4472070.8944230.8944230.447216TR E u u ρ-=-⎡⎤⎡⎤=-⎢⎥⎢⎥⎣⎦⎣⎦--⎡⎤=⎢⎥-⎣⎦(2)计算(1)122R A .记(1)221232(,)27A a a ⎡⎤==⎢⎥⎣⎦,于是 (1)1221112 3.1304967.155419(,) 1.788855 1.341640R A R a R a --⎡⎤==⎢⎥-⎣⎦其中,111111111()()(1,2)T T i i i i R a E u u a a u a u i ρρ--=-=-=(3)计算(1)121A R 及(1)1221()R A R ,即求 1(1)121211(1)1223373.1304967.1554191.788855 1.341640T T T b A R b R R R A b ⎡⎤--⎡⎤⎡⎤⎢⎥⎢⎥==--⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥-⎣⎦⎣⎦7.6026340.4472127.800030.3999990.399999 2.200000-⎡⎤⎢⎥=-⎢⎥⎢⎥-⎣⎦其中,11111()(1,2,3)T T T Ti i i b R b b u u i ρ-=-=(4)计算2111A U AU =.(1)12121(1)1221447.6026340.4472124.4721367.8000030.39999900.399999 2.2000000A R A r R A R ⎡⎤--⎡⎤⎢⎥⎢⎥⎢⎥==--⎢⎥⎢⎥-⎢⎥-⎢⎥⎣⎦⎢⎥⎣⎦为上Hessenberg 阵.7.3.2 平面旋转变换 定义7-4 称矩阵111(,)111i j csi P i j scj ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦第列第列第行第行 为平面旋转矩阵,又称Givens 矩阵,其中cos c θ=,sin s θ=.平面旋转阵(,)P i j 是一个正交阵,与单位阵只有在(,),(,),(,i i i j j j j i四个位置上地元素不一样,用其左乘矩阵A 只改变A 地第i 行和第j 行元素.设12(,,,)T n x x x x =则平面旋转变换Px y =地结果为⎪⎩⎪⎨⎧≠=+-=+=ji k x y cx sx y sx cx y k kj i j j i i ,若令/i c x =,j s x =, 则平面旋转变换向量y 地第i个分两为22j i x x +,第j 个分量为0,其余分量即为x 对应地分量.和初等反射变换一样,用平面旋转变换也可以将一个方阵化为上Hessenberg 矩阵,也可以将将一个方阵化为上三角矩阵.7.4 QR 算法7.4.1 矩阵地QR 分解定理7-8 设A 是可逆矩阵,则存在正交矩阵121,,,n P P P -使121()n P P P A R -=上三角矩阵且R 地主对角元素0(1,2,,1)ii r i n >=-.证明 若10(2,3,,)j a j n ==,则A 地第一列不需约化.若有某个 10(2)j a j n ≠≤≤,则可选择1(1,)j P j P =使A 地第一列中第j 个元素变为零.一般地,可设平面旋转矩阵12131,,,n P P P ,使(2)(2)11121(2)(2)222113122(2)(2)200nn nn nn r a a a a P P P A A a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦记111312nP P P P =,则12P A A =.同理,若(2)20(3,4,,)j a j n ≠=,可选取23242,,,n P P P 使(2)(2)(2)1112131(3)(3)22232(3)(3)2212323333(3)(3)3nn n n n n nn r a a a r a a P P P A A a a a a -⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦记2223nP P P =,则213P P A A =.重复上述过程,可得一系列正交阵121,,,n P P P -使11121222121n n n nn r r r r r P P P A R r -⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦ 定理7-9 (矩阵地QR 分解)如果n 阶实矩阵A 可逆,则A 可分解为一正交阵Q 和上三角阵R 地乘积,即A QR =,且当R 地对角元素都为正数时分解唯一.证明 由定理8知存在正交阵11,,n P P -使121n P P P A R -=为上三角阵,记121T n Q P P P -=,于是T Q A R =由于(1,2,,1)i P i n =-是正交阵,则T Q 亦为正交阵,故A QR =. 若A 有两种QR 分解,记为1122A Q R Q R ==其中12,R R 为上三角阵且主对角元素都为正数,12,Q Q 为正交阵,于是12121T Q Q R R -=注意121R R -是上三角阵地乘积,结果仍为上三角阵,而12,TQ Q 是正交阵,所以121R R -也应是正交阵.若记121D R R -=,由其上三角性T D 应是下三角阵,1D -应是上三角阵;由其正交性由1T D D -=,故D 只能是对角阵,且有2T D D D E ==.又因12,R R 地主对角元素都为正数,即有222212diag[,,,]diag[1,1,,1]n D d d d E ===故1(1,2,,)i d i n ==,则D E =,于是12R R =,12Q Q =.例7-12 求矩阵⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=212240130A 地QR 分解. 解 方法1:利用初等反射阵进行QR 分解令(0)1(0,0,2)T a =,取(0)112||||2d a ==,则)2,0,2(81211)0(111)0(11-=--=e d ae d a u1110012010100TH E u u ⎡⎤⎢⎥=-=⎢⎥⎢⎥⎣⎦,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=1302402121A H 再令(0)2(4,3)T a =,取(0)222||||5d a ==,则(1)2212(2)22121,3)||||T a d e u a d e -==--2224312345TH E u u ⎡⎤=-=⎢⎥-⎣⎦令2210014305534055H H ⎡⎤⎢⎥⎢⎥⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥-⎣⎦于是21212051002H H A R ⎡⎤⎢⎥=-=⎢⎥⎢⎥-⎣⎦故123405521243005155002100T TA H H R ⎡⎤-⎢⎥⎡⎤⎢⎥⎢⎥⎢⎥==-⎢⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎢⎥⎢⎥⎣⎦方法2:利用平面旋转阵进行QR 分解. 取1202,0100221221=+==+=s c ,则130********T ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦,132********T A ⎡⎤⎢⎥=-⎢⎥⎢⎥--⎣⎦再取53)3(43,54)3(44222222-=-+-==-+=s c ,则231004305534055T ⎡⎤⎢⎥⎢⎥⎢⎥=-⎢⎥⎢⎥⎢⎥⎣⎦,2313212051002T T A R ⎡⎤⎢⎥=-=⎢⎥⎢⎥-⎣⎦ 故13233405521243005155002100T T A T T R ⎡⎤-⎢⎥⎡⎤⎢⎥⎢⎥⎢⎥==-⎢⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎢⎥⎢⎥⎣⎦例7-13 求矩阵⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=110133044A 地QR 分解,使得R 地对角线元素为正数.解 A A =1地第一列T x ]0,3,4[1=,521=x .用1x 构造镜面反射阵1H ,使得T y x H ]0,0,5[111==,令T y x u ]0,3,1[111-=-=,有⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-=-=10005453053542221111u u u E H T ,⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-==11054005355112A H A 2A 地第2列对角线以下为T x ]1,0[2=,122=x .用2x 构造镜面反射阵2~H ,使得T y x H ]0,1[~222==,令T y x u ]1,1[222-=-=,易得 ⎥⎦⎤⎢⎣⎡=-=01102~222222u u u E H T,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡=010100001~122H H 于是有R A H A =⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-==54001105355333,⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-==010540535305421H H Q容易验证,QR A =.请读者用平面旋转变换对本例地矩阵A 进行QR 分解.7.5.3 QR 算法QR 算法就是利用QR 分解构造一个矩阵序列{}k A ,当k 充分大时,k A 是近似地上三角矩阵,而该上三角阵地对角元素便是原始矩阵A 地全部特征值.设1()n n ij n n A A a R ⨯⨯==∈,对A 做QR 分解,即A QR =其中R 为上三角阵,Q 为正交阵.利用这个分解可得新矩阵(对QR 交换乘积)2T A RQ Q AQ == 由于2A 是1A 经过正交相似变换得到地,因此2A 与1A 有相同地特征值.再对2A 做QR 分解,按上述方式又可得新矩阵3A ,且3A 与2A 也具有相同地特征值.具体地说,其步骤为:设1A A =,做QR 分解111A Q R =求矩阵211111T A R Q Q A Q ==求得k A 后对k A 作QR 分解k k k A Q R =求矩阵1Tk k k k k k A R Q Q A Q +==只要A 可逆,由定理9可知,按上述方法可唯一确定矩阵序列{}k A ,且序列中任意k A 与原始矩阵有相同特征值.因此只要恰当选择正交相似变换阵12,,,k Q Q Q ,使1111111T T TT TT T k k k k k k k k k k k k k k A Q A Q Q Q A Q Q Q Q Q A Q Q Q +----====当k →∞时,逼近一个上三角阵,便可求出A 地全部特征值(为所逼近上三角阵地主对角元素).可见,QR 算法地关键在于选择正交变换阵(1,2,)k Q k =.从定理7-8地证明看到,正交变换阵k Q 是一系列平面转换矩阵地乘积,这些平面旋转矩阵是用来将k A 地主对角线以下元素约化为零地.如果将QR 算法直接应用于原始矩阵,计算量很大,所以在实际计算中,总是先将原始矩阵用豪斯赫尔德方法约化为上Hessenberg 阵,而后再对上Hessenberg 阵应用QR 算法.可以证明,由上Hessenberg 阵用QR 算法生成地矩阵序列中地每个矩阵仍为上Hessenberg 阵.7.5 雅可比方法雅可比方法是用来计算实对称矩阵地全部特征值及特征向量地一种有效方法.它地基本思想是,通过一组正交相似变换对称矩阵A 化为对角矩阵,得其全部特征值.定理7-10 设A 为n 阶对称矩阵,T C PAP =,其中P 为正交矩阵,则22||||||||F F C A = 证明 一方面2222111||||()()nnnFiji i j i A a tr A A λ======∑∑∑另一方面2221||||()()()nTFi i C tr C C tr C C λ====∑由假设()()i i A C λλ=,故22||||||||F F C A =.设n n A R ⨯∈为对称矩阵,(,)P i j 为一平面旋转矩阵,则T C PAP =(其中()ij n n C c ⨯=)地元素计算公式为:(1)22cos sin 2sin cos ii ii jj ij c a a a θθθθ=++22sin cos 2sin cos jj ii jj ij c a a a θθθθ=+-(2)1()sin 2cos 22ij ji jj ii ij c c a a a θθ==-+ (3)第i 行元素和第j 列元素cos sin (,)ik ki ik jk c c a a k i j θθ==+≠ (4)第j 行元素和第i 列元素 cos sin (,)jk kj jk ik c c a a k i j θθ==+≠(5)(,,)lk lkc a l k i j =≠这说明,当A 经过一初等正交相似变换化为C 时,只需按上述公式计算C 地第i 列.第j 列元素,由对称性可得第i 行和第j 行元素,C 地其余元素与A 地对应元素相同.设A 地非对角元素0ij a ≠,我们可选择平面旋转阵(,)P i j ,使T C PAP =地非对角元素0ij ji c c ==.由定理11可选择(,)P i j ,使sin 2cos 202jj iiij ji ij a a c c a θθ-==+=即选择θ,使22(||)4ij ii jja tg a a πθθ=≤-其中定理7-11 设n n A R ⨯∈为对称阵,0ij a ≠为A 地一个非对角元素,则可选择一平面旋转阵(,)P i j ,使T C PAP =地非对角元素0ij ji c c ==且T C PAP =与A 地元素满足下述关系(1)2222(,)ik jk ik jkc c a a k i j +=+≠(2)222222ii jj ii jj ij c c a a a +=++ (3)22(,,)iklk c a l k i j =≠证明 由上面地计算ij c 公式直接计算可知(1)成立.由(1)及定理7-10可证(2).如果用()S A 表示A 地非对角线元素地平方和,()D A 表示A 地对角线元素平方和,则2()()2ijD C D A a =+ ,2()()2ij S C S A a =- 这说明C 地对角线元素平方和比A 地对角线元素平方和增加了22ij a ,C 地非对角线元素平方和比A 地非对角线元素平方和减少了22ij a .下面介绍雅可比方法.首先在A 地非对角元素中选择绝对值最大地元素(称为主元素),如11||max ||i j lk l ka a ≠=可设110i j a ≠,否则A 已经对角化了.由定理12,选择一平面旋转矩阵111(,)P i j ,使111TAP AP =地非对角元素11110i j j i c c ==. 再选(1)1()lkn n A a ⨯=地非对角元素中地主元素,如 22(1)(1)||max ||0i j lk l ka a ≠=≠由定理12,又可选择一平面旋转矩阵222(,)P i j ,使2212T A P A P =地非对角元素2222(2)(2)i j j i a a ==(注意上次消除了地主元素这次又可能变为不是零). 继续这个过程,连续对A 实行一系列平面旋转变换,消去非对角线绝对值最大地元素,直到将A 地非对角元素全化为充分小为止,从而求得A 地全部(近似)特征值.定理7-12 (雅可比方法地收敛性)设()ij n n A a ⨯=为实对称矩阵,对A 施行上述一系列平面旋转变换1(1,2,)Tm m m mA P A P m -==则 lim ()m m A D→∞=对角矩阵证明 记()()m m lk n n A a ⨯=,()2()m m lk l kS a ≠=∑由定理7-11地(2)可得()212()m m m ij S S a +=-其中 ()()||max ||m m ijlk l ka a ≠= 又由于()2()2()(1)()m m m lk ij l kS a n n a ≠=≤-∑即()2()(1)m m ij S a n n ≤- 由以上得12(1)(1)m m S S n n +≤-- 反复应用上式,即得1102(1)(2)(1)m m S S n n n ++≤->-故 lim 0m m S →∞= 可以证明()lim m ll m a →∞存在(1,2,,)l n =. 下面介绍特征向量地计算.由雅可比收敛定理知,当m 充分大时2112T TTmm P P P AP P P D ≈记12T T T T m m R P P P =,则T m R 地列向量就是A 地近似特征向量.计算Tm R 可采用累积地办法,用一数组R 保存Tm R ,开始时R E ←,以后对A 每进行一次平面旋转变换,就进行计算Tm R RP ←用初等正交阵T m P 右乘R 只需计算R 地两列元素,若记(,)m m P P i j =,则Tm RP 地计算公式为()()cos ()sin (1,,)()()sin ()cos li li lj li li lj l n θθθθ←+⎧⎪=⎨←+⎪⎩R R R R R R关于sin θ和cos θ地计算如下.由定理7-11知,当0ij a ≠时,可选θ满足2tg2ij ii jja a a θ=-方ii jj a a ≠时,由22tg 1tg21tg dθθθ=≡- 得到tg θ地二次方程2tg 2tg 10d θθ+-=解得tg θ=选取tg 0d d θ>=<由此得 |tg |1θ≤可由集合{},,ii jj ij a a a 来计算sin ,cos θθ,设0,||max ||ij ij lk l ka a a ≠≠=,则210tg ,()10cos sin cos ii jj ija a d a d t s d d c t ct sθθθθ-⎧=⎪⎪⎪≥⎧⎪=≡=⎨-<⎨⎩⎪⎪=≡⎪⎪=⋅=≡⎩如果jj ii ij a a a -<<,则12ij ii jja t d a a ≈=-,将c,s 代入定理7-9地(1)中可得ii ii ij jj jj ij ij ji c a ta c a ta c c ⎧=+⎪=-⎨⎪==⎩ 每迭代一次地主要工作是选m A 地非对角线元素中地主元素与计算T 111m m m +++=A P AP .首先计算sin ,cos ,θθ,只需计算1m +A 地第i 列,第j 列元素,再算对称元素,不用做3个矩阵地乘法.计算机计算时,需要两组工作单元,以便存储A (或m A )和R .可用()2()m m lk l ka ε≠=<∑S 控制迭代终止,其中ε是要求地精度.例7-14 用雅可比方法计算对称阵210121012⎡⎤-⎢⎥--⎢⎥⎢⎥-⎣⎦A = 地特征值.解 第1步0=A A ,选非对角线元素中地主元素121(1,2)a i j =-==0,1,1/0.7071068,1/0.7071068d t c s ======T 111100.7071068030.70710680.70710680.70710682⎡⎤-⎢⎥==-⎢⎥⎢⎥--⎣⎦A P AP第2步 在1A 中选非对角元素地主元素(1)130.7071068(1,3)a i j =-==0.7071068,0.5176381,0.8880738,0.4597008d t c s ====T 22120.63397460.325057600.325057630.627963000.62798302.366025-⎡⎤⎢⎥=--⎢⎥⎢⎥-⎣⎦A P A P 第3步 在2A 中选非对角元素地主元素(2)230.627930(2,3)a i j =-==0.5047869,0.6153960,0.8516540,0.5241045d t c s =-=-==-T 33230.63397460.27683660.17036420.27683663.38644600.170364201.979579⎡⎤--⎢⎥=-⎢⎥⎢⎥-⎣⎦A P A P 第4步 在3A 中选非对角元素地主元素(3)120.2768366(1,2)a i j =-==4.971292,0.09958013,0.9950785,0.09909004d t c s ====T 44340.606407200.169525803.4140130.016881400.16952580.016881401.979579⎡⎤-⎢⎥=⎢⎥⎢⎥-⎣⎦A P A P 第5步 在4A 中选非对角元素地主元素(4)130.1695258(1,3)a i j =-==4.050038,0.1216293,0.9926842,0.1207395d t c s ==== 2T 255450.58578790.20382521000.203825210 3.4140130.0167579000.016757902.000198--⎡⎤⨯⎢⎥=⨯⎢⎥⎢⎥⎣⎦A P A P 于是A 地特征值为1233.414013, 2.000198,0.5857879λλλ===A 地精确特征值为12(1 3.414214λ=≈,22λ=,32(10.585786λ=-≈ 且可逐步求出412345T T T T T T R P P P P P =地列向量,即得A 地近似特征向量.雅可比方法是一个求对称矩阵A 地全部特征值及特征向量地迭代方法,精确度较高,但计算量较大,对稀松带状矩阵经过平面旋转变换后其稀松带状将被破坏,所以很少使用.习题71.设911203111(2102113810A j j B ⎡⎤⎡⎤⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦试估计它们地特征值所在地范围.2.编写幂法程序,并求矩阵732341213A -⎡⎤⎢⎥=⎢⎥⎢⎥--⎣⎦地主特征值及对应地特征向量(准确到小数点后3位).3.若p 是A 地特征值j λ地一个近似值,且||||()j i p p i j λλ-<-≠则1j pλ-是1()A pE --地主特征值.试用反幂法求矩阵134231111A ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦地最接近于6地特征值及对应地特征向量.4.设有向量(2,1,2)Tx=,试构造初等反射阵H,使(3,0,0)THx=.5.设(2,3,0,5)Tx=,(1,0,0,5)Te=,用Householder变换化x为与e同方向向量.6.设031042212A⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦,求其QR分解.7.设221022212A⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦,求其QR分解.8.利用初等反射阵将134312421A⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦正交相似约化为对称三对角阵.9.试用平面旋转变换阵对矩阵A作QR分解,其中111021245A⎡⎤⎢⎥=-⎢⎥⎢⎥-⎣⎦.10.按下列要求编写程序框图.(1)将一般矩阵用豪斯赫尔德方法约化称上Hessenberg阵.(2)对矩阵作QR分解.(3)对上Hessenberg阵应用QR算法求全部特征值及相应地特征向量.11.用QR算法求矩阵120211013A⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦地全部特征值.12.设A是对称矩阵,λ和(1)x x=是A地一个特征值及相应地特征向量.又设p是一个正交阵,使1(1,0,0,,0)Tpx e==证明T=是第一行和第一列除了λ外,其余元素均为零.B PAP。

数值分析-第7章 矩阵特征值问题的数值解法n

数值分析-第7章 矩阵特征值问题的数值解法n
(-3.406542,-2.460280, 6.920561) (-2.832406, -2.028615, 6.210333)
7
9 11 12
6.104716
6.026349 6.006637 6.003327
(-0.450275, -0.322058, 1.0)
(-0.445914, -0.318617, 1.0) (-0.444814, -0.31775, 1.0) (-0.444630, -0.317606, 1.0)
其中i为A的特征值,P的各列为相应于i的特征向量。
P -1 AP D
2

n
2
定理7.1.3 ARnn,1, …, n为A的特征值,则
(1)A的迹数等于特征值之和,即 tr ( A) aii i
i 1 i 1
n
n
(2)A的行列式值等于全体特征值之积,即
1 xi(k +1) / xi(k )
i 1,2,, n
可见,当k充分大时, ( k ) 近似于主特征值, ( k +1) 与x ( k )的对应非零分量的比值 x x 近似于主特征值。
在实际计算中需要对计算结果进行规 , 范化。因为当 1 1时,x (k ) 趋于零, 当1 1时, x ( k )的非零分量趋于无穷。 从而计算时会出现下溢 或上溢。
特征值的范围. 解 我们先分别求出各个圆盘区域。 D1 = {z:|z – 1|£0.6};D2 = {z:|z – 3|£0.8} D3 = {z:|z + 1|£1.8};D4 = {z:|z + 4|£0.6}. 易见D2和D4为 弧立圆盘分别 包含A的两个实 特征值.

第7章 矩阵特征值和特征向量的数值解法

第7章 矩阵特征值和特征向量的数值解法

n
i xi
i 1
n
i Ak xi
i 1
n
ii k xi
i 1
1k [1x1
n i ( i )k
i2
1
xi ]
(7.1.4)
主要用于求矩阵按模最大的特征值和相应的特征向量。设矩阵 A 的
n 个特征值 i (i 1,2,..., n) 满足:
| 1 || 2 || 3 | . . .| n | (7.1.1)
3 2.689 319 6.737 850 6.747 559 0.398 562 0.998 561 1.000 000
4 1.595 686 2.379 870 2.381 309 0.670 088 0.999 396 1.000 000
5 2.680 956 6.772 616 6.723 220 0.398 761 0.999 910 1.000 000
7 9.605 572,5.817 228,-3.778 139 1.000 000,0.605 777,-0.394 369 9.605 572
8 9.605 567,5.816 808,-3.788 717 1.000 000,0.605 566,-0.394 429 9.605 567
由表 7.1.1 知, m8 m8 105 ,故取 1 m8 9.605567 ,
u(k) ma x(u
(k
)
)
的最大分量为
1,即完成了规范化。
7.1.1 幂法原理及实用幂法
由于 v(k) 中最大分量为 1,即 max( v(k) )=1,故
v(k)
Ak u ( 0) max( Aku(0) )
(7.1.6)
由式(7.1.4)有

现代科学工程计算基础课后答案

现代科学工程计算基础课后答案

现代科学工程计算基础课后答案《现代科学与工程计算基础》较为详细地介绍了科学与工程计算中常用的数值计算方法、基本概念及有关的理论和应用。

全书共分八章,主要内容有误差分析,函数的插值与逼近,数值积分与数值微分,线性代数方程组的直接解法与迭代解法,非线性方程及非线性方程组的数值解法,矩阵特征值和特征向量的数值解法,以及常微分方程初、边值问题的数值解法等。

使用对象为高等院校工科类研究生及理工科类非“信息与计算科学”专业本科生,也可供从事科学与工程计算的科技工作者参考。

《现代科学与工程计算基础》讲授由浅人深,通俗易懂,具备高等数学、线性代数知识者均可学习。

基本信息出版社: 四川大学出版社; 第1版 (2003年9月1日)平装: 378页语种:简体中文开本: 32ISBN: 7561426879条形码: 9787561426876商品尺寸: 20 x 13.8 x 1.6 cm商品重量: 399 g品牌: 四川大学出版社ASIN: B004XLDT8C《研究生系列教材:现代科学与工程计算基础》是我们在长期从事数值分析教学和研究工作的基础上,根据多年的教学经验和实际计算经验编写而成。

其目的是使大学生和研究生了解数值计算的重要性及其基本内容,熟悉基本算法并能在计算机上实现,掌握如何构造、评估、选取、甚至改进算法的数学理论依据,培养和提高读者独立解决数值计算问题的能力。

目录第一章绪论§1 研究对象§2 误差的来源及其基本概念2.1 误差的来源2.2 误差的基本概念2.3 和、差、积、商的误差§3 数值计算中几点注意事项习题第二章函数的插值与逼近§1 引言1.1 多项式插值1.2 最佳逼近1.3 曲线拟合§2 Lagrange插值2.1 线性插值与抛物插值2.2 n次Lagrange插值多项式2.3 插值余项§3 迭代插值§4 Newton插值4.1 Newton均差插值公式4.2 Newton差分插值公式§5 Hermite插值§6 分段多项式插值6.1 分段线性插值6.2 分段三次Hermite插值§7 样条插值7.1 三次样条插值函数的定义7.2 插值函数的构造7.3 三次样条插值的算法7.4 三次样条插值的收敛性§8 最小二乘曲线拟合8.1 问题的引入及最小二乘原理8.2 一般情形的最小二乘曲线拟合8.3 用关于点集的正交函数系作最小二乘拟合8.4 多变量的最小二乘拟合§9 连续函数的量佳平方逼近9.1 利用多项式作平方逼近9.2 利用正交函数组作平方逼近§10 富利叶变换及快速富利叶变换10.1 最佳平方三角逼近与离散富利叶变换10.2 快速富利叶变换习题第三章数值积分与数值微分§1 数值积分的基本概念1.1 数值求积的基本思想1.2 代数精度的概念1.3 插值型求积公式§2 等距节点求积公式2.1 Newton—CoteS公式2.2 复化求积法及其收敛性2.3 求积步长的自适应选取§3 Romberg 求积法3.1 Romberg求积公式3.2 Richardson外推加速技术§4 Gauss型求积公式4.1 Gauss型求积公式的一般理论4.2几种常见的Gauss型求积公式§5 奇异积分和振荡函数积分的计算5.1 奇异积分的计算5.2 振荡函数积分的计算§6 多重积分的计算6.1 基本思想6.2 复化求积公式6.3 Gauss型求积公式§7 数值微分7.1 Taylor级数展开法7.2 插值型求导公式习题第四章解线性代数方程组的直接法§1 Gauss消去法§2 主元素消去法2.1 全主元素消去法2.2 列主元素消去法§3 矩阵三角分解法3.1 Doolittle分解法(或LU分解)3.2 列主元素三角分解法3.3 平方根法3.4 三对角方程组的追赶法§4 向量范数、矩阵范数及条件数4.1 向量和矩阵的范数4.2 矩阵条件数及方程组性态习题第五章解线性代数方程组的迭代法§1 Jacobi迭代法§2 Gauss-Seidel迭代法§3 超松弛迭代法§4 共轭梯度法习题第六章非线性方程求根§1 逐步搜索法及二分法1.1 逐步搜索法1.2 二分法§2 迭代法2.1 迭代法的算法2.2 迭代法的基本理论2.3 局部收敛性及收敛阶§3 迭代收敛的加速3.1 松弛法3.2 Aitken方法§4 New-ton迭代法4.1 Newton迭代法及收敛性4.2 Newton迭代法的修正4.3 重根的处理§5 弦割法与抛物线法5.1 弦割法5.2 抛物线法§6 代数方程求根6.1 多项式方程求根的Newton法6.2 劈因子法§7 解非线性方程组的Newton迭代法习题……第七章矩阵特征值和特征向量的计算第八章常微方分程数值解法附录参考文献欢迎下载,资料仅供参考!!!资料仅供参考!!!资料仅供参考!!!。

矩阵特征值的数值解法

矩阵特征值的数值解法

矩阵特征值的数值解法矩阵的特征值是在矩阵与其特征向量之间的关系中的数值解。

特征值在各个领域中都有广泛应用,包括物理、工程、金融等。

在解决实际问题时,我们经常需要计算矩阵的特征值,因此研究如何求解矩阵特征值的数值方法是非常重要的。

1. 幂迭代法(Power Iteration)幂迭代法是求解矩阵特征值的一种简单而常用的数值方法。

它的基本思想是通过不断迭代矩阵与向量的乘积,使得向量趋近于该矩阵的一个特征向量。

具体步骤如下:(1)初始化一个非零的初始向量x。

(2)进行迭代计算,即$x^{(k+1)}=Ax^{(k)}/,Ax^{(k)},$。

(3)当向量x的相对误差小于一些预设的精度要求时,停止迭代,此时的x即为矩阵A的一个特征向量。

(4)将x带入特征值的定义式$\frac{Ax}{x}$,计算出特征值。

幂迭代法的优点是简单易实现,计算速度较快,缺点是只能求解特征值模最大的特征向量,而且对于存在特征值模相近的情况,容易收敛到错误的特征值上。

2. QR迭代法(QR Iteration)QR迭代法是一种较为稳定的求解矩阵特征值的数值方法。

它的基本思想是通过不断进行QR分解,使得矩阵的特征值逐渐收敛。

具体步骤如下:(1)将矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R,令$A_1=RQ$。

(2)将$A_1$再次进行QR分解,得到新的矩阵$A_2=R_1Q_1$。

(3)重复步骤(2),直到得到收敛的矩阵$A_k$,此时$A_k$的对角线上的元素即为矩阵A的特征值。

QR迭代法的优点是对于特征值模相近的情况仍然能够收敛到正确的特征值上。

缺点是每次QR分解都需要消耗大量的计算量,迭代次数较多时计算速度较慢。

3. Jacobi迭代法(Jacobi's Method)Jacobi迭代法是一种通过对称矩阵的对角线元素进行迭代操作,逐步将非对角元素变为零的求解特征值的方法。

具体步骤如下:(1)初始化一个对称矩阵A。

数值分析期末复习资料

数值分析期末复习资料

数值分析期末复习题型:一、填空 二、判断 三、解答(计算) 四、证明第一章 误差与有效数字一、 有效数字1、 定义:若近似值x*的误差限是某一位的半个单位,该位到x*的第一位非零数字共有n 位,就说x*有n 位有效数字。

2、 两点理解:(1) 四舍五入的一定是有效数字(2) 绝对误差不会超过末位数字的半个单位eg. 3、 定理1(P6):若x*具有n 位有效数字,则其相对误差限为 4、 考点:(1)计算有效数字位数:一个根据定义理解,一个根据定理1(P7例题3)二、 避免误差危害原则 1、 原则:(1) 避免大数吃小数(方法:从小到大相加;利用韦达定理:x1*x2= c / a )(2) 避免相近数相减(方法:有理化)eg. 或(3) 减少运算次数(方法:秦九韶算法)eg.P20习题14三、 数值运算的误差估计 1、 公式:(1) 一元函数:|ε*( f (x *))| ≈ | f ’(x *)|·|ε*(x )|或其变形公式求相对误差(两边同时除以f (x *))eg.P19习题1、2、5(2) 多元函数(P8)eg. P8例4,P19习题4*(1)11102n r a ε--≤⨯;x εx εx εx ++=-+();1ln ln ln ⎪⎪⎭⎫ ⎝⎛+=-+x εx εx x cos 1-2sin 22x =第二章 插值法一、 插值条件1、 定义:在区间[a,b]上,给定n+1个点,a ≤x 0<x 1<…<x n ≤b 的函数值yi=f(xi),求次数不超过n 的多项式P(x),使 2、 定理:满足插值条件、n+1个点、点互异、多项式次数≤n 的P(x)存在且唯一二、 拉格朗日插值及其余项1、 n 次插值基函数表达式(P26(2.8))2、 插值多项式表达式(P26(2.9))3、 插值余项(P26(2.12)):用于误差估计4、 插值基函数性质(P27(2.17及2.18))eg.P28例1三、 差商(均差)及牛顿插值多项式 1、 差商性质(P30):(1) 可表示为函数值的线性组合(2) 差商的对称性:差商与节点的排列次序无关 (3) 均差与导数的关系(P31(3.5)) 2、 均差表计算及牛顿插值多项式四、埃尔米特插值(书P36) 两种解法:(1) 用定义做:设P 3(x)=ax 3+bx 2+cx+d ,将已知条件代入求解(4个条件:节点函数值、导数值相等各2个)(2) 牛顿法(借助差商):重节点eg.P49习题14 五、三次样条插值定义n i y x P ii n ,,2,1,0)( ==(1) 分段函数,每段都是三次多项式(2) 在拼接点上连续(一阶、二阶导数均连续) (3)考点:利用节点函数值、导数值相等进行解题第三章 函数逼近与曲线拟合一、 曲线拟合的最小二乘法解题思路:确定ϕi ,解法方程组,列方程组求系数(注意ϕi 应与系数一一对应)eg.P95习题17 形如y=ae bx 解题步骤: (1) 线性化(2)重新制表(3)列法方程组求解(4)回代第四章 数值积分与数值微分一、 代数精度 1、 概念:如果某个求积公式对于次数不超过m 的多项式准确成立,但对于m+1次多项式不准确成立,则称该求积公式具有m 次代数精度2、 计算方法:将f(x)=1,x,x 2, …x n 代入式子求解 eg.P100例1二、 插值型的求积公式求积系数定理:求积公式至少具有n 次代数精度的充要条件是:它是插值型的。

矩阵方程的数值解法[文献综述]

矩阵方程的数值解法[文献综述]

文献综述信息与计算科学矩阵方程的数值解法一. 前言部分在科学、工程计算中,求解矩阵方程的任务占相当大的份额。

这是因为,矩阵方程不仅能以完整的形式作为许许多多实际问题的模型之一,而且还能作为不少其他数值方法处理过程中转化而成的组成部分。

例如,在电路网络、弹性力学、潮流计算、热传导、振动等领域,其基本模型就是矩阵方程,而求微分方程边值问题的差分法和有限元法等数值计算本身,也导致求解某些矩阵方程。

在系统控制等工程研究领域经常遇到矩阵方程的求解问题。

自动控制系统最重要的一个特征是稳定性问题,它表示系统能妥善地保持预定工作状态,耐受各种不利因素的影响,因此矩阵方程在系统的稳定性理论,极点配置等方面具有重要的意义。

在常微分方程的定性研究以及数值求解常微分方程的隐式Rung-kwtta 方法和块方法中,也需要求解矩阵方程。

此外,在广义特征值问题的摄动研究中及隐式常微分方程的数值解中,经常遇到矩阵方程的求解问题。

随着科学技术的迅速发展,矩阵方程越来越多地出现在科学与工程计算领域,关于这类问题的研究也日益受到人们的高度重视.对矩阵方程的研究具有很重要的理论意义和应用价值。

本文主要考虑形如B AX =的矩阵方程的数值解法,其中nn R A ⨯∈.,m n R B X ⨯∈由于线性方程组b Ax =, 其中n n R A ⨯∈,n R b ∈是矩阵方程B AX =的一个特例,所以本文试图将解线性方程组的一些经典方法,如高斯消元法、Jacobi 迭代法、Gauss-Seidcl 迭代法和SOR 迭代方法,推广用来解矩阵方程。

在这些方法的基础上,利用matlab 软件编程快速求出矩阵方程的解,并比较各种方法的优劣。

解上述线性方程组数值的数值方法主要有如下两类:(1)直接法: 就是在没有舍入误差的情况下, 通过有限步的代数运算可以求得方程组准确解的方法, 但由于实际计算中舍入误差是客观存在的, 因而使用此类方法也只能得到近似解。

特征值法

特征值法

特征值法对元素为实数或复数的n×n矩阵A,求数λ和n维非零向量x使A x=λx,这样的问题称为代数特征值问题,也称矩阵特征值问题,λ和x分别称为矩阵A的特征值和特征向量。

代数特征值问题的数值解法是计算数学的主要研究课题之一,它常出现于动力系统和结构系统的振动问题中。

在常微分方程和偏微分方程的数值分析中确定连续问题的近似特征系,若用有限元方法或有限差分方法求解,最终也化成代数特征值问题。

此外,其他数值方法的理论分析,例如确定某些迭代法的收敛性条件和初值问题差分法的稳定性条件,以及讨论计算过程对舍入误差的稳定性问题等都与特征值问题有密切联系。

求解矩阵特征值问题已有不少有效而可靠的方法。

矩阵A的特征值是它的特征多项式P n(λ)det(λI-A)的根,其中I为单位矩阵。

但阶数超过4的多项式一般不能用有限次运算求出根,因而特征值问题的计算方法本质上是迭代性质的,基本上可分为向量迭代法和变换方法两类。

向量迭代法是不破坏原矩阵A,而利用A对某些向量作运算产生迭代向量的求解方法,多用来求矩阵的部分极端特征值和相应的特征向量,特别适用于高阶稀疏矩阵。

乘幂法、反幂法都属此类,隆措什方法也常作为迭代法使用。

变换方法是利用一系列特殊的变换矩阵(初等下三角阵、豪斯霍尔德矩阵、平面旋转矩阵等),从矩阵A出发逐次进行相似变换,使变换后的矩阵序列趋于容易求得特征值的特殊形式的矩阵(对角阵、三角阵、拟三角阵等);多用于求解全部特征值问题,其优点是收敛速度快,计算结果可靠,但由于原矩阵A被破坏,当A是稀疏矩阵时,在计算过程中很难保持它的稀疏性,因而大多数变换方法只适于求解中小规模稠密矩阵的全部特征值问题。

雅可比方法、吉文斯-豪斯霍尔德方法以及LR方法、QR方法等都属此类。

乘幂法计算矩阵的按模最大的特征值及对应特征向量的一种向量迭代法。

设A为具有线性初等因子的矩阵,它的n个线性无关的特征向量是u i(i=1,2,…,n),特征值排列次序满足是一个n维非零向量,于是若λ1>λ2,则当α1≠0,且k足够大时,A k z0除相差一个纯量因子外趋于λ1所对应的特征向量,这就是乘幂法的基本思想。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实际计算时,常把每一 步计算的迭代向量 (k ) 规范化。 x
为此, 记 max(x) xi , 其中xi x .这样, 我们有
如下实用的幂法计算公式:
(k ) x (k ) y max(x ( k ) ) (k 0,1,2.) x ( k +1) Ay ( k )
i 1 i 1 i 1
n ( Ax, x) ( i i xi , i xi ) i 1 i2
i 1 2 i
n
n
n
n
n
i 1
i 1
i 1
2 i
i 1
由式(1)的证明,易见式(2)和式(3)成立。定理得证。
4
定理7.1.5 (Gerschgorin圆盘定理) 设ARnn,则 (1)A的每一个特征值必属于下述某个圆盘之中,
(7.2.4)
max(x ( 0) ) 1
y (0) x (0) max(x (0) ) (1, 1, 1) T
x (1) Ay (0) (10, 8, - 7) T
11
k
max(x(k))
y(k) = x(k)/max(x(k))
x(k+1) = Ay (k)
0
1
1
10
(1, 1, 1)
(1, 0.8, -0.7)
(10, 8, -7)
(7.2, 5.4, -10.4)
2
3 5
-10.4
8.230769 6.430115
(-0.692308 -0.519231, 1.0)
(-0.546729, -0.399533, 1.0) (-0.467815, -0.335976, 1.0)
(-4.5, -3.288462, 8.230769)
7
k n 2 x ( k ) 1 [a1v1 + a 2 ( 1 ) k v 2 + + a n ( 1 ) k v n ]
k 若a10, 则对充分大的k有 x ( k ) 1 a1v1 从而知x(k)是属于λ1的特征向量.
因而有
k x ( k +1) 1 +1a1v1 1 x ( k )
lim y
k (k ) r

i 1
ci v i
r i 1
max( ci v i )
, lim max(x ( k ) ) 1。
k
可见, y ( k ) 仍收敛于一个主特征向 量。
算法7.1 幂法 (1)输入矩阵A,非零初始向量x(0),最大迭代次数N,精度 , 置k=0,u=0; (2) 计算 mk = max (x(k)); (3)计算 y ( k ) x ( k ) / mk
det(A) 12 n
定义7.1.2 设矩阵ARnn为对称矩阵,对于任一非零向量x,称
( Ax, x ) R( x ) ( x, x )
为对应于向量x的Rayleigh商.
3
定理7.1.4 设ARnn为对称矩阵,其特征值1≥2≥…≥n,对应特征 向量x1,x2,...,xn组成规范正交向量组,则有 (1)对任意xRn,x≠0,有
(-2.707710, -1.935377, 6.052479)
(-2.676980, -1.912449, 6.013229) (-2.669257, -1.906692, 6.003327)
可取 1 6.003327, y(12)(-0.444630, -0.317606, 1.0)T.
12
7.2.2 幂法的加速技术
由于
mk max(x
(k )
) 1 + o(
2 k 1
)
所以,幂法收敛速度取决于比值|2/1|,当|2/1|1时,收敛是很慢的. 1. Aitken 加速方法 由上式可知 解之得
mk + 2 - 1 mk +1 - 1 mk +1 - 1 mk - 1
设 xi max x k x 1 k n
( - aii ) xi

考虑第i个方程
- aii
j 1, j i
a
j 1
n
ij
x j x i
n
j 1, j i
a
n
ij
xj

n
a ij x j xi

j 1, j i

a ij
xj xi

j 1, j i
2 mk + 2 mk - mk +1 (mk +1 - mk ) 2 1 mk mk + 2 - 2mk +1 + mk mk + 2 - 2mk +1 + mk
(mk +1 - mk ) 2 ~ mk mk mk + 2 - 2mk +1 + mk 会达到加速收敛的目的.
构造Aitken序列
产生迭代序列x(k).
由于v1,v2,…vn 线性无关, 从而有 x(0) =a1v1+a2v2+…+anvn 故有 x(k) = Akx(0) =a11kv1+a22kv2+…+annkvn
k n 2 x ( k ) 1 [a1v1 + a 2 ( 1 ) k v 2 + + a n ( 1 ) k v n ]
特征值的范围. 解 我们先分别求出各个圆盘区域。 D1 = {z:|z – 1|£0.6};D2 = {z:|z – 3|£0.8} D3 = {z:|z + 1|£1.8};D4 = {z:|z + 4|£0.6}. 易见D2和D4为 弧立圆盘分别 包含A的两个实 特征值.
D4
D3
D1
D2
6
7.2
1 xi(k +1) / xi(k )
i 1,2,, n
可见,当k充分大时, ( k ) 近似于主特征值, ( k +1) 与x ( k )的对应非零分量的比值 x x 近似于主特征值。
在实际计算中需要对计算结果进行规 , 范化。因为当 1 1时,x (k ) 趋于零, 当1 1时, x ( k )的非零分量趋于无穷。 从而计算时会出现下溢 或上溢。
(7.2.4)
8
定理7.2.1 设AÎ n×n的特征值i (i = 0,1,2,…)满足式(7.2.1),且 R 对应n个线性无关的特征向量v1, v2, …,vn,任给初始向量
x
(0)
ai v i
( a1 0),则由式(7.2.4)生成的向量序列 i 1 有) v1 (k lim y lim max( x ( k ) ) 1 k
其中i为A的特征值,P的各列为相应于i的特征向量。
P -1 AP D
2

n
2
定理7.1.3 ARnn,1, …, n为A的特征值,则
(1)A的迹数等于特征值之和,即 tr ( A) aii i
i 1 i 1
n
n
(2)A的行列式值等于全体特征值之积,即
x ( k +1) Ay ( k )
(4) 若 |mk-u|< , 则输出mk , y(k) , 停算; (5)若k=N,则停算,输出计算失败信息;否则,置k=k+1, u=mk, 转步2;
10
- 4 14 0 例7.2.1 设 A - 5 13 0 - 9 0 2
1 [a1v1 + a i (
k
max(x ( k ) ) max(Ay ( k -1) ) max(A
v1 max(Av1 ) ) max(v1 ) max(v1 )

max(1v1 ) 1 (k ) m可见幂法的收敛速度由 2 / 1 的大小确定。 , 如果1 2 ... r,且r r +1 ,可以作类似的分析有 ,
x ( k -1) A max(x ( k -1) ) x (k ) Ay ( k -1) max(x ( k ) ) max(Ay ( k -1) ) x ( k -1) max A max(x ( k -1) )
n
A k x ( 0) max(A k x ( 0) )
(-3.406542,-2.460280, 6.920561) (-2.832406, -2.028615, 6.210333)
7
9 11 12
6.104716
6.026349 6.006637 6.003327
(-0.450275, -0.322058, 1.0)
(-0.445914, -0.318617, 1.0) (-0.444814, -0.31775, 1.0) (-0.444630, -0.317606, 1.0)
7.2.1
幂法和反幂法
幂法
设矩阵A R n*n的n个特征值满足 1 2 ....... n , 对应的特征向量为 v1,v2,…vn 线性无关.
1 和 v1 分别称为主特征值和主特征向量.
幂法的基本思想是取初始向量x(0)Rn,作迭代 x(k+1) =Ax(k) =Ak+1x(0) , k=0,1,2,…
第7章 矩阵特征值问题的数值解法
很多工程计算中,会遇到特征值和特征向量的计算, 如:机械、结构或电磁振动中的固有值问题;物理学中 的各种临界值等。这些特征值的计算往往意义重大。
求解线性方程组的迭代法,重要一点是判断迭 代法的收敛性;判断方法之一就是看迭代矩阵的特 征值的模是否都小于1。 n阶方阵A的特征值是特征方程 det(A-I)=0 的根. A的特征向量是齐次线性方程组 (A-I)x=0 的非零解.
相关文档
最新文档