第9章 矩阵特征值问题的数值方法

合集下载

数值计算方法 9矩阵特征值的数值计算

数值计算方法 9矩阵特征值的数值计算
3. 两步QR算法
两步算法的思路就是先利用初等反射阵批量约化消元的特点,将原始 矩阵用有限次的初等反射变换约化为与之正交相似的上Hessenberg阵, 然后使用平面旋转变换对实施算法构造相似矩阵序列,以求出亦即的 全部特征值。
4. 两步QR算法计算步骤
显然,初等反射矩阵H具有对称性和正交性,这样y=Hx是一个正交变换。 ➢初等反射变换主要用在以下两个方面: 等模反射变换 向量的约化消元
9.3 矩阵的QR分解
9.3.1 矩阵的初等反射变换
等模反射变换 定理9-3(等模反射定理)设x,y是两个互异的n维列向量,且2范数
相等,则存在一个初等反射阵H,使得Hx=y。 例9-11 等模反射变换。注意不唯一性。
p*Leabharlann 22n时,rB
max{ 2 p 1 p
,
n 1
p }最小。 p
例9-6,例9-7 原点平移加速。
2 原点平移的反幂法 ➢幂法与反幂法可以求矩阵的最大和最小特征值,对其他特征值就无
能为力了。但是可以将原点平移技术与反幂法结合起来,就可求 出任一个特征值(如果对所有的特征值有大概的估计的话)。
➢具体的作法:假设A在p附近有一个特征值,做原点平移B=A-pE, 用反幂法求B的最小特征值,给其加上p,就是要求的特征值。
例9-8,例9-9 原点平移加速。
9.3 矩阵的QR分解
9.3.1 矩阵的初等反射变换
➢ 矩阵的初等反射变换,又称镜面反射变换,或Householder(豪斯 荷尔德)变换,是一种正交变换。
9.4 QR算法
9.4.2 两步QR算法 2. 矩阵与上Hessenberg矩阵的正交相似 引入上Hessenberg阵的原因是,若对上Hessenberg阵进行分解,由 于的次对角线以下元素均为零,只需使用次构造方便的平面旋转变换 即可完成分解,显然这要比对一般矩阵进行分解简便得多。利用这个 特点给出的两步算法,可以降低基本算法的计算过程中对矩阵做分解 的计算量。

矩阵的特征值问题求解

矩阵的特征值问题求解

矩阵特征值问题求解矩阵在数学和工程领域有着广泛的应用,而研究矩阵的特征值是其中一个重要的问题。

矩阵的特征值对于矩阵的性质和行为具有重要的影响,因此求解矩阵的特征值是一项非常重要的任务。

什么是特征值和特征向量在矩阵理论中,矩阵A的特征值(eigenvalue)是一个数λ,满足方程$A\\mathbf{v} = \\lambda\\mathbf{v}$的向量$\\mathbf{v}$存在且不为零。

其中,$\\mathbf{v}$被称为对应于特征值$\\lambda$的特征向量(eigenvector)。

特征值和特征向量的求解是矩阵理论和线性代数中的重要问题之一。

特征值问题的求解方法1. 特征值分解我们可以通过特征值分解的方法求解矩阵的特征值。

给定一个方阵A,我们可以将其表示为$A=Q\\Lambda Q^{-1}$的形式,其中Q是由A的特征向量所组成的矩阵,Λ是由A的特征值所组成的对角矩阵。

2. 特征多项式特征值问题的另一种求解方法是通过矩阵的特征多项式。

特征多项式是关于矩阵A的一个多项式,它的根就是矩阵A的特征值。

通过求解特征多项式的根,我们可以得到矩阵的特征值。

3. 幂法幂法是一种常用的求解特征值问题的迭代方法。

通过不断的迭代计算$A\\mathbf{v}^{(k)}$,其中$\\mathbf{v}^{(k)}$是第k次迭代得到的特征向量,我们可以逐渐逼近矩阵的特征值和特征向量。

应用和意义矩阵的特征值问题求解在计算机图形学、信号处理、物理学等领域都有着重要的应用和意义。

通过求解矩阵的特征值,我们可以分析矩阵的性质、系统的稳定性以及模式识别等问题,为我们深入理解和应用矩阵提供了重要的工具和方法。

综上所述,矩阵的特征值问题求解是一个具有重要意义和广泛应用的问题,通过不同的方法和技术,我们可以有效地求解矩阵的特征值和特征向量,为我们更好地理解和利用矩阵提供了重要的支持。

第章矩阵特征值的计算

第章矩阵特征值的计算

第章矩阵特征值的计算矩阵特征值是矩阵理论中的一个重要概念,它在很多领域中都有广泛的应用,如物理、化学、工程等。

本文将从特征值的定义、计算方法和应用举例等方面进行阐述。

一、特征值的定义对于一个n阶方阵A,如果存在一个非零向量x,使得Ax=kx,其中k 是一个常数,那么k称为A的特征值,x称为A的对应于特征值k的特征向量。

从定义可以看出,矩阵A的特征值和特征向量是成对出现的,特征向量可以是一个实数或是一个向量,特征值可以是实数或是复数。

二、特征值的计算方法1.直接计算法此方法适合于较小的矩阵。

给定一个n阶矩阵A,首先构造特征方程det(A-λI)=0,其中I是n阶单位矩阵,λ是未知数,然后求解特征方程得到特征值,将特征值代入(A-λI)x=0求解对应的特征向量。

2.幂法幂法是一种迭代方法,适用于大型矩阵。

假设特征值的绝对值最大,那么从非零向量b开始迭代过程,令x0=b,求解x1=A*x0,然后再将x1作为初始值,求解x2=A*x1,以此类推,直到收敛为止。

最后,取最终得到的向量xn,其模即为特征值的近似值。

3.QR方法QR方法是一种迭代方法,可以用于寻找特征值和特征向量。

首先将矩阵A分解为QR,其中Q是正交矩阵,R是上三角矩阵,然后对R进行迭代,重复进行QR分解,直到收敛。

最后,得到的上三角矩阵的对角元素即为特征值的近似值,在QR分解的过程中,特征向量也可以得到。

三、特征值的应用举例1.物理学中的量子力学量子力学中的哈密顿算符可以表示为一个矩阵,物理量的测量值就是对应的特征值。

例如,电子的自旋可以有上自旋和下自旋两种状态,上自旋对应的特征值为1,下自旋对应的特征值为-12.工程中的振动问题在工程中,矩阵特征值可以用来求解振动问题。

例如,振动系统的自由度决定了特征向量的个数,而特征值则表示了振动的频率。

通过计算矩阵的特征值和特征向量,可以预测系统的振动频率和振型。

3.网络分析中的中心性度量在网络分析中,矩阵特征值可以用来计算节点的中心性度量。

求矩阵特征值的方法

求矩阵特征值的方法

求矩阵特征值的方法矩阵特征值是矩阵理论中的一个重要概念,它在许多领域中都有着广泛的应用,如物理学、工程学、计算机科学等。

求矩阵特征值的方法有多种,下面将介绍其中的三种常用方法。

一、特征多项式法特征多项式法是求矩阵特征值的一种常用方法。

它的基本思想是将矩阵A与一个未知数λ相乘,得到一个新的矩阵B=A-λI,其中I为单位矩阵。

然后求解矩阵B的行列式,得到一个关于λ的多项式,称为特征多项式。

矩阵A的特征值就是使特征多项式等于零的λ值。

具体步骤如下:1. 构造矩阵B=A-λI。

2. 求解矩阵B的行列式det(B)。

3. 解特征多项式det(B)=0,得到矩阵A的特征值λ。

二、幂法幂法是求矩阵特征值的一种迭代方法。

它的基本思想是从一个任意的非零向量开始,不断地将其乘以矩阵A,直到向量的方向趋于特征向量的方向,同时向量的模长趋于特征值的绝对值。

具体步骤如下:1. 选择一个任意的非零向量x0。

2. 迭代计算xn+1=Axn/||Axn||,其中||Axn||为Axn的模长。

3. 当xn+1与xn的差值小于某个预设的精度时,停止迭代,此时xn 的模长即为矩阵A的最大特征值,xn/||xn||即为对应的特征向量。

三、QR分解法QR分解法是求矩阵特征值的一种数值方法。

它的基本思想是将矩阵A 分解为QR,其中Q为正交矩阵,R为上三角矩阵。

然后对R进行迭代,得到一个对角矩阵,对角线上的元素即为矩阵A的特征值。

具体步骤如下:1. 对矩阵A进行QR分解,得到A=QR。

2. 对R进行迭代,得到一个对角矩阵D,对角线上的元素即为矩阵A的特征值。

以上三种方法都有其优缺点,具体选择哪种方法取决于实际应用场景和计算需求。

在实际应用中,还可以结合多种方法进行求解,以提高计算精度和效率。

矩阵特征值的数值解法

矩阵特征值的数值解法

矩阵特征值的数值解法矩阵的特征值是在矩阵与其特征向量之间的关系中的数值解。

特征值在各个领域中都有广泛应用,包括物理、工程、金融等。

在解决实际问题时,我们经常需要计算矩阵的特征值,因此研究如何求解矩阵特征值的数值方法是非常重要的。

1. 幂迭代法(Power Iteration)幂迭代法是求解矩阵特征值的一种简单而常用的数值方法。

它的基本思想是通过不断迭代矩阵与向量的乘积,使得向量趋近于该矩阵的一个特征向量。

具体步骤如下:(1)初始化一个非零的初始向量x。

(2)进行迭代计算,即$x^{(k+1)}=Ax^{(k)}/,Ax^{(k)},$。

(3)当向量x的相对误差小于一些预设的精度要求时,停止迭代,此时的x即为矩阵A的一个特征向量。

(4)将x带入特征值的定义式$\frac{Ax}{x}$,计算出特征值。

幂迭代法的优点是简单易实现,计算速度较快,缺点是只能求解特征值模最大的特征向量,而且对于存在特征值模相近的情况,容易收敛到错误的特征值上。

2. QR迭代法(QR Iteration)QR迭代法是一种较为稳定的求解矩阵特征值的数值方法。

它的基本思想是通过不断进行QR分解,使得矩阵的特征值逐渐收敛。

具体步骤如下:(1)将矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R,令$A_1=RQ$。

(2)将$A_1$再次进行QR分解,得到新的矩阵$A_2=R_1Q_1$。

(3)重复步骤(2),直到得到收敛的矩阵$A_k$,此时$A_k$的对角线上的元素即为矩阵A的特征值。

QR迭代法的优点是对于特征值模相近的情况仍然能够收敛到正确的特征值上。

缺点是每次QR分解都需要消耗大量的计算量,迭代次数较多时计算速度较慢。

3. Jacobi迭代法(Jacobi's Method)Jacobi迭代法是一种通过对称矩阵的对角线元素进行迭代操作,逐步将非对角元素变为零的求解特征值的方法。

具体步骤如下:(1)初始化一个对称矩阵A。

求矩阵特征值的方法

求矩阵特征值的方法

求矩阵特征值的方法矩阵特征值是线性代数中一个非常重要的概念,对于矩阵的特征值和特征向量的求解是解线性代数问题和应用的关键之一。

下面将从基本概念、性质、求解方法等方面全面介绍矩阵特征值的方法。

一、基本概念矩阵特征值是指对于一个n阶矩阵A,存在常数λ,使得线性方程组(A-λI)x = 0有非零解x存在。

其中,I是n阶单位矩阵。

λ称为矩阵A的特征值,而满足(A-λI)x = 0的非零向量x称为A的对应于特征值λ的特征向量。

二、性质1. 矩阵A和其转置矩阵A^T具有相同的特征值,但对应的特征向量不同。

2. 矩阵的特征值是与矩阵的倍数无关的。

3. n阶矩阵A的特征值个数不超过n个,包括相同特征值重数。

即重特征值可以有多个线性无关的特征向量。

4. 矩阵的特征向量是线性无关的。

三、求解方法1. 特征值的定义法根据特征值的定义,我们将(A-λI)x = 0进行变换,得到(A-λI)x = 0,即(A-λI)x = 0。

利用行列式的性质求解此方程,得到特征值λ的值,再带入方程组中求解特征向量。

2. 特征值的代数重数和几何重数特征值λ是使(A-λI)x = 0有非零解的λ值,λ称为矩阵的代数重数。

而对应特征值λ的解向量x称为矩阵的特征多项式的零空间,零空间的维数称为矩阵的几何重数。

通常,代数重数大于等于几何重数。

3. 矩阵的特征向量特征向量是矩阵A与特征值λ的关联,通过求解(A-λI)x = 0可以得到特征向量。

特征向量是在特征值确定的情况下,通过解方程组取出的非零向量。

4. 特征值和特征向量的计算法常用的计算特征值和特征向量的方法有幂法、反幂法、QR方法、稀疏特征问题求解方法等。

(1)幂法幂法是求解矩阵最大特征值和特征向量的一种迭代方法。

首先初始化一个非零向量b0,然后进行迭代计算,直到满足迭代终止条件。

迭代过程为:b(k+1) = A*b(k),其中b(k)表示第k次迭代后的向量。

最后得到的向量b即为矩阵A的最大特征值对应的特征向量。

矩阵特征值求法的十种求法(非常经典)

矩阵特征值求法的十种求法(非常经典)

矩阵特征值求法的十种求法(非常经典)以下是矩阵特征值求法的十种经典求法:1. 幂法(Power Method)幂法(Power Method)幂法是求解特征值的常用方法之一。

它基于一个重要的数学原理:对于一个非零向量$x$,当它连续乘以矩阵$A$的$k$次幂后,$Ax$的方向将趋于特征向量相应的特征值。

这种方法通常需要进行归一化,以防止向量过度增长。

2. 反幂法(Inverse Power Method)反幂法(Inverse Power Method)反幂法是幂法的一种变体。

它通过计算矩阵$A$的逆来求解最小的特征值。

使用反幂法时,我们需要对矩阵$A$进行LU分解,以便更高效地求解线性方程组。

3. QR方法QR方法QR方法是一种迭代方法,可以通过将矩阵$A$分解为$QR$形式来逐步逼近特征值。

这种方法是通过多次应用正交变换来实现的,直到收敛为止。

QR方法不仅可以求解特征值,还可以求解特征向量。

4. Jacobi方法Jacobi方法Jacobi方法是一种迭代方法,通过施加正交相似变换将矩阵逐步变为对角矩阵。

在每个迭代步骤中,Jacobi方法通过旋转矩阵的特定元素来逼近特征值。

这种方法适用于对称矩阵。

5. Givens旋转法Givens旋转法Givens旋转法是一种用于特征值求解的直接方法。

它通过施加Givens旋转矩阵将矩阵逐步变为对角矩阵。

这种方法是通过旋转矩阵的特定元素来实现的。

6. Householder变换法Householder变换法Householder变换法是一种用于特征值求解的直接方法。

它通过施加Householder变换将矩阵逐步变为Hessenberg形式,然后再进一步将其变为上三角形式。

这种方法是通过对矩阵的列向量进行反射来实现的。

7. Lanczos方法Lanczos方法Lanczos方法是一种迭代方法,用于对称矩阵的特征值求解。

该方法创建一个Krylov子空间,并使用正交投影找到最接近特征值的Krylov子空间中的特征值。

矩阵特征问题的计算方法

矩阵特征问题的计算方法

矩阵特征问题的计算方法首先,我们来定义特征值和特征向量。

对于一个n阶方阵A,如果存在一个非零向量X,使得下式成立:AX=λX其中,λ是一个实数常数,称为特征值;X是一个非零向量,称为特征向量。

也可以将上面的等式写成(A-λI)X=0,其中I是n阶单位矩阵。

接下来,我们介绍一些常用的计算特征值和特征向量的方法。

一、特征方程法特征方程法是最常用的求解特征值和特征向量的方法。

对于n阶方阵A,我们可以将特征方程写成:A-λI,=0其中,A-λI,表示A-λI的行列式。

解特征方程即可得到n个特征值λ1,λ2,...,λn。

对于每个特征值λi,我们可以代入(A-λiI)X=0,求解出对应的特征向量Xi。

二、幂法幂法是一种迭代计算特征值和特征向量的方法。

它的基本思想是,假设一个向量X0,然后通过迭代的方式不断计算Xk+1=AXk,直到收敛为止。

此时,Xk就是所求的特征向量,而特征值可以通过计算向量Xk与Xk+1的比值得到。

三、雅可比迭代法雅可比迭代法是一种用于计算对称矩阵特征值和特征向量的方法。

它的基本思想是,通过矩阵的相似变换将对称矩阵转化为对角矩阵。

雅可比迭代法的具体步骤如下:1.初始化一个对称矩阵A,令Q为单位矩阵。

2.找到A的非对角元素中绝对值最大的元素(a,b)。

3.计算旋转矩阵R,使得AR=RD,其中D为对角矩阵,D的对角线元素与A的特征值相等。

4.更新矩阵A=R^TAR,更新矩阵Q=Q×R,重复步骤2和3,直到达到收敛条件。

四、QR分解法QR分解法是一种计算特征值和特征向量的常用方法。

它的基本思想是,将矩阵A分解为QR,其中Q是正交矩阵,R是上三角矩阵。

然后,通过对R进行迭代得到对角矩阵D,D的对角线元素与A的特征值相等。

具体步骤如下:1.初始化一个矩阵A。

2.对A进行QR分解,得到矩阵Q和R。

3.计算新矩阵A=RQ,重复步骤2和3,直到达到收敛条件。

特征值和特征向量在实际应用中具有重要的意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第9章矩阵特征值问题的数值方法9.1 特征值与特征向量9.2 Hermite矩阵特征值问题9.3 Jacobi方法9.4 对分法9.5 乘幂法9.6 反幂法9.7 QR方法引言工程实践中有多种振动问题,如桥梁或建筑物的振动,机械机件、飞机机翼的振动,工程实践中有多种振动问题,如桥梁或建筑物的振动,机械机件、飞机机翼的振动,及一些稳定性分析和相关分析可转化为求矩阵特征值与特征向量的问题。

London, England: Millennium ('Wobbly') Bridge (1998-2002, Norman Foster and Partners and Arup Associates)I decide that I have to write something today, otherwise I would not know how to speak English here.•This is a very quick story about a bridge.•London launched three major construction projects to celebrate the arrival of the Millennium. After all, Greenwich (pronounced green-ich) is supposed to be (supposed to be?!) where the prime meridian lies, and the place where the Millennium officially starts in the world. The three projects are the Millennium Dome in North Greenwich, so far the largest single roofed structure in the world, London Eye right across Westminster, which becomes so far the largest observation wheel in the world, and the Millennium Bridge that links Southeast London with St. Paul’s Cathedral, which is currently…well...not swinging any more, it is said.•The bridge was designed by Imperial College, a college of my former university. On the very first day that the bridge was open to public, there were simply so many people going there to walk from the south bank to St. Paul’s that the weight completely exceeded the architect’s expectation.•The slender steel truss bridge began to vibrate with a million people on there. The opening ceremony ended up in anembarrassing vertigo.•Millennium left Londoners a happy adage about swinging bridge, meaning fancy technology that looks good but functions in a funny fashion.•Am I using too many F’s here? Or is it simply because my tongue starts to swing in the same direction when I am writing about this wobbly bridge?•Next time you visit London, I strongly recommend this place.After all, with a little swing, this is a shortcut to dash into St.Paul’s directly from the southeast!xxG =T1e x=TG: Google Matrix,“the world’s largest matrix computation”.4,300,000,000x: PageRank(网页级别)vector“The $25,000,000,000 Eigenvector”搜索引擎9.1 特征值与特征向量设A是n阶矩阵,x是非零列向量. 如果有数λ存在,满足,(1)那么,称x是矩阵A关于特征值λ的特征向量.如果把(1)式右端写为,那么(1)式又可写为:Ix λ()0I A x λ-=||0I A λ-=即1110()||...n n n f I A a a a λλλλλ--=-=++++记它是关于参数λ的n 次多项式,称为矩阵A 的特征多项式,其中a 0=(-1)n |A |.(2)显然,当λ是A 的一个特征值时,它必然是的根. 反之,如果λ是的根,那么齐次方程组(2)有非零解向量x ,使(1)式成立. 从而,λ是A 的一个特征值.A 的特征值也称为A 的特征根.()0f λ=()0f λ=矩阵特征值和特征向量有如下主要性质:定理9.1.1 n阶矩阵A是降秩矩阵的充分必要条件是A有零特征值.定理9.1.2 设矩阵A与矩阵B相似,那么它们有相同的特征值.定理9.1.3 n阶矩阵A与A T有相同的特征值.定理9.1.4 设λi≠λj是n阶矩阵A的两个互异特征值,x、y分别是其相应的右特征向量和左特征向量,那么,x T y=0 .9.2 Hermite矩阵特征值问题设A为n阶矩阵,其共轭转置矩阵记为A H. 如果A=A H,那么,A称为Hermite矩阵.9.2.1 Hermite 矩阵的有关性质设是Hermite 矩阵A 的n 个特征值.有以下性质:•全是实数.12,,...,n λλλ12,,...,nλλλ•有相应的n 个线性无关的特征向量,它们可以化为一组标准酉交的特征向量组,即12,,...,n λλλ12,,...,n u u u Hi j u u ijδ=•是酉空间中的一组标准酉交基.12,,...,n u u u•记U=( ),它是一个酉阵,即U H U=UU H =I ,那么即A 与以为对角元的对角阵相似.12,,...,n u u u 1Hn U AU D λλ⎛⎫⎪==⎪ ⎪⎝⎭O12,,...,n λλλ•A 为正定矩阵的充分必要条件是全为正数.12,,...,nλλλ定理9.2.1 设是Hermite 矩阵A 的n 个特征值,那么证:12,,...,n λλλ21max ii nAλ≤≤=21niFi Aλ==∑2222()()(())HA A A A A ρρρ===由21max ii nAλ≤≤=因此2221()()nHiFi Atr A A tr A λ====∑又由21niFi Aλ==∑得设x 是一个非零向量,A 是Hermite 矩阵,称为矩阵A 关于向量x 的Rayleigh 商,记为R(x).H H x Ax x x 定理9.2.2 如果A 的n 个特征值为其相应的标准酉交的特征向量为那么有12...n λλλ≥≥≥12,,...,n u u u 1()nR x λλ≥≥定理9.2.3 设A 是Hermite 矩阵,那么10min ()min ()k n k k k x C x x C x R x R x λλ-+∈≠∈≠==%%且且或9.2.2 极值定理定理9.2.4(极值定理) 设Hermite 矩阵的n 个特征值为,其相应的标准酉交特征向量为. 用C k 表示酉空间C n 中任意的k 维子空间,那么12...n λλλ≥≥≥12,,...,n u u u 1100max min ()minmax ()k kn k n k k x C x C k C x C x R x R x λλ-+-+∈≠∈≠==且且或9.2.3 Hermite矩阵特征值问题的性态矩阵特征值问题与求解线性方程组问题一样,都存在当矩阵A的原始数据有小变化(小扰动)时,引起特征值问题的变化有大有小的问题,如果引起的变化小,称该特征值问题是良态的. 反之,称为病态的.矩阵特征值问题的性态是很复杂的,通常分别就单个特征值或整体特征值给出条件数进行分析. 对于Hermite矩阵,由于其特征值问题的特殊性质,其特征值都是良态的.下面先证明Hermite矩阵特征值的扰动定理.定理9.2.5 设矩阵A ,E ,A+E 都是n 阶Hermite 矩阵,其特征值分别为那么,证设矩阵A 关于特征值λ1,λ2,…,λn 的标准酉交特征向量为u 1,u 2,…,u n ,是由u i ,u i+1,…,u n 生成的n-i+1维子空间.对中任意非零向量x,由极值定理,有12n λλλ≥≥≥L 12n εεε≥≥≥L 12nμμμ≥≥≥L 1i n i i λεμλε+≤≤+1n i C -+%1n i C -+%111000()max max max n i n i n i Hi Hx C x H HH H x C x x C x x A E x x xx Ax x Exx x x xμ-+-+-+∈≠∈≠∈≠+≤=+%%%且且且由定理9.2.3,又由定理9.2.2,对任意x≠0,有从而有另一方面, A=(A+E)-E. 记为矩阵-E 的特征值,那么,重复上面的过程,可得从而有10max n i Hi H x C x x Ax x xλ-+∈≠=%且110max n i Hn Hx C x x Exx xεε-+∈≠≥≥%且1i i μλε≤+12nδδδ≥≥≥L 1i n i δε-+=-1i i λμδ≤+i i nμλε≥+定理9.2.5通常又称为Hermite 矩阵特征值的扰动定理定理9.2.6 设矩阵A 和A′=A+E 都是n 阶Hermite 矩阵,其特征值分别为和,那么12n λλλ≥≥≥L 12n λλλ'''≥≥≥L 222i i E E λμλ-≤≤+这个定理表明,扰动矩阵E 使A 的特征值的变化不会超过‖E‖2.一般‖E‖2小,因此,Hermite 矩阵特征值是良态的.9.3 Jacobi方法•理论上,实对称矩阵A正交相似于以A的特征值为对角元的对角阵. 问题是如何构造这样的正交矩阵呢? Jacobi方法就是通过构造特殊的正交矩阵序列,通过相似变换使A的非对角线元素逐次零化来实现对角化的.9.3.1 平面旋转矩阵与相似约化先看一个简单的例子.设是二阶实对称矩阵,即a 21=a 12,其特征值为λ1,λ2. 令使得记容易验证B T =B, 且11122122a a A a a ⎛⎫=⎪⎝⎭cos sin sin cos R θθθθ⎛⎫-=⎪⎝⎭11TR AR λλ⎛⎫= ⎪⎝⎭11122122Tb b B R AR b b ⎛⎫== ⎪⎝⎭22111112222212212211122222111222cos 2sin cos sin ()sin cos (cos sin )sin 2sin cos cos b a a a b b a a a b a a a θθθθθθθθθθθθ=++==-+-=-+解之得:当时当时可选取1122a a ≠12112221arctan2a a a θ=-1122a a =4πθ=为使R T AR 为对角阵,要求b 12=b 21=0一般的n 阶平面旋转矩阵21arctan2pq pp qqa a a θ=-4πθ≤9.3.2 经典的Jacobi方法设A是实对称矩阵,记A1=A.Jacobi方法的基本思想是用迭代格式A k+1=Q T k A k Q k , k=1,2,…构造一个相似矩阵序列,使{Ak }收敛于一个对角阵. 其中Qk 为平面旋转矩阵,其旋转角θk 由使Ak的绝对值最大元a(k)pq=a(k)qp=0 或按列依次使A的非对角元零化来确定.定理9.3.1 设A 是n 阶实对称矩阵,那么由Jacobi 方法产生的相似矩阵序列{A k }的非对角元收敛于0. 也就是说,{A k }收敛于以A 的特征值为对角元的对角阵.记其中E k 是A k 除主对角元外的矩阵.由平面旋转矩阵的性质中,对于,有因此,()()k k iikA diag a E =+1Tk pq k pq A R A R +=,i p q≠(1)2(1)2()2()2()()()()k k k k ip iq ip iq a a a a +++=+22()212()k k kpqFFE E a +=-又由假设,因此,这样,便有从而,当22()()()()1,,1max(1)nk k k k pqijpqpqi j n i ji j i jaaan n a≤≤≠=≠==-∑且且且22()(1)k k pqF E n n a ≤-222112222(1)(1)kk kF FFE E E n nn n+≤-≤---1,0k Fk E +→∞→9.3.3 实用的Jacobi 方法•循环Jacobi 方法必须一次又一次扫描,才能使{A k }收敛于对角阵,计算量很大. 在实际计算中,往往用一些特殊方法来控制扫描次数,减少计算量. 下面介绍一种应用最为广泛的特殊循环Jacobi 方法——阈Jacobi 方法. 阈Jacobi 方法首先确定一个阈值δ,在对非对角元零化的一次扫描中,只对其中绝对值超过阈值的非对角元进行零化. 当所有非对角元素的绝对值都不超过阈值后,将阈值减少,再重复下一轮扫描,直至阈值充分小为止.减少阈值的方法通常是先固定一个正整数M≥n ,扫描一次后,让. 而阈值的下界是根据实际问题的精度要求选定的.Mδδ→9.3.4 用Jacobi 方法计算特征向量•假定经过k 次迭代得到A k+1=R T k …R T 1AR 1…R k ,(15) 这时A k+1是满足精度要求的一个近似的对角阵. 如果记Q k =R 1R 2…R k =Q k-1R k ,(16)那么,Q k 是一个正交矩阵,且(15)式又可表示为A k+1=Q T k AQ k .当A k+1的非对角元素充分小,Q k 的第j 列q j 可以看成是近似特征值a (k+1)jj 相应的特征向量了.在实际计算中,可以按(16)式在迭代过程中形成Q k ,把Q k 看成是Q k-1右乘一个平面旋转矩阵得到. 不妨记Q 0=I ,Q k 的元素按下式计算:()(1)(1)()(1)(1)()(1)cos sin ,sin cos ,,,,1,2,k k k ip ipk ipk k k k iq ipk iqk k k ijijq q q q qqqqj p q i nθθθθ-----=+=-+=≠=L9.4 对分法理论上,一个实对称矩阵正交相似于一个以其特征值为对角元的对角阵. 但是,经典的结果告诉我们,一个大于4次的多项式方程不可能用有限次四则运算求根. 因此,我们不可能期望只用有限次相似变换将一个实对称矩阵约化为一个对角阵.下面先介绍将一个实对称矩阵相似约化为实对称三对角矩阵的方法,再讨论求其特征值的对分法.9.4.1 相似约化为实对称三对角矩阵将一个实对称矩阵正交相似约化为一个实对称三对角矩阵的算法,可归纳如下:记A (1)=A,对k=1,2,…,n -2①按(4)式、(5)式和(8)式计算;②按(9)~(12)式,计算A (k+1). ,k k k u σβ'和()1,()2,()(4)k k k k k k k k k nk a a u a σ++⎛⎫- ⎪ ⎪'= ⎪ ⎪ ⎪⎝⎭M ()()21,1(()(5)n k k k k k ik i k sign a a σ+=+=-∑()1,()(8)k k k k k k a βσσ+=-1()1(1)(),(9),(10)1,(11)2(),(12)k k k k T k k kk k k k k k k T T k k k k g A u u g y g u A A u y y u βεβε--+===-=-+9.4.2 Sturm 序列的性质•设实对称三对角矩阵为其中βi ≠0 (i=1,2,…,n-1)其特征矩阵为T-λI. 记T-λI 的第i 阶主子式为111221n n a T a a ββββ-⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭OO O 111211()i i i i a a p a λββλλββλ----=-O OO•这是关于λ的i 次多项式,当i=n 时,p n (λ)=|T-λI |是矩阵T 的特征多项式.令p 0(λ)≡1,则有p 1(λ)=α1-λ,p i (λ)=(αi -λ)p i-1(λ)-β2i-1p i-2(λ),i=2,3,…,n.(15)•多项式序列{p i (λ)}(i=0,1,…,n)称为Sturm 序列111211()i i i i a a p a λββλλββλ----=-O OO定理9.4.1{p i (λ)}(i=1,2,…,n)的根都是实根.证由(14)式,p i (λ)是i 阶实对称矩阵的特征多项式,因此,{p i (λ)}(i=1,2,…,n)的根全是实根. 定理9.4.2定理9.4.2 设α是p i (λ)的一个根,那么①p i-1(α)p i+1(α)≠0,即相邻的两个多项式无公共根;②p i-1(α)p i+1(α)<0,即p i-1(α)与p i+1( α)反号.lim ()0,i p λλ→-∞>lim ()0,lim ()0,i i p p λλλλ→+∞→+∞<>当i 为奇数当i 为偶数定理9.4.4 p i (λ)的根都是单根,并且将p i+1(λ)的根严格隔离.9.4.3 同号数和它的应用•定义1 设p 0(λ)≡1,{p i (λ)}(i=1,2,…,n) 是一个Sturm 序列,称相邻的两个数中符号一致的数目为同号数,记为a i (λ). 若某个p i (λ)=0,规定与p i-1(λ)反号.•定理9.4.5 设两个实数x<y ,那么,形如(13)式的实对称三对角矩阵T 的特征多项式在区间(x,y ]上根的数目为a(x)-a(y).9.4.4 求Hermite矩阵特征值的对分法•对分法的计算可归纳为以下4个部分①确定(13)式的矩阵T的全部特征值的分布区间.②在区间[a,b]中,用区间对分的方法找出只含T的一个特征值的子区间.③在只含一个特征值的子区间上的对分法.④同号数的计算.9.5 乘幂法•设A 是n 阶矩阵,其n 个特征值按模从大到小排序为又假设关于λ1,λ2,…,λn 的特征向量v 1,v 2,…,v n 线性无关. 123n λλλλ>≥≥≥L 201112211[()()]k k k k n n A x a v a v v λλλλλ=+++L 乘幂法是适用于求一般矩阵按模最大特征值及相应特征向量的算法.x k →λk 1a 1v 1 (k→∞).因此,x k 可看成是关于特征值λ1的近似特征向量.迭代格式为1,0,1,k k k k k x z x x Az k ∞+===L按模最大特征值λ1及其相应的特征向量v 1的乘幂法的计算公式:111,0,1,kk k k kT k k k T k k x z x x Az z Az k z z λ∞++====L9.5.2 收缩方法•设矩阵A 的n 个特征值按模从大到小排序为,其相应的n 个线性无关特征向量为v 1,v 2,…,v n . 在计算A 的最大特征值λ1及相应特征向量v 1后,可以通过收缩方法,继续用乘幂法计算λ2及其相应的特征向量v 2.123nλλλλ>>≥≥L•定义n 阶矩阵•把去掉A 1的第1行和第1列的n-1阶矩阵记为2121112221122211111111211211000n n Tn n n n nn n n a v a a v a a v a A A v a v a a v a a v a α⎛⎫⎪---⎪=-= ⎪⎪---⎝⎭L L M M M L222112232113221132311233311333112112311311n n n n n n n n nn n n a v a a v a a v a a v a a v a a v a B a v a a v a a v a ---⎛⎫⎪--- ⎪= ⎪⎪---⎝⎭L LM MM L•那么,B 有与A 1除λ1外的相同的n-1个特征值|λ2|>|λ3|≥…≥|λn |,可以用乘幂法计算λ2及其相应的特征向量. 在计算λ1和v 1后,按(15)式形成n-1阶矩阵B 的计算过程称为收缩方法.9.6 反幂法•反幂法可以求一个非奇异矩阵A 的逆矩阵A-1的按模最小的特征值及相应的特征向量,又可以求A 的一个近似特征值相应的特征向量.•9.6.1 求按模最小特征值及相应特征向量的反幂法,又称为反迭代法.1(1)1,0,1,kk k k kTk k k T k kx z x LUx z z xk z zξ∞+++====L9.6.2 求近似特征值的特征向量的反幂法•先对矩阵进行LU 分解,记那么,(7)下面介绍一种选取特殊的初始向量x 0的反幂法——半迭代法.l I A λ-%l I A LUλ-=%1,0,1,kk k kkk k x z x Ly zUx y k ∞+====L•假设,选取初始向量x 0满足‖x 0‖∞=1,这时z 0=x 0.对照(7)式中的第二个式子.可把z 0看成满足Le=z 0.(8)这里,e=(1,1,…,1)T ,而z 0的各个分量的取值多少是无关重要的.这样,在第一个迭代步的计算中,只需求解(7)式中的上三角方程组Ux 1=e. “半迭代法”的命名也由此而得.l I A λ-%9.7 QR 方法定理9.7.1设A 是n 阶矩阵,其n 个特征值为.那么存在一个酉矩阵U ,使U HAU 是以为对角元的上三角矩阵.12,,,n λλλL 12,,,n λλλL 9.7.1 两个基本定理定理9.7.2设A 是n 阶实矩阵,那么,存在一个正交矩阵Q ,使Q TAQ 为一个准上三角矩阵,它的对角元是A 的一个特征值,对角元上的二阶块矩阵的两个特征值是A 的一对共轭复特征值.9.7.2 相似约化为上Hessenberg矩阵对一般n阶矩阵,QR算法的每一个迭代步需要O(n3)次乘法运算.如果矩阵阶数稍大,这个算法几乎没有实际的应用价值.通常采用的方法是先将矩阵相似约化为上Hessenberg形式的矩阵,在此基础上应用QR 迭代.这时,一个QR迭代步的乘法运算次数只需O(n2)次.所谓上Hessenberg 矩阵是指一个n 阶矩阵A ,如果当i>j+1时,a ij =0,称A 为上Hessenberg 矩阵.例如:一个5阶的上Hessenberg 矩阵具有如下的形式:**********0****00***000**A ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭下面介绍QR 方法时,都假设矩阵A 是一个上Hessenberg 矩阵.。

相关文档
最新文档