第六章非对称特征值问题的计算方法

合集下载

第六章非对称特征值问题的计算方法

第六章非对称特征值问题的计算方法这一章我们来介绍矩阵特征值和特征向量的计算方法。

大家知道，求一个矩阵的特征值问题实质上是求一个多项式的根的问题。

而数学上已经证明：5阶以上的多项式的根一般不能用有限次运算求得。

因此，矩阵特征值的计算方法本质上都是迭代的。

目前，已有不少非常成熟的数值方法用于计算矩阵的全部或部分特征值和特征向量。

而全面系统地介绍所有这些重要的数值方法，会远远超出我们这门课程的范围，因而这里我们仅介绍几类最常用的基本方法。

6·1 基本概念和性质设，一个复数称作是的一个特征值是指存在非零向量使得．复向量称作是关于特征值的特征向量．复数是Ａ的一个特征值的充分必要条件是，因而称多项式为Ａ的特征多项式．显然阶矩阵的特征多项式是一个首项系数为１的次多项式，而且有个特征值．记Ａ的特征值的全体为，通常称之为Ａ的谱集．假定有如下分解其中，，则称为的代数重数（简称重数）；而称数为的几何重数。

易知如果，则称是A的一个单特征值；否则，称是A的一个重特征值。

对于一个特征值，如果，则称其是A的一个半单特征值。

显然，单特征值必是半单特征值。

如果A的所有特征值都是半单的，则称A是非亏损的。

容易证明，A是非亏损的充分必要条件是A有个线性无关的特征向量（即A是可对角化矩阵）。

设．若存在非奇异阵使得则称Ａ与Ｂ是相似的，而上述变换称作是相似变换．若Ａ与Ｂ相似，则Ａ和Ｂ有相同的特征值，而且是Ａ的一特征向量的充分必要条件是是Ｂ的一个特征向量．这样，如果我们能够找到一个适当的变换矩阵，使Ｂ的特征值和特征向量易于求得，则我们就可立即得到Ａ的特征值和相应的特征向量．很多计算矩阵特征值和特征向量的方法正是基于这一基本思想而得到的．从理论上讲，利用相似变换可以将一个矩阵约化成的最简单形式是Jordan标准型，即有定理６·１·１（Jordan分解定理）设有个互不相同的特征值，其重数分别为，则必存在一个非奇异矩阵使得其中并且除了的排列次序可以改变外是唯一确定的。

特征值和特征向量计算的数值方法

特征值和特征向量计算的数值方法在数学和计算机科学领域中，特征值和特征向量是非常重要的概念。

特征值和特征向量的计算有许多不同的数值方法，本文将介绍其中一些常见的数值方法，并分析它们的优劣和适用范围。

一、特征值和特征向量的定义在矩阵理论中，给定一个n×n的矩阵A，如果存在一个非零向量v和一个标量λ，使得Av=λv，那么称v为矩阵A的特征向量，λ为矩阵A的特征值。

特征值和特征向量的计算可以帮助我们理解矩阵的性质以及解决一些实际问题。

二、幂法幂法是计算特征值和特征向量的常用数值方法之一。

幂法的基本思想是通过多次迭代，逐渐逼近矩阵的特征值和特征向量。

具体操作如下：1. 初始化一个非零向量b0；2. 进行迭代计算：bi+1 = A * bi / ||A * bi||；3. 取出近似特征向量的最后一列：v = bn；4. 进行迭代计算特征值：λ = (Av)T * v / (vT * v)。

幂法的主要优点是简单易懂，且只需要进行矩阵向量乘法和内积计算。

然而，幂法仅能求取具有最大特征值的特征向量，而且对于存在多个特征值相等的情况并不适用。

三、反幂法反幂法是幂法的一种改进方法，用于求取矩阵A的最小特征值和对应的特征向量。

反幂法的基本步骤如下：1. 初始化一个非零向量b0；2. 进行迭代计算：bi+1 = (A - μI)^-1 * bi / ||(A - μI)^-1 * bi||；3. 取出近似特征向量的最后一列：v = bn；4. 进行迭代计算特征值：λ = (Av)T * v / (vT * v)。

反幂法的改进之处在于引入了矩阵的逆运算，通过使用矩阵A减去一个合适的常数μ乘以单位矩阵来实现。

反幂法适用于矩阵A的特征值接近于μ的情况。

四、QR方法QR方法也是一种常用的特征值计算方法，它适用于求解所有特征值以及对应的特征向量。

QR方法的基本思想是将一个矩阵分解为正交矩阵Q和上三角矩阵R的乘积，然后迭代地将矩阵A转化为更接近上三角形的形式。

非对称特征值问题-基本概念

2.0003 0.8171 3.6516 , A25 0.0002 0.3336 3.7 263 0.7456 2.3333
2.0002 2.9999 2.2374 。 A26 0.0001 2.9996 2.23 66 2.2349 0.9998
我们称这种分块上三交阵为矩阵A的Schur分块上三角阵，
为了节省运算工作量，实用的方法是先将矩阵约化为与Schur分块上三角
阵相似的Hessenberg形。
（bij） Rnn的次对角线以下的元素bij =0 定义若矩阵B
(i>j+1), 则称B为上Hessenberg矩阵，简称Hessenberg形，即
0.283205888 A3 0.157002612 0 0.287735078 A4 0.036401350 0
Pn2，则定理得证。
推论对于任何对称矩阵A Rnn , 存在正交阵Q，使得B QT AQ为对称三对角阵。
4.2
QR算法及其收敛性
QR算法可以用来求任意的非奇异矩阵的全部特征值，是目前计算这类问题最有效的方法之一。它基于对任何实的非奇异矩阵都可以分解为正交阵Q和上三角矩阵R的乘积。
设向量w Rn , w 2 1, 则称
H (w) I 2wwT
为（初等）镜面反射矩阵或Householder变换矩阵。
Houholder矩阵H=H（w）有如下性质：
(1) (2)
H是对称正交阵，即H H T H 1。
对任何x Rn , 记y Hx, 有 y 2 x 2
1 B

n 1

非对称广义特征值问题的并行同伦-行列式算法

非对称广义特征值问题的并行同伦-行列式算法非对称广义特征值问题是一个经典的数值线性代数问题，涉及到计算矩阵的广义特征值以及对应的特征向量。

在实际应用中，这个问题的规模往往很大，需要使用高效的并行算法来加速计算过程。

本文将介绍一种并行同伦-行列式算法来求解非对称广义特征值问题。

一、问题描述给定一个n阶矩阵A，广义特征值问题可以表示为Ax=λBx，其中B是一个非奇异的n阶对称正定矩阵，x是非零向量，λ是实数。

求解这个问题可以得到广义特征值λ和对应的特征向量x。

二、算法思想并行同伦-行列式算法是一种基于行列式计算的方法，通过计算矩阵行列式的变化来求解特征值问题。

算法的基本思路是通过同伦方法将原始的广义特征值问题转化为一系列的标准特征值问题（特征值问题中的B矩阵为单位阵）。

具体而言，通过引入一个可逆矩阵Q，将原始问题转化为：AQy=λy其中y=Qx，y是新的特征向量，Q是可逆矩阵。

对于新的特征值问题，可以使用标准的特征值求解算法来求解。

将得到的特征值记为μ，对应的特征向量为y，则原始特征值问题的解可以表示为x=Qy。

为了求解标准特征值问题，可以使用行列式计算的方法。

对于给定的矩阵C，可以通过计算其行列式来求解标准特征值。

并行同伦-行列式算法将利用这一性质来求解广义特征值问题。

三、算法流程并行同伦-行列式算法的基本流程如下：1.随机生成一个可逆矩阵Q；2.计算新的特征值问题AQy=μy，其中μ是一个待求解的特征值；3.将特征值问题转化为求解矩阵行列式的问题，即计算，AQ-μI，=0；4.采用并行行列式计算算法，对每个线程分配不同的行片段，使用LU分解方法计算行列式；5.对得到的特征值μ，使用标准特征值求解方法求解特征向量y；6.将得到的特征向量y转化为原始广义特征值问题的特征向量x，即x=Qy。

四、算法优势并行同伦-行列式算法相比于传统的解特征值问题的方法具有以下优势：1.并行计算：算法采用并行行列式计算算法，可以充分发挥多核计算机和分布式系统的计算能力，加速求解过程；2.可扩展性：算法可以适应不同规模的问题，只需要调整行片段的划分方式即可，具有较好的可扩展性；3.数值稳定性：算法使用LU分解方法计算行列式，避免了直接计算行列式的数值稳定性问题，能够在较大规模的问题上保持数值稳定性；4.适用范围广：算法适用于一般的非对称广义特征值问题，可以满足不同应用场景的需求。

4 非对称特征值问题

则称 λ 为 A 的特征值， x 为 A 对应于 λ 的（右）特征向量， y 为 A 对应于 λ 的左特征向量。关于特征值的几个说明： • 只有当 A 是方阵时，才能讨论特征值与特征向量； • 实矩阵的特征值与特征向量有可能是复的； • n 阶矩阵总是存在 n 个特征值（其中可能有相等的）；

4.2 预备知识 • 特征值的代数重数与几何重数; • 相似变换不改变矩阵的特征值；定义 4.3 设 A ∈ Rn×n 。若存在一个非奇异矩阵 X ∈ Cn×n ，使得 X −1 AX = Λ,
4.2
预备知识
4.2.1 特征值与特征向量
定义 4.1 设 A ∈ Rn×n ，称 p(λ) = det(A − λI ) 为 A 的特征多项式， p(λ) = 0 的根是 A 的特征值。定义 4.2 设 A ∈ Rn×n 。若存在 λ ∈ C 和非零向量 x, y ∈ Cn ，满足 Ax = λ x, y∗ A = λy∗ ,
4.2 预备知识
·4·
4.2.4 Schur 标准型
定理 4.5 设 A ∈ Cn×n ，则存在一个酉矩阵 U ∈ Cn×n 使得 λ1 b12 · · · b1n 0 λ b 2 2 n ∆ ∗ = R, U AU = . . . . . . . . . 0 · · · 0 λn 其中 λ1 , λ2 , . . . , λn 是 A 的特征值。证明我们对 n 使用归纳法证明。当 n = 1 时，结论显然成立。假设结论对所有阶数不超过 n − 1 的矩阵都成立。考虑 n 阶矩阵 A ∈ Cn×n 。设 λ 是 A 的一个特征值，其对应的特征向量为 x ∈ Cn ，且 ∥ x∥2 = 1。构造一个以 x 为第一列的酉矩 ˜ ]。于是阵 X = [ x, X ˜ x∗ x∗ Ax x∗ AX ∗ ˜] = . X AX = ˜ ∗ A [ x, X ˜∗ ∗ ˜ AX ˜ X X Ax X ˜ ∗ Ax = X ˜ ∗ · λ x = λX ˜ ∗ x = 0，故因为 x∗ Ax = x∗ · λ x = λ x∗ x = λ，且 X ˜ ˜ 12 λ x∗ A X λ A ∆ ∗ X AX = = . ∗ ˜ ˜ ˜ 0 X AX 0 A22 ˜ ∈ C(n−1)×(n−1) 使得 U ˜ ∗ A22 U ˜ =R ˜ ∈ C(n−1)×(n−1) 是一个上三角根据归纳假设，存在酉矩阵 U 矩阵。令 1 0 U = X . ˜ 0 U 则有 1 U AU = 0 1 = 0 λ = 0 λ = 0

非对称特征值问题 6-3剖析

例设A∈R4×4有特征值
i 15 j ( j 1,2,3,4),
比值r=|λ2/λ1|≈0.9. 做变换 B=A-12I (p=12),
则B的特征值为
1 2, 2 1, 3 0, 4 1.
应用幂法计算B的主特征值μ1的收敛速度的比值为
2 2 p 0.5 2 0.9.
1 1 p
我们将瑞利商应用到用幂法计算实对称矩阵A的主特征值的加速上来.
定理设A∈Rn×n为对称矩阵，特征值满足
1 2 n1 n ,
对应的特征向量vi满足(vi, vj)=δij (单位正交向量) ，应用幂法
公式计算A的主特征值1，则
R xk
Axk , xk xk , xk
1
2 1
2k
由此可见，R(xk) 更快的收敛于1.
证明
xk
Ak x0 max( Ak x0 )
,
yk 1
Axk
Ak x0 max( Ak
x0
)
,
得
R(xk )
( Axk , xk ) ( xk , xk )
( Ak1x0, Ak x0 ) ( Ak x0, Ak x0 )
n
a2 2k 1 jj
j 1
pI)1存在，则可以用反幂法求(A pI)1的
主特征根 1/(i p ) ，收敛将非常快。
2、对称矩阵的Rayleigh商加速
设A∈Rn×n为对称矩阵，称
R( x) ( Ax, x) . (x, x)
为向量x的瑞利商，其中(x, x)=xTx为内积. 由定理11知道，
实对称矩阵A的特征值1及n可用瑞利商的极限值表示. 下面
第三节加速方法
1、原点平移法

数值代数课程

开课院系
数学科学学院
通选课领域
是否属于艺术与美育
否
平台课性质
平台课类型
授课语言
中文
教材
数值线性代数,1. 徐树方，高立，张平文,北京大学出版社,2000；
矩阵计算的理论与方法,2. 徐树方,北京大学出版社,1995,Applied Numerical Linear Algebra,3. J.W.Demmel,Philadephia,1997,
向量范数和矩阵范数，线性方程组的敏度分析，基本运算的舍入误差分析，列主元 Gauss 消去法的舍入误差分析，计算解的精度估计和迭代改进。
三、最小二乘问题的解法(4学时)
最小二乘问题的数学理论，正交变换，正交化方法。
四、线性方程组的古典迭代解法(8学时)
Jacobi 迭代和 Gauss-Seidel 迭代，收敛性分析，模型问题，超松弛迭代法。
教学评估
胡俊：
本课程以课堂讲授为主，辅以课后作业和上机实验。本课程每周3学时, 按每学期17周计, 共计51学时。为了学生更好地掌握所学方法, 每周应安排3小时的上机实验, 实验内容和题目可根据学生的具体情况来安排。本大纲所包括内容可根据具体情况进行适当的增减。
平时成绩40%（上机作业20%，书面作业20%），期末考试成绩60%
五、共轭梯度法(6学时)
最速下降法，共轭梯度法及其基本性质，实用共轭梯度法及其收敛性，预优共轭梯度法，Krylov 子空间法。
六、非对称特征值问题的计算方法(10学时)
基本概念与性质，幂法，反幂法，QR 方法，求解矩阵广义特征值问题的QZ方法。
七、对称特征值问题的计算方法(8学时)
基本性质，对称 QR 方法，Jacobi 方法，二分法，分而治之法。

矩阵特征值与特征向量的计算方法

,
x2
,,
xn，
对A1应用幂法即可！
24
反幂法的迭代公式
设u0 v0 0(n 0)
迭代：vk A1uk1
k max(vk )
规范：uk vk / k
Avk uk1
k 1,2,
综合得到：
25
Th8’(反幂法)
(1)设A (aij ) Rnn有n个线性无关的特征向量；
(2)设A的特征值满足：| 1 | | n1 || n | 0
(1) P()为P( A)的特征值，即P( A)x P()x； (2) P()且x为P( A)的特征向量。 Th2 设A与B为相似矩阵，即B P1AP，则
(1) A与B有相同的特征值； (2) 若y是B的特征向量，则Py是A的特征向量。
3
Th3 (Gerschgorin圆盘定理)
(1)设A (aij )nn , 则A的每一个特征值必属于下述
(1) | 1 p || i p | (i 2,3,, n)
(2)
max
2 jn
|
j
p
|
|
2
|
| 1 p |
| 1 |
20
A (aij ) Rnn，其特征值是实数，如何选择 p ？
设1 2 n
则B A pI的主特征值为1 p或n p
为计算1、x1 要求p满足 | 1 p || n p | 且 max{| 2 p | , | n p |} min 即求极值问题 | 1 p | | 1 p |
(2)
lim
k
k
1
j
p
p
1
k
j
r | j p | 确定。
min i j

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第六章非对称特征值问题的计算方
法
这一章我们来介绍矩阵特征值和特征向量的计算方法。

大家知道，求一个矩阵的特征值问题实质上是求一个多项式的根的问题。

而数学上已经证明：5阶以上的多项式的根一般不能用有限次运算求得。

因此，矩阵特征值的计算方法本质上都是迭代的。

目前，已有不少非常成熟的数值方法用于计算矩阵的全部或部分特征值和特征向量。

而全面系统地介绍所有这些重要的数值方法，会远远超出我们这门课程的范围，因而这里我们仅介绍几类最常用的基本方法。

6·1 基本概念和性质
设，一个复数称作是的一个特征值是指存在非零向量
使得．复向量称作是关于特征值的特征向量．
复数是Ａ的一个特征值的充分必要条件是，因而称多项式
为Ａ的特征多项式．显然阶矩阵的特征多项式是一个首项系数为１的次多项式，而且有个特征值．记Ａ的特征值的全体为，通常称之为Ａ的谱集．
假定有如下分解
其中，，则称为的代数重数（简称重数）；而称数
为的几何重数。

易知如果，则称是A的一个单特
征值；否则，称是A的一个重特征值。

对于一个特征值，如果，则称其是A的一个半单特征值。

显然，单特征值必是半单特征值。

如果A的所有特征值都是半单的，则称A是非亏损的。

容易证明，A是非亏损的充分必要条件是A有个线性无关的特征向量（即A是可对角化矩阵）。

设．若存在非奇异阵使得
则称Ａ与Ｂ是相似的，而上述变换称作是相似变换．若Ａ与Ｂ相似，则Ａ和Ｂ有相同的特征值，而且是Ａ的一特征向量的充分必要条件是是Ｂ的一个特征向量．这样，如果我们能够找到一个适当的变换矩阵，使Ｂ的特征值
和特征向量易于求得，则我们就可立即得到Ａ的特征值和相应的特征向量．很多计算矩阵特征值和特征向量的方法正是基于这一基本思想而得到的．从理论上讲，利用相似变换可以将一个矩阵约化成的最简单形式是Jordan标准型，即有
定理６·１·１（Jordan分解定理）设有个互不相同的特征值
，其重数分别为，则必存在一个非奇异矩阵使得
其中
并且除了的排列次序可以改变外是唯一确定的。

上述定理中的矩阵称作A的Jordan标准型，其中每个子矩阵称作Jordan块。

如果限定变换阵为酉矩阵，则有如下著名的Schur分解定理。

定理6·1·2（Schur分解定理）设，则存在酉矩阵使得
其中是上三解矩阵；而且适当选取，可使得的对角元素按任意指定的顺序排列。

这一定理无论在理论上还是在实际应用上都是非常重要的，著名的QR方法就是基于这一定理而设计的。

下述定理对于估计某些特征值的界限是十分方便而有用的。

定理6·1·3（Gerschgorin圆盘定理）设，令
则有
从数值计算的角度来看，首先应弄清楚的问题是要计算的特征值和特征向量是否是病态的，也就是说矩阵的元素有微小的变化，是否会引起所关心的特征值和特征向量的巨大变化。

对于一般的方阵来说，这一问题是非常复杂的，即于篇幅，这里我们只介绍一个简单而又非常重要的结果。

假定是的一个单特征值，是属于它的单位特征向量（即
）。

令是酉矩阵（），即的列向量构成的一组标准正交基，则有
其中阶方阵。

由是的一个单特征值的假定，知
且
于是我们可定义
此外，由于，故必存在非零向量使。

通常称为这属于的左特征值。

是单特征值的条件蕴含着
．故可选取使．若给矩阵以微小的扰动使其变为，记
，则存在的一个特征值和对应的特征向量，使得
这表明和的敏感性分别与和的大小有关．因此，我们分别称
和为特征值和特征向量的条件数，记作
．
有关特征值和特征向量的敏感性问题的较详细讨论参见［１８］．
６·２幂法
幂法是计算一个矩阵的模最大特征值和对应的特征向量的一种迭代方法．为了说明幂法的基本思想，我们先假定是可对角化的，即Ａ有如下分解
（６.２.１）
其中非奇异，再假定
(6.2.2)
现任取一向量由于的列向量构成的一组基，故可表示为
(6.2.3)
这里．这样，我们有
（6.2.4）由此即知
这表明，当而且充分大时，向量
（6.2.5）
就是的一个很好的近似特征向量．
这样，我们自然想到用(6.2.5)来求的近似特征向量．然而，实际计算时，这是行不通的．其原因有二：一是我们事先并不知道的特征值；二是对充分
大的计算的工作量太大，有可能造成溢出．
仔细观察（6.2.5），不难发现(6.2.5)中的仅改变向量的长度，并不
影响它的方向．而我们所感兴趣的只是的方向，并非它的长度．因此，我们不必非用来约化的长度，而可用其他方便的常数来进行约化（为了防
止溢出，约化是必要的）；其次计算也并不需要事先将算好之后再计算，只需迭代地进行即可．基于这样的考虑，我们可设计如下的迭代格式：
算法6.2.1（幂法：计算矩阵Ａ的模最大的特征向量）
［预始步］取任意非零向量，且．算法终止常数，置
；
［主步］（１）计算；
（２）求；
（３）计算
（４）如果，则输出近似特征向量和近似特征值终止算
法；否则，置，返回（１）．
注：算法中：，其中
定理６.２.１设有个互不相等的特征值满足
并且是半单的（即的几何重数等于它的代数重数）．如果初始向量在
的特征子空间上的投影不为零，则由算法6.2.1产生的向量序列收敛到
的一个特征向量，而且由算法６.2.1产生的数值序列收敛到．
［证明］略．
当定理6.2.1的条件不满足时，由幂法6.2.1产生的序列的收敛性分析将变得非常复杂，这时可能有若干个收敛于不同向量的子序列（参见本章习题３０）．例如，假定，其中
此时有两个模最大的特征值．因此定理条件不满足，取初始向量为，通过简单的计算知
由此即知，由幂法产生的向量序列有两个收敛子列，分别收敛于向量
注意此时分别是属于－３和３的特征向量．
事实上，适当修改算法6.2.1可使幂法对于此例所述的情况下亦是收敛的．请读者作为练习修改算法6.2.1使其适用于而的情形．此外，从算法６.2.1的基本思想亦可看出，幂法的收敛速度主要取决于
的大小．在定理6.2.1的条件下，这个数总是小于１的．它越小收敛就越快，当它接近于１时，收敛是很慢的．为了加快算法的收敛速度，通常可采用位移的方法，即应用幂法于上，如果适当选取可使的模最大的特征值与其他特征值的模的距离更大，就起到加速的目的．例如若在上例中取
，即若对上面给出的矩阵Ａ应用幂法于，则此时产生的向量序列
将收敛到Ａ之属于－３的一个特征向量．
用幂法可以求矩阵Ａ的一个模最大的特征值及其对应的一个特征向量
．假如我们还要求第二个模最大的特征值，直接用算法6.2.1进行迭代是
不行的，必须先对原矩阵降阶才行．降阶就是在知道了的前提下，把矩阵
Ａ降低一阶，使它只包含Ａ的其余特征值．用来完成这一过程的方法通常称作收缩技巧，最简单实用的收缩技巧是利用正交变换．假设
（6.2.9）
现假设酉矩阵使
(6.2.10)
这里，则将(6.2.10)代入（6.2.9）并整理可得
，
这表明的首列为，即
其中是阶方阵．并且它的特征值是．因此，要求只要把幂法应用于即可．而变换(6.2.10)可用复的Householder变换来实现．
作为本节的结束，我们希望指出的是，由于幂法的计算公式依赖于矩阵特征值的分布情况，因此实际使用时很不方便，特别是不适用于自动计算，只是在矩阵阶数非常高，无法利用其他更有效的算法时，才用幂法计算少数几个模最大的特征值和相应的特征向量．然而，幂法的基本思想是重要的，由它可以诱导出一些更有效的算法．
6.3 反幂法
设是非奇异矩阵，可以对作幂法迭代，求出的特征值。

现设
的特征值满足
，
则的特征值满足
，
即为按模最大的特征值，将幂法计算6.2.1用于，具体计算时，可不求逆矩阵，而用解方程组的方法，即反幂法迭代计算过程为
(6.3.
1)
与幂法相同的分析，有
(6.3
.2) 其中是对应的特征向量．反幂法的收敛速度取决于．
假设的特征值为，对应线性无关的特征向量为，设
，则矩阵的特征值为
对应的特征向量为．如果选择接近某一特征值，满足
(6.3.3)
则对矩阵的反幂法迭代为
(6.3.4)
注：算法中：，其中．
必有．而且，只要选择得能很好地满足(6.3.3)，则收敛速度可以很快．一般(6.3.4)第一式的方程组用矩阵的选
列主元的ＬＵ分解方法来求解．可以证明，虽然越接近，越接近奇异，
但用以上的反幂法迭代能够得到精确的结果．所以它是目前求特征值和特征向量的有效方法之一．称为原点位移的反幂法．
参数的选择可以利用Gerschgorin定理或其他有关特征值的信息．如果已知一个特征向量的初始近似向量，也可选择为
， (6.3.5) 这是因为若，则必有．。

第六章 非对称特征值问题的计算方法