12 特征值估计、广义特征值与极大极小原理

合集下载

特征值范围估计

特征值范围估计

特征值范围估计特征值是矩阵的一个重要属性,并具有广泛的应用。

特征值与特征向量的求解是数学中的一个经典问题。

用于数值计算的矩阵通常是大型矩阵,因此求解其特征值和特征向量需要使用高效的算法。

在实际应用中,需要对特征值的范围进行估计,以确定有效的计算区间。

本文将介绍特征值范围估计的基本概念和方法。

特征值范围估计是指对一个矩阵的特征值的上下界进行估算,以便确定计算该矩阵特征值的有效区间。

在数学中,有多种方法对矩阵的特征值进行估计。

这些方法可以大致分为两类:直接方法和迭代方法。

下面分别介绍这两类方法。

直接方法是在不求解特征值和特征向量的情况下,在给定的一些限制条件下估算矩阵特征值的范围。

这些限制条件可以是矩阵的谱范数、对称性、压缩后的矩阵等等。

直接方法的优点是计算简单快速,通常用于对小型矩阵的特征值范围进行估算,但在求解大型矩阵的特征值时不太适用。

常见的直接方法包括以下几种。

1.圆盘定理圆盘定理是用于估算矩阵特征值上下界的一种常见方法。

该方法基于一个名为圆盘定理的性质。

圆盘定理是指对于一个n阶矩阵A和所有的x,其所组成的球形区域B是圆盘定理的开放。

2.双曲线定理双曲线定理是利用矩阵的谱范数估算特征值的上下界的方法。

其本质是矩阵范数不等式,根据Taussky-Todd定理的细节,可以得到这些结果。

3.对称矩阵定理对称矩阵定理是一个比较特殊的特征值范围估计方法,因为对称矩阵具有特殊的性质,使该方法适用于此类矩阵。

此类矩阵的特殊性质表明,它们的特征向量可以正交,自然的特征值也必须是实数。

这使得对称矩阵的特征值范围估计更加简单和可靠。

迭代方法是另一种近期广泛使用的特征值估计方法。

迭代方法通常适用于大型矩阵,其计算量较大。

在这种方法中,需要定义一个初值,通过迭代不断逼近特征值区间的上下界。

不同的迭代算法适用于不同类型的矩阵。

最常见的迭代算法是幂法。

幂法是一种求解矩阵特征值中最大特征值和对应特征向量的迭代方法。

其基本思想是通过不断地将向量乘以矩阵来逼近最大的特征值,并将得到的向量作为新的初始向量,直到收敛。

矩阵特征值问题

矩阵特征值问题
2
§1、特征值的估计
由于工程计算中求矩阵尤其是高阶矩阵的 精确特征值通常比较困难,而许多情况下我们 只需要知道特征值在什么范围内变化或者落在 什么区域内,例如判断方阵的幂级数是否收敛 只要看方阵的特征值的模或谱半径是否小于1, 因此特征值的估计就显得尤其必要,这方面的 理论在特征值问题中相当经典。
由于
实际上是 的
一个
维子空间,因此我们希望将
搜索极值的空间放大到任意
维子空
间 。而增大后的集合的极大值不会比原集
合的小,极小值也不会比原集合大。
58
设有 则
,并假定
,即
59
并且当
时等号成立。因此
60
一般地,我们有
定理4 (Courant-Fischer)设

Hermite矩阵,其特征值为
,则
存在Hermite矩阵特征值的极值原理
48
一、 Rayleigh商
二次型
,如果存在
,那么
所以如果
,我们自然也希望
49
定义1 设
是Hermite矩阵,称
为矩阵 的Rayleigh商。 注意到
因此我们可以把对 在单位球面
的极性的讨论限定 上。
50
单位球面 是闭集,又因为
是 的连续
函数,因此根据多元函数的最值定理,
在 上存在最大值和最小值。由于特征值与
对于广义特征值问题
,可以通过
适当选择位移(shift)或极点(pole) ,再通过 求逆,将之转化为SEP:
这种方法的优点是特征向量不变,矩阵 奇 异时也可以使用,并且在求解邻近 的特征 值或绝对值很小的特征值时效率较高。缺点仍 然是 一般不是特殊矩阵。

线性代数中的广义特征值问题与广义特征向量

线性代数中的广义特征值问题与广义特征向量

线性代数中的广义特征值问题与广义特征向量线性代数是数学的一个重要分支领域,广义特征值问题与广义特征向量是线性代数中的关键概念。

本文将介绍广义特征值问题及其相关概念,并探讨其在实际应用中的重要性。

1. 特征值与特征向量在线性代数中,我们常常研究矩阵和向量的性质。

给定一个n阶方阵A,如果存在一个非零向量v,使得Av = λv,其中λ是一个常数,则我们称λ为矩阵A的特征值,v称为对应于特征值λ的特征向量。

2. 广义特征值问题在某些情况下,特征值问题的定义需要进行推广,这就引入了广义特征值问题。

广义特征值问题可以被描述为:对于一个n阶方阵A和一个非零向量v,存在一个矩阵B,使得Av = λBv,其中B是一个非零矩阵,λ是一个常数。

3. 广义特征向量根据广义特征值问题的定义,我们可以定义广义特征向量。

对于一个n阶方阵A和一个非零向量v,如果存在一个矩阵B使得Av = λBv,则称v为A的广义特征向量。

4. 广义特征值问题的求解广义特征值问题的求解与特征值问题类似,都需要找到矩阵A的特征值和特征向量。

通常,我们会使用特征值分解或者广义特征值分解来解决这个问题。

4.1 特征值分解特征值分解将一个矩阵A分解为A = PDP^(-1)的形式,其中D是对角矩阵,P是一个可逆矩阵。

对于广义特征值问题,我们可以通过广义特征值分解来求解。

4.2 广义特征值分解广义特征值分解将一个方阵A分解为A = PDP^(-1),其中D是对角矩阵,P是一个可逆矩阵。

广义特征值分解的特征值和特征向量满足广义特征值问题的要求。

5. 广义特征值问题的应用广义特征值问题在实际应用中具有广泛的应用价值。

例如,在物理学中,广义特征值问题被用于描述量子力学中的粒子波函数。

在工程学中,广义特征值问题被用于描述振动和波动现象。

在计算机科学中,广义特征值问题被用于图像处理和模式识别。

总结:线性代数中的广义特征值问题与广义特征向量是重要的概念,通过对矩阵特征值问题的推广,我们可以解决更多实际问题。

广义特征值分解

广义特征值分解

广义特征值分解广义特征值分解(Generalized Eigenvalue Decomposition, GED)是一种重要的矩阵分解方法,常常被应用在信号处理、机器学习等领域中。

它能够将两个矩阵同时对角化,得到它们的特征向量和特征值。

在本文中,我们将对广义特征值分解做一个详细的讲解。

步骤一:理解特征值与特征向量在矩阵计算中,特征向量是指在矩阵进行线性变换后仍然保留其方向的向量。

特征值是与特征向量相关的标量,描述了该特征向量在变换中的“伸缩”程度。

一般来说,我们可以通过解决以下方程式来找到一个矩阵的特征向量和特征值:(A−λI)v=0其中,A是一个方阵,λ是一个标量,I是单位矩阵,v是特征向量。

步骤二:理解广义特征值分解在广义特征值分解中,我们要找到两个矩阵A和B的特征向量和特征值。

也就是说,我们需要解决以下方程式:Av=λBv其中,v是特征向量,λ是特征值。

将其转化为标准形式:(A−λB)v=0这样,我们就可以将两个矩阵同时对角化,得到它们的特征向量和特征值。

步骤三:寻找广义特征值分解在实际应用中,我们可以使用数值计算方法来寻找广义特征值分解。

这包括基于迭代算法的方法,如幂法、反幂法和雅可比迭代法等。

其中,幂法是最常用的方法之一,可以用来寻找矩阵的最大特征值和对应的特征向量。

雅可比迭代法则是另一个最常见的方法,可以用来寻找所有特征值和对应的特征向量。

步骤四:应用广义特征值分解广义特征值分解在实际应用中有很多用途。

例如,它可以用来处理分析较大的数据集、图像、信号等。

在信号处理领域中,可以将电磁波分解为多个频率的成分,在图像处理领域中,可以寻找图像的相似性和模式。

在机器学习领域中,广义特征值分解可以被用来进行降维和特征提取。

总之,广义特征值分解是一种非常有用的矩阵分解方法,在很多领域中都被广泛应用。

理解广义特征值分解的原理和寻找方法,将有助于我们更好地应用这种方法来解决实际问题。

矩阵不等式

矩阵不等式

(5.1.3) (5.1.4)
推论: Hermite 矩阵的特征值都是实数; 反 Hermite 矩阵的特征值为零或纯虚数。 事实上,当 A 为 Hermite 矩阵时,由式(5.1.4) 知 Im( )=0,即 为实数; 当 A 为反 Hermite 矩阵时,由式(5.1.3)知 Re( )=0,即为 为零或纯虚数。 定义.5.1 设 A (ars ) C
a1
h
p O q ak
定理 5.5 (Schur’s inequality) 设 A=(ars)Cn×n 的特征值为1,…,n,则有
| r |2
r 1
n
r ,s 1
| a
n
rs
|2 || A ||2 F
(5.1.9)
证明:根据定理 1.43,存在酉矩阵 U 使得 A=UTUH 其中 T 为上三角矩阵。因此 T 的对角元素为 A 的特征值,且有
b
i 1 j i
n 1
ij
( xi y j x j yi ) |2
2
n (2M) | xi y j x j yi | i 1 j i
2
(利用(a1+a2+…+an)2 n((a1)2+(a2)2+…+(an)2)
n 2 (2M) (n(n1)/2) | xi y j x j yi | i 1 j i
xT x yT x
(求等式两边矩阵的对角元之和,可得 (xTx+yTy)=xTAx+yTAy (1) 等式两边矩阵的左上角单元减去右下角单元 可得: (xTx+yTy)=xT(AAT)y 1). 记 B=AAT,则 |xTBy|||x||2 ||B||2||y||2 从而 ||||x||2 ||B||2||y||2 /((||x||2)2 +(||y||2)2) 利用 ab/(a2+b2)1/2 可得 ||||B||2 /2. 2). 由于|xTBy|||Bx||1 ||y||||B||1||x||1 ||y|| 从而 ||||B||1 ||x||1 ||y|| /((||x||2)2 +(||y||2)2) 易证明 ||x||1 ||y|| /((||x||2)2 +(||y||2)2) n /2. (显然,不妨假设(||x||2)2 +(||y||2)2=1, 设||y||=t=cos(), 则 y 必为 t ej 的形式(为什么?) , 从而极值转化为求解如下最大值问题: max ||x||1, 满足约束(||x||2)2=1t2 这样有均值不等式||x||1 n ||x||2=

第十八讲 广义特征值问题及对称矩阵特征值的极性

第十八讲 广义特征值问题及对称矩阵特征值的极性
2)对正定矩阵 B 进行平方根(cholesky) 分解,可得 B GGT ,其中 G 是可逆下三角 矩阵。
于 是 (1) 式 可 写 为 Ax GGT x , 令
y GT x,则有 x (GT )1 y (G1 )T y ,代入 上式得
A(G1 )T y Gy ,即 G1 A(G1 )T y y 。
1 r s n ,则有
min x0
R(
x)
r

max x0
R(
x)
s

二、 对称矩阵特征值的极性
定理 3、( Couanrt hrFsei
)设实对称
矩阵 A 的特征值按 1 2 n 的次序排 列,则 A 的第 k 个特征值
k
min max{xT Ax Vk
xபைடு நூலகம்Vk ,
x
2
1},
其 中 Vk 是 Rn 的 任 意 一 个 k 维 子 空 间 ,
1 k n。
二、 对称矩阵特征值的极性
2、广义特征值的极小极大原理
定义 4、设 A 、B 为 n 阶实对称矩阵,且
B 正定, x Rn 。称
R(x)
xT xT
Ax Bx

x
0
为矩阵 A 相对于矩阵 B 的广义 Rayleigh 商。
二、 对称矩阵特征值的极性
定理 4、非零向量 x0 是 R( x)的驻点的充
推 论 2 、 设 Vnk 1 是 Rn 的 任 意 一 个 n k 1维子空间,则定理 5 或推论 1 的结论
可写成如下形式:
k
max[ min R(x)] , Vnk1 0 xVnk1
nk 1
min[ max
Vnk1 0 xVnk1

极大极小算法原理

极大极小算法原理

极大极小算法原理极大极小算法原理是一种优化算法,广泛应用于数学、计算机科学和工程领域。

它的核心思想是在搜索空间中寻找一个最优解,这个最优解既要满足目标函数的最大值或最小值,又要满足约束条件的可行性。

在这个过程中,极大极小算法通过不断地迭代和更新解的方式,逐步逼近最优解。

一、算法基本原理1.极大极小算法的出发点是:在满足约束条件的前提下,寻找一个使目标函数取得最大或最小值的解。

2.算法的基本步骤如下:(1)初始化:给定问题的参数,如目标函数、约束条件、初始解等。

(2)迭代:在搜索空间中,根据当前解更新解,得到一个新的解。

更新策略可以是基于目标函数的梯度信息,也可以是基于启发式信息等。

(3)评估:评估新的解是否满足停止条件,如目标函数值的改进、约束条件的满意度等。

(4)停止:如果满足停止条件,算法收敛,输出当前解作为最优解;否则,返回步骤2,继续迭代。

二、算法的性质和优点1.极大极小算法具有全局收敛性,即在一定条件下,算法一定能找到最优解。

2.算法具有较强的适应性,可以处理非线性、非凸优化问题,以及具有复杂约束条件的问题。

3.极大极小算法在搜索过程中,可以充分利用目标函数的梯度信息,加快收敛速度。

4.算法具有较好的鲁棒性,对初始解的选择不敏感,适用于不同领域的问题。

三、算法应用与发展1.应用领域:极大极小算法在工程、经济、生物信息学等领域具有广泛的应用,如参数优化、供应链管理、基因表达数据分析等。

2.算法改进:针对原始极大极小算法的不足,研究者们提出了许多改进算法,如自适应步长调整、混合策略、并行计算等。

3.与其他算法比较:极大极小算法与其他优化算法(如梯度下降、牛顿法、遗传算法等)相比,具有更高的收敛速度和更好的全局性能。

总之,极大极小算法作为一种有效的优化方法,在理论上具有严谨的收敛性保证,同时在实际应用中表现出良好的性能。

随着科学技术的不断发展,极大极小算法在未来将继续发挥重要作用,为各个领域的优化问题提供有力支持。

三种常用固有振动特征值解法的比较

三种常用固有振动特征值解法的比较

2005全国结构动力学学术研讨会海南省海口市,2005.12.19-20中国振动工程学会结构动力学专业委员会三种常用固有振动特征值解法的比较宫玉才1周洪伟 陈 璞 袁明武(北京大学力学与工程科学系 北京,100871)Email :yuanmw@摘要: 本文以高效的细胞稀疏直接快速解法为核心步骤,实现了快速的固有振动广义特征值问题解法, 并在相同的允许模态误差的意义下检验了三种结构动力学中常用的大型矩阵特征模态算法——子空间迭代法、迭代Ritz 向量法和迭代Lanczos 法的计算效率。

迭代Ritz 向量法平均而言最快,子空间迭代法最慢,三种解法效率相差不是太大。

与ANSYS 的子空间迭代和Lanczos 法相比,本文的子空间迭代比ANSYS 的效率高很多,Lanczos 法和ANSYS 的差不多 。

大量较大规模的例题显示,本文对特征值算法的改进是十分有效的,算法的健壮性,通用性都达到了高水平。

关键词:特征值,结构振动,迭代法,高效能计算1高等学校博士学科点专项科研基金资助项目 (编号:20030001112)引言在工程有限元分析中常常要求解广义代数特征值问题0K M ϕλϕ−= (1)的部分低阶特征值与特征向量。

对于矩阵阶数超过1000的大型问题,子空间迭代法、Ritz 向量法和Lanczos 法被公认为求解部分低阶极端特征值和特征向量的有效方法。

尽管国内外的有限元软件都提供广义代数特征值问题(1)的多种解法,但结果仍然不能令人完全满意,漏根与多根、自由模态误判都时有发生。

传统上,低端特征值问题求解过程极度依赖于谱变换的线性方程组()T K M x LDL x My µ−==(2)的解法,移轴矩阵K M µ−的LDLT 三角分解是计算量最大的主要步骤。

在以变带宽解法为核心步骤的特征值解法中,它常常占到特征值问题计算时间的70%到90%。

本文采用了文[1]提出的一个效率非常高的有限元解法-细胞稀疏直接快速解法(简称细胞解法)替换变带宽解法,极大地提高了三角分解的效率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十二讲 矩阵特征值估计特征值计算较困难,希望找到简便的特征值界限或分布范围的估计方法。

一、 特征值界的估计定理1. 设n n A R ⨯∈,λ为A 的任意特征值,则有()Im Mλ≤其中,ij ji1i ,j na a Mm a x2≤≤-=证明:设x 为A 的属于特征值λ的单位特征向量,即A xx=λ,Hx x 1=,则 Hx A xλ=→()()HHHH Hx A x xA x x A xλ===()()()HHHT2jIm xAAxxAAx λ-λ=λ=-=-将x 写成[]T12n x,,,=ξξξ()()nnHTi ij ji ji 1j 1xAAx a a ==-=ξ-ξ∑∑()()()n ni ij ji ji 1j 1nn i ij ji ji 1j 12I m a a a a ====λ=ξ-ξ≤ξ-ξ∑∑∑∑n'i j ij jii ,j 1a a ==ξξ-∑('∑表示不含i =j )n'i ji ,j 12M=≤ξξ∑()2n22'i j i ,j 1I m M=⎛⎫λ≤ξξ ⎪⎝⎭∑()n22'i ji ,j 1M n n 1=≤-ξξ∑()n222'iji ,j 1M n n 1==-ξξ∑nnnnn2222424'ijijiiii ,j 1i ,j 1i 1i 1i 1=====ξξ=ξξ-ξ≤ξ-ξ∑∑∑∑∑()n22iii 11==ξ-ξ∑不妨写为: ()()()n2222221122ii i 3111==ξ-ξ+ξ-ξ+ξ-ξ∑()()()222222n112222iii 311122=⎛⎫⎛⎫ξ+-ξξ+-ξ ⎪⎪≤++ξ-ξ ⎪ ⎪⎪ ⎪⎝⎭⎝⎭∑12≤取等号的条件为221212ξ=ξ=,但2x1=,所以其它2iξ=∴()Im Mλ≤定理2. 设n n A R ⨯∈,λ为A 的任意特征值,则有 n λ≤ρ()R e n λ≤τ ()I m n sλ≤其中,ij1i,j nm a x a ≤≤ρ=,ij ji1i,j nm a x a a ≤≤τ=+,ij ji1i,j nsm a x a a ≤≤=-二、 盖尔圆法定义:设()n nijn nAa C⨯⨯=∈,由方程nii i ijj 1i jz a R a =≠-≤=∑所确定的圆称为A 的第i 个盖尔圆,i R 称为盖尔圆的半径。

定理3:矩阵A 的所有特征值均落在它的所有盖尔圆的并集之中。

证明:设()n nijn nAa C⨯⨯=∈,λ为A 的某一个特征值,x 为相应的特征向量,将x 写成[]T12n x,,,=ξξξ ,设0iim a x ξ=ξ由A xx=λ,考虑0i 行ni j j ij 1a =ξ=λξ∑()00n'i i i i j j j 1a a =λ-ξ=ξ∑()0j i ≠00nnjj''iiijiji j 1j 1iia a a R==ξξλ-=≤≤ξξ∑∑对于A 的特征值λ,一定存在0i ()01i n ≤≤,使λ落在A 的第0i 个盖尔圆中,对于每个特征值都有相同的结论。

定理4. 将矩阵A 的全体盖尔圆的并集按连通部分分成若干个子集,(一个子集由完全连通的盖尔圆组成,不同子集没有相连通的部分),对每个子集,若它恰好由K 个盖尔圆组成,则该子集中恰好包含A 的K 个特征值。

说明:盖尔圆相互重叠时重复计算,特征值相重时也重复计算证明:设111n n n n 1n n a a A C a a ⨯⎡⎤⎢⎥=∈⎢⎥⎢⎥⎣⎦,令()1112131n 2122232n3132333n n 1n 2n 3n n a u a u a u a u a a u a u a B u u a u a a u a u a u a u a a ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦0u 1≤≤,()[]1122n n B 0d ia g a a a =,()B 1A=()B u 的特征多项式是u 的多项式,其特征值是u 的连续函数,观察u (0u 1≤≤)变化的过程中()B u 特征值的变化,特征值只能在盖尔圆连通的子集内变动,而不能跨出连通子集。

由此可见,由K 个盖尔圆组成的连通子集恰好包含K 个特征值。

应该注意到:连通的这些盖尔圆中,有些盖尔圆可能包含两个或多个特征值,而其它盖尔圆中可能无特征值。

推论1. 孤立盖尔圆中恰好包含一个特征值。

推论2. 实矩阵的孤立盖尔圆恰好包含一个实特征值。

推论3. 盖尔圆方法中盖尔圆半径可以按列求和。

(因为方阵转置后特征值不变)推论4. 盖尔圆半径变为n'i iijj 1jR a =α=α∑,两个盖尔圆定理仍然成立。

说明如下:相似矩阵1P A P -与A 具有相同的特征值,取[]12n P d ia g =ααα()i 0α>11212ij n n 101B P A P a 010-⎡⎤⎢⎥α⎢⎥α⎡⎤⎢⎥⎢⎥α⎢⎥⎢⎥α⎡⎤==⎣⎦⎢⎥⎢⎥⎢⎥⎢⎥α⎢⎥⎣⎦⎢⎥⎢⎥α⎣⎦iij j a ⎡⎤α=⎢⎥α⎢⎥⎣⎦根据推论4,选取适当的i α使盖尔圆变大或变小,可以对特征值进行隔离。

但有时这种隔离特征值的方法会失效,如对于那些对角线上由相同元素的矩阵,此时盖尔圆的圆心相同。

广义特征值与极小极大原理一、 广义特征值问题1、定义:设A 、B 为n 阶方阵,若存在数λ,使得方程A xB x=λ存在非零解,则称λ为A 相对于B 的广义特征值,x 为A 相对于B 的属于广义特征值λ的特征向量。

● 是标准特征值问题的推广,当B =I (单位矩阵)时,广义特征值问题退化为标准特征值问题。

● 特征向量是非零的 ● 广义特征值的求解()AB x 0-λ= 或者 ()B A x 0λ-=→特征方程()d e t A B 0-λ=求得λ后代回原方程A xB x=λ可求出x本课程进一步考虑A 、B 厄米且为正定矩阵的情况。

2、等价表述(1) B 正定,1B -存在→1BA x x-=λ,广义特征值问题化为了标准特征值问题,但一般来说,1B A -一般不再是厄米矩阵。

(2) B 厄米,存在Cholesky 分解,HB G G=,G 满秩HA x G G x=λ 令H G xy=则()11HGA Gy y--=λ 也成为标准特征值问题。

()11HGA G--为厄米矩阵,广义特征值是实数,可以按大小顺序排列12nλ≤λ≤≤λ ,一定存在一组正交归一的特征向量,即存在12ny ,y ,y 满足()11Hi i GA Gy y --=λHi j ij1i j y y 0i j=⎧=δ=⎨≠⎩还原为()1Hii x Gy -=(i=1,2, ,n),则()()HHHHi j i j i j ij1i j y y x GGx x B x 0i j=⎧===δ=⎨≠⎩ (带权正交)二、 瑞利商A 、B 为n 阶厄米矩阵,且B 正定,称()()HHx A x R x x 0x B x=≠为A相对于B 的瑞利商。

12n x ,x ,x 线性无关,所以,nx C∀∈,存在12n a ,a ,a C ∈ ,使得ni ii 1x a x ==∑Hnnn n2HHi i i j j j i j ii 1j 1i ,j 1i 1x B x a x B a x a a x B x a ====⎛⎫⎛⎫===⎪⎪⎝⎭⎝⎭∑∑∑∑nnn2HHHi i j i j j i i j i ii ,j 1i ,j 1i 1x A x a a x A x a a x B x a =====λ=λ∑∑∑∴ ()n2i ii 1n2ii 1a Rx a ==λ=∑∑●()1x 0m in R x ≠=λ()nx 0m a x R x ≠=λ证明:()()()()()HHHHk x A k x x A x R x x B xk x B k x ==k 为非零常数可取1kx=,k x 1=∴()HHx 1x A x R x x B x==(闭区域)当1xx =或()i a 0i 2,3,,n == 时,()1R x =λi 1λ≥λ()n2i i 111n2ii 1a R x a ==≥λ=λ∑∑∴()1x 0m in R x ≠=λ另一方面,inλ≤λ()n2i i 1nnn2ii 1a R x a ==≤λ=λ∑∑∴()nx 0m a x R x ≠=λ[证毕] 当B =I 时,标准特征值问题A x x =λ (HA A=)12n Hi j ijx x λ≤λ≤≤λ⎧⎨=δ⎩则()H1Hx 0x A x m inx x≠=λ()HnH x 0x A x m a xx x≠=λ进一步分析可得()12x 0a 0m in R x ≠==λ()n n 1x 0a 0m a x R x -≠==λ()12k k 1x 0a a a 0m in R x +≠=====λ()n n 1n k n k 1x 0a a a 0m a x R x ----≠=====λ定理1.设{}r r 1s Lsp a n x ,x ,,x += ()r r 1s +λ≤λ≤≤λ,则()r x 0x Lm in R x ≠∈=λ()s x 0x Lm a x R x ≠∈=λ这一结果不便于应用,希望对上述结果进行改造,改造成不依赖于i x 的一种表达方式。

1a 0=和na 0=的情况均对应于x 在(n-1)维的子空间内变动,x 在L 中变动是在一个(s-r+1)维子空间中变化。

一般的,x 在n C 的(n-1)维子空间n 1V -中变动时,()n 12x 0x V m in R x -≠∈≤λ()n 1n 1x 0x V m a x R x --≠∈≥λ即,对于不同的n 1V -,()R x 的最小值及最大值有可能不同,其中各个最小值中最大者为2λ,各个最大值中的最小者为n 1-λ()nn 1n 12x 0V C x V m a x m in R x --≠∈∈⎡⎤=λ⎢⎥⎢⎥⎣⎦()n n 1n 1n 1x 0V C x V m in m a x R x ---≠∈∈⎡⎤=λ⎢⎥⎢⎥⎣⎦定理2. 设k V 是n C 的一个k 维子空间,则()nk k n k 1x 0V Cx V m a x m in R x -+≠∈∈⎡⎤=λ⎢⎥⎢⎥⎣⎦()n k k kx 0V C x V m in m a x R x ≠∈∈⎡⎤=λ⎢⎥⎢⎥⎣⎦以上两式称为广义特征值的极小极大原理。

● B =I 时,标准特征值问题同样存在上述关系。

● 矩阵奇异值问题:()()2HA A A⎡⎤σ=λ⎣⎦(非零)()()2HH22H2xAA xA x R x x xx==nk k 2n k 1x 0V C x V 2A xm a x m inx -+≠∈∈⎡⎤σ=⎢⎥⎢⎥⎣⎦n k k 2kx 0V C x V 2A xm in m a xx ≠∈∈⎡⎤σ=⎢⎥⎢⎥⎣⎦作业:P262 2,3,4。

相关文档
最新文档