中科院矩阵分析_第五章
矩阵讲义全

本课程的说明:矩阵分析理论是在线性代数的基础上推广的(数学是在已有的基础理论上模仿,推广而发展的。
要大胆猜想,小心证明!) 矩阵分析理论的组成:四部分:一、基础知识(包括书上的前三章内容)重点、难点:约当标准形与多项式矩阵,矩阵的分解等; 二、矩阵分析(第四章:矩阵函数及其应用)重点、难点:范数,矩阵幂级数,微分方程组; 三、矩阵特征值的估计(第五章)重点、难点:Gerschgorin 圆盘定理;广义逆矩阵; 四、非负矩阵(第六章)(注:不讲)重点、难点:基本不等式,素矩阵,随机矩阵等。
§1 线性空间与度量空间一、线性空间: 1.数域:Df 1:若复数的一个非空集合P 含有非零的数,且其中任意两数的和、差、积、商(除数不为0)仍在这个集合中,则称数集P 为一个数域 eg 1:Q (有理数),R (实数),C (复数),Z (整数),N (自然数)中哪些是数域?哪些不是数域? 2.线性空间— 设P 是一个数域,V 是一个非空集合,若满足:<1> 可加性—指在V 上定义了一个二元运算(加法)即:V ∈∀βα, 经过该运算总存在唯一的元素V ∈γ与之对应,称γ为α与β的和,记βαγ+= 并满足:① αββα+=+② )()(γβαγβα++=++ ③ 零元素—=有θαθααθ+∈∀∈∃Vt s V .(线性空间必含θ)。
④ αβαβθβααβ-+∈∀∈∃=记的负元素为=有对V V<2> 数积:(数乘运算)—在P 与V 之间定义了另一种运算。
即V P k ∈∈∀α,经该运算后所得结果,仍为V 中一个唯一确定的元素(存在唯一确定的元素V ∈δ与之对应),称δ为k 与α的乘积。
记为αδk =并满足:① αα=⋅1② P l k ∈∀, αα)()(kl l k = ③ P l k ∈∀, αααl k l k +=+)( ④ γβα∈∀, βαβαk k k +=+)(则称V 为数域P 上的线性空间(向量空间)记为)...(∙+P V 习惯上V 中的元素—向量, θ—零向量, 负元素—负向量结论:可以证明,线性空间中的零向量是唯一的,负元素也是唯一的,且有:θα=⋅0 θθ=⋅k αα-=⋅-)1( )(βαβα-+=-eg2:}{阶矩阵是n m A A V ⨯= P —实数域R按照矩阵的加法和数与矩阵的乘法,就构成实数域R 上的线性空间,记为:n m R ⨯同样,若V 为n 维向量,则可构成R 上的n 维向量空间n R —线性空间。
中科院矩阵分析chapt3

矩阵分析及其应用 3.1矩阵序列定义3.1设矩阵序列{A (k )},其中A(k)=( a (k )) C m n ,当k a j" a u 时,称矩阵序列{A (k)}收敛,并称矩阵 A=( a ij )为矩 阵序列{A (k)}的极限,或称{A (k)}收敛于A,记为lim A (k)A 或 A (k) Ak不收敛的矩阵序列称为发散的。
由定义,矩阵序列 A (k )发散的充要条件为存在 j 使得数列a (k)发散。
类似地,我们可以定义矩阵收敛的 Cauchy 定义 定义3.1'矩阵序列{A (k)}收敛的充要条件为 对任给>0存在N(),当k, l N()时有 ||A (k) A (l)|| <其中||.|为任意的广义矩阵范数。
sin 』)n nsin(k)如果直接按定义我们因为求不出 A (n)的极限从而从而只要I 充分大,则当m, n > l 时就有sin(k)k 2这样A (l)收敛。
定理3.1 A (k) A 的充要条件为 ||A (k) A|| 0证明:利用广义矩阵范数的等价性定理,仅对 范数可以证明。
即c 1ILA (k) A||||A (k) AII C 2 ||A (k) AII 性质 0 若 A (k)A ,则 ||A (k) II IIAII 成立。
性质 1. 设 A (k)A m n ,B (k) B m n , 则A (k)+ B(k) A+ B , ,C 性质 2. 设 A (k)A m n ,B (k )B n l ,贝UA (k)B (k)A B证明:由于矩阵范数地等价性,我们可以只讨论相容的 矩阵范数。
||A (k )B (k) A B|| || A (k) B (k) A B (k)||+||AB (k)A B|||| A (k) A|| ||B (k)||+||A||||B (k) B||例 1 A (n)k m 1k(k 1)相反,由于注意||B(k)|| ||B||,则结论可得。
矩阵分析第5章课件

第五章 向量与矩阵范数 前言
• 向量与矩阵范数是向量与矩阵的一个重要数 字特征---用它可以建立向量集或矩阵集的 拓扑结构,从而便于研究向量或矩阵序列,向 量或矩阵级数的收敛性质.因此,这一章的理 论在数值分析及其它领域中十分有用. • 本章是本课程重点内容之一.所有5节都要认 真学好.最后一节(矩阵幂级数)是研究矩阵 函数的重要工具.
Holder不等式与Minkowski不等式
• 下面两个不等式对本章的理论推导十分有用 • Holder不等式:对任意给定p>1和q=p/(p-1) (>1,即(1/p)+(1/q)=1)及任意ak,bk0成立 k=1nakbk (k=1nakp)1/p(k=1nbkp)1/p. (C-S不等式为其(p=2时)特例) • Minkowski不等式:对任意给定p1成立 (k=1n|ak+bk|p)1/p (k=1n|ak|p)1/p+(k=1n|bk|p)1/p
ACmn 定义 ‖A‖= maxi,k|aik| 则‖A‖显然是向量范数(向量的无穷大范数),但它 不是矩阵范数,反例如下:
1 1 1 1 1 2 A 1 1 , B 0 1 , AB 1 2
x第五章矩阵分析及其应用

2021/3/6
1
虽然在微积分开端时期贝克莱将无穷小称 为“上帝的幽灵”,进而导致“第二次数 学危机”,直到柯西的“极限论”和戴德 金等的“实数理论”的出现危机才算彻底 解决。但微积分在近代社会的巨大作用我 们早已深有体会,将微积分中的极限、导 数、积分、级数等分析思想和方法应用于 矩阵的研究,自然就在情理之中。
|| x ||2
| x1 |2 | x2 |2
| xn |2
定义的|| ||2 是 F n上的向量范数,称为2-范数或 l2
范数,也称为 Euclid 范数。
2021/3/6
10
例 7 对任意 x
|| x ||p
( x1, x2 , , xn )T
1/ p n
| xi |p , p
i1
C n ,由
从而有
A UΛU H U Λ ΛU H BBH
此时
|| x ||A xH Ax xH BH Bx (Bx)H Bx || Bx ||2
因此对任意 y C n , || x y ||A || B( x y) ||2
2021/3/6
|| Bx ||2 || By ||2 || x ||A || y ||A
2021/3/6
24
例 14 (模式识别中的模式分类问题) 模式分类的问题指的是根据已知类型属性的观测样本
的模式向量 s1, , sM ,判断未知类型属性的模式 向量 x 归属于哪一类模式。其基本思想是根据 x 与 模式样本向量 si 的相似度大小作出判断。
最简单的方法是用两向量之间的距离来表示相似度, 距离越小,相似度越大。最典型的是Euclidean距离
22
一般地,由于 A 是Hermite正定矩阵,从而存在
《矩阵分析》(第3版)史荣昌,魏丰.第五章课后习题答案

第五章 范数、序列、级数(详解)5-1 解:需要验证给出的公式满足矩阵范数的四个性质。
非负性与齐次性容易验证,先证三角不等式。
若()m nij b C⨯=∈B ,则()11111111mnij iji j mnij iji j mnmnij iji j i j a b a b a b ========+=+≤+=+=+∑∑∑∑∑∑∑∑A B A B最后证矩阵乘法的相容性。
若()m nij a C⨯=∈A ,()m n ij b C ⨯=∈B ,则11111111111111()()()()pmnik kji j k pmnik kji j k ppmnik kji j k k p pm n ik kj i k j k a b a b a b a b ===============≤⎡⎤≤⎢⎥⎣⎦==∑∑∑∑∑∑∑∑∑∑∑∑∑∑AB AB因此所给计算公式的确是矩阵范数。
5-2 解:因为1122222111(),()m nnij i Fi j i a x x =====∑∑∑A根据H lder ö不等式 22211221112222111()()()()m nij ji j mn n ij j i j j m nnij j FFi j j a x a x a x =========⎡⎤≤⎢⎥⎣⎦==∑∑∑∑∑∑∑∑Ax Ax于是22xF≤A Ax5-3 解:取(1,0,,0)T =α ,设12(,,,)T n x x x =x ,则1222*1()nHi i x ====∑x x αx范数是矩阵理论的一个重要概念,在许多方面有广泛应用。
5-4 解:1(1)01k k ⎡⎤=⎢⎥⎣⎦A ,故lim kk →∞A 发散。
(2)A 的特征值12==0.91λλ<,故k A 收敛,且lim 0k k →∞=A 。
1100(3)00.90.9000.9k kk k k -⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A 由于lim 0.90kk →∞=,1lim 0.90k k -→∞=故kA 收敛,且100lim 000000k k →∞⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A(4)由于10.91=<A ,k A 收敛,且lim 0k k →∞=A5-5 解:由于111()()()0234λλλλ-=---=E A ,所以A 有三个不同特征值123111,,234λλλ===。
第五章矩阵分析

一般地,对于任何不小于1的正数 p , 向量
x x1, x2 ,, xn T 的函数
1
x
p
n i1
xi
p p
也构成向量范数,称为向量的P-范数。
由 p 范数的存在,可知向量的范数有无穷多种,而且,向量的范数并不
仅限于 p 范数.在验证向量的范数定义中,三角不等式的过程中常涉及到两 个著名的不等式,即: 1、Hölder 不等式 设正实数 p, q 满足 1 1 1, 则对任意的 x, y Cn , 有
有了谱半径的概念,可以对矩阵范数作如下的初步估计.
定理 6 设 A C nn ,则对 C nn 上的任一矩阵范数 ,皆有
( A) A
证 设 是 A 的特征值, x 为 A 的属于特征值 的特征向量,故 x 0 ,所 以 x 0 .另设 是 Cn 上与矩阵范数 相容的向量范数,由 Ax x ,应有
则有正实数 C1,C2 , 使对一切矩阵 A 恒有
C1
A
A
C2
A
第二节 向量与矩阵序列的收敛性
定义5:设有向量序列xk : xk x1(k) , x2(k) ,, xn(k) T ,
如果对i 1,2,, n ,
数列
x(k) i
均收敛且有lim k
xi( k
)
xi
则说向量序列xk 收敛,如记 x (x1, x2,...,xn)T ,
k
xi(k
)
xi
i 1,2,...,n
lim
k
xi(k )
xi
0,
i 1,2,...,n
lim
k
max
1in
xi(k
)
xi
中科院矩阵分析课件.doc

矩阵分析及其应用3.1矩阵序列定义3.1设矩阵序列{应)},其中A«)=(#))£Cms,当k—oo, 佝时,称矩阵序列{A00}收敛,并称矩阵A=(佝)为矩阵序列{A00}的极限,或称{A00}收敛于A,记为lim A a)= A或A,k)-> A ks不收敛的矩阵序列称为发散的。
由定义,矩阵序列A(k)发散的充要条件为存在ij使得数列站发散。
类似地,我们可以定义矩阵收敛的Cauchy定义定义31矩阵序列{A00}收敛的充要条件为对任给£>0存在N(E),当k,l> N(E)时有IIA(k)-A(/)ll < £其中11.11为任意的广义矩阵范数。
例 1 A(n)e~nsin(-)n y,sin(R) k=l K 7如果直接按定义我们因为求不出A㈤的极限从而很难应用定义3.1证明收敛。
相反,由于t^< t^<v 1/m从而只要/充分大,则当m, n > /时就有nz sin(A)这样A")收定理3.1 A(k)->A的充要条件为HA'10-AII T O证明:利用广义矩阵范数的等价性定理,仅对co范数可以证明。
即ci IIA(k) -AIL < IIA(k) -All< c2 IIA(k) -AIL性质 1.设A(k,—> A mxn, B,k,—> B mxn>则a- A(k)+P • B(k) -> a- A+P B, V a,PeC性质2.设A(k)—> A mxn, B,k)—> B nx/,则A(k)由如一A B证明:由于矩阵范数地等价性,我们E以只讨论相容的矩阵范数。
IIA(k).B(k)-A-BII < II A(k) -B(k) -A-B(k)ll+IIAB(k)- A-BII<IIA(k)-AII-IIB(k)ll+IIAIMIB(k)-BII注意IIB(k)||_||BII,则结论可得。
中科院学习课件 矩阵分析与应用 6lineartransform

Li Bao bin | UCAS
3 / 34
Linear Transformations | Introduction
If V is the space of all continuous functions from R into R, then the x mapping defined by T(f ) = 0 f (t)dt is a linear operator on V because
Li Bao bin | UCAS
11 / 34
Linear Transformations | Introduction
For T ∈ L(U , V ) and L ∈ L(V , W ), the composition of L with T is defined to be the function C : U → W such that C(x) = L (T(x)). This composition denoted by C(x) = LT, is also a linear transformation because C(αx + y) = L (T(αx + y)) = L (αT(x) + T(y)) = αL (αT(x)) + L (T(y)) = αC(x) + C(y). If B, B and B are bases for U , V and W , respectively, then C must have a coordinate matrix representation with respect to (B, B ). So it’s only natural to ask how [C]BB is related to [L]B B and [T]BB : [C]BB = [L]/ 34
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 特征值的估计及对称矩阵的极性本章主要讨论数值代数中的三个特殊理论,即特征值的估计广义特征值问题实对称矩阵(一般是Hermite 矩阵)特征值的极小极大原理,其次也涉及到一些特征值和奇异值的扰动问题,最后简要地介绍矩阵直积的一些性质及其在线性矩阵方程求解方面的应用。
这几方面的内容,在矩阵的理论研究与实际应用当中都有着相当重要的作用。
5.1特征值的估计一、特征值的界首先给出直接估计矩阵特征值模的上界的一些方法定理5.1 设A=(a rs )∈R n×n ,令 M=||21max ,1sr rs n s r a a -≤≤ λ若表示A 任一特征值,则λ的虚部Im(λ)满足不等式2)1(|)Im(|-≤n n M λ |Im(λ)|≤||A -A T ||2 / 2|Im(λ)|≤||A -A T ||1⋅/2.证明:设x+i ⋅y 为对应于λ的A 的特征向量,则 A(x+i ⋅y)=(α+β⋅i)(x+i ⋅y)其中λ=α+β⋅i.显然x,y 为实向量,且x,y 为线性无关的 向量。
经整理A(x,y)=(x,y)B,其中B=⎪⎪⎭⎫ ⎝⎛-αββα。
从而(x,y)T A(x,y)=(x,y)T (x,y)B展开有⎪⎪⎭⎫ ⎝⎛Ay y Ax y Ay x Ax x T T T T =α⋅⎪⎪⎭⎫ ⎝⎛y y y x y x x x T T T T + β⋅⎪⎪⎭⎫ ⎝⎛--x y y y x x y x T T T T (求等式两边矩阵的对角元之和,可得α(x T x +y T y )=x T Ax +y T Ay (1)等式两边矩阵的左上角单元减去右下角单元可得:β(x T x +y T y )=x T (A -A T )y1).记B=A -A T ,则 |x T By|≤||x||2 ⋅||B||2⋅||y||2从而 |β|≤||x||2 ⋅||B||2⋅||y||2 /((||x ||2)2 +(||y ||2)2)利用ab /(a 2+b 2)≤1/2 可得 |β|≤||B||2 /2.2).由于|x T By|≤||Bx||1 ⋅||y||∞≤||B||1⋅||x||1 ⋅||y||∞从而 |β|≤||B||1 ⋅||x||1 ⋅||y||∞ /((||x ||2)2 +(||y ||2)2)易证明 ||x||1 ⋅||y||∞ /((||x ||2)2 +(||y ||2)2)/2.(显然,不妨假设(||x ||2)2 +(||y ||2)2=1,设||y ||∞=t =cos(α), 则y 必为t ⋅ e j 的形式(为什么?), 从而极值转化为求解如下最大值问题:max ||x||1, 满足约束(||x ||2)2=1-t 2这样有均值不等式||x||1x ||2= -t 2)1/2,从而我们需要求解t (1-t 2)1/2的最大值,设t =cos(α) 可得t (1-t 2)1/2的最大值为1/2. 从而得证。
)因此 |β|≤||B||13). 由于b ii =0, i =1,2,…,n , b ij = -b ji ,因此 |x T By|2=|11()n ij i j j i i j i bx y x y -=>⋅⋅-∑∑|2≤(2M )221||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑(利用(a 1+a 2+…+a n )2≤ n ((a 1)2+(a 2)2+…+(a n )2)≤(2M )2 (n (n -1)/2)21||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑≤(2M )2 (n(n -1)/2)⋅2222111(2)2n n i j i j i j j i i j x y x x y y x y ==-+∑∑=M 2 (n (n -1))⋅2⋅[ (x T x)⋅(y T y )- (x T y)2]利用[ (x T x)⋅(y T y )- (x T y)2]≤(x T x)⋅(y T y )可得|β|≤M (2n (n -1))1/2 (x T x)1/2⋅(y T y )1/2 /(x T x +y T y )≤M (2n (n -1))1/2 / 2=M (n (n -1)/2)1/24). |x T By|=|11()n ij i j j i i j i bx y x y -=>⋅⋅-∑∑|≤1/221||nij i j i b =>⎛⎫ ⎪⎝⎭∑∑1/221||n i j j ii j i x y x y =>⎛⎫- ⎪⎝⎭∑∑ 而 1/221||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑≤(x T x)1/2⋅(y T y )1/2 由此可以有|β|≤(1/2)1/221||nij i j i b =>⎛⎫ ⎪⎝⎭∑∑ 思考题:对于(1)式,利用定理推导的类似技术,求出关于|α|的界。
推论 实对称矩阵的特征值都是实数。
事实上,当A 这实对称矩阵时,M =0.由定理5.1可得Im(λ)=0,即λ为实数。
引理1 设B ∈C n×n ,列向量y ∈C n 满足||y||2=1,则|y H By|∞≤m B ||||.定理5.2 设A ∈C n×n ,则A 的任一特征值λ满足|λ|≤||A||∞m∞+≤m H A A ||||21|)Re(|λ (5.1.3) ∞-≤m H A A ||||21|)Im(|λ (5.1.4) 推论: Hermite 矩阵的特征值都是实数;反Hermite 矩阵的特征值为零或纯虚数。
事实上,当A 为Hermite 矩阵时,由式(5.1.4) 知Im(λ)=0,即λ为实数;当A 为反Hermite 矩阵时,由式(5.1.3)知Re(λ)=0,即为λ为零或纯虚数。
定义.5.1设,)(n n rs Ca A ⨯∈=记∑≠==n rs s rs a A 1r ||)(R ),R (r 简写为.,,1n r =如果00|a r r 0|r R >,则称矩阵A 按行(弱)对角占优。
定义5.2 设A ∈C n×n 。
如果A T 按行严格对角占优,则称A 按列严格对角占优;如果A T 按行(弱)对角占优,则称A 按列(弱)对角占优。
对直接估计矩阵特征之乘积的模的界,再给出以下两个方法。
定理5.3 设A=(a rs )∈C n×n ,令M r =|a rr |+∑∑+=+=-=n r s nr s rs rr r rs a a m a 11|||||,| 如果A 按行严格对角占优,则∏∏∏===≤=≤n r n r nr r r r M A A m 111|)(||det |0λ (5.1.5)且当a rs =0(s>r)时,式(5.1.5)中等号成立。
证明:由于A 按对角占优, 所以det(A)≠0.考虑方程组21222211120,n n n n nn a a a A A a a a ξξ⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪+== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭因为A 按行对角占优, 因此A 1也按行对角占优。
从而A 1可逆。
上述线性方程组有唯一解x (1)=(ξ2, …,ξn )T .可以证明 |ξ k |=max {|ξ2|, …,|ξn |} <1,事实上,若|ξ k |=0 则显然成立。
若|ξ k |≠0, 我们有 a k 1+2n ks s s aξ=∑=0 (2 ≤ k ≤ n )则有 121n s kk k sks k ks k a a a ξξξ=≠-=+∑ (2 ≤ k ≤ n ) 如果|ξ k | ≥ 1, 则可得12||||||nkk k sk s s k a a a =≠≤+∑ (2 ≤ k ≤ n )这和A 对角占优矛盾。
因此|ξ k |=max {|ξ2|, …,|ξn |} <1成立。
利用分块矩阵的性质和x (1)的定义,我们有det(A)=det (1)110n -⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭A xI = det 1112110n b a a A ⎛⎫⎪⎝⎭ 其中b 11=a 11+12n s s s aξ=∑, |ξs |<1 (s =2,…,n )从而m 1 ≤ |b 11|≤ M 1, 其余类推可得0<1n r r m=∏|det |A ≤1nr r M =≤∏定理5.4 (H adamard’s inequality )设A=(a rs )∈C n×n ,则有122111|()||det |[(||)]n n n rrs r r s A A a λ====≤∑∏∏(5.1.7) 且式(5.1.7)中等号成立的充分条件是某a s 0=0或者(a r ,a s )=0 (r ≠ s ),这里a 1,…,a n 表示A 的n 个列向量。
证明:若a 1,…,a n 线性相关,则式(5.17)显然成立。
不妨设a 1,…,a n 线性无关,则对它们进行Gram-schmidt 正交化过程得到:a 1=b 1a 2=b 2+λ21b 1…a n =b n +λn 1b 1 +λn 2b 2+…+λn , n -1b n -1其中b 1 ,b 2,…b n 为正交向量。
从而||a i ||2≥||b i ||2记B=( b 1 ,b 2,…b n ).则A=BL, 其中L 为单位下三角矩阵。
|det(A)|2=|det(B)|2=det(B T B)=|| b 1||2⋅||b 2||2…||b n ||2.≤|| a 1||2⋅||a 2||2…||a n ||2.推广的定理5.4 (H adamard’s inequality )设A=(a rs )∈C n×n ,则有2121221111|||()||det |[(||max )]||n kl rl n n n l rrs n k s r r kl l a a A A a aλ======≤-∑∑∏∏∑ 证明:由于|det(A)|2=det (A H A )=det 111(,)H a a A αα⎛⎫ ⎪⎝⎭ = det 11111(,)0H H a a A A ααα-⎛⎫- ⎪⎝⎭ 利用对于任给的β ≠0有1211||/H H H A A αααβββ-≥从而有|det(A)|2≤[(a 1,a 1)-|αH β|2/βH A 1β]det(A 1)我们可以取β =e k ,这样我们就有|det(A)|2≤[(a 1,a 1)-max k>1|(a 1,a k )|2/(a k ,a k )]det(A 1) (*) 类似推导可以得到命题的证明。