中科院矩阵分析chapt4

中科院矩阵分析chapt4
中科院矩阵分析chapt4

第4章 矩阵分解与表示

(I)高斯消去法

假设矩阵A 的顺序主子式i D ≠0 (i=1,…,n-1),

则我们可以进行以下的顺序消元过程

1.消元过程

n k k i b m b b n

k k j i a m a a k k ik k i k i k kj ik k ij k ij ,,2,1,,,2,1,,)

()

()

1()()()1( ++=-=++=-=++

等价于用初等矩阵T k k k e l I L -=分别

左乘)(k A 和)(k b ,即

)()1(k k k A L A =+ (1)

其中,T k n k k k k k m m m l ),,,,0,,0(,,2,1 ++=,

n k i a a m k kk k ik ik ,,1,/)()( +==

我们称ik m 为消元因子,)(k kk a 为主元素;

消元过程的一个重要性质是:消元过程不改

变矩阵的顺序主子矩阵的行列式(顺序主子式)的值。

????

??????---=012131121A ,顺序主子式为,1,5,-10 ????

??????--?????→?++250050121)1*(2)3(),1()2(,顺序主子式为,1,5,-10 ????

??????--??→?-200050121)2()3(,顺序主子式为,1,5,-10 引理:约化的主元素)(i ii a ≠0的充要条件是

矩阵A 的顺序主子式i D ≠0 (i=1,…,k);

推论:若矩阵A 的顺序主子式i D ≠0

(i=1,…,k),则 1)1(11D a =,k i D D a i i i ii

,,2,1,/1)( ==-; 由此有若A 对称正定或严格对角占优,而

它们的顺序主子矩阵也是对称正定或严格

对角占优,从而顺序主子式不为0,顺序高斯

消去过程可进行;

2.回代过程:

()()

()()()1/()/,

1,2,,1n n n n nn

n k k k k k kj kk j k x b a x b a a k n n =+?=??=-???=--?∑

设??????????---=012131121A ,????

??????-=311b , 用高斯消去法解线性方程Ax=b.

增广矩阵为 ??????????----3012

11311121 ??????????---?????→?++12500050

112

1

)1*(2)3(),1()2(

????

??????---??→?-120000501121)2()3(

??????????---??→?-2/1100

005011

21

2/)3( ??????????---??→?2/11000010

1121

5/)2(

????

??????--????→?-+2/110000102/3001)2*(2)3()1(, 因此,问题的解为

????

??????--=2/102/3x 3. 数值稳定性

1)选列主元;

2)选全主元;

3)高斯若当(Gauss-Jordan)消去法,求矩阵的逆;

????

??????---=012131121A , 求A -1.

增广矩阵为 ??????????---100012

010********* ??????????--?????→?++102250011050

00112

1

)1*(2)3(),1()2(

????

??????---????→?-11120005/15/10100011215/)2(),2()3( ????

??????---????→?+-2/12/12/110005/15/10102/12/12/1021)3()1(,2/)3( ????

??????---???→?-2/12/12/110005/15/10102/110/110/10012)*2()1( 从而

????

??????---=-5550225111011A 4.高斯顺序消元法解方程的计算量

1)乘除次数:3/3/23n n n -+

2)加减次数:6/52/3/23n n n -+

3)求矩阵的逆的计算量为o(4n )

(II) 顺序消元过程与矩阵的三角分解

(1) T k k T k k k e l I e l I L +=-=--11)(

(2) 若 ,j i ≤则有0=j T i l e ,从而

T j j T i i T j j T i i e l e l I e l I e l I ++=++))((,

L e l e l e l I L L L T n n T T n =++++=---

---1

12211111211

(3) 由)()1(k k k A L A =+ 有)(111211)1(n n A L L L A A ----==

故有 A =LU ,

其中)(n A U =,

T n n T T e l e l e l I L 112211--++++= .

这时L 为单位下三角矩阵。

矩阵的三角分解

A =(a 1,a 2,…,a n )T =PR =(p 1,p 2,…,p n )R

(a) LU 分解(Doolittle 分解)

(1) 存在唯一的条件;(顺序主子式不为0)

(2) 公式推导;(矩阵乘法)

定义4.1 如果方阵A 可分解成一个下三角

矩阵L 和一个上三角矩阵U 的乘积,则称

A 可作三角分解. 如果方阵A 可分解成

A=LDU,其中L 为一个单位下三角矩阵,

D 为对角矩阵,U 是一个单位上三角矩阵,

则称A 可作LDU 分解。

推论:若矩阵A 的顺序主子式?k ≠0

(k=1,…,n),则A 可唯一分解为

A=LDU, 其中L 为一个单位下三角矩阵,

D 为对角矩阵,U 是一个单位上三角矩阵。

d k =?k /?k -1 (?0=1)。

定理4.2 设A 是n 阶非奇异矩阵,则存在

置换矩阵P 使得PA=LDU, 其中L 为一个

单位下三角矩阵,D 为对角矩阵,U 是一个

单位上三角矩阵。

定义4.2 设A 存在唯一的LDU 分解.若把

A=LDU 中的D 和U 结合起来,并且用

U ’表示,则得到唯一的LU 分解

A=LU ’

称为Doolittle 分解;若把A=LDU 中的L 和D

结合成L ’,就得到A=L ’U

称为Crout 分解。

LU 分解的公式:

l ik =a ik -(l i1u 1k +…+l i,k-1u k-1,k )

u kj = [a kj -(l k1u 1j +…+l k,k-1u k-1,j )]/l kk

Crout 分解类似。

(b)平方根法

(1)对称矩阵的三角分解定理;

T LDL A =

(2)对称正定矩阵的三角分解(Cholesky 分解)

T LL A =

递推公式

g ii =(a ii -∑-=112i k ik g

)1/2

g ij =[a ij -(g i 1g j 1+g i 2g j 2+…+g i,j -1g j,j -1)]/g ii , i>j

g ij =0 i

四、分块矩阵的拟LU 分解和拟LDU 分解

??

????=22211211A A A A A 若A 11可逆,作??

????-=-21112110n n I A A I L

则 1112

1222111120A A LA A A A A -??=??-??

从而det(A)=det(A 11)?det(12111

2122A A A A --) 同样若A 22可逆,可得类似结果。

推论:设A ∈R m ?n ,B ∈R n ?m .则

det(I m +AB )= det(I n +BA )

矩阵求逆引理(Woodbury 公式)

(A +BC )-1=A -1- A -1B (I +CA -1B )-1CA -1

证明: 求方程(A +BC )x = b,

令y =Cx, 则有 Ax +By =b

-Cx +y =0

写成矩阵为 ??

????=????????????-0b y x I C B A ,

利用高斯消去法有

??

????-0I C b B A ??

????+????→?--+-b CA B CA I b B A CA 11)1*()2(01 ??

????+?????→?---+--b CA B CA I I b B A B CA I 111)2*()()(011 ??????++-???→?-------b CA B CA I I

b CA B CA I B I A B 111111)

2*()1()(0))((0 ??????++-??→?---------b CA B CA I I b CA B CA I B A A I A 11111111)1*()(0))((01 因此可得

x = (A -1- A -1B (I +CA -1B )-1CA -1)b,

而由(A +BC )x = b 可得x = (A +BC )-1b

由于b 的任意性可得

(A +BC )-1=A -1- A -1B (I +CA -1B )-1CA -1

从而命题得证。

推论:(A +BD -1C )-1=A -1- A -1B (D +CA -1B )-1CA -1

例??????????-----=321

151120A =??????????------+??????????-121121121200030001 =[]12111120

0030001-??????????---+??????????-

由于

[]611112000300011211=????

??????---????

??????---

利用矩阵求逆引理有 []11111100030002100110010301112103060021002-----????=-????-??

-??????????????-+- ???????????????---??

????A []2/13/212/13/11762/10003/10001--????

??????---??????????-= []2/13/212/13/11762/10003/10001--????

??????---??????????-=

Schur 补

设矩阵A ∈C n ?n 为非奇异,I,J ?{1,2,…,n}为有序的指标集,

I ≠?, I ≠{1,2,…,n}。令R={1,2,…,n}/I, S={1,2,…,n}/J 。

假定A I , A I,J 非奇异,

则Schur 补A/A I 定义为:

A/A I =A R -A R,I (A I )-1A I,R

A/A I,J =A R,S -A R,J (A I,J )-1A I,S

(当A I,J 不可逆时,使用广义逆(A I,J )+)

其中,A I 表示由矩阵A 的元素其行数和列数在I 中

组成主子矩阵,其余类似。

定理:假设A I 非奇异,那么 A 非奇异的充要条件为

A/A I 非奇异,此时我们有:

(A -1)R =(A/A I ) -1 (1)

(A -1)R,I = -(A/A I ) -1A R,I (A I )-1 (2)

(A -1)I,R = - (A I )-1A I,R (A/A I ) -1 (3)

(A -1)I = (A I )-1- (A I )-1A I,R (A/A I ) -1 A R,I (A I )-1 (4)

从定理的条件看我们发现I 和R的位置可以完全

互换,因此交换I 和R 时等式一定成立。

由公式(1)和(4)可以得到Woodbury 公式.

Schur 补的商性质:

设A B E M C D F G H L ?? ?= ? ???

, A '=A B C D ?? ???, B '=B E D F ?? ???, C '=C D G H ?? ???, D '=D F H L ?? ???

, 假设 D '/D 非奇异,则商性质为

M/D '=((M/D)/(D '/D))= A '/D - (B '/D) (D '/D)-1(C '/D) 证明:M/D '=A -(B,E)(D ')-1

???? ??G C

(D ')-1=???? ??''-'-'+---------111111111)/()/()/()/(D D HD D D D D F D HD D D F D D 从而M/D '=A -(B,E)(D ')-1???

? ??G C =A -B{D -1+D -1F (D '/D)-1HD -1}C +BD -1F (D '/D)-1G+E (D '/D)-1HD -1C -E (D '/D)-1G

=A -BD -1C -BD -1F (D '/D)-1HD -1C

+BD -1F (D '/D)-1G+E (D '/D)-1HD -1C -E (D '/D)-1G

=A '/D -BD -1F (D '/D)-1(HD -1C -G)+E (D '/D)-1(HD -1C -G)

=A '/D+(E -BD -1F) (D '/D)-1(HD -1C -G)

=A '/D -(E -BD -1F) (D '/D)-1(G -HD -1C)

=A '/D -(B '/D) (D '/D)-1(C '/D)

从而得证.

M/D =???

? ??''''D D D C D B D A //// 当A,E,G ,L 为数时,这时等式的两边为标量

从而A '/D=det(A ')/det(D), B '/D=det(B ')/det(D),

C '/D=det(C ')/det(D),

D '/D=det(D ')/det(D),

M/D '=det(M)/det(D ').

这时我们有

det(M)?det(D)=det(A ')det(D ')-det(B ')?det(C ')

这就是所谓的Sylvester 行列式恒等式.

矩阵的QR 分解

Givens 变换与Householder 变换

1. Givens 变换

定义:设实数c 与s 满足 c 2+s 2=1, 称

????????????????

??????????????????-=1][][1][11][11j i j c s i s c T ij

为Givens 矩阵,也可记作T ij =T ij (c,s). 由Givens 矩阵确定

线性变换称为Givens 变换。

性质1. Givens 矩阵是正交矩阵,且有

[T ij (c,s)]-1=[T ij (c,s)]T =T ij (c,-s)

det[T ij (c,s)]=1

性质2 设x =(ξ1,ξ2,?,ξn )T ,y =T ij x=(η1,η2,?,ηn )T ,则有

ηi = c ξi +s ξj

ηj = -s ξi + c ξj

ηk =ξ k ( k ≠i, j )

定理4.3 设x =(ξ1,ξ2,?,ξn )T ∈R n ,x ≠0,则存在有限个Givens 矩阵

的乘积,记作T ,使得Tx =|x |e 1.

推论. 设非零列向量x ∈R n 及单位列向量z ∈R n ,则存在

有限个Givens 变换矩阵的乘积,记作T ,使得Tx =|x |z .

2. Householder 矩阵和Householder 变换

定义4.5 设单位列向量u ∈R n ,称

H =I -2uu T

为Householder 矩阵(初等反射矩阵),由Householder 矩阵

确定的线性变换为Householder 变换(初等反射变换).

(1). H T =H (对称矩阵)

(2). H T H =I (正交矩阵)

(3). H 2=I (对合矩阵)

(4) H -1=H (自逆矩阵)

(5) det(H )= -1

定理4.4 任意给定非零列向量x ∈R n (n>1)及单位列向量

z ∈R n ,则存在Householder 矩阵H ,使得Hx =|x| z .

定理4.5 初等旋转矩阵(Givens 变换)是两个初等反射矩阵

(Householder 变换)的乘积。

证明:对初等旋转矩阵T ij ,取

u =(0,…,0,sin(θ/4),0,…,0,cos(θ/4),0,…,0)T

v =(0,…,0,sin(3θ/4),0,…,0,cos(3θ/4),0,…,0)T

直接计算可得

T ij =H v H u

从平面上看,我们可以得出

H θ(α)= π+2θ-α

其中H =I -2uu T

x

y 为变换后的向量, 用它与正半实轴的夹角表示为

α+2(π/2+θ-α)=π+2θ-α。

G θ(α其中,θ为旋转角度;

x 为变换前的任意向量,用它与正半实轴的夹角α表示;

y 为变换后的向量, 用它与正半实轴的夹角表示为 θ+α。

我们需要证明的目标就是找到两个向量u 1和u 2使得它们

对应的Householder 变换的乘积等于给定的一个旋转

变换G θ(α)。

根据前面的讨论我们对于H 变换和G 变换都可以用

向量的角度表示。因此有

H θ2H θ1(α)=π+2θ2-(π+2θ1-α)=2(θ2-θ1)+α =θ+α= G θ(α) 可见θ =2(θ2-θ1)成立即可。 这个等式在几何成立的意思: x 和H(u 2)H(u 1)x 之间的夹角等于二倍的

u 1和u 2之间的夹角。

这在几何上是显然的。因为u 1对应的垂线l 1平分

x 和H(u 1)x 的夹角;

同样,因为u 2对应的垂线l 2平分

H(u 1)x 和H(u 2)H(u 1)x 的夹角。

注意到l 1和l 2的夹角和向量u 1和u 2的夹角相等。

因此结论是显然的。

换句话说,对于给定的旋转变换,仅需找到夹角为

旋转角度的二分之一的两个向量,用它们作反射变换,

就可以得到旋转变换。

定理(Householder 矩阵的乘积公式)

1122()()()T T T k k I U V I U V I U V -?-???-

= I -1()T U I R V -+

其中U =(U 1,U 2,…,U k ), V = (V 1,V 2,…,V k )

12111212100

00

000000T T T k k T T k k T k k V U V U V U V U V U R V U ---?? ? ? ?= ? ?

??

?

为V T U 分块乘积矩阵的严格上三角部分。

若记U =(U k ,U k -1,…,U 1), V = (V k ,V k -1,…,V 1)

1122()()()T T T k k I U V I U V I U V -?-???-

= I -1()T U I L V -+

其中L 为为V T U 分块乘积矩阵的严格下三角部分。

证明:可以使用数学归纳法.

矩阵QR(正交三角)分解

定义4.6 如果实(复)矩阵A 能够化成正交矩阵Q 与实 (复)非奇异上三角矩阵R 的乘积,即 A=QR

则称为A 的QR 分解。

定理4.6 设A 是n 阶实(复)非奇异矩阵,则存在正交(酉) 矩阵Q 与实(复)非奇异上三角矩阵R 使得 A=QR

且除去相差一个对角元素的绝对值(模)全等于1的对角矩阵 外,分解唯一。即QR 分解存在唯一。

证明:存在性:使用Gram-schmidt 正交化过程。

唯一性:A=QR=Q 1R 1从而P=(Q 1)T Q= R 1 R -1

注意到I=P T P 所以P -1=P T ,而P 为上三角矩阵,其逆也为上 三角矩阵,而P T 为下三角矩阵, 从而P 为对角矩阵. 又P 2=I ,所以P 的对角元只能为正负1。

Q= Q 1P, R= R 1P.

定理4.7 设A 是m ?n 实(复)矩阵,且其n 个列线性无关, 则A 有分解 A=QR

其中Q 是m ?n 实(复)矩阵,且满足Q T Q=I, R 是实(复)非 奇异上三角矩阵R 且除去相差一个对角元素的绝对值(模) 全等于1的对角矩阵外,分解唯一。

定理 任何n 阶实非奇异矩阵A 可通过左连乘初等Givens 旋转矩阵化为上三角矩阵。

定理4.10 任何n 阶实非奇异矩阵A 可通过左连乘

Householder 矩阵化为上三角矩阵。

定义4.7 如果矩阵A 的次对角线以下元素全为零,则称

A 为上Hessenberg 矩阵;

定理4.11: 任何实方阵A 都可以通过初等旋转变换正交 相似与上Hessenberg 矩阵。

定理4.12任何实方正A 都可以通过初等反射变换正交 相似与上Hessenberg 矩阵。

推论:任何实对称矩阵A 都可以通过初等旋转变换(或 初等反射变换)正交相似于实对称三对角矩阵。

4.3 矩阵的满秩分解

复习矩阵的秩的概念和性质

定义:矩阵行或列向量的最大线性无关组的向量个数。

思考题:证明矩阵的行秩和列秩相等。

性质:rank(AB ) ≤min (rank(A ),rank(B ))

定义4.8 设A ∈n m r C ?(r>0),如果存在矩阵F ∈r m r C ?和

G ∈n r r C ?使得 A =FG

则称为A 的满秩分解。

当A 为行满秩或列满秩矩阵时,A 可分解为一个因子为 单位矩阵,另一个为A 本身,称为平凡分解。

定理:设A ∈n m r C ?则A 的满秩分解存在。

证明过程即为构造过程。

证明:设A =(a 1,a 2,…,a n ), 取A 的列向量组的一个极大 线性无关组,不妨设为a i 1,a i 2,…,a ir , 则对于A 的

任意i 列a i 可以表示为a i 1,a i 2,…,a ir 的线性组合。即

a i =g 1i ?a i 1+ g 2i ?a i 2+…+ g ri ?a ir , i =1,2,…,n

写成矩阵形式有

A =FG

其中F =( a i 1,a i 2,…,a ir ), G =(g 1,g 2,…,g n ), g i =(g 1i , g 2i …, g ri )T , 显然F 为列满秩的矩阵,G 为行满秩的矩阵(为什么?)。

注:满秩分解不唯一。

定义4.9 Hermite 标准形, B ∈n m r C ?满足

1)B 的前r 行中每一行至少含一个非零元素,且第一个 非零元素是1,而后m-r 行的元素都为0;

2)若B 中第i 行的第一个非零元素1在第j i 列(i=1,2,…,r), 则 j 1

3)中的j 1,j 2,…,j r 列为单位矩阵I m 的前r 列。

Be jk =e k

例如:

????

? ????????=000000010000010B

这样B ∈732?C 为Hermite 标准形。

定理: 任意非零矩阵A ∈n m r C ?可通过初等行变换

化为Hermite 标准形B, 且B 的前r 行线性无关。

定义:置换矩阵是以n 阶单位矩阵的n 个列向量

为列按照任意顺序构成的矩阵。

定理4.14 设矩阵A ∈n m r C ?的Hermite 标准形为B ,

那么, 取F 为A 的j 1,j 2,…,j r 列构成m ?r 矩阵,

G 为B 的前r 行构成的r ?n 矩阵, A =FG .

证明:A →B ,知存在可逆矩阵P 使得PA =B

从而A =P -1B

将P -1分块为P -1=[F ,S ] 可得 A =FG ,其中G 为B 的

前r 行构成的r ?n 矩阵。(为什么?)

注意到B 为Hermite 标准形,从而它的后n -r 行为0向量.

作置换矩阵P 1使得BP 1=??

????0012B I r 从而AP 1= P -1BP 1=[F ,S ] 1200r ??????

I B =[F ,FB 12] 从而F 为A 对应的列。

下面根据定理4.14的写出满秩分解的一般过程.

例:利用高斯消去法求解矩阵A 的满秩分解

A=1230324

60612313-?? ?- ? ?---??

首先,对于矩阵A 化为Hermite 标准型.

A=1230324

60612313-?? ?- ? ?---??

(2)2*(1)(3)(1)123030000

000016-+-?? ?????→ ? ?-?

? (1)(1)(3)(1)123030000

000016÷-÷----?? ?????→ ? ?-?

? 12303000

1600000---?? ??????→- ? ???

交换(2)和(3) 由于j=1,4构成了三阶单位矩阵的前两列,从而A 的第1列 和第4列构成满秩分解矩阵F,即

F=102011-?? ?- ? ?-??

,相应的G 为B 的前两行,即

G=1230300016---?? ?-??

可以直接验证A=FG .

例:rank(A +B )≤rank(A )+rank(B )

例:设矩阵A ∈n m r C ?(r >0), 则必有分解

A =QR .

其中,Q 为m ? r 矩阵, Q H Q=I, 而R 为r ? n 矩阵,它 的行线性无关。

证明:作A 的满秩分解

A =FG

其中F ∈m r r C ?,G ∈r n r C ?.由矩阵的QR 分解定理有

F =QR 1

其中Q 为m ? r 矩阵, Q H Q=I, 而R 1为r 阶非奇异矩阵。 于是 A = FG = QR 1G =QR.

这里R =R 1G ,它的r 个行线性无关。

定理(习题4.3,第4题). 设F ∈m r r C ?,G ∈r n r C ?, 则

rank(FG )= r

证明:显然 rank(FG )≤ r (a)

如果rank(F H F )= rank(GG H ) = r .

则 rank(F H FGG H ) = r .,从而

rank(FG )≥ r (b)

这样rank(FG )= r .

下面我们证明rank(F H F ) = r (实际为习题4.3 第2题)

这需要证明F H F 为满秩矩阵。仅需证明对任意x ∈C r ,若 F H Fx =0 则 x =0 即可。

事实上, 由F H Fx =0可得x H F H Fx=0,

从而||Fx||=0,根据范数定义, Fx=0;

再由F 为列满秩矩阵,可得x=0。

这样证明了。

思考题: 设F ∈m r r C ?,G ∈r m r C ?, 则rank(GF )= r 成立吗? 若是,证明之;若否,研究成立的条件是什么?

下面利用满秩分解讨论线性方程组求解。

Ax = b,

设A 的满秩分解为A=FG , 方程变为FGx=b.

则若b ∈R (F), 则存在相容解。

若b ?R (F), 则不存在相容解,这时我们可以将b 投影 到R (F)得到b '=F (F H F )-1F H b

b

R(F)

b'

这时方程求解的实际就是所谓最小二乘解。

如果这样方程组变为F Gx= F (F H F)-1F H b.

由于G的秩为r因此方程组Gx= (F H F)-1F H b

肯定有解。如果G不为方阵,

则解不惟一。这时需要求解所谓最小范数解。

即x= G H(GG H)-1(F H F)-1F H b

这就是所谓最小范数最小二乘解。

10个随机逼近点,y= x2+r, 其中r为[-0.1,0.1]之间均匀分布的随机数。根据模型y=ax2+bx+c,利用

最小二乘解得到的逼近结果。红线所在点为逼近点蓝线为y= x2,绿线为求得的逼近解。

20个随机逼近点,y= x2+r, 其中r为[-0.1,0.1]之间均匀分布的随机数。根据模型y=ax2+bx+c,利用

最小二乘解得到的逼近结果。红线所在点为逼近点蓝线为y= x2,绿线为求得的逼近解。

4.4 矩阵的奇异值分解

1.矩阵的正交对角分解

我们知道实对称矩阵A 或Hermite 矩阵A 都可正交相似于 对角矩阵, 即

A =Q H DQ

由定理4.12 任何实方阵A 都可以正交相似于上Hessenberg 矩阵。

即 A =Q T HQ

定理:对于任何非奇异的实方阵,存在正交矩阵P 和Q 使得P T AQ 为正对角矩阵D 。即A =PDQ T

证明: 由于A 非奇异,因此A T A 为实对称矩阵。于是存在 正交矩阵Q 使得 Q T (A T A )Q =K,K 为对角矩阵,其对角元为 A T A 的特征值,它们大于0.

因此记 P =AQK -1/2, 易验证P T P =I.记D=K 1/2

且A= PDQ T .

2矩阵的奇异值分解

基本事实:

1.设A ∈n m r C ?(r>0),则A H A 是Hermite 矩阵,且

其特征值非负。

2. rank(A )=rank(A H A )

3. 设A ∈m n C ?,则A =0的充要条件为A H A =0.

定义: 设A ∈n m r C ?,A 的奇异值为A H A 的特征值的非负 平方根。

定理4.16 设A ∈n m r C ?,则存在m 阶酉矩阵U 和n 阶 酉矩阵V 使得U H A V =000∑??????

, 其中∑=diag(σ1,σ2,…,σr ), 而σi 为矩阵A 的全部非零奇异值。

或者写为 A =U ??

????∑000V H 称为A 的奇异值分解。 证明过程略。

显然由证明过程可见,若A 为实矩阵,则定理4.16中 U 和V 都可以为正交矩阵。

例4.15 设矩阵A =U ??

????∑000V H ,则U 的列是AA H 的 特征向量, V 的列为A H A 的特征向量。

反之不一定对,即设U 的列是AA H 的特征向量,V 的列

为A H A 的特征向量。那么U ??????∑00

0V H =A 不一定成立。 定理4.17 在奇异值分解A =U ??

????∑000V H ,设U 和V 的 列向量分别为u 1,u 2,…,u m 和v 1,v 2,…,v n , 则

N(A )=L(v r+1,v r+2,…,v n )

R(A )=L(u 1,u 2,…,u r )

A =σ1u 11H v +σ2u 22H v +…+σr u r H r v (广义谱分解)。

奇异值分解的统计意义:

若x 一个均值为0的n 维随机向量,A 的每一行表示它的 一次抽样,则A H A/m 表示随机向量x 的在m 次独立

抽样基础上对相关矩阵的一个无偏估计。如果对随机向量x 进行线性变换

y =V H x

则随机向量y 在m 次独立抽样基础上对相关矩阵的一个

无偏估计为对角矩阵,因此我们有理由认为y 为线性独立的。 并且,更为重要的是,我们可以仅取y 的前几位分量,就可以 得到对x 的一个较好的近似表示。这几个分量我们称为主分量。 求取y 的过程称为主分量分析。

它们是特征提取和数据压缩的依据所在。

奇异值分解在图像压缩中的应用。

3 矩阵正交相抵

定义:设A ,B ∈R m ?n ,如果存在m 阶正交矩阵U 和V 使得

B =U T A V , 则称A 和B 正交相抵。

性质:矩阵的正交相抵为等价关系。

定理4.18 正交相抵的矩阵有相同的奇异值。

反之,若实矩阵有相同的奇异值,则它们为正交相抵的。 由奇异值分解定理,任意矩阵都和一个对角矩阵正交相抵。

矩阵表示

一般的矩阵我们可以表示为几个矩阵的和或者几个矩阵的积 非奇异矩阵A :存在置换矩阵P ,使得AP=LU ;

任意矩阵A: 可以分解为两个对称矩阵的乘积;

可以相似于Jordan 标准型;

对称矩阵,正定矩阵, A T =A, A=LDL T

正交矩阵:e A ,其中A 为反对称矩阵

定理:设U=(u 1,u 2,…,u n )为下三角矩阵,且u i 为单位向量 u ii >0(若u ii =0则其对应的矩阵项可以省略), 任何正交矩阵A 都可以表示为:

A=111

222(2)(2)(2)T T T n n n I u u I u u I u u ααα--???- 其中αi 等于0或1。表示唯一

二阶正交矩阵可以表示为

cos sin sin cos αααα-?? ???100δ?? ???

其中δ等于1或-1。

证明:对A T 进行QR 分解,并且要求R 的对角元素为正, 由分解过程可以得到证明。

并且由QR 分解的唯一性可以证明这种表示是唯一的。

中科院矩阵分析与应用大作业

中科院矩阵分析与应用大作业 实现LU分解 QR分解 Householder reduction、Givens reduction Matlab 代码: function [] =juzhendazuoye A=input('请输入一个矩阵A='); x=input('请输入序号 1 LU分解 2 Gram-Schmidt分解 3 Householder reduction 4 Givens reduction:' ); if(x==1) %%*************LU分解*****************%% disp('PA=LU') m=size(A,1); % m等于矩阵A的行数 n=size(A,2); % n等于矩阵A的列数 if(m==n) % 判断矩阵A是不是方阵 % 如果矩阵A不是方阵那么就输出“error” U=A; % 把矩阵A赋值给矩阵U L=zeros(n); % 先将L设为单位阵 P=eye(n); % 首先将交换矩阵P设为单位矩阵 for j=1:n-1 for i=j+1:n if (U(j,j)~=0) %判断主元元素是否不为0

L(i,j)=U(i,j)/U(j,j); U(i,:)=U(i,:)-U(j,:)*U(i,j)/U(j,j); % U(j,j)为主元元素 else a=j+1; % 令a等于j+1 while((U(a,j)==0)&&(a

中科院-模式识别考题总结(详细答案)

1.简述模式的概念及其直观特性,模式识别的分类,有哪几种方法。(6’) 答(1):什么是模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。 模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。 模式的直观特性:可观察性;可区分性;相似性。 答(2):模式识别的分类: 假说的两种获得方法(模式识别进行学习的两种方法): ●监督学习、概念驱动或归纳假说; ●非监督学习、数据驱动或演绎假说。 模式分类的主要方法: ●数据聚类:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据 集。是一种非监督学习的方法,解决方案是数据驱动的。 ●统计分类:基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。 特征向量分布的获得是基于一个类别已知的训练样本集。是一种监督分类的方法, 分类器是概念驱动的。 ●结构模式识别:该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目 的。(句法模式识别) ●神经网络:由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以 在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联 系的权重系数来(weight)实现。神经网络可以实现监督和非监督学习条件下的分 类。 2.什么是神经网络?有什么主要特点?选择神经网络模式应该考虑什么因素? (8’) 答(1):所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处 理系统(计算机)。由于我们建立的信息处理系统实际上是模仿生理神经网络,因此称它为人工神经网络。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。 人工神经网络的两种操作过程:训练学习、正常操作(回忆操作)。 答(2):人工神经网络的特点: ●固有的并行结构和并行处理; ●知识的分布存储; ●有较强的容错性; ●有一定的自适应性; 人工神经网络的局限性: ●人工神经网络不适于高精度的计算; ●人工神经网络不适于做类似顺序计数的工作; ●人工神经网络的学习和训练往往是一个艰难的过程; ●人工神经网络必须克服时间域顺序处理方面的困难; ●硬件限制; ●正确的训练数据的收集。 答(3):选取人工神经网络模型,要基于应用的要求和人工神经网络模型的能力间的 匹配,主要考虑因素包括:

中科院矩阵分析chapt3

矩阵分析及其应用 3.1矩阵序列 定义3.1设矩阵序列{A (k )},其中A(k)=( a (k ) ) C m n ,当k a j" a u 时,称矩阵序列{A (k)}收敛,并称矩阵 A=( a ij )为矩 阵序列{A (k)}的极限,或称{A (k)}收敛于A,记为 lim A (k) A 或 A (k) A k 不收敛的矩阵序列称为发散的。 由定义,矩阵序列 A (k )发散的充要条件为存在 j 使 得数列a (k)发散。 类似地,我们可以定义矩阵收敛的 Cauchy 定义 定义3.1'矩阵序列{A (k)}收敛的充要条件为 对任给>0存在N(),当k, l N()时有 ||A (k) A (l)|| < 其中||.|为任意的广义矩阵范数。 sin 』) n n sin(k) 如果直接按定义我们因为求不出 A (n)的极限从而 从而只要I 充分大,则当m, n > l 时就有 sin(k) k 2 这样A (l)收敛。 定理3.1 A (k) A 的充要条件为 ||A (k) A|| 0 证明:利用广义矩阵范数的等价性定理,仅对 范数可以证 明。 即c 1 IL A (k) A|| ||A (k) AII C 2 ||A (k) AII 性质 0 若 A (k) A ,则 ||A (k) II IIAII 成立。 性质 1. 设 A (k) A m n , B (k) B m n , 则 A (k)+ B (k) A+ B , ,C 性质 2. 设 A (k) A m n , B (k ) B n l ,贝U A (k) B (k) A B 证明:由于矩阵范数地等价性,我们可以只讨论相容的 矩阵范数。 ||A (k )B (k) A B|| || A (k) B (k) A B (k)||+||AB (k) A B|| || A (k) A|| ||B (k)||+||A||||B (k) B|| 例 1 A (n) k m 1 k(k 1) 相反,由于

2020-2021年中国科学院大学(中科院)概率论与数理统计考研招生情况、分数线、参考书目及备考经验

一、中国科学院数学与系统科学研究院简介 中国科学院数学与系统科学研究院由中科院数学研究所、应用数学研究所、系统科学研究所及计算数学与科学工程计算研究所四个研究所整合而成,此外还拥有科学与工程计算国家重点实验室、中科院管理决策与信息系统重点实验室、中科院系统控制重点实验室、中科院数学机械化重点实验室、华罗庚数学重点实验室、随机复杂结构与数据科学重点实验室,以及中科院晨兴数学中心和中科院预测科学研究中心等。2010年11月成立国家数学与交叉科学中心,旨在从国家层面搭建一个数学与其它学科交叉合作的高水平研究平台。数学与系统科学研究院拥有完整的学科布局,研究领域涵盖了数学与系统科学的主要研究方向。共有16个硕士点和13个博士点(二级学科),分布在经济学、数学、系统科学、统计学、计算机科学与技术、管理科学与工程六个一级学科中,可以在此范围内招收和培养硕士与博士研究生。在2006年全国学科评估中,我院数学学科的整体评估得分为本学科的最高分数。数学与系统科学研究院硕士招生类别为硕士研究生、硕博连读生和专业学位硕士研究生。2019年共计划招收122名。 二、中国科学院大学概率论与数理统计专业招生情况、考试科目

三、中国科学院大学概率论与数理统计专业分数线2018年硕士研究生招生复试分数线 2017年硕士研究生招生复试分数线

四、中国科学院大学概率论与数理统计专业考研参考书目 616数学分析 现行(公开发行)综合性大学(师范大学)数学系用数学分析教程。 801高等代数 [1] 北京大学编《高等代数》,高等教育出版社,1978年3月第1版,2003年7月第3版,2003年9月第2次印刷. [2] 复旦大学蒋尔雄等编《线性代数》,人民教育出版社,1988. [3] 张禾瑞,郝鈵新,《高等代数》,高等教育出版社, 1997. 五、中国科学院大学概率论与数理统计专业复试原则 在中国科学院数学与系统科学研究院招生工作小组领导下,按研究所成立招收硕士研究生复试小组,设组长1人、秘书1人。 复试总成绩按百分制计算,其中专业知识成绩占60%,英语听力及口语测试成绩占20%,综合素质成绩占20%。 在面试环节,每位考生有5分钟自述,考查内容主要包括专业知识、外语(口语)水平和综合素质等。 1、专业知识面试重点考查考生对专业基础知识掌握的深度和广度,对知识灵活运用的程度以及考生的实验技能和实际动手能力等,了解考生从事科研工作的潜力和创新能力。 2、外语面试主要考查考生的听、说能力及语言运用能力。 3、思想品德的面试包括考生的政治态度、思想品德、工作学习态度、团队合作精神、科研道德、遵纪守法以及心理素质等内容。 4、体检主要了解考生的身体健康状况,也包括体能、体质和心理素质等。 5、研究生部通过“政审表”向考生所在单位的人事、政工或考生管理部门了解考生的思想品德情况和现实表现。“政审表”将根据中国科学院大学时间部署与调档函一并寄发,需由考生本人档案所在单位的人事(政工)部门加盖公章,随档案一并寄回。政审合格方可寄发录取通知书。 六、中国科学院大学概率论与数理统计专业录取原则 复试小组对本学科参加复试的考生根据初试成绩和复试成绩的综合评定,得出拟录取考生名单,经数学与系统科学研究院招生工作领导小组审核通过。 最终录取成绩:将考生初试成绩和复试成绩按一定比例加权平均后,得出录取成绩。加权平均采用下列公式: 录取成绩=(初试成绩÷5)×40%+复试成绩×60%。复试成绩不合格者不予录取;政审不合格、体检不合格者不予录取。 拟录取名单确定后将在网站上公示10个工作日 七、中国科学院大学概率论与数理统计考研复习建议 1、零基础复习阶段(6月前)

中科院矩阵分析与应用大作业

中科院矩阵分析与应用大作业 实现LU分解QR分解Householder reduction、Givens reduction Matlab 代码: function [] =j uzhendazuoye A=input ('请输入?个矩阵A='); 2 Gram-Schmidt 分解 3 Householder reduction 4 x=input (*请输入序号1 LU分解 Givens reduction: 1); if (>:==!) 壮mmm分解mm%% disp('PA=LU1) m=size(A,1); %nt等于矩阵A的行数 n=size(A,2); %n等于矩阵A的列数 if (m==n) % 刊斯NA是不足方阵 % 如果矩阵A不是方阵那么就输出"error" U=A; %把矩阵至賦值给矩阵u L=zeros(n); %先将L设为单位阵 P=eye(n); %首先将交换矩阵P设为单位矩阵 for j =1:n-1 for i=j +1:n if (U(j, j)-=0) %判断主元元素是否不为0

L(i z j)=U(i z j) /U(j z j); U(i f :)=U(i, :)-U(j, j)/U(j z j); % U(j, j)为主元元素 else a=j+l;% 令 a 等于j + 1 while ( (U (a, j ) ==0) && (a

中科院矩阵分析chapt4

第4章 矩阵分解与表示 (I)高斯消去法 假设矩阵A 的顺序主子式i D ≠0 (i=1,…,n-1), 则我们可以进行以下的顺序消元过程 1.消元过程 n k k i b m b b n k k j i a m a a k k ik k i k i k kj ik k ij k ij ,,2,1,,,2,1,,) () () 1()()()1( ++=-=++=-=++ 等价于用初等矩阵T k k k e l I L -=分别 左乘)(k A 和)(k b ,即 )()1(k k k A L A =+ (1) 其中,T k n k k k k k m m m l ),,,,0,,0(,,2,1 ++=, n k i a a m k kk k ik ik ,,1,/)()( +== 我们称ik m 为消元因子,)(k kk a 为主元素; 消元过程的一个重要性质是:消元过程不改 变矩阵的顺序主子矩阵的行列式(顺序主子式)的值。 例 ???? ??????---=012131121A ,顺序主子式为,1,5,-10 ???? ??????--?????→?++250050121)1*(2)3(),1()2(,顺序主子式为,1,5,-10 ???? ??????--??→?-200050121)2()3(,顺序主子式为,1,5,-10 引理:约化的主元素)(i ii a ≠0的充要条件是 矩阵A 的顺序主子式i D ≠0 (i=1,…,k); 推论:若矩阵A 的顺序主子式i D ≠0 (i=1,…,k),则 1)1(11D a =,k i D D a i i i ii ,,2,1,/1)( ==-; 由此有若A 对称正定或严格对角占优,而 它们的顺序主子矩阵也是对称正定或严格 对角占优,从而顺序主子式不为0,顺序高斯 消去过程可进行; 2.回代过程: ()() ()()()1/()/, 1,2,,1n n n n nn n k k k k k kj kk j k x b a x b a a k n n =+?=??=-???=--?∑

中科院-科大真题最完整版+考试攻略

二、经验类 [quote]1:考中科院科大完全攻略! 普物类 力学科大出版社杨维宏很好的教材 电磁学高教社赵凯划经典教材(科大出版社的也不错) 热学高教社褚圣麟经典教材(科大出版社的也不错)已经出版了对照的习题解答 上述3门是普物a b的考试范围,弄清楚课后习题足够了! 电动力学郭硕鸿高教社已经出版了对照的习题解答 理论力学高教社已经出版了对照的习题解答 光学赵凯华北大出版社 量子类 量子力学卷1曾谨言科学出版社,最好同时购买习题集的上下册非常好搞清楚就足够了! 周世勋高教社《量子力学》入门型已经出版了对照的习题解答! 考科大、中科院的用这些足够了。还有哪些?大家提出我补充。现在资料更新很快,很多抖出了专门的习题集建议大家看最新的,00年以前的老掉牙的东西没什么用处了。 引用 2、各位朋友大家好:也谈中国科大物理辅导班笔记,物理教材! 我是科大研究生想告诉大家,不要太指望辅导班笔记。 看到不少人受到误导心痛不已,其实复习就是很简单的事情,很多教材的选择也就是基础常见的就足够了, 高教版的基本都是非常经典的还要习题集的选择电磁学力学等太多了,不过建议大家看一些比较新的资料。 老掉牙的就算了n年了,编这些书的老师估计早就退休了! 下面几个常见问题:

中国科大物理辅导班笔记,物理教材!(我觉得这个帖子很好) 1 辅导班何时开办? 每年的11月中旬,到12月20左右出来! 1 考科大用什么教材? 其实这个问题很简单了,当然最好是科大教材了,如果是科大习题集最好了,现在科大教材变化很快毫无疑问最好的教材就是最新的。多少年来变化很大的,但是科大教材不是好教材,力学其实复旦的比较好,科大yangweihong的觉得很一般,不过习题不错。电磁学毫无疑问是高教社的zhaokaihua的好啊,科大张玉民的也是很一般的教材。原子物理也是推荐高教社chushe nglin的很经典的教材。但是教材归教材,习题集最好还是选择科大这个道理很简单了 1 为什么考科大物理? 2科大物理国内一流国际闻名科大全公费住宿免费补助待遇每月500以上设备先进值得你去努力 2 外校能否报名? 不能,就是科大校内的学生也要凭借学生证,不是科大物理系的就很难接受。 3 辅导班笔记含金量多高? 辅导班笔记其实就是串讲班不叫辅导班,所以就是科大物理各门的大复习。知识点几乎面面据到! 4 市场上的辅导班笔记可信么? 这个我觉得还是大家自己判断为好。你相信外部人有么?自己决定! 5 给你辅导班笔记怎么判断真假? 首先要考虑对方可能会有么?如果可能有,对比一下是不是往年的笔记可信度多大?科大官方部不提供这个咨询服务。 6 如果没有辅导班笔记怎么复习? 扎扎实实的复习力学电磁学原子物理量子力学建议使用科大版本教材,道理很简单了。其实很多其他教材也不错,科大的很多教材很差不想想你想像的那么好! 引用 3、关于中科大中科院量子力学和普通物理考研试题的若干说明 热烈欢迎2008年考中科大中科院的同学们!!! 2008年考研的要提前准备才充分!!! 中国科学院的一些招生单位(包括物理所和高能所在内),在06年研究生入学考试抛弃了以前科大的命题,改由中科院研究生院命题。实际上就是由以前中科大的老师出题,变为中科院的研究机构的那些导师出题。(据了解,一些导师接到出题任务都很烦,因为科研压力大啊,出题就让自己带的研究生随便在习题集上

中科院矩阵分析课件

矩阵分析及其应用 3.1 矩阵序列 定义3.1 设矩阵序列{A (k)},其中A (k)=() (k ij a )∈C m ?n ,当k →∞, )(k ij a →a ij 时,称矩阵序列{A (k)}收敛,并称矩阵A=(a ij )为矩 阵序列{A (k)}的极限,或称{A (k)}收敛于A, 记为 A A k k =∞ →)(lim 或 A (k)→ A 不收敛的矩阵序列称为发散的。 由定义,矩阵序列A (k) 发散的充要条件为存在ij 使 得数列) (k ij a 发散。 类似地,我们可以定义矩阵收敛的Cauchy 定义 定义3.1' 矩阵序列{A (k)}收敛的充要条件为 对任给ε>0 存在N(ε), 当 k , l ≥ N(ε) 时有 ||A (k)-A (l )|| < ε 其中||.||为任意的广义矩阵范数。 例1 ???? ? ? ??- =∑=-n k n n k k e n n 12) ()sin()1sin(11A 如果直接按定义我们因为求不出A (n )的极限从而 很难应用定义3.1证明收敛。 相反,由于∑∑∑+=+=+=-≤≤n m k n m k n m k k k k k k 112 1 2 ) 1(1 1 ) sin( < 1/m 从而只要l 充分大,则当m, n > l 时就有 ε≤∑ +=n m k k k 1 2 ) sin( 这样A (l ) 收敛。 定理3.1 A (k)→ A 的充要条件为 ||A (k) -A||→0 证明:利用广义矩阵范数的等价性定理,仅对∞范数可以证明。 即 c 1 ||A (k) -A||∞ ≤ ||A (k) -A||≤ c 2 ||A (k) -A||∞ 性质0 若A (k)→ A , 则 ||A (k)|| → ||A|| 成立。

中科院矩阵分析_第五章

第五章 特征值的估计及对称矩阵的极性 本章主要讨论数值代数中的三个特殊理论, 即 特征值的估计 广义特征值问题 实对称矩阵(一般是Hermite 矩阵)特征值的 极小极大原理,其次也涉及到一些特征值 和奇异值的扰动问题,最后简要地介绍矩阵 直积的一些性质及其在线性矩阵方程求解 方面的应用。这几方面的内容,在矩阵的 理论研究与实际应用当中都有着相当重要 的作用。 5.1特征值的估计 一、特征值的界 首先给出直接估计矩阵特征值模的上界的 一些方法 定理5.1 设A=(a rs )∈R n×n ,令 M=||2 1 max ,1sr rs n s r a a -≤≤ λ若表示A 任一特征值,则λ的虚部Im(λ) 满足不等式 2 ) 1(|)Im(|-≤n n M λ |Im(λ)|≤||A -A T ||2 / 2 |Im(λ)|≤||A -A T ||1 ?/2. 证明:设x+i ?y 为对应于λ的A 的特征向量, 则 A(x+i ?y)=(α+β?i)(x+i ?y) 其中λ=α+β?i.显然x,y 为实向量,且x,y 为 线性无关的 向量。 经整理A(x,y)=(x,y)B, 其中B=??? ? ??-αββα 。 从而(x,y)T A(x,y)=(x,y)T (x,y)B 展开有

???? ??Ay y Ax y Ay x Ax x T T T T =α????? ??y y y x y x x x T T T T + β???? ? ? ?--x y y y x x y x T T T T (求等式两边矩阵的对角元之和,可得 α(x T x +y T y )=x T Ax +y T Ay (1) 等式两边矩阵的左上角单元减去右下角单元 可得: β(x T x +y T y )=x T (A -A T )y 1). 记B=A -A T ,则 |x T By|≤||x||2 ?||B||2?||y||2 从而 |β|≤||x||2 ?||B||2?||y||2 /((||x ||2)2 +(||y ||2)2) 利用ab /(a 2+b 2)≤1/2 可得 |β|≤||B||2 /2. 2). 由于|x T By|≤||Bx||1 ?||y||∞≤||B||1?||x||1 ?||y||∞ 从而 |β|≤||B||1 ?||x||1 ?||y||∞ /((||x ||2)2 +(||y ||2)2) 易证明 ||x||1 ?||y||∞ /((||x ||2)2 +(||y ||2)2) /2. (显然,不妨假设(||x ||2)2 +(||y ||2)2=1, 设||y ||∞=t =cos(α), 则y 必为t ? e j 的形式(为什么?), 从而极值转化为求解如下最大值问题: max ||x||1, 满足约束(||x ||2)2=1-t 2 这样有均值不等式||x||1 x ||2 = -t 2)1/2, 从而我们需要求解t (1-t 2)1/2的最大值,设t =cos(α) 可得t (1-t 2)1/2的最大值为1/2. 从而得证。) 因此 |β|≤||B||1 3). 由于b ii =0, i =1,2,…,n , b ij = -b ji , 因此 |x T By|2=| 1 1()n ij i j j i i j i b x y x y -=>??-∑∑|2 ≤(2M )2 2 1||n i j j i i j i x y x y =>??- ??? ∑∑ (利用(a 1+a 2+…+a n )2≤ n ((a 1)2+(a 2)2+…+(a n )2) ≤(2M )2 (n (n -1)/2) 21||n i j j i i j i x y x y =>??- ??? ∑∑

中科院矩阵分析课件.doc

矩阵分析及其应用 3.1矩阵序列 定义3.1设矩阵序列{应)},其中A?)=(#))£Cms,当k—oo, 佝时,称矩阵序列{A00}收敛,并称矩阵A=(佝)为矩阵序列{A00}的极限,或称{A00}收敛于A,记为lim A a)= A或A,k)-> A ks 不收敛的矩阵序列称为发散的。 由定义,矩阵序列A(k)发散的充要条件为存在ij使 得数列站发散。 类似地,我们可以定义矩阵收敛的Cauchy定义 定义31矩阵序列{A00}收敛的充要条件为 对任给£>0存在N(E),当k,l> N(E)时有 IIA(k)-A(/)ll < £ 其中11.11为任意的广义矩阵范数。 例 1 A(n) e~n sin(-) n y,sin(R) k=l K 7 如果直接按定义我们因为求不出A㈤的极限从 而很难应用定义3.1证明收敛。 相反,由于t^< t^< v 1/m 从而只要/充分大,则当m, n > /时就有 n z sin(A) 这样A")收 定理3.1 A(k)->A的充要条件为 HA'10-AII T O 证明:利用广义矩阵范数的等价性定理,仅对co范数可以证明。 即ci IIA(k) -AIL < IIA(k) -All< c2 IIA(k) -AIL

性质 1.设A(k,—> A mxn, B,k,—> B mxn>则 a- A(k)+P ? B(k) -> a- A+P B, V a,PeC 性质2.设A(k)—> A mxn, B,k)—> B nx/,则 A(k)由如一A B 证明:由于矩阵范数地等价性,我们E以只讨论相容的 矩阵范数。 IIA(k).B(k)-A-BII < II A(k) -B(k) -A-B(k)ll+IIAB(k)- A-BII yH Ax,对任意x,y成立. (在无穷维空间中称为弱收敛,但在有限维空间中 和一般收敛性定义是等价的) 对于Hermite(对称)矩阵我们有如下的定理: 设A?), k=l,2,?..,和A都为Hermite矩阵,那么 A(k?A的充要条件为 x”A时X—>x”Ax,对任意x成立 推论:设A如,k=l,2,...,为半正定的Hermite矩阵,且单调减少,即状和4J")为半正定Hermite矩阵,那么4的有极限. 性质3设泌幻和A都为可逆矩阵,且成则 (4伏 证明:因为Af(A如)所以存在K,当必K时有 III-AT?(A(*))II V]/2 我们有(A u))-,= A%( I- A-1- (A(k)? (A(k)r l 从而ll(A(k))-,llK时,有 ll(A(k))_,llK 时)

中科院矩阵分析_第二章

第 2 章范数理论及其应用 2.1向量范数及I p范数 定义:如果V 是数域K 上的线性空间,且对于 V的任一向量x,对应一个实数值ixil,它满足以下三个条件: 1)非负性:||x|| 0,且||x||=0 x=0; 2)齐次性:iikxii=iki iixii,k K; 3)三角不等式:||x+y|| ||x||+||y||. 则称||x|为V上向量x的范数,简称为向量范数。 可以看出范数||||为将V映射为非负数的函数。注意:2)中|k|当K为实数时为绝对值, 当K 为复数域时为复数的模。 虽然向量范数是定义在一般的线性空间上的,但是由于前面的讨论,我们知道任何n 维线性空间在一个基下都代数同构于常用的n维复(或实)列向量空间, 因此下面我们仅仅讨论n 维复(或实)列向量空间就足够了下面讨论如下:1?设||||为线性空间V n的范数,任取它的一个 基X i,X2,…,X n,则对于任意向量X,它可以表示为 x= 1X1+ 2X2+ …+ n X n 其中,(1, 2,…,n)T为X的坐标。 由此定义C n(或R n)中的范数如下: || ||C = () = || 1X1+ 2X2+ …+ n X n|| 则容易验证|| ||C确实为C n中的范数. 2?反之,若|| |C为C n中的范数,定义V n的范数如下:||X||= (X)=|| ||c 其中X= 1X1+ 2X2+ …+ n X n。 则容易验证(X)确实为V n的范数。 这个例子充分说明了一般线性空间的范数和n维 复(或实)列向量空间的范数之间的关系。这也是为我们只讨论n 维复(或实)列向量空间的范数的理由. 范数首先是一个函数,它将线性空间的任意向量映射为非负实数。 范数与函数 性质 1. 范数是凸函数, 即|| (1 )X+ y|| (1 )||X||+ ||y|| 其中0

中科院矩阵分析_第五章

第五章特征值的估计及对称矩阵的极性本章主要讨论数值代数中的三个特殊理论,即 特征值的估计 广义特征值问题 实对称矩阵(一般是Hermite矩阵)特征值的极小极大原理,其次也涉及到一些特征值和奇异值的扰动问题,最后简要地介绍矩阵直积的一些性质及其在线性矩阵方程求解方面的应用。这几方面的内容,在矩阵的理论研究与实际应用当中都有着相当重要的作用。 5.1特征值的估计 一、特征值的界 首先给出直接估计矩阵特征值模的上界的 一些方法 定理 5.1 设A=(a rs) R n X1,令 1 , , M= ma彷总a sr| 若表示A任一特征值,则的虚部Im() 满足不等式 |Im( )| M n(n21) |Im( )| ||A A T||2 / 2 |Im( )| ||A A T||1n /2. 证明:设x+i y为对应于的A的特征向量, 则A(x+i y)=( + i)(x+i y) 其中=+ i.显然x,y为实向量,且x,y为线性无关的向量。 经整理A(x,y)=(x,y)B, 其中B= 从而(x,y) T A(x,y)=(x,y) T(x,y)B 展开有

i 1 j i T T X y X X T T y y y X (求等式两边矩阵的对角元之和,可得 (x T x+y T y)=x T Ax+y T Ay (1) 等式两边矩阵的左上角单元减去右下角单元 可得: (x T x+y T y)=x T (A A T )y 1) . 记 B=A A T ,则 |x T By| ||x||2||B||2||y||2 从而 1 1 1凶|2 ||B||2||y||2 /((||x||2)2 +(||y|2)2) 利用 ab/(a 2+b 2) 1/2 可得 | | ||B||2 /2. 2) . 由于 |x T By| ||B X ||I ||y|| ||B||i ||X ||I ||y|| 从而 | | ||B||i ||x||i ||y|| /((||X |2)2 +(||y||2)2) 易证明 ||x||i ||y|| /((||X ||2)2 +(||y||2) 2) n /2. (显然,不妨假设(||X ||2)2 +(||y||2)2=1, 设HyH =t=cos (),则y 必为t e 的形式(为什么?) 从 而极值转化为求解如下最大值问题: max ||X ||1,满足约束(||X ||2)2=1 t 2 这样有均值不等式 ||x|h i n ||X ||2= 、、n (1 t 2)1/2, 从而我们需要求解t(1 t 2)1/2的最大值,设t=cos() 可得 t(1 t 2)1/2的最大值为1/2.从而得证。) 因此 11 ||B||1 . n /2. 3) . 由于 b ii =0, i =1,2,…,n, b ij = b ji , n 1 因此 x T By|2=| b ij (X y j X j y i )|2 i 1 j i 2 n (2M)2 |xy j X j Y i | i 1 j i (利用(a 1+a 2+…+a n )2 n((a 1)2+(a 2)2+ …+(a n )2) n (2M)2(n(n 1)/2) | X y j X j yj 2 X T A X y T Ax X T Ay y T Ay T T X X X y T T X y y y

LU分解(中科院矩阵分析大作业)

clc,clear,close all; A=input('请输入需要进行LU分解的方阵:'); [m n]=size(A); %判断矩阵是否为方阵 if m~=n error('矩阵非方阵,请重新输入!'); end %判断矩阵是否奇异 if det(A)==0 error('矩阵奇异,请重新输入!'); end %判断矩阵顺序主子式是否全不为0 n=size(A,1); flagMat=zeros(n,1); for i=1:n if det(A(1:i,1:i))==0 flagMat(i)=1; end end %以顺序主子式是否含0来决定采用的LU分解方式if any(flagMat)==0 disp('顺序主子式均不为0,采用A=LU'); [L U]=LUFull(A) else disp('顺序主子式存在0,采用PA=LU'); [L U P]=LUPart(A) end

%对矩阵A进行LU分解(完全主元法) %L,U矩阵为输出变量;A矩阵为输入变量 U=zeros(size(A));%对U尽可能初始化 U(1,:)=A(1,:); L=eye(size(A));%对L尽可能初始化 L(2:end,1)=A(2:end,1)/A(1,1); n=size(A,1); for i=2:n%Dolittle公式 for j=i:n U(i,j)=A(i,j)-L(i,1:i-1)*U(1:i-1,j); end for k=i:n L(k,i)=(A(k,i)-L(k,1:i-1)*U(1:i-1,i))/U(i,i); end end

%对矩阵A进行LU分解(部分主元法) %L,U,P矩阵为输出变量,A矩阵为输入变量 %对输入矩阵A重构 n=size(A,1); B=zeros(n,1); for i=1:n B(i,1)=B(i,1)+i; end A=[A B]; %目标矩阵 tempMat=zeros(size(A)); for j=1:n%第j列 [~,row]=max(abs(A(j:end,j)));%找出第j列最大元素,返回所在行A([row+j-1j],:)=A([j row+j-1],:);%交换最大元素行与第j行 tempMat(j,:)=A(j,:);%将第j行元素复制到tempMat第j行for i=j:n%第i行 if i+1<=n tempMat(i+1,j)=A(i+1,j)/A(j,j); end end %生成新的A(高斯消去) for k=j:n%第k行 if k+1<=n ratio=-A(k+1,j)/A(j,j); A(k+1,j+1:n)=ratio*A(j,j+1:n)+A(k+1,j+1:n); end end end %提取U矩阵 U=triu(tempMat(:,1:n),0);%upper triangle %提取L矩阵 L=tril(tempMat(:,1:n),0);%lower triangle for i=2:n for j=1:(i-1) L(i,j)=L(i,j)./L(j,j); end end

中科院计算数学考研必读经验

本人本科不是985、211名校,2014年考研,考中国科学院大学计算数学,总成绩386分。【关于数学分析】: 大一大二时,我对老师的数学分析课很感兴趣,所以自认为学得比较认真,理解得也比较深刻。这虽然是我学得最认真的一门课,但也只仅限于完成平时的作业和完成期末的复习,并没有做很多额外的努力,这样四学期下来,对数学分析整体还是有个宏观的把握,比如说起微积分学基本定理,Dini定理,欧拉积分等都会有个大致的印象。 大三时,我旁听了老师给下一级上的数学分析课和数学分析选论,虽然已经是第二次听,但由于以前学得都没有及时复习,老师讲的很多忘记了,很多知识他讲到才想起来。同时,大三这一学年我都在自己钻研一些自己比较感兴趣的数学分析内容,比如反常积分敛散性、级数求和等,因此顺便做了数学分析的课题。但由于大三还是有专业课(实变、抽代等)和其他课程的压力,一直没有系统地开展复习。大三结束,从7月5日起,正式进入考研复习阶段,一开始,我打算做《裴礼文》,计划每天做20页,但是做了1个月不到,发现效率很低,因为对于我来说里面大部分题目都不会,每道题都要花时间。到了后来,每天看10页都已经很不错了,因为之前几天看懂的题目又忘了,又需要不断复习。这时我感到了压力很大,觉得应该以应试为主,《裴礼文》上的题目偏难了,有些大大超过考研难度。 于是,从8月开始,我开始做《题解精粹(钱吉林)》,这本书里面有1000多道各地的考研题,而且对于我来说,有简单题,有少量难题,总的来说比较适合我。所以我每天做40道,这样做了一整个8月,刚好差不多做完。这时,我深深感到之前数学分析课堂上学的真的很不够。从9月份开始,我开始做教材的课后习题,顺便复习一下教材里面的定理。这时做课后题还是需要借助答案,然后发现原来教材后面的题目许多都是考研题,怪不得以前都不会做。这一轮复习到了10月中旬。10月中旬我又把《题解精粹(钱吉林)》在第一遍看时没看透彻或是有跳过的地方补上。 11月,我专门去帝都上了新祥旭的专业课冲刺,主要是老师带着讲解中科院的历年数分真题和成套成套地做与讲模拟题,基本上用一个下午的时间大致做一年的数分真题或模拟卷,再讲解答案解析。到11月中下旬,就把中科院数分的历年真题都研究透彻了(包括2013年的,虽然这年数分题出的相当难)。因为在12月,英语政治复习的压力也很大,就没有时间和精力再待了,总结一点就是感觉收获颇大。这样,数学分析考了128,虽然不高,但也还过得去。 【关于高等代数】: 我在大二学高等代数的时候,因为没有数分的那种喜欢,所以一直使不上劲,上册的内容勉强学懂了,下册的内容在学的时候,到线性变换的时候完全就不懂(一点不谦虚)。虽然期末考得还好,但含水量极大。后来整个大三几乎就没碰过高代。到大三结束7月5号开始做《高等代数考研教案》,每天做10页,觉得这本挺适合我,内容也很全。因为后来到了正定二次型和线性变换那边,本来基础就不好,边看边做,边跳边做,到8月底勉强把它做完,这时终于对整个高代内容有了大概的把握,因为把“矩阵”那章也做了,这章一般上课是不讲的,但考研还挺重要的。 到9月份,开始看课本(真的是看课本,很多以前上课的时候都没看过,例如线性变换、矩阵中的内容)。然后把课后习题做一遍,但补充题基本还是要借助答案。这样做到了10月中旬(国庆放了个假),这时开始又把《考研教案》里曾错过,曾不理解,或曾跳过的内容补上。到了10月,我开始看中科院的考研高代真题,基本上用一个下午的时间大致做一年的高代真题,再看答案解析。到10月中下旬,差不多把高代的真题都研究透彻了(例如2013年的高代还是挺难的)。这样,高等代数考了135,应该算不错。 【关于英语】: 我高中时英语还是挺好的,不过经过大学初的几年,就荒废了,大二上靠着高中时残存

中科院矩阵分析_第二章

第2章范数理论及其应用 2.1向量范数及l p范数 定义:如果V是数域K上的线性空间,且对于 V的任一向量x,对应一个实数值||x||,它满足 以下三个条件: 1)非负性:||x||≥0,且||x||=0?x=0; 2)齐次性:||k?x||=|k|?||x||,k∈K; 3)三角不等式:||x+y||≤||x||+||y||. 则称||x||为V上向量x的范数,简称为向量范数。 可以看出范数||?||为将V映射为非负数的函数。 注意:2)中|k|当K为实数时为绝对值, 当K为复数域时为复数的模。 虽然向量范数是定义在一般的线性空间上的, 但是由于前面的讨论,我们知道任何n维线性空间 在一个基下都代数同构于常用的n维复(或实)列向量空间,因此下面我们仅仅讨论n维复(或实) 列向量空间就足够了。下面讨论如下: 1.设||?||为线性空间V n的范数,任取它的一个 基x1,x2,…,x n,则对于任意向量x,它可以表示为 x=ξ1x1+ξ2x2+…+ξn x n 其中,(ξ1,ξ2,…,ξn)T为x的坐标。 由此定义C n(或R n)中的范数如下: ||ξ||C =?(ξ)=||ξ1x1+ξ2x2+…+ξn x n|| 则容易验证||ξ||C确实为C n中的范数. 2.反之, 若||ξ||C为C n中的范数,定义V n的范数如下: ||x||=φ(x)=||ξ||C 其中x=ξ1x1+ξ2x2+…+ξn x n。 则容易验证φ(x)确实为V n的范数。 这个例子充分说明了一般线性空间的范数和n维 复(或实)列向量空间的范数之间的关系。这也是为 我们只讨论n维复(或实)列向量空间的范数的理由. 范数首先是一个函数,它将线性空间的任意 向量映射为非负实数。 范数与函数 性质1. 范数是凸函数, 即|| (1-λ)x+λy||≤(1-λ)||x||+λ||y||

相关主题
相关文档
最新文档