第五章矩阵分析(改)
第五章--向量范数和矩阵范数

当 x 时,|| x ||A 0 ;当 x θ 时由 A 对称
正定知 xH Ax 0 ,即 || x ||A 0 。
对于任意 k C ,有 || k x ||A (kx)T A(kx) | k | xT Ax | k | || x ||A
由于 A 为Hermite正定矩阵,故存在酉矩阵 U ,使得
|| x ||2
| x1 |2 | x2 |2
| xn |2
定义的|| ||2 是 F n上的向量范数,称为2-范数或 l2
范数,也称为 Euclid 范数。
例 7 对任意 x ( x1, x2, , xn) T F n,由
|| x ||p
1/ p n
| xi |p , p 1
i1
定义的|| ||p 是 F n 上的向量范数,称为p -范数或 lp
UT AU Λ diag( λ1, λ2, , λn)
这里 A 的特征值 λi (i 1, 2, , n) 都为正数。
从而有
A UΛUT U Λ Λ UT BT B
此时
|| x ||A xT Ax xT BT Bx (Bx)T Bx || Bx ||2
因此对任意 y C n , || x y ||A || B( x y) ||2
数 || A || 表示对于任意向量 x F n , A 可以 “拉伸”向量 x 的最大倍数,即使得不等式
|| A x || C || x || 成立的最小的数 C 。称 || A || 为范数 || || 和 || ||
j1
n
| xj
j1
yj |; yj |;
yj |;
1
yj |m m;
以及与椭圆范数类似的Mahalanobis距离:
线性代数第五章 相似矩阵

第五章 相似矩阵§1 特征值与特征向量特征值是方阵的一个重要特征量,矩阵理论的很多结果都与特征值有关,在工程技术及其理论研究方面都有很重要的应用。
定义1:设A 为n 阶方阵,如果存在数λ和n 维非0列向量X ,满足:(1)AX X λ=。
则称λ是方阵A 的特征值(也称为特征根),X 是方阵A 的属于特征值λ的特征向量。
例如矩阵1000A ⎛⎫= ⎪⎝⎭,取11= 0X ⎛⎫ ⎪⎝⎭,20=1X ⎛⎫⎪⎝⎭,则有 11=1AX X ⋅,22=0AX X ⋅,所以1,0是A 的特征值,12,X X 是分别属于特征值1和0的特征向量。
(1)式又可以写成 ()0(2)E A X λ-=。
即特征向量是齐次线性方程组(2)的非零解,从而有||0 (3)E A λ-=。
(3)称为方阵A 的特征方程,求解方程(3)即得矩阵A 的特征值。
||E A λ-称为方阵A 的特征多项式。
对求出的特征值0λ,代入方程组(2)求解即得属于0λ的特征向量。
例1:已知方阵A 满足 2A E =,证明:A 的特征值只能为1或1-。
证明:设λ是A 的任一特征值,则有非零向量X ,使得 AX X λ=。
两边左乘以A ,有22()()A X A A AX X λλλ===。
又 2A E =,所以2(1)0X λ-=。
由于0X ≠,从而 21λ=,即 1λ=±。
例2:求矩阵110430102A -⎛⎫ ⎪=- ⎪ ⎪⎝⎭的特征值与特征向量。
解:因 2110||430(2)(1)102E A λλλλλλ+--=-=----。
所以矩阵A 的特征值2λ= 或 1λ=。
当2λ=时,310100410010100000-⎛⎫⎛⎫ ⎪ ⎪-→ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭,1001η⎛⎫ ⎪= ⎪ ⎪⎝⎭。
故属于2λ=的特征向量为11(0)k k η≠。
当 1λ=时,210101420012101000-⎛⎫⎛⎫ ⎪ ⎪-→ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭,2121η-⎛⎫ ⎪=- ⎪ ⎪⎝⎭。
线性代数 第五章 相似矩阵与二次型 第1节

就正交。
显然,零向量与任何向量正交。
定义 一组两两正交的非零向量,称为正交向量组。
定理 如果 n 维向量 1, 2 ,..., m 为正交向量组, 则1, 2 ,..., m 线性无关。
证明 设有1,2,m 使11 2 2 ... m m 0
以
T 1
左乘上式两端,得
1
T 1
1
0
因1 0, 故1T1 1 2 0,从而1 0。
1 3 1
4 6
1 2 1
5 3
1 1 ; 1
3
3
[ 3, 1] [1, 1]
1
[ 3, 2] [2, 2 ]
2
4 1 0
1
3
1 2 1
5
3
1 1 1
2 0
2
再把它们单位化,取
e1
1
1
1 6
1 2 , 1
e3
3
3
r1,n , 把1,r ,r1,n 正交规范化
就得到 Rn 的一个正交规范基。
五、正交矩阵与正交变换
定义 若 n 阶方阵A 满足 AT A E (即A1 AT )
则称 A 是正交矩阵。
若记 A 1 2 n ,则 AT A可表示为:
12TT
1
2
n E
T n
即
iT j
1 0
当i 当i
四、施密特正交化方法
把基 1, 2 ,..., n 化成标准正交基的具体步骤:
先正交化:
令
1
,
1
2
2
[ 2 , [1,
1] 1]
1
3
3
2 i 1
[ 3 [i
【学习】线性代数学习指导第五章矩阵的特征值与特征向量

【关键字】学习第五章矩阵的特征值与特征向量一.内容提要1 . 特征值和特征向量定义1 设是数域P上的n阶矩阵,若对于数域P中的数,存在数域P上的非零n维列向量X,使得则称为矩阵A的特征值,称X为矩阵A属于(或对应于)特征值的特征向量注意:1)是方阵;2)特征向量X 是非零列向量;3)方阵与特征值对应的特征向量不唯一4)一个特征向量只能属于一个特征值.2.特征值和特征向量的计算计算矩阵A的特征值与特征向量的步骤为:(1)计算n阶矩阵A的特征多项式|E-A|;(2)求出特征方程|E-A|=0的全部根,它们就是矩阵A的全部特征值;(3)设1 ,2 ,… ,s 是A的全部互异特征值。
对于每一个i,解齐次线性方程组0,求出它的一个根底解系,该根底解系的向量就是A属于特征值i的线性无关的特征向量,方程组的全体非零解向量就是A属于特征值i的全体特征向量.3.特征值和特征向量的性质性质1 (1)若X是矩阵A属于特征值的特征向量,则kX()也是A属于的特征向量;(2)若是矩阵A属于特征值的特征向量,则它们的非零线性组合也是A属于的特征向量;(3)若A是可逆矩阵,是A的一个特征值,则是A—1的一个特征值,是A*的一个特征值;(4)设是n阶矩阵A的一个特征值,f(x)= amxm + am-1xm-1 + … + a1x + a0为一个多项式,则是f(A)的一个特征值。
性质2(1)(2)性质3 n阶矩阵A和它的转置矩阵有相同的特征值性质4 n阶矩阵A 不同的特征值所对应的特征向量线性无关4. 相似矩阵定义2 设A、B为n阶矩阵,若存在可逆矩阵P,使得B=P―1AP则称A与B相似。
记作A∽B. 并称P为相似变换矩阵.矩阵的相似关系是等价关系,满足:1°反身性:A∽A.2°对称性:若A∽B,则B∽A.3°传递性:若A∽B,B∽C则A∽C.5.矩阵相似的性质:设A、B为n阶矩阵,若A∽B,则(1) ; (2) ;(3)A 、B 有相同的迹和特征多项式,相同的特征值;(4) A ,B 或者都可逆或者都不可逆. 当A ,B 都可逆时,∽;(5)设f (x )= amxm + am-1xm-1 + … + a1x + a0 为一个多项式,则 f (A )∽ f (B ) ; 6.n 阶矩阵A 相似对角化的条件(1)n 阶矩阵A 与对角矩阵Λ相似的充分必要条件是A 有n 个线性无关的特征向量. (2)n 阶矩阵A 与对角阵相似的充要条件是A 的每个k 重特征值恰好对应有k 个线性无关的特征向量.注(1)与单位矩阵相似的 n 阶矩阵只有单位阵 E 本身,与数量矩阵 kE 相似的 n 阶方阵只有数量矩阵 kE 本身(2)有相同特征多项式的矩阵不一定相似。
矩阵分析(5)

n
= A
B
2 F
于是有
AB
F≤ ALeabharlann 例 4 :对于任意 A ∈ C
F n ×n
B
F
,定义
1
A = [Tr ( A A)] 2 证明: 证明 如此定义的 A 也是矩阵 A 的一种范
H
数。
证明: 首先注意到这样一个基本事实, 证明: 首先注意到这样一个基本事实,即
,那么
A
(2) A )
2 F
= Tr ( A A) = ∑ λi ( A A)
H i =1
(3)对于任何 m 阶酉矩阵 U 与 n 阶酉矩阵 )
V 都有等式 A F = UA
F
= A
H F
= AV
F
= UAV
F
关于矩阵范数的等价性定理。 关于矩阵范数的等价性定理。 定理: 定理:设 A α , A β 是矩阵 A 的任意两 种范数, 种范数,则总存在正数 d1 , d 2 使得
α 2 = ( ∑ ai ) = (α α )
2 12 H i =1
n
12
也称为欧氏范数。 也称为欧氏范数。 (3) ∞ -范数 α ) 定理: 定理:
∞
= lim α
p →∞
p
α
∞
= max ai
1≤i ≤ n
证明: 证明:令
x = max ai ,则
1≤i ≤ n
yi =
于是有
ai x
, i = 1, 2,L, n
d1 A
β
≤ A α ≤ d 2 A β , ∀A ∈ C
m ×n
诱导范数 定义: 是向量范数, 定义:设 X α是向量范数, A β 是矩阵范 数,如果对于任何矩阵 A 与向量 X 都有
矩阵论-第五章-广义逆及最小二乘

第五章 广义逆及最小二乘解在应用上见得最频繁的、大约莫过于线性方程组了。
作一番调查或整理一批实验数据,常常归结为一个线性方程组:Ax b =然而是否是相容方程呢?倘若不是,又如何处理呢?最小二乘解是常见的一种处理方法。
其实它不过是最小二乘法的代数形式而已。
广义逆从1935年Moore 提出以后,未得响应。
据说: (S.L.Campbell & C.D.Meyer.Jr Generalized Inverses of Linear Transformations 1979 P9)原因之一,可能是他给出的定义,有点晦涩。
其后,1955年Penrose 给出了现在大都采用的定义以后,对广义逆的研究起了影响,三十年来,广义逆无论在理论还是应用上都有了巨大发展,一直成为了线性代数中不可缺少的内容之一。
为了讨论的顺利进行,我们在第一节中先给出点准备,作出矩阵的奇值分解。
§5.1 矩阵的酉交分解、满秩分解和奇值分解在线行空间中,知道一个线性变换在不同基偶下的矩阵表示是相抵的或等价的。
用矩阵的语言来说,就是:若 ,m n A B C ×∈,倘有非异矩阵()P m n ×,()Q n n ×存在,使B PAQ =则称A 与B 相抵的或等价的。
利用初等变换容易证明m n A C ×∈,秩为r ,则必有P ,Q ,使000r m nI PAQ C ×⎛⎞=∈⎜⎟⎝⎠(5.1-1) 其中r I 是r 阶单位阵。
在酉空间中,上面的说法,当然也成立,如果加上P ,Q 是酉交阵的要求,情形又如何呢?下面就来讨论这个问题。
定理 5.1.1 (酉交分解) m n A C ×∈,且秩为r ,则(),(),,H H m n U m n V n n U U I V V I ∃××==,使00r HU AV Δ⎛⎞=×⎜⎟⎝⎠(m n) (5.1-2) 其中r Δ为r 阶非异下三角阵。
第五章 矩阵的特征值与特征向量

可知 λ1E − A 的秩为 r = 2, 有n − r = 3 − 2 = 1个自由未知量 1 x1 − 3 x3 = 0, 求得它的一个基础解系为 取为 x3 . 由 2 α1 = (1, −2,3)T . x2 + x3 = 0, 3 A 的属于特征值6 的全部特征向量为 k (1, −2,3)T , 所以 k 为任意非零数 为任意非零数. 对于λ2 = 2, 解齐次线性方程组 ( 2 E − A ) X = o, 由 1 1 −1 1 1 −1 −2 −2 2 → 0 0 0 , ( λ2 E − A) = 3 3述, 综上所述,求 n阶矩阵A的特征值与特征向量的步骤: 的全部特征值, 第一步 求 A 的全部特征值,即求特征方程 的全部根; | λE − A|= 0 的全部根; 第二步 的特征向量. 求 A 的特征向量
s
对于每一个特征值 λi,求出齐次线性方程组 求出齐次线性方程组
( λi E − A) X = o的一个基础解系ξ1,ξ2,L,ξs , 那么 X = ∑kiξi i= 1 的全部特征向量, 就是A 的属于 λi 的全部特征向量,其中 k1, k2 ,L, ks为不全
所以 A 的全部特征值为 λ1 = −1, λ2 = 1, λ3 = 3. 利用解齐次线性方程组, 可以求得: 利用解齐次线性方程组 可以求得 A的属于特征值 −1 的全部特征向量为 k1 (1, −1,0)T , 为任意非零数. 其中k1为任意非零数 A的属于特征值 1 的全部特征向量为 k2 (1, −1,1)T , 为任意非零数. 其中k2为任意非零数 A的属于特征值 3 的全部特征向量为 k3 (0,1, −1)T , 其中k3为任意非零数. 为任意非零数 (1, −1,0)T ,(1, −1,1)T ,(0,1, −1)T 线性无关 线性无关. 容易证明 该例中有三个不同的特征值, 注: 该例中有三个不同的特征值 相应的特征向量线 性无关. 性无关
第五章 线性变换 S2 线性变换的矩阵

第五章 线性变换
第二节 n维线性空间中线性 变换的矩阵
只讨论n维线性空间V上的线性变换T. 研究线性变换T和n阶矩阵之间的关系.
x11 x2 2
xn n
又T是线性变换,(保持线性组合不变)必有
2
T T ( x1 1 x2 2 x1T 1 x2T 2
xn n ) xnT n
(1)
这说明当已知 T 1 ,T 2 , ,T n 时,每个向量的象 由(1)确定,即线性变换被完全确定.
T x2 x 3 x3 x1
求T在基底
1 0 0 e1 0 , e2 1 , e3 0 0 0 1
下的矩阵A.
解:由T的定义知 1 0 1
T [T 1 , T 2 , x2 ,T n ] [T 1 , T 2 , x n
xnT n
,T n ]X
(3)
T [T 1 , T 2 ,
(2)代入(3)得到
, T n ] X ( 1 , 2 ,
T ( 1 , 2 ,
, n M ) (T 1 , 2 ,
, n ) M
[T 1 ,T 2 ,
1 ,2 ,
,T n ]M 1 , 2 ,
,n M AM
1
, n AM
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 矩阵分析本章将介绍矩阵微积分的一些内容.包括向量与矩阵序列的收敛性、矩阵的三种导数和矩阵微分与积分的概念,简要介绍向量与矩阵范数的有关知识.§5.1 向量与矩阵的范数从计算数学的角度看,在研究计算方法的收敛性和稳定性问题时,范数起到了十分重要的作用.一、向量的范数定义1 设V 是数域F 上n 维(数组)向量全体的集合,x 是定义在V 上的一个实值函数,如果该函数关系还满足如下条件:1)非负性 对V 中任何向量x ,恒有0x ≥,并且仅当0=x 时,才有x =0;2)齐次性 对V 中任意向量x 及F 中任意常数k ,有;x k kx = 3)三角不等式 对任意V y x ∈,,有y x y x +≤+,则称此函数x (有时为强调函数关系而表示为⋅) 为V 上的一种向量范数.例1 对n C 中向量()T n x x x x ,,,21 =,定义222212nx x x x+++=则2x 为n C 上的一种向量范数[i x 表示复数i x 的模].证 首先,2n x C 是上的实值函数,并且满足1)非负性 当0x ≠时,0x >;当0x =时,0x =; 2)齐次性 对任意k C ∈及n x C ∈,有22||||||kx k x ==;3)三角不等式 对任意复向量1212(,,,),(,,,)T T n n x x x x y y y y ==,有222221122||||||||()n n x y x y x y x y +=++++++2221122()()()n n x y x y x y ≤++++++22111||2||||||nnni i i i i i i x x y y ====++∑∑∑(由Cauchy-ВуНЯКОВСКИЙ不等式)222222222||||2||||||||||||(||||||||),x x y y x y ≤++=+因此 222||||||||||||x y x y +≤+所以 2||||x 确为n C 上的一种向量范数 例2 对n C [或n R ]上向量12(,,,)T n x x x x =定义112||||||||||n x x x x =+++,1max i i nxx ∞≤≤=,则1||||x 及x ∞都是n C [或n R ]上的向量范数,分别称为1-范数和∞-范数.证 仅对后者进行证明. 1)非负性 当0x ≠时,max 0i ixx ∞=>,又显然有00∞=;2)齐次性 对任意向量()T n x x x x ,,,21 =及复数k ,max max ;i i iikxkx k x k x ∞∞===3)三角不等式 对任意向量1212(,,,),(,,,),T T n n x x x x y y y y ==()i i ii i iy x y x yx +≤+=+∞max maxi ii iy x max max +≤ =∞∞+y x .综上可知∞x 确为向量范数.上两例中的∞x x x ,,21是常用的三种向量范数.一般地,对于任何不小于1的正数p ,向量()T n x x x x ,,,21 =的函数pni p i px x11⎪⎭⎫ ⎝⎛=∑= 也构成向量范数,称为向量的p -范数.注(1)当1p =时,1;pxx =(2)当2p =时,2x 为2-范数,它是酉空间范数;当i x 为实数时,12221()ni i x x ==∑为欧氏空间范数;由p -范数的存在,可知向量的范数有无穷多种,而且,向量的范数并不仅限于p -范数.在验证向量的范数定义中,三角不等式的过程中常涉及到两个著名的不等式,即:1、Hölder 不等式 设正实数,p q 满足111,p q+=则对任意的,,n x y C ∈有11111()()nnnpq pqi ii i i i i x yx y ===≤∑∑∑2、Minkowski 不等式 对任意实数1p ≥,及,,n x y C ∈有(111111()()()nnnpp ppppi i i i i i i x y x y ===+≤+∑∑∑).例3 设()T n 1,,1,1 =为n 维向量,则1,,21===∞xn x n x各种范数值差距很大.但是,各种范数之间却存在着内在的制约关系,称为范数的等价性.定理1 设βα⋅⋅,为有限维线性空间V 的任意两种向量范数(它们不限于p -范数),则存在正的常数12,C C ,使对一切向量x ,恒有βαβx C x xC 21≤≤ (1)证 如果范数x α和x β都与一固定范数譬如2-范数2x 满足式(1)的关系,则这两种范数之间也存在式(1)的关系,这是因为若存在正常数12,C C ''和12,C C '''',使 1222122,C x x C x C xx C x αββ''≤≤''''≤≤成立,则显然有1122||||||||||||C C x x C C x βαβ''''''≤≤ 令111222,C C C C C C ''''''==,则得式(1),因此只要对2β=证明或(1)成立即可.设V 是n 维的,它的一个基是12,,,n x x x ,于是V 中的任意向量x 可表示为1122n n x x x x ξξξ=+++从而,1122n n x x x x ααξξξ=+++可视为n 个变量12,,,n ξξξ的函数,记为12(,,,)n x αϕξξξ=,易证12(,,,)n ϕξξξ是连续函数,事实上,若令1122nn x x x x V ξξξ''''=+++∈,则 12(,,,)nx αϕξξξ''''=. 1212(,,,)(,,,)n n x x x x αααϕξξξϕξξξ'''''-=-≤- 11111()()nn n nn n x x x x αααξξξξξξξξ''''=-++-≤-++-. 由于ix α(1,2,,)i n =是常数,因此i ξ'与i ξ充分接近时,12(,,,)nϕξξξ'''就与12(,,,)n ϕξξξ充分接近,所以12(,,,)n ϕξξξ是连续函数.所以在有界闭集{}2221212(,,,)1n S ξξξξξξ=+++=上,函数12(,,,)n ϕξξξ可达到最大值2C 及最小值1C .因此在S 中,i ξ不能全为零,所以10C >.记向量1212222nn y x x x xxxξξξ=+++,则其坐标分量满足22212122221nx x xxxξξξ+++=,因此,y S ∈.从而有 11122220,,n C yC xx x αξξξϕ⎛⎫<≤=≤ ⎪ ⎪⎝⎭. 但2,xy x =故 122x C C x α'≤≤. 即 12222C x x C x ≤≤.二、矩阵的范数定义 2 设V 是数域F 上所有n m ⨯矩阵的集合,A 是定义在V 上的一个实值函数,如果该函数关系还满足如下条件:对V 中任意矩阵A 、B 及F 中任意常数k 总有1)非负性 0≥A 并且仅当0=A 时,才有0=A ; 2)齐次性 A kkA =;3)三角不等式 B A B A +≤+; 则称()⋅A是V 上的一种矩阵范数.例4 对n m C ⨯(或n m R ⨯)上的矩阵A ()ij a =定义∑∑===mi nj ij M a A111,∑∑===m i nj ijM aA1122,11max ij M i m j nA a ∞≤≤≤≤=,则∞⋅⋅⋅M M M ,,21都是n m C ⨯(或n m R ⨯)上的矩阵范数.实用中涉及较多的是方阵的范数,即m n =的情形.定义 3 设F 是数域,⋅是n n F ⨯上的方阵范数.如果对任意的,n n A B F ⨯∈,总有AB A B ≤⋅,则说方阵范数⋅具有乘法相容性.注意:在某些教科书上,往往把乘法相容性直接纳入方阵范数的定义中作为第4个条件,在读书时,只要注意到各自定义的内涵就可以了.例 5 对n n C ⨯上的矩阵][A ij a =定义ij nj i a n A ≤≤⋅=,1max ,则⋅是一种矩阵范数,并且具备乘法相容性.证 非负性与齐次性显然成立,另两条证明如下:三角不等式ij ij b a n B A +⋅=+max()max max ij ij n a b ≤+ B A +=; 乘法相容性⎪⎭⎫⎝⎛⋅≤⋅=∑∑==n k kj ik nk kj ik b a n b a n AB 11max max()()B A b n a n ij ij =⋅≤max max , 证得A 为矩阵范数且具有乘法相容性.并不是所有的方阵范数都具有乘法相容性.例如对于22⨯R 上的方阵范数.M ∞就不具备相容性条件.此时ij j i M a A2,1m ax ≤≤=∞.取 1110,0111A B ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭,则有 1==∞∞M M BA ,而 2M M M ABA B∞∞∞=>.定义4 如果n 阶矩阵A 的范数A 与n 维向量x 的范数x ,使对任意n 阶矩阵A 及任意n 维向量x 均有x A Ax ≤,则称矩阵范数A 与向量范数x是相容的.定理2 设x 是某种向量范数,对n 阶矩阵A 定义AxxAx A x x 1max max=≠==(2)则A 为方阵范数,称为由向量范数x 导出的矩阵范数,而且它具有乘法相容性并且与向量范数x 相容.证 首先可证,由(2)式定义的函数关系||||A 满足与向量范数||||x 的相容性.对于任意n 阶矩阵A 及n 维向量x ,当0x ≠时,有0||||||||max ||||||||||||y Ax Ay A x y ≠≤=, 即 ||||||||||||;Ax A x ≤(3)而当0x =时,||||0||||||||Ax A x ==,于是总有(3)式成立.容易验证||||A 满足范数定义中的非负性、齐次性及三角不等式三个条件,因而A 是一种方阵范数.并且,对任意n 阶矩阵,A B ,利用(2)式和(3)式可得maxmaxmaxx x x A BxABx Bx AB A A B xxx≠≠≠=≤==.即说矩阵范数A 具备乘法相容性.一般地,把由向量p -范数p x 导出的矩阵范数记作p A .下面看常用的三种矩阵范数:例6 证明:对n 阶复矩阵[]i j A a =,有 1)11max nij j ni Aa ∞≤≤==∑,称为A 的列和范数.2)11max nij j nj Aa ∞≤≤==∑,称为A 的行和范数.证 1)设111max nnijikj ni i w a a≤≤===∑∑.若A 按列分块为12(,,,)n A ααα=则111max k j j nw αα≤≤==.任意n 维向量12(,,)T n x x x x =,有112211221111112111()max .n n n nn jj nAx x x x x x x x x x x w ααααααα≤≤+++≤+++≤+++≤=于是,对任意非零向量x 有11Ax w x ≤. 以下证明存在非零向量k e 使11k kAe w e =.事实上,设k e 是第k 个分量为1而其余分量全为0的向量,则1k e =1,且1k ik i Ae a w =∑n=1=,即11k kAe w e =.2)的证明与1)相仿,留给读者去完成. 例7 证明对n 阶复矩阵A ,有21max i i nA σ≤≤=,这里()n i i ,,2,1 =σ是A 的奇异值,称此范数为A 的谱范数.证 设H A A 的全部特征根为12,,n λλλ不妨设11max i i nλλ≤≤=.于是11max i i nσσ≤≤==.因为H A A 为H -矩阵,故有酉矩阵U ,使得,,H H U A AV diag λλλ=Λ=12n (,).如设12(,,,)n U u u u =则i u 是H A A 相应于特征根i λ的单位特征向量,即有,H i i i A A u u λ= 21iu =.对任意满足2||||1x =的复向量12(,,,)T n x x x x = ,有22||||()()H H Ax Ax Ax x ==HU U x Λ令H y U x =,则222222||||||||||||1H y U x x ===,说明y 亦为单位向量.若设12(,,,)T n y y y y =,则2221||||||1nii y y ===∑于是 22211||||||nHi i i Ax y y y λλ==Λ=≤∑.即有12Ax σ≤.由x 的任意性,便得21221max x A Ax σ==≤特别取1x u =,则有211111112H H H Au u A Au u u λλ===, 即112Au σ=.这说明2Ax 在单位球面{}21,n x x x C =∈上可取到最大值1σ,从而证明了21221max x A Ax σ===各种矩阵范数之间也具有范数的等价性定理 3 设,a A A β是任意两种矩阵范数 则有正实数12,,C C 使对一切矩阵A 恒有12a C A A C A ββ≤≤§5.2 向量与矩阵序列的收敛性在这一节里,我们将把数列极限的概念,扩展到向量序列与矩阵序列上去.可数多个向量(矩阵)按顺序成一列,就成为一个向量(矩阵)序列,例如 ()()()12(,,,)k k k Tk n x x x x =,1,2,3,k=是一个n 维向量序列,记为{}k x ,诸k x 的相应分量则形成数列{}k i x .定义5 设有向量序列()()()12{}:(,,,)k k k Tk k n x x x x x =.如果对1,2,i n =,数列(){}k i x 均收敛且有()lim k i i k x x →∞=,则说向量序列{}k x 收敛.如记12(,,,)T n x x x x =,则称x 为向量序列{}k x 的极限,记为lim k k x x →∞=,或简记为k x x →.如果向量序列{}k x 不收敛,则称为发散.类似于数列的收敛性质,读者不难证明向量序列的收敛性具有如下性质.设{},{}k k x y 是n C 中两个向量序列,,a b 是复常数,n ,m A C ⨯∈如果lim ,lim k k k k x x y y →∞→∞==,则1lim();2lim .k k k k k ax by ax by Ax Ax →∞→∞>+=+>=定理 4 对向量序列{}k x ,x x k =∞→k lim 的充分必要条件是0lim =-∞→x x k k ,其中⋅是任意一种向量范数.证明1)先对向量范数i ni x x≤≤∞=1max 证明定理成立.有i k i k k k x x x x =⇔=∞→∞→)(lim lim ,n i ,...,2,1=;,0lim )(=-⇔∞→i k i k x x n i ,...,2,1=;0max lim )(1=-⇔≤≤∞→i k i ni k x x ;0lim =-⇔∞∞→xx k k .2)由向量范数等价性,对任一种向量范数⋅,有正实数21,b b ,使∞∞-≤-≤-x x b x x xx b k k k 21.令∞→k 取极限即知lim 0lim 0k k k k x x x x∞→∞→∞-=⇔-=.于是定理对任一种向量范数都成立.根据上述定义,向量序列有极限的根本之处在于各分量形成的数列都有极限.由于m n C ⨯中矩阵可以看作一个mn 维向量,其收敛性可以和mn C 中的向量一样考虑.因此,我们可以用矩阵各个元素序列的同时收敛来规定矩阵序列的收敛性.定义 6 设有矩阵序列{}n m k ij k k a A A ⨯=][:)(,如果对任何,(1,1)i j i m j n ≤≤≤≤,均有ij k ij k a a =∞→)(lim 则说矩阵序列{}k A 收敛,如令n m ij a A ⨯=][,又称A 为{}k A 的极限.记为,lim A A k k =∞→或A A k →.矩阵序列不收敛时称为发散.讨论矩阵序列极限的性质,以下设所涉及的矩阵为n 阶矩阵: 1) 若A A k k =∞→lim ,{}k a 为数列且a a k k =∞→lim ,则()aA A a k k k =∞→lim .特别,当a 为常数时,()k k k k A a aA ∞→∞→=lim lim .2) 若A A k k =∞→lim ,B B k k =∞→lim ,则()B A B A k k k ±=±∞→lim .3) 若A A k k =∞→lim ,B B k k =∞→lim ,则()AB B A k k k =∞→lim .4) 若A A k k =∞→lim 且诸k A 及A 均可逆,则{}1-k A 收敛,并且11lim --∞→=A A k k .容易证明性质1)-3)成立,对性质4)注意到行列式k A 值定义的和式无非是k A 中元素()(,1,2,,)k ij a i j n =的乘法与加法之组合,再由lim k →∞(),k ij ij a a =即可知lim k k A A →∞=用()k ij A 表示Ak 中(,)i j 元素的代数余子式,用ij A 表示A 中(,i j )元素的代数余子式,便有()lim k ij ij k A A →∞=.进而 **lim k k A A →∞=.这里*k A 是k A 的伴随矩阵,*A 是A 的伴随矩阵.又*1kkk A A A -=, 所以*11lim kk A A A A--→∞==. 定理5 对于矩阵序列{}k A ,lim k k A A →∞=的充分必要条件是对任何一种矩阵范数⋅,有lim 0k k A A →∞-=定理5的证明与定理4类似,由于矩阵范数的等价性,只需证明对矩阵范数,max ij i jA a =定理成立,其方法也与定理4的证明一致,这里从略.以下主要介绍范数在特征值估计方面的应用. 定义7 设n n A C ⨯∈,1,,,,j n λλλ为A 的n 个特征值,称()max j jA ρλ=为A 的谱半径.有了谱半径的概念,可以对矩阵范数作如下的初步估计. 定理6 设n n A C ⨯∈,则对n n C ⨯上的任一矩阵范数⋅,皆有 ()A A ρ≤证 设λ是A 的特征值,x 为A 的属于特征值λ的特征向量,故0x ≠,所以0x ≠.另设v ⋅是n C 上与矩阵范数⋅相容的向量范数,由Ax x λ=,应有v v Ax x λ=而v v Ax A x ≤,于是有v v x A x λ≤同除0v x ≠,有 A λ≤. 故 max jA λ≤,于是 ()A A ρ≤.定理7 设n n A C ⨯∈,lim 0k k A →∞=的充分必要条件是()1A ρ<.证 对n n A C ⨯∈,由定理3.5.1知,存在n 阶的逆矩阵P 使得112(,,,)s P AP J diag J J J -==,其中10110i ii ii ii n n J λλλλ⨯⎛⎫ ⎪ ⎪⎪= ⎪ ⎪ ⎪⎝⎭,则 112(,,)k k k k k s P A P J diag J J J -==.因此lim 0lim 0lim 0(1,2,,)k k k i k k k A J J i s →∞→∞→∞=⇔=⇔==.而(1)11()()()()2(1)()()1()2()()i n k i k i k i k i i k i k i ki k i k i k i f f f f n f f J f f f λλλλλλλλλ-⎛⎫''' ⎪- ⎪' ⎪ ⎪⎪= ⎪'' ⎪ ⎪' ⎪⎪⎝⎭!!! 其中()k k f λλ=因为对任一多项式(),g λ当k →∞时,()01ki i g k λλ→⇔<.而1(1,2,,)()1i i s A λρ<=⇔<.由定理6和定理7即得如下结果.定理8 设n n A C ⨯∈,如果存在n n C ⨯上的一种相容矩阵范数.使1A <,则lim k →∞0k A =§5.3 矩阵的导数本节讨论三种导数:矩阵对变量的导数、函数对矩阵的导数、矩阵对矩阵的导数一、函数矩阵对变量的导数如果矩阵中诸元素都是某实变量x 的函数,则称这种矩阵为函数矩阵.它的一般形式是()⎪⎪⎪⎪⎪⎭⎫⎝⎛=)()()()()()()()()(212222111211x a x a x a x a x a x a x a x a x a x A mn m m n n ,其中()()1,2,,;1,2,,ij a x i m j n ==都是实变量x 的函数.定义8 设函数矩阵()[()]ij m n A x a x ⨯=,如果对一切正整数(),1,1i j i m j n ≤≤≤≤,均有()0lim ij ij x x a x b →=则说当0x x →时函数矩阵()A x 有极限,n m ij b B ⨯=][叫做()A x 的极限,记为()0lim x x A x B →=.该定义的实质是:如果()A x 的所有各元素()ij a x 在0x 处都有极限,则说()A x 在0x 处有极限()A x .若()A x 的所有各元素()ij a x 在0x 处连续,即0lim ()()ij x x A x a x →= (1,2,,;1,2,,)i m j n ==则称A ()x 在0x x =处连续,且记为00lim ()()x x A x A x →=.如果()A x 在某区间[,]a b 上处处连续,则说()A x 在[,]a b 上连续.容易验证下列等式是成立的: 设()()0lim ,lim x x x x A x A B x B →→==,则(1)0lim(()())x x A x B x A B →±=±;(2)()0lim ()x x kA x kA →=;(3)()0lim ()()x x A x B x AB →=.定义9 对于函数矩阵()n m ij x a x A ⨯=)]([,如果所有元素()()n j m i x a ij ,,2,1;,,2,1 ==在某点x 处[或在某区间上]均可导,则称()x A在x 处[或在某区间上]可导.导数[或导函数]记为()dA x dx,简记为()x A '.并规定()()()()()()()()()()()111212122212n n m m mna x a x a x a x a x a x d A x A x dxa x a x a x '''⎛⎫⎪''' ⎪'== ⎪ ⎪ ⎪'''⎝⎭, 其中()ija x '表示()x a ij 对x 的一阶导数. 矩阵对变量的导数运算具有如下一些性质:1° 若函数矩阵()()x B x A ,都可导,则它们的和亦可导,并且()()[]()()x B dxd x A dx d x B x A dx d+=+. 2° 若()x A 可导,()f x 是x 的可导函数,则()x f ()x A 可导,且()()[]()()()()x A dx d x f x A x f dx d x A x f dx d +⎥⎦⎤⎢⎣⎡=, 特别地,当()x f 为常数k 时,有()[]()x A dxd k x kA dx d=. 3° 若()x A 可导,则()x A T 可导,并且()()TT dx x dA x A dx d ⎪⎭⎫⎝⎛= 4° 若()x A ,()x B 可导且二者可乘,则()x A ()x B 亦可导,且()()[]()()()()x B dx d x A x B x A dx d x B x A dx d +⎥⎦⎤⎢⎣⎡=⋅. 推论 若()x A 可导,Q P ,为数字矩阵,则()[]()x A dxd P x PA dx d=,()[]()Q x A dx d Q x A dx d ⎥⎦⎤⎢⎣⎡=. 5° 若()x A 为可逆的可导函数矩阵,则()x A 1-亦可导,且()[]()()()x A dxx dA x A x A dx d 111----=. 证 因为1()(),A x A x E -=所以111()()[()()]()()0d dA x dA x A x A x A x A x dx dx dx---=+=. 于是111()()()()dA x dA x A x A x dx dx---=- 函数矩阵的导数本身也是一个函数矩阵,它可以再进行术导运算,下面我们给出函数矩阵对纯量的高阶导数:2232321()()()()()()()()()k k kd A x d dA x dx dx dx d A x d d A x dx dx dx d A x d d A x dx dx dx-=== 例1 设)(x A 为n 阶可导函数矩阵,求()x A 2的一、二阶导数.解()()()[]()()()()x A x A x A x A x A x A dxdx A dx d '+'==2 [注意一般 2()2()()dA x A x A x dx'≠]()()()()()[]x A x A x A x A dx dx A dxd '+'=222 ()()()[]()()x A x A x A x A x A ''+'+''=22.例2 设()()()⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=t x t x t x x n 21,其中()t x i 均为t 的可导函数,n n ij a A ⨯=][为n 阶实对称矩阵,求二次型Ax x T 对t 的导数.解 []()x A x x A x Ax x Ax x dtd T T T T'+'+'=.又A 为数字矩阵, A '=0,又x A x T '为t 的函数.而有()()()Ax x x A x x A x x A x T T TTT T '='='='.所以()x A x Ax x dxd T T'=2. 二、函数对矩阵的导数定义1 设n m ij x X ⨯=][为多元实变量矩阵,()()1111,,,,,,n m mn f X f x x x x =是以X 中诸元素为变量的多元函数,并且偏导数ijx f∂∂()1,2,,;1,2,,i m j n ==都存在,则定义函数)(X f 对矩阵X 的导数为⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂=mn m m nn x f x f x f x f x f x f x f x f x fdX df212222111211 特别,当X 为向量()Tn x x x x ,,,21 =时,函数()n x x x f ,,,21 对x 之导数为()x f x f x f x f dx df Tn ∇=⎪⎪⎭⎫⎝⎛∂∂∂∂∂∂=,,,21 例3 设[]()∑∑==⨯==m i nj ij nm ijx X f x X 112,,求dXdf解 2,1,2,,;1,2,,ij ijfx i m j n x ∂===∂.X x x x x x x x x x dX df mn m m n n 2222222222212222111211=⎪⎪⎪⎪⎪⎭⎫⎝⎛= . 例4 设1122,n n a x a x a x a x ⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭,1122()T n n f x a x a x a x a x ==+++,则12n a a df a dx a ⎛⎫⎪ ⎪== ⎪⎪⎝⎭三、矩阵对矩阵的导数定义11 设矩阵n m kl a A ⨯=][中每一个元素kl a 都是矩阵q p ij b B ⨯=][中各元素(1,2,...,;1,2,...,)ij b i p j q ==的函数,当A 对B 中各元素都可导时,则称矩阵A 对矩阵B 可导,且规定A 对B 的导数为11122122212q q p p pq A A A b b b A A A dA b b b dB A A A b b b ∂∂∂⎛⎫ ⎪∂∂∂ ⎪ ⎪∂∂∂ ⎪∂∂∂= ⎪⎪ ⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭,其中111122212212n ij ij ij n ijij ij ij m m mn ijijij a a a b b b a a a A b b b b a a a b b b ∂∂∂⎛⎫⎪∂∂∂ ⎪ ⎪∂∂∂ ⎪∂∂∂∂= ⎪∂⎪ ⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭,dB dA 是一个nq mp ⨯矩阵.例5 设n m ij a A ⨯=][,求dA dA 解⎪⎪⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂=mn m m n n mn m m n n E E E E E E E E E a A a A a A a A a A a A a A a A a AdA dA212222111211212222111211. 这里),(j i E ij 是元素都是1,其余元素都是0的n m ⨯矩阵. 例6 设()n x x x x ,,,21 =,()Tn y y y y ,,,21 =,其中()()m i x x x f y n i i ,,2,1,,,21 ==.如果()1,2,,;1,2,ijy i m j n x ∂==∂都存在,则y 对x 可导且⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂=⎪⎪⎭⎫ ⎝⎛∂∂∂∂∂∂=n mm m n n n x y x y x y x y x y x y x y x y x y x yx y x y dx dy21222121211121,, 例7 设12(,,,)n x x x x =,求Tdx dx.解 111122221212n T n n n n n x x x x x x x x x dx E dx x x x x x x x x x ⎛⎫∂∂∂⎪∂∂∂ ⎪ ⎪∂∂∂==⎪∂∂∂ ⎪ ⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭. 以下我们考虑向量对向量的导数设 12(,,),n x x x x = 12n y y y y ⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭,其中 12(,)(1,2,,).i i n y f x x x i m ==如果(1,2,,;1,2)ijy i m j n x ∂==∂都存在,则y对x 可导,且12(,,,)ndy y y ydx x x x ∂∂∂=∂∂∂111122221212n n m m n n y y y x x x y y y x x x y y y x x x ∂∂∂⎡⎤⎢⎥∂∂∂⎢⎥∂∂∂⎢⎥⎢⎥∂∂∂=⎢⎥⎢⎥⎢⎥∂∂∂⎢⎥⎢⎥∂∂∂⎣⎦(1)在一些书上,往往对行向量和列向量不加区别,而规定任何一个m 维向量y 对另一个n 维向量x 的导数都以上面(1)式最后的矩阵形式来表达,这主要是为了应用的方便例8 设数量函数()n x x x f y ,,,21 =的所有二阶偏导数都存在,记()Tn x x x x ,,,21 = 求梯度()dyf x dx∇=,及海森[Hessian]矩阵22()d y H x dx =解 12(),,,Tn dy y yy f x dx x x x ⎛⎫∂∂∂∇== ⎪∂∂∂⎝⎭. 222211212222221222222212()n n n n n y y y x x x x x yy y d y d dy H x x x x x x dx dx dx y y y x x x x x ⎛⎫∂∂∂ ⎪∂∂∂∂∂⎪ ⎪∂∂∂⎪⎛⎫===∂∂∂∂∂ ⎪ ⎪⎝⎭⎪⎪ ⎪∂∂∂⎪∂∂∂∂∂⎝⎭.当y 的所有二阶偏导数都连续时,Hessian 矩阵为n 阶对称矩阵.§5.4 矩阵的微分与积分定义12 当函数矩阵()[()]ij m n A x a x ⨯=可导时,其微分111212122212[]n n ij m nm m mn da da da da da da dA da da da da ⨯⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦,其中()ij ij da a x dx '=.(1)矩阵的微分实质上就是各个元素分别微分,因此,相应于每一个导数运算性质都可以得到一个关于微分的相应性质,例如();d A B dA dB +=+()();d AB dA B AdB =+ ();d kA kdA =(k 为常数)()()()d fA df A f dA =+ (()f f x =为可微函数)都是正确的如果矩阵A 中每个元素都是以矩阵B 中诸元素为变量的多元函数,则称矩阵A 是矩阵B 的函数,记为()A B .此时矩阵A 作为一个多元函数矩阵,它的全微分仍可按(1)式定义,只不过其中元素ij da 应该换成全微分,即 11pqij ij kl k l kla da db b ==∂=∂∑∑,这里,p q 分别是矩阵B 的行数和列数.定义13 若函数矩阵()(())ij m n A x a x ⨯=的所有各元素()(1,2,,;ij a x i m =1,2,,)j n =都在[,]a b 上可积,则称()A x 在[,]a b 上可积,且 111211222212()()()()()()()()()()nn m m mn bbb a x dx a x dx a x dx a a a bbba x dx a x dx a x dxb A x dx aa a ab bb a x dx a x dxa x dx a a a ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎰⎰⎰⎰⎰⎰⎰⎰⎰⎰.函数矩阵的定积分有如下简单性质:(1)()()b bkA x dx k A x dx a a=⎰⎰ k R ∈(2)[]()()()()b b bA xB x dx A x dx B x dx a a a+=+⎰⎰⎰ 函数矩阵的不定积分也有类似的情况.例8 设sin cos ()cos sin x x A x x x -⎛⎫= ⎪-⎝⎭,求()0x A x dx ⎰及2()0x d A x dx dx ⎰.解 sin (cos )01cos sin ()0sin 1cos cos sin 00xxxdxx dx x x x A x dx x x x x xdx xdx ⎛⎫- ⎪--⎛⎫⎪== ⎪ ⎪-⎝⎭⎪⎝⎭⎰⎰⎰⎰⎰.因为若以()ij a x 表示()A x 中各元素(,1,2)i j =,则有22()2()0ij ij x d a x dx xa x dx =⎰. 所以有 222222sin cos ()2()20cos sin x x x d A x dx xA x x dx x x ⎛⎫-== ⎪⎝⎭⎰.。