同济大学--矩阵分析课件---矩阵论§3.6-2

合集下载

矩阵分析课件

矩阵分析课件

1 13
3 3 3
1
2
0
1
3 3
3
1 3
2 3
1
1 3
向量 A第一组基下的坐标为
x1
7 3
,
x2
4 3
,
x3
1, 3
x4
2 3
利用坐标变换公式可以求得 A 在第二组基下的坐标为
y1 y2 y3 y4
123
3
1
3
1 3
1 3 2 3
0 0 0
1 1
13 3 1 3
x1 1
例 4 全体正的实数 R 在下面的加法与数乘的
定义下也构成线性空间:
a b : ab, a, b R
k a : ak , a, k R
例 5 R 表示实数域 R 上的全体无限序列组成的
的集合。即
R
[a1,
a2, a3,]
ai F, i 1,2,3,
在 R 中定义加法与数乘:
[a1, a2, a3,] [b1, b2, b3,] [a1 b1, a2 b2, a3 b3, ] k[a1, a2, a3,] [ka1, ka2, ka3,] 则 R 为实数域 R上的一个线性空间。
i a1i1 a2i2 anin
a1i
1,2,
,
n
a2i
,
i 1, 2,
,n
ani
将上式矩阵化可以得到下面的关系式:
a11 a12
a1n
1, 2,
,
n
1
,2
,n
a21
a22
a2
n
an1 a2
ann
称 n 阶方阵
记为P

矩阵论课本2

矩阵论课本2

第三章 矩阵分解把矩阵分解为形式比较简单或具有某种特性的一些矩阵的乘积,在矩阵理论的研究与应用中,都是十分重要的。

因为这些分解式的特殊形式一方面能明显地反映出原矩阵的某些数值特征,如矩阵的秩、行列式、特征值及奇异值等,另一方面分解的方法与过程往往提供了某些有效的数值计算方法和理论分析根据。

本章将分别介绍矩阵的五种分解:三角分解、QR 分解、满秩分解、谱分解和奇异值分解,并简单介绍了矩阵的正则性。

§3.1 矩阵的三角分解三角矩阵的计算,如求行列式、求逆矩阵、求解线性方程组等,都是很方便的,因此首先研究是否可将矩阵分解成一些三角矩阵的乘积。

定义3.1.1 设n n A C ⨯∈,如果存在下三角矩阵n n L C ⨯∈和上三角矩阵n n R C ⨯∈,使得A LR =,则称A 可以作三角分解。

定理 3.1.1 设n n n A C ⨯∈,则A 可以作三角分解的充分必要条件是0k ∆≠(1,2,,1)k n =-,其中det k k A ∆=为A 的k 阶顺序主子式,而k A 为A 的k 阶顺序主子阵。

证明:必要性。

已知A 可以作三角分解,即A LR =,其中()ij n nL l ⨯=(0,)ij l i j =<,()ij n nR r ⨯=(0,)ij r i j =>。

将A ,L 和R 进行分块,得12122122212222kkkA A L O R R A A L L O R ⎛⎫⎛⎫⎛⎫= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭, 这里k A ,k L 和k R 分别是A ,L 和R 的k 阶顺序主子阵,且k L 和k R 分别是上三角矩阵和下三角矩阵。

由矩阵的分块乘法运算,得k k k A L R = (1,2,,)k n =,由于1111det det det 0nn nn A L R l l r r ==≠,所以1111det det det 0(1,2,1)k k k kkk kk A L R l l r r k n ∆===≠=-充分性。

矩阵分析课件

矩阵分析课件
一、线性空间的概念 几何空间和 n 维向量空间的回顾 推广思想:
抽象出线性运算的本质,在任意研究对象的集 合上定义具有线性运算的代数结构。
定义1.1(P .1)
要点:
• 集合V 与数域F • 向量的加法和数乘向量运算 • 运算的性质刻画
常见的线性空间
F n={X=(x1,x2,…,xn)T:x F} 运算:向量加法和数乘向量 F mn = {A=[aij]mn:a ijF}; 运算:矩阵的加法和数乘矩阵 i 1 R mn ;C mn 。 ix a i aiR} Pn [x]={p(x)= :
0
1
]
5 向量的长度 定义: || || = ( , ) 性质: || k || =k || || ;
Cauchy 不等式:
, [Vn(F);(,)], | (,) | || || || || 。 || +|| || || +|| ||
如果
W1=L{1,2,…, m },
W2=L{1,2,…, k},
则 W1+W2=L{1,2,…,m,1,2,…, k }
3 、维数公式
子空间的包含关系: W1 W1 W2 W1 W2 Vn ( F ) W2
dimW1W2 dim Wi dimW1+W2 dimVn(F)。
子空间的“和”为“直和”的充要–条件 : 定理1· 8 设 W=W1+W2,则下列各条等价: ( 1) W=W1W2 ( 2) X W,X=X 1+X2的表 是惟一的 ( 3) W中零向量的表示是惟一的 ( 4) dim W =dimW1+dimW2
例1 P12 eg18 例2 设在Rn×n中,子空间 W 1={A AT =A } , W2={B BT= –B }, 证明Rn×n=W1W2。 例3 子空间W的“直和补子空间”

同济大学--矩阵分析课件---矩阵论§3.5

同济大学--矩阵分析课件---矩阵论§3.5

⎛ n ⎞ T (α + β ) = T ⎜ ∑ ( k i + l i ) α i ⎟ ⎝ i =1 n ⎠ n n = ∑ ( ki + li )β i = ∑ ki β i + ∑ li β i = T (α ) + T ( β ) ,
i =1 i =1 i =1
⎛ n ⎞ ⎛ n ⎞ T ( λα ) = T ⎜ λ ∑ kiα i ⎟ = T ⎜ ∑ λ kiα i ⎟ ⎝ i =1 ⎠ ⎝ i =1 ⎠ n = ∑ λ k i β i = λ T (α ) .
11
⎡ kTT −1 (α ) ⎤ = T −1 ⎡ kT T −1 (α ) ⎤ T ( kα ) = T ⎣ ⎦ ⎣ ⎦ −1 ⎡T kT −1 (α ) ⎤ = T −1T kT −1 (α ) =T ⎣ ⎦ = kT −1 (α ) .
−1 −1
(
) (
( )(
)
)
注:当T 可逆时,可以定义T 的负整数幂,即 ∀n ∈ Z + , n −n −1 定义 T = T .
§3.5
线性变换(线性映射)
定义: 若在数域F 的线性空间V上,有一种规则T,使得 ' V中任意向量α 对应于V中唯一向量α T (α ) , 规则T 称为V 的变换, ' 称为α的像,α 称为 α ' 的原像. α
T : V ⎯⎯ V →
α
α = T (α )
'
如果变换T 又满足下面条件: ∀α , β ∈V 和 k ∈ F 有
α = T (α ) = Aα ∈ R
'
n
⇒ T是线性变换,由方阵A所确定的线性变换也
通常用A表示.

《矩阵论》课件 共39页PPT资料

《矩阵论》课件 共39页PPT资料

n
x 1
xi ;
i1
1
x
2


n i1
xi
2 2
;
x


max
1 i n
xi
;
1
x
n p i 1
xi
p p ,
p1
x , x , x , x ( p 1)都是 C n上的向量范数。
1
2

p
引6理 .1.1 如 果p实 1,q数 1且111,则 对 pq
向 量 范,数1,,n为V的 一 组,V基中 任 一 向量
n
可唯一地表示为xii, x(x1,, xn)T Pn. i1
则 是x1,, xn的连续函. 数
定义6.1.2 设 , 是n维线性V空 上间 定义的 ab
种 向 量,范 如数 果 存 在 两 无个关与的 正 常
其中p 实 1,q 数 1且 111. pq
定理6.1.2(Minkowski不等式)
设 x ( x 1 , ,x n ) T ,y ( y 1 , ,y n ) T C n ,则
1
1
1
i n1xiyi p p i n1xi p p i n1yi p p
定理6.1.5 设V是 数 域 P上 的n维 线 性 空,间 1,,n 为V的 一 组,基 则V中 任 一 向可 量唯 一 地 表 示
n
xii , x (x1,, xn)T Pn.又 设 是Pn上 的
i1
向 量 范,数 令 v
x,
则 是V上的向量范. 数 v
定理6.1.6 设 是数域 P上n维线性空V上 间的任一

同济大学--矩阵分析课件---矩阵论§1.1

同济大学--矩阵分析课件---矩阵论§1.1

= −2.
方阵行列式的运算性质
(1) (2)
AT = A ;
λ A = λn A ;
(3)
AB = A B
6. 方阵的迹
定义: n 阶方阵 A 的对角元素的和称为 A 的迹, 记作 tr( A),即
tr( A) = a11 + a 22 +
方阵迹的运算性质
(1) tr( A) + tr( B ) = tr( A + B ) ;
(1) (2) (3) (4)
(AT)T = A; (A+B)T = AT + BT; (λA)T = λAT; (AB)T = BTAT;
5. 方阵的行列式
定义: 由n 阶方阵A 的元素所构成的行列式叫做 方阵A 的行列式, 记作 | A | 或 detA .
⎛ 2 3 ⎞, 则 A = 2 3 例如: A = ⎜ ⎟ 6 8 6 8⎠ ⎝
• • • • • • 基础知识和矩阵的分解 矩阵的标准形 线性空间与线性变换 内积空间 矩阵分析 矩阵的广义逆
线性代数基础知识
• 矩阵的基本运算 • 线性方程组的解的结构以及求解方法 • 矩阵的特征值与特征向量 • 实对称矩阵的基本性质
§1.1 矩阵的基本运算
定义: 由m×n个数 aij ( i =1, 2, ···, m; j =1, 2, ···, n ) 排成的 m 行 n 列的数表: a11 a12 a1 n a 21 a 22 a2n
+ a nn
( 2) tr( kA) = k tr( A) ;
( 3) tr( AB ) = tr( BA) ;
7. 共轭矩阵
定义: 当 A = (aij) 为复矩阵时, 用 a ij 表示aij 的共轭 复数, 记 A = (a ij ), 称 A 为A 的共轭矩阵. 运算性质 设A, B为复矩阵, λ为复数, 且运算都是可行的, 则:

同济大学--矩阵分析课件---矩阵论§3.6-1

T
−1
15
∴ BA=E, 即T是满秩的线性变换.
⇐ T (α , α , S (α 1 , α 2 ,
1 2
, α n ) = (α 1 , α 2 ,
,α n ) A
, α n ) = (α 1 , α 2 ,
,α n ) A
−1
∴ TS = ST = I. 例: 设T 是n维线性空间V 的线性变换, T 在V的一个基
§3.6 线性变换的矩阵
取V 的基 α1 , α 2 , 表示,有
, α n , V中任意向量β可由基线性
β = (α 1 , α 2 ,
⎡ k1 ⎤ ⎢k ⎥ ⎛ n ⎞ n T 的坐标 ⎢ 2 ⎥ 唯一确定, ( β ) = T ⎜ ∑ kiα i ⎟ = ∑ kiT (α i ), ⎢ ⎥ ⎝ i =1 ⎠ i =1 ⎢ ⎥ ⎢ kn ⎥ ⎣ ⎦ T由它在基上的作用 T(αi) 唯一确定,自然地得到
1
⎡ k1 ⎤ ⎢k ⎥ ⎢ 2⎥, ,α n ) 即β由它在基 α 1 , α 2 , ⎢ ⎥ ⎢ ⎥ ⎢ kn ⎥ ⎣ ⎦
,α n 下
线性变换与矩阵的联系.
定义:设 α 1 , α 2 ,
, α n是数域F上n 维线性空间V的一个基,
, T (α n ) 可由基 α 1 , α 2 ,
T (α 1 ) , T (α 2 ) ,
由线性变换的定义易知,T 是V 的线性变换. ⎡0 ⎤ ⎢ ⎥ ⎢ ⎥ T (α i ) = (α1 , α 2 , , α n ) A ⎢1 ⎥ i i = 1, 2, ⎢ ⎥ ⎢ ⎥ ⎢0 ⎥ T (α i ) = (α1 , α 2 , , α n ) Aei ⎣ ⎦ T ( α 1 , α 2 , , α n ) = ( T ( α 1 ) , T ( α 2 ) , , T (α n ) )

矩阵分析课件

引理 设 矩阵 A 的左上角元a11 0, 并且 A 中至少有一个元素不能被它整除,那 么一定可以找到一个与 A 等价的矩B , 它的左上角元素也不为零,但是次数比a11
的次数低。
定理 2.1.4 任意一个非零的n阶 矩阵 A
都等价于一个对角矩阵,即
A( )
d1( )
参照例 2.1.2 的方法可把二阶矩阵用初等变换化某一
个元素成常数。
1
A 0
0
1 C2C3 0
0
1 C3 C2 0
0
0
3 2 2 4 3 2
0
3 2 1
4 3 2
0
3 2 2 4 3 2
0
2 1
0
0
0
2
2 1
4 3 2
0
1
0
2
2
3
2 5
3
然后用初等变换把公因子 所在的行、列的
其余元素均化为零。
A( )
2 3
2
2
3
5
23r1
r2
0
2 5
3
(
2
10
3)
( 5)C1C2
0
0
(
2
10
3)
3
3C2 0
0 ( 2 10 3)
例 2.1.2 用初等变换把 矩阵
1 2
A( )
【证明】必要性:设 A()可逆,在式(2.1.1)
的两边求行列式得
A( ) B( ) 1
(2.1.2)
因为 A( ) 和 B( ) 都是 的多项式,所以根
据式(2.1.2)推知,A( ) 和 B( ) 都是零次多
项式,此即 A( ) 是非零的常数.

矩阵论矩阵分析

第三章 矩阵分析在此之前我们只研究了矩阵的代数运算,但在数学的许多分支和工程实际中,特别是涉及到多元分析时,还要用到矩阵的分析运算.本章首先讨论矩阵序列的极限和矩阵级数,然后介绍矩阵函数和它的计算,最后介绍矩阵的微积分,以及矩阵分析在解微分方程组和线性矩阵方程中的应用.§3.1 矩阵序列 定义 3.1 设有Cm n⨯中的矩阵序列{}()k A ,其中()()()k k ij m nAa ⨯=.若()lim (1,2,,;1,2,,)k ij ij k a a i m j n →+∞=== ,则称矩阵序列{}()k A 收敛于()ij m n A a ⨯=,或称A 为矩阵序列{}()k A 的极限,记为()lim k k A A →+∞=或()()k A A k →→+∞不收敛的矩阵序列称为发散. 由定义可见,Cm n⨯中一个矩阵序列的收敛相当于mn 个数列同时收敛.因此,可以用初等分析的方法来研究它.但同时研究mn 个数列的极限未免繁琐.与向量序列一样,可以利用矩阵范数来研究矩阵序列的极限. 定理 3.1 设()k A,C (012)m n A k ,,,⨯∈= .则()lim k k AA →+∞=的充分必要条件是()lim 0k k A A →+∞-=,其中 是C m n ⨯上的任一矩阵范数.证 先取Cm n⨯上矩阵的G-范数.由于()()()()1=1k k k ij ij ij ij Gi,jm nk ijiji j a a a a A Aaa =-≤-=-≤-所以()lim k k A A →+∞=的充分必要条件是()lim 0k Gk A A→+∞-=.又由范数的等价性知,对C m n⨯上任一矩阵范数 ,存在正常数α,β,使得()()()k k k GGAAAA AA αβ-≤-≤-故()lim 0k Gk AA→+∞-=的充分必要条件是()lim 0k k A A →+∞-=.证毕推论 设()k A,C(012)m nA k ,,,⨯∈= ,()lim k k A A →+∞=.则()lim k k A A →+∞=其中 是Cm n⨯上任一矩阵范数.证 由()()k k AA A A -≤-即知结论成立.证毕需要指出的是,上述推论的相反结果不成立.如矩阵序列()1(1)112k k A k ⎛⎫- ⎪=+ ⎪ ⎪⎝⎭不收敛.但()Flim lim k k x A →+∞== 收敛的矩阵序列的性质,有许多与收敛数列的性质相类似. 定理3.2 设()lim k k AA →+∞=,()lim k k B B →+∞=,其中()k A ,()k B ,A ,B 为适当阶的矩阵,α,β∈C .则 (1)()()lim ()k k k AB A B αβαβ→+∞+=+;(2) ()()lim k k k A BAB →+∞=;(3)当()k A与A 均可逆时,()11lim ()k k AA --→+∞=.证 取矩阵范数 ,有()()()()()()()()()()()()()()()k k k k k k k k k k k k k A B A B A A B B A B ABA B A B A B AB A B B A A Bαβαβαβ+-+≤-+--=-+-≤-+-由定理3.1和推论知(1)和(2)成立.因为()1()k A -,1A -存在,所以()lim det det 0k k AA →+∞=≠,又有()lim adj adj k k A A →+∞=.于是()()11()adj adj lim ()lim det det k k k k k A AA A A A--→+∞→+∞=== 证毕 定理3.2(3)中条件()k A与A 都可逆是不可少的,因为即使所有的()k A可逆也不能保证A一定可逆.例如()11111k Ak ⎛⎫+ ⎪= ⎪ ⎪⎝⎭对每一个()k A都有逆矩阵()1()1k kk A k k --⎛⎫=⎪-+⎝⎭,但()11lim 11k k A A →+∞⎛⎫== ⎪⎝⎭而A 是不可逆的. 在矩阵序列中,最常见的是由一个方阵的幂构成的序列.关于这样的矩阵序列有以下的概念和收敛定理. 定义3.2 设n nA C ⨯∈,若()lim 0k k A→+∞=,则称A 为收敛矩阵.定理3.3 设n nA C⨯∈,则A 为收敛矩阵的充分必要条件是ρ(A )<1.证 必要性.已知A 为收敛矩阵,则由谱半径的性质,有(())()k k k A A A ρρ=≤其中 是Cn n⨯上任一矩阵范数,即有lim (())0kk A ρ→+∞=,故ρ(A )<1.充分性.由于ρ(A )<1,则存在正数ε,使得ρ(A )+ε<1.根据定理2.14,存在C n n⨯上的矩阵范数m ,使得()1m A A ρε≤+<从而由kk m mAA ≤得lim 0kmk A →+∞=.故lim 0k k A →+∞=. 证毕推论 设n nA C ⨯∈.若对Cn n⨯上的某一矩阵范数 有1A <,则A 为收敛矩阵.例3.1 判断下列矩阵是否为收敛矩阵:(1)181216A -⎛⎫= ⎪-⎝⎭; (2)0.20.10.20.50.50.40.10.30.2A ⎛⎫⎪= ⎪ ⎪⎝⎭. 解 (1)可求得A 的特征值为156λ=,212λ=-,于是5()16A ρ=<,故A 是收敛矩阵; (2)因为10.91A =<,所以A 是收敛矩阵.§3.2 矩阵级数定义3.3 由Cm n⨯中的矩阵序列{}()k A 构成的无穷和(0)(1)()k A A A ++++ 称为矩阵级数,记为()k k A+∞=∑.对任一正整数N ,称()()NN k k SA ==∑为矩阵级数的部分和.如果由部分和构成的矩阵序列{}()N S收敛,且有极限S ,即()lim N N SS →+∞=,则称矩阵级数()0k k A +∞=∑收敛,而且有和S ,记为()k k S A+∞==∑不收敛的矩阵级数称为发散的.如果记()()()k k ij m n Aa ⨯=,()ij m n S s ⨯=,显然()0k k S A +∞==∑相当于()(1,2,,;1,2,,)k ij ij k a s i m j n +∞====∑即mn 个数项级数都收敛. 例3.2 已知()1π24(0,1,)10(1)(2)k kk A k k k ⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭研究矩阵级数()k A+∞∑的敛散性.解 因为k 00()()001π2410(1)(2)1π1242341012N Nk Nk k N k N k k N N S A k k N ====⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭⎛⎫⎛⎫-- ⎪ ⎪⎝⎭ ⎪= ⎪- ⎪+⎝⎭∑∑∑∑所以()4π2lim 301N N S S →+∞⎛⎫⎪= ⎪ ⎪⎝⎭故所给矩阵级数收敛,且其和为S . 定义3.4 设()()()C (0,1,)k k m n ij m n Aa k ⨯⨯=∈= .如果mn 个数项级数()0(1,2,,;1,2,,)k ijk ai m j n +∞===∑ 都绝对收敛,即()k ijk a +∞=∑都收敛,则称矩阵级数()k k A+∞=∑绝对收敛.利用矩阵范数,可以将判定矩阵级数是否绝对收敛转化为判定一个正项级数是否收敛的问题.定理3.4 设()()()C(0,1,)k k m nij m nAa k ⨯⨯=∈= .则矩阵级数()0k k A +∞=∑绝对收敛的充分必要条件是正项级数()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数.证 先取矩阵的1m -范数.若1()k k m A +∞=∑收敛,由于1()()()11(1,2,,;1,2,,)mnk k k ijij i j m aa A i m j n ==≤===∑∑从而由正项级数的比较判别法知()k ijk a+∞=∑都收敛,故()k k A+∞=∑绝对收敛.反之,若()k k A+∞=∑绝对收敛,则()0k ijk a+∞=∑都收敛,从而其部分和有界,即()0(1,2,,;1,2,,)Nk ijijk aM i m j n =≤==∑ 记,max ij i jM M =,则有1()()()0011110()()NNmnm n Nk k k ijijk k i j i j k m AaamnM =========≤∑∑∑∑∑∑∑故1()k k m A +∞=∑收敛.这表明()k k A+∞=∑绝对收敛的充分必要条件是1()k k m A +∞=∑收敛.由矩阵范数的等价性和正项级数的比较判别法知,1()k k m A+∞=∑收敛的充分必要条件是()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数. 证毕利用矩阵级数收敛和绝对收敛的定义,以及数学分析中的相应结果,可以得到以下一些结论.定理3.5 设()k k AA +∞==∑,()0k k B B +∞==∑,其中()k A ,()k B ,A ,B 是适当阶的矩阵,则(1)()()0()k k k AB A B +∞=+=+∑;(2)对任意λ∈C ,有()k k AA λλ+∞==∑;(3)绝对收敛的矩阵级数必收敛,并且任意调换其项的顺序所得的矩阵级数仍收敛,且其和不变; (4)若矩阵级数()k k A+∞=∑收敛(或绝对收敛),则矩阵级数()k k PAQ +∞=∑也收敛(或绝对收敛),并且有()()0()(3.1)k k k k PAQ P A Q+∞+∞===∑∑(5)若()k k A+∞=∑与()k k B+∞=∑均绝对收敛,则它们按项相乘所得的矩阵级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)(()()(3.2)k k k A B AB A B A B A B A B -++++++++ 也绝对收敛,且其和为AB . 证 只证(4)和(5).若()0k k A+∞=∑收敛,记()()0NN k k SA ==∑,则()lim N N S A →+∞=.从而()()00lim(lim)NNk k N N k k PAQ P AQ PAQ →+∞→+∞====∑∑可见()k k PAQ +∞=∑收敛,且式(3.1)成立.若()k k A+∞=∑绝对收敛,则由定理3.4知()k k A +∞=∑收敛,但()()()k k k PA Q P AQ Aα≤≤其中α是与k 是无关的正数,从而()k k PAQ +∞=∑收敛,即()k k PAQ +∞=∑绝对收敛.当()k k A+∞=∑和()k k B+∞=∑绝对收敛时,由定理3.4知()k k A+∞=∑和()0k k B +∞=∑收敛,设其和分别为1σ与2σ,从而它们按项相乘所得的正项级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()k k k A B A B A B ABABAB-++++++++也收敛,其和为12σσ.因为(0)()(1)(1)()(0)(0)()(1)(1)()(0)k k k k k k A B A B A B ABABAB--+++≤+++所以矩阵级数(3.2)绝对收敛.记()()1NN k k SA==∑,()()2NN k k SB ==∑,()(0)()(1)(1)()(0)3()NN k k k k SA B A B A B -==+++∑则()()()(1)()(2)(1)(2)()()(1)()()123N N N N N N N N N S S S A B A B A B A B A B --=++++++又记()()1NN k k Aσ==∑,()()2NN k k B σ==∑,()(0)()(1)(1)()(0)3()NN k k k k A B A B A B σ-==+++∑显然()()()()()()123123N N N N N N S S S σσσ-≤-故由()()12lim N N N S S AB →+∞=和()()()123lim ()0N N N N σσσ→+∞-=,得()3lim N N S AB →+∞=证毕下面讨论一类特殊的矩阵级数——矩阵幂级数. 定义3.5 设n nA C⨯∈,C(0,1,)k a k ∈= .称矩阵级数kk k a A+∞=∑为矩阵A 的幂级数.利用定义来判定矩阵幂级数的敛散性,需要判别2n 个数项级数的敛散性,当矩阵阶数n 较大时,这是很不方便的,且在许多情况下也无此必要.显然,矩阵幂级数是复变量z 的幂级数0kk k a z+∞=∑的推广.如果幂级数kk k a z+∞=∑的收敛半径为r ,则对收敛圆z r <内的所有z ,kk k a z+∞=∑都是绝对收敛的.因此,讨论kk k a A+∞=∑的收敛性问题自然联系到kk k a z+∞=∑的收敛半径.定理3.6 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.则(1)当ρ(A )<r 时,矩阵幂级数0kk k a A+∞=∑绝对收敛;(2)当ρ(A )>r 时,矩阵幂级数kk k a A+∞=∑发散.证 (1)因为ρ(A )<r ,所以存在正数ε,使得ρ(A )+ε<r .根据定理2.14,存在Cn n⨯上的矩阵范数m ,使得m ()A A r ρε≤+<从m m(())kk k k k k a A a A a A ρε≤≤+而由于幂级数(())kkk aA ρε+∞=+∑收敛,故矩阵幂级数0k k k a A +∞=∑绝对收敛.(2)当ρ(A )>r 时,设A 的,n 个特征值为12,,,n λλλ ,则有某个l λ满足l r λ>.由Jordan 定理,存在n 阶可逆矩阵P ,使得11112(10)i n n P AP J λδδδλλ--⎛⎫⎪⎪== ⎪⎪⎝⎭代表或而kk k a J+∞=∑的对角线元素为0(1,2,,)k k jk a j n λ+∞==∑ .由于0k k lk a λ+∞=∑发散,从而0k k k a J +∞=∑发散.故由定理 3.5(4)知,kkk a A+∞=∑也发散. 证毕推论 设幂级数kkk a z +∞=∑的收敛半径为r ,C n n A ⨯∈.若存在C n n ⨯上的某一矩阵范数 使得A r <,则矩阵幂级数0kk k a A+∞=∑绝对收敛.例3.3 判断矩阵幂级数018216kkk k+∞=-⎛⎫ ⎪-⎝⎭∑的敛散性. 解 令181216A -⎛⎫= ⎪-⎝⎭.例3.1中已求得5()6A ρ=.由于幂级数0kk kz +∞=∑的收敛半径为r =1,故由ρ(A )<1知矩阵幂级数kk kA+∞=∑绝对收敛.最后,考虑一个特殊的矩阵幂级数. 定理3.7 设Cn nA ⨯∈.矩阵幂级数kk A+∞=∑(称为Neumann 级数)收敛的充分必要条件是ρ(A )<1,并且在收敛时,其和为1()I A --. 证 当ρ(A )<1时,由于幂级数kk z+∞=∑的收敛半径r =1,故由定理 3.6知矩阵幂级数0kk A+∞=∑收敛.反之,若kk A+∞=∑收敛,记0kk S A+∞==∑,()()0NN k k SA ==∑则()lim N N S S →+∞=.由于()(1)()(1)lim lim ()=lim lim N N N N N N N N N A S S S S O --→+∞→+∞→+∞→+∞==--故由定理3.3知ρ(A )<1.当kk A+∞=∑收敛时,ρ(A )<1,因此I -A 可逆,又因为()1()N N S I A I A +-=-所以()111()()N N S I A A I A -+-=---故()1lim ()N N S S I A -→+∞==- 证毕 例3.4 已知0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,判断矩阵幂级数0k k A +∞=∑的敛散性.若收敛,试求其和.解 因为10.91A =<,所以kk A+∞=∑收敛,且102814141()44624214202535k k A I A +∞-=⎛⎫ ⎪=-= ⎪ ⎪⎝⎭∑ §3.3 矩阵函数矩阵函数是以矩阵为变量且取值为矩阵的一类函数.本节介绍矩阵函数的定义和计算方法,并讨论常用矩阵函数的性质. 一、矩阵函数的定义 定义3.5 设幂级数0k k k a z +∞=∑的收敛半径为r ,且当z r <时,幂级数收敛于函数f (z ),即0()()kk k f z a zz r +∞==<∑如果Cn nA ⨯∈满足ρ(A )<r ,则称收敛的矩阵幂级数kk k a A+∞=∑的和为矩阵函数,记为f (A ),即0()(3.3)kk k f A a A+∞==∑根据这个定义,可以得到在形式上和数学分析中的一些函数类似的矩阵函数.例如,对于如下函数的幂级数展开式02120101e ()!(1)sin ()(21)!(1)cos ()(2)!(1)(1)(1)ln(1)(1)1kzk k k k k kk kk k k k z r k z zr k z zr k z z r z zr k +∞=+∞+=+∞=+∞-=+∞+===+∞-==+∞+-==+∞-==-+==+∑∑∑∑∑ 相应地有矩阵函数01e !kk A A k +∞==∑(C n n A ⨯∈) 210(1)sin (21)!kk k A A k +∞+=-=+∑ (C n n A ⨯∈)20(1)cos (2)!k kk A A k +∞=-=∑ (C n n A ⨯∈)1()k k I A A +∞-=-=∑ (ρ(A )<1)1(1)ln()1k k k I A A k +∞+=-+=+∑ (ρ(A )<1)称e A为矩阵指数函数,sin A 为矩阵正弦函数,cos A 为矩阵余弦函数.如果把矩阵函数f (A )的变元A 换成At ,其中t 为参数,则相应得到()()(3.4)kk k f At a At +∞==∑在实际应用中,经常需要求含参数的矩阵函数.二、矩阵函数值的计算以上利用收敛的矩阵幂级数的和定义了矩阵函数f (A ),在具体应用中,要求将f (A )所代表的具体的矩阵求出来,即求出矩阵函数的值.这里介绍几种求矩阵函数值的方法.以下均假设式(3.3)或式(3.4)中的矩阵幂级数收敛. 方法一 利用Hamilton-Cayley 定理利用Hamilton-Cayley 定理找出矩阵方幂之间的关系,然后化简矩阵幂级数求出矩阵函数的值.举例说明如下. 例3.5 已知0110A ⎛⎫=⎪-⎝⎭,求e At.解 可求得2det()1I A λλ-=+.由Hamilton-Cayley 定理知2A I O +=,从而2A I =-,3A A =-,4A I =,5A A =,…即2(1)k k A I =-,21(1)(1,2,)k k A Ak +=-=故243501e 1!2!4!3!5!cos sin (cos )(sin )sin cos Atk k k t t t t A t I t Ak t t t I t A t t +∞=⎛⎫⎛⎫==-+-+-+- ⎪ ⎪⎝⎭⎝⎭⎛⎫=+= ⎪-⎝⎭∑例3.6 已知4阶方阵A 的特征值为π,-π,0,0,求sin A ,cos A .解 因为2422det()(π)(π)πI A λλλλλλ-=-+=-,所以422πA A O -=.于是422πA A =,523πA A =,642πA A =,743πA A =,…即2222πkk A A -=,21223π(2,3,)k k A A k +-==故213223023321323332(1)1(1)sin π(21)!3!(21)!11(1)π3!π(21)!sin ππ1ππk k k k k k k k k A A A A Ak k A A A k A A A A +∞+∞+-==+∞+=--==-+++⎛⎫-=-+ ⎪+⎝⎭=+=-∑∑∑-22222022222(1)1(1)cos π(2)!2!(2)!cos π12ππk k k k k k A A I A Ak k I A I A +∞+∞-==--==-+=+=-∑∑-方法二 利用相似对角化 设C n nA ⨯∈是可对角化的,即存在C n n n P ⨯∈,使得112diag(,,,)n P AP A λλλ-== 则有11112112()()()diag(,,,)diag((),(),,())kkk k k k k k k kk k k k k n k k k n f A a A a P P P a P P a a a P P f f f P λλλλλλ+∞+∞+∞--===+∞+∞+∞-===-==Λ=Λ==∑∑∑∑∑∑同理可得112()diag((),(),,())n f At P f t f t f t P λλλ-=例3.7 已知460350361A ⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭,求e At,cos A .解 可求得2det()(2)(1)I A λλλ-=+-,即A 的特征值为12λ=-,231λλ==.对应12λ=-的特征向量为T 1(1,1,1)p =-,对应231λλ==的两个线性无关的特征向量为T 2(2,1,0)p =-,T 3(0,0,1)p =.于是120110101P --⎛⎫ ⎪= ⎪ ⎪⎝⎭ 使得1211P AP --⎛⎫⎪= ⎪ ⎪⎝⎭故22212222e 2e e 2e 2e 0e e e e2e e 0e e e 2e 2e e tt t t t At tt t t t t t t t tt P P --------⎛⎫⎛⎫-- ⎪ ⎪==--⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭1cos(2)cos cos1cos12cos1cos 22cos12cos 20cos 2cos12cos 2cos10cos 2cos12cos 22cos1cos1A P--⎛⎫⎪= ⎪ ⎪⎝⎭--⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭方法三 利用Jordan 标准形 设Cn nA ⨯∈,且C n nn P ⨯∈,使得121s J J P AP J J -⎛⎫ ⎪⎪== ⎪ ⎪⎝⎭ 其中×1(1,2,,)1i iii i i r rJ i s λλλ⎛⎫ ⎪⎪== ⎪⎪⎝⎭由定理1.12得111111001(1)01(1C C ()C ()()1!(1)!()1!()()1!(1)!i i i i i i i r k r k k i k i k ik k k k i i k i k k k k k ik i r r k k k i k k k k k tr r i f J t a J t a t t t r a t t t f f f r λλλλλλλλλλλλλλλλ--+-+∞+∞-==--+∞==--⎛⎫ ⎪⎪== ⎪ ⎪ ⎪⎝⎭⎛⎫' ⎪- ⎪⎪= ⎪⎪'⎪ ⎪⎝⎭'-=∑∑∑)()()()1!()i tt f t f f λλλλλ=⎛⎫ ⎪ ⎪⎪ ⎪⎪' ⎪ ⎪⎝⎭从而1010110011()()()()()k kk kk k k k k k k k k k k k k k k s k s f At a A t a PJP t a J tP a J t P P P a J t f J t P Pf J t +∞+∞-==+∞=+∞--=+∞=-==⎛⎫⎪ ⎪== ⎪⎪ ⎪ ⎪⎝⎭⎛⎫ ⎪= ⎪ ⎪⎝⎭∑∑∑∑∑例3.8 已知101120403A -⎛⎫⎪= ⎪ ⎪-⎝⎭,求e A,sin At .解 例1.9已求得100111210P ⎛⎫ ⎪=-- ⎪ ⎪⎝⎭,11112P AP J -⎛⎫⎪== ⎪ ⎪⎝⎭于是12222e e e 0ee e 3e e e 2e+e e 4e 03e A P P -⎛⎫⎛⎫ ⎪ ⎪==- ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭-- 1sin cos sin sin sin 2sin 2cos 0cos sin 2cos sin 2sin 2cos sin sin 24cos 02cos sin t t t At P t Pt t t t t t t t t t t t t t t t t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭-⎛⎫ ⎪=+---+ ⎪ ⎪-+⎝⎭根据Jordan 标准形理论可得 定理3.8 设Cn nA ⨯∈,1λ,2λ,…,n λ是A 的n 个特征值,则矩阵函数f (A )的特征值为1()f λ,2()f λ,…,()n f λ. 方法四 待定系数法 设Cn nA ⨯∈,且A 的特征多项式为1212()det()()()()(3.5)srr r s I A ψλλλλλλλλ=-=---其中1λ,2λ,…,s λ是A 的全部互异特征值,12s r r r n +++= .为计算矩阵函数()k kk k f At a A t +∞==∑,记0()k k k k f t a t λλ+∞==∑.将f (λt )改写为()(,)()(,)(3.6)f t q t r t λλψλλ=+其中q (λ,t )是含参数t 的λ的幂级数,r (λ,t )是含参数t 且次数不超过n -1的λ的多项式,即1110(,)()()()n n r t b t b t b t λλλ--=+++由Hamilton-Cayley 定理知ψ(A )=O ,于是由式(3.6)得1110()(,)()(,)()()()n n f At q A t A r A t b t Ab t A b t Iψ--=+=+++可见,只要求出()(0,1,,1)k b t k n =- 即可得到f (At ).注意到()()0(0,1,,1;1,2,,)l i i l r i s ψλ==-=将式(3.6)两边对λ求导,并利用上式,得d d ()(,)d d iil ll l f t r t λλλλλλλλ=== 即d d ()(,)(0,1,,1;1,2,,)(3.7)d d iil l li l l t t f r t l r i s μλλλμλμλ====-=由式(3.7)即得到以0()b t ,1()b t ,…,1()n b t -为未知量的线性方程组. 综上分析,用待定系数法求矩阵函数f (At )或f (A )的步骤如下: 第一步:求矩阵A 的特征多项式(3.5);第二步:设1110()n n r b b b λλλ--=+++ .根据()()()()(0,1,,1;1,2,,)i l l l i i tr t f l r i s λλλλ===-=或()()()()(0,1,,1;1,2,,)l l i i i r f l r i s λλ==-=列方程组求解0b ,1b ,…,1n b -;第三步:计算1110()(())()n n f At f A r A b A b A b I --==+++ 或.例3.9 已知101120403A -⎛⎫ ⎪= ⎪ ⎪-⎝⎭,求e At,cos A .解 可求得2det()(1)(2)I A λλλ-=--.设2210()r b b b λλλ=++则由210212210(1)e (1)2e (2)42e tt t r b b b r b b t r b b b ⎧=++=⎪'=+=⎨⎪=++=⎩解得222120e e e 2e 2e 3e e 2e t t t t t t t t b t b t b t ⎧=--⎪=-++⎨⎪=-⎩于是2222210e 2e 0e e e e 2ee e e e 4e 02e e t tAt t t tt t t t t ttt t b A b A b I t t t t t ⎛⎫-⎪=++=-++-- ⎪ ⎪ ⎪-+⎝⎭而由21021210(1)cos1(1)2sin1(2)42cos 2r b b b r b b r b b b =++=⎧⎪'=+=-⎨⎪=++=⎩解得210sin1cos1cos 23sin12cos12cos 22sin1cos 2b b b =-+⎧⎪=-+-⎨⎪=+⎩从而22102sin1cos 20sin1cos 2sin1cos1cos 2cos 2sin1cos1cos 24sin102sin1cos1A b A b A b I +-⎛⎫ ⎪=++=-+--+ ⎪ ⎪-+⎝⎭如果求得矩阵A 的最小多项式,且其次数低于A 的特征多项式的次数,则计算矩阵函数就要容易一些.例3.10 已知311202113A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭,求e At ,sin A . 解 例1.9已求得A 的Jordan 标准形为2212J ⎛⎫⎪= ⎪ ⎪⎝⎭于是A 的最小多项式为2()(2)A m λλ=-.设10()r b b λλ=+由21021(2)2e (2)e t tr b b r b t ⎧=+=⎪⎨'==⎪⎩ 解得2120e (12)et t b t b t ⎧=⎪⎨=-⎪⎩ 于是2101e e 21221At t tt t b A b I t tt t t t +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭又由101(2)2sin 2(2)cos 2r b b r b =+=⎧⎨'==⎩ 解得10cos 2sin 22cos 2b b =⎧⎨=-⎩从而10sin 2cos 2cos 2cos 2sin 2cos 2sin 22cos 22cos 2cos 2cos 2sin 2cos 2A b A b I +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭三、常用矩阵函数的性质常用的矩阵函数有e A,sin A ,cos A ,它们有些性质与普通的指数函数和三角函数相同,但由于矩阵乘法不满足交换律,从而有些性质与一般指数函数和三角函数不相同. 定理3.9 对任意Cn n A ⨯∈,总有(1)sin(-A )=-sin A ,cos(-A )=cos A ; (2)i e cos isin AA A =+,i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =-. 证 (1)由sin A 与cos A 的矩阵幂级数形式直接得到;(2)i 221000i (1)(1)e i !(2)!(21)!cos isin k k k Ak k k k k k A A A k k k A A+∞+∞+∞+===--==++=+∑∑∑又有-i e cos()isin()cos isin A A A A A =-+-=- 从而i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =- 定理3.10 设A ,C n nB ⨯∈,且AB =BA ,则(1)ee e e e A BA B B A +==;(2)sin(A +B )=sin A cos B +cos A sin B ;(3)cos(A +B )=cos A cos B -sin A sin B .证 (1)0022011e e !!1()(2)2!1()e !A Bk k k k k A B k A B k k I A B A AB B A B k +∞+∞==+∞+=⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭=++++++=+=∑∑∑(2)i()-i()i i -i -i i -i i -i i -i i -i 11sin()(e e )(e e e e )2i 2i 1111(e e )(e e )(e e )(e e )2i 222i sin cos cos sin A B A B A B A B A A B B A A B B A B A B A B+++=-=-=-+++-=+ 同理可证(3). 证毕在定理3.10中,取A =B ,即得 推论 对任意Cn nA ⨯∈,有22cos 2cos sin A A A =-,sin2A =2sin A cos A 值得注意的是,当AB ≠BA 时,ee e A BA B +=或e e e A B B A +=不成立.如取0010A ⎛⎫= ⎪⎝⎭,0100B ⎛⎫= ⎪⎝⎭,则0110A B ⎛⎫+= ⎪⎝⎭,00100100AB BA ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭且10e 11A⎛⎫= ⎪⎝⎭,11e 01B ⎛⎫= ⎪⎝⎭,-1-1-1-1e+e e e 1e 2e e e+e A B+⎛⎫= ⎪⎝⎭-- 可见1121e e e e 1211A BB A ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭e e e A B A B +≠,e e e A B B A +≠定理3.11 设Cn nA ⨯∈,则有(1)tr dete eA A=;(2)1(e )e A A --=.证 (1)设A 的特征值为1λ,2λ,…,n λ.则由定理3.8知,e A的特征值为1e λ,2e λ,…,e n λ,从而1212tr dete =e e e e e n n A A λλλλλλ++==…+…(2)由于tr dete =e0AA≠,所以e A 总是可逆的.又由定理3.10,得e e e e A A A A OI--===故1(e )e A A --=. 证毕需要指出的是,对任何n 阶方阵A ,e A总是可逆的,但sin A 与cos A 却不一定可逆.如取π00π/2A ⎛⎫=⎪⎝⎭,则00sin 01A ⎛⎫= ⎪⎝⎭,10cos 00A -⎛⎫= ⎪⎝⎭.可见sin A 与cos A 都不可逆.§3.4 矩阵的微分和积分在研究微分方程组时,为了简化对问题的表述及求解过程,需要考虑以函数为元素的矩阵的微分和积分.在研究优化等问题时,则要碰到数量函数对向量变量或矩阵变量的导数,以及向量值或矩阵值函数对向量变量或矩阵变量的导数.本节简单地介绍这些内容. 一、函数矩阵的微分和积分定义 3.6 以变量t 的函数为元素的矩阵()(())i j m n A t a t ⨯=称为函数矩阵,其中()(1,2,,;1,2,,)ij a t i m j n == 都是变量t 的函数.若t ∈[a ,b ],则称A (t )是定义在[a ,b )上的;又若每个()ij a t 在[a ,b ]上连续、可微、可积,则称A (t )在[a ,b ]上是连续、可微、可积的.当A (t )可微时,规定其导数为()(())ijm n A t a t ⨯''=或d d ()()d d ij m nA t a t t t ⨯⎛⎫= ⎪⎝⎭而当A (t )在[a ,b ]上可积时,规定A (t )在[a ,b ]上的积分为()()d ()d bb ijaam nA t t a t t ⨯=⎰⎰例3.11 求函数矩阵23sin cos ()2e 01t t t t t A t t t ⎛⎫⎪= ⎪ ⎪⎝⎭的导数. 解2cos sin 1d ()2ln 2e 2d 003t t t t A t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭关于函数矩阵,有下面的求导法则.定理3.12 设A (t )与B (t )是适当阶的可微矩阵,则(1)d d d(()())()()d d d A t B t A t B t t t t+=+ (2)当λ(t )为可微函数时,有d d d (()())()()()()d d d t A t t A t t A t t t t λλλ⎛⎫=+ ⎪⎝⎭(3)d d d (()())()()()()d d d A t B t A t B t A t B t t t t ⎛⎫=+ ⎪⎝⎭; (4)当u =f (t )关于t 可微时,有d d()()()d d A u f t A u t u'= (5)当1()A t -是可微矩阵时,有111d d (())()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证 只证(2)和(5).设()(())ij m n A t a t ⨯=,()(())ij n p B t b t ⨯=,则111d d (()())(()())d d d d ()()()()d d d d ()()()()d d nik kj m n k n nik kj ik kj k k m nA tB t a t b t t t a t b t a t b t t t A t B t A t B t t t ⨯===⨯=⎛⎫⎛⎫=+ ⎪ ⎪⎝⎭⎝⎭⎛⎫=+ ⎪⎝⎭∑∑∑由于1()()A t A t I-=,两边对t 求导,得11d d ()()()()d d A t A t A t A t O t t --⎛⎫+= ⎪⎝⎭从而111d d ()()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证毕 定理3.13 设C n nA ⨯∈,则有(1)d e e e d AtAt At A A t ==; (2)dsin cos (cos )d At A At At A t ==;(3)dcos sin (sin )d At A At At A t=-=-.证 这里只证(1).(2)和(3)的证明与(1)类似.由0e !k Atkk t A k +∞==∑,并利用绝对收敛级数可以逐项求导,得101111d d e d d !(1)!e (1)!k k At k k k k k k Atk t t A A t t k k tA A A k -+∞+∞==-+∞-===-==-∑∑∑同样11111d e ==e d (1)!(1)!k k At k k At k k t t A A A A t k k --+∞+∞-==⎛⎫= ⎪--⎝⎭∑∑ 证毕根据定义和积分的有关性质,可得定理3.14 设A (t ),B (t )是区间[a ,b ]上适当阶的可积矩阵,A ,B 是适当阶的常数矩阵,λ∈C ,则 (1)(()())d ()d ()d bb baaaA tB t t A t t B t t +=+⎰⎰⎰;(2)()d ()d bba aA t t A t t λλ=⎰⎰;(3)()()d ()d bbaaA tB t A t t B =⎰⎰,()d ()d b baaAB t t A B t t =⎰⎰;(4)当A (t )在[a ,b ]上连续时,对任意t ∈(a ,b ),有()d ()d ()d t aA A t tττ=⎰(5)当A (t )在[a ,b]上连续可微时,有()d ()()baA t t A b A a '=-⎰以上介绍了函数矩阵的微积分概念及一些运算法则.由于d()d A t t仍是函数矩阵,如果它仍是可导矩阵,即可定义其二阶导数.不难给出函数矩阵的高阶导数11d d d ()()d d d k k k k A t A t t t t --⎛⎫= ⎪⎝⎭二、数量函数对矩阵变量的导数定义 3.7 设f (X )是以矩阵()ij m n X x ⨯=为自变量的mn 元函数,且(1,2,,;1,2,,)ijfi m j n x ∂==∂ 都存在,规定f 对矩阵变量X 的导数d d f X 为 1111d d ij m nm mn ff x x n f fX x ff x x ⨯∂∂⎛⎫ ⎪∂∂ ⎪⎛⎫∂ ⎪== ⎪ ⎪ ⎪∂⎝⎭∂∂ ⎪ ⎪∂∂ ⎪⎝⎭特别地,以T12(,,,)n x ξξξ= 为自变量的函数f (x )的导数T12d (,,,)d nf f f f x ξξξ∂∂∂=∂∂∂ 称为数量函数对向量变量的导数,即为在数学分析中学过的函数f 的梯度向量,记为grad f .例 3.12 设T 12(,,,)n a a a a = 是给定的向量,T 12(,,,)n x ξξξ= 是向量变量,且T T ()f x a x x a ==求d d f x. 解 因为1()nk kk f x a ξ==∑而(1,2,,)j jfa j n ξ∂==∂ 所以 TT 1212d (,,,)(,,,)d n nf f f f a a a a x ξξξ∂∂∂===∂∂∂ 例3.13 设()ij m n A a ⨯=是给定的矩阵,()ij n m X x ⨯=是矩阵变量,且()tr()f x Ax =求d d fX. 解 因为1()nikkj m m k AX ax ⨯==∑.所以11()tr()m nsk ks s k f X AX a x ====∑∑而(1,2,,;1,2,,)ijfi n j m x ∂==∂ 故T d ()d ji n m ij n mf f a A X x ⨯⨯⎛⎫∂=== ⎪ ⎪∂⎝⎭ 例 3.14 设()ij n n A a ⨯=是给定的矩阵,T 12(,,,)n x ξξξ= 是向量变量,且T ()f x x Ax =求d d f x. 解 因为T1111()()n nn ns sk ks sk k s k s k f x x Ax aa ξξξξ=======∑∑∑∑而1111,11,111()nj j j j jk k j jj j j j n nj k j n nsj s jk ks k fa a a a a a a a ξξξξξξξξξ--++===∂=+++++++∂=+∑∑∑所以1111111T T d d ()n ns s k k s k n nsn s nk k s k n f a a f x f a a A x Ax A A xξξξξξξ====∂⎛⎫⎛⎫+ ⎪ ⎪∂⎪ ⎪ ⎪== ⎪ ⎪ ⎪∂ ⎪ ⎪+ ⎪⎪∂⎝⎭⎝⎭=+=+∑∑∑∑ 特别地,当A 是对称矩阵时,有d 2d fAx x=例3.15 设()ij n n X x ⨯=是矩阵变量,且det X ≠0.证明1T ddet (det )()d X X X X-= 证 设ij x 的代数余子式为ij X .把det X 按等i 行展开,得1det nikik k X xX ==∑于是det ij ijX X x ∂=∂故 T1T 1Tddet det ()(adj )d ((det ))(det )()ij n n ij n nX X X X X x X X X X ⨯⨯--⎛⎫∂=== ⎪ ⎪∂⎝⎭== 三、矩阵值函数对矩阵变量的导数定义3.8 设矩阵()(())ij s t F X f X ⨯=的元素()(1,2,,;1,2,,)ij f X i s j t == 都是矩阵变量()ij m n X x ⨯=的函数,则称F (X )为矩阵值函数,规定F (X )对矩阵变量X 的导数d d FX为111d d 1FF x x n F X FF x x m mn ∂∂⎛⎫ ⎪∂∂ ⎪⎪= ⎪∂∂ ⎪ ⎪∂∂ ⎪⎝⎭ ,其中1111tij s stf f x x ij ij F x f f x x ij ij ∂∂⎛⎫ ⎪∂∂ ⎪∂⎪=⎪∂ ⎪∂∂ ⎪∂∂ ⎪⎝⎭即其结果为(ms )×(nt )矩阵. 作为特殊情形,这一定义包括了向量值函数对于向量变量的导数,向量值函数对于矩阵变量的导数,矩阵值函数对于向量变量的导数等.例3.16 设T12(,,,)n x ξξξ= 是向量变量,求T T d d d d x xx x=. 解 由定义,得T 1TT 2T 100010d d 001n nx x x I x x ξξξ⎛⎫∂ ⎪∂ ⎪⎛⎫ ⎪∂ ⎪⎪ ⎪===∂ ⎪ ⎪⎪ ⎪⎪⎝⎭ ⎪∂ ⎪∂⎝⎭同理可得T 12d ,,,d n n x x x x I x ξξξ⎛⎫∂∂∂== ⎪∂∂∂⎝⎭例3.17 设T1234(,,,)a a a a a =是给定向量,24()ij X x ⨯=是矩阵变量,求Td()d Xa X,d()d Xa X. 解 因为41121k k k n k k k x a Xa x a ==⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭∑∑,44T 1211()(,)k k k k k k Xa x a x a ===∑∑ 所以T T TT T 13141112T T T T 2122232431243124()()()()d()d ()()()()00000000Xa Xa Xa Xa x x x x Xa XXa Xa Xa Xa xx x x a aa a a a a a ⎛⎫∂∂∂∂⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪ ⎪∂∂∂∂⎝⎭⎛⎫= ⎪⎝⎭而131411122122232412341234()()()()d()()()()()d 00000000Xa Xa Xa Xa x x x x Xa Xa Xa Xa Xa Xxx x x a a a a a a a a ∂∂∂∂⎛⎫⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪∂∂∂∂⎝⎭⎛⎫⎪ ⎪=⎪⎪⎝⎭§3.5 矩阵分析应用举例本节介绍矩阵函数及矩阵微积分的一些应用. 一、求解一阶线性常系数微分方程组在数学或工程技术中,经常要研究一阶常系数微分方程组1111122112211222221122d ()()()()()d d ()()()()()d d ()()()()()d n n n n n n n nn n n x t a x t a x t a x t f t t x t a x t a x t a x t f t t x t a x t a x t a x t f t t ⎧=++++⎪⎪⎪=++++⎨⎪⎪=++++⎪⎩满足初始条件0()(1,2,,)i ix t c i n ==的解.如果记T12(),(,,,)ij n n n A a c c c c ⨯==T 12()((),(),,())n x t x t x t x t = ,T 12()((),(),,())n f t f t f t f t =则上述微分方程组可写为0d ()()()(3.8)d ()x t Ax t f t tx t c⎧=+⎪⎨⎪=⎩因为d d ()(e ())e ()()e d d d ()e ()e ()d At At At At At x t x t A x t t t x t Ax t f t t -----=-+⎛⎫=-= ⎪⎝⎭将上式两边在[0t ,t ]上积分,得00d (e ())d e ()d d tt A A t t x f τττττττ--=⎰⎰ 即00e()e()e ()d tAt A A t x t x t f ττττ----=⎰于是微分方程组的解为00()()e e e ()d tA t t At A t x t c f τττ--+⎰=例3.18 求解微分方程组初值问题113212313123d ()()()1d d ()()2()1d d ()4()3()2d (0)1,(0)0,(0)1x t x t x t t x t x t x t tx t x t x t t x x x ⎧=-++⎪⎪⎪=+-⎪⎨⎪=-++⎪⎪⎪===⎩ 解 记123()10111120,0,()(),()140312()x t A c x t x t f t x t -⎛⎫⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪====- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭则微分方程组可以写成式(3.8)的矩阵形式.例3.9已求得222e 2e 0e e e e 2e e e e e 4e 02e e t t tAt t t tt t t t t t t t t t t t t ⎛⎫-⎪=-++-- ⎪ ⎪-+⎝⎭依次计算下列各量e e e e e 2e t t At t t t t c t t ⎛⎫- ⎪= ⎪ ⎪-⎝⎭,00e 1e e ()d e 1e 2e 22e t t t A t tf d τττττττ-------⎛⎫⎛⎫- ⎪ ⎪=-=-+ ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎰⎰, 0e 1e e ()d e 12e 2t t At A t tf τττ-⎛⎫- ⎪=-+ ⎪ ⎪-⎝⎭⎰故微分方程组的解为123e e e 1(2)e 1()()()e e 1(1)e 1()e 2e 2e 2(32)e 2t t t tt t t t t t t t t x t x t x t t t x t t ⎛⎫⎛⎫⎛⎫----⎛⎫⎪ ⎪ ⎪ ⎪==+-+=-+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭⎝⎭二、求解矩阵方程在控制论与系统理论中,要遇到形如AX +XB =F 的矩阵方程求解问题,这个矩阵方程也称为Lyapunov 方程.关于这个矩阵方程的解有如下结果. 定理3.15 给定矩阵方程 AX +XB =F (3.9) 其中Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈.如果A 和B 的所有特征值具有负实部(这种矩阵称为稳定矩阵),则该矩阵方程有惟一解e e d At Bt X F t +∞=-⎰证 记()e e At Bt Y t F =.则有Y (0)=F ,且d ()e e e e ()()(3.10)d At Bt At Bt Y t A F F B AY t Y t B t=+=+设12,,,m λλλ 是A 的m 个特征值,12,,,n μμμ 是B 的n 个特征值.根据利用Jordan 标准形求矩阵函数的方法(见§3.3)知,e At的元素是形如e (0)j tr t r λ≥的项的线性组合.因为A 的所有特征值j λ的实部是负的,所以lim eAtt O →+∞=.同理lim e Bt t O →+∞=.于是lim ()lim e e At Bt t t Y t F O →+∞→+∞==又由于e e At BtF 的元素是形如()e (0)i j tr t r λμ+≥的项的线性组合,且积分()0ed i j tr t t λμ+∞+⎰都存在,故积分e e d At Bt F t +∞⎰存在.对式(3.10)两边从0到+∞积分,得()()0()(0)()d ()d Y Y AY t t Y t t B +∞+∞+∞-=+⎰⎰即()()0()d ()d A Y t t Y t t B F+∞+∞-+-=⎰⎰这说明0e e d At Bt X F t +∞=-⎰是矩阵方程(3.9)的解.惟一性的证明见第七章. 证毕 推论1 设Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈,则矩阵微分方程d ()()()d (0)X t AX t X t B tX F⎧=+⎪⎨⎪=⎩的解为()e e At BtX t F =推论2 设A ,C n nF ⨯∈,且A 的所有特征值具有负实部,则矩阵方程HA X XA F+=-的惟一解为H 0ee d (3.11)A tAt X F t+∞=⎰如果F 是Hermite 正定矩阵,则解矩阵X 也是Hermite 正定矩阵.证 只需证明后一结论.当F 是Hermite 正定矩阵时,由式(3.11)可知X 是Hermite 矩阵.又对0Cnx ≠∈,由于eAt总是可逆的,所以e 0Atx ≠,于是HH H e e (e )(e )0A t At At At x F x x F x =>.从而HH 0(e )(e )d 0At At x Xx x F x t +∞=>⎰故X 是Hermite 正定矩阵. 证毕三、最小二乘问题 设Cm nA ⨯∈,C n b ∈.当线性方程组Ax =b 无解时,则对任意C nx ∈都有Ax -b ≠0.此时希望找出这样的向量0C n x ∈,它使2Ax b -达到最小,即022Clim (3.12)nx Ax b Ax b ∈-=-称这个问题为最小二乘问题,称0x 为矛盾方程组Ax =b 的最小二乘解.以下结论给出了当A ,b 分别是实矩阵和实向量时,Ax =b 的最小二乘解所满足的代数方程.定理3.16 设R m nA ⨯∈,R mb ∈,0R n x ∈.若0R n x ∈是Ax =b 的最小二乘解,则0x 是方程组TT(3.13)A Ax A b=的解.称式(3.13)为Ax =b 的法方程组.证 由于2T 2TTTTTT()()()f x Ax b Ax b Ax b x A Ax x A b b Ax b b=-=--=--+若0x 为Ax =b 的最小二乘解,则它应是f (x )的极小值点,从而d 0(3.14)d x f x=根据例3.12和例3.14,得T T d 22d fA Ax A b x=- 由式(3.14)即知T T00A Ax A b -=,故0x 是式(3.13)的解. 证毕 对于含约束条件的最小二乘问题,有如下的结果. 例3.19 设Rm nA ⨯∈,R m b ∈,Rk nB ⨯∈,R kd ∈,且Bx =d 有解.试求约束极小。

《矩阵分析》课件


Gauss消元法原理
LU分解求解线性方程组
通过行变换将矩阵化为上三角矩阵, 从而解线性方程组。
将Ax=b转化为LUx=b,通过前向替 换和后向替换求解。
LU分解定义
将矩阵分解为一个下三角矩阵L和一个 上三角矩阵U的乘积。
QR分解原理及实现
QR分解定义
将矩阵分解为一个正交矩阵Q和 一个上三角矩阵R的乘积。
Jordan标准型及其性质
Jordan标准型定义: 设A是n阶方阵,如果 存在一个可逆矩阵P, 使得P^(-1)AP为 Jordan矩阵,则称A 可以相似对角化为 Jordan标准型。
Jordan标准型的性质
Jordan标准型是唯一 的,即对于给定的方 阵A,其Jordan标准 型是唯一的。
Jordan标准型中的每 个Jordan块对应A的 一个特征值。
非零行的首非零元所在列在上一行的 首非零元所在列的右边。
同一行的所有非零元均在首非零元的 右边。
线性无关组与基础解系
线性无关组:一组向量线性无关当且仅当它们不 能由其中的部分向量线性表示出来。换句话说, 只有当这组向量中任何一个向量都不能由其余向 量线性表示时,这组向量才是线性无关的。
基础解系中的解向量线性无关。
初等变换和行阶梯形式
初等变换:对矩阵进行以下三种变换称为初等变 换 对调两行(列)。
以数k≠0乘某一行(列)中的所有元。
初等变换和到另一行(列)的对应元上去。
02
行阶梯形式:一个矩阵经过初等行变换可以化为行阶梯形式,
其特点是
非零行在零行的上面。
03
初等变换和行阶梯形式
方阵
行数和列数相等的矩阵称为方阵。
01
对角矩阵
除主对角线外的元素全为零的方阵称 为对角矩阵。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2) β r +1 ,
, β n 线性无关. kr +1 β r +1 +
+ kn β n = 0
∴ (α 1 , α 2 ,
∵α1 , α 2 , ∴ β r +1 ,

, α n )( kr +1 xr +1 +
+ kn xn ) = O
, α n 线性无关,xr +1 , , β n 线性无关.
若 rank ( A) = r , 则 dim KerT = n − r ; dim Im T = r .
证明: dim Ker T = n − r ; 1. ∵ rank ( A) = r , ∴ AX = O 解空间维数为n-r. 设xr+1,…, xn 为解空间的一个基,即线性方程的一个 基础解系.令 β j = (α 1 , α 2 ,
, α n ) x j , j = r + 1,
,n
,n
即β j 在基 α 1 , α 2 ,
, α n 下的坐标为 x j .
1) β j ∈ Ker T , j = r + 1,
3
T ( β j ) = T (α 1 , α 2 , , α n ) x j = (α 1 , α 2 , , α n ) Ax j = O
4
, α n ) y0
= (α 1 , α 2 ,
, α n ) Ay0
, α n 线性无关, ∴ Ay0 = O 即 y0 为 AX =O的解,从而有
∵α1 , α 2 ,
y0 =
j = r +1
∑kx
j
n
j
∴ α = (α 1 , α 2 , = (α 1 , α 2 , =
n j = r +1 j 1
3) ∀α ∈ Ker T , k ∈ F ,
有 T ( kα ) = kT (α ) = kO = O .
问:像空间和核空间的维数分别为多少?
2
定理:设 α 1 , α 2 ,
T (α 1 , α 2 ,
, α n 是n 维线性空间V的一个基,
, αБайду номын сангаасn ) = (α 1 , α 2 ,
,α n ) A
i =1
r
i =1
6
设 k1T ( β 1 ) +
T ( k1 β 1 +
+ kr T ( β r ) = 0, 则有 + kr β r ) = 0,
+ kr β r ∈ Ker T , 从而可由 β r +1 , + k r β r = k r +1 β r + 1 + + k r β r − k r +1 β r +1 − + kn β n − kn β n = 0
为V 的一个基,即 ∀α ∈V 有 α =
n
∵ β r +1 ,
∑a β ,
i =1 i i
n
β = T (α ) = ∑ aiT ( β i ) = ∑ aiT ( β i ) ∈ Im T ,
即 Im (T ) 中任意向量可由T(βi)线性表示,i=1,2,…,r. 下面只需证T(βi)线性无关即可.
7
注: dim ImT = r 等于T 的秩, 1) dim KerT 称为T 的亏, 则n维线性空间的任一线性变换的亏与秩之和恰好为n.
2) 和空间 Im T + Ker T 一般不是直和.
例:设 D 是 R 上线性空间 P[x]4 的微分线性变换 求:1) Im D和 Ker D; 2) Im D + Ker D是否是直和? 解:方法一: P[x]4 的自然基为:1, x , x 2 , x 3 . D(1) = 0, D( x ) = 1, D( x 2 ) = 2 x , D( x 3 ) = 3 x 2
, xn 线性无关,
3) ∀α ∈ Ker T , α 可由 β r +1 ,
, β n 线性表示.
⎡ y1 ⎤ ⎢y ⎥ ⎢ 2 ⎥ = (α , α , α = (α 1 , α 2 , , α n ) 1 2 ⎢ ⎥ ⎢ ⎥ ⎢ yn ⎥ ⎣ ⎦ 则 O = T (α ) = T (α 1 , α 2 , , α n ) y0
, α n ) y0
,α n )
2
∑ k (α , α
j = r +1
∑kx
j
n
j
,
,α n ) x j =
j = r +1
∑kβ
j
n
j
.
由 1), 2), 3) 可知 β r +1 ,
5
, β n 为KerT 的一个基,
即 dim Ker T = n − r .
2) dim ImT = r
, β n 为 KerT ⊂ V 的一个基,由基的扩充 β 定理,必存在V中向量 β 1 , , β r 使 β 1 , , β r, r +1 , , β n
3) ∀α ∈ Im T , k ∈ F , ∃α ′ ∈V , 使 T (α ′ ) = α kα = kT (α ′ ) = T ( kα ′ ) ∈ Im T .
2. KerT 为V 的子空间:
1) T ( O ) = O , ∴ O∈KerT, KerT为V的非空子集.
2) ∀α , β ∈ Ker T , 有 T ( α + β ) = T (α ) + T ( β ) = O + O = O ∴ α + β ∈ Ker T .
= (1, x , x 2 , x 3 ) Aei 2 3 = D(1, x , x , x )ei ∈ Im D, 下证 βi 线性无关. 设 k 2 β 2 + k 3 β 3 + k4 β 4 = 0
∵ 1, x , x 2 , x 3 为基 又 ∵ α 2 ,α 3 ,α 4 线性无关
A = (α1 , α 2 , α 3 , α 4 ), rank ( A) = 3
∴ k1 β 1 + k1 β 1 + k1 β 1 +
, βn
线性表示.
∵ β1 ,
, β n 为V 的基
∴ ki = 0, i = 1, 2,
n, 即T ( β i ) , i = 1, 2,
, r 线性无关.
推论:设T 是有限维线性空间V 的线性变换,则
dim Ker T + dim Im T = dim V
定义: 设T 是线性空间V 的线性变换,分别定义T 的核 KerT 与T 的像ImT
Ker T = {α ∈V T (α ) = 0} , Im T = {β ∈V ∃α ∈V 使T (α ) = β } .
性质: KerT 和ImT 均是V 的子空间,从而分别称为 T的核空间和像空间. 证明:1. ImT 为V 的子空间;
i = 2, 3, 4
(1, x , x 2 , x 3 ) ( k2α 2 + k3α 3 + k4α 4 ) = 0
∴ k2α 2 + k3α 3 + k4α 4 = 0 ∴ k 2 = k 3 = k4 = 0
∴ β 2 ,β 3 , β 4 线性无关 ∴ Im D = β 2 ,β 3 , β 4 ∵ Im D ⊆ P[ x ]3 , 且 dim Im D = 3 = dim P[ x ]3 , ∴ Im D = P[ x ] . 3
9
方法二: Im D ⊆ P[ x ]3 ,
又∀f ( x ) = b0 + b1 x + b2 x 2 ∈ P[ x ]3 ,
b1 2 b2 3 ⎞ ⎛ = D ⎜ b0 x + x + x ⎟ ∈ Im D , 2 3 ⎝ ⎠
10
∴ Im D = P[ x ]3 . 下面求 Ker D . 设 C ∈ R且C ≠ 0, D ( C ) = 0 ∴ C ∈ Ker D , 但 dim Ker D = 1 ∴ Ker D = C = R 2) 设 C ∈ R且C ≠ 0, C ∈ Ker D , 又C ∈ P[ x ]3 = Im D ∴不是直和. ∴ Im D ∩ Ker D ≠ {O} ,
D ( f ) = f ′( x)
8
⎡0 ⎢0 D(1, x , x 2 , x 3 ) = 1, x , x 2 , x 3 ⎢ ⎢0 ⎢ ⎣0
(
)
1 0 0 0
0 2 0 0
0⎤ ⎥ 0⎥ 3⎥ ⎥ 0⎦
dim Ker D = 1, dim Im D = 3. 由定理可知: β i = (1, x , x 2 , x 3 )α i , i = 2, 3, 4
1
α + β = T (α ′ ) + T ( β ′ ) = T (α ′ + β ′ ) ∈ Im T .
1) T ( O ) = O ∈ Im T ∴ Im T 是非空子集. 2) ∀α , β ∈ Im T , ∃α ′, β ′ ∈V 使 T (α ′ ) = α,T ( β ′ ) = β .
相关文档
最新文档