矩阵可对角化的总结分解

合集下载

第二十讲 矩阵的对角化

第二十讲 矩阵的对角化

20.1 矩阵可对角化的条件设矩阵有个线性无关的特征向量令则是一个对角矩阵其对角元素是的特征值:20.1 矩阵可对角化的条件事实上,于是因可逆,故20.1 矩阵可对角化的条件若存在可逆矩阵使为对角矩阵,则称矩阵是可对角化的(diagonalized).由上面的分析知,反之也成立. 故有定理:矩阵可对角化的充要条件是有个线性无关的特征向量.20.1 矩阵可对角化的条件例:的特征值为故只有个线性无关的特征向量,因此不能对角化.20.1 矩阵可对角化的条件定理:设是的互异特征值,是相应特征向量. 则线性无关.证明:设两边左乘得再左乘得不断左乘直到得故有20.1 矩阵可对角化的条件左边第二个矩阵的行列式行列式因此该矩阵可逆,故由于特征向量均为非零向量,故所以线性无关.20.1 矩阵可对角化的条件推论:具有个两两互异特征值的矩阵可以对角化.但若矩阵有相同特征值,其也可能对角化.例:有重特征值任何可逆矩阵都使是对角阵. 这反映了所有非零向量都是单位矩阵的特征向量.20.2 特征值的代数重数和几何重数定义:设其中称为特征值的代数重数(algebraicmultiplicity),记作称为特征值的几何重数(geometric multiplicity),记作例:20.2 特征值的代数重数和几何重数例:例:20.2 特征值的代数重数和几何重数一般地,命题:引理1:相似矩阵具有相同的特征多项式.事实上,设可逆,则我们有20.2 特征值的代数重数和几何重数引理2:任意复方阵相似于上三角阵,且其对角元为矩阵的特征值. 证明:对方阵的阶数用数学归纳法.时结论成立. 假设对阶复方阵结论成立.对任意阶复方阵设其有特征值及相应特征向量则可将其扩充得的一组基有记则有20.2 特征值的代数重数和几何重数对阶复方阵由归纳假设, 存在可逆阵使得为上三角阵.令为上三角阵.则结论第一部分得证.由引理1知上三角阵的对角元为的特征值.20.2 特征值的代数重数和几何重数命题的证明:由引理2,相似于上三角阵则和有相同特征值,且对任意特征值因此,不妨设是上三角阵,即于是故20.2 特征值的代数重数和几何重数定理:复方阵可对角化对任意特征值事实上,若则故有个线性无关的特征向量.从而可对角化.20.2 特征值的代数重数和几何重数例:判断是否可对角化,若可以求使为对角阵.解:于是又因此,可对角化.20.2 特征值的代数重数和几何重数对的基础解系为对的基础解系为20.2 特征值的代数重数和几何重数令则20.2 特征值的代数重数和几何重数注:可以看到,使对角化的矩阵不是唯一的. 一个特征向量乘以非零常数后仍是属于同一特征值的特征向量,所以若用任意非零常数乘以的各列,则得一个新的使对角化的矩阵. 而对于重特征值则有更大自由度. 上例中由的任意线性组合得到的两个线性无关的向量都可充当的前两列.20.2 特征值的代数重数和几何重数例:设其中为矩阵.的秩为的秩为故可对角化.20.3 矩阵可对角化的应用若矩阵可对角化,则可快速计算例:设求解:的特征值可对角化.20.3 矩阵可对角化的应用对的基础解系为对的基础解系为20.3 矩阵可对角化的应用令 则故20.3 矩阵可对角化的应用例(Markov过程):每年海淀区以外人口的迁入海淀区,而海淀区人口的迁出. 这给出一个差分方程:设最初外部人口为内部人口为则一年以后外部人口内部人口即20.3 矩阵可对角化的应用这个虚构的人口迁移过程有两个特点:(1)人口总数保持不变;(2)海淀区外部和内部的人口数不是负的. 我们称之为Markov(马尔科夫)过程.由性质(1),矩阵每一列元素之和为由性质(2),矩阵元素非负. 同样等也非负.20.3 矩阵可对角化的应用记取则20.3 矩阵可对角化的应用于是我们可求和年之后的人口分布:20.3 矩阵可对角化的应用可以看出,经过很多年之后,会变得非常小,从而这个解达到一个极限状态:此时,总人口仍为与初始状态相同. 但在此极限状态下,总人口的在外部,在内部, 并且这个数据无论初始分布怎样总成立.20.3 矩阵可对角化的应用注意到即这个稳定状态是Markov矩阵关于的特征向量.20.3 矩阵可对角化的应用例(Fibonacci数列):数列满足规律这是一个差分方程.怎样由出发,求出Fibonacci数列的通项公式呢?20.3 矩阵可对角化的应用令则即于是只需求20.3 矩阵可对角化的应用故20.3 矩阵可对角化的应用初始值给出于是Fibonacci数是这个乘积的第二个分量20.3 矩阵可对角化的应用我们希望研究由差分方程描述的离散动力系统的长期行为,即时解的性质.设可对角化,即存在可逆矩阵其中使为对角阵.则其中即可以看出,的增长由因子支配. 因此系统的稳定性依赖于的特征值.20.3 矩阵可对角化的应用对由一个差分方程定义的离散动力系统,当的所有特征值时,它是稳定的(stable),且;当所有时,它是中性稳定的(neutrally stable),且有界;而当至少有一个特征值时,它是不稳定的(unstable),且是无界的.Markov过程是中性稳定的,Fibonacci数列是不稳定的.20.3 矩阵可对角化的应用例:考虑差分方程其中的特征值为其对角元和故该系统是稳定的.由任何一个初始向量出发,的解必定最终趋向于如:20.3 矩阵可对角化的应用可以看到从开始,而的实际作用是,若把分解成的两个特征向量的和:则把属于的特征向量化为零,而把属于的特征向量乘以20.4 同时对角化问题:给定两个阶矩阵是否存在可逆矩阵使得同时为对角阵,也即同时对角化?命题:若有相同特征向量矩阵使得为对角阵,则事实上,20.4 同时对角化重要的是,“逆”命题也成立. 我们不加证明地给出:定理:若均可对角化,且则可同时对角化.注意到,若则故和是的属于同一特征值的特征向量. 看简单的情况.假设的特征值两两互异,则其所有特征子空间都是一维的. 于是必是的倍数,也即是的特征向量. 从而有公共特征向量矩阵,可同时对角化.20.4 同时对角化定理:对阶复矩阵若矩阵的特征值两两互异,则可同时对角化.20.4 同时对角化小结:1. 矩阵可对角化,指存在可逆矩阵使为对角阵.2. 矩阵可对角化有个线性无关的特征向量.3. 若复矩阵有个互异特征值,则可对角化.4. 复矩阵可对角化任意特征值的几何重数等于代数重数.5. 设可对角化, 即存在可逆阵使则6. 差分方程的解为其中。

矩阵特征分解与对角化

矩阵特征分解与对角化

矩阵是线性代数中的重要概念,广泛应用于科学、工程和其他领域。

矩阵的特征分解和对角化是矩阵理论中的关键概念,它们在各个领域的应用非常广泛。

矩阵的特征分解是指将一个矩阵分解为特征值和特征向量的乘积的形式。

具体而言,对于一个n×n的矩阵A,特征分解可以写为A=PDP^(-1),其中P是一个由特征向量组成的矩阵,D是一个对角矩阵,对角线上的元素是A的特征值。

特征分解的好处在于可以将一个复杂的矩阵转化为一个对角矩阵,从而简化了矩阵的计算和分析。

特征分解在物理学、工程学、计算机科学和金融学等领域中都有广泛的应用。

例如,在物理学中,特征分解可以用于描述量子力学中的粒子状态和能级。

在工程学中,特征分解可以用于矩阵的频域分析和系统动力学分析。

在计算机科学中,特征分解可以用于图像处理和模式识别。

在金融学中,特征分解可以用于资产组合的风险评估和收益预测。

特征分解的一个重要应用是矩阵对角化。

一个矩阵被称为可对角化的,如果它可以通过相似变换(diagonalizing transformation)转化为对角矩阵。

相似变换是指将一个矩阵A变换为B的过程,其中B= P^(-1)AP,P是一个可逆矩阵。

对角化的好处在于可以简化矩阵的计算和分析。

例如,对角化可以使得矩阵的幂运算变得简单,因为A^n=PD^nP^(-1)。

对角化的一个重要应用是谱分解。

谱分解是对角化的一个特殊情况,它可以将对称矩阵分解为特征向量的线性组合。

对称矩阵的谱分解可以写为A=QΛQ^T,其中Q是一个由特征向量组成的正交矩阵,Λ是一个对角矩阵,对角线上的元素是A的特征值。

谱分解在物理学、信号处理、图像处理和统计学等领域中有广泛的应用。

例如,在物理学中,谱分解可以用于描述对称量子力学系统的能级和波函数。

在信号处理中,谱分解可以用于频谱分析和滤波。

在图像处理中,谱分解可以用于图像压缩和特征提取。

在统计学中,谱分解可以用于主成分分析和数据降维。

总之,矩阵的特征分解和对角化是矩阵理论中的重要概念,它们在各个领域的科学和工程应用中都起到了关键的作用。

矩阵的对角化方法

矩阵的对角化方法

矩阵的对角化方法矩阵的对角化是一种重要的矩阵变换方法,在线性代数中具有广泛的应用。

对于一个可对角化的矩阵,可以将其通过相似变换转化为对角矩阵,这样可以简化矩阵的计算和分析过程。

在本文中,我将介绍矩阵的对角化方法,并详细解释其原理和应用。

首先,我们需要明确一下矩阵的对角化定义。

一个n×n的矩阵A称为可对角化的,如果存在一个可逆矩阵P,使得P-1AP为对角矩阵。

其中,对角矩阵是指非对角线上的元素全部为0的方阵。

对角化的主要目的是将原矩阵化简为对角形式,以方便计算和理解。

对于一个可对角化的矩阵A,其对应的对角矩阵D的对角线元素是A的特征值,而P的列向量组成的矩阵则是对应于特征值的特征向量。

因此,对角化的关键在于求解矩阵A的特征值和特征向量。

求解矩阵A的特征值和特征向量的方法有多种,下面将介绍两种常见的方法:特征值分解和相似对角化。

一、特征值分解方法特征值分解方法是求解矩阵特征值和特征向量的最常用方法之一。

对于一个n×n的矩阵A,其特征值和特征向量的计算步骤如下:1. 求解特征多项式。

将A的特征多项式定义为det(A-λI)=0,其中I为n阶单位矩阵,λ为特征值。

解特征多项式可以得到n个特征值λ1,λ2,...,λn。

2. 求解特征向量。

对于每一个特征值λi,将其代入方程组(A-λiI)X=0,并求解出特征向量X。

3. 归一化特征向量。

将每个特征向量进行归一化处理,使其模长等于1。

4. 构造P和D矩阵。

将特征向量按列组成P矩阵,特征值按对角线组成D矩阵,得到P和D满足P-1AP=D。

特征值分解方法的优点是求解过程直观简单,容易理解,适用于一般情况。

但是,对于大规模矩阵,求解特征多项式和连续的特征值比较困难,计算量较大。

二、相似对角化方法相似对角化方法是通过相似变换将矩阵A转化为对角矩阵的方法。

它的基本思路是寻找一个可逆矩阵P,使得P-1AP=D。

P矩阵的列向量正好是A的特征向量。

相似对角化的步骤如下:1. 求解矩阵A的特征值和特征向量。

矩阵对角化

矩阵对角化

引言在高等代数中,我们为了方便线性方程组的运算引入了矩阵的概念. 在线性方程组的讨论中我们看到,线性方程组的系数矩阵和增广矩阵反应出线性方程组的一些重要性质,并且解方程组的过程也表现为变换这些矩阵的过程.除线性方程组之外,在二次型中我们用矩阵研究二次型的性质,引入了矩阵合同、正定、负定、半正定、半负定等概念及其判别方法.在线性空间中用矩阵研究线性变换的性质,引入矩阵相似的概念,这是一种等价关系,利用它我们把矩阵分类,其中与对角矩阵相似的矩阵引起的我们的注意,由此我们对线性变换归类,利用简单的矩阵研究复杂的,方便我们看待问题,进而又引入对角型矩阵、λ矩阵及若尔当标准型.基本概念定义定义1 常以n m P ⨯表示数域P 上n m ⨯矩阵的全体,用E 表示单位矩阵.定义2 n 阶方阵A 与B 是相似的,如果我们可以找到一个n 阶非奇异的方阵矩阵T n n P ⨯∈,使得AT T B 1−=或者BT T A 1−=.根据定义我们容易知道相似为矩阵间的一个等价关系:①反身性:AE E A 1−=; ②对称性:若A 相似于B ,则B 相似于A ; ③传递性:如果A 相似于B ,B 相似于C ,那么A 相似于C . 定义3 n 阶方阵A 与B 是合同的,如果我们可以找到一个n 阶非奇异方阵T n n P ⨯∈,使得B =T T AT 或者BT T A T =.根据定义我们容易知道合同也为矩阵间的一个等价联系:①反身性:A =AE E T ;②对称性:由AT T B T =即有11)(−−=BT T A T ;③传递性:由111AT T A T=和2122T A T A T =有)()(21212T T A T T A T =.定义4 式为⎪⎪⎪⎪⎪⎭⎫⎝⎛⋯⋯⋯m b b b 000000021的m 阶方阵叫对角矩阵,这里i b 是数(),2,1m i ⋯⋯=. 定义5 方阵A n n P ⨯∈,若BT T A 1−=,T 非奇异,B 是对角阵,则称A 可相似对角化. 定义6 方阵A n n P ⨯∈,若BT T A T =,T 非奇异,B 是对角阵,则称A 可合同对角化.定义7 矩阵的初等变换:⑴互换矩阵的第i 行(列)于j 行(列); ⑵用非零数c P ∈乘以矩阵第i 行(列);⑶把矩阵第j 行的t 倍加到第i 行.定义 8 由单位矩阵经过一次初等行(列)变换所得的矩阵称为初等矩阵. 共有三种初等矩阵:①单位矩阵经过初等变换⑴得),(j i P 且),(),(1j i P j i P =−;②单位矩阵经过初等变换⑵得))((t i P 且)/1(())((1t i P t i P =−;③单位矩阵经过初等变换⑶得))(,(t j i P 且))(,())(,(1t j i P t j i P −=− 定义9 设方阵n n P B ⨯∈,若E B =2,就称B 为对合矩阵。

矩阵对角化问题总结

矩阵对角化问题总结

矩阵对角化问题总结矩阵对角化是线性代数中的一个重要概念,它在很多数学和工程领域中都有广泛应用。

对角化可以把一个矩阵转化为对角矩阵的形式,简化了计算和分析的过程。

本文将对矩阵对角化的定义、条件以及计算方法进行总结。

首先,矩阵对角化的定义如下:对于一个n × n的矩阵A,如果存在一个可逆矩阵P,使得我们可以得到对角矩阵D,则称矩阵A是可对角化的。

其中,对角矩阵D的非零元素是A的特征值,且按照相应的特征值的重数排列。

为了判断一个矩阵是否可对角化,我们需要满足以下条件:1. 矩阵A必须是一个方阵(即行数等于列数)。

2. 矩阵A必须具有n个线性无关的特征向量,对应于n个不同的特征值。

当满足上述条件时,我们可以通过以下步骤进行矩阵对角化:1. 求出矩阵A的特征值,即解A的特征方程det(A-λI) = 0,其中I是单位矩阵。

2. 对每个特征值λ,解方程组(A-λI)X = 0,求得对应的特征向量X。

3. 将特征向量按列组成矩阵P。

4. 求出特征值构成的对角矩阵D。

需要注意的是,在实际求解矩阵对角化问题时,可能会遇到以下情况:1. 矩阵A的特征值重数大于1。

在这种情况下,我们需要确保对应于相同特征值的特征向量线性无关。

2. 矩阵A不可对角化。

这意味着矩阵A无法被相似变换为对角矩阵。

这可能发生在矩阵A的特征向量不足以构成一组基的情况下。

矩阵对角化在很多应用中具有重要意义,它简化了矩阵的计算和分析过程。

对角矩阵具有很好的性质,例如幂运算和指数函数的计算变得更加简单。

此外,在线性系统的稳定性和动态响应的分析中,矩阵对角化也起到了关键的作用。

总之,矩阵对角化是一个重要而又广泛应用的概念。

本文对矩阵对角化的定义、条件以及计算方法进行了总结,并提到了在实际问题中可能会遇到的情况。

了解矩阵对角化的概念和方法,对于深入理解和应用线性代数具有重要意义。

特征值特征向量与矩阵可对角化详解

特征值特征向量与矩阵可对角化详解

特征值特征向量与矩阵可对角化详解特征值特征向量与矩阵可对角化是线性代数中一个重要的概念,它在矩阵的理论研究和应用中有着广泛的应用。

本文将详细介绍特征值特征向量的定义、性质以及矩阵可对角化的条件和方法。

让我们一起来探索这一有趣而重要的概念。

首先,我们来介绍特征值和特征向量的定义。

设A是一个n阶矩阵,如果存在一个非零向量x,使得Ax=kx,其中k是一个常数,则k称为矩阵A的特征值,x称为矩阵A对应于特征值k的特征向量。

特征值和特征向量的定义看起来可能抽象,我们可以通过一个具体的例子来理解这个概念。

考虑一个2阶矩阵A=[[3,-2],[4,-1]],我们要找到它的特征值和特征向量。

首先,我们解方程A-λI=0,其中λ是特征值,I是单位矩阵。

这将得到一个关于λ的方程,我们解它可以找到特征值λ1=1和λ2=-1、然后,我们带入A-λI=0,解得对应于λ1的特征向量x1=[1,2]和对应于λ2的特征向量x2=[1,-1]。

所以,矩阵A的特征值是λ1=1和λ2=-1,对应的特征向量是x1=[1,2]和x2=[1,-1]。

接下来,我们来介绍特征值特征向量的性质。

首先,特征值与矩阵的大小是相关的,一个n阶矩阵最多有n个不同的特征值。

此外,矩阵的特征值和对应的特征向量是成对出现的,一个特征值可以对应多个特征向量。

矩阵可对角化的条件是,矩阵A的n个特征向量x1,x2,...,xn都线性无关。

这又可以等价于矩阵A的n个特征向量x1,x2,...,xn都是线性独立的,即不存在一个非零向量x可以表示为这些特征向量的线性组合。

我们还可以通过矩阵的代数重数和几何重数来进一步讨论特征值的性质。

矩阵的代数重数是一个特征值λ在特征多项式中的重数,而几何重数是对应于特征值λ的特征向量的个数。

根据定理,矩阵的代数重数与几何重数之和等于矩阵的阶数。

当矩阵的代数重数等于几何重数时,我们称矩阵的特征值是简单的;当矩阵的代数重数大于几何重数时,我们称矩阵的特征值是重复的。

矩阵对角化的方法

矩阵对角化的方法

矩阵对角化的方法
矩阵对角化是将一个方阵通过相似变换,转化为对角矩阵的过程。

常用的矩阵对角化方法有以下几种:
1. 特征值分解:对于一个可对角化的矩阵,可以通过求解其特征值和特征向量来进行对角化。

首先求解矩阵的特征值,然后求解每个特征值对应的特征向量,并将这些特征向量排列成一个矩阵,将原矩阵相似变换到对角矩阵。

2. 正交对角化:对于实对称矩阵,可以通过正交对角化的方法进行对角化。

首先通过特征值分解求解出特征值和对应的特征向量,然后将特征向量单位化得到正交矩阵,再进行相似变换得到对角矩阵。

3. Jordan标准形:对于不可对角化的矩阵,可以通过Jordan标准形对其进行对角化。

首先求解矩阵的特征值和对应的特征向量,然后通过Jordan标准形的分块结构将矩阵进行相似变换得到对角矩阵。

需要注意的是,并不是所有矩阵都可以对角化。

只有满足一定条件的矩阵才可以进行对角化。

矩阵对角化公式

矩阵对角化公式

矩阵对角化公式矩阵对角化是线性代数中的重要概念,它提供了一种将一个矩阵表示为对角矩阵的方法,使得矩阵的运算更加简化。

在本文中,我们将介绍矩阵对角化的基本概念、判定条件以及计算方法。

1. 矩阵对角化的基本概念一个n×n矩阵A可对角化,意味着存在一个可逆矩阵P和一个对角矩阵D,使得A=PDP^{-1}。

其中,D是由A的特征值组成的对角矩阵。

2. 判定矩阵可对角化的条件一个n×n矩阵A可对角化的条件是:- 矩阵A有n个线性无关的特征向量;- 矩阵A的每个特征值都有对应的正交归一化特征向量。

3. 计算矩阵的特征值和特征向量要计算一个矩阵A的特征值和特征向量,可以遵循以下步骤:- 计算矩阵A的特征多项式det(A-λI),其中λ是一个未知数,I是单位矩阵;- 解特征多项式的根,即特征值λ;- 将特征值代入方程A-λI的解空间中,求解特征向量。

4. 矩阵对角化的计算过程对于可对角化的矩阵A,可以按以下步骤进行对角化:- 对矩阵A进行特征值分解,得到特征矩阵V和对角矩阵D;- 计算可逆矩阵P,使得A=V^{-1}DVP;- 可以通过相似变换将矩阵A对角化,P表示变换矩阵。

5. 对角化与矩阵的性质对角矩阵的特点是非常简单的,可以很容易地计算幂、指数和逆矩阵等运算。

因此,对角化使得矩阵的运算更加简化。

6. 矩阵对角化的应用矩阵对角化在许多领域都有广泛应用,包括物理、工程和数据分析等。

例如,在量子力学中,矩阵对角化可以把含有多个粒子态的哈密顿矩阵表示成一组分立的单粒子能级。

总结:矩阵对角化是线性代数中一个重要的概念,它提供了将一个矩阵表示为对角矩阵的方法。

这篇文章介绍了矩阵对角化的基本概念、判定条件及计算方法,还讨论了对角化的计算过程、矩阵的性质以及应用领域。

对角化简化了矩阵的运算,并且在许多领域有广泛的应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

矩阵可对角化的总结莆田学院数学系02级1班连涵生21041111 [摘要]:主要讨论n级方阵可对角化问题:(1)通过特征值,特征向量和若尔当标准形讨论方阵可对角化的条件;(2)实n 级对称矩阵的可对角化讨论;(3)几个常见n 级方阵的可对角化讨论。

[关键词]:n级方阵;可对角化;相似;特征值;特征向量;若尔当标准形;n级实对称矩阵说明:如果没有具体指出是在哪一个数域上的n级方阵,都认为是复数域上的。

当然如果它的特征多项式在某一数域K上不能表成一次多项式的乘积的话,那么在此数域上它一定不能相似对角阵。

只要适当扩大原本数域使得满足以上条件就可以。

复数域上一定满足,因此这样假设,就不用再去讨论数域。

引言所谓矩阵可对角化指的是矩阵与对角阵相似,而说线性变换是可对角化的指的是这个线性变换在某一组基下是对角阵(或者说线性变换在一组基下的矩阵是可对角化的),同样可以把问题归到矩阵是否可对角化。

本文主要是讨论矩阵可对角化。

定义1:设A,B是两个n级方阵,如果存在可逆矩阵P,使P-1AP=B,则称B与A相似,记作A~B。

矩阵P称为由A到B的相似变换矩阵。

[]1[]2[]3[]4定义2:设A 是一个n 级方阵,如果有数λ和非零向量X ,使AX=λX 则称λ是矩阵A 的特征值,X 称为A 的对应于λ的特征向量,称{|}V A λααλα==为矩阵对应于特征值λ的特征子空间。

[]1[]2[]3[]4定义3:设A 是数域P 上一个n 级方阵,若多项式()[]f x P X ∈,使()0f A =则称()f x 为矩阵A 的零化多项式。

[]2定义4:数域P 上次数最低的首项为1的以A 为根的多项式称为A 的最小多项式。

[]1[]2[]3一、首先从特征值,特征向量入手讨论n 级方阵可对角化的相关条件。

定理1:一个n 级方阵A 可对角化的充要条件它有n 个线性无关的特征向量。

[]1[]2[]3[]4证明:必要性:由已知,存在可逆矩阵P ,使121n P AP λλλ-⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦即12n AP P λλλ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦把矩阵P 按列分块,记每一列矩阵为 12,,,n P P P 即12[,,,]n P P P P = 于是有12[,,,]n A P P P ==1212[,,,]n n P P P λλλ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦, 即 121122[,,,][,,,]n n n AP AP AP P P P λλλ=于是有 ,1,2,,i i i AP P i n λ==。

由特征值,特征向量定义,表明P 的每一列都是A 的特征向量,因为P 是可逆的,因此12,,,n P P P 是A 的n 个线性无关特征向量,其中12,,,n λλλ为A 的特征值。

充分性:若A 有n 个线性无关的特征向量12,,,n P P P 则有,1,2,,i i i AP P i n λ==,其中i λ是对应于特征向量i P 的A 的特征值。

以12,,,n P P P 为列作矩阵12[,,,]n P P P P =,因为12,,,n P P P 线性无关,所以矩阵P 是可逆的。

由 12[,,,]n AP A P P P ==121122[,,,][,,,]n n n AP AP AP P P P λλλ==1212[,,,]n n P P P λλλ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦=12n P λλλ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦则有 121n P AP λλλ-⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦即A 与对角矩阵相似从以上证明中可知:(1) 与矩阵A 相似的对角矩阵主对角线上的元素是A的特征值,而相似变换矩阵P 的列是A 的n 个线性无关特征向量。

(2)12,,,n λλλ在主对角线上的次序应与其对应的特征向量在P 中的次序相对应,如果12,,,nλλλ的次序改变,那么12,,,n P P P 在P 中的次序也要作相应的改变。

但这时P 就不是原来的P 了。

因此相似变换矩阵不是唯一的。

若不计k λ的排列顺序,则对角矩阵是唯一的,称它为A 的相似标准形。

由相似是一种等价关系知:与A 相似的矩阵都有相同的相似标准形。

定理2:矩阵A 的属于不同特征值的特征向量是线性无关的。

[]1[]2[]3[]4由此给出了一个推论:n 级方阵可对角化的充分条件A 有n 个互不相同的特征值。

[]1[]2[]3[]4证明:由定理1及定理2可得。

但这个推论的逆不成立。

例如:n 级单位阵E ,显然它是可对角化的,但它的特征值为1(n 重根)。

那我们要问若有重根时,要满足什么条件才可对角化? 定理3:n 阶矩阵A 可对角化的充要条件是:A 的每个特征值对应的特征向量线性无关的最大个数等于特征值的重数(即A 的每个特征子空间i V λ的维数等于特征值i λ的重数)[]4这个定理又可以这样叙述:矩阵A 的每个特征值的代数重数等于对应子空间的(几何)重数。

[]2[]3引理1:如果1,,k λλ是矩阵A 的不同特征值,而12,,,i i i ir ααα是属于i λ的线性无关的特征向量,12,,,i k = 那么向量组111121,,,,,kr kr αααα也线性无关。

[]1[]2[]3即:给出一个n 级矩阵,求出属于每个特征值的线性无关向量,把它们合在一起也是线性无关的。

引理2:设0λ是n 阶矩阵A 的一个k 重特征值,对应于0λ的特征向量线性无关的最大个数为l ,则k l ≥。

[]4证明:反证法。

设 l k < ,由已知 0012,,,,,i i i A i l αλαα=≠=。

(1) 12,,,l ααα 线性无关。

将 12,,,l ααα 扩充为n 维向量空间 V 的一组基:121,,,,,,l l n ααααα+ 其中 1,,l n αα+一般不 是A 的特征向量,但1,,,m A V m l n α∈=+ ,可用上述的一 组基线性表示,即 1111'''',,,,m m l m l l m l n m n A a a a a ααααα++=+++++ 其中1(,,)m l n =+ (2)用矩阵可表示为:()121,,,,,,l l n A ααααα+()011100112111110'',,'',,'',,'',,,,,,,,l n l l l n l l n l l l n n l n n a a a a a a a a λλλααααα+++++++⎛⎫⎪ ⎪ ⎪ ⎪ ⎪=⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭(3)记 ()121,,,,,,l l n P ααααα+= 则P 是可逆的。

因此上式可表为 01011220l l E A E A AP P P AP A A λλ-⎛⎫⎛⎫=⇒=⎪ ⎪⎝⎭⎝⎭根据相似矩阵有相同的特征多项式,得111()n n n n E A P E A P P E A P E P AP λλλλ----=-=-=-01022()()ll n l n l E A E E A E A λλλλλλ----==---02()l n l E A λλλ-=-- (4)令2()n l g E A λλ-=-是λ的n l -次多项式,由(4)式知0λ至少是A 的l (l k >)重特征值。

与0λ为A 的k 重特征值,矛盾,所以l k ≤。

由上面的两个引理作基础,下证定理3:证明:不妨设1()i mr i i E A λλλ=-=-∏其中1,,m K λλ∈又1mi i r n ==∑。

(在复数域中)充分性:由于对应于i λ的特征向量有i r 个线性无关,又m 个特征值互异。

由引理1知A 有n 个线形无关的特征向量,依据定理1,A 与对角阵相似。

必要性:用反证法:设有一个特征值i λ所对应的线性无关的特征向量的最大个数i i l λ<的重数为i r ,则由引理2知, A 的线性无关的特征向量个数小于n ,故A 不能对角化,与题设矛盾,假设不成立。

即A 的每个特征值对应的特征向量线性无关的最大个数i l 等于特征值的重数i r 。

[]4推论:n 级方阵A 可对角化的充要条件是对于A 的每一个特征根λ,有秩()E A n S λ-=-,其中s 是λ的重数。

[]2 证明:()0E A X λ-=的解空间V λ的维数等于特征值λ的重数即维()V S λ=(由定理3知)。

又维()V n λ=-秩()E A λ-。

所以,秩()E A n S λ-=- 成立。

以上给出的可对角化的几个条件都是以特征值,特征向量为基础。

其中条件1(也是定理1)是最基础的,可以把它看作是矩阵可对角化的实质。

其它条件都是它的扩展。

下面我们用λ-矩阵及若尔当标准形来讨论矩阵可对角化。

定理4:复数域上每一个n 阶矩阵A 都与一个若尔当标准形相似。

这个若当形矩阵除去其中若当块的排列次序外是被矩阵A 唯一决定的。

它称为A 的若尔当标准形。

[]1[]2[]3[]4由相似是一个等价关系知,与A 相似的矩阵都有相同的若尔当标准形。

从这个意义上讲,我们可以把n 级方阵划分为以若当标准形为代表元素的等价类。

等价类中的每个元素是相似的。

由若尔当标准形的构造知,它包含对角形矩阵为它的特殊情况。

那么当它满足什么条件时,一个若尔当标准形是一个对角矩阵,也就是可对角化的条件。

由于每个初等因子对应一个若当块,例如初等因子为()ir i λλ-,那它对应的若当块为11i ii ii i r rJ λλλ⨯⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦, 而若当形矩阵是由这样的若当块组成的。

例: 12S J J J J ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦, 所以如果每一个若当块都是1阶,那么,这个若当形矩阵J 就成了对角阵,那么与之对应的初等因子都是一次的。

由上面讨论给出矩阵可对角化的几个条件:定理5:n 级方阵可对角化的充要条件它的初等因子都是一次的。

[]1[]2[]3推论1:n 级方阵可对角化的充要条件它的不变因子无重根。

[]1[]2[]3 推论2:n 级方阵可对角化的充要条件它的最小多项式无重根。

[]1[]2[]3这三个充要条件充分利用了不变因子,初等因子及最小多项式之间的关系,但在具体的解题过程中很少直接去求不变因子和初等因子,一般情况下是通过求最小多项式来解题的。

例:由最小多项式的定义知,对于任一个零化多项式()f x 都满足()|()A m x f x ,()A m x 表示矩阵A 的最小多项式。

因此若()f x 无重根,则()A m x 一定无重根。

当然这只是一种方法。

由此给出推论3:n 级方阵可对角化的充分条件是它的零化多项式无重根。

由哈密尔顿—凯莱定理知,特征多项式是一个零化多项式。

相关文档
最新文档