矩阵论文献翻译--5000字
矩阵特征值、特征向量的研究【文献综述】

毕业论文文献综述数学与应用数学矩阵特征值、特征向量的研究一、前言部分数学作为一种研究问题的工具,大部分同学并未真正感受到它的实用价值,往往低估了数学对于学习知识及其解决问题的重要作用,或不会灵活运用数学这一工具去理解、解决问题.许多理论、规律、计算等若能灵活而有效地借助数学方法去剖析、推演,往往会有意外的收获[]1。
矩阵就是数学中的一小部分,英文名Matrix(SAMND矩阵)本意是子宫、控制中心的母体、孕育生命的地方,同时,在数学名词中,矩阵用来表示统计数据等方面的各种有关联的数据。
这个定义很好地解释了Matrix代码制造世界的数学逻辑基础。
在科学技术和工程应用中,矩阵理论的重要性和应用的广泛性是众所周知的,尤其是有了矩阵特征值、特征向量的各种求解及计算机的广泛使用和MATLAB等数学计算软件的迅猛普及为矩阵提供了更为广阔的发展和应用前景。
矩阵特征值、特征向量运用非常的广泛,在很多方面都有涉及。
本文将先从各种矩阵的特征值、特征向量求解方法和矩阵历史入手,从几个方面综述矩阵特征值、特征向量的应用[]2。
那什么是矩阵特征值、特征向量呢?定义:设A是N阶矩阵,如果数X和N维非零列向量x,使关系式Ax=Xx成立,那么,这样的数X就称为方阵A的特征值,非零向量x称为A的对应于特征值X的特征向量。
求特征值描述正方形矩阵的特征值的重要工具是特征多项式:说λ是A的特征值等价于λ) v = 0 (其中I是恒等矩阵)有非零解 (一个特征向量),因说线性系统 (A –iλ)=0。
此等价于行列式 det(A –i第一:运用MATLAB求解矩阵特征值、特征向量。
首先,我用下面的例子,来引导我们认识MATLAB在求解矩阵特征值、特征向量上的运用。
例1:对亏损矩阵进行 Jordan 分解[]5。
A=gallery(5) %MATLAB 设置的特殊矩阵,它具有五重特征值。
[VJ,DJ]=jordan(A); % 求出准确的特征值,使 A*VJ=VJ*D 成立。
矩阵研究毕业论文

0 引言为了利用矩阵研究线性变换, 希望能找到线性空间的基使线性变换在该基下的矩阵具有最简单的形式, 因此我们引进了特征值与特征向量. 特征值与特征向量在线性变换中起着举足轻重的作用, 充分利用特征值与特征向量的命题与性质对我们解题带来极大的帮助, 能使复杂的问题变的简单, 化简为易, 化繁为简. 本文就矩阵的特征值与特征向量在一些解题中的应用作了初步的探讨.1. 关于矩阵的特征值与特征向量的一般理论我们知道, 在有限维线性空间中, 取了一组基之后, 线性变换就可以用矩阵来表示. 为了利用矩阵来研究线性变换, 对于每个给定的线性变换, 我们希望能找到一组基使得它的矩阵具有最简单的形式. 从现在开始, 我们主要的来讨论, 在适当的选择基之后, 一个线性变换的矩阵可以化成什么样的简单形式. 为了这个目的, 先介绍特征值和特征向量的概念, 它们对于线性变换的研究具有基本的重要性.定义 1.1 设A 是数域P 上的一个n 阶方阵,若存在一个数P λ∈以及一个非零n 维列向量n x P ∈,使得Ax x λ=则称λ是矩阵A 的一个特征值,向量x 称为矩阵A 关于特征值λ的特征向量. 定义1.2 设A 是数域P 上一n 级矩阵, λ是一个文字. 矩阵A E -λ的行列式nnn n n n a a a a a a a a a A E ---------=-λλλλ212222111211,称为A 的特征多项式, 这是数域P 上的一个次多项式.设T 是n 维线性空间V 上的一个线性变换,求解T 的特征值与特征向量的方法可以分成一下三几步:1) 在线性空间V 中取一组基12,,,nξξξ, 写出/A 在这组基下的矩阵A ;2) 求出A 的特征多项式E Aλ-在数域P 中全部的根, 它们也就是线性变换/A 的全部特征值;3) 对于A 的每个特征值,j λ求其次线性方程组()0jI A X λ-=的一组基础解系:12,,,.t ηηη于是A 的属于jλ的全部特征值组成的集合是}{1122,0,1,2,,t t i i k k k k K k i t ηηη+++∈≠=例1 设V 是数域K 上3维线性空间,T 是V 上的一个线性变换,它在在V 的一个基1α,2α,3α下的矩阵A 是222214241A -⎛⎫ ⎪=-- ⎪⎪-⎝⎭,求A 的全部特征值与特征向量. 解: 因为特征多项式为2222214(3)(6)241I A λλλλλλ--⎛⎫ ⎪-=+-=-+ ⎪⎪+⎝⎭所以A 的全部特征值3(二重),-6.对于特征值3,解齐次线性方程组(3)0I A X -=,12312312322024402440x x x x x x x x x +-=⎧⎪+-=⎨⎪++=⎩得到一个基础解系:210-⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦, 201⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦因此,A 的属于3的两个线性无关的特征向量就是1122ζαα=-+,2132ζαα=+ 而A 的属于3的全部特征向量就是 .{}11221212,,,0k k k k K k k ζζ+∈且不全为对于特征值-6代入, 求出(6)0I A X --=的一个基础解系:122⎡⎤⎢⎥⎢⎥⎢⎥-⎣⎦.因此, A 的属于特征值-6的一个线性无关的特征向量就是312322ζααα=+-,而A 的属于特征值-6的全部特征向量是{}3,0k k K k ζ∈≠且.例2 设T 是复数域上n 维线性空间V 上的一个线性变换()1n >,它在V 的一个基12,,,nααα下的矩阵A 是1012210000010000001n n A ααααα--⎛⎫ ⎪ ⎪⎪= ⎪ ⎪ ⎪-----⎝⎭,求T 的特征值和特征向量. 解 :1012201221100001000100001000010000100001n n n n I A λλλλααααλαλαλαλαλαλα-------=-+--=--+令01221000100001000001001n n n D λαλαλαλαλα----=--+下面用数学归纳法求解()2n D n ≥当2n =时,22101.1D λαλαλαλα==++-+假设对于上述形式的1n -阶行列式,有012-132000100001000001001n n n D λαλαλαλαλα----=--+n-1n-2n-210=+++λαλαλα,对于n 阶行列式,把它第1行展开,得12102112111210121210000100010010(1)001000100101()(1)(1).n n n n n n n n n n n n D xλαλαλλαλαλαλλλλαλαλααλαλαλαλα+----+----=---+----+-=+++++--=++++根据数学归纳法原理,此命题对一切自然数2n ≥都成立. 故121210.n n n I A λλαλαλαλα---=++++即为T 的特征多项式.设12,,n λλλ 是I A λ-的全部复根. 对于1i n ≤≤,有111122201111,n n n n i i i i i i i ii i i n i A λλλλλλλλλλααλαλ-----⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭ 因此12'(1,,,,)n i i i λλλ-(1i n ≤≤)是A 的属于特征值i λ的一个特征向量. 由于()()11,2,,110,2,3,,n i n I A n λ--⎛⎫-=-≠⎪⎝⎭而i I A λ-=,因此()1i rank I A n λ-=-. 从而齐次线性方程组()0i I A X λ-=的解空间的维数为(1)1n n --=. 于是A 的属于特征值i λ的所有特征向量组成的集合是{}21'(1,,,,)|,0.n i i i k k C k λλλ-∈≠从而T 的属于特征值i λ的全部特征向量是{}21'123()|,0.n i i i k k C k αλαλαλ-++++∈≠(1i n ≤≤)例2 在空间[]nP x (n>1)中(P 为实数域), 求微分运算D'()()f x f x ∂= 的 特征多项式,并证明:D 在任何一组基下的矩阵不可能是对角矩阵. 证:在[]nP x 中取一组基()211,,,,2!1!n x x x n --微分运算D 在此基下的矩阵为.0000100001000010⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=DD 的特征多项式是.01000010001n D E λλλλλ=---=-从而D 的特征多项式为nλ. 因此D 的特征值为210n λλλ====.又D 的对应特征值0的奇次线性方程组()0A X -=的系数矩阵的秩为n-1,从而基础解系只含一个向量.它小于[]nP x 的维数n(n>1),故D 不可能同任何对角矩阵相似.所以微分运算D 在任何基下的矩阵都不可能是对角形. 2矩阵特征值与特征向量的五个应用2.1特征值与特征向量判断线性变换可对角化的应用定义2.1.1如果V 中存在一个基,使得线性变换A 在这个基下的的矩阵是对角矩阵,那么A 可对角化.由于线性变换A 在V 的不同基下的矩阵是相似的,因此线性变换A 可对角化当且仅当A 在V 的基下的矩阵A 可对角.定理2.1.1域F 上n 维线性空间V 上线性变换A 可对角化当且仅当A 有n 个线性无关的特征向量12,,,nξξξ,此时A 在基12,,,nξξξ下的矩阵A 为1000,00n λλ⎛⎫ ⎪⎪ ⎪⎝⎭其中i λ是i ξ所属的特征值(即i i i A ξλξ=),1,2,,.i n = 矩阵A 称为线性变换A 的标准形,除了主对角线上元素的排列次序外,A 的标准形是有A 唯一决定的.推论2.1.1 域F 上n 维线性空间V 上线性变换A 可对角化当且仅当V 中存在由A的特征向量组成的一个基.定义2.1.2设A 是域F 上线性空间V 上的一个线性变换,0λ是A 的一个特征值,令 {}00|,defV A V λααλαα==∈ .易验证V λ 是V 的一个子空间,称0V λ是A 的属于特征值0λ的特征子空间. 0V λ中全部非零向量就是A 的属于特征值0λ的全部特征向量. 由于()00000().V A I A Ker I A λααλαλααλ∈⇔=⇔-=⇔∈-因此 00().V Ker I A λλ=-即线性变换A 的属于特征值0λ的特征子空间等于线性变换0I A λ- 的核.设V 是域F 上n 维线性空间,V 上线性变换A 在V 的一个基12,,,nααα下的矩阵为A,λ是A 的一个特征值. 设σ是V 到nF 的一个同构映射,它把V 中向量对应于它在基12,,,nααα下的坐标,则()0V λσ等于n 元齐次线性方程组()00I A X λ-=的解空间,即矩阵A 的属于特征值0λ的特征子空间. 于是()()00dim V n rank I A λλ=-- .定理2.1.2设A 是域F 上n 维线性空间V 上的一个线性变换,则A 可对角化⇔A 有n 个线性无关的特征向量⇔V 中存在由A 的特征向量组成的一个基⇔A 的属于不同特征值的特征子空间的维数之和等于n 12,s V V V V λλλ⇔=⊕⊕⊕其中12,,,sλλλ 是A 的所有不同的特征值.例 3 设T 是复数域上n 维线性空间V 上的一个线性变换()1n >,它在V 的一个基12,,,nααα下的矩阵A 是1012210000010000001n n A ααααα--⎛⎫ ⎪ ⎪⎪= ⎪ ⎪ ⎪-----⎝⎭,称它是Frobennis 矩阵. 求T 的特征多项式和属于特征值i λ的全部特征向量(1,2,3,,)i n =;T 是否可对角化?令122221211112111n n n n n n P λλλλλλλλλ---⎛⎫⎪ ⎪ ⎪= ⎪⎪ ⎪⎝⎭情形112,,n λλλ两两不等. 此时0.p ≠从而P 的列向量组线性无关. 于是A 有n 个线性无关的特征向量,因此A 可对角化.此时{}112,,n p AP diag λλλ-=从而T 可对角化.情形 212,,n λλλ中有相等的. 此时0.p = 从而P 线性相关. 这时A 没有n 个线性无关的特征向量,因此A 不可对角化, 从而T 不可对角化.例4 设T 是数域K 上n 维线性空间V 上的对合变换(即T 满足2T I =),(1)证明T 有特征值,且它的特征值是1或-1.(2)判断T 是否可对角化;若可以对角化,请写出它的标准形. 解:设T 在V 的一个基12,,,nααα下的矩阵是A ,由2T I =,可得2A I =. 即A 是数域K 上的对合矩阵,设0λ是对合矩阵A 的一个特征值,则有0,α≠使0.A αλα=从而2200.A A αλαλα== 由于2A I =,因此20αλα=,即20(1)0.λα-=由于0,α≠因此2010.λ-= 即01.λ=± 当A I =时,1是A 的特征值,-1不是;当A I =-时,-1是A 的特征值,1不是; 当A I ≠±时,0.I A ±≠由于()()rank I A rank I A n -++=因此 ()().rank I A n rank I A n -=-+< 从而0.I A -=从而1是A 的一个特征值.同理可证,-1是A 的一个特征值.(1)从而,T 有特征值,且它的特征值是1或-1.(2)设().rank I A r +=由于()()rank I A rank I A n -++=,因此().rank I A n r -=- 属于特征值1的特征子空间1W 的维数为1dim ()();W n rank I A n n r r =--=--=属于特征值-1的特征子空间1W -的维数为1dim ()();W n rank I A n rank I A n r -=---=-+=-由于11dim dim (),W W r n r n -+=+-=因此A 可对角化.A 的相似标准形为{},.r n r diag I I --从而T 可对角化,且它的相似标准形为0,0rn r I I -⎛⎫ ⎪-⎝⎭其中().r rank I A =+2.2 特征值与特征向量在确定可对角化矩阵的应用当矩阵A 可对角化时,可根据A 的特征值和特征向量来确定它的元素.例 5 设3阶方阵A 的特征值1231,0,1,λλλ===-对应的特征向量分别是1231222,2,1.211ξξξ-⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪==-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭求A .分析:此题给了3阶矩阵A 的3个不相同的特征值及其对应的特征向量,那么矩阵A 可对角化,显然可用A 的特征值和特征向量来确定它的元素.解:由i ξ是方阵A 对应于特征值i λ 的特征向量,于是i i i A ξλξ=()1,2,3.i =令()123122221212P ξξξ-⎛⎫⎪==-- ⎪⎪⎝⎭,则112212219212P -⎛⎫ ⎪=- ⎪⎪--⎝⎭, ,PA PD =其中100000,001D ⎛⎫ ⎪= ⎪ ⎪-⎝⎭ 由上式可得:11021012,3220A PDP --⎛⎫ ⎪== ⎪⎪⎝⎭ 即为所求.2.3特征值与特征向量在n 阶矩阵的高次幂的求解中的应用当n 阶矩阵A 可对角化时,即矩阵A 可与对角阵相似时,可应用矩阵的特征值与特征向量计算其高次幂()k A k N *∈,且比较简单.当n 阶矩阵A 满足下面的四个条件之一时,即可对角化,即1.A PDP -=n 阶矩阵A 有n 个线性无关的特征向量. n 阶矩阵A 有n 个互不相等的特征值.n 阶矩阵A 的每个特征值的几何重数等于其代数重数. A 为是对称矩阵. 对于(){}11212,,,,,,,,n n A PDP P D diag ξξξλλλ-===其中12,,,nλλλ是A 的n 个互不相等的特征值,i ξ是A 的属于特征值i λ的特征向量()1,2,,.i n =例6 已知矩阵122212221A ⎛⎫ ⎪= ⎪⎪⎝⎭,求k A (其中k N *∈). 分析:矩阵的高次幂的求解一般是有技巧的,这里因为矩阵A 为实对称矩阵,故可对角化. 可按上面讨论的方法求之.解 因为,T A A =所以矩阵A 为实对称矩阵,故A 可对角化为D .()()212221251221I A λλλλλλ----=---=-+---故A 的特征值为1231,5,λλλ==-=当1λ=-时,解齐次线性方程()0,I A X --=求出一个基础解系:12111,001ηη--⎛⎫⎛⎫⎪ ⎪== ⎪ ⎪⎪ ⎪⎝⎭⎝⎭ 当5λ=时,可求()50A X λ-=的一个基础解系:311,1η⎛⎫ ⎪= ⎪ ⎪⎝⎭ 令111101,011P --⎛⎫ ⎪= ⎪ ⎪⎝⎭()1001,1,5010005D diag -⎛⎫ ⎪=--=- ⎪⎪⎝⎭ 则()11,1,5P AP D diag -==--则1A PDP -=于是()()()()()()()()1111111111111()()1001112111101010121301100511121515151152153k kkkkk k k k k k k k k k k A PP APP PP APP PP APP P P AP P AP PAP P -------------==⎛⎫----⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪=--- ⎪ ⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭-+-+-+=-+-+-()()()()111151515215k kk k k k k k---⎛⎫⎪ ⎪+ ⎪ ⎪-+-+-+⎝⎭2.4 特征值与特征向量在求一些特殊数列通项公式的应用由一些特殊数列的递推公式,构造关系矩阵A ,并列出递推关系,当关系矩阵A 可对角化时,可利用A 的特征值与特征向量求解这些数列的通项公式.例7 斐波那契(Fibonacci )数列是0,1,1,2,3,5,8,13,它满足下列递推公式:21,n n n ααα++=+ 0,1,2,n=以及初始条件010, 1.αα== 求Fibonacci 数列的通项公式,并且求1lim.nn n αα→∞+解 由2111,,n n n n n ααααα++++=+⎧⎨=⎩ 可得21111.,10n n n n αααα+++⎛⎫⎛⎫⎛⎫= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭令11,10A ⎛⎫= ⎪⎝⎭ 1,0,1,2,n n n D n αα+⎛⎫== ⎪⎝⎭上式可写成1,n n D AD +=又由1001,0D αα⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭ 所以0,.n n D A D n N *=∈于是求Fibonacci 数列的通项公式就只要去计算nA .可利用A 的相似标准形来求简化nA 的计算.211111122I A λλλλλλλ⎛⎫⎛---==--=-- ⎪ ⎪-⎝⎭⎝⎭于是A的特征值为12λλ==从而A 可对角化.对于特征值1λ,解奇次线性方程组()10,I A X λ-=求出一个基础解系:11,1λη⎛⎫= ⎪⎝⎭对于特征值2λ,可求出()20I A X λ-=的一个基础解系:22,1λη⎛⎫= ⎪⎝⎭ 令12,11P λλ⎛⎫= ⎪⎝⎭ 则1120,0P AP λλ-⎛⎫= ⎪⎝⎭从而12121121211212112010011101.1nn nn n n n n A P P λλλλλλλλλλλλλλ-++-⎛⎫⎛⎫⎛⎫⎛⎫== ⎪⎪ ⎪-⎝⎭⎝⎭⎭⎝-⎛⎫⎛⎫=⎪ ⎪-⎝⎭⎭由于110n n n A αα+⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭因此))2121211110.n nn n n n nλαλλλλλ-⎛⎫⎛⎫==- ⎪⎪-⎝⎭⎝⎭⎡⎤⎢⎥=-⎢⎥⎝⎭⎝⎭⎣⎦即为Fibonacci 数列的通项公式. 于是211211112212111lim lim lim112nn nnnn nn n nnλλαλλαλλλλλλλ++→∞→∞→∞+⎛⎫- ⎪-⎝⎭==-⎛⎫- ⎪⎝⎭==例8已知()11,1,2i ii i ib cc b c--=⎧⎪⎨=+⎪⎩其中2,3,.i =设11,b c已知,求,.n nb c解由题可得1101,2,3,1122i ii ib bic c--⎛⎫⎛⎫⎛⎫⎪==⎪ ⎪⎪⎝⎭⎝⎭⎝⎭令01,1122B⎛⎫⎪=⎪⎝⎭则111,n nnb bBc c-⎛⎫⎛⎫=⎪ ⎪⎝⎭⎝⎭下面求1n B-.()111.11222I Bλλλλλ-⎛⎫-==-+⎪--⎝⎭因此B的全部特征值是11,.2-从而B可对角化.对于特征值1,解奇次线性方程组()0,I B X-=得到它的一个基础解系:11,1ξ⎛⎫= ⎪⎝⎭对于特征值1,2-解齐次线性方程组10,2I B X ⎛⎫--= ⎪⎝⎭得到它的一个基础解系:22.1ξ-⎛⎫= ⎪⎝⎭ 令12,11P -⎛⎫= ⎪⎝⎭ 则110.102P BP -⎛⎫⎪= ⎪-⎝⎭ 从而1111122111010210121211111130211122213111222n n n n n n n n B P P ---------⎛⎫⎪= ⎪-⎝⎭⎛⎫-⎛⎫⎛⎫ ⎪= ⎪ ⎪ ⎪⎛⎫--⎝⎭⎝⎭ ⎪ ⎪⎝⎭⎝⎭⎛⎫⎛⎫⎛⎫--+- ⎪ ⎪⎪⎝⎭⎝⎭ ⎪= ⎪⎛⎫⎛⎫ ⎪--+- ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭因此22111111111112,3232111112.3232n n n n n n b b c c b c ----⎧⎡⎤⎡⎤⎛⎫⎛⎫=--++-⎪⎢⎥⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎢⎥⎪⎣⎦⎣⎦⎨⎡⎤⎡⎤⎪⎛⎫⎛⎫=--++-⎢⎥⎢⎥ ⎪ ⎪⎪⎝⎭⎝⎭⎢⎥⎢⎥⎣⎦⎣⎦⎩2.5特征值与特征向量行列式计算中的应用用矩阵的特征值和特征向量计算三对角形的方法如下:设00000000000n a b c a b c a D a b ca =按第一行展开,得:12,n n n D aD cbD --=- 3,4,n =上式可写成21,n n n D aD cbD ++=- n N +∈由于2111,,n n n n n D aD cbD D D ++++=-⎧⎨=⎩ 令2111,,,10n n n n n n D D a cb d d A n N D D +++++-⎛⎫⎛⎫⎛⎫===∈ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭因此111,n nn n d Ad d A d +-==()2,3,n =其中2211D a cb d D a ⎛⎫-⎛⎫== ⎪⎪⎝⎭⎝⎭ 这样求nD 的问题就转化为nd 的问题,因而转化为求1,n A -即存在可逆矩阵P 使得 1P AP D -=(对角形),就可以算出1.n A -由201a cbI A a cb λλλλλ--==-+=-得A 的特征值12λλ==1) 若24a cb ≠① 若240,a cb -<则A 有两个不相等的复特征值12,,λλ在复数域上对应于12,λλ的特征向量分别为12,.ξξ取()12,P ξξ=则P 可逆 于是就有11111200n n n AP P λλ----⎛⎫=⎪⎝⎭所以111n n n n D d A d D+-⎛⎫== ⎪⎝⎭从而可求出nD .如果A 限制在实数域上,A 有复特征值,这时A 不可对角化.② 若240,a cb ->则A 有两个不同的特征值,则A 可对角化,按在复数域上的情况可求出nD2) 若24,a cb =这时A 有重根.若A 有两个线性无关的特征向量,则A 可对角化;若A 只有一个特征向量,这时可利用相似变换,把A 化若当标准形1100λλ⎛⎫ ⎪⎝⎭,可以算出1n A -,即可求出n D .例9 计算n 阶行列式:950004950004900.9500049n D =解:按第一行展开,得:12920,n n n D D D --=-()3,4,n =上式可写成21920,n n n D D D ++=-()n N +∈ 由2111920,,n n n n n D D D D D ++++=-⎧⎨=⎩ 令2111920,,,10n n n n n n D D d d A n N D D +++++-⎛⎫⎛⎫⎛⎫===∈ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭得111,n nn n d Ad d A d +-==()2,3,n =其中211619D d D ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭ 由于()()2920920451I A λλλλλλλ--==-+=---因此A 的特征值是124, 5.λλ==对于特征值14,λ=解其次线性方程组()40,I A X -=求出一个基础解系:14,1η⎛⎫= ⎪⎝⎭对于特征值25,λ=解其次线性方程组()50,I A X -=求出一个基础解系:25,1η⎛⎫= ⎪⎝⎭令45,11P ⎛⎫= ⎪⎝⎭ 则140,05P AP -⎛⎫= ⎪⎝⎭ 从而14005A P P-⎛⎫= ⎪⎝⎭111111111400545154011140554 5.4 4.554 5.4 4.5n n n n n n n n n n n n A P P---------⎛⎫= ⎪⎝⎭-⎛⎫⎛⎫⎛⎫= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎛⎫--= ⎪--⎝⎭由于11619n n n D A D +-⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭因此()11111161545.44.5549n n n n n n n D ----++⎛⎫=--=- ⎪⎝⎭例10 计算n 阶行列式:2120000121200012120000000210022n D ------=.解:将nD 按第一列展开得:1231232(2)22,n n n n n n n D D D D D D D ------=--+=+- ()4,5,6,n =上式可写成32122,n n n n D D D D +++=+-()n N *∈ 根据321221122,,,n n n n n n n n D D D D D D D D +++++++=+-⎧⎪=⎨⎪=⎩ 令323121*********,,100,5,0102n n n n n n n n D D D D D A D D D D ααα++++++-⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪===== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭ 可得1,n n A αα+=11,n n A αα-=由于()()()2121011201I A λλλλλλλ---=-=-+-- 因此A 的特征值是1231,1, 2.λλλ==-= 对于特征值11,λ= 解其次线性方程组()0,I A X -=得到一个基础解系;111,1η⎛⎫ ⎪= ⎪ ⎪⎝⎭ 同理,分别可求231, 2.λλ=-=的一个特征向量23141,2,11ηη⎛⎫⎛⎫ ⎪ ⎪=-= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ 令114112,111P ⎛⎫ ⎪=- ⎪ ⎪⎝⎭ 则1100010002P AP -⎛⎫ ⎪=- ⎪ ⎪⎝⎭ 于是1100010002A P P -⎛⎫ ⎪=- ⎪ ⎪⎝⎭从而()()()()11111111111000100021001143361112010132611100220211233611121326202112n n n n n n n n n n n A P P -------+--⎛⎫ ⎪=- ⎪ ⎪⎝⎭⎛⎫-⎛⎫⎛⎫ ⎪ ⎪ ⎪=--- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪- ⎪⎝⎭⎝⎭⎝⎭⎛⎫--⎛⎫ ⎪ ⎪ ⎪=-- ⎪ ⎪ ⎪- ⎪⎝⎭-⎝⎭于是()()()1121111123361011121325,62022112n n n n n n n n n D D D -+++--⎛⎫--⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪⎪ ⎪=-- ⎪ ⎪⎪ ⎪ ⎪ ⎪⎪- ⎪⎝⎭⎝⎭⎝⎭-⎝⎭从而()()()()()121013123 3.16 2.12562112263n n n nn n n n D -+⎛⎫ ⎪=-+-++-+-- ⎪ ⎪⎝⎭-=-++3.小结本文利用特征值与特征向量的一些命题和性质来探讨特征值与特征向量在一些解题计算中的应用,充分应用命题和性质给我们的解题带来很大的方便.参考文献[1] 大学数学系几何与代数教研室前代数小组.高等代数(第三版)[M].北京:高等教育出版社,2003.[2] 同济大学应用数学系. 工程数学- 线性代数(第4版) [M] . 北京:高等教育出版社,2003.[3] 奚传志. 矩阵的特征值与特征向量在行列式计算中的应用枣庄师专学报,1992年2期[4] 李淑花. 关于一类线性代数习题的快速解法[J]. 高等数学研究.[5] 谢国瑞. 线性代数及应用[M]. 北京:高等教育出版社,1999.[6] 戴华. 矩阵特征值反问题的若干进展[J]. 南京航空航天大学学报,1995.[7] 钱吉林.高等代数题解精粹[M].北京:中央民族大学出版社.[8]邵丽丽.矩阵的特征值和特征向量的研究.菏泽学院.计算机与信息工程系.山东菏泽(274015)[9] 朱凤娟.特征值与特征向量逆问题的研究[J].滨州学院学报2007.6 .[10] [英]S.巴比特. 科技工作者用矩阵方法[M] .北京:化学工业出版社.1984.126-137.[11]丘维声,高等代数(第二版)下册.北京:高等教育出版社[12] tephen H.Friedbeng等.Linear Algebra(4th Edition) [M].Prentice Hall/Pearson,1998.[13] Verler.W.J.Vectors Structures and Solutions of linear Matrix Equation, linear Algebra Appl;1975.[14]丘维声,高等代数(第二版)上册.北京:高等教育出版社[15] 熊全淹,线性代数[M].北京;高等教育出版社,1987.4.[16]丘维声,高等代数学习指导(下册).北京:清华大学出版社,2009[17]杨子胥,高等代数习题解(下册).济南:科学技术出版社,2009[18]丘维声,高等代数学习指导(上册).北京:清华大学出版社,2009致谢本学位论文是在我的指导老师张宝环老师的亲切关怀与细心指导下完成的.由于经验的匮乏,难免有许多考虑不周到的地方,从论文的选题、资料的搜集到论文的撰写编排整个过程中,张老师始终都给予了悉心的指导和不懈的支持,并为我指点迷津,帮助我开拓思路,精心点拨,热忱鼓励.张老师的一丝不苟的作风,严谨求实的态度,踏踏实实的精神,不仅授我以文,而且教我做人,给我以终生受益无穷之道.感谢老师们对我的教育培养.他们细心指导我的学习与研究.在此,我要向诸位老师深深地鞠上一躬.同时我要感谢同组的同学们,是我们相互的鼓励和支持才使得做论文的过程充满着快乐和感动.在此,我对所有帮助我的老师和同学们表达我衷心的感谢!。
矩阵分解的研究文献综述

矩阵分解的研究文献综述毕业论文文献综述数学与应用数学矩阵分解的研究一、前言部分(说明写作的目的,介绍有关概念,综述范围,扼要说明有关主题争论焦点)在近代数学、工程技术、经济理论管理科学中,大量涉及到矩阵理论的知识。
因此,矩阵理论自然就是学习和研究上述学科必不可少的基础之一。
矩阵理论发展到今天,已经形成了一整套的理论和方法,内容非常丰富。
矩阵分解对矩阵理论及近代计算数学的发展起了关键的作用。
寻求矩阵在各种意义下的分解形式,是对与矩阵有关的数值计算和理论都有着极为重要的意义。
因为这些分解式的特殊形式,一是能明显的反映出原矩阵的某些特征;二是分解的方法与过程提供了某些有效的数值计算方法和理论分析根据。
这些分解在数值代数和最优化问题的解决中都有着十分重要的角色以及在其他领域方面也起着必不可少的作用。
本文结合矩阵的基本知识原理,对矩阵分解的各种常用形式进行梳理、归纳,并举例进行说明。
矩阵的定义:由m n ?个数(1,2,,,1,2,,)ij a K i m j n ∈==K K 排成的m 行、n 列的长方形表111212122212n n m m mn a a a a a a a a a ?? ? ? ? ???K K M M O M K (1) 称为数域K 上的一个m n ?矩阵。
其中的ij a 称为这个矩阵的元。
两个矩阵相等就是它们对应位置的元全相等[1]。
矩阵通常用一个大写拉丁字母表示。
如(1)的矩阵可以被记为A .如果矩阵的行数m 与列数n 相等,则称它为n 阶方阵。
数域K 上所有m n ?矩阵的集合记为(),m n M K ,所有n 阶方阵的集合记为()n M K ,元全为0的矩阵称为零矩阵,记为0.矩阵A 的位于第i 行、第j 列的元简称为A 的(),i j 元,记为(),A i j 。
如果矩阵A 的(),i j 元是(1,2,,,1,2,,)ij a i m j n ==K K ,则可以写成()ij A a =。
矩阵理论应用论文

高维随机矩阵理论在数组信号检测与估计中的应用摘要本文中,我们展示了高维随机矩阵理论在频谱中的要素、相关源的检测并解决了在大数组中的估计问题。
这些结果适用于样本空间的协方差矩阵R̂中所感测的数据。
可以看出,可以实现的检测样品尺寸大小小于传统方法所要求的。
如果确定了预定的方向,可以通过给R̂设置限制条件,包括从高维随机矩阵理论中提出的,可以得到更加准确的估计。
一组理论用来解决可行性问题。
讨论 了一些没有解决的问题。
问题声明我们认为,当p 很大时,检测映射在数列p (q<p )的传感器上的q 的数量以及他们的到达方向是个问题。
该模型的成像机制如下。
在每个时间t 的第j 个信号出现在场景中时,第i 个传感器的加性噪声和在第i 个传感器接收到的数据可以分别用平方可积的复数值随机变量序列S j (t)、N i (t)和X i (t)表示。
随机向量(S(t)=[S 1(t )……S q ])T,t ∈[0,+∞],ES (0)=0和奇异空间的协方差矩阵R S =ES(0)S(0)∗。
此外,假设随机变量序列(N i (t )|1≤i ≤p ,t ∈[0,+∞]),EN 1(0)=0和E |N 1(0)|2=σ2,σ2未知,与随机变量序列(S j (t )|1≤j ≤p ,t ∈[0,+∞])独立。
让N (t )=σW (t )=σ[W 1(t )……W p (t)]T (W i (t )被标准化)和X (t )=[X 1(t )……X p (t)]T 。
这些由阵列传感器收集的数据被建模成为随机向量的观测值X (t )=AS (t )+N(t)t ∈[0,+∞],A 是根据阵列的几何尺寸和信号参数的p*q 的矩阵,假设秩为q 。
在数据处理中的检测问题是从观测到的n 个快照(X (t i ))1≤i≤n 中估计q 。
根据上述假设,随机向量(X (t ))t∈[0,+∞]由空间的协方差R =EX (0)X (0)∗=AR S A ∗+σ2I p 决定,I p 表示p*p 的单位矩阵。
矩阵理论的应用

矩阵理论的应用摘要:矩阵是数学的基本概念之一。
作为线性代数的核心内容,矩阵广泛运用于各个领域,如数学建模、密码学、化学、通信和计算机科学等,解决了大量的实际问题。
关键词:矩阵;密码学;化学;数学建模;应用Abstract:Matrix is one of the fundamental conception in mathematics.As the core content in the linear algebra,It is used in various domains like mathematical modeling,cryptology,chemistry,communication&computer science,etc.and also solve a large amount of practical problems.Keyword:matrix,cryptology,chemistry,mathematical modeling,application. 一、引言矩阵理论在现代统计学的许多分支有着广泛的应用,成为统计学中不可缺少的工具,而且,随着研究的深入和应用的发展,矩阵与统计学之间的关系会越来越深刻。
一方面,统计学对矩阵研究提出了许多新的研究课题,刺激了有关矩阵理论研究的发展;另一方面,矩阵理论中的结果被越来越多地应用于统计学的理论研究及其应用中。
近三十年,许多统计学家致力于这方面的研究,并撰写了很多这方面的论文和著作,其中很多结论在统计学的研究中发挥着很大的作用。
矩阵理论在数值计算、线性规划、数据分析、科学试验、信号传输等重大领域也有着极其广泛的应用。
随着科技日新月异地进步,人类社会开始步入信息化、数字化时代,矩阵在生产实践中的应用越来越广泛,故矩阵理论的研究也就越来越重要。
二、矩阵理论在实际中的应用矩阵理论的应用是十分有必要,也是十分简便的。
它帮助我们解决了大量的实际问题,具体应用有如下几个方面:(1)在密码学中的应用古罗马时期,凯撒大帝为了避免信使在途中背杀以至于情报被敌军劫走,发明了一种方法,即,把明文中的每一个字母转化为英文字母表中的第四个字母。
矩阵理论论文

矩阵分解在信号和图像处理方面的应用矩阵理论是一门发展完善、理论严谨、方法独特的理论基础课程,它对培养学生的逻辑能力、推理能力具有重要作用,但它又能广泛应用于各个领域。
矩阵理论主要内容包括线性空间、线性变换、范数理论;矩阵分析;矩阵分解;广义逆矩阵;特征值的估计以及广义特征值等。
用矩阵的理论和方法来处理现代工程技术中的各种问题已经越来越普遍。
下面简单介绍一下矩阵的奇异值分解在信号和图像处理方面的简单应用。
此方法近年来在数据降维和压缩,滤波器设网络节点估计、小波变换结果的后续处理等很多领域都获得了重要的应用。
在滤波器设计方面,VOZALIS等将SVD 用于协同滤波,他们的研究结果表明,SVD提高了协同滤波过程中预测的质量和精度。
而在消噪方面,LEHTOLA等利用SVD和数学形态学相结合,对心电信号(Electrocardiogram,ECG)进行处理,消除了噪声的影响,提高了心电图诊断的准确性。
同时奇异值分解已用于从孕妇皮肤测量信号中提取胎儿心电信号。
在另一些研究中SVD则被利用来实现特征提取和弱信号分离,如LIU等利用SVD从背景噪声强烈的振动信号中提取周期性冲击信息。
SVD在神经网络中也获得了应用,如TEOH等利用SVD实现了对隐层空间中模式的线性独立性分析,进而决定了隐层神经元节点的数目。
SVD的正交化特性在对小波和小波包变换结果的后续处理中也得到了有效的应用,如XIE等利用SVD对小波包分解后的肌电信号进行正交化处理,以获得代表肢体运动模式的最优特征,进而对肌电信号进行分类,用于对假肢的控制。
小波多分辨分析的本质就是把信号在一系列不同层次的空间上进行分解,获得相应的近似和细节信号,从而以不同的层次显示信号的各种概貌和细节特征[9],这种多分辨思想使得小波分析在很多领域获得了极为广泛的应用。
基于这种多分辨分析思想的思考,赵学智在SVD中提出了一种矩阵二分递推构造方法,根据该方法得到的SVD分解结果将分属于不同层次的空间,而且下一层次空间的基矢量是利用上一层次的近似基矢量而获得的,实现了利用SVD以不同的层次来展现信号的概貌和细部特征。
数学 外文翻译 外文文献 英文文献 矩阵

Assume that you have a guess U(n) of the solution. If U(n) is close enough to the exact solution, an improved approximation U(n + 1) is obtained by solving the linearized problemwhere have asolution.has. In this case, the Gauss-Newton iteration tends to be the minimizer of the residual, i.e., the solution of minUIt is well known that for sufficiently smallAndis called a descent direction for , where | is the l2-norm. The iteration iswhere is chosen as large as possible such that the step has a reasonable descent.The Gauss-Newton method is local, and convergence is assured only when U(0)is close enough to the solution. In general, the first guess may be outside thergion of convergence. To improve convergence from bad initial guesses, a damping strategy is implemented for choosing , the Armijo-Goldstein line search. It chooses the largestinequality holds:|which guarantees a reduction of the residual norm by at least Note that each step of the line-search algorithm requires an evaluation of the residualAn important point of this strategy is that when U(n) approaches the solution, then and thus the convergence rate increases. If there is a solution to the scheme ultimately recovers the quadratic convergence rate of the standard Newton iteration. Closely related to the above problem is the choice of the initial guess U(0). By default, the solver sets U(0) and then assembles the FEM matrices K and F and computesThe damped Gauss-Newton iteration is then started with U(1), which should be a better guess than U(0). If the boundary conditions do not depend on the solution u, then U(1) satisfies them even if U(0) does not. Furthermore, if the equation is linear, then U(1) is the exact FEM solution and the solver does not enter the Gauss-Newton loop.There are situations where U(0) = 0 makes no sense or convergence is impossible.In some situations you may already have a good approximation and the nonlinear solver can be started with it, avoiding the slow convergence regime.This idea is used in the adaptive mesh generator. It computes a solution on a mesh, evaluates the error, and may refine certain triangles. The interpolant of is a very good starting guess for the solution on the refined mesh.In general the exact Jacobianis not available. Approximation of Jn by finite differences in the following way is expensive but feasible. The ith column of Jn can be approximated bywhich implies the assembling of the FEM matrices for the triangles containing grid point i. A very simple approximation to Jn, which gives a fixed point iteration, is also possible as follows. Essentially, for a given U(n), compute the FEM matrices K and F and setNonlinear EquationsThis is equivalent to approximating the Jacobian with the stiffness matrix. Indeed, since putting Jn = K yields In many cases the convergence rate is slow, but the cost of each iteration is cheap.The nonlinear solver implemented in the PDE Toolbox also provides for a compromise between the two extremes. To compute the derivative of the mapping , proceed as follows. The a term has been omitted for clarity, but appears again in the final result below.The first integral term is nothing more than Ki,j.The second term is “lumped,” i.e., replaced by a diagonal matrix that contains the row j j = 1, the second term is approximated bywhich is the ith component of K(c')U, where K(c') is the stiffness matrixassociated with the coefficient rather than c. The same reasoning can beapplied to the derivative of the mapping . Finally note that thederivative of the mapping is exactlywhich is the mass matrix associated with the coefficient . Thus the Jacobian ofU) is approximated bywhere the differentiation is with respect to u. K and M designate stiffness and mass matrices and their indices designate the coefficients with respect to which they are assembled. At each Gauss-Newton iteration, the nonlinear solver assembles the matrices corresponding to the equationsand then produces the approximate Jacobian. The differentiations of the coefficients are done numerically.In the general setting of elliptic systems, the boundary conditions are appended to the stiffness matrix to form the full linear system: where the coefficients of and may depend on the solution . The “lumped”approach approximates the derivative mapping of the residual by The nonlinearities of the boundary conditions and the dependencies of the coefficients on the derivatives of are not properly linearized by this scheme. When such nonlinearities are strong, the scheme reduces to the fix-pointiter ation and may converge slowly or not at all. When the boundary condition sare linear, they do not affect the convergence properties of the iteration schemes. In the Neumann case they are invisible (H is an empty matrix) and in the Dirichlet case they merely state that the residual is zero on the corresponding boundary points.Adaptive Mesh RefinementThe toolbox has a function for global, uniform mesh refinement. It divides each triangle into four similar triangles by creating new corners at the midsides, adjusting for curved boundaries. You can assess the accuracy of the numerical solution by comparing results from a sequence of successively refined meshes.If the solution is smooth enough, more accurate results may be obtained by extra polation. The solutions of the toolbox equation often have geometric features like localized strong gradients. An example of engineering importance in elasticity is the stress concentration occurring at reentrant corners such as the MATLAB favorite, the L-shaped membrane. Then it is more economical to refine the mesh selectively, i.e., only where it is needed. When the selection is based ones timates of errors in the computed solutions, a posteriori estimates, we speak of adaptive mesh refinement. Seeadapt mesh for an example of the computational savings where global refinement needs more than 6000elements to compete with an adaptively refined mesh of 500 elements.The adaptive refinement generates a sequence of solutions on successively finer meshes, at each stage selecting and refining those elements that are judged to contribute most to the error. The process is terminated when the maximum number of elements is exceeded or when each triangle contributes less than a preset tolerance. You need to provide an initial mesh, and choose selection and termination criteria parameters. The initial mesh can be produced by the init mesh function. The three components of the algorithm are the error indicator function, which computes an estimate of the element error contribution, the mesh refiner, which selects and subdivides elements, and the termination criteria.The Error Indicator FunctionThe adaption is a feedback process. As such, it is easily applied to a lar gerrange of problems than those for which its design was tailored. You wantes timates, selection criteria, etc., to be optimal in the sense of giving the mostaccurate solution at fixed cost or lowest computational effort for a given accuracy. Such results have been proved only for model problems, butgenerally, the equid is tribution heuristic has been found near optimal. Element sizes should be chosen such that each element contributes the same to the error. The theory of adaptive schemes makes use of a priori bounds forsolutions in terms of the source function f. For none lli ptic problems such abound may not exist, while the refinement scheme is still well defined and has been found to work well.The error indicator function used in the toolbox is an element-wise estimate of the contribution, based on the work of C. Johnson et al. For Poisson'sequation –f -solution uh holds in the L2-normwhere h = h(x) is the local mesh size, andThe braced quantity is the jump in normal derivative of v hr is theEi, the set of all interior edges of thetrain gulation. This bound is turned into an element-wise error indicator function E(K) for element K by summing the contributions from its edges. The final form for the toolbox equation Becomeswhere n is the unit normal of edge and the braced term is the jump in flux across the element edge. The L2 norm is computed over the element K. This error indicator is computed by the pdejmps function.The Mesh RefinerThe PDE Toolbox is geared to elliptic problems. For reasons of accuracy and ill-conditioning, they require the elements not to deviate too much from beingequilateral. Thus, even at essentially one-dimensional solution features, such as boundary layers, the refinement technique must guarantee reasonably shaped triangles.When an element is refined, new nodes appear on its mid sides, and if the neighbor triangle is not refined in a similar way, it is said to have hanging nodes. The final triangulation must have no hanging nodes, and they are removed by splitting neighbor triangles. To avoid further deterioration oftriangle quality in successive generations, the “longest edge bisection” scheme Rosenberg-Stenger [8] is used, in which the longest side of a triangle is always split, whenever any of the sides have hanging nodes. This guarantees that no angle is ever smaller than half the smallest angle of the original triangulation. Two selection criteria can be used. One, pdead worst, refines all elements with value of the error indicator larger than half the worst of any element. The other, pdeadgsc, refines all elements with an indicator value exceeding a user-defined dimensionless tolerance. The comparison with the tolerance is properly scaled with respect to domain and solution size, etc.The Termination CriteriaFor smooth solutions, error equi distribution can be achieved by the pde adgsc selection if the maximum number of elements is large enough. The pdead worst adaption only terminates when the maximum number of elements has been exceeded. This mode is natural when the solution exhibits singularities. The error indicator of the elements next to the singularity may never vanish, regardless of element size.外文翻译假定估计值,如果是最接近的准确的求解,通过解决线性问题得到更精确的值当为正数时,( 有一个解,即使也有一个解都是不需要的。
数学专业英语第二版的课文翻译

2-A Why study geometry Many leading institutions of higher learning have recognized that positive benefits can be gained by all who study this branch of mathematics. This is evident from the fact that they require study of geometry as a prerequisite to matriculation in those schools. 许多居于领导地位的学术机构承认,所有学习这个数学分支的人都将得到确实的受益,许多学校把几何的学习作为入学考试的先决条件,从这一点上可以证明。
Geometry had its origin long ago in the measurement by the Babylonians and Egyptians of their lands inundated by the floods of the Nile River. The greek word geometry is derived from geo, meaning “earth” and metron, meaning “measure” . As early as 2000 . we find the land surveyors of these people re-establishing vanishing landmarks and boundaries by utilizing the truths of geometry . 几何学起源于很久以前巴比伦人和埃及人测量他们被尼罗河洪水淹没的土地,希腊语几何来源于geo ,意思是”土地“,和metron 意思是”测量“。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矩阵相关文献翻译:Cooperative Spectrum Sensing Using Random Matrix TheoryLeonardo S. Cardoso and Merouane Debbah and Pascal BianchiFROM IEEE字数:5000字基于随机矩阵理论的协作频谱感知摘要本文提出了一种基于随机矩阵理论的协作频谱感知算法,这个算法既适用于AWGN,也适用于衰落信道。
不像先前的研究工作,新算法并不需要噪声统计和方差,并且与随机矩阵的最大和最小特征值有关。
值得注意的是,仿真结果表明,新算法方便随时间变化的拓扑结构,其性能明显优于典型的能量检测算法。
一、前言从美国联邦通信委员会(FCC)频谱政策专责小组[1]的报告中显示,无论是由于稀疏用户访问还是系统的固有缺陷,目前移动通信系统并没有充分利用可用的频谱,这已经成为共识。
可以预见,未来的系统将能够有机会利用这些频谱,通过认知环境的能力的相关知识,以适应相应的无线电参数[2]。
由于微电子和计算机系统的最新进展,这种无线电的时代已经不远,其中最重要的是开发出很好的感知技术。
用最通俗的话来说,频谱检测手段是在一个给定的有噪声的频段下寻找频带中的信号在(也可能包括进行分类的信号)。
这个问题以前得到广泛的研究,如今由于认知无线电研究的部分原因重获关注。
为此,有几个经典的技术,如能量检测(ED)(文献[3] - [5]),匹配滤波器(文献[6])和循环平稳特征检测(文献[7] - [9])。
这些技术有自身的优缺点,而且都是适合于非常特殊的应用场合。
然而,从认知无线电的角度来看,频谱感知有非常严格的要求和限制的问题,例如:•没有信号结构的先验知识(统计、噪音方差值,等等);•在最短的时间内的信号检测;需要具有在严重衰落信道的环境下可靠检测的能力。
Cabric等人的工作[7]、Akyildiz等人的工作[10]、和Haykin[11]提供了从认知网络的角度对这些经典技术进行了汇总。
从这些工作中可以清楚的看到,任何方法都不可能完全应付认知无线电网络的所有需求。
在简单的AWGN(加性高斯白噪声)信道中,经典的方法效果非常好。
然而,在快衰落的情况下,这些技术无法提供满意的解决方案,尤其是隐藏节点问题[12]。
为此,[13]- [16]几部文献已经研究认知无线电的协作频谱感知的情况。
这些工作的目的是通过增加额外的冗余感知方法降低错误概率。
他们还旨在通过减少收集的样本数量,来使用并行测量装置估计次数。
不过,即使人们可以高效的利用空间维度,这些工作也都是是基于相同的基本技术,都需要一个信号的先验信息。
在这项工作中,我们引入一个不需要先验信息的频谱感知方法。
这种方法依赖于多个接收器采用随机矩阵理论(RMT)对接收到的信号进行结构推断。
随机矩阵理论(RMT)是研究大维随机矩阵的经验谱分布函数在一定条件下特殊收敛性质的相关理论,现已被广泛应用于无线通信领域中,如无线信道容量、阵列信号处理、接收机性能分析、通信系统设计等的各个方面。
基于RMT 的频谱感知算法具有能够在噪声统计特性未知的情况下成功感知的优点。
实验表明,我们可以用所收到的少量可靠取样对频谱占用进行估算。
本文的其余部分作如下划分。
在第二节,我们提出了频谱感知的问题。
在第三节中,我们从随机矩阵理论的基础上提出方法。
在第四节中,我们拿出一些实际结果,证实在少量取样下的假设。
然后,在第五节中,我们对所提出的方法显示了性能测试结果。
最后,第六节中,我们得出主要结论,并指出进一步的研究。
二、问题提出频谱感知的基本问题是在有噪声情况下的信号检测。
这是一项艰巨的任务,特别在由于路径损耗或衰减造成接收到的信号功率非常低的情况下,频谱的盲检测是未知的。
这个问题可以构成假设检验,如[3]:其中y(k)是样品在k时刻接收的向量,n(k)是噪声方差(不一定是高斯的),h(k)是衰落分量,s(k)是我们要检测的信号,这样的话,E[s(k)2]=0,上式H0和H1分别只有噪声和信号假设。
我们还假设在N个信道上(K = 1.. N)的h保持不变。
基于能量频谱感知的经典技术检测是将信号能量与已知的阈值相比较,此阈值由V T[3] - [5]中的噪声和信道的统计所得。
下面的式子被公认为判定规则:其中,E[| y(k)|2]是信号能量,V T通常认为是噪声方差。
这种做法有一个缺点,就是噪音/通道的分配和V T都不是已知先验的。
在现实环境中的V T取决于无线的特点,这很难正确估计。
此外,在衰落和路径损耗的情况下,接收到的信号能量可能是噪音序列,使其很难检测,因而使检测到的取样数量N更加有限。
事实上,E[| Y(K)|2]由下式估计得到:这不是一个少量取样情况下的估计公式。
下面,我们在认知网络下提供了一种基于随机矩阵理论的协作频谱感知算法来从原始系统中检测信号而无需噪声方差。
.三、频谱感知的随机矩阵理论考虑图1中描绘的场景,其中用户(用白色表示)与他们的专用(主)基站通信。
二级基站{BS1,BS2,BS3,……,BS k}协作感知信道,以定位白色区域,并利用这些媒介。
在进一步讨论之前,让我们假设以下情况:• K 个基站的二级系统,它们之间的共享信息。
这可以通过有线高速骨干传输实现。
• 各个基站分析的频谱相同的部分。
让我们考虑以下的K×N 矩阵,此矩阵由所有的K 二级基站接收到的取样组成(y i (K )是基站i 在k 时刻的取样)。
随机矩阵理论方法的目标是检验测试不同基站接受到信号之间的独立性。
事实上,在信号的存在的情况下(以H1为例),所有收到的取样之间都是相关的,而当没有信号的情况下(以H0为例的情况下),无论衰落情况如何,取样之间都是不相关的。
因此,在这种情况下,对于固定值K ,当N→∞,样本协方差矩阵N 1YY H 收敛于σ2I 。
然而,在实际情况中,N 可以是与K 有着相同数量级的序列,因此不能直接推断N1YY H 中取样的独立性。
这可以使用随机矩阵理论工具[17]。
在以下渐近随机矩阵理论结果状态的情况下,Y 的各项都是独立的(统一具体的概率分布,与没有信号传输,即H0的情况对应):定理。
考虑K×N 矩阵W ,它的的各项是独立的复杂(或实际)的均值为零且随机变量方差为N 2并且时刻4序列为O (21N )。
当K ,N→∞且K/N→α,根据经验,分布WW H 几乎肯定会收敛到一个非随机的极限分布。
当有趣的是,当没有信号,样本协方差矩阵的特征值(如图2,由MP表示)是有限的,无论是否有噪音存在。
因此,Marchenko-Pastur定理,是在假设矩阵是“所有噪声”的假设下的一个理论预测。
也就是说,从这个特征值分布理论极限的偏差上可以显示出在无噪声的情况下的有关矩阵的信息。
在一信号是(H1)的情况下,矩阵Y可以改写为:其中s(i)和z k(i)=σn k(i)分别是在时刻i和基站k的独立的信号和噪声。
让我们用T表示矩阵:TT H有一个明显特征值λ1= |h i|2+ σ2,,其他所有的等于σ2,。
N1YY H的特征值与大数据量的人口模型样本协方差矩阵的特征值的研究有关[18]。
让我们在这项工作中定义信号信噪比(SNR)ρ :Baik等人最近的工作(文献[18][19])表明:当(这显然满足的假设,当取样数量N 足够高时),N 1YY H 的最大特征值几乎肯定收敛于:这在是优于b =σ2(1+ )2 H0情况下得到的。
因此,不论何时当矩阵N1YY H 特征值的分布不符合背离Marchenko-Pastur 定理(图3)时,探测器知道信号是否存在。
因此,可以使用这个有趣的特征感知频谱。
令λi 为N1YY H 特征值且G= [a ,b],协作感知算法的工作原理如下: A. 噪声分布未知,方差已知。
在这种情况下,用于以下准则:请注意,这种算法的改进(在非渐近情况下考虑出错概率)可以在文献[20]中找到。
这是在H0和H1的情况下,渐近最大的特征值分布的计算结果。
B. 两个噪声分布和方差未知。
请注意,在H0假设的情况下最大和最小特征值的比值不依赖于噪声方差。
因此,为了避免需要噪声的信息,用于以下准则:应该指出,在这种情况下,我们仍然需要较高的取样数量N ,使得条件 式(2)得到满足。
换句话说,取样数的平方与与信噪比的倒数成比例。
此外,请注意测试H1还提供一个很好的估计信噪比ρ。
事实上,N 1YY H 的最大的特征值(b')和最小(a )特征值的比仅与ρ和α有关:据我们所知,这SNR 估计从未在文献中提出。
四、性能分析前面的理论结果显示,我们可以只用取样的协方差矩阵的最大和最小特征值的比值就可以从噪声中区分出信号。
对于有限维数,这样的算法的操作区域仍然是一个问题,这与缩放因子的比例的渐近分布[20]有关。
这节通过分析各种大小不同的矩阵的之间N1YY H 的λmax 和λmin 的比值,说明了在这种情况下的一些特性。
图4和图5显示了在α=1 / 2和α= 1 / 10下,各种矩阵在纯噪声的情况下Y 的λmax/λmin 值。
从这些数字中,我们看到,即使矩阵较小,这两种情况下也可以提供一个很好的近似渐近比例。
如果有需要,例如,N = 100(K= 50,α= 1 / 2;K = 10,α= 1 /10),可以看出,在α=1 / 2和α= 1 / 10的情况下,模拟结果分别等于81%和83%的渐近。
正如预期的那样,对于一个较大的Y 矩阵,图中的比值接近相同的渐近值。
图6和图7显示了α=1 / 2和α= 1 / 10且信号加噪声的情况下,λmax/λmin 的取值。
在这两种情况下,σ2=1/ρ(-5分贝ρ)且 |h i|2=1(运行在表达式(2)的准则下)。
在纯信号的情况下,λmax/λmin=b'/a。
有趣的是,当N = 100(K= 50,α= 1 / 2;K = 10,α= 1 /10),可以看出,在α=1 / 2和α= 1 / 10的情况下,模拟结果分别等于70%和83%的渐近。
正如预期的那样,Y矩阵越大,图中的比值越接近渐近值。
N的一个很好的近似值可低至100。
五、结果基于文献[15][16],我们将随机矩阵探测器的方案和能量协作方案进行了模拟仿真,并对性能进行了对比。
能量探测器的框架在本文的第二部分提到过,用h(k) 瑞利多径衰落方差1/ K进行建模。
造成的差异被归一化,因为考虑到由于路径损耗的缘故,随着基站数量的增加,能量不会没有边界的无限增大。
共对十个二级基站进行了模拟。
基于投票方案,判定准则为以下几点:一是认为整体频谱占用情况判定需要由绝大多数的二级基站选择。
阈值V T为σ2(在噪声方差已知的情况下)。
对于随机矩阵理论为基础的方案,一个固定的总(K = 10)基站被采纳。