直和分解与秩的关系

合集下载

讨论Jordan标准形及其过渡矩阵的求法

讨论Jordan标准形及其过渡矩阵的求法

讨论Jordan 标准形及其过渡矩阵的求法摘要:本文较系统的总结了Jordan 标准形及其过渡矩阵的通用的求法。

关键字:Jordan 标准形,特征向量,过渡矩阵一、求解Jordan 标准形1、通过λ-矩阵求Jordan 标准形定义1:P 是一个数域,λ是一个文字,作多项式环[]P λ。

一个矩阵,若它的元素是λ的多项式,称其为λ-矩阵,用(),(),A B λλ 表示。

定义2:设λ-矩阵()A λ的秩为r ,对于正整数,1k k r ≤≤,()A λ中必有非零的k 级子式,()A λ中全部k 级子式的首相系数为1的最大公因式()k D λ称为()A λ的k 级行列式因子。

定义3:λ-矩阵的初等变换:(,)P i j 、(())P i c 、(,())P i j ϕ。

若()A λ经过有限次初等变换变为()B λ,称()A λ与()B λ等价。

在初等变换过程中,行列式因子是不变的,也就是说等价的λ-矩阵具有相同的行列式因子。

对任意一个非零的s n ⨯的λ-矩阵()A λ进行有限次适当的初等变换总能将其化为以下形式的λ-矩阵12()()()00r d d d λλλ⎛⎫ ⎪⎪⎪ ⎪⎪ ⎪ ⎪⎪ ⎪⎝⎭其中1,()(1,2,)i r d i r λ≥= 是首项系数为1的多项式,且1()()(1,2,1)i i d d i r λλ+=- 。

称其为()A λ的标准形。

依据以上论述可以求得:121()()()()(),()(1,2,)()i k k i i D D d d d d i r D λλλλλλλ-=== ,因此可以断定λ-矩阵的标准形是唯一的。

我们称标准形的主对角线上非零元素()i d λ为()A λ的不变因子;将不变因子分解成为互不相同的首项为1的一次因式方幂的乘积,所有这些一次因式方幂(相同的按出现的次数计算)称为()A λ的初等因子。

下面给出一个定理。

定理2:,A B 为数域P 上n 级矩阵,(),()A B λλ分别为,A B 的特征矩阵。

高等代数主要内容

高等代数主要内容

二、主要复习内容:1. 行列式行列式的定义、性质和常用计算方法(如:三角化法、加边法、降阶法、递推法、裂项法、范得蒙行列式法、数学归纳法、作辅助行列式法)。

重点:n阶行列式的计算。

2. 矩阵理论矩阵的运算,分块矩阵的初等变换与矩阵的秩,可逆矩阵与伴随矩阵,矩阵的三种等价关系(等价、合同、相似),矩阵的特征值和特征向量,矩阵的迹,矩阵的最小多项式,矩阵的对角化,矩阵的常用分解(如:等价分解,满秩分解,实对称矩阵的正交相似分解,实可逆阵的正交三角分解,Jordan分解),几种特殊矩阵的常用性质(如:准对角阵,对称阵与反对称阵,幂等阵,幂零阵,对合阵,正交阵)。

重点:利用分块矩阵的初等变换证明有关矩阵秩的等式与不等式,矩阵的逆与伴随矩阵的性质与求法,矩阵的三种等价关系的关系,矩阵对角化的判断(特别是多个矩阵的同时对角化问题)和证明,矩阵分解的证明及应用(特别是实对称矩阵的正交相似分解,Jordan 标准型的计算与有关证明)。

3. 线性方程组Cramer法则,齐次线性方程组有非零解的充要条件及基础解系的求法和有关证明,非齐次线性方程组的解法和解的结构。

重点:非齐次线性方程组解的结构与其导出组的基础解系的有关证明。

特殊方程组求解。

4.多项式理论多项式的整除,最大公因式与最小公倍式,多项式的互素,不可约多项式与因式分解,多项式函数与多项式的根。

重点:运用多项式理论证明有关问题,如多项式的互素和不可约多项式的性质的有关证明与应用;重要定理的证明,如因式分解唯一性定理,Eisenstein判别法,Gauss引理等,不可约多项式的证明。

5.二次型理论二次型线性空间与对称矩阵空间同构,化二次型为标准形和正规形,Sylvester惯性定律,正定、半正定、负定、半负定及不定二次型的定义和性质,正定矩阵的一些重要结论及其应用。

重点:正定和半正定矩阵的有关证明,n级方阵按合同关系的分类问题,实对称矩阵有关证明。

6. 线性空间与欧氏空间线性空间的定义,向量组的线性关系(线性相关与线性无关,向量组的等价,极大线性无关组的求法,替换定理),基与扩充基定理,维数公式,坐标变换,基变换与坐标变换,生成子空间,子空间的交与和(包括直和),内积和欧氏空间的定义及简单性质,子空间的正交补,度量矩阵与标准正交基的求法以及性质的证明和应用,线性空间的同构。

循环子空间的若干应用

循环子空间的若干应用

循环子空间的若干应用谢启鸿【摘要】从线性变换诱导的循环子空间出发,推导出了Cayley-Hamilton定理,并给出了循环子空间在相似标准形理论以及一些相关问题中的若干应用.【期刊名称】《大学数学》【年(卷),期】2016(032)001【总页数】6页(P1-6)【关键词】线性变换;不变子空间;循环子空间;Cayley-Hamilton定理;有理标准形;Jordan标准形【作者】谢启鸿【作者单位】复旦大学数学科学学院,上海200433【正文语种】中文【中图分类】O151.21设V是数域K上的n维线性空间,φ是V上的线性变换.对任意的非零向量α∈V,由α,φ(α),φ2(α),…张成的子空间C(φ,α)称为向量α关于线性变换φ的循环子空间,α称为循环子空间C(φ,α)的循环向量.由定义知道,C(φ,α)是φ的不变子空间,而且是包含向量α的最小不变子空间.讲授相似标准形理论的传统方法是λ-矩阵的方法,这种方法在证明有理标准形和Jordan标准形存在性的基础上,还能教会学生如何计算上述两种标准形,所以对初学者来说是一个较好的选择.而如果要用几何的方法建立相似标准形理论,那么循环子空间将在这一过程中起到举足轻重的作用.例如,由Cayley-Hamilton定理可以得到全空间关于根子空间的直和分解,而每一个根子空间又可以分解为若干个循环子空间的直和,由此即可推导出Jordan标准形的存在性(参考[2]的§7.2.10).虽然仍需要通过进一步的计算来确定Jordan标准形的形状,但循环子空间给予了Jordan标准形理论一个清晰的几何意义,让我们可以看清楚复杂问题的几何内涵.按照近世代数(模论)的观点来看,V是多项式环K[x]上的模,即对任意的多项式f(x)以及任意的向量α∈V,K[x]关于V的作用可定义为f(x)·α=f (φ)(α).由于K[x]是主理想整区,故由主理想整区上有限生成模的结构定理可得V的K[x]-循环子模的直和分解.注意到V的K[x]-循环子模均可写成K[x]·α的形式,其中α是V中的某个向量,根据模结构的定义,上述循环子模就是循环子空间C(φ,α).进一步,对应于V的K[x]-循环子模直和分解的不变因子组和初等因子组,可分别得到φ的有理标准形和Jordan标准形.因此,一个Frobenius块或一个Jordan块对应的子空间就是一个循环子空间.当然,即使不从较高的观点来建立相似标准形理论,一般的高等代数教材(例如[1])也都会引入循环子空间的概念并阐述其几何意义,但通常篇幅不会太长,也很少探讨它的相关应用等.在讲授完相似标准形理论后,作者在复旦大学数学科学学院本科生的高等代数习题课上引入了循环子空间的理论,阐述了它的几何意义,并且深入探讨了它在一些问题中的应用,得到了较好的教学效果.本文试将这些内容进行如下的总结.以下总是假设V是数域K上的n维线性空间,φ是V上的线性变换.我们先证明关于循环子空间的两个引理.引理1 设α是V中的非零向量,C(φ,α)是循环子空间.设di mC(φ,α)=m,则{α,φ(α),…,φm-1(α)}是C(φ,α)的一组基.证设于是α,φ(α),…,φk-1(α)线性无关,但α,φ(α),…,φk(α)线性相关,故φk(α)是α,φ(α),…,φk-1(α)的线性组合.进一步用数学归纳法容易证明:对任意的i≥k,φi(α)都是α,φ(α),…,φk-1(α)的线性组合.因此{α,φ(α),…,φk-1(α)}是C(φ,α)的一组基,从而m=dimC(φ,α)=k,结论得证.引理2 设α是V中的非零向量,使得V=C(φ,α)(此时V称为循环空间,α称为全空间的循环向量).设ψ是V上的另一线性变换且φψ=ψφ,则(i)ψ由它在循环向量α上的取值ψ(α)唯一确定;(ii)存在多项式g(x)∈K[x],使得ψ=g(φ).证(i)由引理1可知,{α,φ(α),…,φn-1(α)}是V的一组基.线性变换ψ由它在基向量上的取值唯一确定,又由φ,ψ的交换性可得ψ(φi(α))=φi(ψ(α))(0≤i≤n-1),因此ψ由ψ(α)唯一确定.(ii)设令则ψ(α)=g(φ)(α),即线性变换ψ,g(φ)在循环向量α上的取值相同.又ψ,g(φ)都与φ可交换,从而由(1)可得ψ=g(φ).先利用循环子空间来证明著名的Cayley-Hamilton定理.定理1 设是φ的特征多项式,则f(φ)=0.证任取非零向量α∈V,设dimC(φ,α)=m,则由引理1可知,{α,φ(α),…,φm-1(α)}是C(φ,α)的一组基.设,令则g(φ)(α)=0.容易验证φ限制在C(φ,α)上在基{α,φ(α),…,φm-1(α)}下的表示矩阵为多项式g(λ)的友阵将{α,φ(α),…,φm-1(α)}扩张为V的一组基,则φ在这组基下的表于是其中是K上的不可约多项式.证先证充分性.设f(λ)是K上的不可约多项式,则与定理1完全相同的证明可得f(λ)=g(λ)h(λ),从而只能是h(λ)=1,于是因此C(φ,α)=V对任意的非零向量α都成立..因此f(φ)(α)=h(φ)g(φ)(α)=0,再由α的任意性即得f(φ)=0.若V有一个非平凡的φ-不变子空间U,任取一个非零向量α∈U,则有C(φ,α)⊆U≠V.反之,若存在一个非零向量α∈V,使得C(φ,α)≠V,则C(φ,α)就是一个非平凡的φ-不变子空间.因此,V只有平凡的φ-不变子空间当且仅当对任意的非零向量α∈V,C(φ,α)=V都成立,即V的任一非零向量都是全空间的循环向量.利用循环子空间的理论,还能给出下列命题的一个简单证明.命题1 V只有平凡的φ-不变子空间当且仅当特征多项式再证必要性.设f(λ)在K上可约,即f(λ)=g(λ)h(λ),其中degg(λ)<n,degh(λ)<n,则由Cayley-Hamilton定理可得f(φ)=g(φ)h(φ)=0.注意到Kerg(φ)和Kerh(φ)不可能同时是零空间,否则g(φ)和h (φ)都是线性同构,这与g(φ)h(φ)=0相矛盾.因此Kerg(φ)和Kerh (φ)至少有一个非零,不妨设Kerg(φ)≠0.进一步可设其中m<n,再任取0≠α∈Kerg(φ),则有用数学归纳法容易证明:对任意的i≥m,φi(α)都是α,φ(α),…,φm-1(α)的线性组合,因此C(φ,α)的维数小于等于m,从而C(φ,α)≠V.设φ的不变因子组为1,…,1,d1(λ),…,dk(λ),其中di(λ)是K上的非常数首一多项式,且di(λ)|di+1(λ)(1≤i≤k-1),则由有理标准形理论可知,存在V的一组基{e1,e2,…,en},使得φ在这组基下的表示矩阵为其中F(di(λ))表示多项式di(λ)的友阵(形状见定理1的证明).例如,若设则有如下的关系图成立:这说明第一个Frobenius块F(d1(λ))对应的子空间L(e1,e2,…,em)就是由e1生成的循环子空间C(φ,e1).因此全空间V可以分解为若干个基向量生成的循环子空间的直和:我们来看一个特殊情形.若φ的不变因子组为1,…,1,f(λ),即极小多项式等于特征多项式f(λ),则φ的有理标准形只含一个Frobenius块F(f(λ)),此时V=C(φ,e1)就是一个循环空间.反之,若V=C(φ,α)是一个循环空间,则由引理1可知{α,φ(α),…,φn-1(α)}是V的一组基,仿照定理1的证明可得φ在这组基下的表示矩阵为F(f(λ)),其中f(λ)是φ的特征多项式,也是φ的极小多项式.利用上述一一对应可得如下两个有趣的推论.推论1 设A=F(f(λ))为n次首一多项式f(λ)的友阵,B为同阶方阵,若AB=BA,则存在次数小于n的多项式g(λ),使得B=g(A).证利用代数与几何之间的对应关系和引理2(2)即得结论.推论2 设V是数域K上的n维线性空间,φ是V上的线性变换,α1≠0,α2,…,αm是V中的向量,满足令若g(λ)在K上不可约,则α1,α2,…,αm线性无关.证显然,U=L(α1,α2,…,αm)=C(φ,α1)是V的循环子空间.记φ在U上的限制为φ1,则U=C(φ1,α1)也是一个循环空间.设φ1的特征多项式为h(λ),则h(λ)也是φ1的极小多项式.由假设可知g(φ1)(α1)=0,故由引理2(1)可得g(φ1)=0,再由极小多项式的基本性质可得h(λ)|g(λ).因为g(λ)在K上不可约,所以只能是h(λ)=g(λ),于是U的维数等于degh(λ)=degg(λ)=m,从而{α1,α2,…,αm}是U的一组基,故必线性无关.一个循环空间还可以分解为若干个循环子空间的直和,我们来看下面的命题.命题2 设V是数域K上的n维线性空间,φ是V上的线性变换,f(λ)是φ的特征多项式.设存在非零向量α∈V,使得V=C(φ,α)为循环空间,则以下结论等价:(i)f(λ)=P1(λ)m1…Pr(λ)mr,其中Pi(λ)(1≤i≤r)是数域K上互异的首一不可约多项式,mi(1≤i≤r)是正整数;(ii)r=max{s∈Z+|存在非零向量α1,…,αs∈V,使得证(i)由前面的讨论可知,存在非零向量α∈V,使得V=C(φ,α)当且仅当φ的不变因子组为1,…,1,f(λ).改写(ii)为:(ii)k=max{s∈Z+|存在非零向量α1,…,αs∈V,使得,只要证明:由(i)可推出k≥r;由(ii)可推出r≥k,于是有k=r,因此(i)与(ii)等价.假设(i)成立,因为初等因子组是相似关系下的全系不变量,故由[2]的例7.2可知,存在直和分解,使得的不变因子组为于是存在使得Vi从而因为k是这种分解的直和因子的最大个数,所以有k≥r.假设(ii)成立,设dimC(φ,αi)=ni,则由引理1可知,是C(φ,αi)的一组基.于是是V的一组基,φ在这组基下的表示矩阵为其中fi(λ)是φ限制在C(φ,αi)上的特征多项式,F(fi(λ))是fi(λ)的友阵.一方面考察特征多项式,有f(λ)=f1(λ)…fk(λ);另一方面考察极小多项式,由[1]的命题6.3.3可知,f(λ)是f1(λ),…,fk(λ)的最小公倍式,因此f1(λ),…,fk(λ)必两两互素,于是f(λ)的互异的首一不可约因式至少有k个,从而r≥k.设φ是n维复线性空间V上的线性变换,φ的初等因子组为,根据Jordan标准形理论,存在V的一组基{e1,e2,…,en},使得φ在这组基下的表示矩阵为Jordan标准型其中Jri(λi)是如下ri阶的Jordan块:例如,设则有如下的关系图成立:这说明第一个Jordan块Jr1(λ1)对应的子空间V1=L(e1,e2,…,er1)就是由er1生成的循环子空间C(φ1,er1).因此全空间V可以分解为若干个基向量生成的循环子空间的直和:注意到φi=φ|Vi-λiIVi,其中Vi是第i个Jordan块对应的子空间,因此上述循环子空间都是关于不同线性变换的循环子空间,而且每一个循环轨道(上述关系图)都是以零向量结尾,这些都是与有理标准形诱导的循环子空间直和分解不同的.下面利用Jordan块对应的循环子空间来给出两个有趣的应用.推论3 设A=Jn(λ0)是特征值为λ0的n阶Jordan块,B为同阶方阵,若AB=BA,则存在次数小于n的多项式g(λ),使得B=g(A).证用几何的语言来证明.设φ是n维复线性空间V上的线性变换,φ在V的一组基{e1,e2,…,en}下的表示矩阵是Jordan标准形Jn(λ0),ψ是另一线性变换且与φ可交换,令φ0=φ-λ0IV,则V=C(φ0,en)为循环空间且φ0ψ=ψφ0.由引理2(2)可知,存在次数小于n的多项式g0(λ),使得ψ=g0(φ0),令g(λ)=g0(λ-λ0),则ψ=g(φ).如果已知n阶方阵A的Jordan标准形为J=diag{Jr1(λ1),Jr2(λ2),…,Jrk(λk)},一个自然的问题是,对任意的正整数m,Am的Jordan标准型如何确定?要回答这个问题,只要对Jordan块Jn(λ0)来考虑即可.若λ0≠0,则通过Jordan标准形理论不难证明Jn(λ0)m的Jordan标准形是(参考[2]的例7.35);若要考虑Jn(0)m的Jordan标准形,如用代数的方法,则需要通过矩阵的秩与Jordan块个数的关系来得到结论(参考[2]的例7.33和例7.36).在这里我们将通过Jordan块对应的循环子空间来给出上述问题的几何解法.例1 求Jn(0)m(m≥1)的Jordan标准形.解若m≥n,则Jn(0)m=O.以下可设m<n,并作带余除法n=mq+r,其中0≤r<m.用几何的语言来考虑,设φ是n维复线性空间V上的线性变换,φ在V的一组基{e1,e2,…,en}下的表示矩阵是Jordan标准形Jn(0),则V =C(φ,en)为循环空间.由φm可诱导出如下的循环轨道:是K上的不可约多项式,用反证法来证明结论.若任取Im(φψ-ψφ)中的非零向量α,则Im(φψ-ψφ)=L(α).因为φ的特征多项式f(λ)在K上不可约,由命题1充分性的证明可得V=C(φ,α),再由引理1可知,{α,φ(α),…,φn-1(α)}是V的一组基.设线性变换φψ-ψφ在这组基下的表示矩阵为C=(cij),则由Im(φψ-ψφ)=L(α)可得cij=0对任意的i>1成立,于是一般地,对任意的k≥1,考虑线性变换(φψ-ψφ)φk-1在上述基下的表示矩阵,这是一个从第二行开始都为零且第(1,1)元素等于c1k的矩阵,于是从而C=O,即φψ-ψφ=0,这与r(φψ-ψφ)=1相矛盾.注意到命题1,推论2和例2中都有不可约多项式的条件,因此利用互素多项式的性质也可以给出上述题目的其他证明(推论2的另证可参考[2]的例5.76);另外,推论1和推论3也有代数的证明(可参考[2]的例7.22和例7.23).可能某些证明要比本文中的证明更简单,然而循环子空间的方法却给出了清晰的几何意义,让学生们能通过几何直观抓住问题的本质,从而加深对问题的理解,最终找到解决问题的有效途径.事实上,这也是复旦大学数学科学学院高等代数教学中的一条主线,即在要求学生熟练掌握代数方法的同时,也要求学生深入理解概念和定理的几何意义,强调代数与几何之间的相互转换和有机统一,而本文所阐述的循环子空间的若干应用正是从一个侧面反映了这种理念在高等代数教学中的实践.致谢在本文的撰写过程中,得到了复旦大学数学科学学院姚慕生教授、吴泉水教授、朱胜林教授的热心指导和大力斧正,在此谨表示衷心的感谢.由循环轨道与Jordan块之间的对应可知,只要将旧基{e1,e2,…,en}按照上述循环轨道进行重排,则φm在新基{er,…,en-m,en;…;e1,…,en -r+1-m,en-r+1;em,…,en-r-m,en-r;…;er+1,…,en-2 m +1,en-m+1}下的表示矩阵为diag{Jq+1(0),…,Jq+1(0),Jq (0),…,Jq(0)},其中有r个Jq+1(0),m-r个Jq(0).由Jordan 标准形的唯一性可知,这就是φm或Jn(0)m的Jordan标准形.最后,给出一个综合运用循环子空间理论的例题.例2 设A,B是数域K上的n阶方阵,且A的特征多项式f(λ)是K上的不可约多项式,证明:r(AB-BA)≠1.证换成几何的语言来证明,设V是数域K上的n维线性空间,φ,ψ是V上的线性变换,CLC Number:O29 Document Code:A Article ID:1672-1454(2016)01-0007-04Received date:2015-05-20Foundation item:National Science Foundation of China(11401534),(11226050)and(61272007)Low density parity check codes were firstly introduced by R.G.Gallager in 1962[1].These classes of codes can be defined by very sparse parity matrix.For their decoding performance are near to the Shannon limit[2-3],LDPC codes were investigated wildly.There are two classes of LDPC codes.If the parity check matrix has weight kin each row and weight l in each column exactly,the code can be called(k,l)-regular LDPC code and irregular otherwise.Two methods can be used to construct LDPC codes:random or pseudo-random ways and algebraic way.In general,irregular LDPC codes constructed by random or pseudo-random ways have been shown surpassing performance in AWGN channel than regular LDPC codes generated by algebraic way when the code has more long length.But these methods also face to its shortage.With losing of structure,the complexity will increase unavoidably both of encoding and decoding proceedings.So the requirement will be high both for hardware and software.LDPC codes can be formed from Reed-Solomon code[4],which is a typical block code.It is an useful way to construct LDPC codes from other good codes.A code is self-dual if the generator matrix of the code identifies its parity check matrix.It implies that the code has rate 1/2.In[5],an useful way to generate self-dual code fromq-ary circulant matrices based on orthogonal design has been introduced.In this paper,we will build binary LDPC code from the generator matrix of the q-ary self-dual code.Let GF(q)be a Galois field with qelements andαbe a primiti ve element of GF(q).If we denoteα-∞=0,then all elements of GF(q)can be presented asα0=1,α1,α2,…,αq-2,α-∞=0.We can make a one-one corresponding between elements of GF(q)and a subset of(q-1)-dimensional vector space Rq-1on real number field by a function Z.Definition 2.1 The functionis calledα-location vector function on GF(q),whereThe vector corresponding toαiis called the location vector[4]ofαi.Given a q-ary matrix,the function Zcan be generalized to deal with a matrix.Definition 2.2is called aα-location vector function of G.Given a q-ary circulant matrix A,if there exists a circulant matrix Bsuch thatthen a self-dual code can be generated by the following matrix[5]Based on the generator matrix of self-dual code,we can construct a LDPC code byα-location vector function.Proposition 2.1 Let Gbe a generator matrix of a q-ary self-dual code in the form of(a)and H arise fromby deleting its all-zero columns.Thenis a parity check matrices of a LDPC code.Obviously,I2nwill be remained,whendelete its all-zero columns.It implies that rows ofare linear independence and the number of columns ofis at mostHence the maximum rate of the codes isBut for the existence of all-zero columns in the second half of the matrix,the value of the maximum rate can hardly be achieved.Now we will calculate the length and rate of the code.Let a1,a2,…,ambe a sequence comes fromGF(q).The set Dis composed of all different nonzero elements of a1,a2,…,am.If wedenote the number of elements in Dby l(a1,a2,…,am),then Lemma 2.2 The number of all non-zero columns of(Z(a1)T,Z(a2)T,…,Z(am)T)Tis l(a1,a2,…,am).Proof Letαbe a primitive element in GF(q)and aibe a power ofα.If ai≠aj,then location vectors of aiand ajare distinct.So 1stays in different positions of their location vectors.If b∈GF(q)and b∉D,then the corresponding columns of b in(Z(a1)T,Z(a2)T,…,Z(am)T)Tare all zero.Otherwise,location vector of b appear and there is a 1in theright place.It implies that b∈D,contradictorily.The formulation of length Land rate Rof the code corresponding toisand then the rate of the code Ris are given by:Theorem 2.3 The length Lof the LDPC code corresponding towhere(α1,…,αn),(β1,…,βn)are first rows of Aand Brespectively.Proof Because Aand Bare all circulant,ATand-BTare circulant.Then all columns of Aand ATare composed of(α1,…,αn),all columns of Bare composed of(β1,…,βn)and all columns of-BTare composed of(-β1,…,-βn).We only need to observe first rows of(A,B)and(A,-B)respectively.By lemma 2.2,the conclusion is straightforward.The following corollary shows the region of R.Corollary 2.4Proof We consider two especial cases.Firstly,if A=Inand B=O,then the rate reach low bound.Secondly,if first rows of(A,B)and(A,-B)contain all q-1nonzeroelements of GF(q),then the rate can attain the upper boundAs an example,by computer searching,when n=4and q=11,we have Example 2.1 When is 60and the rate of the code is 0.8667.The code hasn’t the largest rate and the longest length in the situation that self-dual codes have length 16on GF(11).But if we ignore the identity matrix in the front ofthe length of the code corresponding to,the remain satisfy RC-constraint by computer testing.If the generator matrix of a code can be gained just by elementary transformation of rows and columns from another one’s,two codes are called equivalent.In general,self-dual codes with the same length are not unique under equivalence relationship.Suppose that there are Ninequivalent selfdual codes in the form of(a)with length n.We choose integer numbers s and t satisfying st≤N.Thenst inequivalent self-dual codes with length ncan be selected out for arranging a matrix G*with their generator matrices as G*′s elements.Now we replace everyαiby their location vectors and delete columns with all 0elements.We have a parity check matrix of LDPC codes.Proposition 2.5 Let Gij(i=1,…,s;j=1,…t)be generator matrices of self-dual codes in the form of(a),which are inequivalent each other.Denote G*=(Gij)s×t.Letis arisen fromZ(G*)by deleting its all-zero columns.Thenis parity check matrix for some LDPC code.•Based on self-dual codes with length 4n,we have the main method of constructing LDPC codes from theα-location vector function of generatormatrix of self-dual codes.•By considering the first row of generator matrix of the corresponding self -dual code,we investigate the length and the rate of LDPC code,and show the range of rates of this codes.•To expand the method,we consider all inequivalent self-dual codes with the same size as cells,constructing a more large matrix.The size of LDPC code can be more adaptable.•By computer searching,when n=4and q=11,the superior code with high rate have been found.The method shows a way to search codes with high rate and good algebraic structure.[1] Gallager RG.Low Density Parity Check Codes[M].Cambridge,MA:MIT Press,1963.[2] Shannon CE.A mathematical theory of communication[J].Bell systems Technology Journal,1948,27:379-423.[3] Chung S,Forney GD,Richardson JJ and Urbanke R.On the design of low-denisty parity-check codes within 0.0045 db of the Shannon limit[J].IEEE Commun.Lett.,2001,5:58-60.[4] Djurdjevic I,Xu J,Abdel-Ghaffar K and Lin S.A class of Low-density parity-check codes Constructed based on Reed-Solomon codes with two information symbols[J].IEEE Commun.Lett.,2003,7:317-319.[5] Koichi Betsumiya,Telio Georgiou,Aron Gulliver T,Masaaki Haradaand Christos Koukouvinos.On self-Dual Codes over Some Prime Fields [J].Discrete Math.,2003,262:37-58.【相关文献】[1]姚慕生,吴泉水,谢启鸿.高等代数学[M].3版.上海:复旦大学出版社,2014.[2]姚慕生,谢启鸿.高等代数(大学数学学习方法指导丛书)[M].3版.上海:复旦大学出版社,2015.。

第六章 线性空间

第六章 线性空间

第六章 线性空间一.内容概述(一) 基本概念⒈线性空间的定义-----两个集合要明确。

两种运算要封闭,八条公理要齐备。

V ,数域F V ∙V →V V ∈∀βα、 使V ∈+βα。

V F ⨯→V ∀k V ∈使k V ∈α。

满足下述八条公理:⑴αββα+=+; ⑵)()(γβαγβα++=++; ⑶对于,V ∈α都有αα=+0,零元素;⑷对于V ∈α,都有0=+βα,称β为α的负元素,记为α-; ⑸βαβαk k k +=+)(;⑹αααl k l k +=+)(;⑺)()(ααl k kl =; ⑻αα=1。

常用的线性空间介绍如下:(ⅰ)2V 、3V 分别表示二维,三维几何空间。

(ⅱ)nF 或nP 表示数域)(P F 上的n 维列向量构成的线性空间。

(ⅲ)[]x F 表示数域上全体多项式组成的线性空间。

[]x F n 表F 上次数不大于n 的多项式集合添上零多项式构成的线性空间。

(ⅳ)()F M n m ⨯表示数域F 上n m ⨯矩阵的集合构成的线性空间。

当n m =时,记为()F M n m ⨯。

(ⅴ)[]b a R ,表示在实闭区间[]b a ,上连续函数的集合组成的线性空间。

⒉基,维数和坐标------刻画线性空间的三个要素。

⑴基 线性空间()F V 的一个基指的是V 中一组向量{}n ααα,,21 满足(ⅰ)n ααα,,21 线性无关;(ⅱ)V 中每一向量都可由n ααα,,21 线性表出。

⑵维数 一个基所含向量的个数,称为维数。

记为V dim 。

⑶坐标 设n ααα,,21 为()F V n 的一个基。

()F V n ∈∀α有n n a a a αααα+++= 2211则称有序数组n a a a ,,21 为α关于基n ααα,,21 的坐标。

记为(n a a a ,,21 )。

⑷过渡矩阵 设()F V n 的二个基n ααα,,21 (ⅰ)n βββ ,,21(ⅱ)且∑==ni iij j a 1αβn j 2,1=则称n 阶矩阵。

6[1].7 子空间的直和

6[1].7  子空间的直和

1 - 1 = 0 , 2 - 2 = 0 , 即 1 = 1 , 2 = 2 .
这就是说,向量 的分解式是唯一的.
证毕
推论 和 V1 + V2 为直和的充分必要条件是
V1 ∩ V2 = { 0 } .
证明 先证充分性. 假设有等式
1 + 2 = 0,
那么
1 V1 , 2 V2 ,
是唯一的,这个和就称为直和. 记为 V1 V2 … Vs .
和两个子空间的直和一样,我们有
定理 4 设 V1 , V2 , … , Vs 都是线性空间 V
的子空间,则下面这些条件是等价的:
1) W Vi 是直和;
2) 零向量的表法唯一; 3) Vi
V
j i
j
{0}
(i 1,2,, s) ;
则 R 3 U W1 U W2 , 但 W1 W2
例 3 设 V = P 3,U = L(1 ), 1 = (1, 1, 1),
求 U 的补空间 W .
解 要求补空间 W,即要求 W 的一组基. 只需
把 U 的基扩充为 P 3 的基. 取
e1 = (1, 0, 0), e2 = ( 0, 1, 0),
② 分解式唯一的不是在任意两个子空间的和中 都成立. 例如,R3的子空间
V1 L( 1 , 2 ), V2 L( 2 , 3 ), V3 L( 3 )
这里, 1 (1,0,0), 2 (0,1,0), 3 (0,0,1)
在和 V1 V2 中,向量的分解式不唯一,如
而0有分解式 0= 0 0,
1 0, 2 0.
充分性.
设 V1 + V2 1 + 2 , 1 , 1 V1 , 2 , 2 V2.

矩阵论小结

矩阵论小结

矩阵论线性空间定义:本质是个集合,满足一定条件卜•的集合。

首先定义了加法运算(满足加法的交换结合律),在这个集合中能找到零元素,与负元素;然后定义数乘运算(数域上的元素与集合当中的元素相乘),并且满足数乘的分配,结合律(集合中的兀素能否进行乘法运算并没有定义)。

最后指出,这些运算都是封闭的,运算的结果与集合中的九素唯一对应。

称这样的一个集合为线性空间。

注总:运算结果与集介中的元素对应。

例如0*a=0 (此零非彼零,不是数域里的零,而是线性空间当中的零,即集合当中的零元素<很可能不是零〉)核空间:矩阵A对应于齐次线性方程组Ax=O的解空间。

子空间:线性空间对应集合的一个子集,并且也满足线性空间的定义的一个子集。

其中,冬空间,与线性空间本身构成平凡子空间,还存在的其他子空河构成非平凡子空间。

矩阵A的核空间就是他的•个子空间,相当于对矩阵A构成的空间中的尤素进行了限定。

矩阵A的列向量的线性组介构成了矩阵A的值域空间(其中的基为最人无关组的个数)。

注意:子空间交,与子空间的和任然为子空间,但子空间的并集不一定再是子空间。

属于两个子空间的线性无关的两个基的并基构成新的元素,但是这个元素不在属于原来的两个子空间的任意一个。

子空间中的几个等价定义:(1)直和定义为VI与V2的交空间只包含零元素(不一定是数字零),构成零子空间(2)直和空间中的元素表达式唯一。

(3)VI的基于V2的基直接构成直和空间的基。

(4)和空间的维度等于VI巧V2维度的和。

线性映射性质:(1)VI的零元素经过线性映射变为V2的零元素(2 )线性相关组经过线性映射之后任然为线性相关(3)线性无关组经过单射线性映射后任然为线性无关同构:两个线性空间之间存在一个一一对应的线性变换,则称这两个矩阵是同构的。

相应的线性变换称为同构映射。

任一线性空间都能够找到一个数域向量与其同构,这个向最就是坐标。

线性变换T的秩,线性映射的坐标表示:T表示线性空间到线性空间的映射,在貝体的基底下(两个线性空间基都确定的情况),可以由一个矩阵A表示T,为V到V '的线性映射。

线性变换的像与核对空间的直和分解

线性变换的像与核对空间的直和分解
可进 一 步 得 到 下 面 的
结论 。
推论 1 设 是 n维 线性 空 间 上 的一个 线
性变 换 , 且 = , 则 可逆 的充 要 条 件 是 o r - 为
恒 等变换 , 并且 V= I m 0k e r 。
证 取线性 空间 的一组基 1 , , …, I l f l  ̄ n , 并
c o nd i t i o ns f o r he t i d e mp o t e n t t r a ns f o m a r io t n nd a t he i de mp o t e n t r a n k ra t ns f o m a r io t n d i r e c t s u m d e c o mpo s i — t i o n or f f i n i t e i me d ns i o n o f l i n e r a s p a c e. An d he t di r e c t s u m d e c o mp o s i io t n i s in f a l l y e x t e n d e d t o ny a l i n e r a ra t ns f o m a r io t n. I t p r ov i d e s a bu n d nt a he t o r y t oo l s or f r e s e a r c h e s o f he t s e qu e s io t ns .
的维数的结论 , 但是 由此结论并不一定能得 到线 性空 间 就 等 于 像 与 核 的直 和 。如 果 o - 为幂 等
件; 汪 杏枝 - 2 对线 性 空 间上 两 个 线 性 变换 的像 与 核 之 间 的关 系进 行 了较 为详 细 的描述 ; 吴校 良 j 、 朱 一心 等 l 4 分别 对线 性变 换像 与核 之 间 的维 数关

矩阵的秩的一类新的证明方法

矩阵的秩的一类新的证明方法

矩阵的秩的一类新的证明方法唐睿;董晓亮;薛淑悦;朱乾宏【摘要】基于齐次线性方程组解的理论,利用集合的包含关系,给出了若干个关于矩阵的秩的不等式的新的证明方法.【期刊名称】《宁夏师范学院学报》【年(卷),期】2018(039)001【总页数】3页(P80-81,87)【关键词】矩阵的秩;齐次线性方程组;包含关系;直和【作者】唐睿;董晓亮;薛淑悦;朱乾宏【作者单位】北方民族大学数学与信息科学学院,宁夏银川750021;北方民族大学数学与信息科学学院,宁夏银川750021;北方民族大学数学与信息科学学院,宁夏银川750021;北方民族大学数学与信息科学学院,宁夏银川750021【正文语种】中文【中图分类】O221.2董晓亮,(1981-),男,甘肃静宁人,讲师,博士,硕士生导师.研究方向:最优化理论及方法.矩阵的秩作为高等代数中基本而重要的概念,体现了矩阵在初等变换下的不变量,刻画矩阵在运算前后的秩之间的变化关系.矩阵的秩的关系式内容丰富,其证明方法多样且有一定难度,一直是教学的重点和难点[1,2].教科书中对于矩阵中关于秩的关系式的证明多是考虑其列(或行)极大线性无关组,通过向量组的秩建立相应的关系式.本文中,尝试通过构造齐次线性方程组,利用直和分解和方程组的解空间等理论去证明秩的关系式.1 预备知识定义1[1] 设A∈Rs×n,矩阵的行秩和矩阵的列秩统称为矩阵A的秩;一个矩阵A 的秩为r的充分必要条件是矩阵A中有一个r阶子式不为零,而所有的r+1阶子式都为零.定义1分别从向量组的秩和矩阵中的行列式的关系刻画了矩阵的秩.对于一个实际问题而言,通常采取用初等变换法、子式法和求矩阵的列向量组或行向量组的极大无关组去求解矩阵的秩.定理1[1] 给定向量组η1,η2,…,ηt,其生成子空间L=L{η1,η2,…,ηt}.则子空间的维数和向量组的秩二者相等,即dim(L)=R{η1,η2,…,ηt}.对一个矩阵A而言,与A相关的有三个重要的线性空间,分别是A的行向量组和列向量组分别生成的子空间,以及将A看作是一个线性变换,该线性变换的核子空间.下面给出它们的定义.定义2[1] 设A∈Rs×n,由矩阵A的行向量组生成的子空间称为A的行空间;由矩阵A的列向量组生成的子空间称为A的列空间;以矩阵A为系数矩阵对应的齐次线性方程组的解集形成的子空间称方程组Ax=0的解空间(矩阵A的的零空间),记为ΩA={x|Ax=0}.定理2[1] 设V1,V2是有限维线性空间W的子空间,令W=V1+V2,则直和W=V1⊕V2成立与如下几个命题等价:①dim(W)=dim(V1)+dim(V2);②V1∩V2={0};③零元素的分解是唯一的,即0=01+02,0i∈Vi(i=1,2).定理3[1] 在齐次线性方程组AX=0有非零解的情况下,它的基础解系所含解的个数等于n-r,这里n是变量的个数,r=r(A).注1 设A∈Rs×n,以及η1,η2,…,ηs是A的s个行向量,齐次线性方程组AX=0对应了即A构成的行空间正交于解空间.换言之,A的行空间和方程组Ax=0的解空间构成直和Rn,即ΩA⊕A行空间=Rn,则由定理2知矩阵的秩+解空间的维数=n.这一点实际是定理3在空间分解上的关于维数公式的生动诠释.2 若干结论本节考虑基于齐次线性方程组解的理论,利用集合的包含关系,给出了若干个关于矩阵的秩的关系式的新的证明方法.命题1 R(AB)≤min{R(A),R(B)}.证明构造线性方程组BX=0和ABX=0,其中系数矩阵A∈Rm×s,B∈Rs×n.不妨设相应的解集为ΩB和ΩAB.容易知道,BX=0的任一解为ABX=0的解,从而ΩB⊆ΩAB,以及dim(ΩAB)≥dim(ΩB).另一方面,由注1可得如下关系式(1)则有R(AB)≤R(B).基于对称的思想,利用“转置运算不改变矩阵的秩”这一事实,可类似地构造方程组ATY=0,BTATY=0,并仿上证得R(BTAT)=R(AB)≤R(A).综上所述,R(AB)≤min{R(A),R(B)}.注2 系数矩阵的行空间与对应的齐次线性方程组的解空间形成了直和,从而“两个空间的和的维数等于各自维数的和”.既然ΩB⊆ΩAB,从而结论可以看作是“此增彼减”的反映.而矩阵中三秩合一,两个行空间的秩的大小关系就反映到矩阵的秩的大小变化关系.命题2 R(A)=R(AT)=R(AAT)=R(ATA).证明观察得到:构造线性方程组AX=0,两边左乘AT得ATAX=0,说明二者对应的解集存在ΩA⊆ΩATA.反之,如果ATAX=0,在ATAX=0两边左乘XT从而XTATAX=(AX)T(AX)=||AX||2=0,即AX=0,故ΩATA⊆ΩA.综上所述,两个方程组同解,结合注1知R(ATA)=R(A),类似地,可得到R(A)=R(AT)=R(ATA)=R(AAT).命题3 若AB=0,其中A∈Rm×s,B∈Rs×n则有R(A)+R(B)≤n.证明记则有设β1,β2,…,βn是方程组AX=0的解,而β1,β2,…,βn的生成子空间L{β1,β2,…,βn}⊆ΩA.由定理2可得:dim(ΩA)=n-R(A),R(B)≤dim(ΩA)=n-R(A).从而命题获证.命题4 若A∈Rm×n,B∈Rm×n,则有R(A+B)≤R([AT,BT]).证明构造线性方程组其中x∈Rn两边同时左乘[Im,Im],得到另一个齐次线性方程组则有Ω[AT,BT]≤ΩA+B.根据注1,则命题结论成立.3 结束语本文通过构造齐次线性方程组,利用解集的包含关系讨论了几类基本的秩的关系式.从中可以看出,通过矩阵A的行空间和方程组Ax=0解空间形成直和的实质可以更方便的得到矩阵的秩的变化关系,可以进一步理解和掌握其中矩阵的秩的相关结论的证明.参考文献:【相关文献】[1] 北京大学数学系几何与代数教研室代数小组.高等代数[M].北京: 北京大学出版社,2000:126-154.[2] 孟道骥.高等代数与解析几何[M].北京:科学出版社,1998:215-221.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

α = (g (ϕ )u (ϕ ) + h(ϕ )v(ϕ ) )α = u (ϕ ) g (ϕ )h(ϕ ) β 2 + v(ϕ )h(ϕ ) g (ϕ ) β1 = 0 ,
因此 Im g (ϕ ) ⊕ Im h(ϕ ) = V ,从而 r ( g (ϕ ) ) + r (h(ϕ ) ) = m 。
r ( A + B) ≤ r ( A) + r ( B) − r ( AB) 。

W , W1 , W2 分别表示 A + B, A, B 的列向量组生成的子空间,则 W ⊂ W1 + W2 ,故
r ( A + B) = dim W ≤ dim(W1 + W2 ) = dim W1 + dim W2 − dim W1 ∩ W2 , = r ( A) + r ( B) − dim W1 ∩ W2 .
Im g (ϕ ) + Im h(ϕ ) = V 是直和。 反过来, 当 r ( g (ϕ ) ) + r (h (ϕ )h(ϕ )α ∈ Im g (ϕ ) ∩ Im h(ϕ ) = 0 ,即 g (ϕ )h(ϕ ) = 0 。
例2
设 A, B 为数域 F 上 n 阶方阵, AB = BA 。证明:
证 由 V = V1 ⊕ V2 得 Im ϕ = ϕ (V1 ) + ϕ (V2 ) ,而 ϕ (V1 ) ∩ ϕ (V2 ) ⊂ V2 ∩ V1 = 0 ,故有
Im ϕ = ϕ (V1 ) ⊕ ϕ (V2 ) ,从而 rank (ϕ ) = dim V1 + dim V2 。
二、 不变子空间分解
以不变子空间来研究线性变换是一种常用的方法。 不变子空间的直和分解便于我们选择 适当的基,以简化线性变换的表示矩阵。运用到矩阵理论中,就是在相似的框架下将方阵化 为比较简单的形式,甚至为对角形。这种方法基于以下两个结论: 1.定理 设 ϕ 是 n 维线性空间 V 的线性变换, W 是 V 的 ϕ -不变子空间.取 W 的一组
g (λ )u (λ ) + h(λ )v(λ ) = 1 ,

g (ϕ )u (ϕ ) + h(ϕ )v(ϕ ) = id ,
因而 Im g (ϕ ) + Im h(ϕ ) = V 。 当 g (ϕ )h(ϕ ) = 0 时,对任意 α ∈ Im g (ϕ ) ∩ Im h(ϕ ) ,记 α = g (ϕ ) β 1 = h(ϕ ) β 2 ,则 有
基 ε 1 , ε 2 , ", ε r ,并将其扩展为 V 的一组基 e1 , e2 , ", er , er +1 , ", en ,那么 ϕ 在这组基下的 矩阵具有下列形状:
⎛ A1 ⎜ ⎜0 ⎝
A3 ⎞ ⎟. A2 ⎟ ⎠
在每个子空间 Vi 中 2.推论 1 若 V 可分解为 ϕ -不变子空间直和 V = V1 ⊕ V2 ⊕ " ⊕ Vs , 取基
空间分解
空间分解是认识空间关系的一种重要方法。 实现这种分解的方式多种多样, 而且每种分 解的目的也不尽相同。因此,在学习过程中,我们要注意训练两个方面能力:一是训练将基 本的代数关系转化为几何空间关系的能力(反之亦然) ;二是根据不同的解题要求,学会选 择适当的分解方式。 这些训练对于培养学生对空间关系的直觉、 养就整体把握和运用知识的 能力都有着重要的作用。
r ( AB) = dim U ≤ dim W1 ∩ W2 。
设 ϕ 是 数 域 F 上 n 维 线 性 空 间 V 的 线 性 变 换 , V1 , V2 是 V 的 子 空 间 且
例3
V = V1 ⊕ V2 。若 ϕ (V1 ) ⊂ V2 , ϕ (V2 ) ⊂ V1 ,则 rank (ϕ ) = dim V1 + dim V2 。
n
子空间直和 V = V1 ⊕ V2 ⊕ " ⊕ Vs ,则 A 相似于分块对角阵:
例1
设数域 F 上多项式 g (λ ), h(λ ) 互素, ϕ 是数域 F 上 n 维线性空间 V 的线性变 换。证明: g (ϕ ) h(ϕ ) = 0 ⇔ r ( g (ϕ ) ) + r (h(ϕ ) ) = m 。

因为 g (λ ), h(λ ) 互素,所以存在多项式 u (λ ), v (λ ) ,使
一、
直和分解、维数与秩
在解题中,除了要有空间关系的直觉外,更基本的是要学会直和分解的判定。一旦有了 空间的这种直和分解, 一个直接的几何观察就是子空间之间维数关系, 甚至是维数与线性变 换的秩之间的关系(参见维数公式 1,2) 。 1.直和的判定定理 设 V1 , V2 , " , Vs 是线性空间 V 的子空间,则下列命题等价: (1) V1 + V2 + " + Vs 是直和; (2)零向量的表示唯一; (3) Vi ∩ (V1 + " + Vi −1 + Vi +1 + " + Vs ) = {0} ; (4) dim(V1 + V2 + " + Vs ) = dim V1 + dim V2 + " + dim Vs 。 2.维数公式 1 设 V = V1 + V2 ,则 dim V = dim V1 + dim V2 − dim(V1 ∩ V2 ) 。 因此 dim V ≤ dim V1 + dim V2 ,等号成立当且仅当 V = V1 + V2 是直和。
仅需证明: r ( AB ) ≤ dim W1 ∩ W2 。这是因为 AB 的列向量组是 A 的列向量组的线性组合, 所以 U ⊂ W1 ,其中 U 表示 AB 的列向量组生成的子空间。而 AB = BA 表明 AB 的列向量 组 也 是 B 的 列 向 量 组 的 线 性 组 合 , 故 U ⊂ W2 , 所 以 U ⊂ W1 ∩ W2 , 于 是
ei1 , ei 2 ,", eini , i = 1,2,", s ,
并合并成为 V 的一组基 I .那么在这组基下, ϕ 的矩阵为分块对角阵:
⎛ A1 ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
A2
⎞ ⎟ ⎟ ⎟. % ⎟ As ⎟ ⎠
n
3.推论 2 设 A 是 n 阶矩阵, ϕ 为 V 上由 A 定义的线性变换。若 V 可分解为 ϕ -不变
相关文档
最新文档