矩阵的物理意义

矩阵的物理意义
矩阵的物理意义

矩阵的物理意义

如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,这就带来了教学上的困难。”

* 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用?

* 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么?

* 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧合?* 矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的?* 对于矩阵转置运算AT,有(AB)T = BTAT,对于矩阵求逆运算A-1,有(AB)-1 = B-1A-1。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗?

* 为什么说P-1AP得到的矩阵与A矩阵“相似”?这里的“相似”是什么意思?

* 特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax =λx,一个诺大的矩阵的效应,竟然不过相当于一个小小的数λ,确实有点奇妙。但何至于用“特征”甚至“本征”来界定?它们刻划的究竟是什么?

今天先谈谈对线形空间和矩阵的几个核心概念的理解。首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始,一步步往上加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。

总之,空间有很多种。你要是去看某种空间的数学定义,大致都是“存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。这未免有点奇怪,为什么要用“空间”来称呼一些这样的集合呢?大家将会看到,其实这是很有道理的。

我们一般人最熟悉的空间,毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:1. 由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动,

事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。

因此只要知道,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动。下面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间是个空间,那么有两个最基本的问题必须首先得到解决,那就是:

1. 空间是一个对象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什么样的对象的集合?或者说,线性空间中的对象有什么共同点吗?

2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的?

我们先来回答第一个问题,回答这个问题的时候其实是不用拐弯抹角的,可以直截了当的给出答案。线性空间中的任何一个对象,通过选取基和坐标的办法,都可以表达为向量的形式。通常的向量空间我就不说了,举两个不那么平凡的例子:

L1. 最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空间中的每一个对象是一个多项式。如果我们以x0, x1, ..., xn为基,那么任何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分量ai其实就是多项式中x(i-1)项的系数。值得说明的是,基的选取有多种办法,只要所选取的那一组基线性无关就可以。这要用到后面提到的概念了,所以这里先不说,提一下而已。

L2. 闭区间[a, b]上的n阶连续可微函数的全体,构成一个线性空间。也就是说,这个线性空间的每一个对象是一个连续函数。对于其中任何一个连续函数,根据魏尔斯特拉斯定理,一定可以找到最高次项不大于n的多项式函数,使之与该连续函数的差为0,也就是说,完全相等。这样就把问题归结为L1了。后面就不用再重复了。

所以说,向量是很厉害的,只要你找到合适的基,用向量可以表示线性空间里任何一个对象。这里头大有文章,因为向量表面上只是一列数,但是其实由于它的有序性,所以除了这些数本身携带的信息之外,还可以在每个数的对应位置上携带信息。为什么在程序设计中数组最简单,却又威力无穷呢?根本原因就在于此。这是另一个问题了,这里就不说了。

下面来回答第二个问题,这个问题的回答会涉及到线性代数的一个最根本的问题。

线性空间中的运动,被称为线性变换。也就是说,你从线性空间中的一个点运动到任意的另外一个点,都可以通过一个线性变化来完成。那么,线性变换如何表示呢?很有意思,在线性空间中,当你选定一组基之后,不仅可以用一个向量来描述空间中的任何一个对象,而且可以用矩阵来描述该空间中的任何一个运动(变换)。而使某个对象发生对应运动的方法,就是用代表那个运动的矩阵,乘以代表那个对象的向量。

简而言之,在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的乘法施加运动。

是的,矩阵的本质是运动的描述。如果以后有人问你矩阵是什么,那么你就可以响亮地告诉他,矩阵的本质是运动的描述

可是多么有意思啊,向量本身不是也可以看成是n x 1矩阵吗?这实在是很奇妙,一个空间中的对象和运动竟然可以用相类同的方式表示。能说这是巧合吗?如果是巧合的话,那可真是幸运的巧合!可以说,线性代数中大多数奇妙的性质,均与这个巧合有直接的关系。“矩阵是运动的描述”,到现在为止,好像大家都还没什么意见。但是我相信早晚会有数学系出身的网友来拍板转。因为运动这个概念,在数学和物理里是跟微积分联系在一起的。我们学习微积分的时候,总会有人照本宣科地告诉你,初等数学是研究常量的数学,是研究静态的数学,高等数学是变量的数学,是研究运动的数学。大家口口相传,差不多人人都知道这句话。但是真知道这句话说的是什么意思的人,好像也不多。简而言之,在我们人类的经验里,运动是一个连续过程,从A点到B点,就算走得最快的光,也是需要一个时间来逐点地经过AB之间的路径,这就带来了连续性的概念。而连续这个事情,如果不定义极限的概念,根本就解释不了。古希腊人的数学非常强,但就是缺乏极限观念,所以解释不了运动,被芝诺的那些著名悖论(飞箭不动、飞毛腿阿喀琉斯跑不过乌龟等四个悖论)搞得死去活来。因为这篇文章不是讲微积分的,所以我就不多说了。有兴趣的读者可以去看看齐民友教授写的《重温微积分》。我就是读了这本书开头的部分,才明白“高等数学是研究运动的数学”这句话的道理。

不过在我这个《理解矩阵》的文章里,“运动”的概念不是微积分中的连续性的运动,而是瞬间发生的变化。比如这个时刻在A点,经过一个“运动”,一下子就“跃迁”到了B点,其中不需要经过A点与B点之间的任何一个点。这样的“运动”,或者说“跃迁”,是违反我们日常的经验的。不过了解一点量子物理常识的人,就会立刻指出,量子(例如电子)在不同的能量级轨道上跳跃,就是瞬间发生的,具有这样一种跃迁行为。所以说,自然界中并不是没有这种运动现象,只不过宏观上我们观察不到。但是不管怎么说,“运动”这个词用在这里,还是容易产生歧义的,说得更确切些,应该是“跃迁”。因此这句话可以改成:“矩阵是线性空间里跃迁的描述”。

可是这样说又太物理,也就是说太具体,而不够数学,也就是说不够抽象。因此我们最后换用一个正牌的数学术语——变换,来描述这个事情。这样一说,大家就应该明白了,所谓变换,其实就是空间里从一个点(元素/对象)到另一个点(元素/对象)的跃迁。比如说,拓扑变换,就是在拓扑空间里从一个点到另一个点的跃迁。再比如说,仿射变换,就是在仿射空间里从一个点到另一个点的跃迁。附带说一下,这个仿射空间跟向量空间是亲兄弟。做计算机图形学的朋友都知道,尽管描述一个三维对象只需要三维向量,但所有的计算机图形学变换矩阵都是4 x 4的。说其原因,很多书上都写着“为了使用中方便”,这在我看来简直就是企图蒙混过关。真正的原因,是因为在计算机图形学里应用的图形变换,实际上是在仿射空间而不是向量空间中进行的。想想看,在向量空间里相一个向量平行移动以后仍是相同的那个向量,而现实世界等长的两个平行线段当然不能被认为同一个东西,所以计算机图形学的生存空间实际上是仿射空间。而仿射变换的矩阵表示根本就是4 x 4的。又扯远了,有兴趣的读者可以去看《计算机图形学——几何工具算法详解》。

一旦我们理解了“变换”这个概念,矩阵的定义就变成:

“矩阵是线性空间里的变换的描述。”

到这里为止,我们终于得到了一个看上去比较数学的定义。不过还要多说几句。教材上一般是这么说的,在一个线性空间V里的一个线性变换T,当选定一组基之后,就可以表示为矩阵。因此我们还要说清楚到底什么是线性变换,什么是基,什么叫选定一组基。线性变换的定义是很简单的,设有一种变换T,使得对于线性空间V中间任何两个不相同的对象x和y,以及任意实数a和b,有:

T(ax + by) = aT(x) + bT(y),

那么就称T为线性变换。

定义都是这么写的,但是光看定义还得不到直觉的理解。线性变换究竟是一种什么样的变换?我们刚才说了,变换是从空间的一个点跃迁到另一个点,而线性变换,就是从一个线性空间V的某一个点跃迁到另一个线性空间W的另一个点的运动。这句话里蕴含着一层意思,就是说一个点不仅可以变换到同一个线性空间中的另一个点,而且可以变换到另一个线性空间中的另一个点去。不管你怎么变,只要变换前后都是线性空间中的对象,这个变换就一定是线性变换,也就一定可以用一个非奇异矩阵来描述。而你用一个非奇异矩阵去描述的一个变换,一定是一个线性变换。有的人可能要问,这里为什么要强调非奇异矩阵?所谓非奇异,只对方阵有意义,那么非方阵的情况怎么样?这个说起来就会比较冗长了,最后要把线性变换作为一种映射,并且讨论其映射性质,以及线性变换的核与像等概念才能彻底讲清楚。我觉得这个不算是重点,如果确实有时间的话,以后写一点。以下我们只探讨最常用、最有用的一种变换,就是在同一个线性空间之内的线性变换。也就是说,下面所说的矩阵,不作说明的话,就是方阵,而且是非奇异方阵。学习一门学问,最重要的是把握主干内容,迅速建立对于这门学问的整体概念,不必一开始就考虑所有的细枝末节和特殊情况,自乱阵脚。接着往下说,什么是基呢?这个问题在后面还要大讲一番,这里只要把基看成是线性空间里的坐标系就可以了。注意是坐标系,不是坐标值,这两者可是一个“对立矛盾统一体”。这样一来,“选定一组基”就是说在线性空间里选定一个坐标系。就这意思。

好,最后我们把矩阵的定义完善如下:

“矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。”

理解这句话的关键,在于把“线性变换”与“线性变换的一个描述”区别开。一个是那个对象,一个是对那个对象的表述。就好像我们熟悉的面向对象编程中,一个对象可以有多个引用,每个引用可以叫不同的名字,但都是指的同一个对象。如果还不形象,那就干脆来个很俗的类比。

比如有一头猪,你打算给它拍照片,只要你给照相机选定了一个镜头位置,那么就可以给这头猪拍一张照片。这个照片可以看成是这头猪的一个描述,但只是一个片面的的描述,因为换一个镜头位置给这头猪拍照,能得到一张不同的照片,也是这头猪的另一个片面的描述。所有这样照出来的照片都是这同一头猪的描述,但是又都不是这头猪本身。

同样的,对于一个线性变换,只要你选定一组基,那么就可以找到一个矩阵来描述这个线性

变换。换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变换的描述,但又都不是线性变换本身。

但是这样的话,问题就来了如果你给我两张猪的照片,我怎么知道这两张照片上的是同一头猪呢?同样的,你给我两个矩阵,我怎么知道这两个矩阵是描述的同一个线性变换呢?如果是同一个线性变换的不同的矩阵描述,那就是本家兄弟了,见面不认识,岂不成了笑话。好在,我们可以找到同一个线性变换的矩阵兄弟们的一个性质,那就是:

若矩阵A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关系:

A = P-1BP

线性代数稍微熟一点的读者一下就看出来,这就是相似矩阵的定义。没错,所谓相似矩阵,就是同一个线性变换的不同的描述矩阵。按照这个定义,同一头猪的不同角度的照片也可以成为相似照片。俗了一点,不过能让人明白。

而在上面式子里那个矩阵P,其实就是A矩阵所基于的基与B矩阵所基于的基这两组基之间的一个变换关系。关于这个结论,可以用一种非常直觉的方法来证明(而不是一般教科书上那种形式上的证明),如果有时间的话,我以后在blog里补充这个证明。

这个发现太重要了。原来一族相似矩阵都是同一个线性变换的描述啊!难怪这么重要!工科研究生课程中有矩阵论、矩阵分析等课程,其中讲了各种各样的相似变换,比如什么相似标准型,对角化之类的内容,都要求变换以后得到的那个矩阵与先前的那个矩阵式相似的,为什么这么要求?因为只有这样要求,才能保证变换前后的两个矩阵是描述同一个线性变换的。当然,同一个线性变换的不同矩阵描述,从实际运算性质来看并不是不分好环的。有些描述矩阵就比其他的矩阵性质好得多。这很容易理解,同一头猪的照片也有美丑之分嘛。所以矩阵的相似变换可以把一个比较丑的矩阵变成一个比较美的矩阵,而保证这两个矩阵都是描述了同一个线性变换。

这样一来,矩阵作为线性变换描述的一面,基本上说清楚了。但是,事情没有那么简单,或者说,线性代数还有比这更奇妙的性质,那就是,矩阵不仅可以作为线性变换的描述,而且可以作为一组基的描述。而作为变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也能够把线性空间中的一个坐标系(基)表换到另一个坐标系(基)去。而且,变换点与变换坐标系,具有异曲同工的效果。线性代数里最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代数里很多定理和规则会变得更加清晰、直觉。

首先来总结一下前面两部分的一些主要结论:

1. 首先有空间,空间可以容纳对象运动的。一种空间对应一类对象。

2. 有一种空间叫线性空间,线性空间是容纳向量对象运动的。

3. 运动是瞬时的,因此也被称为变换。

4. 矩阵是线性空间中运动(变换)的描述。

5. 矩阵与向量相乘,就是实施运动(变换)的过程。

6. 同一个变换,在不同的坐标系下表现为不同的矩阵,但是它们的本质是一样的,所以本征值相同。

下面让我们把视力集中到一点以改变我们以往看待矩阵的方式。我们知道,线性空间里的基本对象是向量,而向量是这么表示的:

[a1, a2, a3, ..., an]

矩阵呢?矩阵是这么表示的:

a11, a12, a13, ..., a1n

a21, a22, a23, ..., a2n

...

an1, an2, an3, ..., ann

不用太聪明,我们就能看出来,矩阵是一组向量组成的。特别的,n维线性空间里的方阵是由n个n维向量组成的。我们在这里只讨论这个n阶的、非奇异的方阵,如果一组向量是彼此线性无关的话,那么它们就可以成为度量这个线性空间的一组基,从而事实上成

为一个坐标系体系,其中每一个向量都躺在一根坐标轴上,并且成为那根坐标轴上的基本度量单位(长度1)。现在到了关键的一步。看上去矩阵就是由一组向量组成的,而且如果矩阵非奇异的话(我说了,只考虑这种情况),那么组成这个矩阵的那一组向量也就是线性无关的了,也就可以成为度量线性空间的一个坐标系。结论:矩阵描述了一个坐标系。之所以矩阵又是运动,又是坐标系,那是因为——“运动等价于坐标系变换”。对不起,这话其实不准确,我只是想让你印象深刻。准确的说法是:“对象的变换等价于坐标系的变换”。或者:“固定坐标系下一个对象的变换等价于固定对象所处的坐标系变换。”说白了就是:“运动是相对的。”

让我们想想,达成同一个变换的结果,比如把点(1, 1)变到点(2, 3)去,你可以有两种做法。第一,坐标系不动,点动,把(1, 1)点挪到(2, 3)去。第二,点不动,变坐标系,让x轴的度量(单位向量)变成原来的1/2,让y轴的度量(单位向量)变成原先的1/3,这样点还是那个点,可是点的坐标就变成(2, 3)了。方式不同,结果一样。从第一个方式来看,那就是我在《理解矩阵》1/2中说的,把矩阵看成是运动描述,矩阵与向量相乘就是使向量(点)运动的过程。在这个方式下,

Ma = b的意思是:

“向量a经过矩阵M所描述的变换,变成了向量b。”而从第二个方式来看,矩阵M 描述了一个坐标系,姑且也称之为M。那么:

Ma = b的意思是:

“有一个向量,它在坐标系M的度量下得到的度量结果向量为a,那么它在坐标系I 的度量下,这个向量的度量结果是b。”

这里的I是指单位矩阵,就是主对角线是1,其他为零的矩阵。而这两个方式本质上是等价的。我希望你务必理解这一点,因为这是本篇的关键。正因为是关键,所以我得再解释一下。在M为坐标系的意义下,如果把M放在一个向量a的前面,形成Ma的样式,我们可以认为这是对向量a的一个环境声明。它相当于是说:“注意了!这里有一个向量,它在坐标系M中度量,得到的度量结果可以表达为a。可是它在别的坐标系里度量的话,就会得到不同的结果。为了明确,我把M放在前面,让你明白,这是该向量在坐标系M中度量的结果。”那么我们再看孤零零的向量b:

b 多看几遍,你没看出来吗?它其实不是b,它是:

Ib

也就是说:“在单位坐标系,也就是我们通常说的直角坐标系I中,有一个向量,度量的结果是b。”

而Ma = Ib的意思就是说:

“在M坐标系里量出来的向量a,跟在I坐标系里量出来的向量b,其实根本就是一个向量啊!”这哪里是什么乘法计算,根本就是身份识别嘛。从这个意义上我们重新理解一下向量。向量这个东西客观存在,但是要把它表示出来,就要把它放在一个坐标系中去度量它,然后把度量的结果(向量在各个坐标轴上的投影值)按一定顺序列在一起,就成了我们平时所见的向量表示形式。你选择的坐标系(基)不同,得出来的向量的表示就不同。向量还是那个向量,选择的坐标系不同,其表示方式就不同。因此,按道理来说,每写出一个向量的表示,都应该声明一下这个表示是在哪个坐标系中度量出来的。表示的方式,就是Ma,也就是说,有一个向量,在M矩阵表示的坐标系中度量出来的结果为a。我们平时说一个向量是[2 3 5 7]T,隐含着是说,这个向量在I 坐标系中的度量结果是[2 3 5 7]T,因此,这个形式反而是一种简化了的特殊情况。

注意到,M矩阵表示出来的那个坐标系,由一组基组成,而那组基也是由向量组成的,同样存在这组向量是在哪个坐标系下度量而成的问题。也就是说,表述一个矩阵的一般方法,也应该要指明其所处的基准坐标系。所谓M,其实是IM,也就是说,M中那组基的度量是在I 坐标系中得出的。从这个视角来看,M×N也不是什么矩阵乘法了,而是声明了一个在M坐标系中量出的另一个坐标系N,其中M本身是在I坐标系中度量出来的。

回过头来说变换的问题。我刚才说,“固定坐标系下一个对象的变换等价于固定对象所处的

坐标系变换”,那个“固定对象”我们找到了,就是那个向量。但是坐标系的变换呢?我怎么没看见?

请看:

Ma = Ib

我现在要变M为I,怎么变?对了,再前面乘以个M-1,也就是M的逆矩阵。换句话说,你不是有一个坐标系M吗,现在我让它乘以个M-1,变成I,这样一来的话,原来M坐标系中的a在I中一量,就得到b了。

我建议你此时此刻拿起纸笔,画画图,求得对这件事情的理解。比如,你画一个坐标系,x 轴上的衡量单位是2,y轴上的衡量单位是3,在这样一个坐标系里,坐标为(1,1)的那一点,实际上就是笛卡尔坐标系里的点(2, 3)。而让它原形毕露的办法,就是把原来那个坐标系:

2 0

0 3

的x方向度量缩小为原来的1/2,而y方向度量缩小为原来的1/3,这样一来坐标系就变成单位坐标系I了。保持点不变,那个向量现在就变成了(2, 3)了。

怎么能够让“x方向度量缩小为原来的1/2,而y方向度量缩小为原来的1/3”呢?就是让原坐标系:

2 0

0 3

被矩阵:

1/2 0

0 1/3

左乘。而这个矩阵就是原矩阵的逆矩阵。

下面我们得出一个重要的结论:

“对坐标系施加变换的方法,就是让表示那个坐标系的矩阵与表示那个变化的矩阵相乘。”再一次的,矩阵的乘法变成了运动的施加。只不过,被施加运动的不再是向量,而是另一个坐标系。

如果你觉得你还搞得清楚,请再想一下刚才已经提到的结论,矩阵MxN,一方面表明坐标系N在运动M下的变换结果,另一方面,把M当成N的前缀,当成N的环境描述,那么就是说,在M坐标系度量下,有另一个坐标系N。这个坐标系N如果放在I坐标系中度量,其结果为坐标系MxN。

在这里,我实际上已经回答了一般人在学习线性代数是最困惑的一个问题,那就是为什么矩阵的乘法要规定成这样。简单地说,是因为:

1. 从变换的观点看,对坐标系N施加M变换,就是把组成坐标系N的每一个向量施加M 变换。

2. 从坐标系的观点看,在M坐标系中表现为N的另一个坐标系,这也归结为,对N坐标系基的每一个向量,把它在I坐标系中的坐标找出来,然后汇成一个新的矩阵。

3. 至于矩阵乘以向量为什么要那样规定,那是因为一个在M中度量为a的向量,如果想要恢复在I中的真像,就必须分别与M中的每一个向量进行内积运算。我把这个结论的推导留给感兴趣的朋友吧。应该说,其实到了这一步,已经很容易了。

综合以上1/2/3,矩阵的乘法就得那么规定,一切有根有据,绝不是哪个神经病胡思乱想出来的。

我已经无法说得更多了。矩阵又是坐标系,又是变换。到底是坐标系,还是变换,已经说不清楚了,运动与实体在这里统一了,物质与意识的界限已经消失了,一切归于无法言说,无法定义了。道可道,非常道,名可名,非常名。矩阵是在是不可道之道,不可名之名的东西。到了这个时候,我们不得不承认,我们伟大的线性代数课本上说的矩阵定义,是无比正确的:“矩阵就是由m行n列数放在一起组成的数学对象。”

好了,这基本上就是我想说的全部了。还留下一个行列式的问题。矩阵M的行列式实际上

是组成M的各个向量按照平行四边形法则搭成一个n维立方体的体积。对于这一点,我只能感叹于其精妙,却无法揭开其中奥秘了。也许我掌握的数学工具不够,我希望有人能够给我们大家讲解其中的道理了。

我不知道是否讲得足够清楚了,反正这一部分需要您花些功夫去推敲。

此外,请大家不必等待这个系列的后续部分。以我的工作情况而言,近期内很难保证继续投入脑力到这个领域中,尽管我仍然对此兴致浓厚。不过如果还有(四)的话,可能是一些站在应用层面的考虑,比如对计算机图形学相关算法的理解。但是我不承诺这些讨论近期内会出现了。

“分”的反义字是“和”,是我们熟悉的字。比如:2+3=5,从左往右运算,我们叫求和。那么“分”呢,既然是反义字,就把上面的等式反过来:5=2+3。

把一个对象表示成两个以至更多的对象的和,这个过程叫分析。

通常来说,分析对象应当与被分析对象一致。是数就都是数,是函数就都是函数,是向量就都是向量,是矩阵就都是矩阵。

求和是数学里最基本的运算,减、乘、除是从求和中衍生出来的。而更高级的幂、指、对、三角、微积分等,也是一层一层建立起来的,最根本的还是这个求和。求和最简单,最容易计算,性质也最简单。所以成了分析的基本出发点。

分析的妙处在于,通过分析可以将较复杂的对象划分为较简单的对象。比如2和3就比5

简单。单独研究2的性质,再单独研究3的性质,再通过简单的求和,就可以把握5的性质。把复杂的东西划分成若干简单对象的和,对各简单对象搞各个击破,再加起来,复杂的东西也就被掌握了。

分析是西方思想中一个根本性的东西。西方人认为,事物总是有因果的,看到了结果,要分析原因。所谓分析原因,就是找出一堆因素,说明这堆因素合起来导致了结果。西方人认为,事物总是可以分析的。看到了整体,就要把那些合成这个整体的局部一一分析出来。现代科学很大一部分就是这么回事。

大学数学里,有很多内容就是在讲分析。数学里的分析还要把含义拓展,就是把一个数学对象合理地表示成若干更简单对象与实数系数之积的和。但微积分和线性代数各有侧重。微积分研究的是无穷项求和。无穷项之和与有穷项之和是本质不同的。但是无穷项之和是无法运算的,至少不实际。所以要想办法通过一种办法用有穷项之和来近似的代替,这就是逼近。逼近成立的条件是收敛,就是说,只有从一个收敛的无穷项的开头截出一部分来求和,才能被认为是逼近。华人数学家项武义说,微积分就逼近这一板斧,但是无往而不利。

微积分主要研究函数,连续函数的因变量y会由于自变量x的变化而变化。这种变化也是要分析的。当x从 x0变成x1时,y是怎样从y0变到y1 的?按照上面的说法,“y的变化(y1-y0)”这一个数学对象,要用一系列比较简单的“变化”相加来表示。数学家找到了一个收敛的“变化”对象的序列,排在头一位的是一个线性的变化量,它的系数就是导数,它本身就是微分dy。数学家又发现,当x的变化量无穷小时,从这个无穷的、收敛的“变化”对象序列中,只要截出第一项,也就是微分dy,就无论如何可以精确描述y的变化了。曾在一本书上见过这样的说法,泰勒公式是数学分析的顶峰。不知道是不是有道理。我自己觉得是这么回事。有了泰勒公式,我们可以任意精确地算一个函数在某一点上的值。毕竟只是实数求和嘛。

但是为了表示泰勒公式,我们却用了一个挺复杂的连加代数式。代数式不能象实数那样简单加起来得到一个对象,它只能表示成和的形式。这是我们意识到,在这个连加式中各对象存在某些特别的不同,使它们没法简单地加到一起。因此我们有必要讨论,把一些性质不同的东西加到一起所形成的这个对象有什么性质。这就是向量。

微积分研究如何把一个对象分解为无穷项同质对象之和,线性代数研究“有限项异质对象之和”这个新对象的性质。一方面,上面说过,微积分到最后还是要化无穷为有穷,化精确为逼近;另一方面,异质对象经过某种处理可以转化为同质对象。比如不同次的幂函数是异质对象,但是一旦代入具体数值则都可以转化为实数,变成了同质对象。因此线性代数研究的问题对微积分很重要。故我认为大学里应先讲线性代数,后讲微积分。

我们的微积分教学,将重点过分倾注在微分和积分的运算上了,其实实践中更为重要的是我们称为“级数”的那部分内容。即研究如何将一个量表达为一个数项级数,如何将一个函数表达为一个函数项级数。

线性代数把异质对象之和(向量)作为研究的基础,研究这些新定义的对象加起来又可以表示什么。其结论是,有限数量的向量连加起来,有可能具有这样的能力,即同维的全部向量都可以表示成这些向量的和。这样的一组具有充分表现能力的向量,是线性无关的向量,组成了一个向量空间,而它们自己构成了这个向量空间里的一组基。

回到分析的概念上,一个向量总可以表示为若干个同阶向量之和,这就是向量的分析。但是并不是所有的这些分析都具有相同的价值。在某种运算中,某种特别的分析能够提供特别优越的性,从而大大简化运算。比如在大多数情况下,将一个向量表示成一组单位正交基向量的和,就能够在计算中获得特别的便利。面对某个问题,寻找一个最优越的分析形式,把要研究的对象合理地表示成具有特殊性质的基对象与实数系数之积的和,这是分析的重要步骤,也是成功的关键。在这种表示式中,系数称为坐标。

经典的方法都是以找到一组性质优良的基为开端的,例如:

傅立叶分析以正交函数系为基,因此具有优良性质,自1904年以来取代幂函数系,成为分析主流。

在曲线和曲面拟合中,正交多项式集构成了最佳基函数。拉格朗日插值多项式具有一个特别的性质,即在本结点上为1,在其他结点上为0。

有限元中的形函数类似拉氏插值多项式。

结构动力学中的主振型迭加法,也是以相互正交的主振型为基,对多质点体系位移进行分析的。

举两个例子:说到采样,大家的第一反应肯定是一个词“2倍”(采样定理)。学得比较扎实的,可能还会把为什么是2倍解释清楚。但我对采样的理解是:采样实际上是在进行正交分解,采样值不过是在一组正交基下分解的系数。如果原信号属于该组正交基所张成的线性子空间,那么该信号就能无失真的恢复(满足采样定理)。学过信号处理的朋友,你知道这组正交基是什么吗?:)第二个例子是关于为什么傅里叶变换在线性系统理论中如此重要?答

案可能五花八门,但我认为我的理解是比较深入的:原因是傅里叶基是所有线性时不变算子的特征向量(和本文联系起来了)。这句话解释起来比较费工夫,但是傅里叶变换能和特征向量联系起来,大家一定感觉很有趣吧。

特征向量确实有很明确的几何意义,矩阵(既然讨论特征向量的问题,当然是方阵,这里不讨论广义特征向量的概念,就是一般的特征向量)乘以一个向量的结果仍是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量,那么变换的效果是什么呢?这当然与方阵的构造有密切关系,比如可以取适当的二维方阵,使得这个变换的效果就是将平面上的二维向量逆时针旋转30度,这时我们可以问一个问题,有没有向量在这个变换下不改变方向呢?可以想一下,除了零向量,没有其他向量可以在平面上旋转30度而不改变方向的,所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能是零向量),所以一个变换的特征向量是这样一种向量,它经过这种特定的变换后保持方向不变,只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax=cx,你就恍

然大悟了,看到了吗?cx是方阵A对向量x进行变换后的结果,但显然cx和x的方向相同),而且x是特征向量的话,ax也是特征向量(a是标量且不为零),所以所谓的特征向量不是一个向量而是一个向量族,另外,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值不是那么重要,虽然我们求这两个量时先求出特征值,但特征向量才是更本质的东西!

比如平面上的一个变换,把一个向量关于横轴做镜像对称变换,即保持一个向量的横坐标不变,但纵坐标取相反数,把这个变换表示为矩阵就是[1 0;0 -1],其中分号表示换行,显然[1 0;0 -1]*[a b]'=[a -b]',其中上标'表示取转置,这正是我们想要的效果,那么现在可以猜一下了,这个矩阵的特征向量是什么?想想什么向量在这个变换下保持方向不变,显然,横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像对称变换,那镜子表面上(横轴上)的向量当然不会变化),所以可以直接猜测其特征向量是[a 0]'(a不为0),还有其他的吗?有,那就是纵轴上的向量,这时经过变换后,其方向反向,但仍在同一条轴上,所以也被认为是方向没有变化,所以[0 b]'(b不为0)也是其特征向量,去求求矩阵[1 0;0 -1]的特征向量就知道对不对了!

常用单元的刚度矩阵

r u r r u r =-+= πππεθ22)(2 由于各点在圆周方向上无位移,因而剪应变θr v 和r v θ均为 零。将应变写成向量的形式,则{}?? ?? ? ?????? ?????? ???????+??????=??????????????=r w z u z w r u r u rz z r γεεεεθ 根据上式,可推导出几何方程{}[]{})(e B ?ε= 其中几何矩阵[]????????? ?????????? ??= ij ji ki ik jk kj ji ik kj k j i ij kj jk z r z r z r r r r r z r N r z r N r z r N z z z B 000 0),(0),(0),(00021 3.弹性方程和弹性矩阵[D] 依照广义虎克定律,同样可以写出在轴对称中应力和应变之间的弹性方程,其形式为 [])(1 θσσσε+-= z r r u E [])(1 z r u E σσσεθθ+-= [])(1 θσσσε+-=r z z u E rz rz E r τμ)1(2+= 所以弹性方程为{}[]{}εσD = 式中应力矩阵{}{}T rz z r τσσσσθ=

弹性矩阵[]? ? ??????? ???? ?-----+=221000010101)21)(1(μμμμμμμμμμ μμE D 4.单元刚度矩阵[])(e k 与平面问题相同,仍用虚功原理来建立单元刚度矩阵,其积分式为 [][][][]dV B D B k V T e ?=)( 在柱面坐标系中,drdz dV π2= 将drdz dV π2=代入[][][][]dV B D B k V T e ?=)(,则[][][][]rdrdz B D B k T e ??=π2)( 即为轴对称问题求单元刚度矩阵的积分式。 与弹性力学平面问题的三角形单元不同,在轴对称问题中,几何矩阵[B]有的元素(如r z r N i ),(等)是坐标r 、z 的函 数,不是常量。因此,乘积[][][]B D B T 不能简单地从式 [][][][]rdrdz B D B k T e ??=π2)(的积分号中提出。如果对该乘积逐项求 积分,将是一个繁重的工作。一般采用近似的方法:用三角形形心的坐标值代替几何矩阵[B]的r 和z 的值。用[]B 表示在形心),(z r 处计算出的矩阵[B]。其中 3 ) (,3 ) (k j i k j i z z z z r r r r ++= ++= 只要单元尺寸不太大,经过这样处理引起的误差也不大。被积函数又成为常数,可以提出到积分号外面:

特征值分解与奇异值分解

特征值:一矩阵A作用与一向量a,结果只相当与该向量乘以一常数λ。即A*a=λa,则a 为该矩阵A的特征向量,λ为该矩阵A的特征值。 奇异值:设A为m*n阶矩阵,A H A的n个特征值的非负平方根叫作A的奇异值。记 (A) 为σ i 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。特征值和奇异值在大部分人的印象中,往往是停留在纯粹的数学计算中。而且线性代数或者矩阵论里面,也很少讲任何跟特征值与奇异值有关的应用背景。奇异值分解是一个有着很明显的物理意义的一种方法,它可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示,这些小矩阵描述的是矩阵的重要的特性。就像是描述一个人一样,给别人描述说这个人长得浓眉大眼,方脸,络腮胡,而且带个黑框的眼镜,这样寥寥的几个特征,就让别人脑海里面就有一个较为清楚的认识,实际上,人脸上的特征是有着无数种的,之所以能这么描述,是因为人天生就有着非常好的抽取重要特征的能力,让机器学会抽取重要的特征,SVD是一个重要的方法。 在机器学习领域,有相当多的应用与奇异值都可以扯上关系,比如做feature reduction的PCA,做数据压缩(以图像压缩为代表)的算法,还有做搜索引擎语义层次检索的LSI(Latent Semantic Indexing) 另外在这里抱怨一下,之前在百度里面搜索过SVD,出来的结果都是俄罗斯的一种狙击枪(AK47同时代的),是因为穿越火线这个游戏里面有一把狙击枪叫做 SVD,而在Google上面搜索的时候,出来的都是奇异值分解(英文资料为主)。想玩玩战争游戏,玩玩COD不是非常好吗,玩山寨的CS有神马意思啊。国内的网页中的话语权也被这些没有太多营养的帖子所占据。真心希望国内的气氛能够更浓一点,搞游戏的人真正是喜欢制作游戏,搞Data Mining的人是真正喜欢挖数据的,都不是仅仅为了混口饭吃,这样谈超越别人才有意义,中文文章中,能踏踏实实谈谈技术的太少了,改变这个状况,从我自己做起吧。 前面说了这么多,本文主要关注奇异值的一些特性,另外还会稍稍提及奇异值的计算,不过本文不准备在如何计算奇异值上展开太多。另外,本文里面有部分不算太深的线性代数的知识,如果完全忘记了线性代数,看本文可能会有些困难。 一、奇异值与特征值基础知识: 特征值分解和奇异值分解在机器学习领域都是属于满地可见的方法。两者有着很紧密的关系,我在接下来会谈到,特征值分解和奇异值分解的目的都是一样,就是提取出一个矩阵最重要的特征。先谈谈特征值分解吧:

结构力学思考题答案

1、结构的动力特性一般指什么? 答:结构的动力特性是指:频率(周期)、振型和阻尼。动力特性是结构固有的,这是因为它们是由体系的基本参数(质量、刚度)所确定的、表征结构动力响应特性的量。动力特性不同,在振动中的响应特点亦不同。 2、什么是阻尼、阻尼力,产生阻尼的原因一般有哪些?什么是等效粘滞阻尼? 答:振动过程的能量耗散称为阻尼。 产生阻尼的原因主要有:材料的内摩擦、构件间接触面的摩擦、介质的阻力等等。当然,也包括结构中安装的各种阻尼器、耗能器。 阻尼力是根据所假设的阻尼理论作用于质量上用于代替能量耗散的一种假想力。粘滞阻尼理论假定阻尼力与质量的速度成比例。 粘滞阻尼理论的优点是便于求解,但其缺点是与往往实际不符,为扬长避短,按能量等效原则将实际的阻尼耗能换算成粘滞阻尼理论的相关参数,这种阻尼假设称为等效粘滞阻尼。 3、采用集中质量法、广义位移法(坐标法)和有限元法都可使无限自由度体系简化为有限自由度体系,它们采用的手法有何不同? 答:集中质量法:将结构的分布质量按一定规则集中到结构的某个或某些位置上,认为其他地方没有质量。质量集中后,结构杆件仍具有可变形性质,称为“无重杆”。 广义坐标法:在数学中常采用级数展开法求解微分方程,在结构动力分析中,也可采用相同的方法求解,这就是广义坐标法的理论依据。所假设的形状曲线数目代表在这个理想化形式中所考虑的自由度个数。考虑了质点间均匀分布质量的影响(形状函数),一般来说,对于一个给定自由度数目的动力分析,用理想化的形状函数法比用集中质量法更为精确。 有限元法:有限元法可以看成是广义坐标法的一种特殊的应用。一般的广义坐标中,广义坐标是形函数的幅值,有时没有明确的物理意义,并且在广义坐标中,形状函数是针对整个结构定义的。而有限元法则采用具有明确物理意义的参数作为广义坐标,且形函数是定义在分片区域的。在有限元分析中,形函数被称为插值函数。 综上所述,有限元法综合了集中质量法和广义坐标法的特点: (l) 与广义坐标法相似,有限元法采用了形函数的概念。但不同于广义坐标法在整体结构上插值(即定义形函数),而是采用了分片的插值,因此形函数的表达式(形状)可以相对简单。 (2) 与集中质量法相比,有限元法中的广义坐标也采用了真实的物理量,具有直接、直观的优点,这与集中质量法相同。 4、直接动力平衡法中常用的有哪些具体方法?它们所建立的方程各代表什么条件? 答:常用方法有两种:刚度法和柔度法。刚度法方程代表的是体系在满足变形协调条件下所应满足的动平衡条件;而柔度法方程则代表体系在满足动平衡条件下所应满足的变形协调条件。 5、刚度法与柔度法所建立的体系运动方程间有何联系?各在什么情况下使用方便? 答:刚度法与柔度法建立的运动方程在所反映的各量值之间的关系上是完全一致的。由于刚度矩阵与柔度矩阵互逆,刚度法建立的运动方程可转化为柔度法建立的方程。一般来,对于单自由度体系,求[δ]和求[k]的难易程度是相同的,因为它们互为倒数,都可以用同一方法求得,不同的是一个已知力求位移,一个已知位移求力。对于多自由度体系,若是静定结构,一般情况下求柔度系数容易些,但对于超静定结构就要根据具体情况而定。若仅从建立运动方程来看,当刚度系数容易求时用刚度法,柔度系数容易求时用柔度法。 6、计重力与不计重力所得到的运动方程是一样的吗? 答:如果计与不计重力时都相对于无位移的位置来建立运动方程,则两者是不一样的。但如果计重力时相对静力平衡位置来建立运动方程,不计重力仍相对于无位移位置来建立,

理解矩阵,矩阵背后的现实意义

理解矩阵,矩阵背后的现实意义作者:郭博 这是很早以前已经看过的,最近无意中又把保存的文章翻岀来时,想起很多朋友问过矩阵,虽对 矩阵似懂非懂,但却很想弄懂它,希望这几篇文章能帮你一下,故转之: 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说, 在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍 逆序数这个前无古人,后无来者”的古怪概念,然后用逆序数给岀行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题一一把这行乘一个系数加到另一行上,再把那一列减过 来,折腾得那叫一个热闹,可就是压根看不岀这个东西有嘛用。大多数像我一样资质平庸的学生 到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太无厘头 了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰 回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的 岀场一一矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰 的一幕!自那以后,在几乎所有跟学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对 于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血 流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国外皆然。 瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:"如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”然而按照现行的国际标准,线性代 数是通过公理化来表述的,它是第二代数学模型,…,这就带来了教学上的困难。”事实上,当 我们开始学习线性代数的时候,不知不觉就进入了第二代数学模型”的畴当中,这意味着数学的 表述方式和抽象性有了一次全面的进化,对于从小一直在第一代数学模型”即以实用为导向的、 具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shif t,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研 和应用工作,但对于很多这门课程的初学者提岀的、看上去是很基础的问题却并不清楚。比如说: 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩 阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什 么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每 一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如 此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不

矩阵特征值、特征向量的研究【开题报告】

毕业论文开题报告 数学与应用数学 矩阵特征值、特征向量的研究 一、选题的背景、意义 (1)选题的背景、意义 “矩阵(Matrix)”术语是由西尔维斯特创用并由凯莱首先明确其概念的。19世纪50年代,西尔维斯特引入“矩阵”一词来表示“一项由几行H列元素组成的矩形阵列”或“各种行列式组”,凯莱作为矩阵理论的创立者,首先为简化记法引进矩阵,然后系统地阐述了矩阵的理论体系。随后,弗罗伯纽斯等人发展完善了矩阵的理论体系形成了矩阵的现代理论。然而,矩阵思想的萌芽由来已久,早在公元前l世纪中国的《九章算术》就已经用到类似于矩阵的名词。但那时矩阵仅是用来作为一种矩形阵列解决实际问题,并没有建立起独立完善的矩阵理论。18世纪末到19世纪中叶,这种排列形式在线性方程组和行列式计算中应用日益广泛,行列式等理论的发展提供了矩阵发展的条件,矩阵概念由此产生,矩阵理论得到系统的发展。20世纪初,无限矩阵理论得到进一步发展[]1。 线性代数(Linear Algebra)是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中[]2。 由于费马和笛卡儿的工作,线性代数基本上出现于十七世纪。直到十八世纪末,线性代数的领域还只限于平面与空间。十九世纪上半叶才完成了到n维向量

空间的过渡矩阵论始于凯莱,在十九世纪下半叶,因若当的工作而达到了它的顶点。1888年,皮亚诺以公理的方式定义了有限维或无限维向量空间。托普利茨将线性代数的主要定理推广到任意体上的最一般的向量空间中.线性映射的概念在大多数情况下能够摆脱矩阵计算而引导到固有的推理,即是说不依赖于基的选择。不用交换体而用未必交换之体或环作为算子之定义域,这就引向模的概念,这一概念很显著地推广了向量空间的理论和重新整理了十九世纪所研究过的情况。 “代数”这一个词在我国出现较晚,在清代时才传入中国,当时被人们译成“阿尔热巴拉”,直到1859年,清代著名的数学家、翻译家李善兰才将它翻译成为“代数学”,一直沿用至今[]3[]4。 线性代数是讨论矩阵理论、与矩阵结合的有限维向量空间及其线性变换理论的一门学科。 (2)国内外研究现状和发展趋势 主要理论成熟于十九世纪,而第一块基石(二、三元线性方程组的解法)则早在两千年前出现(见于我国古代数学名著《九章算术》)[]5。 ①线性代数在数学、力学、物理学和技术学科中有各种重要应用,因而它在各种代数分支中占居首要地位; ②在计算机广泛应用的今天,计算机图形学、计算机辅助设计、密码学、虚拟现实等技术无不以线性代数为其理论和算法基础的一部分; ③该学科所体现的几何观念与代数方法之间的联系,从具体概念抽象出来的公理化方法以及严谨的逻辑推证、巧妙的归纳综合等,对于强化人们的数学训练,增益科学智能是非常有用的; ④随着科学的发展,我们不仅要研究单个变量之间的关系,还要进一步研究多个变量之间的关系,各种实际问题在大多数情况下可以线性化,而由于计算机的发展,线性化了的问题又可以计算出来,线性代数正是解决这些问题的有力工具。 线性代数起源于对二维和三维直角坐标系的研究。在这里,一个向量是一个有方向的线段,由长度和方向同时表示。这样向量可以用来表示物理量,比如

矩阵的物理意义

矩阵的物理意义 如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,这就带来了教学上的困难。” * 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧合?* 矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的?* 对于矩阵转置运算AT,有(AB)T = BTAT,对于矩阵求逆运算A-1,有(AB)-1 = B-1A-1。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗? * 为什么说P-1AP得到的矩阵与A矩阵“相似”?这里的“相似”是什么意思? * 特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax =λx,一个诺大的矩阵的效应,竟然不过相当于一个小小的数λ,确实有点奇妙。但何至于用“特征”甚至“本征”来界定?它们刻划的究竟是什么? 今天先谈谈对线形空间和矩阵的几个核心概念的理解。首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始,一步步往上加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。 总之,空间有很多种。你要是去看某种空间的数学定义,大致都是“存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。这未免有点奇怪,为什么要用“空间”来称呼一些这样的集合呢?大家将会看到,其实这是很有道理的。 我们一般人最熟悉的空间,毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:1. 由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动, 事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。 因此只要知道,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动。下面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间是个空间,那么有两个最基本的问题必须首先得到解决,那就是: 1. 空间是一个对象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什么样的对象的集合?或者说,线性空间中的对象有什么共同点吗? 2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的?

读《理解矩阵》的一点心得及整理归类

线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没

矩阵特征值和特征向量的研究

矩阵特征值与特征向 量的研究

目录 一矩阵特征值与特征向量研究的背景及意义 (3) 二、特征值与特征向量的定义及其性质 (4) 2.1 定义 (4) 2.2 性质 (4) 三特征值及其特征向量的求法及其MATLAB的实现 (5) 3.1 QR方法 (5) 3.1.1 基本原理 (5) 3.1.2 具体实例 (5) 3.2 用多项式的方法来求解特征值 (10) 四特征值与特征向量的简单应用 (12) 五小结 (16)

一矩阵特征值与特征向量研究的背景及意义 矩阵的特征值与特征向量是高等代数的重要组成部分,通过对矩阵特征值与特征向量的性质介绍,以及对矩阵特征值与特征向量理论的分析,将特征值与特征向量应用于方程组的求解问题是高等代数中的重要内容。 随着社会到的进步,计算机的飞速发展,高等代数这门课程已经渗透到各行各业里面。在许多方面都有着很重要的应用。在多数高等代数教材中,特征值与特征向量描述为线性空间中线性变换A的特征值与特征向量。从理论上来讲只要求出线性变换A的特征值和特征向量就可以知道矩阵A的特征值和特征向量。因此求矩阵的特征值与特征向量就变得尤为重要的引入是为了研究线性空间中线性变换A的属性。 在物理,力学,工程技术中有很多问题在数学上都归结为求矩阵的特征值和特征向量的问题。现在教材中给出的求解特征值和特征性向量的方法基本上都是通过求解特方程来求解。有时候特征方程会极其的麻烦。有一些文章中虽然给了初等行列变换的方法来较少计算量,但是仍未摆脱参数行列式计算的问题。本文中我们将首先讲解有关特征值和特征向量的相关知识,另外介绍一些简单实用的方法来求解矩阵的特征值与特征向量。

结构力学概念题

概念题 1.1 结构动力计算与静力计算的主要区别是什么? 答:主要区别表现在: (1)在动力分析中要计入惯性力,静力分析中无惯性力; (2)在动力分析中,结构的内力、位移等是时间的函数,静力分析中则是不随时间变化的量; (3)动力分析方法常与荷载类型有关,而静力分析方法一般与荷载类型无关。 1.2 什么是动力自由度,确定体系动力自由度的目的是什么? 答:确定体系在振动过程中任一时刻体系全部质量位置或变形形态所需要的独立参数的个数,称为体系的动力自由度(质点处的基本位移未知量)。 确定动力自由度的目的是:(1) 根据自由度的数目确定所需建立的方程个数(运动方程数=自由度数),自由度不同所用的分析方法也不同;(2) 因为结构的动力响应(动力内力和动位移)与结构的动力特性有密切关系,而动力特性又与质量的可能位置有关。 1.3 结构动力自由度与体系几何分析中的自由度有何区别? 答:二者的区别是:几何组成分析中的自由度是确定刚体系位置所需独立参数的数目,分析的目的是要确定体系能否发生刚体运动。结构动力分析自由度是确定结构上各质量位置所需的独立参数数目,分析的目的是要确定结构振动形状。 1.4 结构的动力特性一般指什么? 答:结构的动力特性是指:频率(周期)、振型和阻尼。动力特性是结构固有的,这是因为它们是由体系的基本参数(质量、刚度)所确定的、表征结构动力响应特性的量。动力特性不同,在振动中的响应特点亦不同。 1.5 什么是阻尼、阻尼力,产生阻尼的原因一般有哪些?什么是等效粘滞阻尼?答:振动过程的能量耗散称为阻尼。 产生阻尼的原因主要有:材料的内摩擦、构件间接触面的摩擦、介质的阻力等等。当然,也包括结构中安装的各种阻尼器、耗能器。阻尼力是根据所假设的阻尼理论作用于质量上用于代替能量耗散的一种假想力。粘滞阻尼理论假定阻尼力与质量的速度成比例。粘滞阻尼理论的优点是便于求解,但其缺点是与往往实际不符,为扬长避短,按能量等效原则将实际的阻尼耗能换算成粘滞阻尼理论的相关参数,这种阻尼假设称为等效粘滞阻尼。 1.6 采用集中质量法、广义位移法(坐标法)和有限元法都可使无限自由度体系简化为有限自由度体系,它们采用的手法有何不同? 答:集中质量法:将结构的分布质量按一定规则集中到结构的某个或某些位置上,认为其他地方没有质量。质量集中后,结构杆件仍具有可变形性质,称为“无重杆”。 广义坐标法:在数学中常采用级数展开法求解微分方程,在结构动力分析中,也可采用相同的方法求解,这就是广义坐标法的理论依据。所假设的形状曲线数目代表在这个理想化形式中所考虑的自由度个数。考虑了质点间均匀分布质量的影

特征值和特征向量的几何意义是什么

特征值和特征向量的几何意义是什么? 特征向量的几何意义 特征向量确实有很明确的几何意义,矩阵(既然讨论特征向量的问题,当然是方阵,这里不讨论广义特征向量的概念,就是一般的特征向量)乘以一个向量的结果仍 是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量,那么变换的效果是什么呢?这当然与方阵的构造有密切关系,比如可 以取适当的二维方阵,使得这个变换的效果就是将平面上的二维向量逆时针旋转30度,这时我们可以问一个问题,有没有向量在这个变换下不改变方向呢?可以想 一下,除了零向量,没有其他向量可以在平面上旋转30度而不改变方向的,所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能 是零向量),所以一个变换的特征向量是这样一种向量,它经过这种特定的变换后保持方向不变,只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax= cx,你就恍然大悟了,看到了吗?cx 是方阵A 对向量x 进行变换后的结果,但显然cx 和x 的方向相同),而且x 是特征向量的话,ax 也是特征向量(a 是标 量且不为零),所以所谓的特征向量不是一个向量而是一个向量族, 另外,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值不是那么重要,虽然我们求这两个量时 先求出特征值,但特征向量才是更本质的东西! 比如平面上的一个变换,把一个向量关于横轴做镜像对称变换,即保持一个向量的横坐标不变,但纵坐标取相反数,把这个变换表示为矩阵就是 A=??? ? ??-1001 显然??? ? ??-=???? ?????? ??-b a b a 1001 这正是我们想要的效果,那么现在可以猜一下了,这个矩阵的特征向量是什么? 想想什么向量在这个变换下保持方向不变,显 然,横轴上的向量在这个变换下保持方向不变 (记住这个变换是镜像对称变换,那镜子表面上(横轴上)的向量当然不会变化) 所以可以直接猜测其特征向量是 )0( ,0≠??? ? ??a a 还有其他的吗?有,那就是纵轴上的向量,这时经过变换后,其方向反向,但仍在同一条轴上,所以也被认为是方向没有变化,所以 )0( ,0≠??? ? ??b b 也是其特征向量,去求求矩阵A 的特征向量就知道对不对了! (来自百度网站)

一般单元在局部坐标系下的单元刚度矩阵

9.3 一般单元在局部坐标系下的单元刚度矩阵 1.杆端内力与位移关系回顾 (轴向); ;(弯曲); 2.公式推导(图1) 图1 杆件性质:长度l,截面面积A,截面惯性矩I,弹性模量E;杆端位移u、v、θ。 (1) (2)列成矩阵形式:

(3) 即:(4)局部坐标系下单元刚度矩阵: (5) 9.4 梁单元 1.简支梁 简支梁单元见图1。 图1 说明:(a)梁单元通常忽略轴向变形;(b)图10-3中;相应的力分量也应该为零;(c)依据刚度矩阵的物理意义,可以由一般单元的刚度矩阵生成梁单元矩阵。即去掉位移分量为零 的相应行和列。

即:单元刚度方程:单元刚度矩阵: (1) 2.悬臂梁等 思考:建立图2的单元刚度矩阵:(固定端位移为零;自由端有转角和竖向位移) 图2 图a:图b: 3.桁架 仅有轴向位移 9.5 单元刚度系数的物理意义 1.单元刚度系数的意义 一般地,第j 个杆端位移分量取单位值1,其它杆端位移为0 时所引起的第i个杆端力分量的值。

例:的物理意义:当第3个杆端位移分量时引起的第5个杆端力分量。 对称性 (反力互等定理) 3.奇异性(,不存在逆矩阵) 根据式可由杆端位移求解杆端力,且是唯一解。但由杆端力求杆端位移,可能无解,如有解也是非唯一解。 说明:已知6个杆端力分量,(a)无法保证力状态的合法性——可能造成无解;(b)无法确定杆的支承条件——可能造成非唯一解。 9.6 单元坐标转换矩阵的物理意义 1.问题的提出 单元刚度矩阵——单根杆;多根根组成的复杂结构呢?(图1)

图1 分析(a)从数学的角度理解整体坐标系(xy)与局部坐标系()的区别; (b)力分量应向整体坐标系转换,图f给出了两种坐标系下力分量之间的数学关系: 。 同理: 2.公式推导 矩阵形式: (1)同理:(2)

浅谈矩阵的特征向量特征值的意义

浅谈矩阵的特征向量特征值的意义 描述了矩阵的特征向量和特征值的定义,简述了矩阵的特征向量特征值在数学、物理、信息和哲学上的一些意义,对于从多角度深入理解矩阵的特征向量特征值有积极意义。 标签:线性代数;矩阵;特征向量;特征值 1 线性变换与矩阵的特征向量特征值[1] 线性变换是指一个n维列向量被左乘一个n阶矩阵后得到另一个n维列向量,它是同维向量空间中的把一个向量线性映射成了另一个向量。即 Y=AX (Y,X∈Rn A=(aij)A=(aij)n×n) 如果对于数λ,存在一个n维零列向量X(即X∈Rn且X≠0),使得 AX=?姿X 则称数λ为矩阵A的一个特征值,X为矩阵A对应于λ的特征向量。 在线性代数中研究线性变换就是研究相应的矩阵A,矩阵A的特征向量和特征值是线性变换研究的重要内容。 2 在数学上的意义 矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。这里可以将特征值为负,特征向量旋转180度,也可看成方向不变,伸缩比为负值。所以特征向量也叫线性不变量。特征向量的不变性是他们变成了与其自身共线的向量,他们所在的直线在线性变换下保持不变;特征向量和他的变换后的向量们在同一根直线上,变换后的向量们或伸长或缩短,或反向伸长或反向缩短,甚至变成零向量(特征值为零时)[2]。 对对称矩阵而言,可以求得的特征向量是正交的,就是把矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。 例如,对于x,y平面上的一个点(x,y),我对它作线性变换A, 这个线性变换相当于关于横轴x做镜像。我们可以求出矩阵A的特征向量

第4章 多自由度系统的振动题解

62 习 题 4-1 在题3-10中,设m 1=m 2=m ,l 1=l 2=l ,k 1=k 2=0,求系统的固有频率和主振型。 解:由题3-10的结果 2 2121111)(l g m l g m m k k + ++ =,2 221l g m k - =, 2 212l g m k - =,2 2222l g m k k + = 代入m m m ==21,021==k k ,l l l ==21 可求出刚度矩阵K 和质量矩阵M ?? ? ? ??=m m M 0 0;?? ?? ? ???? ?- - =l mg l mg l mg l mg K 3 由频 02 =-M p K ,得 032 2 =????? ?? ?? ?-- --=mp l mg l mg l mg mp l mg B 0242 2 22 2 4 2=+ - ∴l g m p l g m p m l g p ) 22(1-= ∴ ,l g p ) 22(2+= 为求系统主振型,先求出adjB 的第一列 ???? ? ? ? ?? ?-=l mg mp l mg adjB 2 分别将频率值21p p 和代入,得系统的主振型矩阵为 ? ? ????-=112) 1(A ??????+=112) 2(A 题4-1图

63 4-2 题4-2图所示的均匀刚性杆质量为m 1,求系统的频率方程。 解:设杆的转角θ和物块位移x 为广义坐标。利用刚度影响系数法求刚度矩阵k 。 设0,1==x θ,画出受力图,并施加物体力偶与力 2111,k k ,由平衡条件得到, 2 22 111a k b k k +=, a k k 221-= 设1,0==x θ,画出受力图,并施加物体力偶与力2212,k k ,由平衡条件得到, 12k a k 2-=, a k k 222= 得作用力方程为 ?? ? ???=???????????? --++????????????? ?000031222222122 1x a k a k a k a k b k x m a m θθ 由频率方程02=-M K p ,得 031 2 22222 212 22 1=---- +p m a k a k a k p a m a k b k 4-3 题4-3图所示的系统中,两根长度为l 的均匀刚性杆的质量为m 1及m 2,求系统的刚度矩阵和柔度矩阵,并求出当m 1=m 2=m 和k 1=k 2=k 时系统的固有频率。 解:如图取21,θθ为广义坐标,分别画受力图。由动量矩定理得到, l l k l l k I 434343432 1 1 1 11θθθ+-= 2 2434343432 2 2 1 1 1 22l l k l l k l l k I θθθθ--= 整理得到, 016 916 922 1 12 1 11=-+θθθl k l k I 题4-3图 题4-2图

理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)

理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)来源:曾雅文的日志 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说: * 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本

矩阵特征值的意义

矩阵特征值的意义 数学里面的特征值和特征矩阵到底有什么用,它的物理意义在于什么 矩阵的特征值要想说清楚还要从线性变换入手,把一个矩阵当作一个线性变换在某一组基下的矩阵,最简单的线性变换就是数乘变换,求特征值的目的就是看看一个线性变换对一些非零向量的作用是否能够相当于一个数乘变换,特征值就是这个数乘变换的变换比,这样的一些非零向量就是特征向量,其实我们更关心的是特征向量,希望能把原先的线性空间分解成一些和特征向量相关的子空间的直和,这样我们的研究就可以分别限定在这些子空间上来进行,这和物理中在研究运动的时候将运动分解成水平方向和垂直方向的做法是一个道理! 特征值时针对方阵而言的。 两个向量只有维数相同时才能考虑相等的问题,才能有和、有差。 引入特征值与特征向量的概念 ? 引例 在一个n 输入n 输出的线性系统y=Ax 中,其中 ? 我们可发现系统A 对于某些输入x ,其输出y ? 恰巧是输入x 的 倍,即 ;对某些输入,其输出与输入就不存在这种按比例放大的关系。 ??????? ??=??????? ??=??????? ??=n n nn n n n n y y y y x x x x a a a a a a a a a A M M L L L L L L L 2121212222111211,,λx y λ=

? 例如,对系统 ,若输入 ? 则 ? ? 若输入 ,则 ? 所以,给定一个线性系统A ,到底对哪些输入,能使其输出按比例放大,放大倍数 等于多少这显然是控制论中感兴趣的问题。 基于此给出特征值与特征向量的概念: ? 定义 设A 是一个n 阶方阵,若存在着一个数 和一个非零n 维向量x ,使得 则称 是方阵A 的特征值,非零向量x 称为A 对应于特征值 的特征向量,或简称为A 的特征向量 ???? ??=4312A ? ?? ? ??=31x x Ax y 5315155314312=???? ??=???? ??=???? ?????? ??==???? ??=52x x Ax y λ≠???? ??=???? ?????? ??==269524312λx Ax λ=λλ

结构动力学复习 新

结构动力学与稳定复习 1.1 结构动力计算与静力计算的主要区别是什么? 答:主要区别表现在:(1) 在动力分析中要计入惯性力,静力分析中无惯性力; (2) 在动力分析中,结构的内力、位移等是时间的函数,静力分析中则是不随时间变化的量;(3) 动力分析方法常与荷载类型有关,而静力分析方法一般与荷载类型无关。 1.2 什么是动力自由度,确定体系动力自由度的目的是什么? 答:确定体系在振动过程中任一时刻体系全部质量位置或变形形态所需要的独立参数的个数,称为体系的动力自由度(质点处的基本位移未知量)。 确定动力自由度的目的是:(1) 根据自由度的数目确定所需建立的方程个数(运动方程数=自由度数),自由度不同所用的分析方法也不同;(2) 因为结构的动力响应(动力内力和动位移)与结构的动力特性有密切关系,而动力特性又与质量的可能位置有关。 1.3 结构动力自由度与体系几何分析中的自由度有何区别? 答:二者的区别是:几何组成分析中的自由度是确定刚体系位置所需独立参数的数目,分析的目的是要确定体系能否发生刚体运动。结构动力分析自由度是确定结构上各质量位置所需的独立参数数目,分析的目的是要确定结构振动形状。1.4 结构的动力特性一般指什么? 答:结构的动力特性是指:频率(周期)、振型和阻尼。动力特性是结构固有的,这是因为它们是由体系的基本参数(质量、刚度)所确定的、表征结构动力响应特性的量。动力特性不同,在振动中的响应特点亦不同。 1.5 什么是阻尼、阻尼力,产生阻尼的原因一般有哪些?什么是等效粘滞阻尼? 答:振动过程的能量耗散称为阻尼。 产生阻尼的原因主要有:材料的内摩擦、构件间接触面的摩擦、介质的阻力等等。当然,也包括结构中安装的各种阻尼器、耗能器。 阻尼力是根据所假设的阻尼理论作用于质量上用于代替能量耗散的一种假

新理解矩阵(1-6全)

新理解矩阵1 前边我承诺过会写一些关于自己对矩阵的理解。其实孟岩在《理解矩阵》这三篇文章中,已经用一种很直观的方法告诉了我们有关矩阵以及线性代数的一些性质和思想。而我对矩阵的理解,大多数也是来源于他的文章。当然,为了更好地理解线性代数,我还阅读了很多相关书籍,以求得到一种符合直觉的理解方式。孟岩的blog已经很久没有更新了,在此谨引用他的标题,来叙述我对矩阵的理解。 当然,我不打算追求那些空间、算子那些高抽象性的问题,我只是想发表一下自己对线性代数中一些常用工具的看法,比如说矩阵、行列式等。同时,文章命名为“理解矩阵”,也就是说这不是矩阵入门教程,而是与已经有一定的线性代数基础的读者一起探讨关于矩阵的其他理解方式,仅此而已。我估计基本上学过线性代数的读者都能够读懂这篇文章。 首先,我们不禁要追溯一个本源问题:矩阵是什么? 我们不妨回忆一下,矩阵是怎么产生的。矩阵可以看成是一个个向量的有序组合,这说明矩阵可以类比向量;但是向量又是怎么产生的?向量则是一个个数字的有序组合,这又把我们的研究方向指向了“数字是什么”这个问题上。比如,数字1是什么?它可以代表1米,可以代表1千克,也可以代表1分钟、1摄氏度甚至1个苹果。它为什么有这么多的表示意义?答案很简单,因为在本质上,它什么都不是,它就是数字1,一个记号,一个抽象的概念。正因为它抽象,它才可以被赋予各种各样直观的意义!回到矩阵本身,我们才会明白,矩阵的作用如此之大,就是因为书本上那个很枯燥的定义——矩阵就是m行n列的一个数表!它把矩阵抽象出来,让它得到了“进化”。它是一个更一般化的概念:一个向量可以看作一个矩阵,甚至一个数都可以看成一个矩阵,等等。 代数方面的理解 当然,上述说法是含糊的,我们还是需要确切知道它究竟有什么用?这可以从代数和几何的角度来分析,因为做到数形结合才是最完美的。首先我们知道数学最基本的元素就是数字,严格来说是自然数,如0,1,2,...;有了数字,我们就可以做到很多东西。但是数字是单一的,而我们很多时候都要批量处理一些类似的运算,比如同时要计算1+2,1+3,2+3,4+5这四个算式。不论是从记录还是从研究的角度来说,分开研究它们都是比较繁琐的。于是一种“批量”的记号产生了,我们记为(1,1,2,4)+(2,3,3,5),用两个不同记号记录它们,比如 A =(1,1,2,4), B =(2,3,3,5),我们就可以将它记为A +B 。这样不论在研究还是记录方面都能够给我们方便。于是一个我们称之为“向量”的东西产生了,也就是说,从代数的角度来讲,向量是为了研究批量运算而产生的。但是向量并没有解决所有的批量运算的问题。比如3元一次方程组 a11x1+a12x2+a13x3=b1 a21x1+a22x2+a23x3=b2

相关文档
最新文档