极小范数最小二乘解

合集下载

矩阵论导教导学导考(矩阵论西北工大学)

则 Tn = Tm O 是 n 阶 Give ns 矩阵 . ( ) O In - m
3. 设 A ∈ Rn× n 的特征值是λ1 ,λ2 , … ,λn , 且 AT = A. 若 B ∈ Rn× n
与 A 正交相抵, 则 B 的奇异值是(
).
4. 已知 A ∈ Cn×n 及 A+ , 设 B = A , 则 B+ =
2 8 3i
Байду номын сангаас
- 1) 的特征值,并在复平面上画图表示 .
10
1
六、( 12 分 ) 已知 A = 0 1 , b = 1 .
11
2
1. 求 A 的奇异值分解 .
2. 利用 A 的奇异值分解求 A+ .
3. 求方程组 Ax = b 的极小范数解或极小范数最小二乘解 x0 ( 指
出 x0 的类型 ).
七、( 12 分 ) 已知多项式空间 P2 [ t] 的一个基为
0 -1
21
X1 =
,
00
00 X2 =
21
2 -1
X3 =
,
00
00 X4 =
2 -1
T 在基 X1 , X2 , X3 , X4 下的矩阵为 Λ.
八、设 A = ( aij ) n× n , C = ( cij ) n× n , 且 ( y1 , … , yn ) = ( x1 , … , xn ) C,
附录试题精解
171
因为度量矩阵 A 可逆 , 所以 C = A- 1 . 因此 , 满足要求的基 y1 , … , yn 存在 , 且由 ( y1 , … , yn ) = ( x1 , … , xn ) A- 1 确定 .

关于矩阵方程组AX_C_XB_D的最小二乘解和极小范数最小二乘解_尤兴华

+
DB H ），
DB H ）．
H ） = R （ A ） = R （ Q1 ）， Q2 （ AH ） +
由于
H Q2 Q1 = O 且 R （（ A H ） +
= O，
因而根据引理 1 ． 4 ，有
{
H Q1 Y =
∫
+∞
0
H e －Λ2t ΛQ1 （ C + （ AH ）
+
DB H ） e －BB t dt，
H
从而（ 0 ． 1 ）的极小范数最小二乘解可以表示为 X =A+ 定理 2 ． 2
∫ ∫
0
e － AA t A（ A H C + DB H ） e － BB t dt + F A DB + ．
H
H
（ 0 ． 1 ）的最小二乘解的通解形式为
+∞ 0
X =A+ 这里矩阵 U∈C 证明
e － AA t A（ A H C + DB H ） e － BB t dt + F A DB + + F A UE B ，
第 28 卷第 4 期 2012 年 10 月
苏州大学学报（自然科学版） JOURNAL OF SOOCHOW UNIVERSITY（ NATURAL SCIENCE EDITION）
Vol. 28 No． 4 Oct． 2012
XB = D 的最小二乘解关于矩阵方程组 AX = C，和极小范数最小二乘解
ST ），
+ S = （ I － KK + ） QP + ．其中 K = Q（ I － P P ），［1 ］ B，引理 1 ． 4 对于矩阵 A，设其特征值分别为 λ i ∈λ （ A）， μ j ∈μ（ B）．如果特征值满足 Re（ λ i ） + Re（ μ j ）＜ 0 （ i = 1 ， 2， …， s； j = 1 ， 2， …， t），

解析线性方程组中的若干问题

解析线性方程组中的若干问题施妮沙【摘要】解线性方程组是线性代数课程的最重要内容之一,通过线性方程组的一般解析法对相容线性方程组进行了一般的介绍,用微积分方法给出不相容方程组的最小二乘解以及相容线性方程组极小范数解.循序渐进的对线性方程组的求解法进行了延伸.【期刊名称】《贵阳学院学报（自然科学版）》【年(卷),期】2013(008)001【总页数】3页(P28-29,33)【关键词】相容方程组;不相容方程组;极小范数解;最小二乘解【作者】施妮沙【作者单位】贵阳学院数学与信息科学学院,贵州贵阳550008【正文语种】中文【中图分类】O151线性代数是大学理、工、经济管理、医药、农业等学科必修的一门数学基础课，是除算术外，应用最为广泛的数学方法，它是从初等数学到高等数学学习的桥梁，对学生数学的学习起重要作用。

虽然这门课所安排的学时数不是太多，但其与微积分并驾齐驱的重要性已成为人们的共识。

线性代数在工农业生产实践中也有广泛应用，如钢板受力后的变形，大气的流场，都可以用若干个微分方程来描述。

通常对微分方程进行离散，得到线性方程组，再用数值方法求解。

在试验数据处理和曲线拟合问题中，在无法完全满足给定条件的情况下，求一个比较接近的解，最常用的方法是最小二乘法。

［1－3］通过介绍基础的线性方程组在求解中的如干问题，然后用微积分方法给出不相容方程组的最小二乘解，在介绍完以上两点后笔者再来讨论特殊情况下能否找到一组解向量使它在范数意义下长度是所有解向量中最短的，这就归结为求相容线性方程组的极小范数解。

在(*)式中系数矩阵、未知数向量和常数向量分别为:则方程组(*)也可表示为矩阵的形式:Ax= b (1)当向量b=0时线性方程组被称为齐次线性方程组，方程组(1)只有零解的充分必要条件是矩阵A的秩r(A)=R=n;有非零解的充分必要条件是矩阵A的秩r(A)=R＜n;其中n表示未知量个数，n－r是自由未知量个数。

特别地，当m=n(即方程个数与未知量个数相等)时，由Gramer［4］法则知(1)只有零解的充分必要条件为|A|≠0(r(A) =n)。

数值代数主要知识点

20世纪最好的十个算法( Computing in Science & Engineering 评选)1.1946.Los Alamos的Von Neumann,Stan Vlam,Nick Metropolis编的Metropolis算法,即Monte Carlo方法2.1947兰德公司的Grorge Dantzig创造的线性规划的单纯性算法3.1950.美国国家标准局数值分析所的Magnus Hestenes,Edward Stiefel, Cornelius Lanczos的Krylovz空间迭代法4.1951 橡树岭国家实验室的Alston Householder矩阵计算的分解方法5.1951 John Backus在IBM领导的小组研制的Fortron最优编译程序6.1959-61 伦敦的Ferranti Ltd的J.G.F.Francis的称为QR的算法的计算机本征值的稳定的算法7.1962London的Elliot Brothers Ltd的Tony Hoare提出的快速(按大小)分类法8.1965 IBM的Cooley与Princeton及Bell的Turkey的FFT算法9.1977 Brighham Young大学的Helaman Ferguson和Rodney Forcede的整数关系侦察算法10.1987 Yale的Leslie Greengard和Vladinimir Rokhlin发明的快速多级算法数值代数上课内容：一、预备知识（基础）1）误差分析2）范数理论3）初等变换与矩阵分解二、线性方程组的求解1）直接法2）迭代法3）最小二乘问题与矩阵广义逆三、矩阵特征值问题1）普通特征值问题a)幂法和反幂法b)QR方法2）对称特征值问题各部分的主要知识要点：（主要看上课笔记）一、预备知识（基础）§1 误差分析基本要求：1）了解数值代数的研究对象与特点及主要研究内容2）了解误差的基本知识及误差来源、误差种类3）了解浮点运算和舍入误差分析4）了解算法的评价及算法的向后稳定§2范数理论基本要求：1）熟练掌握向量范数的定义，会判断给定的某个函数是否是向量范数（范数的三个条件正定性、齐次性和三角不等式）2）了解常用向量范数、范数等价定理3）熟练掌握矩阵范数的定义，会判断给定的某个函数是否是矩阵范数（范数的三个条件正定性、齐次性和三角不等式）4）熟练掌握几个特殊的矩阵范数－算子范数、相容范数、酉不变范数的定义5）掌握常用矩阵范数1－范数，2－范数，－范数，F－范数的定义，并清楚且会证明它们分别属于算子范数、相容范数、酉不变范数的那一种范数6）会证明常用的范数不等式7）了解矩阵的谱和谱半径的定义二、初等变换与矩阵分解§1初等变换（主要看上课笔记）基本要求：1）了解初等变换的一般形式和一般初等变换的性质2）熟练掌握两种特殊的初等变换－Gauss消元变换、Household变换a)熟练掌握Gauss消元变换的定义和性质，特别是消元性质，会利用Gauss消元变换对向量进行消元b) 熟练掌握Householder变换/初等Hermit阵的定义和性质，特别是变换性质和消元性质，会利用Householder变换对向量进行消元，会求Householder变换矩阵3)熟练掌握Givens旋转变换的定义和性质，特别是消元性质即消元特点，会灵活运用Givens 旋转变换对向量进行消元（消调某一个变量）4）了解交换阵的定义即性质§2 矩阵分解1、基于Gauss消元阵的分解基于Gauss消元阵的分解，包括无主元LU分解、列主元LU分解、对称正定阵的Cholesky 分解基本要求：1）熟练掌握无主元LU分解的具体过程，会写出相应的程序，给定一个矩阵，会计算它的LU 分解矩阵2）了解LU 分解的不稳定性和LU 分解的唯一性及存在条件det()0(1,2,,).1n n k k n A R D A k n A L U A LU ⨯∈=≠== 若阶方阵的顺序主子式则可唯一地分解为一个单位下三角阵和非奇异的上三角阵的乘积。

矩阵论小结

矩阵论线性空间定义：本质是个集合，满足一定条件下的集合。

首先定义了加法运算（满足加法的交换结合律），在这个集合中能找到零元素，与负元素；然后定义数乘运算（数域上的元素与集合当中的元素相乘），并且满足数乘的分配，结合律（集合中的元素能否进行乘法运算并没有定义）。

最后指出，这些运算都是封闭的，运算的结果与集合中的元素唯一对应。

称这样的一个集合为线性空间。

注意：运算结果与集合中的元素对应。

例如0*a=0（此零非彼零，不是数域里的零，而是线性空间当中的零，即集合当中的零元素<很可能不是零>）核空间：矩阵A对应于齐次线性方程组Ax=0的解空间。

子空间：线性空间对应集合的一个子集，并且也满足线性空间的定义的一个子集。

其中，零空间，与线性空间本身构成平凡子空间，还存在的其他子空间构成非平凡子空间。

矩阵A的核空间就是他的一个子空间，相当于对矩阵A构成的空间中的元素进行了限定。

矩阵A的列向量的线性组合构成了矩阵A的值域空间（其中的基为最大无关组的个数）。

注意：子空间交，与子空间的和任然为子空间，但子空间的并集不一定再是子空间。

属于两个子空间的线性无关的两个基的并基构成新的元素，但是这个元素不在属于原来的两个子空间的任意一个。

子空间中的几个等价定义：（1）直和定义为V1与V2的交空间只包含零元素（不一定是数字零），构成零子空间（2）直和空间中的元素表达式唯一。

（3）V1的基于V2的基直接构成直和空间的基。

（4）和空间的维度等于V1与V2维度的和。

线性映射性质：（1）V1的零元素经过线性映射变为V2的零元素（2）线性相关组经过线性映射之后任然为线性相关（3）线性无关组经过单射线性映射后任然为线性无关同构：两个线性空间之间存在一个一一对应的线性变换，则称这两个矩阵是同构的。

相应的线性变换称为同构映射。

任一线性空间都能够找到一个数域向量与其同构，这个向量就是坐标。

线性变换T的秩，线性映射的坐标表示：T表示线性空间到线性空间的映射，在具体的基底下（两个线性空间基都确定的情况），可以由一个矩阵A表示T，为V到V‘的线性映射。

最小二乘法(least sqaure method)

最小二乘法（least sqauremethod）专栏文章汇总文章结构如下：1：最小二乘法的原理与要解决的问题2 ：最小二乘法的矩阵法解法3：最小二乘法的几何解释4：最小二乘法的局限性和适用场景5：案例python实现6：参考文献1：最小二乘法的原理与要解决的问题最小二乘法是由勒让德在19世纪发现的，形式如下式：标函数 = \sum（观测值-理论值）^2\\观测值就是我们的多组样本，理论值就是我们的假设拟合函数。

目标函数也就是在机器学习中常说的损失函数，我们的目标是得到使目标函数最小化时候的拟合函数的模型。

举一个最简单的线性回归的简单例子，比如我们有 m 个只有一个特征的样本： (x_i, y_i)(i=1, 2, 3...,m)样本采用一般的 h_{\theta}(x) 为 n 次的多项式拟合，h_{\theta}(x)=\theta_0+\theta_1x+\theta_2x^2+...\theta_nx^n,\theta(\theta_0,\theta_1,\theta_2,...,\theta_n) 为参数最小二乘法就是要找到一组\theta(\theta_0,\theta_1,\theta_2,...,\theta_n) 使得\sum_{i=1}^n(h_{\theta}(x_i)-y_i)^2 (残差平方和) 最小，即，求 min\sum_{i=1}^n(h_{\theta}(x_i)-y_i)^22 ：最小二乘法的矩阵法解法最小二乘法的代数法解法就是对 \theta_i 求偏导数，令偏导数为0，再解方程组，得到 \theta_i 。

矩阵法比代数法要简洁，下面主要讲解下矩阵法解法，这里用多元线性回归例子来描：假设函数h_{\theta}(x_1,x_2,...x_n)=\theta_0+\theta_1x_1+...+\t heta_nx_n 的矩阵表达方式为：h_{\theta}(\mathbf{x})=\mathbf{X}\theta\\其中，假设函数 h_{\theta}(\mathbf{x})=\mathbf{X}\theta 为 m\times1 的向量, \theta 为 n\times1 的向量，里面有 n 个代数法的模型参数。

最小二乘法

最小二乘法原理及极值点判定(2013-06-27 05:50:07)转载▼标签：最小二乘法极值分类：Tim赤子心最小二乘法的本质原理本文主要以最简单的二元线性函数为基础，阐述最小二乘法的原理，事实上，最小二乘法可以更广泛地应用于非线性方程中，但本文以介绍为主，希望能以最简单的形式，使读者能够掌握最小二乘法的意义。

在物理实验数据统计时，我们会记录一些数据，记做数据x和数据y。

但是，在记录数据后，我们依然不知道x和y 的具体关系。

例如，测算男人手掌面积和身高的关系，我们会得到两组数据，如图，图1数据点分布这并不是一条严格意义上的直线，但这些数据对于实验研究员来说，可以作为某种依据，从而判断出两种数据之间的关系。

根据两个量的许多组观测数据来确定它们的函数曲线，这就是实验数据处理中的曲线拟合问题。

事实上，我们更关注的是如何才能找到这么一条漂亮的曲线。

那么，找到这条曲线的方法称作“最小二乘法”。

曲线拟合中最基本和最常用的是直线拟合。

设x和y之间的函数关系由直线方程y=ax+b给出。

式中有两个待定参数，b代表截距，a代表斜率。

下面的问题在于，如何找到“最合适”的a和b使得尽可能多的数据落在或者更加靠近这条拟合出来的直线上。

即数据对这条直线的逼近程度最佳。

当然，当我们将直线拟合出来之后，就可以反过来进行预测了。

所以说最小二乘法是很有用的一种测算方法。

实际上，我们并不关心x和y到底是多少，因为x和y是给定的，当然x和y与其本质的内在关系之间肯定存在误差。

我们关心的是方程中的a和b，也就是说，在这个待定的方程中，a和b才是所求的变量，它们可以描述出x和y的关系。

所以我们接下来的任务就是找到一组最好的a和b。

我们对a和b的要求就是，使得所有x和y相对拟合直线的误差总和最小。

也就是说，我们要考虑的是，要使这些数据点距离拟合直线的和最小，距离最短，这样就可以使得尽可能多的数据成为有效点。

接下来我们的工作就是，最小化误差了。

Loewner方程组极小范数最小二乘解的快速算法

ｓｌｔｏｏｅｅｑｕｔｏｙｔｍｏｕｉｎｆｒＬｏｗｎｒｅａｉｎｓｓｅ
ＣＨＡＩｕ —ｅｇＴｎｆｎ，ＯＮＧＱｉ－ａＪｕｊｎｕ
（ｏｏｌｏｉｎｅ，ＸｉａｉｅｓｔｆＰｏｔａｄＴｅｅｏｍｕｉａｉｎ，Ｘｉａ０６ＳｈｏｆＳｃｅｃｓ ’ｎＵｎｖｒｉｙｏｓｎｌｃｍｎｃｔｏｓ ’ ｎ７１０２，Ｃｈｎ）ｉａ
文献Ｅｉ过单调矩阵函数的特征及有理插ｌ通值问题研究了各种Ｌｅｅ矩阵之间的关系；ｏｗｎｒ文
济与生物工程等领域中有着广泛的应用［。如在８］控制理论中，常利用最小二乘概念构造目标函数；
献［］２给出了Ｈｎｅ矩阵和Ｌｅｎｒ阵之问ａｋｌｏｗｅ矩
ｍｅｈｄｉ０（）Ｏ（０，ｗｈｌｈｍｏｎｆｃｍｐｔｔｎｆｒｔｅｃｎｔｕｔｎｏｈｏｍａｑａｔｏＳｍ＋）ｉｔｅａｕｔｏｕａｉｏｈｏｓｒｃｉｆｔｅｎｒｌｕ — ｅｏｏｏｅ
柴军锋，仝秋娟
（西安邮电学院学院，陕西西安７０６）１０２
摘
要：对于秩为的ｍ× 阶Ｌｅｅｏｗｎ矩阵，通过构造分块矩阵并研究其三角分解，进而得到了求线性方程
组的极小范数最小二乘解的快速算法，所需运算量为Ｏ（ｎ４Ｏ（算量为Ｏ（。）ｒ，＋Ｏ（。用正交化法虽然避免了构造法方程组，ｎｚｍ），但所需的运算量更大。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第十四讲矛盾方程（组）的解---最小二乘法
一、从实验数据处理谈起
设有一组实验数据(t 1，s 1)，(t 2，s 2)，……，(t n ，s n )，希望由实验数据拟合给定规律，从而测出待测量的有关参数。

假定规律为：2t c +1s=c ，由于存在误差i 2
t c (i 1,2,,n)≠+=i 1s c ，令
1121
22n n t 1s t 1c s A ,x ,b c t 1s ⎧⎫⎧⎫⎪⎪⎪⎪⎧⎫⎪⎪⎪⎪===⎨⎬⎨⎬⎨⎬⎩⎭⎪⎪⎪⎪
⎪⎪⎪⎪⎩⎭⎩⎭
，则：
Ax=b 实际无解，或者说矩阵方程Ax=b 成为矛盾方程（不自洽、非相容），虽说无解，但在物理上看，我们需要而且也理当有“解”。

怎么办？
一般处理是，定义一种目标函数，例如：
n
2
12i i 1i 2i i 1E(c ,c )w (s c t c )w 0==-->∑为加权系数
使误差12E(c ,c )最小化。

w i =1(i=1～n)时2
122E(c ,c )Ax b -＝
二、最小二乘法（解）
对于矛盾方程Ax=b ，最小二乘法是求其“解”的一种方法。

即求使2Ax b min -=的解。

t
s
引理：m n A C ⨯∈设,A{1,3}由如下方程的通解构成：
(1,3)(1,3)(1,3)n m AX AA A{1,3}{A (I A A)Z Z C }⨯=→=+-∈
其中，A (1,3)为A{1,3}中的某个矩阵。

证：1。

方程既然相容，设X 是其某个解，则
(1,3)H
(1,3)H
(1,3)
(i)
AXA AA A A X A{1}
(iii)(AX)(AA )AA
AX X A{3}
==→∈===→∈
即方程的解必在A{1,3}中。

2。

设X 为A 的一个{1,3}-逆矩阵，则 (
)()
()()()iii
H
H
(1,3)
(1,3)H
(1,3)
H
H
H
H (1,3)H
H
(1,3)(1,3)
AX AA
AX AA
AX A A X A A (AXA)AA AA
======
即，A 的{1,3}-逆矩阵必满足方程AX=AA (1,3)
{}
{
}
(1,3)(1,3)
(1,3)
n m
A{1,3}AX AA A
(I A
A)Z Z C
⨯∴==+-∈方程的所有解
＝
令(1,3)(1,3)X A I A A)Z ＝＋（－，则
(1,3)(1,3)(1,3)
(1,3)
(1,3)
H
(i)AX A AA A AZA AA AZA A X A{1}
(iii)AX AA
(A AA
A)Z A A
(AX)
X A{3}
=+-=∈=+-==∈
定理：矩阵方程Ax=b 的最小二乘解为 (1,3)x A b =，其中A (1,3)为A
的任何一个{1,3}-逆矩阵，反之，存在X ，对于任何m b C ∈均有Xb 成为Ax=b 的最小二乘解，则X A{1,3}∈。

证明：
R(A)R(A)R(A)R(A)R(A)R (A)Ax b (Ax P b)(P b b)
(Ax P b)R(A),(P b b)(I P )b P b R (A)
⊥⊥
-=-+--∈-=--=-∈
所以，2222
R(A)R(A)R(A)22
2
2Ax b Ax P b P b b b P b -=-+-≥-，故2
2Ax b -取得极小值的条件是x 为方程R(A)Ax P b = 的解。

任取一个(1,3)A A{1,3}∈，我们知道(1,3)R(A)AA P =。

而对于(1,3)x A b =，有(1,3)R(A)Ax AA b P b ==（但最小二乘解是否一定具有A (1,3)b 的形式呢？）
方程(1,3)Ax AA b =的通解为
{}
{}
(1,3)(1,3)(1,3)n
(1,3)(1,3)
(1,3)
n
x A AA b y A Ay y C y A b z
A
b (I A
A)z z C
=+-∈=+=+-∈
显然最小二乘解并不一定都具有A (1,3)b 的形式。

反之，若对于m (1,3)b C ,x Xb A b AA b ∀∈==R(A)均使x=P ，即
(1,3)(1,3)b,AXb AA b AX AA X A{1,3}∀=→=→∈有
推论：x 是方程Ax ＝b 的最小二乘解的充要条件是，x 为方程
H H A Ax A b =的解。

证：R(A)x Ax P b ⇔=为最小二乘解，而H R(A)N(A )b P b P b =+，故
H H H N(A )x Ax b P b N(A )A (Ax b)0
⇔-=-∈→-=为最小二乘解
最小二乘解一般不唯一。

三、极小范数最小二乘解
定理2 ：设m n m A C ,b C ⨯∈∈ ，则x ＝+A b 是方程Ax ＝b 的极小范数最小二乘解。

反之，若存在n m X C ⨯∈，若对于所有m b C ∈，x ＝Xb 均
成为方程Ax ＝b 的极小范数最小二乘解，则X ＝+A 。

证：最小二乘解满足Ax ＝AA (1,3)b ，其极小范数解唯一，且为
b A b AA A x +==)()3,1()4,1(，反之，m b C ,Xb ∀∈均成为唯一的极小范数最小二乘解b A +，所以：X ＝+A 。

定理3：矩阵方程AXB ＝D 的极小范数最小二乘解唯一，且为
++=DB A X
证明略.。