最小二乘法对多变点检验的性能研究

最小二乘法对多变点检验的性能研究
最小二乘法对多变点检验的性能研究

第37卷 第6期2009年11月河南师范大学学报(自然科学版)J our nal of H enan N or mal Univer sity (N atur al Science ) Vol.37 N o.6 N ov.2009 文章编号:1000-2367(2009)06-0007-04

最小二乘法对多变点检验的性能研究

张学新1,段志霞2

(1.中南财经政法大学信息学院,武汉430060;2.济源职业技术学院基础部,河南济源459650)

摘 要:给出了衡量最小二乘法识别多变点能力的方法,模拟研究了最小二乘法对不同数据生成过程的多变

点检测效果,指出了最小二乘法的适用性,最后应用最小二乘法检测了中国主要经济部门的GDP 变点.

关键词:最小二乘法;多变点检验;单位根过程;蒙特卡罗模拟

中图分类号:C812文献标识码:A

数据生成过程的结构突变是指系统受到诸如金融危机,体制变化等剧烈的外力冲击而发生的突然变化,是系统对外界条件的光滑变化而做出的突然响应,常见的有均值突变,频率突变,趋势突变,方差突变.突变分析,尤其是带单位根过程的突变分析是国内外比较热门的课题,各种变点检验的方法也在不断涌现.目前的研究大多集中于前述常见类型的突变,国外见文献[1-6],国内主要是各种方法在气候,交通等领域的应用,见文献[7-9]等.其中有些统计方法是有缺陷的,如用滑动t ,滑动F 检测法检测均值突变时,经常会检测到一些虚假的突变点,主要问题是不能确定突变的研究通常涉及到的非独立随机变量的分布.最小二乘法也是处理变点问题中使用较多的一种方法,它以观察值与理论值之差的平方和作为目标函数,以其达到极小值之点作为有关参数的点估计,其优点是对随机误差的分布不需要作特定的假设.国内文献鲜见研究最小二乘法识别多变点的性能,国外至多用最小二乘法讨论了误差为线性过程时一个未知均值变点的估计问题(见前述文献中的JushanBai).本文通过模拟对最小二乘法识别多变点的性能做较为详尽的研究.

1 均值变点的最小二乘法估计

设离散的模型是X i =a i +e i ,

e i ~iid ,E(e i )=0,Var (e i )= 2,i =1, ,n,

a m j =a {m j +1= =a m j +1-1=

b j+1,j =0,1 ,q.

这里q 是事先给定的变点个数,可以取充分大以满足实际要求,或者通过其它方法粗略估计得到.1=m 0

q+1j=1!m j -1i=m j-1(x i -b j )2,极小化它,求出未知的m 1 ,m q ,b 1 ,b q+1的估计值.易见,当固定m 1, ,m q 时,上式在b j =X m j-1+X m j-1+1+ +X m j -1m j -m j-1时达到最小值,因此极小化目标函数T =T(m 1 ,m q )=!q+1

j=1!m j -1i=m j -1(x i -X m j-1+X m j -1+1+ +X m j -1m j -m j-1

)2即可.引理1 设两序列X m , ,X i-1与X i , ,X n 的算术平均数分别为 X i 1, X i 2,则当(i-m)?(n-i+1)最

大时,S i =!i-1

t=m (X t - X i 1)2+!n

t=i (X t - X i 2)2达到最小.

引理2 设序列X m , ,x n ,S i =

!i-1t=m (X t - X i 1)2+!n t=i (X t - X i 2)2,S *=min (S m+1, ,S n ),C =

收稿日期:2009-05-20作者简介:张学新(1966-),男,湖北宜城人,中南财经政法大学博士研究生,研究方向:概率论与数理统计方法应用.

S *(2ln ln (n -m +1)+ln ln ln (n -m +1)-ln ( )-2ln (-0.5ln (1- )))n -m +1-2ln ln (n -m +1)-ln ln ln (n -m +1)-2.4

,当S -S *>C 时,认为变点存在,且该检验有渐近水平 .

引理2由文献[10]推广得到,用它检验变点存在与否.一旦确认存在变点,则遵循以下步骤极小化目标函数[10]:

(1)取定一组初始值m 1, ,m q ,1=m 0

(2)在约束条件1

-1i=1(x i -X 1+ +X m 1-1m 1-1

)2+!m 2

-1i=m 1(x i -X m 1+ +X m 2-1m 2-m 1

)2达到最小,记所得的m 1为m #1;(3)在约束条件1

!m 2-1i=m #1(x i -X m #

1+ +X m 2-1m 2-m #1

)2+!m 3-1i=m 2(x i -X m 2+ +X m 3-1m 3-m 2

)2达到最小,记所得的m 2为m #2这样继续下去,得到一组新值m #1

q ;(4)把它们作为初始值回到第一步,继续下去得到一组新值m ##1

续这个过程,直到新值与上一次的值完全相同时为止,记最后所得的值为m ^1, ,m ^q ,它就是变点m 1, ,m q 的估计.此时T 的最小值记为T q =T(m ^1, ,m ^q ).

实际应用时变点个数q 是未知的,但总可取充分大的q 作为上限,再设定一个比1稍大的值比如1.1,找出使T k T q 1.1成立的最大的k,把它作为q 的估计.能用图像等方法预先设定更好.2 最小二乘法的性能比较研究

2.1 衡量最小二乘法检验性能的方法

统计假设检验时,由于样本的随机性,可能会犯两类错误,第二类错误是指当原假设H 0不真时,样本观测值没有落入拒绝域W ,从而没有拒绝原假设H 0.把不犯第二类错误的概率1-!称为检验的功效.在原假设(?没有变点%)H 0:b 1=b 2= =b q +1下,变点估计(m ^1, ,m ^q )的分布是什么,目前理论上尚无答案,也就

没有用精确的置信系数和置信区间估计来评价检验功效的办法.现引入欧氏距离d =&MM ^ &,其中

M(m 1, ,m q )是真实变点的位置,M ^(m ^1, ,m ^q )是它的估计值.显然d 越小越好.选取?,设定蒙特卡洛模拟次数N ,计算变点的估计落在区间d ?的次数N rec ,则最小二乘法的识别能力(性能)可定义为:Pow er =N rec N

.若取?=1,2,22,其含义分别是点M ^(m ^1,m ^2)与点M(m 1,m 2)的对应坐标,一个完全相同,另一个只相差1;两个各相差1,或一个相同,另个相差2;两个都相差2.这种误差,在应用上可以容忍.下面做模拟研究,为方便,考虑两个变点情形,多个变点情形完全类似.

2.2 不同数据生成过程的变点检验

为比较,设定所有模拟次数均为1000次,取3段数据个数各n =50,总个数n =150,真实变点设为M(51,101),当误差标准差为1时,跃度是0.1,意指约为误差标准差的35%.若非声明,以下所说的结果都指模拟结果,且是针对?=4(d 42)而言.

均值突变 数据生成过程是X i =a i +e i ,e i ~iid

U(-0.5,0.5),i =1,2,3,取a 1=0.1,a 2=0.2,a 3=0.3,结果只有4%,究其原因,是在每个变点处的跃度太小,数据近似平稳过程.但是使其他条件不变,只把每个变点处的跃度提高到约为误差标准差的70%,则结果提高到36%,假若跃度再提高到约为误差标准差的138%,则结果提高到87%.

类似的,取数据生成过程是X i =a i +e i ,e i ~iid N (0,1),i =1,2,3,仍然使每个变点处的跃度依次约为误差标准差的35%,70%,138%(a 1=0.1,a 2=1.485,a 3=2.87),则结果依次为不超过5%,提高到29%,提8河南师范大学学报(自然科学版) 2009年

高到88%以上.

可见,最小二乘法的检验功效与各个信噪比|a i+1-a i |

有很大关系,与误差项的分布关系不大;各个变点处的跃度越大,d 越小; 越小,d 越小,最小二乘法的性能越好.

方差突变 设数据生成过程是X i =a i +e i ,e 1~iid N (1,1),e 2~iid N (1,2),e 3~iid N (1,3),结果只有0.2%,

最小二乘法的性能较差.

不含时间趋势的截距突变的单位根过程 数据生成过程是y t =#0+y t-1+#1D U 1t +#2DU 2t +e t ,e t ~iid N (0, 2),其中D U 1t =I (t >T b 1),D U 2t =I (t >T b 2),分别代表在时点T b 1,T b 2均值(截距)发生突变,改变量分别是#1,#2.取#0=1, =1,每个变点处的跃度约为误差标准差的1.38倍(#1=1.485,#2=2.87),结果为0,究其原因,当数据生成过程为单位根过程时,用于检验的模型已不是均值突变模型,为此,应向均值突变模型转换,先对数据{X t }进行差分,然后再用最小二乘法检验,结果竟达到99%以上,两个估计点与真实位置的误差均不超过1(d 2)的结果亦达60%以上,这与前面的均值突变模型的检验结果较吻合.

含时间趋势的截距突变的单位根过程 数据生成过程是y t =#0+?0t+y t-1+#1DU 1t +#2DU 2t +e t ,

e t ~iid

N (0, 2),其中DU 1t =I (t >T b 1),DU 2t =I (t >T b 2)的含义同前.对此种模型的检验,先对差分序列作时间退势回归,再对残差作最小二乘检验.取#0=1, =1,?0=0.5,每个变点处的跃约为误差标准差的138%,结果几乎为0,究其原因,参数估计值^?0向右偏离真值较远(多数在0.54左右),当估计改进为^?0=0.52时,重新做上述模拟,结果改善到65%以上.

含时间趋势的截距和斜率双突变的单位根过程 数据生成过程是y t =#

0+?0t +y t-1+#1DU 1t +#2D U 2t +?1{DT 1t *+?

2{DT 2t *2+e t ,e t ~iid N (0, 2),其中DT 1*t =(t-T b 1)DU 1t ,{DT 2*

t =(t-T b 2)D U 2t ,分别代表伴随均值发生突变,在时点T b 1,T b 2上斜率也发生突变,改变量分别是?1,?2.若模型中e t 取成一般的ARM A (p ,q)过程,则意味着对趋势函数的冲击是渐进完成的,这可能更符合现实经济运行情况.若考虑加入!p

j =1c j %y t-j 又得如下模型,

y t =#0+?0t +y t-1+#1DU 1t +#2DU 2t +?1DT 1*t +?2{DT 2*t +!p

j=1c j %y t-j +e t ,各变量含义同前.

这两种模型的斜率随时间变化,不宜对时间作退势回归了.

结论 最小二乘法对均值变点模型较适用,运用于其他模型时须向此方面转化.

3 实 例

考虑对1952-2003年中国主要经济部门GDP 的变点检验.为真实可信,数据特别取自文献[11],各年GDP 的估计是农业,工业,建筑业,交通与通讯业,商业,非物质服务业的GDP 估计加总.

以{y t }表示GDP 序列,在作回归系数的显著性检验后常数项,时间趋势项均被剔除,再作单位根检验得AR (2)模型 %2

^y t =0.044y t-1-0.403%y t-1

(3.27)(-2.45)

R 2=0.175, AI C =24.88 SC =24.96 ADF =3.27 D.W =1.97,

或者y ^t =1.642y t-1-0.5974y t-2,括号()内是t 值,对应的概率P 值分别是0.0020,0.0181,所有信息表明模型拟合得较好,(在建模过程中发现中国GDP 过程是近似含时间趋势的两个单位根过程,y ^t =-1360.655t+1.603y t-1-0.525y t-2,时间变量t 值及对应的概率P 值分别是-1.654,0.105,t 的显著性检

验不能通过显得较为勉强,若原文的数据再长一些,结论应会改变).若直接对二阶差分序列{%2yt }作单位根

检验,ADF =-3.26,对应的P 值是0.0017,在1%的检显著性水平下,拒绝原假设,也得到{y t }含有两个

单位根的结论.用最小二乘法对{%2y t }变点检测:(任意)设想5年左右有一个变化,则52个数据至多有11断点,分别计算T i ,得(T 1,T 2, ,T 10,T 11)=(15.3,14.9,7.79,6.34,6.05,5.82,5.67,5.45,5.34,4.62,4.

42)?1010,取q 为使T k T 11

1.1成立的最大的k =9,得变点估计M ^(9,10,33,34,35,37,43,44,46),进一步确认,得M ^(9,33,35,37,44,46),对应的年份是1962,1986,1988,1990,1997,1999;若从{T k }下降的梯度何9第6期 张学新等:最小二乘法对多变点检验的性能研究

10河南师范大学学报(自然科学版) 2009年

时开始一直趋于平缓考察,则得到5个年份:1962,1964,1987,1990,1997,1999.

这两个检测结果与当年的经济实际运行情况非常吻合.查历史文献可知,1962年是?压缩支出,平衡预算,加强财政管理%年,是政府工作报告中提出?必须用几年的时间幅度调整国民经济%年;1964年则是农业学大寨,是大搞农田基本建设的一年;1987年是把农村改革引向深入,强调?深化企业改革,压缩过度膨胀的预算外投资规模和过高的非生产性投资%的一年,是进一步加快和深化改革的一年;1990年十三届七中全会召开,是?企业改革为重点%,加?积极稳妥地推进粮食流通体制的改革%的一年;1997年则是?农业和农村工作要着力做好八个方面的工作%的一年,是提出%三个有利于%的所有制形式,?调整和完善所有制结构,进一步解放和发展生产力%的一年,是以?国有企业改革为经济体制改革的重点%的一年;1999年则是亚洲金融危机影响扩散的一年,也是中央加快中西部地区发展的一年.

参 考 文 献

[1] Bai J.Least squares estimation of a shift in lin ear p roces ses[J].Journal of Tim e Series Analysis,1994,15:453-472.

[2] Per ron P.T es tin g for a U nit Root in a Time Series w ith a Changing M ean[J].J ournal of Busin ess an d Economic Statistics,1990,8:

153-162.

[3] LanneLann e M,L tkep oh l H,Saikk on en https://www.360docs.net/doc/3d4218726.html, paris on of unit r oot tests for time s eries w ith level s hifts[J].J ou rnal of Tim e S eries A!

nalysis,2002,23:667-685.

[4] Saikk on en P,L tk epohl H.T esting for a un it root in a tim e s eries w ith a level s hift at un know n time[J].Econometric T heory,2002,18:

313-348.

[5] Lavielle M,M ou lines E.Least!squares estimation of an u nknow n numb er of shifts in a time s eries[J].Journal of Time Series Analysis,

2000,21:33-59.

[6] Clemen te J,M onta s A,Reyes M.Testing for a unit root in variables w ith a double change in th e mean[J].Economics Letters,1998,

59:175-182.

[7] 齐培艳,田 铮.噪声为单位根过程的非参数函数变点的小波检测[J].控制理论与应用,2009,26(1):57-61.

[8] 张建军,周后福.合肥气温和降水的突变特征分析[J].安徽农业科学,2007,35(9):2724-2726.

[9] 龚志强,封国林.非线性时间序列的动力结构突变检测的研究[J].物理学报,2006,55(06):3180-3186.

[10] 陈希孺.变点统计分析简介[J].数理统计管理,1991,10(2):52-53.

[11] 安格斯麦迪森.中国经济的长期表现:公元960-2030年[M].伍晓鹰译.上海:上海人民出版社,2008:158.

S imulation Study on the Power of Least!squares Test for Detecting Multiple Breaks

ZH ANG Xue!xin1,DUAN Zhi!x ia2

(https://www.360docs.net/doc/3d4218726.html,rmation S chool,Zhongnan University of Economics and Law,W uhan430060,Ch ina;

2.Department of Basic,J iyuan Vocational and Techn ical C ollege,Jiyuan459650,C hina)

Abstract:In this paper,a no vel scheme to measure the pow er of least!squares test fo r checking mult iple br eaks is pr esen! ted as well it s a pplicability to v ario us stream data pr ocessing sy stems discussed firstly,A lso a co nclusio n is g iv en that L east Squa re method can be suitable for mean break model,that sig nal!to!no ise r atio clo sely related to the test pow er w ill be indicated too,Finally,the GD P breaks from China's major eco no mic secto rs ar e detected}.

Keywords:the po wer of least!squar es;multiple br eaks test;unit r oot pr ocess;M onte Carlo simulation

最小二乘法在系统辨识中的应用

最小二乘法在系统辨识中的应用 王文进 控制科学与控制工程学院 控制理论与控制工程专业 2009010211 摘要:在实际的工程中,经常要对一个系统建立数学模型。很多时候,要面对一个未知的系统,对于这些未知系统,我们所知道的仅仅是它们的一些输入输出数据,我们要根据这些测量的输入输出数据,建立系统的数学模型。由此诞生了系统辨识这门科学,系统辨识就是研究怎样利用对未知系统的输入输出数据建立描述系统的数学模型的科学。系统辨识在工程中的应用非常广泛,系统辨识的方法有很多种,最小二乘法是一种应用及其广泛的系统辨识方法。本文主要讲述了最小二乘估计在系统辨识中的应用。 首先,为了便于介绍,用一个最基本的单输入单输出模型来引入系统辨识中的最小二乘估计。 例如:y = ax + (1) 其中:y、x 可测,为不可测的干扰项,a未知参数。通过N 次实验,得到测量数据y k和x k ,其中k=1、2、3、…,我们所需要做的就是通过这N次实验得到的数据,来确定未知参数a 。在忽略不可测干扰项的前提下,基本的思想就是要使观测点y k和由式(1)确定的估计点y的差的平方和达到最小。用公式表达出来就是要使J最小: 确定未知参数a的具体方法就是令: J a = 0 , 导出 a 通过上面最基本的单输入单输出模型,我们对系统辨识中的最小二乘法有了初步的了解,但在实际的工程中,系统一般为多输入系统,下面就用一个实际的例子来分析。在接下来的表述中,为了便于区分,向量均用带下划线的字母表示。 水泥在凝固过程中,由于发生了一系列的化学反应,会释放出一定的热量。若水泥成分及其组成比例不同,释放的热量也会不同。 水泥凝固放热量与水泥成分的关系模型如下: y = a0+ a1x1+…+ a n x n + 其中,y为水泥凝固时的放热量(卡/克);x1~x2为水泥的几种成分。

系统辨识最小二乘参数估计matlab

最小二乘参数估计 摘要: 最小二乘的一次性完成辨识算法(也称批处理算法),他的特点是直接利用已经获得的所有(一批)观测数据进行运算处理。这种算法在使用时,占用内存大,离线辨识,观测被辨识对象获得的新数据往往是逐次补充到观测数据集合中去的。在应用一次完成算法时,如果要求在每次新增观测数据后,接着就估计出系统模型的参数,则需要每次新增数据后要重新求解矩阵方程()Z l T l l T l ΦΦΦ-∧=1θ。 最小二乘辩识方法在系统辩识领域中先应用上已相当普及,方法上相当完善,可以有效的用于系统的状态估计,参数估计以及自适应控制及其他方面。 关键词: 最小二乘(Least-squares ),系统辨识(System Identification ) 目录: 1.目的 (1) 2.设备 (1) 3引言 (1) 3.1 课题背景 (1) 4数学模型的结构辨识 (2) 5 程序 (3) 5.1 M 序列子函数 ................................................................................. 错误!未定义书签。 5.2主程序............................................................................................... 错误!未定义书签。 6实验结果: ................................................................................................................................... 3 7参考文献: ................................................................................................. 错误!未定义书签。 1.目的 1.1掌握系统辨识的理论、方法及应用 1.2熟练Matlab 下最小二乘法编程 1.3掌握M 序列产生方法 2.设备 PC 机1台(含Matlab 软件) 3引言 3.1 课题背景 最小二乘理论是有高斯(K.F.Gauss )在1795年提出:“未知量的最大可能值是这样一个数值,它使各次实际观测值和计算值之间的差值的平方乘以度量其精度的数值以后的和最小。”这就是最小二乘法的最早思想。 最小二乘辨识方法提供一个估算方法,使之能得到一个在最小方差意义上与实验数据最

系统辨识-最小二乘法MATLAB仿真

《系统辨识》基于MATLAB的最小二乘法(一阶)的仿真 clc clear % ①白噪声的生成过程如下:e=randn(1,500); e=e/std(e); e=e-mean(e); A=0; %白噪声的均值为0 B=sqrt(0.1); %白噪声的方差为0.1 e=A+B*e; %绘制白噪声图 k=1:500; subplot(4,1,1) %画四行一列图形窗口中的第一个图形 plot(k,e,'r'); xlabel('k'), ylabel('e');title('(0,1)均匀分布的随机序列') % ②生成M序列的过程如下:X1=1;X2=0;X3=1;X4=0; %移位寄存器输入Xi初始状态(0101), Yi寄存器的各级输出 m=500; %M序列的总长度 for i=1:m Y4=X4; Y3=X3; Y2=X2; Y1=X1; X4=Y3; X3=Y2; X2=Y1; X1=xor(Y3,Y4); %异或运算 if Y4==0 U(i)=-1; else U(i)=Y4; end end M=U; u=U; %绘制M序列图? i1=i k=1:1:i1; subplot(4,1,2) %画四行一列图形窗口中的第二个图形 plot(k,U,k,U,'rx') stem(M) xlabel('k') ylabel('M序列') title('移位寄存器产生的M序列') % ③参数估计的过程如下: %绘制参数估计的相关图形 z=zeros(1,500); %定义输出观测值的长度 for k=2:500 z(k)=0.9*z(k-1)+u(k-1)+e(k);%用理想输出值作为观测值 end subplot(4,1,3) %画四行一列图形窗口中的第三个图形 i=1:1:500; %横坐标的范围从1到500,步长为1 plot(i,z) %图形的横坐标是采样时刻i,纵坐标是输出观测值Z, 图形格式为连续曲线

数值计算_第6章 曲线拟合的最小二乘法

第6章曲线拟合的最小二乘法 6.1 拟合曲线 通过观察或测量得到一组离散数据序列,当所得数据比较准确时,可构造插值函数逼近客观存在的函数,构造的原则是要求插值函数通过这些数据点,即。此时,序列与 是相等的。 如果数据序列,含有不可避免的误差(或称“噪音”),如图6.1 所示;如果数据序列无法同时满足某特定函数,如图6.2所示,那么,只能要求所做逼近函数最优地靠近样点,即向量与的误差或距离最小。按与之间误差最小原则作为“最优”标准构造的逼近函数,称为拟合函数。 图6.1 含有“噪声”的数据 图6.2 一条直线公路与多个景点 插值和拟合是构造逼近函数的两种方法。插值的目标是要插值函数尽量靠近离散点;拟合的目标是要离散点尽量靠近拟合函数。 向量与之间的误差或距离有各种不同的定义方法。例如: 用各点误差绝对值的和表示: 用各点误差按模的最大值表示: 用各点误差的平方和表示: 或(6.1)

其中称为均方误差,由于计算均方误差的最小值的方法容易实现而被广泛采用。按 均方误差达到极小构造拟合曲线的方法称为最小二乘法。本章主要讲述用最小二乘法构造拟合曲线的方法。 在运筹学、统计学、逼近论和控制论中,最小二乘法都是很重要的求解方法。例如,它是统计学中估计回归参数的最基本方法。 关于最小二乘法的发明权,在数学史的研究中尚未定论。有材料表明高斯和勒让德分别独立地提出这种方法。勒让德是在1805年第一次公开发表关于最小二乘法的论文,这时高斯指出,他早在1795年之前就使用了这种方法。但数学史研究者只找到了高斯约在1803年之前使用了这种方法的证据。 在实际问题中,怎样由测量的数据设计和确定“最贴近”的拟合曲线?关键在选择适当的拟合曲线类型,有时根据专业知识和工作经验即可确定拟合曲线类型;在对拟合曲线一无所知的情况下,不妨先绘制数据的粗略图形,或许从中观测出拟合曲线的类型;更一般地,对数据进行多种曲线类型的拟合,并计算均方误差,用数学实验的方法找出在最小二乘法意义下的误差最小的拟合函数。 例如,某风景区要在已有的景点之间修一条规格较高的主干路,景点与主干路之间由各具特色的支路联接。设景点的坐标为点列;设主干路为一条直线 ,即拟合函数是一条直线。通过计算均方误差最小值而确定直线方程(见图6.2)。 6.2线性拟合和二次拟合函数 线性拟合 给定一组数据,做拟合直线,均方误差为 (6.2) 是二元函数,的极小值要满足 整理得到拟合曲线满足的方程:

2003版系统辨识最小二乘法大作业

西北工业大学系统辩识大作业 题目:最小二乘法系统辨识

一、 问题重述: 用递推最小二乘法、加权最小二乘法、遗忘因子法、增广最小二乘法、广义最小二乘法、辅助变量法辨识如下模型的参数 离散化有 z^4 - 3.935 z^3 + 5.806 z^2 - 3.807 z + 0.9362 ---------------------------------------------- = z^4 - 3.808 z^3 + 5.434 z^2 - 3.445 z + 0.8187 噪声的成形滤波器 离散化有 4.004e-010 z^3 + 4.232e-009 z^2 + 4.066e-009 z + 3.551e-010 ----------------------------------------------------------------------------- = z^4 - 3.808 z^3 + 5.434 z^2 - 3.445 z + 0.8187 采样时间0.01s 要求:1.用Matlab 写出程序代码; 2.画出实际模型和辨识得到模型的误差曲线; 3.画出递推算法迭代时各辨识参数的变化曲线; 最小二乘法: 在系统辨识领域中 ,最小二乘法是一种得到广泛应用的估计方法 ,可用于动态 ,静态 , 线性 ,非线性系统。在使用最小二乘法进行参数估计时 ,为了实现实时控制 ,必须优化成参数递推算法 ,即最小二乘递推算法。这种辨识方法主要用于在线辨识。MATLAB 是一套高性能数字计算和可视化软件 ,它集成概念设计 ,算法开发 ,建模仿真 ,实时实现于一体 ,构成了一个使用方便、界面友好的用户环境 ,其强大的扩展功能为各领域的应用提供了基础。对 4324326.51411.5320120232320 Y s s s s G U s s s s ++++== ++++432 120120232320 E N W s s s s == ++++

普通最小二乘法(OLS)

普通最小二乘法(OLS ) 普通最小二乘法(Ordinary Least Square ,简称OLS ),是应用最多的参数估计方 法,也是从最小二乘原理出发的其他估计方法的基础,是必须熟练掌握的一种方法。 在已经获得样本观测值 i i x y ,(i=1,2,…,n )的情况下 (见图2.2.1中的散点),假如模型(2.2.1)的参数估计量 已经求得到,为^0β和^ 1β,并且是最合理的参数估计量,那 么直线方程(见图2.2.1中的直线) i i x y ^ 1^0^ββ+= i=1,2,…,n (2.2.2) 应该能够最好地拟合样本数据。其中 ^ i y 为被解释变量的估计值,它是由参数估计量和解释 变量的观测值计算得到的。那么,被解释变量的估计值与观测值应该在总体上最为接近,判断的标准是二者之差的平方和最小。 ),()(102 2101ββββQ u x y Q i i n i i ==--=∑∑= ()() ),(min ????1 02 1 102 12?,?1 1 ββββββββQ x y y y u Q n i i n i i i =--=-==∑∑∑== (2.2.3) 为什么用平方和?因为二者之差可正可负,简单求和可能将很大的误差抵消掉,只有平方和才能反映二者在总体上的接近程度。这就是最小二乘原则。那么,就可以从最小二乘原则和样本观测值出发,求得参数估计量。 由于 2 1 ^ 1^01 2 ^ ))(()(∑∑+--=n i i n i i x y y y Q ββ= 是 ^ 0β、^ 1β的二次函数并且非负,所以其极小值总是存在的。根据罗彼塔法则,当Q 对^ 0β、 ^ 1β的一阶偏导数为0时,Q 达到最小。即

系统辨识之最小二乘法

方法一、最小二乘一次性算法: 首先对最小二乘法的一次性辨识算法做简要介绍如下: 过程的黑箱模型如图所示: 其中u(k)和z(k)分别是过程的输入输出,)(1-z G 描述输入输出关系的模型,成为过程模型。 过程的输入输出关系可以描述成以下最小二乘格式: )()()(k n k h k z T +=θ (1) 其中z(k)为系统输出,θ是待辨识的参数,h(k)是观测数据向量,n(k) 是均值为0的随机噪声。 利用数据序列{z (k )}和{h (k )}极小化下列准则函数: ∑=-=L k T k h k z J 12])()([)(θθ (2) 使J 最小的θ的估计值^ θ,成为最小二乘估计值。 具体的对于时不变SISO 动态过程的数学模型为 )()()()()(11k n k u z B k z z A +=-- (3) 应该利用过程的输入、输出数据确定)(1-z A 和 )(1-Z B 的系数。 对于求解θ的估计值^θ,一般对模型的阶次 a n , b n 已定,且b a n n >;其次将(3)模 型写成最小二乘格式 )()()(k n k h k z T +=θ (4) 式中 ?????=------=T n n T b a b a b b b a a a n k u k u n k z k z k h ],,,,,,,[)](,),1(),(,),1([)(2121 θ (5)

L k ,,2,1 = 因此结合式(4)(5)可以得到一个线性方程组 L L L n H Z +=θ (6) 其中 ???==T L T L L n n n n L z z z z )](),2(),1([)](),2(),1([ (7) 对此可以分析得出,L H 矩阵的行数为),max(b a n n L -,列数b a n n +。 在过程的输入为2n 阶次,噪声为方差为1,均值为0的随机序列,数据长度)(b a n n L +>的情况下,取加权矩阵L Λ为正定的单位矩阵I ,可以得出: L T L L T L z H H H 1^ )(-=θ (8) 其次,利用在Matlab 中编写M 文件,实现上述算法。 此次算法的实现,采用6阶M 序作为过程黑箱的输入;噪声采用方差为1,均值为0的随机数序列;黑箱模型假设为:y(k)-1.5y(k-1)+0.7y(k-2)=2u(k-1)+0.5u(k-2),则系统输出为Z(k)-1.5Z(k-1)+0.7Z(k-2)=2U(k-1)+0.5U(k-2)+n (k );模型的阶次2,2==b a n n ;数据长度取L=200。 程序清单如下见附录:最小二乘一次性算法Matlab 程序 运行结果如下: 图1 最小二乘一次性算法参数真值与估计值 其中re 为真值,ans 为估计值^ θ 结果发现辨识出的参数与真值之间存在细微误差,这是由于系统噪声以及数据长度L 的限制引起的,最小二乘辨识法是一种无偏估计方法。 方法二、最小二乘递推算法: 最小二乘一次性算法计算量大,并且浪费存储空间,不利于在线应用,由此引出最小

线性判别分析LDA

LDA 算法入门 一.LDA 算法概述: 线性判别式分析(Linear Discriminant Analysis , LDA),也叫做Fisher 线性判别(Fisher Linear Discriminant ,FLD),是模式识别的经典算法,它是在1996年由Belhumeur 引入模式识别和人工智能领域的。线性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵最小。就是说,它能够保证投影后模式样本在新的空间中有最小的类内距离和最大的类间距离,即模式在该空间中有最佳的可分离性。 二. LDA 假设以及符号说明: 假设对于一个n R 空间有m 个样本分别为12,,m x x x ,即每个x 是一个n 行的矩阵,其中 i n 表示属第 i 类的样本个数,假设一共有 c 个类,则 12i c n n n n m ++++= 。 b S : 类间离散度矩阵 w S :类内离散度矩阵 i n :属于i 类的样本个数 i x :第i 个样本 u :所有样本的均值 i u :类i 的样本均值 三. 公式推导,算法形式化描述 根据符号说明可得类i 的样本均值为: 1 i x classi i u x n ∈= ∑ (1.1)

同理我们也可以得到总体样本均值: 1 1m i i u x m ==∑ (1.2) 根据类间离散度矩阵和类内离散度矩阵定义,可以得到如下式子: ()() 1c T b i i i i S n u u u u ==--∑ (1.3) ()() 1k c T w i k i k i x classi S u x u x =∈=--∑ ∑ (1.4) 当然还有另一种类间类内的离散度矩阵表达方式: ()()() 1 c T b i i i S P i u u u u ==--∑ (1.5) ()()()(){ } 11 (i)(i)E |k c T w i k i k i x classi i c T i i i P S u x u x n P u x u x x classi =∈==--=--∈∑ ∑∑ (1.6) 其中()P i 是指i 类样本的先验概率,即样本中属于i 类的概率()i n P i m =,把 ()P i 代入第二组式子中,我们可以发现第一组式子只是比第二组式子都少乘了1m ,我们将在稍后进行讨论,其实对于乘不乘该1m ,对于算法本身并没有影响,现在我们分析一下算法的思想, 我们可以知道矩阵 ()() T i i u u u u --的实际意义是一个协方差矩阵,这个矩阵 所刻画的是该类与样本总体之间的关系,其中该矩阵对角线上的函数所代表的是该类相对样本总体的方差(即分散度),而非对角线上的元素所代表是该类样本总体均值的协方差(即该类和总体样本的相关联度或称冗余度),所以根据公式(1.3)可知(1.3)式即把所有样本中各个样本根据自己所属的类计算出样本与总体的协方差矩阵的总和,这从宏观上描述了所有类和总体之间的离散冗余程度。同理可以的得出(1.4)式中为分类内各个样本和所属类之间的协方差矩阵之和,它所刻画的是从总体来看类内各个样本与类之间(这里所刻画的类特性是由是类

系统辨识最小二乘法大作业 (2)

系统辨识大作业 最小二乘法及其相关估值方法应用 学院:自动化学院 学号: 姓名:日期:

基于最小二乘法的多种系统辨识方法研究 一、实验原理 1.最小二乘法 在系统辨识中用得最广泛的估计方法是最小二乘法(LS)。 设单输入-单输出线性定长系统的差分方程为 (5.1.1) 式中:为随机干扰;为理论上的输出值。只有通过观测才能得到,在观测过程中往往附加有随机干扰。的观测值可表示为 (5.1.2) 式中:为随机干扰。由式(5.1.2)得 (5.1.3) 将式(5.1.3)带入式(5.1.1)得 (5.1.4) 我们可能不知道的统计特性,在这种情况下,往往把看做均值为0的白噪声。 设 (5.1.5) 则式(5.1.4)可写成 (5.1.6) 在观测时也有测量误差,系统内部也可能有噪声,应当考虑它们的影响。因此假定不仅包含了的测量误差,而且包含了的测量误差和系统内部噪声。假定是不相关随机序列(实际上是相关随机序列)。 现分别测出个随机输入值,则可写成个方程,即 上述个方程可写成向量-矩阵形式 (5.1.7) 设 则式(5.1.7)可写为

(5.1.8) 式中:为维输出向量;为维噪声向量;为维参数向量;为测量矩阵。因此式(5.1.8)是一个含有个未知参数,由个方程组成的联立方程组。如果,方程数少于未知数数目,则方程组的解是不定的,不能唯一地确定参数向量。如果,方程组正好与未知数数目相等,当噪声时,就能准确地解出 (5.1.9) 如果噪声,则 (5.1.10) 从上式可以看出噪声对参数估计是有影响的,为了尽量较小噪声对估值的影响。在给定输出向量和测量矩阵的条件下求系统参数的估值,这就是系统辨识问题。可用最小二乘法来求的估值,以下讨论最小二乘法估计。 2.最小二乘法估计算法 设表示的最优估值,表示的最优估值,则有 (5.1.11) 写出式(5.1.11)的某一行,则有 (5.1.12) 设表示与之差,即 - (5.1.13)式中 成为残差。把分别代入式(5.1.13)可得残差。设 则有 (5.1.14) 最小二乘估计要求残差的平方和为最小,即按照指数函数 (5.1.15) 为最小来确定估值。求对的偏导数并令其等于0可得 (5.1.16) (5.1.17)

最小二乘法--计算方法

生活中的计算方法应用实例——— 最小二乘法,用MATLAB实现1. 数值实例 下面给定的是某市最近1个月早晨7:00左右(新疆时间)的天气预报所得到的温度 天数 1 2 3 4 5 6 7 8 9 10 温度9 10 11 12 13 14 13 12 11 9 天数11 12 13 14 15 16 17 18 19 20 温度10 11 12 13 14 12 11 10 9 8 天数21 22 23 24 25 26 27 28 29 30 温度7 8 9 11 9 7 6 5 3 1 下面用MATLAB编程对上述数据进行最小二乘拟合,按照数据找出任意次曲线拟合方程和它的图像。 2、程序代码 x=[1:1:30]; y=[9,10,11,12,13,14,13,12,11,9,10,11,12,13,14,12,11,10,9,8,7,8,9,11,9,7, 6,5,3,1]; a1=polyfit(x,y,3) %三次多项式拟合% a2= polyfit(x,y,9) %九次多项式拟合% a3= polyfit(x,y,15) %十五次多项式拟合% b1= polyval(a1,x) b2= polyval(a2,x) b3= polyval(a3,x) r1= sum((y-b1).^2) %三次多项式误差平方和% r2= sum((y-b2).^2) %九次次多项式误差平方和% r3= sum((y-b3).^2) %十五次多项式误差平方和% plot(x,y,'*') %用*画出x,y图像% hold on plot(x,b1, 'r') %用红色线画出x,b1图像% hold on plot(x,b2, 'g') %用绿色线画出x,b2图像% hold on plot(x,b3, 'b:o') %用蓝色o线画出x,b3图像% 3、数值结果 不同次数多项式拟合误差平方和为: r1=67.6659

系统辨识—最小二乘法

最小二乘法参数辨识 1 引言 系统辨识是根据系统的输入输出时间函数来确定描述系统行为的数学模型。现代控制理论中的一个分支。通过辨识建立数学模型的目的是估计表征系统行为的重要参数,建立一个能模仿真实系统行为的模型,用当前可测量的系统的输入和输出预测系统输出的未来演变,以及设计控制器。对系统进行分析的主要问题是根据输入时间函数和系统的特性来确定输出信号。对系统进行控制的主要问题是根据系统的特性设计控制输入,使输出满足预先规定的要求。而系统辨识所研究的问题恰好是这些问题的逆问题。通常,预先给定一个模型类μ={M}(即给定一类已知结构的模型),一类输入信号u和等价准则J=L(y,yM)(一般情况下,J是误差函数,是过程输出y和模型输出yM的一个泛函);然后选择使误差函数J达到最小的模型,作为辨识所要求的结果。系统辨识包括两个方面:结构辨识和参数估计。在实际的辨识过程中,随着使用的方法不同,结构辨识和参数估计这两个方面并不是截然分开的,而是可以交织在一起进行的。 2 系统辨识的目的 在提出和解决一个辨识问题时,明确最终使用模型的目的是至关重要的。它对模型类(模型结构)、输入信号和等价准则的选择都有很大的影响。通过辨识建立数学模型通常有四个目的。 ①估计具有特定物理意义的参数有些表征系统行为的重要参数是难以直接测量的,例如在生理、生态、环境、经济等系统中就常有这种情况。这就需要通过能观测到的输入输出数据,用辨识的方法去估计那些参数。 ②仿真仿真的核心是要建立一个能模仿真实系统行为的模型。用于系统分析的仿真模型要求能真实反映系统的特性。用于系统设计的仿真,则强调设计参数能正确地符合它本身的物理意义。 ③预测这是辨识的一个重要应用方面,其目的是用迄今为止系统的可测量的输入和输出去预测系统输出的未来的演变。例如最常见的气象预报,洪水预报,其他如太阳黑子预报,市场价格的预测,河流污染物含量的预测等。预测模型辨识的等价准则主要是使预测误差平方和最小。只要预测误差小就是好的预测模型,对模型的结构及参数则很少再有其他要求。这时辨识的准则和模型应用的目的是一致的,因此可以得到较好的预测模型。 ④控制为了设计控制系统就需要知道描述系统动态特性的数学模型,建立这些模型的目的在于设计控制器。建立什么样的模型合适,取决于设计的方法和准备采用的控制策略。 3 系统辨识的方法 经典方法: 经典的系统辨识方法的发展已经比较成熟和完善,他包括阶跃响应法、脉冲

基于最小二乘法的系统辨识的设计与开发(整理版)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 基于最小二乘法的系统辨识的设计与开发(整理版)课程(论文)题目: 基于最小二乘法的系统辨识摘要: 最小二乘法是一种经典的数据处理方法。 最小二乘的一次性完成辨识算法(也称批处理算法),他的特点是直接利用已经获得的所有(一批)观测数据进行运算处理。 在系统辨识领域中, 最小二乘法是一种得到广泛应用的估计方法, 可用于动态系统, 静态系统, 线性系统, 非线性系统。 在随机的环境下,利用最小二乘法时,并不要求观测数据提供其概率统计方面的信息,而其估计结果,却有相当好的统计特性。 关键词: 最小二乘法;系统辨识;参数估计 1 引言最小二乘理论是有高斯( K.F.Gauss)在 1795 年提出: 未知量的最大可能值是这样一个数值,它使各次实际观测值和计算值之间的差值的平方乘以度量其精度的数值以后的和最小。 这就是最小二乘法的最早思想。 最小二乘辨识方法提供一个估算方法,使之能得到一个在最小方差意义上与实验数据最好拟合的数学模型。 递推最小二乘法是在最小二乘法得到的观测数据的基础上,用新引入的数据对上一次估计的结果进行修正递推出下一个参数估计值,直到估计值达到满意的精确度为止。 1 / 10

对工程实践中测得的数据进行理论分析,用恰当的函数去模拟数据原型是一类十分重要的问题,最常用的逼近原则是让实测数据和估计数据之间的距离平方和最小,这即是最小二乘法。 最小二乘法是一种经典的数据处理方法。 在随机的环境下,利用最小二乘法时,并不要求观测数据提供其概率统计方面的信息,而其估计结果,却有相当好的统计特性。 2 最小二乘法的系统辨识设单输入单输出线性定常系统的差分方程为: 1),()()() 1()(01knkubkubnkxakxakxnn ( 1)上式中: )(ku为输入信号;)(kx为理论上的输出值。 )(kx只有通过观测才能得到,在观测过程中往往附加有随机干扰。 )(kx的观测值)(ky可表示为 ( 2)将式( 2)代入式( 1)得 1()()() 1()(101kubkubnkyakyakyn (3) 我们可能不知道)(kn的统计特性,在这种情况下,往往把)(kn看做均值为 0 的白噪声。 设 ( 4)则式( 3)可以写成 (5) 在测量)(ku时也有测量误差,系统内部也可能有噪声,应当

基于最小二乘法的系统参数辨识

基于最小二乘法的系统参数辨识 吴令红,熊晓燕,张涛 太原理工大学机械电子研究所,太原 (030024) E-mail lhwu0818@https://www.360docs.net/doc/3d4218726.html, 摘要:系统辨识是自动控制学科的一个重要分支,由于其特殊作用,已经广泛应用于各种领域,尤其是复杂系统或参数不容易确定的系统的建模。过去,系统辨识主要用于线性系统的建模,经过多年的研究,已经形成成熟的理论。但随着社会、科学的发展,非线性系统越来越受到人们的关注,其控制与模型之间的矛盾越来越明显,因而非线性系统的辨识问题也越来越受到重视,其辨识理论不断发展和完善本。文重点介绍了系统参数辨识中最小二乘法的基本原理,并通过悬臂梁模型的辨识实例,具体说明了基于最小二乘法参数辨识在Matlab 中的实现方法。结果表明基于最小二乘法具有算法简单、精度较高等优点。 关键词:系统辨识;参数辨识;滑动平均模型(ARX);最小二乘法;Matlab 中图分类号:TH-9 1. 引言 所谓辨识就是通过测取研究对象在人为输入作用下的输出响应,或正常运行时的输入输出数据记录,加以必要的数据处理和数学计算,估计出对象的数学模型。这是因为对象的动态特性被认为必然表现在它的变化着的输入输出数据之中,辨识只不过是利用数学的方法从数据序列中提炼出对象的数学模型而已[1]。 最小二乘法是系统参数辨识中最基本最常用的方法。最小二乘法因其算法简单、理论成熟和通用性强而广泛应用于系统参数辨识中。本文基于悬臂梁的实测数据,介绍了最小二乘法的参数辨识在Matlab中的实现。 2. 系统辨识 一般而言,建立系统的数学模型有两种方法:激励分析法和系统辨识法。前者是按照系统所遵循的物化(或社会、经济等)规律分析推导出模型。后者则是从实际系统运行和实验数据处理获得模型。如图1所示,系统辨识就是从系统的输入输出数据测算系统数学模型的理论和方法。更进一步的定义是L.A.Zadeh曾经与1962年给出的,即“系统辨识是在输入和输出的基础上,从系统的一类系统范围内,确立一个与所实验系统等价的系统”。另外,系统辨识还应该具有3个基本要素,即模型类、数据和准则[5]。被辨识系统模型根据模型形式可分为参数模型和非参数模型两大类。所谓参数模型是指微分方程、差分方程、状态方程等形式的数学模型;而非参数模型是指频率响应、脉冲响应、传递函数等隐含参数的数学模型。在辨识工程中,模型的确定主要根据经验对实际对象的特性进行一定程度上的假设,如对象的模型是线性的还是非线性的、是参数模型还是非参数模型等。在模型确定之后,就可以根据对象的输入输出数据,按照一定的辨识算法确定模型的参数[4]。 y 图1 被研究的动态系统

系统辨识最小二乘法大作业

系统辨识最小二乘法大作业 系统辨识大作业最小二乘法及其相关估值方法应用 学院:自动化学院 专业:信息工程 学号:2007302171 姓名:马志强 日期:2010.11.14 基于最小二乘法的多种系统辨识方法研究 1. 最小二乘法的引出 在系统辨识中用得最广泛的估计方法是最小二乘法(LS)。 设单输入-单输出线性定长系统的差分方程为 (5.1.1) 式中:为随机干扰;为理论上的输出值。只有通过观测才能得到,在观测过程中往往附加有随机干扰。的观测值可表示为

(5.1.2) 式中:为随机干扰。由式(5.1.2)得 (5.1.3) 将式(5.1.3)带入式(5.1.1)得 (5.1.4) 我们可能不知道的统计特性,在这种情况下,往往把看做均值为0的白噪声。 设 (5.1.5) 则式(5.1.4)可写成 (5.1.6) 在观测时也有测量误差,系统内部也可能有噪声,应当考虑它们的影响。因此假定不仅包含了的测量误差,而且包含了的测量误差和系统内部噪声。假定是不相关随机序列(实际上是相关随机序列)。 现分别测出个随机输入值,则可写成个方程,即 上述个方程可写成向量-矩阵形式 (5.1.7) 设 则式(5.1.7)可写为 (5.1.8) 式中:为维输出向量;为维噪声向量;为维参数向量;为测量矩阵。因此式(5.1.8)是一个含有个未知参数,由个方程组成的联立方程组。如果,方程数少于未知数数目,则方程组的解是不定的,不能唯一地确定参数向量。如果,方程组正好与未知数数目相等,当噪声时,就能准确地解出 (5.1.9) 如果噪声,则

(5.1.10) 从上式可以看出噪声对参数估计是有影响的,为了尽量较小噪声对估值的影响。在给定输出向量和测量矩阵的条件下求系统参数的估值,这就是系统辨识问题。可用最小二乘法来求的估值,以下讨论最小二乘法估计。 2. 最小二乘法估计算法 设表示的最优估值,表示的最优估值,则有 (5.1.11) 写出式(5.1.11)的某一行,则有 (5.1.12) 设表示与之差,即 - (5.1.13) 式中 成为残差。把分别代入式(5.1.13)可得残差。设 则有 (5.1.14) 最小二乘估计要求残差的平方和为最小,即按照指数函数 (5.1.15) 为最小来确定估值。求对的偏导数并令其等于0可得 (5.1.16) (5.1.17) 由式(5.1.17)可得的最小二乘估计 (5.1.18) 3.递推最小二乘法 为了实现实时控制,必须采用递推算法,这种辨识方法主要用于在线辨识。 设已获得的观测数据长度为,将式(5.1.8)中的和分别用来代替, 即 (5.3.1) 用的最小二乘估计,则 (5.3.2)

系统辨识试验

2.用普通最小二乘法(OLS )法辨识对象数学模型 选择的仿真对象的数学模型如下 )()2(5.0)1()2(7.0)1(5.1)(k v k u k u k z k z k z +-+-=-+-- 其中,)(k v 是服从正态分布的白噪声N )1,0(。输入信号采用4阶M 序列,幅度为1。选择如下形式的辨识模型 )()2()1()2()1()(2121k v k u b k u b k z a k z a k z +-+-=-+-+ 设输入信号的取值是从k =1到k =16的M 序列,则待辨识参数LS θ?为LS θ?=L τL 1L τL z H )H H -(。其中,被辨识参数LS θ?、观测矩阵z L 、H L 的表达式为 ?? ?? ? ? ??????=2121? b b a a LS θ , ????????????=)16()4()3(z z z L z , ????????????------=)14()2()1()15()3()2()14()2()1()15()3()2(u u u u u u z z z z z z L H 程序框图如下所示:

参考程序: %ols u=[-1,1,-1,1,1,1,1,-1,-1,-1,1,-1,-1,1,1]; %系统辨识的输入信号为一个周期的M 序列 z=zeros(1,16); %定义输出观测值的长度 for k=3:16 z(k)=1.5*z(k-1)-0.7*z(k-2)+u(k-1)+0.5*u(k-2); %用理想输出值作为观测值 end subplot(3,1,1) %画三行一列图形窗口中的第一个图形 stem(u) %画出输入信号u的经线图形 subplot(3,1,2) %画三行一列图形窗口中的第二个图形 i=1:1:16; %横坐标范围是1到16,步长为1 plot(i,z) %图形的横坐标是采样时刻i, 纵坐标是输出观测值z, 图形格式为连续曲线subplot(3,1,3) %画三行一列图形窗口中的第三个图形 stem(z),grid on%画出输出观测值z的经线图形,并显示坐标网格 u,z%显示输入信号和输出观测信号 %L=14%数据长度 HL=[-z(2) -z(1) u(2) u(1);-z(3) -z(2) u(3) u(2);-z(4) -z(3) u(4) u(3);-z(5) -z(4) u(5) u(4);-z(6) -z(5) u(6) u(5);-z(7) -z(6) u(7) u(6);-z(8) -z(7) u(8) u(7);-z(9) -z(8) u(9) u(8);-z(10) -z(9) u(10) u(9);-z(11) -z(10) u(11) u(10);-z(12) -z(11) u(12) u(11);-z(13) -z(12) u(13) u(12);-z(14) -z(13) u(14) u(13);-z(15) -z(14) u(15) u(14)] %给样本矩阵HL赋值 ZL=[z(3);z(4);z(5);z(6);z(7);z(8);z(9);z(10);z(11);z(12);z(13);z(14);z(15); z(16)]% 给样本矩阵zL赋值 %calculating parameters%计算参数 c1=HL'*HL; c2=inv(c1); c3=HL'*ZL; c=c2*c3 %计算并显示 %DISPLAY PARAMETERS a1=c(1), a2=c(2), b1=c(3), b2=c(4) %从中分离出并显示a1 、a2、 b1、 b2 %End

基于最小二乘法的系统参数辨识

基于最小二乘法的系统参数辨识 研究生二队李英杰 082068 摘要:系统辨识是自动控制学科的一个重要分支,由于其特殊作用,已经广泛应用于各种领域,尤其是复杂系统或参数不容易确定的系统的建模。过去,系统辨识主要用于线性系统的建模,经过多年的研究,已经形成成熟的理论。但随着社会、科学的发展,非线性系统越来越受到人们的关注,其控制与模型之间的矛盾越来越明显,因而非线性系统的辨识问题也越来越受到重视,其辨识理论不断发展和完善本。文重点介绍了系统参数辨识中最小二乘法的基本原理,并通过热敏电阻阻值温度关系模型的辨识实例,具体说明了基于最小二乘法参数辨识在Matlab中的实现方法。结果表明基于最小二乘法具有算法简单、精度较高等优点。 1. 引言 所谓辨识就是通过测取研究对象在人为输入作用下的输出响应,或正常运行时的输入输出数据记录,加以必要的数据处理和数学计算,估计出对象的数学模型。这是因为对象的动态特性被认为必然表现在它的变化着的输入输出数据之中,辨识只不过是利用数学的方法从数据序列中提炼出对象的数学模型而已[1]。最小二乘法是系统参数辨识中最基本最常用的方法。最小二乘法因其算法简单、理论成熟和通用性强而广泛应用于系统参数辨识中。本文基于热敏电阻阻值与温度关系数据,介绍了最小二乘法的参数辨识在Matlab中的实现。 2. 系统辨识 一般而言,建立系统的数学模型有两种方法:激励分析法和系统辨识法。前者是按照系统所遵循的物化(或社会、经济等)规律分析推导出模型。后者则是从实际系统运行和实验数据处理获得模型。如图1 所示,系统辨识就是从系统的输入输出数据测算系统数学模型的理论和方法。更进一步的定义是L.A.Zadeh 曾经与1962 年给出的,即“系统辨识是在输入和输出的基础上,从系统的一类系统范围内,确立一个与所实验系统等价的系统”。另外,系统辨识还应该具有3 个基本要素,即模型类、数据和准则[5]。被辨识系统模型根据模型形式可分为参数模型和非参数模型两大类。所谓参数模型是指微分方程、差分方程、状态方程等形式的数学模型;而非参数模型是指频率响应、脉冲响应、传递函数等隐含参数的数学模型。在辨识工程中,模型的确定主要根据经验对实际对象的特性进行一定程度上的假设,如对象的模型是线性的还是非线性的、是参数模型还是非参数模型等。在模型确定之后,就可以根据对象的输入输出数据,按照一定的辨识算法确定模型的参数[4]。 图1 被研究的动态系统 3. 最小二乘法(LS)参数估计方法 对于参数模型辨识结构,系统辨识的任务是参数估计,即利用输入输出数据估计这些参数,建立系统的数学模型。在参数估计中最常用的是最小二乘法(LS)、

最小二乘法拟合

4.最小二乘法线性拟合 我们知道,用作图法求出直线的斜率a 和截据b ,可以确定这条直线所对应的经验公式,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据处理方法,求出的a 和b 误差较大。用最小二乘法拟合直线处理数据时,任何人去处理同一组数据,只要处理过程没有错误,得到的斜率a 和截据b 是唯一的。 最小二乘法就是将一组符合Y=a+bX 关系的测量数据,用计算的方法求出最佳的a 和b 。显然,关键是如何求出最佳的a 和b 。 (1) 求回归直线 设直线方程的表达式为: bx a y += (2-6-1) 要根据测量数据求出最佳的a 和b 。对满足线性关系的一组等精度测量数据(x i ,y i ),假定自变量x i 的误差可以忽略,则在同一x i 下,测量点y i 和直线上的点a+bx i 的偏差d i 如下: 111bx a y d --= 222bx a y d --= n n n bx a y d --= 显然最好测量点都在直线上(即d 1=d 2=……=d n =0),求出的a 和b 是最理想的,但测量点不可能都在直线上,这样只有考虑d 1、d 2、……、d n 为最小,也就是考虑d 1+d 2+……+d n 为最小,但因d 1、d 2、……、d n 有正有负,加起来可能相互抵消,因此不可取;而|d 1|+ |d 2|+……+ |d n |又不好解方程,因而不可行。现在采取一种等效方法:当d 12+d 22+……+d n 2 对a 和b 为最小时,d 1、d 2、……、d n 也为最小。取(d 12+d 22+……+d n 2 )为最小值,求a 和b 的方法叫最小二乘法。 令 ∑== n i i d D 1 2=21 1 2][i i n i n i i b a y d D --== ∑∑== (2-6-2) D 对a 和b 分别求一阶偏导数为: ][211∑∑==---=??n i i n i i x b na y a D ][21 2 11∑∑∑===---=??n i i n i i n i i i x b x a y x b D

主成分分析和判别分析详解

主成分分析 主题描述:中国城镇家庭全年人均食品支出分析。希望通过对原始数据,如粮食支出、肉类支出等多个变量进行主成分分析,研究城镇家庭食品支出的主成分构成,并用较少维度的变量综合表征食品支出这一变量。 模型描述: Y=β1X1+ β2X2+…+ β18X18其中, 因变量Y表示:食品支出总额 自变量X包括:X1粮食支出、X2淀粉及薯类支出、X3干豆类支出、X4油脂类支出、X5肉禽及制品支出、X6蛋类支出、X7水产品支出、X8菜类支出、X9调味品支出、X10糖 类支出、X11烟草类支出、X12酒和饮料支出、X13干鲜瓜果类支出、X14糕点类支出、 X15奶及奶制品支出、X16其他支出、X17在外用餐支出、X18食品加工服务费支出共 18项指标。 数据来源:2007/2008/2009《中国数据统计年鉴》30个城市自治区居民家庭平均每人全年消费性支出共93组数据 (数据见附录) 结果展示及分析: 操作过程:导入数据后,选择“分析”—“降维”—“因子分析”,在弹出的对话框中: 数据选择除“年份”、“城市”、“食品支出”以外的所有变量,“描述”、“抽取”、“得分”选项分别按如下图中设置,其余选项保持默认设置。

其中,将“抽取”设置为“基于特征值—特征值大于1”用以筛选特征根大于1的主成分。 (此处勾选了“载荷图”选项,主要是为了后面因子分析中对比因子旋转前后的载荷变化,在主成分中将暂不做分析。)

设置“得分”选项是用以计算将原始数据和主成分都进行标准化后的主成分系数。得到的结果如下:

这是相关系数矩阵,表明各个变量之间的相关性。如果数据在此矩阵中表现出来的相关性较强则可进行主成分分析,否则表明数据不需要做主成分分析。从表中数据看:大多数变量间的相关性中等偏高,个别变量如糕点类与干鲜瓜果类之间的相关性较强……说明所选初始变量存在信息上的重叠,可以尝试进行主成分分析。

相关文档
最新文档