2013年数学建模数据拟合方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据拟合
问题的提出及最小二乘原理
取
x 的n 个不全相同的值n x x x ,,,21 作独立试验,得到样本
()11,y x ,()22,y x ,…,()n n y x ,,则
i i i bx a y ε++=,
设()2
,0~σεN i
,各 i ε 相互独立 于是
()
2
,~σi i bx a N y +,
n
i ,,2,1 =。且由
n y y y ,,,21 的独立性,知n y y y ,,,21 的联合概率密度为
()⎥⎦
⎤
⎢⎣
⎡---⎪⎭⎫
⎝⎛=∑=n
i i i n
bx a y L 12
2
21exp 21σπσ (1)
现用最大似然估计法来估计未知参数
b a ,。对于任意一组观察值
n y y y ,,,21 ,(1)式就是样本的似然函数。显然,要L 取最大值,
只需函数
()()
∑=--=n
i i i bx a y b a Q 12
,
取最小值。 如果
y 不是正态变量,则直接用(1)式估计b a ,使
y 的观察值 i y
与
i bx a + 偏差的平方和 ()b a Q , 为最小。这种方法叫最小二乘法。
如果y 是正态变量,则最小二乘法与最大似然估计法给出相同的结果。
取
()b a Q ,分别关于b a ,的偏导数,并令它们等于0,得到b
a ,
应满足方程
()()⎪⎪⎩⎪⎪⎨⎧=---=∂∂=---=∂∂∑∑==020211n i i i i n
i i i x x b a y b
Q x b a y a Q
(2) (2)式称为正规方程组。解此方程组即可确定
b a ,,从而得到直线方程
bx a y +=*。
对一组测定数据用最小二乘原理找出其合适的数学公式,可以分以下几步: 1. 由观测数据作出散点图
2. 根据散点图确定近似公式的函数类
3. 用最小二乘原理确定函数中的未知参数 这一方法称为数据拟合法。
常用的曲线(函数类)有直线、多项式、双曲线、指数曲线等,实际操作中可以在直观判断的基础上,选几种曲线分别做拟合,然后比较看哪条曲线的最小二乘指标最小。
一. 多变量的数据拟合
若影响变量
y
的因素不只是一个,而是几个,譬如有
k
个因素
k x x x ,,,21 ,这时通过n 次实验可以得到数据表:
实验 1x
2x … k x y
1 11x 21x
… 1k x 1y 2 12x
22x
… 2k x
2y
…
…
…
… …
…
n
n x 1 n x 2 …
kn x n y
一般说来
k n >,如果选择近似方程为
k k x a x a x a a y ++++= 22110*
和前面一样,用最小二乘原理可确定此方程中的全部系数。
二. 非线性曲线的数据拟合
()()()()x c x c x c x c y k k φφφφ++++= 221100*
多项式数据拟合有它特殊的重要性,因为任何连续函数,至少在一个比较小的领域内可以用多项式任意逼近。因此,在许多实际问题中,可以不问
y 与
诸因素的确切关系如何,而用多项式进行拟合。
数据拟合总是在一组选定的基函数上,构造基函数的线性组合,并从这个组合函数类中对给定数据找出最好的拟合曲线。例如,线性拟合是在基函数
{}x ,1上构造一次函数类,找出对给定数据最好的直线方程;多项式拟合
是在基函数{}m
x x ,,,1 上构造m 次多项式,在全部m 次多项
式中选取对给定数据拟合的最好的一个m
次多项式。因此,怎样选择基函数来构造函数类是非常重要的,也比较困难,它主要靠对问题的仔细分析和搞清物理背景的办法来解决,但在数学上也有行之有效的方法——正交筛选法。
三. 数据拟合的MATLAB 实现
命令: polyfit 、polyval 、
curvefit 、leastsq