第三章 第八节 曲线拟合

合集下载

曲线拟合

曲线拟合

1 .0 0 .167 2 0 .233 1
1 .0 0 .286 5 0 .279 2 J( x1 ) =
1 .0 0 .392 6 0 .286 1
1 .0 0 .490 8 0 .272 3
1 .0 0 .583 7 0 .245 0
1 .0 0 .672 5 0 .208 0
1 .0 1 .0 0 .000 0 F( x1 ) = ( - 0 .082 2 , - 0 .074 3 , - 0 .045 0 , - 0 .016 5 , 0 .001 3 , 0 .017 0 ,
其中
x = R - Rm in , y = N - Nmin
R+1
N+2
式中 Rmin , R 分别为最小回流 比和 实际 回流 比 ; Nmin , N 分别 为理 论 最小 塔板 数
和实际塔板数。
本题 取 不 同 的 初 始 点 x0 , 也 可 收 敛 到 相 同 的 结 果。 如 果 取 x0 = (6. 0 , - 0. 4 , 1 .2 ) T , 远离 x* 点 , 迭代次数增加到 38 次才收敛。
yi 仍记作 y i 则该问题的目标函数为
10
∑ mi n S =
( x1
+
x2
Rx i
3
-
yi )2
i= 1
函数 f i ( x) 的梯度表达式为
Δ f i ( x) =
f i ( x) , f i ( x) , f i ( x) T
x1
x2
x3
1 .0
=
Rx i3
x2
Rx i
3
l
n(
Ri
)
取 λ= 0 .01 , μ= 2 .0 , x0 = ( 0 .6 , - 0 .4 , 0 .3 ) T , 则 目标 函 数 S0 = 0 .180 9 ,

曲线拟合问题讲解

曲线拟合问题讲解

曲线拟合问题摘要本文首先对给定数据根据不同要求进行多次直线拟合,分别求得使所拟直线预期值的偏差平方和、绝对偏差总和和最大偏差最小的三类拟合直线,然后再求得二次曲线条件下满足三类要求的二次拟合曲线,最后运用其他曲线对给定数据进行拟合,得到吻合度最高的曲线。

针对问题一,构建线性回归方程,运用最小二乘法及lingo软件使得目标函数预期值的即拟合偏差平方和达到最小,从而得到拟合曲线^0.80310480.0123077iy x-=。

针对问题二,构建给定数据的线性回归方程,使得目标函数即预期值的绝对偏差综合最小,但由于绝对偏差较难处理,采用转化的思想将对绝对偏差的求解转化为对偏差平方和开方的求解,从而得到拟合曲线^0.650.575iy x=+。

针对问题三,构建给定数据的线性回归方程,运用lingo软件使得目标函数即预期值的最大偏差最小,从而得到拟合曲线^1.13 1.879iy x=-。

针对问题四,构建给定数据的二次方程,运用lingo软件分别求得三类不同条件下的最优拟合曲线,偏差平方和达到最小:^210.097030110.138534 1.425301i iy x x-=+,绝对偏差总和达到最小:^210.041481480.27111111i iy x x+=+,观测值与预测值最大偏差为最小:^210.025568180.76590910.6923295i iy x x-=+。

针对问题五,本文做出给定数据散点图,构建不同曲线类型进行拟合,得到2R即吻合度最高的曲线类型,运用Matlab软件求得该曲线类型的方程。

本文的特色在于利用图标直观表达拟合曲线,增强文章可靠性及真实性,并构建不同的曲线类型,得到吻合度最高的拟合曲线。

关键词:曲线拟合、线性回归、lingo1.问题的重述已知一个量y 依赖于另一个量x ,现收集有数据如下:(1)求拟合以上数据的直线a bx y +=。

目标为使y 的各个观察值同按直线关系所预期的值的偏差平方和为最小。

曲线拟合-PPT精选文档

曲线拟合-PPT精选文档

-11.2705
-8.0196 -4.0604 0.0000 3.9012 7.6049
12.62
15.77 18.01 19.75 21.16 22.36
0.1017
0.0053 0.0361 1.0921 0.0563 0.0566
1.6
23.8
0.4700
0.2209 566.44
4.1078 2671.63
54 50 45 37 35 25 20 16 18 13
4.双曲形式关系
6.多项式形式关系
(一) 指数关系曲线
ˆ ae y
两种形式:
y
bx
ˆ ab y
x
a >0,b>0
a >0,b<0
0
x
当a>0,b>0时,Y随x的↑而↑,曲线凹向上; 当a>0,b<0时,Y随x的↑而↓,曲线也是凹向上。
(二) 对数关系曲线
方程为:
y
ˆ y a b ln x
(五) S型曲线 • S型曲线由于其曲线形状与动、植物的生长过程的 基本特点类似,故又称生长曲线,曲线一开始时 增长较慢,而在以后的某一范围内迅速增长,达 到一定的限度后增长又缓慢下来,曲线呈拉长 的”S”,故称S曲线 • 最著名的曲线是Logistic生长曲线,它最早由比利 时数学家 P.F.Vehulst 于 1838 年导出,但直至 20 世 纪 20 年代才被生物学家及统计学家 R.Pearl 和 L.J. Reed 重新发现,并逐渐被人们所发现。目前它已 广泛应用于多领域的模拟研究。
解决办法
曲线直线化估计(Curve estimation) 非 线 性 / 曲 线 回 归 (Nonlinear/curvilinear regression)

曲线拟合方法

曲线拟合方法

今天帮同学做了一个非线性函数的曲线拟合,以前没做过,所以是摸着石头过河。

费了一下午时间,终于把曲线拟合出来了,顺道也学习了使用Matlab进行曲线拟合的方法,把学习所得记录下来,和大家共享。

一、单一变量的曲线逼近Matlab有一个功能强大的曲线拟合工具箱 cftool ,使用方便,能实现多种类型的线性、非线性曲线拟合。

下面结合我使用的 Matlab R2007b 来简单介绍如何使用这个工具箱。

假设我们要拟合的函数形式是y=A*x*x + B*x, 且A>0,B>0 。

1、在命令行输入数据:》x=[110.3323 148.7328 178.064 202.8258033 224.7105 244.5711 262.908 280.0447 296.204 311.5475];》y=[5 10 15 20 25 30 35 40 45 50];2、启动曲线拟合工具箱》cftool3、进入曲线拟合工具箱界面“Curve Fitting tool”(1)点击“Data”按钮,弹出“Data”窗口;(2)利用X data和Y data的下拉菜单读入数据x,y,可修改数据集名“Data set name”,然后点击“Create data set”按钮,退出“Data”窗口,返回工具箱界面,这时会自动画出数据集的曲线图;(3)点击“Fitting”按钮,弹出“Fitting”窗口;(4)点击“New fit”按钮,可修改拟合项目名称“Fit name”,通过“Data set”下拉菜单选择数据集,然后通过下拉菜单“Type of fit”选择拟合曲线的类型,工具箱提供的拟合类型有:•Custom Equations:用户自定义的函数类型•Exponential:指数逼近,有2种类型, a*exp(b*x) 、 a*exp(b*x) + c*exp(d*x) •Fourier:傅立叶逼近,有7种类型,基础型是 a0 + a1*cos(x*w) + b1*sin(x*w)•Gaussian:高斯逼近,有8种类型,基础型是 a1*exp(-((x-b1)/c1)^2)•Interpolant:插值逼近,有4种类型,linear、nearest neighbor、cubic spline、shape-preserving•Polynomial:多形式逼近,有9种类型,linear ~、quadratic ~、cubic ~、4-9th degree ~•Power:幂逼近,有2种类型,a*x^b 、a*x^b + c•Rational:有理数逼近,分子、分母共有的类型是linear ~、quadratic ~、cubic ~、4-5th degree ~;此外,分子还包括constant型•Smoothing Spline:平滑逼近(翻译的不大恰当,不好意思)•Sum of Sin Functions:正弦曲线逼近,有8种类型,基础型是 a1*sin(b1*x + c1)•Weibull:只有一种,a*b*x^(b-1)*exp(-a*x^b)选择好所需的拟合曲线类型及其子类型,并进行相关设置:——如果是非自定义的类型,根据实际需要点击“Fit options”按钮,设置拟合算法、修改待估计参数的上下限等参数;——如果选Custom Equations,点击“New”按钮,弹出自定义函数等式窗口,有“Linear Equations线性等式”和“General Equations构造等式”两种标签。

第八章 曲线拟合、回归和相关分析

第八章 曲线拟合、回归和相关分析
数据点集(x1,y1),…,(xn,yn)最小二乘直线方程 y=a+bx 将所有点代入直线方程后相加,我们得到 y=an+bx(或 y a b x) 以及 xy=ax+bx2 这两个方程称为最小二乘的正规方程。由上 面的方程组我们可以达到a,b分别为:
yx xxy a , 2 2 n x ( x ) nxy xy b , 其中b也可以写成 2 2 n x ( x )
t ( y0 y p ) n 2
2 s y. x 1 [(x0 x) 2 / s x ]
有n-2个自由度的t分布。由此能求得预报的平均总体 值的置信限
相关的抽样理论
我们经常要从样本的相关系数r估计总体的相 关系数,或者检验有关的假设。为此我们 必须知道r的抽样分布。在=0的情况,这个 对称是对称的,且有一个具有t分布的统计量 可以利用。对0,这个分布是偏斜的,这种 情况,Fisher做出的变换构造了一个统计量, 它近似正态分布。下面的检验概括了这一构 造。
2 s y. x n 1 [n( x0 x) 2 / s x ]
有n-2个自由度的t分布。由此能求得预报得总体值 得置信限
2 预报的平均值的假设检验 设y0是x=x0时y的预报值,它是从样本回归方程得到 的估计,即y0=a+bx0。设y p记对总体而言对应x=x0的y 的预报平均值,那么统计量
回归的概率解释
从同一总体抽取不同的样本作拟合,我们会 得到不同的回归曲线。 给定两个随机变量X和Y的联合密度函数和概 率函数。如果使E{[Y-g(X)]2}=最小值的y=g(x) 曲线称为Y关于X的最小二乘回归曲线有如下 定理: 定理一:y=g(x)=E(Y|X=x)满足E{[Y-g(X)]2}= 最小值,所以它是Y关于X的最小二乘曲线。

曲线拟合

曲线拟合

32
30
28
26
24
22
20
18 16
18
20
22
24
26
28
30
数据拟合函数表
cfit
fit
产生拟合的目标
用库模型、自定义模型、平滑样条或 内插方法来拟合数据 产生或修改拟合选项 产生目标的拟合形式 显示一些信息,包括库模型、三次样 条和内插方法等。 显示曲线拟合工具的信息 返回拟合曲线的属性 对于拟合曲线显示属性值
•输出结果为: •p = • Columns 1 through 5 • 0.0193 -0.0110 -0.0430 0.0073 0.2449 • Column 6 • 0.2961 •说明拟合的多项式为:
0.0193x 5 0.0110x 4 0.043x 3 0.0073x 2 0.2449x 0.2961
• 算例: >> years=1950:10:1990; >> service=10:10:30; >> wage = [150.697 199.592 187.625 179.323 195.072 250.287 203.212 179.092 322.767 226.505 153.706 426.730 249.633 120.281 598.243]; >> w = interp2(service,years,wage,15,1975) w= 190.6288
Method:用于指定插值的方法,linear:线性插值(默认方 法)。Cubic三次多项插值。Spline:三次样条插值。Nearst: 最近邻插值。
• 例
>> year=1900:10:2010; >> product=[75.995,91.972,105.711,123.203,131.669,... 150.697,179.323,203.212,226.505,249.633,256.344,267.893]; >> p1995 = interp1(year,product,1995) p1995 = 252.9885 >> x = 1900:10:2010; >> y = interp1(year,product,x,'cubic'); >> plot(year,product,'o',x,y)

曲线拟合

曲线拟合
列表计算:
机动 目录
o
上页 下页 返回 结束
t
i
0 7
ti 0 7 28
ti2 0 49 140
yi 27.0 24.8 208.5
yi ti 0 137.6 717.0
140 a 28b 717 得法方程组 28 a 8b 208 .5 解得 a 0.3036 , b 27.125 , 故所求经验公式为
评价方式
• SSE(The sum of squares due to error)
– – 和方差、误差平方和 A value closer to 0 indicates a better fit.→0
ˆi )2 SSE Wi ( yi y
i 1
n
• MSE(Mean squared error)
p1=2255
q1=83.1
Sum of Sine
f(x)=a1*sin(b1*x0.0420 9
c1=1.693
fitting Exponential Fourier Gaussian Polynomial Rational
SSE 0.1224 0.01768 0.01916 0.1082 0.1374
x
150 160 170
X
165
160 140
180
190
200
Back
• 从图上虽可看出,个子高的父亲确有生出个子高的 儿子的倾向,同样地,个子低的父亲确有生出个子 低的儿子的倾向。得到的具体规律如下:
y a bx u ˆ 84.33 0.516x y
• 如此以来,高的伸进了天,低的缩入了地。他百思 不得其解,同时又发现某人种的平均身高是相当稳 定的。最后得到结论:儿子们的身高回复于全体男 子的平均身高,即“回归”——见1889年F.Gallton 的论文《普用回归定律》。 • 后人将此种方法普遍用于寻找变量之间的规律

曲线拟合

曲线拟合

向自定义函数拟合
在化工生产中获得的氯气的级分y随生产时间x下降,假定在x≥8时,y与x之间有如下形式的非线性 模型: 现收集了44组数据,利用该数据通过拟合确定非线性模型中的待定常数。 x y x y x 8 0.49 16 0.43 28 8 0.49 18 0.46 28 10 0.48 18 0.45 30 10 0.47 20 0.42 30 10 0.48 20 0.42 30 10 0.47 20 0.43 32 12 0.46 20 0.41 32 12 0.46 22 0.41 34 12 0.45 22 0.40 36 12 0.43 24 0.42 36 14 0.45 24 0.40 38 14 0.43 24 0.40 38 14 0.43 26 0.41 40 16 0.44 26 0.40 42 16 0.43 26 0.41 y 0.41 0.40 0.40 0.40 0.38 0.41 0.40 0.40 0.41 0.36 0.40 0.40 0.36 0.39
2.多项式曲线拟合函数 多项式曲线拟合函数
调用格式: p=polyfit(x,y,n) [p,s]= polyfit(x,y,n) 说明:x,y为数据点,n为多项式阶数,返回 p为幂次从高到低的多项式系数向量p。矩阵s 用于生成预测值的误差估计。
多项式曲线拟合函数
例2:由离散数据 x0.1.2.3.4.5.6.7.8.91y.3.511.41.61.9.6.4.81.52拟 合出多项式。 程序: x=0:.1:1; y=[.3 .5 1 பைடு நூலகம்.4 1.6 1.9 .6 .4 .8 1.5 2] n=3; p=polyfit(x,y,n) xi=linspace(0,1,100); z=polyval(p,xi); %多项式求值 plot(x,y,’o’,xi,z,’k:’,x,y,’b’) legend(‘原始数据’,’3阶曲线’)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

显然这是一个关于 , a1 ,, am的m 1元线性方程组 a0
用内积表示线性方程组
则由内积的概念可知
( j , k ) j ( xi ) k ( xi ) ( f , k ) y i k ( x i )
i 0 i 0 n
n
a0 0 ( xi ) k ( xi ) a1 1 ( x i ) k ( xi ) am m ( xi ) k ( xi )
将其表示成矩阵形式
( 0 , 0 ) ( 1 , 0 ) ( m , 0 ) a0 ( f , 0 ) ( , ) ( , ) ( , ) a ( f , ) 1 1 m 1 1 0 1 1 ( 0 , m ) ( 1 , m ) ( m , m ) am ( f , m )
基函数之间的内积为
n n
(0 , 0 ) n 1
n j i k i j k
( j , k ) j ( xi ) k ( xi ) x x xi ( f , k ) yi k ( xi ) yi xik
i 0 i 0 i 0 n i 0 i 0 n
(1)
使 max | P ( x i ) y i | 最小 0i n
(2)
使
| P( x ) y
i 0 i
n
i
| 最小
n
(3) 使

2 2

i 0 2 i
n
| P ( x i ) y i |2
i 0
最小
2范数计算方便,常作为 总体误差的衡量标准
最小二乘拟合
3、最小二乘法的基本思路
一般要求 n m
设( xi , yi )(i 0,1,, n)为给定的一组数据
设x, y的关系为
使满足
2 2 n i 0
y P( x )
| P ( xi ) yi |2 达到最小
i 0 n
i2
其中P( x )来自函数类 , {0 ( x),1 ( x),, m ( x)}
a0 113.1 a 731.6 1
( f ,0 ) 113.1
则法方程组为:
127.5 24 127.5 829.61
解得:
a0 0.1505
a1 0.8587
y( x ) 0.1505 0.8587x
yi
9
纤维强度随拉伸 倍数增加而增加
8 7 6 5 4 3 2 1
并且24个点大致分 布在一条直线附近
因此可以认为强度 y与拉伸倍数x的主 要关系应是线性关 系
1
2
3
4
5
6
7
8
9
10
y( x) a0 a1 x
其中a0 , a1为待定参数
纤维强度和拉伸倍数之间近似与线性关系,故可选取线性函数
y=.23 -.26 -1.10 -.45 .27 解:数据的散点图
1
0.5
0
y
-0.5 -1 -1.5 0
0.5
1
1.5 x
2
2.5
3
从图中可以看出:
y与x之间具有三角函数关系 x cos
y与x之间还具有指数函数关 e x 系
y与x之间还具有对数函数关 ln x 系
因此假设拟合函数为
S( x) a ln x b cos x cex
i 0 i 0 i 0
n
n
n
yi k ( xi )
i 0
n
( k 0,1, m )
a0 (0 ,k ) a1 (1 ,k ) am (m ,k ) ( f , k )
a0 (0 ,k ) a1 (1 ,k ) am (m ,k ) ( f , k )
近)。 但是① n 很大; ② yi 本身是测量值,不准确,即 yi p (xi) 这时没必要取 p(xi) = yi , 而要使 i
p( xi ) yi 总体上尽可能地小。
这种构造近似函数 的方法称为曲线拟合,有的还称为配曲线或找经 验公式。
在回归分析中称为残差
2、“使 P(xi) yi 尽可能地小”有不同的准则
i 0 j 0 j j i i
n
m
k
( xi )] 0
[ a ( x )
i 0 j 0 j j i
n
m
k
( xi ) yi k ( xi )] 0
[ a ( x )
i 0 j 0 j j i n m i 0 j 0 j j i
n
m
k
( xi ) yi k ( xi )] 0 ( x i ) y i k ( x i )
4、最小二乘法曲线拟合的步骤 (1)列出已知的函数对(xi,yi) (2)给出基函数 (3)列法方程组 (4)解法方程组(计算内积等) (5)得到曲线拟合函数
实例:考察某种纤维的强度与其拉伸倍数的关系,下表是实际测定的24个
纤维样品的强度与相应的拉伸倍数是记录:
编 号 拉伸倍数 1 1.9 2 2 3 2.1 4 2.5 5 2.7 6 2.7 7 3.5 8 3.5 9 4 10 4 11 4.5 12 4.6
方法,允许函数 p( x ) 在数据点上有误差,但要求达到某种误差 指标最小化。
插 值


插值方法比较适合数据准确或数据量小的情形。 拟合方法比较适合数据有误差且数据量大的情形。
1、曲线拟合问题 已知 x0 … xn ; y0 … yn, 求一个简单易算的近似函数 p(x) ,能充
分反映 y f ( x ) 的大致面目,也就是与 f ( x )有最好的拟合(或逼
根据内积公式
( j , k ) j ( xi ) k ( xi ) ( f , k ) y i k ( x i )
i 0 i 0 n
n
得:
(0 ,0 ) 24
(0 , 1 ) 127.5 (1 , 1 ) 829.61
( f , 1 ) 731.6
即为所求的最小二乘解
实例: 已知 sin 0 0, sin

6
0.5000 , sin

3
0.8660 , sin

2
1,
用最小二乘法求 sin x的拟合曲线 p( x ) ax bx3 。 温度t(0C) 实例:已知热敏电阻数据:
求600C时的电阻R。
1100 1000 900 800 700 20
通过计算,得法方程组的系数矩阵及常数项矩阵为
用Gauss列主元消去法,得
a b c
-1.0410 -1.2613 0.030735
y关于x的最小二乘解是
S * ( x) 1.0410ln x 1.2613cos x 0.030735 x e
xi
强 度 1.4 1.3 1.8 2.5 2.8 2.5 3 2.7 4 3.5 4.2 3.5
yi 编 号 拉伸倍数 xi
13 14 15 16 17 18 19 20 21 22 23 24 5 5.2 6 6.3 6.5 7.1 8 8 8.9 9 9.5 10
强度 5.5 5 5.5 6.4 6 5.3 6.5 7 8.5 8 8.1 8.1
本章内容小结
①插值问题与插值多项式 ②拉格朗日插值 ③牛顿插值 ④埃尔米特插值 ⑤分段低次插值 ⑥三次样条插值
⑦曲线拟合
该方程称为法方程组或正则方程组。且方程组有唯一解。
内积满足交换律 ( j , k ) ( k , j )
作为一种简单的情况,
常使用多项式m ( x )作为 xi , yi )(i 0,1,, n)的拟合函数 P ( 拟合函数 m (x)的基函数为 P
,k ( x) x k ,, m ( x) x m 0 ( x ) 1, 1 ( x ) x ,
P ( x ) 为 j ( x) j 0,1,m) 的线性组合。 (
m
即P ( x ) a j j ( x )
j 0
a00 ( x ) a11 ( x) am m ( x)

2 2
( P ( xi ) yi ) ( a j j ( xi ) yi )2
拟合的平方误差为
* 2 ( S * ( xi ) yi )
2
i 0 m i 0
m
2
( 1.0410ln xi 1.2613cos xi 0.030735 xi yi )2 e
0.92557
已知观测数据为
x
y
0
1
2
3
5
1.1
1.9
3.1
3.9
4.9
用最小二乘法求经验直线 y a0 a1 x
20.5 32.7 51.0 73.0 95.7 826 873 942 1032
电阻R() 765
设 R=at+b a,b为待定系数
得到 a=3.3940, b=702.4918
40 60 80 100
实例:求拟合下列数据的最小二乘解 x=.24 .65 .95 1.24 1.73 2.01 2.23 2.52 2.77 2.99 .10 -.29 .24 .56 1
0 ( x) ln x
6.7941 -5.3475 -5.3475 5.1084 63.2589 -49.0086
相关文档
最新文档