一种分段曲线拟合方法研究

一种分段曲线拟合方法研究
一种分段曲线拟合方法研究

一种分段曲线拟合方法研究

摘要:分段曲线拟合是一种常用的数据处理方法,但在分段点处往往不能满足连续与光滑.针对这一问题,本文给出了一种能使分段点处连续的方法.该方法首先利用分段曲线拟合对数据进行处理;然后在相邻两段曲线采用两点三次Hermite插值的方法,构造一条连结两条分段曲线的插值曲线,从而使分段点处满足一阶连续.最后通过几个实例表明该方法简单、实用、效果较好.

关键词:分段曲线拟合Hermite插值分段点连续

Study on A Method of Sub-Curve Fitting

Abstract:Sub-curve fitting is a commonly used processing method of data, but at sub-points it often does not meet the continuation and smooth, in allusion to to solve this problem, this paper presents a way for making sub-point method continuous. Firstly, this method of sub-curve fitting deals with the data; and then uses the way of t wo points’ cubic Hermite interpolation in the adjacent, structures a interpolation curve that links the two sub-curves, so the sub-point meets first-order continuation; lastly, gives several examples shows that this method is simple, practical and effective.

Key words:sub-curve fitting Hermite interpolation sub-point continuous

前言

数据拟合是一种重要的数据处理方法,其中最常用的是多项式曲线拟合.然而当数据点较多时,多项式阶数太低,拟合精度和效果不太理想,要提高拟合精度和效果就需要提高曲线阶数,但阶数太高又带来计算上的复杂性及其他方面的不利.因此,如果只采用一种多项式曲线函数拟合较多的数据点,难以取得较好的拟合精度和效果.为有效地解决上述问题,一般采用分段曲线拟合.以往的分段曲线拟合方法主要是针对在自然科学领域中测量的数据而使用的拟合方法,这些数据的变化一般都遵循一定的规律.因此,在对这些测量数据拟合时,传统的分段曲线拟合方法一般是先根据主观经验对数据分段, 然后进行拟合.但是对于有些实际问题的数据,比如社会、经济生活中的大量统计数据,这些数据变化的机理一般非常复杂,往往不像物理定律那样有着严格的规律,所以变化的不确定性很强.因此,传统的分段曲线拟合根据主观经验对数据进行分段的做法就显现出明显地不足.针对这种不足,国内外许多文献也讨论过,文献[1]研究的是最小二乘法在曲线拟合中的实现,给出了最小二乘法在多元正交基函数拟合中的计算机实现方法,以常见的二次曲线拟合为例说明了程序编制的要点,在实验的数据处理中具有实用价值;文献[2]讨论分段最小二乘曲线拟合方法,本文在一般最小二乘的基础上提出分段最小二乘曲线拟合的方案,讨论了连接分段拟合曲线的方法,并且给出分段最小二乘多项式拟合的计算方法;文献[4]主要介绍基于最小二乘原理的分段曲线拟合法,在最小二乘的基础上,运用实测数据点的分段曲线拟合法,探讨相应的模型以及用不同类型的曲线拟合同时拟合数据点的具体应用,对一实例,应用MATLAB编程设计,完成模型的求解、显著性检验等,可以得到拟合精度比较高的拟合曲线,该方法原理简便,其模型易用MATLAB编程求解;文献[5]研究的是基于最小二乘法的分段三次曲线拟合方法研究,多项式曲线拟合是一种较常用的数据处理方法,但当数据点较多时,只采用一种多项式曲线函数拟合所有数据点难以得到较好的拟合效果,针对传统分段曲线拟合方法中对数据点分段时经验成分较多的不足,提出了一种基于最小二乘法原理的分段三次曲线拟合方法,建立三次拟合曲线方程,通过实际数据的检验,验证了该方法的拟合效果;文献[6,7,8]主要研究基于分段三次曲线拟合的广州周发案量预测,随着城市化进程的不断加快,城市人口不断增多,广州市未来治安形势预警,支持政府部门和政法部门关于治安工作的决策,首先需要对未来时期的发案量做出比较精确的预测,由于目前广州市方案量统计数据比较少,且发案量受农历春节影响较明显,针对传统时间序列预测方法在此情况下应用不足,提出了基于分段三次曲线拟合的周发案量预测模型,并给出了具体的建模、计算步骤,最后通过实际数据的检验,证明了方法预测效果较好;文献[9]提出了分段函数的光滑方法及其在曲线拟合中的应用,在分析复杂实验数据时,采用分段曲线拟合方法,利用此方法在段内可以实现最佳逼近,但在段边界上却可能不满足连续性与可导性.

为了克服这种现象,本文主要研究一种能使段边界连续的方法,具有一定的理论和实际意义.在前人的基础上,本文总结分段曲线拟合的方法与步骤,介绍了分段三次曲线的拟合方法和两点三次Hermite插值,然后讨论如何利用Hermite插值方法使得分段拟合曲线在连接点处满足连续方法,最后通过一些实例应用,表明本文所介绍的方法具有一定的应用价值.

1 最小二乘曲线拟合

1.1 最小二乘法[1]

令待求的未知量为12,,,t a a a ,它们可由()n n t ≥个直接测量12,,,n y y y 通过下列函数关系求得:

11122212331212(,,,)(,,,)(,,,)(,,,)

t t t n n t y f a a a y f a a a y f a a a y f a a a ====

若j a 为真值,由上述已知函数求出真值j y ,若其测量值为*j y ,则对应的误差为

*,(1

,2,)j j j y y j n σ=-= .最小二乘法可定量表示为:

2

1min n

j

j σ

==∑ (1.1.1)

对不等精度的测量,应加上各测量值的权重因子j p ,即:

2

1

min n

j j

j p σ

==∑ (1.1.2)

最小二乘法是在随机误差为正态分布时,由最大似然法推出的这个结论.它可使测

量误差的平方和最小,因此被视为从一组测量值中求出一组未知量的最可信赖的方法.

1.2 最小二乘多项式曲线拟合的基本原理[2]

1.2.1 线性拟合原理

将拟合函数取线性函数是一种简单的数据拟合方法,将数据点

1122(,()),(,()),,(,())m m x f x x f x x f x

确定线性拟合函数

()x a bx ?=+ (1.2.1.1) 称为对数据的线性拟合。对于线性拟合问题,需要求函数

2

(,)1[()]

m

a b k k k S a b x y ==+-∑ (1.2.1.2) 的最小值点,该问题的几何背景是寻求一条直线,使该直线与数据表所确定的平面散点

的纵向距离的平方和最小,如图1.2.1-1所示.

(图1.2.1-1)

由函数对两个变量求导得:

1

2[()],m

k k k S

a bx y a =?=+-?∑

(1.2.1.3) 1

2[()],m

k k k k S

a b x y x b =?=+-?∑ (1.2.1.4)

其余等于零,得正规方程组

11

21

11,m m

k k k k m m m

k k k k k k k ma x b y x a x b x y =====?

+=????+=??∑∑∑∑∑ (1.2.1.5) 也可将其矩阵形式写出来即:

112111m

m k k k k m m m i k k k k k k m x y a b x x x y =====???? ? ??? ? ?= ? ? ??? ? ?

????

∑∑∑∑∑ 解得,a b 的值,将其代入(1.2.1.1)即可得到拟合线性函数. 1.2.2 多项式拟合原理

为了确定数据拟合问题,选用幂函数2{1,,,}n x x x 作为函数类,则

2012()n

n x a a x a x a x ?=++++ (1)n m +< (1.2.2.1)

这就是多项式拟合函数.

为了确定拟合函数2012()n n x a a x a x a x ?=++++ 的系数,需要求解正规方程组

01111

21

011111

12011

111m m m

n

k k n k

k k k m m m m

n k k k n k k k k k k m m m m

n n n n k k k n k k

k k k k ma x a x a y x a x a x a x y x a x a x a x y ===+====+====?+++=??

?+++=????

?+++=??∑∑∑∑∑∑∑∑∑∑∑ (1.2.2.2) 也可以用矩阵形式表示为

11

102111111121111m m

m n k k k k k k m m m m n k k k k k k k k k n m m m

m n n n n k k k k k k k k k m x x y a x x x x y a a x x x x y ===+====+====???? ? ?

? ??? ? ? ? ? ? ?= ? ? ? ? ? ? ? ??? ? ? ? ?????

∑∑∑∑∑∑∑∑∑∑∑ 解得01,,,n a a a 即可,将其代入(1.2.2.1)即可得到拟合多项式.

2 分段曲线拟合

2.1 分段曲线拟合的基本原理[3]

先根据实测数据分布的特点,确定分段数目以及相应拟合曲线类型.拟合函数一般可选为多项式函数,因为在一定范围内,连续函数可用多项式任意逼近,然后再应用最小二乘法原理求得各分段拟合方程的系数.

基本步骤为:

第一步:将数据点分段,确定基函数01(),(),,()n x x x ??? , 第二步:根据题目要求,建立正规方程组, 第三步:解正规方程组,求出待定系数, 第四步:写出拟合函数.

下面以分段线性拟合与分段三次曲线拟合为例讨论分段拟合的基本过程. 2.1.1 分段线性拟合

我们把给出的数据点分成k 组12,,,k N N N ,即

1122***

1111121211***2121222222***1122(,),(,),,(,)(,),(,),,(,)

(,),(,),(,)

k k N N N N k k k k kN kN x y x y x y x y x y x y x y x y x y

其中12,,,k N N N 为每组数据的个数.

首先考虑线性拟合这种简单的情形,对k 组数据点分别应用最小二乘线性拟合,得

到各组数据点所对应的近似线性函数,

111()g x a b x =+ 1111()N x x x ≤<

222()g x a b x =+ 1212()N N x x x ≤<

()k k k g x a b x =+ 11()k k k N kN x x x --≤≤

而在整个考虑的拟合区间上就得到了1k -条直线段,现在就这1k -条直线段所在各

区间的左端点定义1()()i i i iN i iN g x g x +=,该函数就成为整个区间上的数据拟合函数.这就是分段最小二乘线性拟合问题.

然而有些数据组并不是每段都呈线性关系,如数据(,)1,2,,i i x y i n = ,根据其散点图却发现其前m 个点较接近直线,后n m -个点呈现非线性关系,则可分两段拟合.分别以一次多项式1Y 和n 次多项式2Y 进行拟合,即

1Y kx b =+ (2.1.1.1) 为了说明具体的方法,不妨选2Y 的阶数为2,即

22012Y a x a x a =++ (2.1.1.2) 要保证在边界点(,)m m x y 连续光滑,所以存在两个约束条件

2

012m m m kx b a x a x a +=++和012m k a x a =+,因此,式(2.1.1.1)和(2.1.1.2)的系数是相关的.解得2

20m b a a x =-,故式(2.1.1.1)为

2

10102(2)m m Y a x a x a x a =+-+

令S 为最小二乘估计量,则

22

2201200121

1

[(2)]()m

n

m i m

i i i i i i m S a x a x a a x y a x

a x a y ==+=++--+

++-∑∑

通过模型

0i

S

a ?=?;0,1,2i =,

可求得最小方差S 的012,,a a a 的值,从而确定出式(2.1.1.1)与(2.1.1.2)中的回归系数.最后,通过

r =

和F 检验值22(2)1n r F r -=-,对回归方程进行显著性检验,式中1

1n

i i y y n ==∑;

2

10102(2)i m i m Y a x a x a x a

=+-+;22012i i Y a x a x a =++. 当然,根据不同的数据,可分三段进行拟合,或根据不同的数据特点,采用多次曲

线拟合方式.

2.1.2 分段三次曲线拟合[4,5]

设有N 个数据123,,,N Z Z Z Z .因为四个数据点可确定一条三次曲线,但在选取分段点时,必须考虑分段后相邻曲线必须连续,即边界点连续,因此用五个数据点拟合一条三次曲线.

拟合方法:首先对数据进行一定的分段,将第一到第五数据分为第一段,再将第五到第九个数据分为第二段,将第九到第十三个数据分为第三段,依次类推进行分组,即前一段末尾的数据为下一段数据的首位,这样便保证了数据分段的连续性.然后再对个分段数据进行三次曲线拟合即可.

令某段数据的三次拟合曲线函数为:23(2,1,0,1,2)t w a bt ct dt t =+++=--可以将此曲线函数分解为奇偶两个函数:奇函数3t v bt dt =+和偶函数2t u a ct =+.下面应用最小二乘法的基本原理求三次拟合曲线的系数[6],由于在每段数据中第一点和最后一点均两次参与拟合,因此,在求一段曲线的拟合方差时需要加权.按照平均分配的原则[7],求方差

的权值221

2

λλ-==,1011λλλ-===,得到该段曲线拟合的方差

2

2

22()t t t t S w Z λ=-=-∑ (2.1.2.1)

曲线表示为奇偶函数的形式如下

,,t t t t t t t w u v u u v v --=+==- (2.1.2.2) 由(2.1.2.2)可以推导出下式

11

(),()22

t t t t t t u w w v w w --=+=- (2.1.2.3)

令,,t t t t t t t Z x y x x y y --=+==-则

11

(),()22

t t t t t t x Z Z y Z Z --=+=- (2.1.2.4)

因此拟合方差为

2

2

2

2

2

222

2

2

2

2

2

22

()() ()() t t t t t t t t t t t t t t t t t t S w Z u v x y u x v y S S λλλλ=-=-=-=-=-=+--=-+-=+∑∑∑∑奇偶

(2.1.2.5)

即t w 对t Z 的平滑可以看作是奇函数和偶函数分别平滑的叠加.从(2.1.2.5)式中可知奇函数拟合的方差.

2

2

2

223

2

1

22

12() 2() 2()(28)t t t t t

t t S x y bt dt

y b d y b d y λλ=-=-=-=

--=+-++-∑∑奇

(2.1.2.6)

120

280

b d y b d y +-=??

+-=?, 解出

2112(2)6

(8)6

b y y d y y =-??

=-?. 因此0S =奇,即奇函数的拟合方差为0,达到最佳逼近.同样,从(2.1.2.5)式中可

知偶函数拟合方差为

2

2222

20

122

()()2()(4)t t t t S

u x a x a c x a c x

λ=-=-=-

+

+-++-∑偶

(2.1.2.7) 由(2.1.2.3)式得知在边界点上

2221

()42

u w w a c -=

+=+. 考虑到边界点连续这一约束条件,令

4e a c =+ (2.3.2.8)

因此由式(2.3.2.7)可令

22

222

120122

01(4)()2()31()2()

44

S S a c x a x a c x a x a e x =-+-=-++-=-++-偶 (2.1.2.9) 解令

2

10S a

?=?,有01312()3()044a x a e x -++-=,得 10(1283)17a x x e =+- (2.1.2.10)

从(2.1.2.10)式可知三次曲线函数的系数,a c 的取值与边界点值有关,将(2.1.2.10)式代入(2.1.2.9)式中可得

2222

22122011(4)()(34)17

S S a c x S e x x e x =-+-=--=+-偶偶 .

所以得出222

2011()(34)17S e x x e x =-++-偶,再令2

0S e

?=?偶,有

2012

2()(34)017

e x x e x -++-=,

解得

102

431718

x x x e -+=. (2.1.2.11)

联立式(2.1.2.8)、式(2.1.2.10)、式(2.1.2.11),解得

012(34)6a x x x =+-

012(325)18c x x x =--+

最后得到三次拟合曲线表达式为

23

0120122112(34)(325)(2)(8)66186t x x x x x x y y y y w t t t

+---+--=+++.

3 基于两点三次Hermite 插值的分段曲线拟合

3.1 插值的定义

定义3.1.1[9] 设函数()y f x =在区间[,]a b 上有定义,且已知在点

012n a x x x x b ≤<<<<≤ 处的函数值(),(0,1,2,,)j j y f x j n == ,若存在n 次多项式

2012()n n n p x a a x a x a x =++++ (3.1.1) 使得

(),(0,1,2,,)n j j p x y j n == (3.1.2) 成立,则称()n p x 为()f x 的插值多项式,012,,,,n x x x x 为插值结点,()f x 为插值函数.

3.2 Hermite 插值方法

Hermite 插值方法可以处理插值条件中合导数值的插值问题,即知道插值结点处的

函数值以及导数值,求插值多项式的插值问题. 3.2.1 三次Hermite 插值

考虑两个插值结点的情形,设01a x x b ≤<≤,函数()[,]f x c a b '∈且已知

00110011(),(),(),()f x y f x y f x m f x m ''====, 在区间[,]a b 上求三次插值函数

230123()H x a a x a x a x =+++ (3.2.1.1) 使其满足插值条件

(),(),(

0,j j j j H x y H x m j '==

=. (3.2.1.2)

定理3.2.1.1[9] 满足插值条件(3.2.1.2)的三次Hermite 插值多项式是存在且唯一的.

证明:由插值条件得线性方程组

23

00000231111122000231111101230123a y x x x a y x x x a m x x a m x x ?????? ??? ? ??? ?= ??? ? ???

? ? ? ???

???? (3.2.1.3)

考虑系数矩阵行列式,利用行列式的拉普拉斯展开定理,可得

23

000234

111102

002

1111()01230123x x x x x x x x x x x x =-- (3.2.1.4) 故系数矩阵非奇异,线性方程组(3.1.2.3)有唯一解,从而三次多项式存在且唯一.

例 1 求满足插值条件0011()1,()0,()0,()0x x x x αααα''====的三次插值多项式

()x α,以及满足插值条件0101()0,()0,()1,()0

x x x x ββββ''====的三次插值多项式()x β.

解:由于1x 是三次多项式()x α的二重零点,故可设

2121)()()(x c x x x c α+-=

由插值条件00)1,()0(x x αα'==得

210201)()1(x c x x c +-=, 210110201()2()()0x x c x c x x c -++-=

求解得

012

323

010101221

,()()()x c x x x x x x c =-

=+--- 代入

2121)()()(x c x x x c α+-=

整理得

2

011010

)()()(12

x x x x x x x x x α----=+ 现求()x β,由于1x 是三次多项式()x β的二重零点,0x 是一重零点,故可设

201)()()(x x x c x x β-=-

由插值条件0()1x β='得

2010001)2()()]1[(x x x x x c x -+--=

求解得

2

101

()x x c -=

所以

2

1010

)(

)()(x x x x x x x β--=- 注:例题中的两个特殊的插值函数实际上是两点Hermite 插值的基函数.

定理3.2.1.2[9] 两点Hermite 插值函数可以用基函数的方法表示为

00110011()()()()()x y x m x m x H x y ααββ+++=,01,][x x x ∈ (3.2.1.5)

其中

2

01010102

0111010

2

10010

2

01110

()(12

)()()(12

)()()()()

()()(

)x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x αββα--=+----=+---=---=--

注:定理3.2.1.2中的0101(),(),(),()x x x x αββα为Hermite 插值基函数,其中

1 () ()00 i j i j i j

x x i j αβ=?==?≠?

1 () ()00

i j i j i j

x x i j βα=?''==?≠?

例2 给定(1)0,(1)4,(1)2,(1)0f f f f ''-==-==,求Hermite 插值多项式. 解:30101()0()4()2()0()H x h x h x g x g x =+++. 显然本题不必计算01(),()h x g x .

2

2

1(1)(1)()12(2)(1)4111(1)x x h x x x ??---??=+=-+

? ?----?

??? 2

2

01()((1))(1)(1)411x g x x x x -??=--=+- ?--??

310()4()2()H x h x g x =+

2231

()(2)(1)(1)(1)2

H x x x x x =-+++-

3.3 基于Hermite 插值的分段曲线拟合基本原理的主要步骤

第一步:根据给出的数据做出其散点图,

第二步:分析散点图的特点,通过拟合试验确定分段拟合函数, 第三步:采用MATLAB 编程求得分段拟合函数的表达式, 第四步:利用Hermite 插值求出分段边界点的插值多项式, 第五步:将插值多项式与分段拟合函数连接成连续的拟合曲线.

4 实例应用

例3 在农业生产试验研究中,对某地区土豆的产量与化肥的关系做了一实验, 得到磷肥的施肥量与土豆产量的对应关系如表4-1所示.

根据上表的数据给出土豆产量与磷肥的关系做出其散点图,如图4-1所示.

土豆产量(公斤)

0510152025303540450

50

100

150

200

250

300

350

400

土豆产量(公斤)

图4-1磷肥的施肥量与土豆产量对应关系的散点图

从图可看出从 0 到 98、从 98 到 342 之间分别呈明显的线性关系, 由此可选取所求拟合函数为一分段的线性函数作拟合试验,换言之,用前 5 点作一线性拟合函数,再用后 5个点也作一线性拟合函数.

采用MATLAB 编程(见附录1)求得,对磷肥的分段拟合函数

0.084432.0771

0.009039.1303x y x +?=?

+?

分段拟合图如图4-2所示.

图4-2磷肥的施肥量与土豆产量分段拟合曲线图

考虑到边界点不连续,采用两点三次Hermite 插值使边界点连续的方法,由于

(98)40.3483,(147)40.4533,(98)0.0844,(147)0.0090y y y y ''====,故可以设其Hermite 插值多项式为

30101()40.3483()40.4533()0.0844()0.0090()H x h x h x g x g x =+++

经计算得

22322

40.3483(147)(2147)40.4533(98)(3432)

()117649

0.0844(147)(98)0.0090(98)(147)2401

x x x x H x x x x x --+--=

--+--+

323()0.00003711550.0144093294 1.839257142936.444499972H x x x x =-+- 将插值多项式与分段边界点连接便可以得到连续的拟合曲线图,达到较好的拟合效果. 拟合曲线图如图4-3所示(程序见附录2).

图4-3磷肥的施肥量与土豆产量的Hermite 插值分段拟合曲线图

例4 弹簧受力F 的作用伸长x ,F 与x 在一定范围内服从虎克定律:F kx =(x 为弹性系数),呈线性关系;但当F 增加到一定值后,不再服从虎克定律.一次试验测得的数据如表4-2所示,其散点图如图4-4所示.

x (cm) 1 3 5 7 9 11 12 14 16 18 F (N)

1.9

5.3

8.6

12.1

15.7

16.8

19.2

20.7

21.4

21.8

图4-4弹簧受力与伸长量的关系的散点图

通过散点图先拟合试验,得出前5个点可用线性拟合,后5个点可作二次函数拟合;同样采用分段拟合的方法,方法同例3(可设211221202,y kx b y a a x a x =+=++).运行程序(见附录3)可得0120.1350; 4.5518;16.5508; 1.7200;0.1200a a a k b =-==-==.同样将拟合函数的边界点采用两点三次Hermite 插值.

由(9)15.6000,(11)17.1840,(9) 1.7200,(11) 1.5818y y y y ''====,采用MATLAB 编程(见附录4)求得插值多项式为

3230.429449999999999712.91805000000000129.8885499999999 420.1039499999994

H x x x

=-+-

再用插值多项式连接分段拟合曲线的边界点便可得到较好的拟合图形,拟合曲线如图4-5所示(程序见附录5).

图4-5弹簧受力与伸长量的Hermite 插值分段拟合曲线图

例5 在油页高温分解的过程中,一种苯有机分解成沥青及其他物质,要了解沥青在一定温度下随时间t (分钟)变化的相对浓度y (%)之间的关系.试验如表4-3所示,

散点图如图4-6所示.

图4-6沥青的相对浓度与时间变化的关系的散点图

同样通过散点图先作拟合试验,得出前5个点可采用三次多项式拟合,后5个点可采用二次多项式拟合,可设分段拟合函数为

322

11121314212223,y a x a x a x a y b x b x b =+++=++ 运行程序(见附录6)得出

12341230.0002;0.0285; 1.5456;7.4491

0.0013;0.1747;16.2750

a a a a

b b b ==-==-=-== 再将拟合函数的边界点采用两点三次Hermite 插值,由

(65)20.4974,(80)22.2531,(65)0.3756,(80)0.3827y y y y ''====

采用MATLAB 编程(见附录7)计算求得插值多项式为

3230.0023298074074074070.506496444444444036.68982888888888 864.2173592592588

H x x x

=-+-

将插值多项式连接分段拟合曲线的边界点后得到的拟合曲线图,拟合曲线见图4-7(程序见附录8).

图4-7沥青的相对浓度与时间变化的关系的Hermite插值分段拟合图

5 结束语

本文介绍最小二乘多项式曲线拟合的基本原理,在具体介绍线性拟合、多项式拟合的基本及方法的基础上,给出了分段曲线拟合的方法与步骤.分段曲线拟合是一种常用的数据处理方法,但是在分段点处往往不能满足连续与光滑,针对这一问题,本文进一步给出了Hermite插值的基本原理,并采用两点三次Hermite插值连接分段曲线,从而使分段点处满足一阶连续,最后通过三个实例表明该方法的拟合效果较好.

另外,本文仅讨论了使用Hermite插值连接分段线性、分段多项式曲线拟合的方法,对其他种类的曲线未作讨论.事实上,两点三次Hermite插值的方法连接其他种类的拟合曲线同样适用.

参考文献

[1] 聂翔, 张瑞林. 最小二乘法在曲线拟合中的实现[J]. 陕西工学院学报, 2000, 3: 79-82.

[2] 张东林. 分段最小二乘曲线拟合[J]. 沈阳大学学报(自然科学版), 1994, 2: 80-83.

[3] 刘晓莉, 陈春梅. 基于最小二乘原理的分段曲线拟合法[J]. 伊犁教育学院学报, 2004, 17(3):

131-136.

[4] 蔡山, 张浩, 陈洪辉, 等. 基于最小二乘法的分段三次曲线拟合方法研究[J]. 科学技术与工程,

2007, 7(3): 352-355.

[5] 张浩, 任义广, 沙基昌. 基于分段三次曲线拟合的广州周发案量预测[J]. 计算机仿真, 2008, 25(6):

257-260.

[6] Roychowdhury S. Fuzzy curve fitting using least square principles[J]. IEEE International Conference

on Systems, Man and Cybemetics, 1998, 4: 4022-4027.

[7] 高伟, 姜水生. 分段曲线拟合与离散度加权的数据误差处理方法[J]. 中国测试技术, 2005, 11:

55-56.

[8] 张兴元. 分段函数的光滑方法及其在曲线拟合中的应用[J]. 西南民族大学学报(自然科学

版),2007, 33(3): 486-490.

[9] 钟尔杰, 黄延祝. 数值分析(第四版) [M]. 北京: 高等教育出版社, 2004.

[10] 韩中庚. 数学建模方法及其应用[M]. 北京: 高等教育出版社, 2005.

[11] 刘卫国. MA TLAB程序设计与应用(第二版) [M]. 北京: 高等教育出版社, 2006.

致谢

经过几个月的努力和忙碌,本次毕业论文即将完成,对为一个本科生的毕业论文,由于经验不足,难免有许多地方考虑不全面,如果没有指导老师的督促与辛勤的指导,以及一起学习的同学们的帮助与支持,想顺利的完成这篇论文比较难.

值此论文完成之际,首先对指导老师李军成老师表示最诚挚的感谢与崇高的敬意.李老师严谨的治学态度,深厚渊博的学术素养,敏锐的思维,积极进去的精神,严以律己,宽以待人的崇高品质,乐观向上的人生态度,谦逊和蔼的为人品德,平等的师生关系,尤其是认真负责的工作态度均给我留下了不可磨灭的印象,相信对我今后的学习、工作以及生活都会有着深远的影响.

感谢陈国华主任、杨笃庆书记、谭本远主任等数学系领导们,你们认真负责的治学态度和高速度、高效率的办事方式深深的感染了我们,让我们能够时时刻刻提醒自己要认真负责对待每件事情、每一个环节,感谢梁经珑老师、杨涤尘老师、余星老师、李军成老师、邓华老师、钟月娥老师、孙红果老师、李兵老师、龙承星老师等数学系的老师们,你们的授课方式与渊博的知识深化了我们的知识面,拓广了我们的视野,使我们对数学有了更浓厚的兴趣与体会.感谢杜鹃老师、郑丽峰老师,你们热忱的帮助使我们有一个很好的学习氛围来完成论文.

在本文的写作过程中,李军成老师,石小芳、彭迪、方其斌等同学提出了许多宝贵的意见,此论文的完成离不开他们的指导,特别是李军成老师;他们渊博的学识与敏锐的头脑让我受益匪浅.再次对帮助我的人表示衷心的感谢.

附录1 磷肥的施肥量与土豆产量的分段拟合函数程序

x=[0,24,49,73,98,147,196,245,294,342];

y=[33.46,32.47,36.06,37.96,41.04,40.09,41.26,42.17,40.36,42.73];

plot(x,y,'r+')

a1=polyfit(x(1:5),y(1:5),1)

a2=polyfit(x(6:10),y(6:10),1)

xx1=0:98; yy1=a1(1)*xx1+a1(2);

xx2=147:342; yy2=a2(1)*xx2+a2(2);

plot(x,y,'r+',xx1,yy1,xx2,yy2)

附录2 磷肥的施肥量与土豆产量的Hermite插值的分段拟合曲线图程序x=[0,24,49,73,98,147,196,245,294,342];

y=[33.46,32.47,36.06,37.96,41.04,40.09,41.26,42.17,40.36,42.73];

plot(x,y,'r+')

a1=polyfit(x(1:5),y(1:5),1)

a2=polyfit(x(6:10),y(6:10),1)

xx1=0:0.01:98; yy1=a1(1)*xx1+a1(2);

xx2=147:0.01:342; yy2=a2(1)*xx2+a2(2);

xx3=98:0.01:147;yy3=0.0000371155*xx3.^3-0.0144093294*xx3.^2+1.83925 71429*xx3-36.444499972;

plot(x,y,'r+',xx1,yy1,xx2,yy2,xx3,yy3)

附录3 弹簧受力与伸长量的关系的分段拟合函数程序

x=[1,3,5,7,9,11,12,14,16,18];

y=[1.9,5.3,8.6,12.1,15.7,16.8,19.2,20.7,21.4,21.8];

plot(x,y,'r+')

a1=polyfit(x(1:5),y(1:5),1)

a2=polyfit(x(6:10),y(6:10),2)

xx1=1:0.01:9; yy1=a1(1)*xx1+a1(2);

xx2=11:0.01:18; yy2=a2(1)*xx2.^2+a2(2)*xx2+a2(3);

plot(x,y,'r+',xx1,yy1,xx2,yy2)

附录4 弹簧受力与伸长量的关系的两点三次Hermite插值多项式程序format long e

clf,clear,

x0=9;x1=11;y0=15.6000;y1=17.1840;m0=1.7200;m1=1.5818;

x=linspace(9,11,100);

y=linspace(15.6000,17.1840,100);

m=2*(y0-y1)+(m0+m1)*(x1-x0);

n=3*(x0+x1)*y1-3*(x0+x1)*y0-(2*x1+x0)*m0*(x1-x0)-(2*x0+x1)*(x1-x0)

*m1;

k=6*x0*x1*(y0-y1)+(x1-x0)*((m0*x1.^2+m1*x0.^2)+2*x1*x0*(m0+m1));

q=x1.^2*(x1-3*x0)*y0+x0.^2*(3*x1-x0)*y1-x0*x1*(x1-x0)*(x1*m0+x0*m1

);

p=(x1-x0).^3;

a=m/p

b=n/p

c=k/p

d=q/p

y=a*x.^3+b*x.^2+c*x+d;

plot(x,y,'r-')

附录5 弹簧受力与伸长量的Hermite插值的分段拟合曲线图程序

x=[1,3,5,7,9,11,12,14,16,18];

y=[1.9,5.3,8.6,12.1,15.7,16.8,19.2,20.7,21.4,21.8];

plot(x,y,'r+')

a1=polyfit(x(1:5),y(1:5),1)

a2=polyfit(x(6:10),y(6:10),2)

xx1=1:0.01:9; yy1=a1(1)*xx1+a1(2);

xx2=11:0.01:18; yy2=a2(1)*xx2.^2+a2(2)*xx2+a2(3);

xx3=9:0.01:11;yy3=0.4294499999999997*xx3.^3-12.91805000000000*xx3.

^2+129.8885499999999*xx3-420.1039499999994;

plot(x,y,'r+',xx1,yy1,xx2,yy2,xx3,yy3)

附录6 沥青的相对浓度与时间变化的关系分段拟合函数程序

x=[5,15,20,50,65,80,100,120,160,180];

y=[0,8.0,15.1,20.1,20.5,22.0,20.9,18.2,11.5,5.5];

plot(x,y,'r+')

a1=polyfit(x(1:5),y(1:5),3)

a2=polyfit(x(6:10),y(6:10),2)

xx1=5:0.01:65; yy1=a1(1)*xx1.^3+a1(2)*xx1.^2+a1(3)*xx1+a1(4);

xx2=80:0.01:180; yy2=a2(1)*xx2.^2+a2(2)*xx2+a2(3);

plot(x,y,'r+',xx1,yy1,xx2,yy2)

附录7 沥青的相对浓度与时间变化的两点三次Hermite插值多项式程序format long e

clf,clear,

x0=65;x1=80;y0=20.4974;y1=22.2531;m0=0.3756;m1=0.3827;

x=linspace(65,80,100);

y=linspace(20.4974,22.2531,100);

m=2*(y0-y1)+(m0+m1)*(x1-x0);

n=3*(x0+x1)*y1-3*(x0+x1)*y0-(2*x1+x0)*m0*(x1-x0)-(2*x0+x1)*(x1-x0) *m1;

k=6*x0*x1*(y0-y1)+(x1-x0)*((m0*x1.^2+m1*x0.^2)+2*x1*x0*(m0+m1));

q=x1.^2*(x1-3*x0)*y0+x0.^2*(3*x1-x0)*y1-x0*x1*(x1-x0)*(x1*m0+x0*m1 );

p=(x1-x0).^3;

a=m/p

b=n/p

c=k/p

d=q/p

y=a*x.^3+b*x.^2+c*x+d;

plot(x,y,'r-')

附录8 沥青的相对浓度与时间变化的Hermite插值的分段拟合曲线图程序x=[5,15,20,50,65,80,100,120,160,180];

y=[0,8.0,15.1,20.1,20.5,22.0,20.9,18.2,11.5,5.5];

plot(x,y,'r+')

a1=polyfit(x(1:5),y(1:5),3)

a2=polyfit(x(6:10),y(6:10),2)

xx1=5:0.01:65;yy1=a1(1)*xx1.^3+a1(2)*xx1.^2+a1(3)*xx1+a1(4);

xx2=80:0.01:180;yy2=a2(1)*xx2.^2+a2(2)*xx2+a2(3);

xx3=65:0.01:80;yy3=0.002329807407407407*xx3.^3-0.5064964444444440 *xx3.^2+ 36.68982888888888*xx3-864.2173592592588;

plot(x,y,'r+',xx1,yy1,xx2,yy2,xx3,yy3)

spss曲线拟合与回归分析

曲线拟合与回归分析 1、有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下: (1)说明两变量之间的相关方向; (2)建立直线回归方程; (3)计算估计标准误差; (4)估计生产性固定资产(自变量)为1100万元时的总资产(因变量)的可能值。 解:由表格易知:工业总产值是随着生产性固定资产价值的增长而增长的,而知之间存在正向相关性。 用spss回归有: (2)、可知:若用y表示工业总产值(万元),用x表示生产性固定资产,二者可用如下的表达式近似表示: =x .0+ y . 567 395 896

(3)、用spss回归知标准误差为80.216(万元)。 (4)、当固定资产为1100时,总产值可能是(0.896*1100+395.567-80.216~0.896*1100+395.567+80.216)即(1301.0~146.4)这个范围内的某个值。 另外,用MATLAP也可以得到相同的结果: 程序如下所示: function [b,bint,r,rint,stats] = regression1 x = [318 910 200 409 415 502 314 1210 1022 1225]; y = [524 1019 638 815 913 928 605 1516 1219 1624]; X = [ones(size(x))', x']; [b,bint,r,rint,stats] = regress(y',X,0.05); display(b); display(stats); x1 = [300:10:1250]; y1 = b(1) + b(2)*x1; figure;plot(x,y,'ro',x1,y1,'g-'); industry = ones(6,1); construction = ones(6,1); industry(1) =1022; construction(1) = 1219; for i = 1:5 industry(i+1) =industry(i) * 1.045; construction(i+1) = b(1) + b(2)* construction(i+1); end display(industry); display( construction); end 运行结果如下所示:b = 395.5670 0.8958 stats = 1.0e+004 * 0.0001 0.0071 0.0000 1.6035 industry = 1.0e+003 * 1.0220 1.0680 1.1160 1.1663 1.2188 1.2736

曲线拟合的数值计算方法实验

曲线拟合的数值计算方法实验 【摘要】实际工作中,变量间未必都有线性关系,如服药后血药浓度与时间的关系;疾病疗效与疗程长短的关系;毒物剂量与致死率的关系等常呈曲线关系。曲线拟合(curve fitting)是指选择适当的曲线类型来拟合观测数据,并用拟合的曲线方程分析两变量间的关系。曲线直线化是曲线拟合的重要手段之一。对于某些非线性的资料可以通过简单的变量变换使之直线化,这样就可以按最小二乘法原理求出变换后变量的直线方程,在实际工作中常利用此直线方程绘制资料的标准工作曲线,同时根据需要可将此直线方程还原为曲线方程,实现对资料的曲线拟合。常用的曲线拟合有最小二乘法拟合、幂函数拟合、对数函数拟合、线性插值、三次样条插值、端点约束。 关键词曲线拟合、最小二乘法拟合、幂函数拟合、对数函数拟合、线性插值、三次样条插值、端点约束 一、实验目的 1.掌握曲线拟合方式及其常用函数指数函数、幂函数、对数函数的拟合。 2.掌握最小二乘法、线性插值、三次样条插值、端点约束等。 3.掌握实现曲线拟合的编程技巧。 二、实验原理 1.曲线拟合 曲线拟合是平面上离散点组所表示的坐标之间的函数关系的一种数据处理方法。用解析表达式逼近离散数据的一种方法。在科学实验或社会活动中,通过 实验或观测得到量x与y的一组数据对(X i ,Y i )(i=1,2,...m),其中各X i 是彼此不同的。人们希望用一类与数据的背景材料规律相适应的解析表达式,y=f(x,c)来反映量x与y之间的依赖关系,即在一定意义下“最佳”地逼近或 拟合已知数据。f(x,c)常称作拟合模型,式中c=(c 1,c 2 ,…c n )是一些待定参 数。当c在f中线性出现时,称为线性模型,否则称为非线性模型。有许多衡量拟合优度的标准,最常用的一种做法是选择参数c使得拟合模型与实际观测值在

样条曲线的使用方法完整版

样条曲线的使用方法 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

创建高级曲线 曲线作为构建三维模型的基础,在三维建模过程中有着不可替代的作用,尤其是在创建高级曲面时,使用基本曲线构造远远达不到设计要求,不能构建出高质量、高难度的三维模型,此时就要利用UG NX中提供的高级曲线来作为建模基础,具体包括样条曲线、双曲线、抛物线、螺旋线等。 样条曲线是指通过多项式曲线和所设定的点来拟台曲线,其形状由这些点来控制。样条曲线采用的是近似的创建方法,很好地满足了设计的需求,是一种用途广泛的曲线。它不仅能够创建自由曲线和曲面,而且还能精确表达圆锥曲面在内的各种几何体的统表达式。在UG NX中,样条曲线包括般样条曲线和艺术样条曲线两种类型。 1.创建一般样条曲线 一般样条曲线是建立自由形状曲面(或片体)的基础。它拟合逼真、彤状控制方便,能够满足很人一部分产品设计的要求。一般样条曲线主要用来创建高级曲面,广泛应用于汽车、航空以及船舶等制造业。在“曲线”工具栏中单击“样条”按钮~,打开“样条”对话框,如图5-30所示。在该对话框中提供了以下4种生成一般样条曲线的方式。 ■根据极点 该选项是利用极点建立样条曲线,即用选定点建立的控制多边形来控制样条的形状,建立的样条只通过两个端点,不通过中问的控制点。 选择“根据极点”选项,在打开的对话框中选择生成曲线的类型为“多段”,并在“曲线阶次”文本框中输入曲线的阶次,然后根据“点”对话框在绘图区指定点使其生成样条曲线,最后单击“确定”按钮,生成的样条曲线如图5-31所示。

SPSS线性回归描述

SPSS 10.0高级教程十二:多元线性回归与曲线拟合 2009年,国内生物医药的突破之年。不仅有干细胞发现的新突破,还有转基因作物政策的新举措。 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。 §10.1Linear过程 10.1.1 简单操作入门 调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。 例10.1:请分析在数据集Fat surfactant.sav中变量fat对变量spovl的大小有无影响? 显然,在这里spovl是连续性变量,而fat是分类变量,我们可用用单因素方差分析来解决这个问题。但此处我们要采用和方差分析等价的分析方法--回归分析来解决它。 回归分析和方差分析都可以被归入广义线性模型中,因此他们在模型的定义、计算方法等许多方面都非常近似,下面大家很快就会看到。 这里spovl是模型中的因变量,根据回归模型的要求,它必须是正态分布的变量才可以,我们可以用直方图来大致看一下,可以看到基本服从正态,因此不再检验其正态性,继续往下做。 10.1.1.1 界面详解 在菜单中选择Regression==>liner,系统弹出线性回归对话框如下:

除了大家熟悉的内容以外,里面还出现了一些特色菜,让我们来一一品尝。 【Dependent框】 用于选入回归分析的应变量。 【Block按钮组】 由Previous和Next两个按钮组成,用于将下面Independent框中选入的自变量分组。由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。下面的例子会讲解其用法。 【Independent框】 用于选入回归分析的自变量。 【Method下拉列表】 用于选择对自变量的选入方法,有Enter(强行进入法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。该选项对当前Independent框中的所有变量均有效。

曲线拟合的方法及过程

一、课程设计题目: 对于函数 x e x x f --=)( 从00=x 开始,取步长1.0=h 的20个数据点,求五次最小二乘拟合多项式 5522105)()()()(x x a x x a x x a a x P -++-+-+= 其中 ∑ ===19 95.020 i i x x 二、原理分析 (1)最小二乘法的提法 当数据量大且由实验提供时,不宜要求近似曲线)(x y φ=严格地经过所有数据点),(i i y x ,亦即不应要求拟合函数)(x ?在i x 处的偏差(又称残差) i i i y x -=)(φδ (i=1,2,…,m) 都严格的等于零,但是,为了使近似曲线能尽量反应所给数据点的变化趋势,要求偏差i δ适当的小还是必要的,达到这一目标的途径很多,例如,可以通过使最大偏差i δmax 最小来实现,也可以通过使偏差绝对值之和∑i i δ最小来实 现……,考虑到计算方便等因素,通常用使得偏差平方和∑i i 2δ最小(成为最小 二乘原则)来实现。 按最小二乘原则选择近似函数的方法称为最小二乘法。 用最小二乘法求近似函数的问题可以归结为:对于给定数据),(i i y x (i=1,2,…,m),要求在某个函数类Φ中寻求一个函数)(x * ?,使 [][]2 1 )(2 1 * )()(mi n ∑∑=Φ∈=-=-m i i i x m i i i y x y x ??? (1-1) 其中)(x ?为函数类Φ中任意函数。 (1)确定函数类Φ,即确定)(x ?的形式。这不是一个单纯的数学问题,还与其他领域的一些专业知识有关。在数学上,通常的做法是将数据点),(i i y x 描

最新利用SPSS拟合非线性回归模型

利用S P S S拟合非线性回归模型

利用SPSS拟合非线性回归模型 ——以S型曲线为例 1.原始数据 下表给出了某地区1971—2000年的人口数据(表1)。试用SPSS软件对该地区的人口变化进行曲线拟合,并对今后10年的人口发展情况进行预测。 表1 某地区人口变化数据 年份时间变量t=年份-1970 人口y/人 1971133 815 1972233 981 1973334 004 1974434 165 1975534 212 1976634 327 1977734 344 1978834 458 1979934 498 19801034 476 19811134 483 19821234 488 19831334 513 19841434 497 19851534 511 19861634 520 19871734 507 19881834 509 19891934 521 19902034 513 19912134 515 19922234 517 19932334 519 19942434 519 19952534 521 19962634 521 19972734 523

1998 28 34 525 1999 29 34 525 2000 30 34 527 根据上表中的数据,做出散点图,见图1。 , 33700 33800 3390034000341003420034300 3440034500346001970197219741976197819801982198419861988199019921994199619982000 年份 人口 图1 某地区人口随时间变化的散点图 从图1可以看出,人口随时间的变化呈非线性过程,而且存在一个与横坐标轴平行的渐近线,近似S 曲线。 下面,我们用SPSS 软件进行非线性回归分析拟合计算。 2.用SPSS 进行回归分析拟合计算 在SPSS 中可以直接进行非线性拟合,步骤如下(假定已经进行了数据输入,关于数据输入方法见SPSS 相关基础 教程):

一种分段曲线拟合方法研究

一种分段曲线拟合方法研究 摘要:分段曲线拟合是一种常用的数据处理方法,但在分段点处往往不能满足连续与光滑.针对这一问题,本文给出了一种能使分段点处连续的方法.该方法首先利用分段曲线拟合对数据进行处理;然后在相邻两段曲线采用两点三次Hermite插值的方法,构造一条连结两条分段曲线的插值曲线,从而使分段点处满足一阶连续.最后通过几个实例表明该方法简单、实用、效果较好. 关键词:分段曲线拟合Hermite插值分段点连续 Study on A Method of Sub-Curve Fitting Abstract:Sub-curve fitting is a commonly used processing method of data, but at sub-points it often does not meet the continuation and smooth, in allusion to to solve this problem, this paper presents a way for making sub-point method continuous. Firstly, this method of sub-curve fitting deals with the data; and then uses the way of t wo points’ cubic Hermite interpolation in the adjacent, structures a interpolation curve that links the two sub-curves, so the sub-point meets first-order continuation; lastly, gives several examples shows that this method is simple, practical and effective. Key words:sub-curve fitting Hermite interpolation sub-point continuous

样条插值和曲线拟合

第三章 样条插值和曲线拟合 1.x y = 有如下的函数表 8。 解 先作差商表 4 167 1210 13 9 3 42015 11008 16012 4 60 13 1611 1 10 0-?- -- 故:8.2)48(5 1 2)8(1=-+=p 819047619.2) 98)(48(210 1 )48(512)8(2=----+=p 844444.2)98)(48)(18(3 4201) 48)(18(601 )18(311)8(3=---?+----+=p 6222.2)1(4781008 1478601) 18(86 1 )08(10)8(4=-???-??+---?+=p 已知 828427.28=,因此选定 )8(,16,9,42321p x x x ===最接近8。 利用Neville 方法得: xi 8-xi f(xi) 2.8284271 8 0 8 1 7 1 -1.33333333 3.3333333 2.4 4 4 2 2.866666667 2.6222222 2.8 2.8444444 9 -1 3 2.819047619 2.8571429 16 -8 4 f(8)= 2.828427125 xi 8-xi f(xi) 8 0 8 1 7 1 -1 1/3 3 1/3 2 2/5 4 4 2 2 13/15 2 28/45 2 4/5 2 38/45 9 -1 3 2 86/105 2 6/7 16 -8 4 已知 828427.28=,故选定)8(,16,9,42321 p x x x ====2.819047619最接近8.

实验数据与曲线拟合

实验数据与曲线拟合 1. 曲线拟合 1. 曲线拟合的定义 2. 简单线性数据拟合的例子 2. 最小二乘法曲线拟合 1. 最小二乘法原理 2. 高斯消元法求解方程组 3. 最小二乘法解决速度与加速度实验 3. 三次样条曲线拟合 1. 插值函数 2. 样条函数的定义 3. 边界条件 4. 推导三次样条函数 5. 追赶法求解方程组 6. 三次样条曲线拟合算法实现 7. 三次样条曲线拟合的效果 4. 12.1 曲线拟合 5. 12.1.1 曲线拟合的定义 6. 曲线拟合(Curve Fitting)的数学定义是指用连续曲线近似地刻画或比拟平面上一组离散点所表示的坐 标之间的函数关系,是一种用解析表达式逼近离散数据的方法。曲线拟合通俗的说法就是“拉曲线”,也就是将现有数据透过数学方法来代入一条数学方程式的表示方法。科学和工程遇到的很多问题,往往只能通过诸如采样、实验等方法获得若干离散的数据,根据这些数据,如果能够找到一个连续的函数(也就是曲线)或者更加密集的离散方程,使得实验数据与方程的曲线能够在最大程度上近似吻合,就可以根据曲线方程对数据进行数学计算,对实验结果进行理论分析,甚至对某些不具备测量条件的位置的结果进行估算。 7. 12.1.2 简单线性数据拟合的例子 8. 回想一下中学物理课的“速度与加速度”实验:假设某物体正在做加速运动,加速度未知,某实验人员 从时间t0 = 3秒时刻开始,以1秒时间间隔对这个物体连续进行了12次测速,得到一组速度和时间的离散数据,请根据实验结果推算该物体的加速度。 9. 表 12 – 1 物体速度和时间的测量关系表 10. 在选择了合适的坐标刻度之后,我们就可以在坐标纸上画出这些点。如图12–1所示,排除偏差明显 偏大的测量值后,可以看出测量结果呈现典型的线性特征。沿着该线性特征画一条直线,使尽量多的测量点能够位于直线上,或与直线的偏差尽量小,这条直线就是我们根据测量结果拟合的速度与时间的函数关系。最后在坐标纸上测量出直线的斜率K,K就是被测物体的加速度,经过测量,我们实验测到的物体加速度值是1.48米/秒2。

曲线回归估计的SPSS分析

上机操作8 曲线回归估计的SPSS分析 习题:落叶松林单位面积的蓄积量(V)和胸高断面积(D)的测定数据如下表, (1)定义变量:打开SPSS数据编辑器,点击“变量视图”,在名称列下输入“V”、“D”,改“类型”栏均为“数字”,“小数”栏分别保留0位和1位。 (2)输入数据:在“数据视图”模式 下,在各名称列输入相应的数据,如图所 示: 二、分析过程 分析→回归→曲线估计,将“V”添加 到“因变量”中,将“D”添加到“变量” 中,勾选模型中的“二次模型”、“复合”、 “对数”、“立方模型”、“指数”、“幂”、“”、 “Logistic”,→确定。 三、输出结果分析 曲线拟合 MODEL: MOD_1. Dependent variable.. V Method.. LOGARITH(对数曲线模型) Listwise Deletion of Missing Data Multiple R (负相关系数) .97210 R Square(决定系数) .94498 Adjusted R Square .93811 Standard Error 6.59944 Analysis of Variance(方差分析): DF(自由度) Sum of Squares Mean Square(均方) Regression(回归) 1 5984.4787 5984.4787 Residuals(残差) 8 348.4213 43.5527 F = 137.40787 Signif F = .0000 (小于0.05,具有极显著性) -------------------- Variables in the Equation (方程中的变量)-------------------- Variable B(系数) SE B Beta T Sig T(T的显著性水平) D 78.152283 6.667083 .972102 11.722 .0000(小于0.05) (Constant) -77.682919 14.110257 -5.505 .0006(小于0.05)分析可知:蓄积量(V)与胸高段面积(D)的相关性为0.97210,它们的F 检验Sig.<0.01,说明蓄积量(V)与胸高段面积(D)达到极显著水平,即蓄积量(V)与胸高段面积(D)的方程具有统计学意义。胸高段面积(D)的T检验Sig.<0.01,说明胸高段面积(D)前的系数具有统计学意义。其方程如下: V=78.152283*ln(D)-77.682919

origin两条曲线拟合步骤

o r i g i n两条曲线拟合步 骤 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

以英文版origin75为例: 首先是输入数据(以两个拟合曲线为例): 一、在origin里面增加两列:点击鼠标右键,选择add new column, 二、选择C列,并将 其设为X(点击鼠标 右键选择) 三、从excel表格中选择需要的数据复制过来 然后是曲线拟合: 一、画散点图 全选数据后点击表格左下角的散点符号即可画出散点图 二、断开两组数据的关联 任选一点,双击,将dependent改为independent 三、第一条曲线拟合 单击最小梯度数据点,然后选择analysis→fit exponential decay→ first order 这样第一条线就拟合出来了 四、第二条曲线拟合 拟合之前需要将第一条线的拟合方程剪切,因为直接拟合第二条会将第 一条曲线方程覆盖 先选择需要拟合的数据,选择data→2g1 data1:C(X),D(Y) 然后依旧是analysis→fit exponential decay→first order,然后将剪切的方程粘贴上去,这样两个方程 然后双击进行修 改。

去掉方程的文本框:鼠标放在文本框上,右键→properties→选择none即可 增加图名,右键add text即可。 最后是输出图件 一、输出图片格式 二、输出工程文件 file→export page file→save project as 单曲线拟合在输入数据的时候不需要增加列数,直接输入,然后拟合即可。 带有异常值的数据在输入时就要再增加两列输入异常值,并将其中一列设置为X,然后和两条曲线一样进行拟合即可。

Bezier曲线和BSpline曲线拟合问题

. .. Bzeier曲线和BSpline曲线的插值拟合问题 目录 一、问题重述 (1) 二、Bezier曲线的插值和拟合 (1) 2.1 Bezier曲线的定义 (1) 2.2 Bezier曲线的性质 (2) 2.3 三次Bezier曲线的插值 (2) 2.3.1 工程应用中常用的三次Bezier插值的算法 (2) 2.3.2 改进的三次Bezier插值的算法 (3) 2.3.3 两种Bezier插值的算法比较 (4) 2.4 Bezier曲线的拟合 (4) 三、BSpline曲线的插值和拟合 (4) 3.1 BSpline曲线的定义 (4) 3.2 B样条性质 (5) 3.3 均匀B样条 (5) 3.4 三次B样条插值算法 (6) 3.4 结合实际情况的三次样条插值算法改进 (7) 3.5 两种BSpline插值的比较 (8) 四、Bezier曲线与BSpline曲线的区别和联系 (8) 五、上述算法在实际血管提取中的应用 (9)

一、问题重述 在图像中任意点两个点,软件能自动提取出以这两点为端点的一段血管,要求提取到的血管必须经过客户所点的两点作为提取血管的两个端点。 在OnGetEdge()的函数里,首先通过自动增长获取血管两条边缘的采样点数据,接下来的问题就是要拟合这些采样点,生成两条比较光滑的血管边缘曲线。得到的拟合(插值)曲线有以下4点要求: 1、精确插入客户所点的起始点终点,作为曲线的两个端点; 2、拟合的曲线具有较好的光滑性 3、具有较高的拟合精度和较快的拟合速度 4、要求拟合曲线点八连通 上述的实际问题转化为有序离散点的插值拟合问题。所谓插值拟合,就是通过诸如采样、实验等方法获得若干离散的数据,根据这些数据,得到一个连续的函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。插值是曲线必须通过已知点的拟合。常用的插值方法有拉格朗日插值、牛顿插值、埃尔米特插值、样条函数插值等。 其中,样条插值可以使用低阶多项式样条实现较小的插值误差,这样就避免了使用高阶多项式所出现的龙格现象,所以样条插值得到了流行。三次B 样条插值不仅运行速度较快,而且因为其分段连续带来的特有的卓越的性能,有效提高了血管边缘的平滑程度,锯齿状的现象大大减少。本文接下来将主要介绍Bezier 曲线和B 样条的插值拟合。 二、Bezier 曲线的插值和拟合 2.1 Bezier 曲线的定义 【定义1】n 次Bezier 曲线是由n+1个控制点和以Bernstein 多项式为基底共同生成的参数曲线,其数学表达式为:,其中, 0()(),[0,1]n n i i i B t d b t t ==∈∑为控制点,为Bernstein 基。 (0,...,)i d i n =()(1),0,...,n n i i i n b t t t i n i -??=-= ???Fig.1是一条三次的Bezier 曲线,有四个控制点。工程应用上常使用二次或三次Bezier 曲线做采样点的插值拟合以及制图设计。

LOGISTIC人口预测模型的SPSS拟合方法分析

【摘要】logistic阻滞增长模型在人口预测中有着广泛应用,应用spss软件能较为简便地进行logistic曲线的拟合。文章介绍了spss拟合logistic人口预测方程的两种方法及其步骤,并通过其结果分析比较二者的优缺点。 【关键词】logistic;spss软件;拟合方法 logistic模型为荷兰数学家及生物学家verhulst.pearl在修正非密度方程时提出,其目的为研究受到生存资源制约的情况下生物种群的增长规律。在logistic模型中,有限空间内种群不能无限增长,而是存在着数量上限。由于自然资源、环境条件等因素对种群的增长起着阻滞作用,并且随着种群数量的增大,阻滞作用逐步增大,即实测增长率是一个减函数,且随着种群数量的增大而减小,当种群数量趋于上限时,种群增长亦趋于稳定。由于logistic 阻滞增长模型所需的数据少,计算简单,对中短期时间内的种群数量预测较为准确,亦常应用于人口预测方面。 一、logistic阻滞增长模型 如上文述,人口增长率为以人口数量x为自变量的函数r(x),这里r(x)为减函数。假设r(x)= r ?sx,s>0,这里r为初始值r(),即当人口无生存环境和资源限制时的固有增长率。当人口数量达到人口最大容量,将有r()=0,此时人口达到稳定状态。由线性关系r()=r-s,可得s=r/。假设x是时间t的函数x(t),从而有解变量可分离方程。 二、spss软件拟合logistic人口阻滞增长模型 通过模型方程(ⅰ)可知,logistic模型拟合的重点为参数和的确定。下采用两种spss 软件的回归拟合方法,利用1990-2010年人口调查数据(如表1)进行人口数量的预测。 (一)非线性回归(nonlinear regression)拟合 在spss(spss19.0)的变量视图中定义两变量人口数量x及年份t,在数据视图中由上而下录入人口数据(如图1所示)。 在菜单栏依次选择分析(analyze)―回归(regression)―非线性估计(nonlinear),打开非线性回归窗口。将年末总人口[x]送入因变量一栏,在模型表达式输入框中输入模型公式 a/(1 +(a / 114333 - 1)* exp(- r *(t - 1990)))(如图2)。此处以a代替人口最大容量,由于时间以1990年为初始年份,原方程中的t转为t-1990。选择“参数”项进行参数a和r初始值的设定(如图3),这里a初始值选择人数中的最大值134091(万人),r 的初始值选择1991年的人口增长率0.013,“使用上一分析的起始值”一栏选中,单击“继续”。单击“保存”项,打开对话框如图4,选中预测值和残差项,便于检验模型方程的拟合效果,选择“继续”返回非线性回归窗口,选择“确定”运行。在输出(output)窗口中,可以得到参数a的迭代计算过程、参数估计等内容。由参数估计得参数估计值,=0.0675。r2=1.000。 (二)曲线估计法 采用spss的曲线估计进行模型拟合,须先求参数。对估计的方法很多,这里采用三点法进行求取。 选择分析(analyze)―回归(regression)―曲线估计(curve estimation),打开曲线估计窗口,将年末总人口[x]和年份[t]分别送入因变量和自变量输入框,在“模型”区选中logistic,在上限一栏填入142515.5576,在“保存”对话框中选中预测值和残差,其他依照默认选择。选择“确定”。 三、对两种方法所得拟合方程的讨论 从可决系数r2来看,两种方法所得拟合方程的r2均得1,则两种方法对logistic人口预测模型的拟合性都很好。分别用两种方法所得方程对2011年和2012年的年末人口数进行

matlab实现插值法和曲线拟合电子教案

m a t l a b实现插值法和 曲线拟合

插值法和曲线拟合 电子科技大学 摘要:理解拉格朗日多项式插值、分段线性插值、牛顿前插,曲线拟合,用matlab编程求解函数,用插值法和分段线性插值求解同一函数,比较插值余项;用牛顿前插公式计算函数,计算函数值;对于曲线拟 合,用不同曲线拟合数据。 关键字:拉格朗日插值多项式;分段线性插值;牛顿前插;曲线拟合 引言: 在数学物理方程中,当给定数据是不同散点时,无法确定函数表达式,求解函数就需要很大的计算量,我们有多种方法对给定的表格函数进行求解,我们这里,利用插值法和曲线拟合对函数进行求解,进一步了解函数性质,两种方法各有利弊,适合我们进行不同的散点函数求解。 正文: 一、插值法和分段线性插值 1拉格朗日多项式原理 对某个多项式函数,已知有给定的k + 1个取值点: 其中对应着自变量的位置,而对应着函数在这个位置的取值。 假设任意两个不同的x j都互不相同,那么应用拉格朗日插值公式所得到的拉格朗日插值多项式为: 其中每个为拉格朗日基本多项式(或称插值基函数),其表达式为: [3] 拉格朗日基本多项式的特点是在上取值为1,在其它的点 上取值为0。 2分段线性插值原理 给定区间[a,b], 将其分割成a=x 0

1、曲线拟合及其应用综述

曲线拟合及其应用综述 摘要:本文首先分析了曲线拟合方法的背景及在各个领域中的应用,然后详细介绍了曲线拟合方法的基本原理及实现方法,并结合一个具体实例,分析了曲线拟合方法在柴油机故障诊断中的应用,最后对全文内容进行了总结,并对曲线拟合方法的发展进行了思考和展望。 关键词:曲线拟合最小二乘法故障模式识别柴油机故障诊断 1背景及应用 在科学技术的许多领域中,常常需要根据实际测试所得到的一系列数据,求出它们的函数关系。理论上讲,可以根据插值原则构造n 次多项式Pn(x),使得Pn(x)在各测试点的数据正好通过实测点。可是, 在一般情况下,我们为了尽量反映实际情况而采集了很多样点,造成了插值多项式Pn(x)的次数很高,这不仅增大了计算量,而且影响了函数的逼近程度;再就是由于插值多项式经过每一实测样点,这样就会保留测量误差,从而影响逼近函数的精度,不易反映实际的函数关系。因此,我们一般根据已知实际测试样点,找出被测试量之间的函数关系,使得找出的近似函数曲线能够充分反映实际测试量之间的关系,这就是曲线拟合。 曲线拟合技术在图像处理、逆向工程、计算机辅助设计以及测试数据的处理显示及故障模式诊断等领域中都得到了广泛的应用。 2 基本原理 2.1 曲线拟合的定义 解决曲线拟合问题常用的方法有很多,总体上可以分为两大类:一类是有理论模型的曲线拟合,也就是由与数据的背景资料规律相适应的解析表达式约束的曲线拟合;另一类是无理论模型的曲线拟合,也就是由几何方法或神经网络的拓扑结构确定数据关系的曲线拟合。 2.2 曲线拟合的方法 解决曲线拟合问题常用的方法有很多,总体上可以分为两大类:一类是有理论模型的曲线拟合,也就是由与数据的背景资料规律相适应的解析表达式约束的曲线拟合;另一类是无理论模型的曲线拟合,也就是由几何方法或神经网络的拓扑结构确定数据关系的曲线拟合。 2.2.1 有理论模型的曲线拟合 有理论模型的曲线拟合适用于处理有一定背景资料、规律性较强的拟合问题。通过实验或者观测得到的数据对(x i,y i)(i=1,2, …,n),可以用与背景资料规律相适应的解析表达式y=f(x,c)来反映x、y之间的依赖关系,y=f(x,c)称为拟合的理论模型,式中c=c0,c1,…c n是待定参数。当c在f中线性出现时,称为线性模型,否则称为非线性模型。有许多衡量拟合优度的标准,最常用的方法是最小二乘法。 2.2.1.1 线性模型的曲线拟合 线性模型中与背景资料相适应的解析表达式为: ε β β+ + =x y 1 (1) 式中,β0,β1未知参数,ε服从N(0,σ2)。 将n个实验点分别带入表达式(1)得到: i i i x yε β β+ + = 1 (2) 式中i=1,2,…n,ε1, ε2,…, εn相互独立并且服从N(0,σ2)。 根据最小二乘原理,拟合得到的参数应使曲线与试验点之间的误差的平方和达到最小,也就是使如下的目标函数达到最小: 2 1 1 ) ( i i n i i x y Jε β β- - - =∑ = (3) 将试验点数据点入之后,求目标函数的最大值问题就变成了求取使目标函数对待求参数的偏导数为零时的参数值问题,即: ) ( 2 1 1 = - - - - = ? ?∑ = i i n i i x y J ε β β β (4)

数值计算_第6章 曲线拟合的最小二乘法

第6章曲线拟合的最小二乘法 6.1 拟合曲线 通过观察或测量得到一组离散数据序列,当所得数据比较准确时,可构造插值函数逼近客观存在的函数,构造的原则是要求插值函数通过这些数据点,即。此时,序列与 是相等的。 如果数据序列,含有不可避免的误差(或称“噪音”),如图6.1 所示;如果数据序列无法同时满足某特定函数,如图6.2所示,那么,只能要求所做逼近函数最优地靠近样点,即向量与的误差或距离最小。按与之间误差最小原则作为“最优”标准构造的逼近函数,称为拟合函数。 图6.1 含有“噪声”的数据

图6.2 一条直线公路与多个景点 插值和拟合是构造逼近函数的两种方法。插值的目标是要插值函数尽量靠近离散点;拟合的目标是要离散点尽量靠近拟合函数。 向量与之间的误差或距离有各种不同的定义方法。例如: 用各点误差绝对值的和表示: 用各点误差按模的最大值表示: 用各点误差的平方和表示: 或(6.1) 其中称为均方误差,由于计算均方误差的最小值的方法容易实现而被广泛采用。按 均方误差达到极小构造拟合曲线的方法称为最小二乘法。本章主要讲述用最小二乘法构造拟合曲线的方法。 在运筹学、统计学、逼近论和控制论中,最小二乘法都是很重要的求解方法。例如,它是统计学中估计回归参数的最基本方法。

关于最小二乘法的发明权,在数学史的研究中尚未定论。有材料表明高斯和勒让德分别独立地提出这种方法。勒让德是在1805年第一次公开发表关于最小二乘法的论文,这时高斯指出,他早在1795年之前就使用了这种方法。但数学史研究者只找到了高斯约在1803年之前使用了这种方法的证据。 在实际问题中,怎样由测量的数据设计和确定“最贴近”的拟合曲线?关键在选择适当的拟合曲线类型,有时根据专业知识和工作经验即可确定拟合曲线类型;在对拟合曲线一无所知的情况下,不妨先绘制数据的粗略图形,或许从中观测出拟合曲线的类型;更一般地,对数据进行多种曲线类型的拟合,并计算均方误差,用数学实验的方法找出在最小二乘法意义下的误差最小的拟合函数。 例如,某风景区要在已有的景点之间修一条规格较高的主干路,景点与主干路之间由各具特色的支路联接。设景点的坐标为点列;设主干路为一条直线 ,即拟合函数是一条直线。通过计算均方误差最小值而确定直线方程(见图6.2)。 6.2线性拟合和二次拟合函数 线性拟合 给定一组数据,做拟合直线,均方误差为 (6.2) 是二元函数,的极小值要满足

利用SPSS拟合非线性回归模型

利用SPSS拟合非线性回归模型 ——以S型曲线为例 1.原始数据 下表给出了某地区1971—2000年的人口数据(表1)。试用SPSS软件对该地区的人口变化进行曲线拟合,并对今后10年的人口发展情况进行预测。 表1 某地区人口变化数据 年份时间变量t=年份-1970人口y/人 1971133 815 1972233 981 1973334 004 1974434 165 1975534 212 1976634 327 1977734 344 1978834 458 1979934 498 19801034 476 19811134 483 19821234 488 19831334 513 19841434 497 19851534 511 19861634 520 19871734 507 19881834 509 19891934 521 19902034 513 19912134 515 19922234 517 19932334 519 19942434 519 19952534 521 19962634 521

1997 27 34 523 1998 28 34 525 1999 29 34 525 2000 30 34 527 根据上表中的数据,做出散点图,见图1。, 33700 3380033900340003410034200343003440034500346001970197219741976197819801982198419861988199019921994199619982000 年份 人口 图1 某地区人口随时间变化的散点图 从图1可以看出,人口随时间的变化呈非线性过程,而且存在一个与横坐标轴平行的渐近线,近似S 曲线。 下面,我们用SPSS 软件进行非线性回归分析拟合计算。 2.用SPSS 进行回归分析拟合计算 在SPSS 中可以直接进行非线性拟合,步骤如下(假定已经进行了数据输入,关于数据输入方法见SPSS 相关基础 教程): Analysis->Regression->Cubic,在弹出的对话框(见图一)中选择拟合的变量和自变量,本例分别选择y (人口),t (时间变量)为变量(Dependent )和自变

实验数据曲线拟合方法研究

本科毕业设计论文题目实验数据曲线拟合方法研究 专业名称 学生姓名 指导教师 毕业时间

毕业 一、题目 实验数据曲线拟合方法研究 二、指导思想和目的要求 通过毕业设计,使学生对所学自动控制原理、现代控制原理、控制系统仿真、电子技术等的基本理论和基本知识加深理解和应用;培养学生设计计算、数据处理、文件编辑、文字表达、文献查阅、计算机应用、工具书使用等基本事件能力以及外文资料的阅读和翻译技能;掌握常用的实验数据曲线拟合方法,培养创新意识,增强动手能力,为今后的工作打下一定的理论和实践基础。 要求认真复习有关基础理论和技术知识,认真对待每一个设计环节,全身心投入,认真查阅资料,仔细分析被控对象的工作原理、特性和控制要求,按计划完成毕业设计各阶段的任务,重视理论联系实际,写好毕业论文。 三、主要技术指标 设计系统满足以下要求: 数据拟合误差要尽量的小的同时保证曲线的线形形状最佳。 四、进度和要求 1、搜集中、英文资料,完成相关英文文献的翻译工作,明确本课题的国内外研 究现状及研究意义;(第1、2周) 2、撰写开题报告;(第 3、4周) 3、应用最小二乘法进行曲线拟合;(第5、6周) 4、应用Matlab命令曲线拟合;(第7、8周) 5、应用Matlab图形用户界面曲线拟合;(第9、10周) 6、研究其他曲线拟合方法;(第11周) 7、整理资料撰写毕业论文; (1)初稿;(第12、13周)(2)二稿;(第14周)

8、准备答辩和答辩。(第15周) 五、主要参考书及参考资料 [1]卢京潮,《自动控制原理》,西北工业大学出版社,2010.6 [2]胡寿松,《自动控制原理》,科学出版社,2008,6 [3]薛定宇,陈阳泉,《系统仿真技术与应用》,清华大学出版社,2004.4 [4]王正林,《Matlab/Simulink与控制系统仿真》,电子工业出版社,2009.7 [5]李桂成,《计算方法》,电子工业出版社,2013.8 [6]蒋建飞,胡良剑,唐俭.数值分析及其Matlab实验【M】.北京:科学出版社,2008 学生指导教师系主任

spss之线性回归详解(张文彤)

第十章:多元线性回归与曲线拟合―― Regression菜单详解(上) (医学统计之星:张文彤) 上次更新日期: 10.1 Linear过程 10.1.1 简单操作入门 10.1.1.1 界面详解 10.1.1.2 输出结果解释 10.1.2 复杂实例操作 10.1.2.1 分析实例 10.1.2.2 结果解释 10.2 Curve Estimation过程 10.2.1 界面详解 10.2.2 实例操作 10.3 Binary Logistic过程 10.3.1 界面详解与实例 10.3.2 结果解释 10.3.3 模型的进一步优化与简单诊断 10.3.3.1 模型的进一步优化 10.3.3.2 模型的简单诊断

回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。 §10.1Linear过程 10.1.1 简单操作入门 调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。 例10.1:请分析在数据集Fat surfactant.sav中变量fat对变量spovl的大小有无影响? 显然,在这里spovl是连续性变量,而fat是分类变量,我们可用用单因素方差分析来解决这个问题。但此处我们要采用和方差分析等价的分析方法--回归分析来解决它。 回归分析和方差分析都可以被归入广义线性模型中,因此他们在模型的定义、计算方法等许多方面都非常近似,下面大家很快就会看到。 这里spovl是模型中的因变量,根据回归模型的要求,它必须是正态分布的变量才可以,我们可以用直方图来大致看一下,可以看到基本服从正态,因此不再检验其正态性,继续往下做。 10.1.1.1 界面详解

相关文档
最新文档