多项式曲线拟合(Polynomial Curve Fitting)

1. #!/usr/bin/python

2. # -*- coding: utf-8 -*-

4. """

5. author ： duanxxnj@https://www.360docs.net/doc/db17093373.html,

6. time : 2016-06-04_14-00

8. 多项式特征生成

10. """

11.

12. from sklearn.preprocessing import PolynomialFeatures

13. import numpy as np

14.

15. # 首先生成3x2的原始特征矩阵

16. # 即样本数为3，特征数为2

17. X = np.arange(6).reshape(3,2)

18.

19. print'原始数据：'

20. print X

21.

22. # 特生变换/特征生成

23. # 将原始一阶数据升维到二阶数据

24. # 升维方式是： [x_1, x_2] 变为 [1, x_1, x_2, x_1^2, x_1 x_2, x_2^2]

25. polyFeat =PolynomialFeatures(degree=2)

26. X_transformed = polyFeat.fit_transform(X)

27.

28. print'特征变换后的数据：'

29. print X_transformed

1. 原始数据：

2. [[01]

3. [23]

4. [45]]

5. 特征变换后的数据：

6. [[ 1.0. 1.0.0. 1.]

7. [ 1. 2. 3. 4. 6.9.]

8. [ 1. 4. 5.16.20.25.]] 1. #!/usr/bin/python

2. # -*- coding: utf-8 -*-

5. """

6. author ： duanxxnj@https://www.360docs.net/doc/db17093373.html,

7. time : 2016-06-04_16-38

9. 这个例子展示了多项式曲线拟合的特性

10.

11. 多项式曲线拟合分为两个步骤：

12. 1、根据多项式的最高次数，对输入特征向量做特征生成

13. 对原来的每一个特征向量而言，可以生成一个范特蒙德矩阵（ Vandermonde matrix）

14.

15. 范特蒙德矩阵的尺寸为：[n_samples , n_degree+1]

16.

17. 其形式为：

18. [[1, x_1, x_1 ** 2, x_1 ** 3, ...],

19. [1, x_2, x_2 ** 2, x_2 ** 3, ...],

20. ...]

21.

22. 2、基于第一步生成的范特蒙德矩阵，直接使用已有线性回归模型，就可以实现多项式回归

23.

24. 这个例子展示了如何基于线性回归模做非线性回归，其实这个也是核函数的基本思想。

25. """

26. print(__doc__)

27.

28. import numpy as np

29. import matplotlib.pyplot as plt

30.

31. from sklearn.linear_model import LinearRegression

32.

33. from sklearn.preprocessing import PolynomialFeatures

34. from sklearn.pipeline import make_pipeline

35.

36. # 多项式回归需要拟合的函数

37. def f(x):

38. return x * np.sin(x)

39.

40.

41. # 产生绘图用的原始数据点

42. # 这里产生的点的范围比实际拟合所采用的点的范围要宽一些

43. # 其目的是为了展示当多项式拟合的次数过高时，过拟合的现象

44. # 过拟合的模型在训练数据范围内，拟合效果非常好

45. # 在训练数据范围外，模型的拟合效果特别误差

46. x_plot = np.linspace(-1,13,140)

47.

48. # 训练用数据范围

49. x = np.linspace(0,10,100)

50.

51. # 随机取训练数据中的10个点作为拟合用的点

52. rng = np.random.RandomState(0)

53. rng.shuffle(x)

54. x = np.sort(x[:10])

55. y = f(x)

56.

57. # 将数据从行向量换为列向量，这样每一行就能代表一个样本

58. X = x[:, np.newaxis]

59. X_plot = x_plot[:, np.newaxis]

60.

61. # 从次数为1一直到次数变为17，模型的次数增长步长为3

62. # 下面会绘制出不同的次数所对应的图像

63. # 需要注意的是，这6个图的坐标系的y轴的数据范围相差是非常大的

64. # 模型的次数越高，在训练数据外的测试点上，y的数据和原始数据相差越大

65. # 即：过拟合现象越明显

66. #

67. # 同时，下面还输出了不同次数下，模型对应的参数向量w

68. # 可以看到，模型次数越大，模型所对应的参数向量的模||w||也越大

69. # 即：过拟合现象越明显，模型所对应的参数向量的模||w||也越大

70. #

71. # 在损失函数后面，加上模型所对应的参数向量的模||w||

72. # 那么，在最小化损失函数的同时，也限制了参数向量的模||w||的增长

73. # 这就是正则化可以防止过拟合的原因

74. #

75. # 但是在实际测试中发现，如果随机取训练数据的时候，选取的是20个点

76. # 那么参数向量的模||w||并不是随着模型复杂度的增加而增加

77. # 这个是因为训练的样本足够大的时候，能够有效的描述原始数据分布

78. # 那么过拟合的这一套理论就不是特别的适用了

79. # 所以，方法的选择还是要建立在对数据分布充分的认识上才行

80. #

81. for degree in range(9):

82.

83. # 基于不同的次数生成多项式模型

84. model = make_pipeline(PolynomialFeatures(degree),LinearRegression()

)

85. model.fit(X, y)

86.

87. # 不同次数下，多项式模型的参数

88. print'模型次数为：', degree,' 时，模型的参数向量的模：'

89. print np.dot(np.array(model.steps[1][2].coef_),

90. np.array(model.steps[1][3].coef_))

91.

92. print'模型的参数为：'

93. print model.steps[1][4].coef_

94.

95. y_plot = model.predict(X_plot)

96.

97. plt.subplot('52'+ str(degree +1))

98.

99. plt.grid()

100. plt.plot(x_plot, f(x_plot), label="ground truth") 101. plt.scatter(x, y, label="training points")

102. plt.plot(x_plot, y_plot, label="degree %d"% degree) 103. plt.legend(loc='lower left')

104.

105. plt.show()

过拟合

从上面的代码的运行结果如下：

1. 模型次数为：0时，模型的参数向量的模：

2. 0.0

3. 模型的参数为：

4. [0.]

5. 模型次数为：1时，模型的参数向量的模：

6. 0.0672247305597

7. 模型的参数为：

8. [0.0.25927732]

9. 模型次数为：2时，模型的参数向量的模：

10. 0.00485169982253

11. 模型的参数为：

12. [0.0.067022610.01896495]

13. 模型次数为：3时，模型的参数向量的模：

14. 21.6855657558

15. 模型的参数为：

16. [0.-4.50881058 1.16216004-0.07467912]

17. 模型次数为：4时，模型的参数向量的模：

18. 193.44229814

19. 模型的参数为：

20. [0.11.8668248-7.13912616 1.28405087-0.06970187]

21. 模型次数为：5时，模型的参数向量的模：

22. 100.775416362

23. 模型的参数为：

24. [0.00000000e+008.81727284e+00-4.75722615e+00 6.32370347e-01

25. 3.81031381e-03-2.92969155e-03]

26. 模型次数为：6时，模型的参数向量的模：

27. 412.685941253

28. 模型的参数为：

29. [0.00000000e+00-1.12195467e+01 1.52609522e+01-7.19720894e+00

30. 1.44728030e+00-1.28827774e-01 4.18692299e-03]

31. 模型次数为：7时，模型的参数向量的模：

32. 584.784763013

33. 模型的参数为：

34. [0.00000000e+00-1.33786428e+01 1.80697292e+01-8.70772778e+00

35. 1.85005336e+00-1.85152116e-018.14689351e-03-1.10477347e-04]

36. 模型次数为：8时，模型的参数向量的模：

37. 325.113163284

38. 模型的参数为：

39. [0.00000000e+008.34477828e+00-1.22270425e+019.49806252e+00

40. -3.88031716e+008.35492773e-01-9.56033297e-02 5.50928798e-03

41. -1.25987578e-04]

可以明显的看出来，模型的次数越高，参数向量的模就越大，那么其拟合程度就越高，越容易产生过拟合。

注意：在实际测试中发现，如果随机取训练数据的时候，选取的是20个点那么参数向量的模||w||并不是随着模型复杂度的增加而增加。这个是因为训练的样本足够大，能够有效的描述原始数据分布的时候，那么过拟合的这一套

正交多项式最小二乘法拟合.doc

《MATLAB 程序设计实践》课程考核一、编程实现以下科学计算算法,并举一例应用之。（参考书籍《精通ＭＡＬＡＢ科学计算》,王正林等著,电子工业出版社,２００９年） “正交多项式最小二乘法拟合” 正交多项式最小二乘法拟合原理正交多项式做最小二乘法拟合：不要求拟合函数y=f(x)经过所有点（x i ,y i ),而只要求在给定点x i 上残差δi=f(x i )-y i 按照某种标准达到最小,通常采用欧式范数||δ||2作为衡量标准。这就是最小二乘法拟合。根据作为给定节点x 0,x 1,…x m 及权函数ρ(x)>0,造出带权函数正交的多项式{P n （x ）}。注意n ≤m,用递推公式表示P k （x ）,即 ()()()()()()()01101 111,, (1,2,,1)k k k k k P x P x x P x P x P x P x k n ααβ++-=??=-??=--=...-? 这里的P k (x)是首项系数为1的k 次多项式,根据P k (x)的正交性,得 ()()()()()()()()()()()()()()()()()()()()2i 012i 02i 0211i 10x ,,x ,0,1,1,x ,0,1,1,x m i k i k k i k m k k k i i k k m k k k i k k i k m k k k i i x P x xP x P x a P x P x P x xP P k n P P P x P P k n P P P x ρρρβρ=+==---=???==???==???-???===???-????∑∑∑∑ 根据公式(1)和(2)逐步求P k （x ）的同时,相应计算系数 ()()()020()(),(0,1,n (,)() m i j i k i k i k m k k i k i i x x x f P a k P P x x ρ??ρ?=====???,∑∑）并逐步把*k a P k （x ）累加到S （x ）中去,最后就可得到所求的拟合函数曲线 ***0011n n y=S x =a P x +a P x ++a P x ???（）（）（）（）. 流程图 M 文件 function [p] = mypolyfit(x,y,n) %定义mypolyfit 为最小二乘拟合函数 %P = POLYFIT(X,Y,N)以计算以下多项式系数 %P(1)*X^N + P(2)*X^(N-1) +...+ P(N)*X + P(N+1). if ~isequal(size(x),size(y)) （2）（1）

试验优化设计与分析(教材)

试验优化设计与分析(教材) 成果总结成果完成人：任露泉，丛茜，杨印生，李建桥，佟金成果完成单位：吉林大学推荐等级建议：二等奖

1.立项背景在现代社会实现过程和目标的最优化，已成为解决科学研究、工程设计、生产管理以及其他方面实际问题的一项重要原则。试验优化技术因其具有设计灵活、计算简便、试验次数少、优化成果多、可靠性高、适用面广等特点，已成为现代设计方法中一个先进的设计方法，成为发达国家企业界人士、工程技术人员、研究人员和管理人员的必备技术，它对于创造利润和提高生产率起着巨大的作用。因此在我国为了赶超世界先进水平，促进科研、生产和管理事业的发展，编著相关教材，大力推广与应用试验优化技术，不仅具有普遍的实际意义，也具有一定的迫切性。 20世纪80年代初，鉴于国民经济建设实践和科学技术研究中对试验优化技术的广泛需求，为推动教学改革、提高教学质量，任露泉教授对试验优化理论与技术进行了深入系统研究，为本科生开设了“试验设计”课程，为研究生开设了“试验优化技术”课程，并于1987年由机械工业出版社出版了教材《试验优化技术》，产生了很高的学术与技术影响。 2001年任露泉教授在《试验优化技术》一书的基础上编著了《试验优化设计与分析》教材，由吉林科技出版社出版发行。该教材是对1987年出版的《试验优化技术》的修改、补充和发展。作者根据对试验优化的教学和科研应用的多年实践与体会，为适应读者学习与使用的实际需要，调整修改了原书中的部分内容和一些方法的设计程式；补充了一些试验优化设计的新方法、新技术；增添了试验优化的一些最新应用实例；并增加了试验优化分析一篇。本教材2001年获吉林省长白山优秀图书一等奖，2002年被遴选为教育部全国研究生教学用书，再次出版发行，2004年获吉林省教学成果一等奖。 2.教材内容本教材万字，共分三篇二十一章。第一篇试验设计，除正交设计、干扰控制设计与数据处理等常用技术外,还介绍SN比设计、均匀设计、广义设计、调优运算及稳健设计等正交试验设计技术的拓广应用和现代发展的最新方法；第二篇回归设计，除各种回归的正交设计、旋转设计、饱和设计、多项式设计、还介绍多次变换设计、交互作用搜索设计、混料设计以及D-最优设计等回归设计技术的进一步完善与最新应用技术；在第三篇试验优化技术分析中,介绍了试验数据处理过程中经常遇到的难题及其解决办法，数据分析的最新研究成果及其应用实例。例如：有偏估计、PPR分析、探索性数据分析等；此外还介绍了试验优化的常用统计软件。 3.教材特点

math

数学组课程大纲 93.3.1 101 [024002] 微积分(一) [Calculus (I)] , 4学分. 大一必修先修科目：无极限及连续性, 微分及其应用, 不定积分, Riemann 积分. 102 [024001] 线性代数(一) [Linear Algebra (I)] , 3学分. 大一必修先修科目：无 Gaussian 消去法, 矩阵计算, 行列式, 矩阵运算, 基底内积及垂直性. 103 [024021] 数学导论(一) [Introduction to Mathematics (I)] , 3学分. 大一必修先修科目：无叙述及量化逻辑，基数, 真值表, 证明法, 谬论, 集合运算, 等价关系, 函数. 111 [024003] 微积分(二) [Calculus (II)] , 4学分. 大一必修先修科目：微积分(一) 瑕积分, 超越函数, 数列及级数, Taylor's 定理, 偏微分, 重积分及其应用. 112 [024004] 线性代数(二) [Linear Algebra (II)] , 3学分. 大一必修先修科目：线性代数(一) 线性变换, 固有值, 固有向量, 对角化, 二次型, 及正定矩阵. 113 [024028] 数学导论(二) [Introduction to Mathematics (II)], 3学分. 大一选修先修科目：数学导论(一) 实数, Schr?der-Bernstein定理, 次序, Zorn's 引理, 选择公理. 201 [024007] 高等微积分(一) [Advanced Calculus (I)] , 4学分. 大二必修先修科目：微积分(一) , 微积分(二) 实数性质, 均匀连续, 函数序列与级数, 均匀收敛. 203 [024018] 离散数学(一) [Discrete Mathematics (I)] , 3学分. 大二必修先修科目：微积分(一) , 微积分(二) 排列, 组合方式, 排演原理, 图的表示法, 图的结构, 二分图, 样本, 最小生成样本, 最短路, 欧拉回路, 组合数学和基本图论等. 204 [024020] 拓朴学（一）[Topology I ] , 3学分. 大二选修先修科目：无赋距空间, 子空间, 积空间, 商空间, 收敛及连续, 分离公设, 紧致性及连通性, 拓朴不变性. 211 [024008] 高等微积分(二) [Advanced Calculus (II)] , 4学分. 大二必修先修科目：高等微积分(一) 反函数及隐函数定理, Ｒn之拓朴性, 连续映射, 重积分. [024008] 213 [024019] 离散数学(二) [Discrete Mathematics (II)] , 3学分. 大二选修先修科目：离散数学(一) Recurrence relation ,生成函数(generating function),图的连通性,汉来尔顿路径,图的着色, matching. 214[024022] 代数学(一) [Algebra (I)] , 3学分. 大二必修先修科目：无群, 子群, 商群, 对称群, 置换群, 同态群的应用.

正交多项式拟合在解决实际问题的应用

正交多项式拟合在解决实际问题的应用为了避免正规矩阵的“病态”问题，提出了正交多项式拟合方法。尤其是实际工作中的误差是不可避免的，而正交多项式拟合能够更好的考虑到自变量和因变量的误差，拟合出来的曲线更合理，也更便于计算机实现。正交多项式拟合的实用性和一般性使得它在工程项目，机械制造，甚至人工智能等领域应用广泛，先简要介绍其中的几个方面。 1、边缘识别是利用数字图像法检测结构变形的一种方法，其中一种是需要多项式拟合，且拟合的精度决定了识别的精度，为提高拟合精度，就需要高次多项式，但又会产生“病态”，因此采用正交多项式拟合方法就十分必要了。将基于正交多项式拟合的边缘识别应用到梁变形检测中，拟合程度高，检测效果好。 2、提高零炮检距地震道的拟合精度是保幅地震资料处理的关键环节之一。相对于常规地震叠加技术，二阶多项式拟合技术能够提高零炮检距地震道的拟合精度。但是不同时刻地层反射信号的A VO特性是变化的，仅仅利用二阶多项式来实现零炮检距地震道拟合是达不到精度要求的。采用正交多项式描述CMP道集上不同时刻地层反射信号的A VO特性，建立正交多项式系数谱;并根据SVD估计有效波的能量，自适应地确定不同时刻拟合零炮检距地震道信号所需的阶次，实现高精度的零炮检距地震道拟合。合成记录和实际数据的处理表明该方法能够有效地减小零炮检距地震道拟合误差，提高拟合精度。 3、水泵性能曲线一般是用图表或曲线图给出，但在水泵选型或泵站经济运行中，常常有必要知道水泵性能曲线的函数表达式。对此，可以根据试验数据或性能图上的数据进行拟合。目前，在水泵性能曲线拟合中较常用的一般多项式的最小二乘拟合，需要求解一非线性方程组，增加了数据存贮量，而且在多项式次数较高时方程容易出现病态。如果采用正交多项式，则对n组数据，可以一直拟合到n-1次多项式而结果仍然稳定，因此提出对离心泵性能曲线的等流量间距的正交多项式回归法。采用Forsythe递推法生成正交多项式，根据显著性检验来确定拟合的多项式次数，并在计算中佐以作图程序来进行直观分析。并证明了这种方法的实用性。采用正交多项式并最终转化为一般多项式来拟合水泵性能曲线，避免了解联立方程组的繁琐和不稳定性，并根据数据分析来确定多项式的次数m，使m的取值不受人为经验限制。另外，各正交多项式之间互相正交，增减(最高)项次时，低次项的拟合系数并不改变，这就避免了重复计算。

matlab多项式拟合

matlab_最小二乘法数据拟合 (2012-10-21 12:19:27) 转载▼ 标签： matlab 最小二乘数据拟合定义：最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。最小二乘法原理：在我们研究两个变量（x,y）之间的相互关系时，通常可以得到一系列成对的数据（x1,y1.x2,y2... xm,ym）；

将这些数据描绘在x -y直角坐标系中，若发现这些点在一条直线附近，可以令这条直线方程如（式1-1）。 Yj= a0 + a1 X （式1-1) 其中：a0、a1 是任意实数 1.多项式曲线拟合:polyfit 1.1常见拟合曲线：直线：y=a0X+a1 多项式：一般次数不易过高2 3 双曲线：y=a0/x+a1 指数曲线：y=a*e^b 1.2 matlab中函数 P=polyfit(x,y,n) [P S mu]=polyfit(x,y,n) polyval（P，t）：返回n次多项式在t处的值注：其中x y已知数据点向量分别表示横纵坐标，n 为拟合多项式的次数，结果返回：P-返回n次拟合多项式系数从高到低依次存放于向量P中，S-包含三个值其中normr是残差平方

和，mu-包含两个值mean（x）均值，std（x）标准差。 1.3举例 1. 已知观测数据为： X：0 1 2 3 4 5 6 7 8 9 1 Y：-0.447 1.987 3.28 6.16 7.08 7.34 7.66 9.56 9.48 9.3 11.2 用三次多项式曲线拟合这些数据点： x=0:0.1:1 y=[- 0.447,1.978,3.28,6.16,7.08,7.34,7.66,9.56,9.48,9.3,1 1. 2] plot(x,y,'k.','markersize',25) hold on axis([0 1.3 -2 16]) p3=polyfit(x,y,3) t=0:0.1:1.2: S3=polyval(P3,t); plot(t,S3,'r');

曲线拟合(数值 (C语言))

(1)曲线拟合： #include #include #define MAX 100 void main() { int i,j,k,m,n,N,mi; float tmp,mx; float X[MAX][MAX],Y[MAX],x[MAX],y[MAX],a[MAX]; printf("\n 输入拟合多项式的次数:\n"); scanf("%d",&m); printf("\n 输入给定点的个数n及坐标(x,y):\n"); scanf("%d",&N); printf("\n"); for(i=0;imx) { mi=i; mx=fabs(X[i][j]); } if(j

Y[j]=Y[mi]; Y[mi]=tmp; for(k=j;k<=m;k++) { tmp=X[j][k]; X[j][k]=X[mi][k]; X[mi][k]=tmp; } } for(i=j+1;i<=m;i++) { tmp=-X[i][j]/X[j][j]; Y[i]+=Y[j]*tmp; for(k=j;k<=m;k++) X[i][k]+=X[j][k]*tmp; } } a[m]=Y[m]/X[m][m]; for(i=m-1;i>=0;i--) { a[i]=Y[i]; for(j=i+1;j<=m;j++) a[i]-=X[i][j]*a[j]; a[i]/=X[i][i]; } printf("\n 所求的二次多项式为:\n"); printf("P(x)=%f",a[0]); for(i=1;i<=m;i++) printf("+(%f)*x^%d",a[i],i); } 输入拟合多项式的次数: 2 输入给定点的个数n及坐标(x,y): 5 1,2 5,3 2,4 8,3 -1,5 所求的二次多项式为: P(x)=3.952280+(-0.506315)*x^1+(0.050877)*x^2Press any key to continue

第四章最佳逼近

第四章最佳逼近学习目标：掌握最佳一致逼近和最佳平方逼近的基本理论和方法、以及最小二乘法常用的正交多项式以及正交多项式的性质。重点为最佳一致逼近和最佳平方逼近的特征性质（如契比雪夫定理等）以及最佳一致逼近和最佳平方逼近多项式的计算方法。

§1 C[a ,b ]上的最佳一致逼近不难验证，[a ,b ]上所有连续函数的全体构成一无限维线性空间，简记为C[a,b]。为描述方便，引进符号函数，称为C[a,b] 上的一致范数或契比雪夫（Chebyshev ）范数，其定义为 ∞?],[] ,[,)(max b a b a x C f x f f ∈?=∈∞考虑所有n 次代数多项式的全体形成的集合 . 不难验证，P n 是C [a ,b ]上的n+1维线性子空间。 { }n n x x span P ,,,1 =

对给定的函数f (x )∈C [a ,b ]称量： ) ()(min ),(x p x f P f n P p n -=?∈为f (x )关于P n 的最佳一致逼近，简称最佳逼近，也称为契比雪夫逼近。满足上式的多项式p *(x )称为f (x )在[a ,b ]上的最佳逼近多项式，而线性空间 P n 也称为逼近子空间。围绕这一问题，人们马上会问：最佳逼近多项式是否存在？是否唯一？如果存在，如何寻找或构造它？对这些问题的回答构成了最佳一致逼近研究的中心内容。

定理（契比雪夫定理）对任意是f 的最佳一致逼近多项式的充要条件是f - p 在[a ,b ]上存在的至少有n +2个点组成的交错点组。 n b a p p C f ∈∈,],[推论1 如果，那么在中存在唯一的元素为f 的最佳一致逼近多项式 ],[b a C f ∈n p 推论 2 如果f 在[a ,b ]上有n +1阶导数，且在（a ,b ）上保号（恒正或恒负），那么契比雪夫交错组唯一，且区间[a ,b ]的端点属于契比雪夫交错组。 )1(+n f

Matlab多项式拟合曲线

?MATLAB软件提供了基本的曲线拟合函数的命令． 1 多项式函数拟合：a=polyfit(xdata,ydata,n) 其中n表示多项式的最高阶数，xdata，ydata为将要拟合的数据，它是用数组的方式输入．输出参数a 为拟合多项式的系数多项式在x处的值y可用下面程序计算． y=polyval(a,x) 2 一般的曲线拟合：p=curvefit(‘Fun’,p0,xdata,ydata) 其中Fun表示函数Fun(p,data)的M函数文件，p0表示函数的初值．curvefit()命令的求解问题形式是若要求解点x处的函数值可用程序f=Fun(p,x)计算．例如已知函数形式，并且已知数据点要确定四个未知参数a，b，c，d．使用curvefit命令，数据输入；初值输；并且建立函数的M文件（Fun．m）．若定义，则输出又如引例的求解，MATLAB程序： t=[l：16]；％数据输人 y=[ 4 6．4 8 8．4 9．28 9．5 9．7 9．86 10．2 10．32 10．42 10．5 10．55 1 0．58 10．6] ； plot(t,y,’o’) ％画散点图 p=polyfit(t,y,2) (二次多项式拟合）计算结果： p=-0.0445 1.0711 4.3252 %二次多项式的系数由此得到某化合物的浓度y与时间t的拟合函数。 ?zjxdede | 2008-10-17 12:10:06 ?MATLAB软件提供了基本的曲线拟合函数的命令． 1 多项式函数拟合：a=polyfit(xdata,ydata,n) 其中n表示多项式的最高阶数，xdata，ydata为将要拟合的数据，它是用数组的方式输入．输出参数a为拟合多项式的系数多项式在x处的值y可用下面程序计算． y=polyval(a,x) 2 一般的曲线拟合：p=curvefit(‘Fun’,p0,xdata,y data) 其中Fun表示函数Fun(p,data)的M函数文件，p0表示函数的初值．curvefit()命令的求解问题形式是若要求解点x处的函数值可用程序f=Fun(p,x)计算．例如已知函数形式，并且已知数据点要确定四个未知参数a，b，c，d．使用curvefit命令，数据输入；初值输；并且建立函数的M文件（Fun．m）．若定义，则输出又如引例的求解，MATLAB程序： t=[l：16]；％数据输人 y=[ 4 6．4 8 8．4 9．28 9．5 9．7 9．86 10．2 10．32 10．42 10．5 1 0．55 10．58 10．6] ；

数值分析函数逼与曲线拟合

第三章函数逼近与曲线拟合 1 函数的逼近与基本概念 1.1问题的提出多数计算机的硬件系统只提供加、减、乘、除四种算术运算指令，因此为了计算大多数有解析表达式的函数的值，必须产生可用四则运算进行计算的近似式，一般为多项式和有理分式函数.实际上，我们已经接触到两种逼近多项式，一种是泰乐多项式，一种是插值多项式.泰乐多项式是一种局部方法，误差分布不均匀，满足一定精度要求的泰乐多项式次数太高，不宜在计算机上直接使用.例如，设 ()f x 是[1,1]-上的光滑函数，它的Taylor 级数0 ()k k k f x a x ∞ ==∑， ()(0) ! k k f a k = 在[1,1]-上收敛。当此级数收敛比较快时，1 1()()()n n n n e x f x s x a x ++=-≈。这个误差分布是不均匀的。当0x =时，(0)0n e =，而x 离开零点增加时，()n e x 单调增加，在1x =±误差最大。为了使[1,1]-的所有x 满足()()n f x s x ε-<，必须选取足够大的n ，这显然是不经济的。插值函数出现的龙格现象表明，非节点处函数和它的插值多项式相差太大。更重要的是，实际中通过观测得到的节点数据往往有各种误差，此时如果要求逼近函数过全部节点，相当于保留全部数据误差，这是不适宜的。如图1所示，给出五个点上的实验测量数据，理论上的结果应该满足线性关系，即图1中的实线。由于实验数据的误差太大，不能用过任意两点的直线逼近函数。如果用过5个点的4次多项式逼近线性函数，显然误差会很大。

1.2范数与逼近一、线性空间及赋范线性空间要深入研究客观事物，不得不研究事物间的内在联系，给集合的元素之间赋予某种“确定关系”也正是这样的道理.数学上常把在各种集合中引入某些不同的确定关系称为赋予集合以某种空间结构，并将这样的集合称为空间。最常用的给集合赋予一种“加法”和“数乘”运算，使其构成线性空间.例如将所有实 n 维数对组成的集合，按照“加法”和“数乘”运算构成实数域上的线性空间，记作n R ，称为n 维向量空间.类似地，对次数不超过n 的实系数多项式全体，按通常多项式与多项式加法及数与多项式乘法也构成数域R 上一个线性空间，用n H 表示，称为多项式空间。所有定义在[,]a b 上的连续函数集合，按函数加法和数与函数乘法构成数域R 上的线性空间，记作[,]C a b .类似地，记[,]p C a b 为具有p 阶连续导数的函数空间. 在实数的计算问题中，对实数的大小、距离及误差界等是通过绝对值来度量的.实践中，我们常常会遇到对一般线性空间中的向量大小和向量之间的距离进行度量的问题，因此有必要在一般线性空间上，赋予“长度”结构，使线性空间成为赋范线性空间. 定义1 设 X 是数域K 上一个线性空间，在其上定义一个实值函数g ，即对于任意 ,x y X ∈及K α∈，有对应的实数x 和y ，满足下列条件 (1) 正定性：0x ≥，而且0x =当且仅当0x =； (2) 齐次性：x x αα=； (3) 三角不等式：x y x y +≤+；实验数据真函数插值多项式逼近精确的线性逼近图1

离散试验数据点的正交多项式最小二乘拟合

%离散试验数据点的正交多项式最小二乘拟合 function a=ZJZXEC(x,y,m) if(length(x) == length(y)) n = length(x); else disp('x和y的维数不相等！'); return; end syms v; d = zeros(1,m+1); q = zeros(1,m+1); alpha = zeros(1,m+1); for k=0:m px(k+1)=power(v,k); end B2 = [1]; d(1) = n; for l=1:n q(1) = q(1) + y(l); alpha(1) = alpha(1) + x(l); end q(1) = q(1)/d(1); alpha(1) = alpha(1)/d(1); a(1) = q(1); B1 = [-alpha(1) 1]; for l=1:n d(2) = d(2) + (x(l)-alpha(1))^2; q(2) = q(2) + y(l)*(x(l)-alpha(1)); alpha(2) = alpha(2) + x(l)*(x(l)-alpha(1))^2; end q(2) = q(2)/d(2); alpha(2) = alpha(2)/d(2); a(1) = a(1)+q(2)*(-alpha(1)); a(2) = q(2); beta = d(2)/d(1); for i=3:(m+1) B = zeros(1,i); B(i) = B1(i-1); B(i-1) = -alpha(i-1)*B1(i-1)+B1(i-2); for j=2:i-2 B(j) = -alpha(i-1)*B1(j)+B1(j-1)-beta*B2(j);

实验题目用正交多项式做小二乘曲线拟合

实验题目：用正交多项式做小二乘曲线拟合

实验题目：用正交多项式做最小二乘的曲线拟合学生组号： 6 完成日期： 2011/11/27 1 实验目的针对给定数据的煤自燃监测数据中煤温与N O 2 2 ,之间的非线性关系，用正交多项式做最小二乘曲线拟合。 2 实验步骤 2.1 算法原理设给定n+1个数据点：（ y x k k ,），k=0,1,···,n ，则根据这些节点作一个m 次的最小二乘拟合多项式 p m （x ）= a +x a x a a m m x +++ (2) 21=x a j m j j ∑=0 ① 其中，m ≤n,一般远小于n.。若要构造一组次数不超过ｍ的在给定点上正交的多项式函数系｛)(x Q j （ｊ＝０，１，．．．，ｍ）｝，则可以首先利用｛)(x Q j （ｊ＝０，１，．．．，ｍ）｝作为基函数作最小二乘曲线的拟合，即 p m （x ）＝ )(...)()(1 1 x x x Q q Q q Q q m m +++ ② 根据②式，其中的系数 q j （ｊ＝０，１，．．．，ｍ）为 ∑∑=== n k k j n k k j k j x Q x Q y q 2 ) () (，ｊ＝０，１，．．．，ｍ ③ 将④代入③后展开就成一般的多项式。构造给定点上的正交多项式 )(x Q j （ｊ＝０，１，．．．，ｍ）的递推公式如下： ?? ? ? ???-=--=-==-+1 ,...,2,1),()()()()()(1)(1 1010m j x x x x x x x Q Q Q Q Q j j j j j βαα ④

数值计算_第6章曲线拟合的最小二乘法

第6章曲线拟合的最小二乘法 6.1 拟合曲线通过观察或测量得到一组离散数据序列，当所得数据比较准确时，可构造插值函数逼近客观存在的函数，构造的原则是要求插值函数通过这些数据点，即。此时，序列与是相等的。如果数据序列，含有不可避免的误差（或称“噪音”），如图6.1 所示；如果数据序列无法同时满足某特定函数，如图6.2所示，那么，只能要求所做逼近函数最优地靠近样点，即向量与的误差或距离最小。按与之间误差最小原则作为“最优”标准构造的逼近函数，称为拟合函数。图6.1 含有“噪声”的数据图6.2 一条直线公路与多个景点插值和拟合是构造逼近函数的两种方法。插值的目标是要插值函数尽量靠近离散点；拟合的目标是要离散点尽量靠近拟合函数。向量与之间的误差或距离有各种不同的定义方法。例如：用各点误差绝对值的和表示：用各点误差按模的最大值表示：用各点误差的平方和表示：或（6.1）

其中称为均方误差，由于计算均方误差的最小值的方法容易实现而被广泛采用。按均方误差达到极小构造拟合曲线的方法称为最小二乘法。本章主要讲述用最小二乘法构造拟合曲线的方法。在运筹学、统计学、逼近论和控制论中，最小二乘法都是很重要的求解方法。例如，它是统计学中估计回归参数的最基本方法。关于最小二乘法的发明权，在数学史的研究中尚未定论。有材料表明高斯和勒让德分别独立地提出这种方法。勒让德是在1805年第一次公开发表关于最小二乘法的论文，这时高斯指出，他早在1795年之前就使用了这种方法。但数学史研究者只找到了高斯约在1803年之前使用了这种方法的证据。在实际问题中，怎样由测量的数据设计和确定“最贴近”的拟合曲线？关键在选择适当的拟合曲线类型，有时根据专业知识和工作经验即可确定拟合曲线类型；在对拟合曲线一无所知的情况下，不妨先绘制数据的粗略图形，或许从中观测出拟合曲线的类型；更一般地，对数据进行多种曲线类型的拟合，并计算均方误差，用数学实验的方法找出在最小二乘法意义下的误差最小的拟合函数。例如，某风景区要在已有的景点之间修一条规格较高的主干路，景点与主干路之间由各具特色的支路联接。设景点的坐标为点列；设主干路为一条直线，即拟合函数是一条直线。通过计算均方误差最小值而确定直线方程（见图6.2）。 6.2线性拟合和二次拟合函数线性拟合给定一组数据，做拟合直线，均方误差为（6.2）是二元函数，的极小值要满足整理得到拟合曲线满足的方程：

用正交多项式做最小二乘拟合

关于用正交多项式做最小二乘拟合的实验报告 1.实验目的：用正交多项式做最小二乘拟合及拟合图形 2.实验内容：编写用正交多项式做最小二乘拟合的程序，并用于求解一个任意给定的数的3次多项式最小二乘拟合问题，在这里给出数据如下：对表格中数据用正交多项式做最小二乘拟合在拟合完后作出拟合曲线的图形，计算平方误差，最后对它们进行分析。程序如下： 1). 构建的正交多项式最高项次数为3时的程序： >> x= 1:0.3:4; >> y=[2.718 3.669 4.95 6.686 9.025 12.182 16.445 22.198 29.964 40.447 54.598]; >> n=3; 构建的正交多项式最高项次数为3 >> result=inputdlg({'请输入权向量w:'},'charpt-3',1,{'[1 1 1 1 1 1 1 1 1 1 1]'}); >> w=str2num(char(result)); 利用str2num函数将数值型转化为符号型 >> m=length(x)-1; >> s1=0; >> s2=ones(1,m+1); >> v2=sum(w); >> d(1)=y*w'; >> c(1)=d(1)/v2; >> for k=1:n xs=x.*s2.^2*w'; a(k)=xs/v2; if(k==1) b(k)=0; else b(k)=v2/v1; end s3=(x-a(k)).*s2-b(k)*s1; v3=s3.^2*w'; d(k+1)=y.*s3*w'; c(k+1)=d(k+1)/v3; s1=s2;

s2=s3; v1=v2; v2=v3; end >> r=y.*y*w'-c*d' r = 0.8918 >> alph=zeros(1,n+1) alph = 0 0 0 0 >> T=zeros(n+1,n+2); >> T(:,2)=ones(n+1,1); >> T(2,3)=-a(1); >> >> if(n>=2) for k=3:n+1 for i=3:k+1 T(k,i)=T(k-1,i)-a(k-1)*T(k-1,i-1)-b(k-1)*T(k-2,i-2); end end end >> for i=1:n+1 for k=i:n+1 alph(n+2-i)=alph(n+2-i)+c(k)*T(k,k+2-i); end end >> xmin=min(x); >> xmax=max(x); >> dx=(xmax-xmin)/(25*m); >> t=(xmin-dx):dx:(xmax+dx); >> s=alph(1); >> for k=2:n+1 s=s.*t+alph(k); end >> plot(x,y,'x',t,s,'-'); >> grid on; >> disp(alph); >> disp(r)

用多项式模型进行数据拟合实验报告(附代码)

实验题目：用多项式模型进行数据拟合实验 1 实验目的本实验使用多项式模型对数据进行拟合，目的在于：（1）掌握数据拟合的基本原理，学会使用数学的方法来判定数据拟合的情况；（2）掌握最小二乘法的基本原理及计算方法；（3）熟悉使用matlab 进行算法的实现。 2 实验步骤 2.1 算法原理所谓拟合是指寻找一条平滑的曲线，最不失真地去表现测量数据。反过来说，对测量的实验数据，要对其进行公式化处理，用计算方法构造函数来近似表达数据的函数关系。由于函数构造方法的不同，有许多的逼近方法，工程中常用最小平方逼近（最小二乘法理论）来实现曲线的拟合。最小二乘拟合利用已知的数据得出一条直线或曲线，使之在坐标系上与已知数据之间的距离的平方和最小。模型主要有：1.直线型2.多项式型3.分数函数型4.指数函数型5.对数线性型6.高斯函数型等，根据应用情况，选用不同的拟合模型。其中多项式型拟合模型应用比较广泛。给定一组测量数据()i i y x ,，其中m i ,,3,2,1,0Λ=，共m+1个数据点，取多项式P （x ），使得 min )]([020 2=-=∑∑==m i i i m i i y x p r ，则称函数P （x ）为拟合函数或最小二乘解，此时，令 ∑==n k k k n x a x p 0 )(，使得min ])([02 002=??? ? ??-=-=∑∑∑===m i n k i k i k m i i i n y x a y x p I ，其中 n a a a a ,,,,210Λ为待求的未知数，n 为多项式的最高次幂，由此该问题化为求),,,(210n a a a a I I Λ=的极值问题。由多元函数求极值的必要条件：0)(200 =-=??∑∑==m i j i n k i k i k i x y x a a I ，其中n j ,,2,1,0Λ= 得到： ∑∑∑===+=n k m i i j i k m i k j i y x a x )(，其中n j ,,2,1,0Λ=，这是一个关于n a a a a ,,,,210Λ的线性方程组，用矩阵表示如下所示：

试验设计习题及答案

【西北农林科技大学试验设计与分析复习题】员海燕版一、名词解释(15分) 1．重复：一个条件值的每一个实现。或因素某水平值的多次实现。 2．因素：试验中要考虑的可能会对试验结果产生影响的条件。常用大写字母表示。 3．水平：因素所处的不同状态或数值。 4．处理：试验中各个因素的每一水平所形成的组合 5．响应：试验的结果称为响应；响应函数：试验指标与因素之间的定量关系用模型 ε+=),,(1n x x f y Λ表示，其中 ),,(1n x x f y Λ=是因素的值n x x ,,1Λ的函数，称为响应函数。 6．正交表：是根据均衡分散的思想，运用组合数学理论在拉丁方和正交拉丁方的基础上构造的一种表格。 7．试验指标：衡量试验结果好坏的指标 8．随机误差：在试验中总存在一些不可控制的因素，它们的综合作用称为～ 9．交互作用：一般地说，如果一个因素对试验指标的影响与另一个因素所取的水平有关，就称这两个因素有交互作用。 10．试验设计：是研究如何合理地安排试验，取得数据，然后进行综合的科学分析，从而达到尽快获得最优方案的目的。 11．试验单元：在试验中能施以不同处理的材料单元。 12．拉丁方格：用拉丁字母排列起来的方格，要求每个字母不论在方格的行内还是列内都只出现一次。 13．综合平衡法：先对各项指标进行分析，找出其较优生产条件，然后将各项指标的较优生产条件综合平衡，找出兼顾各项指标都尽可能好的生产条件的方法。 14．综合评分法：是用评分的方法，将多个指标综合成单一的指标---得分，用每次试验的得分来代表试验的结果，用各号试验的分数作为数据进行分析的方法。 15．信噪比：信号功率与噪声功率之比。 16．并列法：是由相同水平正交表构造水平数不同的正交表的一种方法。 17．拟水平法：是对水平数较少的因素虚拟一些水平使之能排在正交表的多水平列上的一种方法。 18．直和法：是先把一部分因素和水平放在第一张正交表上进行试验，如果试验结果达不到要求，再利用第一阶段试验结果提供的信息，在第二张正交表上安排下一阶段的试验，最后再对两张正交表上的结果进行统一分析的方法。 19．直积法: 在某些试验设计中，试验因素常可分为几类，为了考察其中某两类因素间的交互作用，常采用的把两类因素所用的两张正交表垂直叠在一起进行设计和分析的一种方法。 20．稳健设计：为了减少质量波动,寻找使得质量波动达到最小的可控因素的水平组合二、简答题(10分) 1．试验设计的基本原则是什么？答：一是重复，即一个条件值的每一个实现。作用是提高估计和检验的精度二是随机化，是通过试验材料的随机分配及试验顺序的随机决定来实现的三是区组化，也就是局部控制。 2．试验设计的基本流程是什么？ 1明确试验目的 2选择试验的指标，因素，水平 3设计试验方案 4实施试验 5对获得的数据进行分析和推断。 3．试验设计的相关分析有哪几种？一是相关系数，即用数理统计中的两个量之间的相关程度来分析的一种方法。二是等级相关，是把数量标志和品质标志的具体体现用等级次序排序，再测定标志等级和标志等级相关程度的一种方法。有斯皮尔曼等级差相关系数和肯德尔一致相关系数） 4．为什么要进行方差分析？方差分析可检验有关因素对指标的影响是否显著，从而可确定要进行试验的因素；另外，方差分析的观点认为，只需对显著因素选水平就行了，不显著的因素原则上可在试验范围内取任一水平，或由其它指标确定。 5．均匀设计表与正交表，拉丁方设计的关系 6．产品的三次设计是什么？产品的三次设计是系统设计，参数设计，容差设计。三、(15分) 1．写出所有3阶拉丁方格，并指出其中的标准拉丁方格和正交拉丁方格

JMP试验设计

JMP试验设计 1.试验设计方法及其在国内的应用 (2) 2.试验设计(DOE)就在你身边试验设计(DOE)就在你身边 (7) 3.初识试验设计(DOE) (13) 4.多因子试验设计(DOE)的魅力 (18) 5.用DOE方法最优化质量因子配置 (26) 6.顾此不失彼的DOE (32) 7.试验设计(DOE)五部曲 (39) 8.稳健参数设计的新方法 (45) 9.JMP的试验设计优势——为什么用JMP做试验设计 (50)

试验设计方法及其在国内的应用随着改革开放的深入，以市场经济为代表的西方先进文明及其方法论越来越多被国内企业界所接纳。在质量管理、产品（医药，化工产品，食品，高科技产品，国防等）研发、流程改进等领域，统计方法越来越多成为企业运营的标准配置。试验设计作为质量管理领域相对复杂、高级的统计方法应用，也开始在国内被逐渐接受，推广。其实试验设计对于我国学术界来说并不陌生。比如均匀设计，均匀设计是中国统计学家方开泰教授(下图左)和中科院院士王元首创，是处理多因素多水平试验设计的卓有成效的试验技术，可用较少的试验次数，完成复杂的科研课题开发和研究。国内一些大学的数学系和统计系近年来已经逐渐开始开设专门的试验设计课程，比如清华大学，电子科技大学、复旦大学等高校。国内一些行业领先的企业，比如中石化，华为科技，中石油，宝钢等企业，也开始在质量管理和产品研发、工艺改进等领域采用DOE方法。尽管DOE越来越多的被国内产、学、研领域所接受，但是我们还是看到，国内对于DOE的研究和推广仍旧停留在比较浅的层次。以上述企业为例，中石化下属的石化科学研究院和上海石化研究院应该是我国石油化工研究领域的王牌单位了，不过不管是北京的石科院，还是上海石化研究院，在油品研发、工艺改进、质量管理等领域，对于DOE的使用还仅仅停留在部分因子和正交设计层面。笔者在网络

石河子大学2016级研究生《试验设计与数据处理》

石河子大学 2016至2017年第1学期 2016级硕士生《试验设计与数据处理》试题题号一二三四五总分得分 1、某钢厂为了研发弹簧用镍铜合金代用材料，优选8%磷青铜生产中的加工度A 与退火温度B ，以便获得以下四种规格的材料：第一种抗拉强度75kgf/mm 2以上第二种抗拉强度70kgf/mm 2以上第一种抗拉强度65kgf/mm 2以上第一种抗拉强度60kgf/mm 2以上取A 、B 水平如下：加工度A ：A 1=30，A 2=40，A 3=50，A 4=60（%）退火温度B ：B 1=150，B 2=200，B 3=250，B 4=300（O C ）将A 、B 各取四水平，按随机顺序作全面试验，然后随机抽取试样测量其抗拉强度，得数据如下表： B y A B 1 B 2 B 3 B 4 A 1 A 2 A 3 A 4 试分析下述问题： 1）加工度A 、退火温度B 与抗拉强度间的关系式（试配二元三次多项式回归方程）提示：3033302022 2011011000^ B b A b B b A b AB b B b A b b y +++++++= 2）求出满足第一种到第四种抗拉强度的加工度与退火温度的范围。 2、设有四个自变量1234,,,Z Z Z Z ，拟合线性回归的小区域为：[10,15]，[1,2]，[25,35]，[75,85]，选用78(2)L 正交表作试验计划，试验结果如表2：自然变量规范变量试验结果 y 1Z 2Z 3Z 4Z 1x 2x 3x 4x 15 2 35 85 1 1 1 1 15 2 25 75 1 1 -1 -1 15 1 35 75 1 -1 1 -1 15 1 25 85 1 -1 -1 1 10 2 35 75 -1 1 1 -1 10 2 25 85 -1 1 -1 1 10 1 35 85 -1 -1 1 1 10 1 25 75 -1 -1 -1 -1 试拟合一次回归模型并进行相关回归方程检验。用手工计算后再用统计软件计算，要求

神经网络优化理论研究及应用_第4章优化网络在板形模式识别中的应用_44_59

第4章优化网络在板形模式识别中的应用 4.1 引言　板形是表征板带材横向质量的，它包含两重意义：一重意义是指板带材的横向厚差；另一重意义是指板带材的横向张力差。前者主要对中厚板起作用；后者对薄板起作用，用平直度来标定[45,46]。对冷轧带钢来说，“板形”的概念通常指平直度，平直度是指不平直的程度，亦即对一平坦平面的偏离程度，平直度也就是这种偏离程度的计量。“板形”就其实质而言，是指带钢内部残余应力的分布程度[47]。通常冷轧带钢产品不允许有明显的浪形与瓢曲等板形缺陷存在，因为板形不良将影响用户的使用。如带钢在长度方向在水平面上向一边弯曲，会影响用户放样下料、自动进料或材料的利用率，更为严重的是切不成材，无法使用。因此板形是冷轧带钢产品标准的保证项目之一。在板形闭环控制策略中，板形缺陷识别和控制策略优化是彼此相关的两个重要环节。为制定合理的控制策略，须通过对实测的一组板形应力信σ（i=1,2,…,n）进行模式识别，并以约定的参数定量的提供给下一控制号 i 环节，这即为板形缺陷模式识别。在实际板形控制系统中，轧机出口带材的板形信息可以通过板形仪在线测量获得。众所周知，轧机不同的执行机构控制不同类型的板形缺陷，而由板形仪测得的板形数据是一个综合板形缺陷，无法直接应用到板形控制系统中。只有通过适当的方法进行模式分解，提取出控制系统各回路的控制量，才能达到控制板形的目的。因此，实测板形的模式分解是板形控制系统中必不可少的一个环节，也是板形控制中的一个热点。板形模式识别的主要任务是把在线检测到的（或理论计算得到的）一组张力分布离散值，经过一定的数学方法，映射为较少的几个特征参数，并且具有如下性质[48]：（1）尽可能少的状态变量，数学表达简练；（2）不丢失必要的信息，特征参数能够完全反映原应力分布值所决定的带钢板形质量状态；