数据拟合文献

合集下载

电量系统的数据拟合与计量方法

结束值一读表开始值）倍率＝ × 读表数增量× 倍率；）３计算后的电量值需要进行统计。统计方式有小时统计、
日时段统计、日统计、月统计、年统计等。日统计总电量＝后一天基值一（当天基值）倍率；日统计峰电量＝ ×
（后一天基值峰值一当天基值峰值）倍率；月统计总 × 电量＝下月１日基值一（当月１日基值）倍率； × 年统计总电量＝下年１１日基值一（月当年１１日基值）月 ×
倍率。
若计量的时间段倍率不一致，即有换ＣＴ或的情况，上述计算公式则不适用，需根据更换时间分
段计算，即为更换ｃＴ或业务。若计量时间段读表数增长不连续，或结束值小于初始值，上述计算公式就也不适用，同样需根据更换时间分段计算，即为换
●
ＦｇｒＦｔｎｕｃｏｕｖｉｕｅ１ｉｉｇｆｎｔｎｃｒｅｔｉ
分析等应用。在主站系统执行采集任务过程中。若因采集通道
采用曲线拟合方法处理构造近似函数（）在，包含全部基节点施０１２＂的区间“ （，，…Ｉｔ）最好” 逼近
收稿日期：０１０ — １２１－３２
求，但基本原理没有多大变化。数据采集类型可以是脉冲计数量或电能表窗口．值也可以是对功率量积分累计。通过设置参数标度和倍率，可以将采集值转换
为电能量，并对电能量进行日累计、分时段累计、增量检查及丢失数据处理。
拟合。系统使用离散数据曲线拟合的方法进行数据拟合。只能观测或测量到量测函数ｙｆｘ的一组离散的＝（）试验数据：－ｙ，０１ …１（ｉｉｉ．２ｌｑ）＝．，（＂９，且这些数据比较准确

最小二乘法的数据拟合

四川理工学院《数值计算方法》课程设计题目：用最小二乘法实现数据拟合专业：数学与应用数学班级：2013级2班姓名：李宁、李鑫、骆丹、冯莉娟目录：一、摘要............................ 错误！未定义书签。

二、应用计算方法的基本原理.......... 错误！未定义书签。

1.最小二乘法线性拟合............... 错误！未定义书签。

1.1算法描述........................ 错误！未定义书签。

1.2误差估计 (3)2.最小二乘法非线性拟合 (3)三、例题的计算结果 (4)1. 最小二乘法线性拟合 (4)2.最小二乘法非线性拟合 (5)四、总结及心得体会 (7)五、参考文献........................ 错误！未定义书签。

六、附录程序 (8)一、摘要本文主要依据最小二乘法对任意一组数据进行线性拟合和非线性拟合。

因为在实际生活中，我们在工厂、车间、工作室等地方将遇见很多数据，这些数据可能有关系，及线性关系，正比关系，一些简单和复杂的关系。

但是更多的数据是杂乱无章的。

对于这些无规律的数据，我们得出对我们有利的结论。

然而分析数据有是我们这个时代发展的必不可少的研究，所以只有将数据转化成为我们需要的形式，才能进一步分析。

将数据转化为必要的形式的一种重要的方式则是最小二乘法中的数据拟合。

但是在拟合的时候，有些非线性的数据需要我们进行变量代换。

在本文中就举出了一个非线性拟合的例子，通过此例子来演示如何把非线性拟合转化为线性拟合求解。

本文中还有重要的模块是用matlab编写程序，在使用c语言调用子程序时，我们只需要建立大M文件，而我们所工作的区间就是主程序。

我们可以初步绘制出散点图，观察散点图的趋势来确定用什么拟合。

用最小二乘法拟合数据大概分为两类：线性拟合和非线性拟合。

一般先测量数据在直角坐标平面上描出散点图，看一看散点同哪类曲线图形接近，然后选用相近的线性或非线性的曲线去拟合数据，非线性的曲线再通过适当的变量替换转化为线性拟合问题，进而用matlab编写程序求出拟合函数表达式。

统计学文献综述

统计学文献综述统计学是研究如何从数据中提取有用信息，以及如何通过这些信息来做出决策和预测的科学。

在过去的几十年里，统计学得到了广泛的应用和发展，涉及的领域包括生物学、医学、经济学、社会学等。

以下是对统计学领域的一些重要文献的综述。

一、描述性统计学描述性统计学是统计学的基础，它主要研究如何通过图表、表格和数字来描述数据的特征和规律。

以下是一些重要的描述性统计学文献：《统计学基础》（作者：David Freedman）这本书是统计学入门教材的经典之作，它详细介绍了描述性统计学的概念和方法，包括平均数、中位数、众数、方差、标准差等。

此外，书中还涵盖了概率论和概率分布的基础知识，为进一步学习统计学打下了坚实的基础。

《实用回归分析》（作者：David Freedman）这本书是回归分析领域的经典之作，它详细介绍了线性回归分析的概念和方法，包括最小二乘法、模型拟合度、变量选择等。

此外，书中还介绍了非线性回归分析和其他回归分析方法，为数据分析和预测提供了重要的工具。

二、推断性统计学推断性统计学是统计学的核心，它主要研究如何通过样本数据来推断总体特征。

以下是一些重要的推断性统计学文献：《概率论与数理统计》（作者：吴喜之）这本书是概率论与数理统计的经典教材之一，它详细介绍了概率论和数理统计的基本概念和方法，包括大数定律、中心极限定理、参数估计、假设检验等。

此外，书中还涵盖了贝叶斯统计学和其他推断性统计方法，为数据分析提供了重要的理论支撑。

《实验设计与分析》（作者：John Maurice Hoey）这本书是实验设计与分析领域的经典之作，它详细介绍了实验设计和数据分析的方法和技巧，包括单因素和多因素实验设计、方差分析、协方差分析等。

此外，书中还介绍了实验设计在实践中的应用，为科研人员和工程师提供了重要的参考。

三、机器学习与数据挖掘随着大数据时代的到来，机器学习和数据挖掘在统计学领域的应用越来越广泛。

以下是一些重要的机器学习和数据挖掘文献：《机器学习》（作者：Tom M. Mitchell）这本书是机器学习领域的经典之作，它详细介绍了机器学习的概念和方法，包括分类、聚类、决策树、神经网络等。

origin,指定数据拟合曲线__解释说明

origin,指定数据拟合曲线解释说明1. 引言1.1 概述在科学研究和工程实践中，经常会遇到需要对一组数据进行拟合的情况。

数据拟合是根据已有的观测数据，利用数学模型寻求最佳的拟合函数与观测值之间的关系，从而得到一条曲线来描述这些数据的趋势和规律。

通过进行数据拟合，我们能够更好地理解现象背后的规律，并可以预测未知观测点的结果。

此外，数据拟合还可以用于优化设计、参数估计、信号处理、模式识别等领域。

本文将详细探讨数据拟合曲线的选择和评估指标，并通过实际应用案例进行分析。

同时，我们将介绍数据拟合的原理和方法，并讨论不同方法在实践中的适用性和局限性。

1.2 文章结构本文共分为五个部分：引言、正文、数据拟合曲线解释说明、结论和参考文献。

其中，引言部分将介绍本文内容概述以及文章结构安排；正文部分将详细讨论相关概念和方法；数据拟合曲线解释说明部分将进一步探讨数据拟合原理、拟合曲线选择以及评估指标；结论部分将总结文章的主要内容和研究成果；参考文献部分将列举本文所引用的相关文献。

1.3 目的本文的目的在于深入探讨数据拟合曲线的原理与方法，以及其在实际应用中的具体案例。

通过对数据拟合原理和方法进行阐述，并借助实例分析，我们旨在帮助读者更好地理解数据拟合问题，并能够正确选择适用于自己实际需求的拟合曲线和评估指标。

此外，我们还希望通过本文能够激发读者对数据拟合问题进一步探索和研究的兴趣。

2. 正文数据拟合曲线是一种数学模型，可以用于描述和预测实际数据中的趋势和关系。

在科学研究和工程应用中，我们经常遇到需要通过拟合曲线来分析和解释数据的情况。

本节将介绍一些常见的数据拟合方法，并探讨它们在不同场景下的应用。

首先，最简单也是最常见的数据拟合方法是线性回归。

在线性回归中，我们假设变量之间存在线性关系，并试图找到最佳拟合直线来表示这种关系。

通过最小二乘法等统计方法，可以确定直线的斜率和截距，从而得到一个近似解。

除了线性回归，还有很多其他的拟合曲线方法可供选择。

基于IN-SAR地面沉降缺失数据拟合

摘要我国的地面沉降现象一直比较严重。

地面沉降破坏建筑物和生产设施、损坏地下线路设施等，给人们的生产、生活带来严重的影响。

基于地面沉降对环境及经济建设破坏的严重性，当前许多地区及城市已将地面沉降监测作为防灾减害的一项重要工作。

近年来大量的研究和实践表明， InSAR（合成孔径雷达干涉测量）技术可以高精度监测地表的微小地表形变，具有全天候、全天时、覆盖面广、高度自动化和高精度监测地表变形的优势，能够有效弥补水准测量和GPS测量空间分辨率不足的问题，是目前沉降灾害监测的一种重要技术手段。

然而，InSAR监测手段也有自己的不足，InSAR技术虽然具有很高的空间分辨率，但是雷达卫星因其固有的运行周期，无法满足监测的要求。

另外，时间失相干或山区SAR影像的顶底倒置等易导致干涉图出现数据缺失，从而难以达到区域监测的目的。

本文针对数据缺失现象，研究基于多项式拟合和多面函数拟合的缺失数据拟合方法，重点探讨多面函数拟合中心节点以及核函数的选择问题，最后以西安市地面沉降监测数据为例，对比分析不同拟合模型的拟合效果，以此来探讨拟合模型的优选问题。

关键词：地面沉降，InSAR，D-InSAR，多项式拟合，多面函数拟合ABSTRACTSerious land subsidence phenomenon happen in china for a long time. Subsidence damage to buildings and production facilities, damage to underground line facilities to the people's production and life seriously affected. Based on land subsidence damage to the environment and the gravity of economic development, the current number of regions and cities have land subsidence monitoring harm reduction as an important prevention work. In recent years, extensive research and practice shows that, InSAR (Interferometric Synthetic Aperture Radar) technology to high-precision monitoring of the surface of the small surface deformation, all-weather, all-time, wide coverage, high degree of automation and high precision ground deformation monitoring of the advantages of effective to make up for leveling and GPS measurements the problem of inadequate spatial resolution, is the subsidence is an important side lesson plan techniques.However, InSAR monitoring tools also have their own deficiencies, InSAR technology, while high spatial resolution, but the operation of the radar satellite because of its inherent cycle can not meet monitoring requirements. In addition, the time lost coherence or mountain top and bottom inverted SAR image of the interferogram so easily lead to data loss occurs, and thus difficult to achieve regional monitoring purposes.In this paper, the phenomenon of missing data, research is based on polynomial fitting and multi-faceted function fitting of the missing data fitting method, focusing on the multi-faceted function fitting the selection of nodes, and finally to ground subsidence monitoring data of Xi'an, comparative analysis fitting results of different fitting models in order to fit the model of optimization problem.KEY WORDS Land subsidence，InSAR，Polynomial fitting，Multisurface function fitting，isoline目录第一章绪论 (1)1.1 地面沉降性质及监测意义 (1)1.2 地面沉降监测常用方法 (1)1.3 D-InSAR简介及国内外发展情况 (2)1.4 缺失数据拟合研究意义 (3)1.5 本论文研究内容 (3)第二章 InSAR及D-InSAR基本原理及数据处理流程 (4)2.1 引言 (4)2.2 InSAR基本原理 (5)2.3 D-InSAR监测地表形变基本原理 (7)2.4 干涉测量的数据处理流程 (8)第三章缺失数据拟合 (11)3.1 引言 (11)3.2 多项式曲面拟合模型 (11)3.2.1曲面拟合基本原理 (11)3.2.2曲面函数的选取 (12)3.3 多面函数拟合模型 (12)3.3.1多面函数的基本原理 (12)3.3.2多面函数相关参数的确定 (14)3.3.3 InSAR沉降数据拟合内插精度评定 (16)第四章地面沉降监测中InSAR沉降数据内插模型实例分析 (16)4.1 西安市地面沉降概况 (16)4.2 缺失数据拟合实例分析 (17)4.2.1多项式曲面拟合模型实例分析 (17)4.2.2多面函数拟合模型实例分析 (21)4.3地面沉降量等值线图的提取 (24)4.3.1等值线简介 (24)4.3.2提取地面沉降等值线图 (24)总结 (25)致谢 (26)参考文献 (27)附录 1 多项式内插MATLAB代码 (28)附录 2 多面函数内插MATLAB代码 (30)附录 3 地面沉降等值线图MATLAB代码 (33)第一章绪论1.1 地面沉降性质及监测意义地面沉降是在自然和人为因素作用下,由于地壳表层土体压缩而导致区域性地面标高降低的一种环境地质现象,是一种不可补偿的永久性环境和资源损失,是地质环境系统破坏所导致的恶果[1]。

文献翻译-基于MATLAB的数据曲线拟合分析

英文翻译系别专业班级学生姓名学号指导教师报告日期Data Curve Fitting Based on MATLABCurve fitting is the process of constructing a curve, or mathematical function, that has the best fit to a series of data points,possibly subject to constraints. Curve fitting can involve eitherinterpolation, where an exact fit to the data is required, or smoothing, in which a "smooth" function is constructed that approximately fits the data. A related topic is regression analysis, which focuses more on questions of statistical inference such as how much uncertainty is present in a curve that is fit to data observed with random errors. Fitted curves can be used as an aid for data visualization, to infer values of a function where no data are available, and to summarize the relationships among two or more variables.Extrapolation refers to the use of a fitted curve beyond the range of the observed data, and is subject to adegree of uncertaintysince it may reflect the method used to construct the curve as much as it reflects the observed data. Research and Application of a New Method of Curve Fitting.The technique of curve fitting is used proverbially for the image processing, reverse engineering, test data processing, etc. It is inequitable to process physical parameters by some usual methods of curve fitting. Those methods are performed only by minimizing the fitting error of one physical parameter, but do not take other parameters into account. The new method of curve fitting processes each physical parameter equally The simulation also proves that this new curve fitting method is right and effective.In the experiment of sound velocity, the voltammetry to measure the resistance experiment and the volt-ampere characteristic of diode experiment data processing as an example, introduced the experiment data processing based on MATLAB.With the traditional experimental data processing methods, experimental data is processed by using MATLAB can effectively avoid the error caused by manual processing, but also can reduce the computational workload, obtain accurate curve fitting, thereby increasing the accuracy of data processing and fast,rom graphic display results also can be more intuitive to judge the validity of the experiment.Mathematical expressionGiven set of discrete data(x k,y k) (k=1,2,…,m),(1)Where xk is the independent variable x (scalar or vector, i.e., a mono-or polyhydric variable) values; yk of (scalar) corresponding to the value of the dependent variable y. Curve fitting is to seek to solve the problem of (1) to adapt the laws of the analytical expression of the backgroundy=f(x,b),(2)Making best approximation in some sense or fit (1), (x, b) is called fitting model;? Parameters to be determined, when b) only appears when the linear, called a linear model? otherwise non-linear.Amount(k=1,2,…，m)In xk place called residual or remaining fit,The standard measure of goodness of fit is usually或Where ωk> 0 as weight coefficient or weight(Unless otherwise specified, generally taken to be the average weight,w k(k=1,2,…,m),At this time without mention weight).When the parameter b) make T (b)) or Q (b)) to achieve the most hours,Appropriate (2) are referred to (1) the weighted Chebyshev fitting meaning orweighted least squares sense,latter is more simple and most commonly used in the calculation.General linear model to determine the model parameters are parameters b) generalized polynomial coefficients,thatf(x,b)=b0g0(x)+b1g1(x)+…b n g n(x)(3)Wherein g0, g1, ..., gn called basis functions.Gj on various different choices may constitute a variety of typical and commonly used linear model.From the point of view of function approximation, equation (3) can be approximated reflect the nature of many of nonlinear models.In the least squares sense (3) fitting a linear model with a discrete set of points(1),parameter b can be obtained by solving equations=0(i=0,…,n)to determine,that solution on b0,b1,…,bn of linear algebraic equations(i=0,1,…，n),(4)Formula (i,j＝0,1,…，n),Equations (4) commonly referred to as the normal equation or the normal equation, when m> n, generally have a unique solution.As for the case of non-linear model and the principle of least squares, the parameter b) can be determined (see numerical solution of nonlinear equations, optimization) nonlinear equations or calculations about the method optimization.Select the modelFor a given discrete data (1), the need to properly select the general model (2) of the function f (x, b) the type and specific form, which is the basis of fitting results.If known, (1) the actual background of the law, that is the dependent variable ydependence of the empirical formula of the independent variable x has an expression determined directly take appropriate empirical formula is fitting model.On the contrary, through the model (3) of the basis functions g0, g1, ..., gn (number and types) of different choices, each corresponding proposed merger by choosing the good effect.Function g0, g1, ..., gn adaptation plays a role the model for testing, it is also known test function.Another way is: the number and types into a sufficient number of test functions in the model (3), by means of statistical methods in mathematical correlation analysis and test of significance of the test function contains screened individually or sequentially with establish more appropriate model (see regression analysis).Certainly, the above method may fit residuals (as a new discrete data) is performed again to compensate for the lack of the first fitting.In conclusion, when the intrinsic link between the variables in the data is not clear, as the choice to adapt the model to fit generally requires repeated testing and analysis to identify.Procedure（一）Draw a scatter plot, select the appropriate type of curve.Generally based on the nature of the information can be combined with the expertise to determine the type of curve data, not reallytaht can be plotted on graph paper squares scatter plot, according to the distribution of scattered points, choose close, the appropriate curve type.Can be plotted on graph paper squares scatter plot, according to the distribution of scattered points, choose close, the appropriate curve type.（二）Be variable transformationY’=f(Y),X’=g(X)(12.37)The two variables transformed linear relationship.（三）Solving linear equations and variance analysis by the least squares method（四）Convert the linear equations on the original variables X, Y of the function expression基于MATLAB的数据曲线拟合分析曲线拟合是构建的过程曲线，或数学函数，具有最适合于一系列的数据点，可能受到约束。

Origin软件在实验数据拟合中的应用

Origin软件在实验数据拟合中的应用吕东灿;袁帅;赵仲麟;顿文涛;李建伟;袁志华;袁超【摘要】本文介绍了Origin软件线性拟合和非线性拟合处理实验数据的方法,并以恒压过滤常数的测定实验为例,详细介绍了如何使用Origin软件进行线性拟合.以溶解热的测定实验为例,说明了Origin软件非线性拟合求得实验曲线的方法.结果表明,Origin软件能够快速、精确、客观地处理实验数据,将其应用于实验教学中,能够激发学生的学习积极性,培养学生良好的科研素养,提高学生的综合应用能力.【期刊名称】《农业网络信息》【年(卷),期】2016(000)002【总页数】3页(P38-40)【关键词】Origin软件;数据处理;线性拟合;非线性拟合;教学【作者】吕东灿;袁帅;赵仲麟;顿文涛;李建伟;袁志华;袁超【作者单位】河南农业大学理学院,河南郑州 450002;四川农业大学机电学院,四川雅安 625014;河南农业大学理学院,河南郑州 450002;河南农业大学信息化管理处,河南郑州 450002;河南农业大学机电工程学院,河南郑州 450002;河南农业大学机电工程学院,河南郑州 450002;河南农业大学理学院,河南郑州 450002【正文语种】中文【中图分类】TP315大学理科专业教师和学生都离不开科学研究实验，在实验过程中必然会涉及数据的处理，如找出变量之间的关系[1]、吸附过程的重要参数和吸附类型的判断[2]等。

一些实验可以直接判断出变量间的关系，但在一些创新的探索实验中，实验数据不能简单地用线性或非线性来描述。

例如，实验曲线出现多个峰时，确定必要的数据非常繁琐。

在一些工程性特点显著的实验中，需要解决一些实际的工程问题[3]，采用传统手工计算方法分析大量数据，存在费时费力、数据处理误差大等问题。

若能够借助专业技术软件进行数据处理、图形绘制等工作，在工作效率和实验误差方面都有了很大的进步。

Origin是一款操作灵活、结果直观、功能强大的图形绘制和数据分析处理软件[4]。

课题参考文献举例

课题参考文献引言在进行课题研究时，参考和借鉴前人的研究成果是非常重要的。

本文将介绍一个关于某个课题的参考文献，通过对这些文献的全面、详细、完整的探讨，帮助读者更好地了解和研究该课题。

一、文献1文献1题为《某课题的研究方法与实验设计》[1]，主要介绍了该课题的研究方法和实验设计。

该文献详细阐述了采用的研究方法，包括问卷调查、实验研究和数据分析等。

该文献还特别强调了实验设计的重要性，提供了一套完整的实验设计流程，帮助研究者设计和实施实验。

1.1 研究方法该文献详细介绍了研究方法的选择和应用。

作者提出了通过问卷调查的方式收集数据，并使用统计学方法对数据进行分析的方法。

通过问卷调查可以获取大量的数据，较好地反映研究对象的特征和态度，而统计学方法可以对收集到的数据进行客观、准确的分析。

1.2 实验设计实验设计是该研究的核心内容之一。

文献中详细介绍了实验设计的步骤和要点，包括研究对象的选择、实验组和对照组的设置以及实验因子的确定等。

通过科学合理的实验设计可以有效地降低实验误差，提高实验结果的可信度和可重复性。

1.3 数据分析数据分析是该研究的最后一步。

文献中介绍了常见的数据分析方法，包括描述性统计、假设检验和相关分析等。

通过对数据进行分析，可以得出结论并进行科学的解释和推断。

二、文献2文献2题为《某课题的理论探索和研究现状》[2]，主要介绍了该课题的理论探索和研究现状。

该文献从理论基础的角度出发，深入探讨了该课题的相关概念、理论模型和假设，并介绍了该课题研究的最新进展和现状。

2.1 理论基础该文献首先介绍了该课题的理论基础。

通过对相关概念和理论模型的阐释，读者可以更好地理解该课题的研究方向和目标。

该文献还提出了几个关键的假设，为后续的实证研究提供了理论支持。

2.2 研究现状该文献接着介绍了该课题的研究现状。

通过对近年来相关研究成果的综述，该文献让读者了解到该课题研究的最新进展和趋势。

这些研究成果包括不同方法、不同数据集的实证研究，以及对研究结果的解释和讨论。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、前言部分本文首先指明了数据拟合的研究背景和意义，以及关于数据拟合问题所做的相关工作和当前的研究现状。

二次拟合曲线由于有着良好的几何特性、较低的次数及灵活的控制参数，成为基本的体素模型之一，在计算机图形学和计算机辅助几何设计等领域中起着重要的作用。

解决数据拟合问题的基本思想是最小二乘法，本文中给出了最小二乘法的基本思想。

分析解决数据拟合问题所采用的算法，并对典型性的算法进行了较为详细的求解。

关键词数据拟合；最小二乘法；多项式拟合；二、主题部分2.1 国内外研究动态，背景及意义数学分有很多学科，而它主要的学科大致产生于商业计算的需要、了解数字间的关系、测量土地及预测天文事件。

而在科技飞速发展的今天数学也早已成为众多研究的基础学科。

尤其是在这个信息量巨大的时代，实际问题中国得到的中离散数据的处理也成为数学研究和应用领域中的重要的课题。

比如科学实验中，我们经常要从一组试验数据(,)i ix y，i = 0,1,...,n中来寻找自变量x和因变量y之间的函数关系，通常可以用一个近似函数y = f (x)表示。

而函数y = f (x)的产生方法会因为观测数据和具体要求不同而不同，通常我们可以采用数据拟合和函数插值两种方法来实现。

数据拟合主要考虑到了观测数据会受到随机观测误差的影响，需要寻求整体误差最小、能够较好的反映出观测数据的近似函数y = f (x)，这时并不要求得到的近似函数y = f (x)必须满足yi = ()if x,i = 0,1,…,n。

函数插值则要求近似函数y = f (x)在每一个观测点ix处一定要满足y i=()if x，i = 0,1,…,n。

在这种情况下，通常要求观测数据相对比较准确，即不考虑观测误差的影响。

所以，可以通过比如采样、实验等方法而得到若干的离散的数据，根据这些离散的数据，我们往往希望能得到一个连续函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。

这个过程叫做拟合。

也就是说，如果数据不能满足某一个特定的函数的时候，而要求我们所要求的逼近函数“最优的” 靠近那些数据点，按照误差最小的原则为最优标准来构造出函数。

我们称这个函数为拟合函数。

2.1.1 国内外研究现状在通过对国内外有关的学术刊物、国际国内有关学术会议和网站的论文进行参阅。

数据拟合的研究和应用主要是面对各种工程问题，有着系统的研究和很大的发展。

通过研究发展使得数据拟合有着一定的理论研究基础。

尤其是关于数据拟合基本的方法最小二乘法的研究有着各种研究成果。

但是，由于现实问题的复杂性，数据拟合还拥有很好的研究空间，还有很多能够优化和创新的问题需要去研究和探索。

各种算法的改进和应用以及如何得到合适的模型一直是一个比较热门的研究领域。

例如，国内外文献里提出了很多基于形状的描述方法，比如傅氏描述子法、多边形法、累积角法等, 其中以二次曲线和超二次曲线来拟合物体的边界形状并进行物体的描述已获得广泛应用。

现在,我们应用高次隐式多项式曲线来作为物体的几何模型受到广泛的重视。

2.1.2 研究的意义归纳总结数据拟合理论在实际中的应用，发掘各个数据拟合算法的在实际应用中的应用范围适用性。

通过对本项目的研究和分析，使得实际中的工程问题根据不同的需求使用最合适的拟合算法，从而提高拟合的精确度。

研究和发展数据拟合理论，发掘各种数据拟合的优化方案。

根据离散的数据，我们想要得到连续的函数或更加密集的离散方程与已知数据相吻合。

如何选择数学模型，如何减小误差，如何使得逼近函数图像最靠近那些数据点，使得优化拟合算法变得十分重要。

2.2 研究主要成果最小二乘法为数据拟合的最基本也是应用最广泛的方法，最小二乘法有了很大的发展。

在实际应用和实验中，我们经常采用实验的方法寻找变量间的相互关系。

但是，当观测到的数据较多时，一般情况下使用插值多项式来求近似函数是不现实的。

根据多元函数线性回归理论，使用曲线拟合最小二乘法来寻求变量之间的函数关系能够很好的解决这个问题。

而且我们对它在实际应用中产生各方面的需求有着各种研究。

例如：基于于均差最小二乘拟合方程形式的研究、数据拟合函数的最小二乘积分法、非线性最小二乘法等各种方法已经在工程中得到了应用。

所谓数据拟合的最小二乘法是一种数学优化的技术，它通过最小化误差的平方和寻找数据的最佳函数匹配，并使得这些求得的数据与实际数据之间误差(残差)的平方和为最小。

为了使问题的提法更具有一般性，通常把最小二乘法中的误差(残差)平方和都考虑为加权平方和。

最后为了使误差的加权平方和最小，会转化为求多元函数的极小点的问题。

其有关概念与方法可以推广到多元函数拟合之中。

最小二乘法在运筹学、统计学、逼近论和控制论中，是很重要的求解方法。

例如，它在统计学之中是估计回归参数最基本的方法。

在实际问题中，如何由测量的离散数据设计和确定最优的拟合曲线？其关键在于选择适当类型的拟合曲线，一些时候根据专业的知识和我们的经验就可以确定拟合曲线类型；但是当我们在对拟合曲线一无所知的情况下，可以先绘制离散数据的粗略图形，也许能够从中观测出拟合曲线的类型；或者对数据进行多种可能较好的曲线类型的拟合，并且计算出它们的均方误差，利用数学实验的方法找出最小二乘法意义下误差最小的拟合函数。

在离散数据的最小二乘法中，最简单、最常用的数学模型是多项式拟合。

另外，近年来对高次隐式多项式曲线来作为物体的几何模型也受到广泛的重视，用隐式多项式曲线来描述数据点集合的轮廓也有了初步的比较系统的研究。

随着数据拟合的广泛应用出现了许多可以进行拟合的应用软件。

OriginPro ，Matlab ，SAS ，SPSS ，DataFit ，GraphPad ，TableCurve2D ，TableCurve3D ，Mathematica 等其功能都十分优秀。

他们还具有自动选择数学模型的功能。

2.3 最小二乘曲线拟合对于已知的m +1的离散数据m i i i y x 0},{=和权数mi i 0}{=ω，记i mi i mi x b x a ≤≤≤≤==00max ,min在连续函数空间C [a ,b ]中选定n +1个线性无关的基函数m k k x 0)}({=ϕ，并记由它们生成的子空间)}(),(),({10x x x span n ϕϕϕ =Φ。

如果存在***0()()nk k x a x ϕϕ==∈Φ∑ （2-1）使得*22()0[()]min[()]nniiiix i i y x y x ϕωϕωφ∈Φ==-=-∑∑ (2-2)则称)(*x ϕ为离散数据m i i i y x 0},{=在子空间Φ中带权mi i 0}{=ω的最小二乘拟合。

函数)(x ϕ在离散点处的值为()(),0,1,,ni j j j x a x i m ϕϕ===∑ (2-3)因此，(2-2)右边的和式是参数n a a a ,,10的函数，记作2010])([),,(∑∑==-=m i nj i j j i i n x a y a a a I ϕω (2-4)这样，求极小值问题(2-2)的解)(*x ϕ,就是求多元二次函数),,,(**1*0n a a a 的极小点),,(10n a a a I 使得01***0101,,(,,)min(,,)n n n a a a RI a a a I a a a ∈=(2-5)由求多元函数极值的必要条件002[()]()0,0,1,,m ni i j j i k i i j k Iy a x x k n a ωϕϕ==∂=--==∂∑∑ (2-6)若记0(,)()()()mj k i j i k i i x x x ϕϕωϕϕ==∑ (2-7)n k d x x f x f k i k i mi i k ,,1,0,)()()(),(0=≡=∑=ϕωϕ (2-8)上式可改写为),...,1,0(;),(n k d a k j noj j k==∑=ϕϕ(2-9)这个方程称为法方程，可写成矩阵形式d Ga = (2-10)其中0101(,,...,),(,,...,)T T n n a a a a d d d d == (2-11)⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=),(),(),()(),(),(),(),(),(101110101000n n n n n n G ϕϕϕϕϕϕϕϕϕϕϕϕϕϕϕϕϕϕ (2-12) 由于)(),(),(10x x x n ϕϕϕ 线性无关，故|G |≠0，方程(2-9)存在唯一的解*,0,1,,k k a a k n == (2-13)从而得到函数f (x )的最小二乘解为**0()()nk k k S x a x ϕ==∈Φ∑ (2-14) 可以证明，这样得到的*()S x ，对于任何)(x S ，都有()()()()*22*[()][()]nni i iii i i i fx f x x S x x S x ωω==-≤-∑∑ (2-15)故)(*x S 是所求的最小二乘解。

记)(*x y ϕδ-=，显然，平方误差22δ或均方误差2δ越小，拟合的效果越好。

2.3.1 多项式拟合前面讨论了子空间Φ中的最小二乘拟合。

这是一种线性的拟合模型。

在离散数据最小二乘拟合中，最简单、最常用的数学模型是多项式。

为了确定数据拟合问题，我们选用2{1,,,}n x x x 作为函数类，有2012()n n x a a x a x a x ϕ=++++ (1)n m +< (2-16) 这就是多项式拟合函数。

为了确定拟合函数2012()n n x a a x a x a x ϕ=++++的系数，需要求解正规方程组011112101111112011111m m mnk k n kk k k m m m mn k k k n k kk k k k m m m mn n n n k k k n k kk k k k ma x a x a y x a x a x a x y x a x a x a x y ===+====+====⎧+++=⎪⎪⎪+++=⎪⎨⎪⎪⎪+++=⎪⎩∑∑∑∑∑∑∑∑∑∑∑ (2-17) 也可以用矩阵形式表示为11102111111121111mmm nkkk k k k mmm mn k kk k k k k k k n mmmm n n n n k kk k k k k k k m xx y a x xx x y a a x xx x y ===+====+====⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪= ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭∑∑∑∑∑∑∑∑∑∑∑ (2-18)解得01,,,n a a a 即可，将其代入(2-16)即可得到拟合多项式。