数据的n次拟合多项式_第1页
数据的n次拟合多项式_第2页
数据的n次拟合多项式_第3页
数据的n次拟合多项式_第4页
数据的n次拟合多项式_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据的 n 次拟合多项式第一章第一章 绪论绪论1.1 课题国内外研究动态,课题研究背景及意义1.2 国内外的研究现状1.3 发展趋势第二章第二章 数据拟合的基本理论数据拟合的基本理论2.1 最小二乘曲线拟合2.2 线性拟合函数2.3 二次拟合函数2.4 多项式拟合函数2.5 小结第三章第三章 数据拟合的应用实例数据拟合的应用实例3.1 数据拟合在物理实验中的应用3.2 数据拟合在经济监控中的应用3.3 模型评价参考文献参考文献附录附录第一章 绪论1.1 课题国内外研究动态,课题研究背景及意义数学分有很多学科,而它主要的学科大致产生于商业计算的需要、了解数字间的关系、测量土地及预测天文事件。而在

2、科技飞速发展的今天数学也早已成为众多研究的基础学科。尤其是在这个信息量巨大的时代,实际问题中得到的离散数据的处理也成为数学研究和应用领域中的重要的课题。在解决实际工程问题和科学实验的过程中,经常需要通过研究某些变量之间的函数关系,帮我们去认识事物内在的规律和本质属性,这些变量间的未知的关系一般隐含在从观测、试验而得到的一组离散的数据之中。所以,是否能够根据一组试验观测数据来找到变量之间的相对准确的函数关系成为了解决工程实际问题的关键。在实际问题中,通过观测数据能否正确揭示某些变量之间的关系,进而正确认识事物的内在规律与本质属性,往往取决于两方面因素。其一是观测数据的准确性或准确程度,这是因为在

3、获取观测数据的过程中一般存在随机测量误差,导致所讨论的变量成为随机变量。其二是对观测数据处理方法的选择,即到底是采用插值方法还是用拟合方法1-3,插值方法之中、拟合方法之中又选用哪一种插值或拟合技巧来处理观测数据。插值问题忽略了观测误差的影响,而拟合问题则考虑了观测误差的影响。但由于观测数据客观上总是存在观测误差,而拟合函数大多数情况下是通过经验公式获得的,因此要正确揭示事物的内在规律,往往需要对大量的观测数据进行分析,尤为重要的是进行统计分析。统计分析的方法有许多,如方差分析、回归分析等。数据拟合虽然较有效地克服了随机观测误差的影响,但从数理统计的角度看,根据一个样本计算出来的拟合函数(系数

4、),只是拟合问题的一个点估计,还不能完全说明其整体性质。因此,还应该对拟合函数作区间估计或假设检验,如果置信区间太大或包含零点,则由计算得到的拟合函数系数的估计值就毫无意义。所以,据科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说,如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数“最优的” 靠近那些数据点,按照误差最小的原则为最优标准来构造出函数。我们称这个函数为拟合函数。现在,对数据点进行函数拟合以获得信息模型是许多工程应用领域

5、的一个核心问题。而为了适应这个多元化的世界中,为了能够满足各种各样的应用领域的要求,针对他们而对各种拟合方法的改进和研究也从未停止过。1.1.1 国内外的研究现状国内外的研究现状在通过对国内外有关的学术刊物(如计算机科学 、 宇航学报 、 中原工学院学报等)、国际国内有关学术会议和网站的论文进行分析。数据拟合的研究和应用主要是面对各种工程问题,有着系统的研究和很大的发展。通过研究发展使得数据拟合有着一定的理论研究基础。尤其是关于数据拟合基本的方法最小二乘法4-9的研究有着各种研究成果。但是,由于现实问题的复杂性,数据拟合还拥有很好的研究空间,还有很多能够优化和创新的问题需要去研究和探索。各种算

6、法的改进和应用以及如何得到合适的模型一直是一个比较热门的研究领域。例如,国内外文献里提出了很多基于形状的描述方法,比如傅氏描述子法、多边形法、累积角法等, 其中以二次曲线和超二次曲线来拟合物体的边界形状并进行物体的描述已获得广泛应用。现在,我们应用高次隐式多项式曲线来作为物体的几何模型受到广泛的重视。应用高次隐式多项式曲线和曲面10-15为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于

7、它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。所以说,在现在这个各个工程领域飞速发展的今天,数据拟合在实际应用与研究中仍然有着不小的发展空间1.2 发展趋势应用高次隐式多项式曲线和曲面为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。隐式多项式曲线的信息建模近

8、年有了很大的发展。对隐式多项式曲线进行分析看出,MinMax 算法十分精确地拟合了数据点的形状,并且非常的稳定,只需要对 3L 集合的权值参数调整问题做进一步的研究,MinMax 等隐式多项式曲线的拟合算法抛弃了需要迭代的优化算法,只需要求解一个线性方程组就能够确定隐式多项式曲线方程的系数,可以说已经趋于成熟。我们可以预见,把这种建模思想应用到各种数据点集合之中必将带来很大的发展空间。随着计算机的广泛应用,利用计算机相关软件解数据拟合问题也已经成为了不可缺少的步骤。第二章第二章 数据拟合的基本理论数据拟合的基本理论科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据,根据这些离散的

9、数据,我们往往希望能得到一个连续函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说,如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数最优的靠近那些数据点,按照误差最小的原则为最优的标准来构造出函数。在科学计算中经常要建立实验数据的数学模型。给定函数的实验数据,需要用比较简单和合适的函数来逼近(或拟合)实验数据。这种逼近的特点是:(1) 是需要适度的精度的;(2) 实验数据有一些小的误差;(3) 对于一些问题,可能有一些特殊的信息能够用来选择实验数据的数学模型。逼近离散数据的基本方法就是曲线拟合,常采用最小二乘拟合。曲线拟合问题的数学描述是,已

10、知一组(二维)数据,i = 1,2,n(即平),(yxii面上的 n 个点,i = 1,2,n),互不相同,寻找一个函数(曲线)y = f(x),),(yxiiix使得 f(x)在某种准则下与所有的数据点最接近,即曲线拟合得最好。2.12.1 最小二乘法的基本原理最小二乘法的基本原理从整体上考虑近似函数)(xp同所给数据点),(iiyx(i=0,1,m)误差iiiyxpr)(i=0,1,m)的大小,常用的方法有以下三种:一是误差iiiyxpr)(i=0,1,m)绝对值的最大值imir0max,即误差 向量Tmrrrr),(10的范数;二是误差绝对值的和miir0,即误差向量 r 的 1范数;三

11、是误差平方和miir02的算术平方根,即误差向量 r 的 2范数;前两种方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2范数的平方,因此在曲线拟合中常采用误差平方和miir02来 度量误差ir(i=0,1,m)的整体大小。数据拟合数据拟合的具体作法是:对给定数据 ),(iiyx (i=0,1,,m),在取定的函数类中,求)(xp,使误差iiiyxpr)(i=0,1,m)的平方和最小,即 miir02 miiiyxp02min)(从几何意义上讲,就是寻求与给定点),(iiyx(i=0,1,m)的距离平方和为最小的曲线)(xpy (图 6-1)。函数)(xp称为拟合函数拟合函数或最小二

12、乘解,最小二乘解,求求拟合函数拟合函数 p(x)p(x)的方法称为曲线拟合的最小二乘法。的方法称为曲线拟合的最小二乘法。在曲线拟合中,函数类可有不同的选取方法.612.2 线性拟合函数原理线性拟合函数原理给定一组数据,做拟合直线,均方误差为 (6.2)是二元函数,的极小值要满足整理得到拟合曲线满足的方程: (6.3)或 称式(6.3)为拟合曲线的法方程。用消元法或克莱姆法则解出方程:a=2.3 二次拟合函数二次拟合函数给定数据序列,用二次多项式函数拟合这组数据。设,作出拟合函数与数据序列的均方误差: (6.4)由多元函数的极值原理,的极小值满足整理得二次多项式函数拟合的法方程: (6.5)解此

13、方程得到在均方误差最小意义下的拟合函数。方程组(6.5)称为多项式拟合的法方程,法方程的系数矩阵是对称的。当拟保多项式阶时,法方程的系数矩阵是病态的,在计算中要用双精度或一些特殊算法以保护解的准确性。2.42.4 多次拟合函数多次拟合函数假设给定数据点),(iiyx(i=0,1,m),为所有次数不超过)(mnn的多项式构成的函数类,现求一nkkknxaxp0)(,使得min)(00202 miminkikikiinyxayxpI (1)当拟合函数为多项式时,称为多项式拟合,满足式(1)的)(xpn称为最小二乘拟合多项式。特别地,当当 n=1n=1 时,称为线性拟合或直线拟合。时,称为线性拟合或

14、直线拟合。显然 minkikikyxaI020)(为naaa,10的多元函数,因此上述问题即为求),(10naaaII的极值 问题。由多元函数求极值的必要条件,得njxyxaaImijinkikikj, 1 , 0, 0)(200 (2)即njyxaxnkmiijikmikji, 1 , 0,)(000 (3)(3)是关于naaa,10的线性方程组,用矩阵表示为miinimiiimiinminiminiminiminimiimiiminimiiyxyxyaaaxxxxxxxxm000100201001020001 (4)式(3)或式(4)称为正规方程组或法方程组。可以证明,方程组(4)的系数矩

15、阵是一个对称正定矩阵,故存在唯一解。从式(4)中解出ka(k=0,1,,n),从而可得多项式nkkknxaxp0)( (5)可以证明,式(5)中的)(xpn满足式(1),即)(xpn为所求的拟合多项式。我们把miiinyxp02)(称为最小二乘拟合多项式)(xpn的平方误差,记作miiinyxpr0222)(由式(2)可得minkmiikikiyxayr000222)( (6)多项式拟合的一般方法可归纳为以下几步:多项式拟合的一般方法可归纳为以下几步: (1)(1) 由已知数据画出函数粗略的图形由已知数据画出函数粗略的图形散点图,确定拟合多项式的次数散点图,确定拟合多项式的次数n n;(2)(

16、2) 列表计算列表计算 mijinjx0)2 , 1 , 0(和和miijinjyx0)2 , 1 , 0(;(3)(3) 写出正规方程组,求出写出正规方程组,求出 naaa,10;(4)(4) 写出拟合多项式写出拟合多项式 nkkknxaxp0)(。2.5 本章小结本章小结本章阐述了数据拟合的基本理论及其方法。用最小二乘法论理引出了线性以及二次曲线拟合的方法,并推广至多元拟合。分别详细介绍了各种方法的理论及其公式。并分别对曲线拟合以及多元拟合的求解的基本步骤做出了归纳。通过本章可以掌握数据拟合的基本方法以及理论基础。第三章第三章 MATLAB 解应用问题实例解应用问题实例3.13.1 数据拟

17、合在物理实验中的应用数据拟合在物理实验中的应用现在有一为了测量线性电阻元件伏安特性的物理实验。实验数据见表3-1。表3-1 测量线性电阻元件伏安特性的实验数据i/ AiI/ ViUi/ AiI/ ViU10060.049520.00917O.061630.020280.073740.030390.082850.0394100.0929由于试验的目的是研究关于线性电阻的伏安特性,所以设拟合多项式为 (3-1)01/ V/ AUaa I将数据表代入数据拟合的基本公式里,得此实验的正则方程组0101100.45545 0.4550.02952.9010aaaa=它的解为a0= 0.1062 ,a1=

18、 96.5662 因此这一组数据的最小二乘法拟合为U/V=0.1062+96.5662I/An=1时,其各拟合图像为:利用最最小二乘法来分析物理实验里所测得的实验数据,我们可以根据测得的数据拟合出近似函数,并得到比较精确的解。总之,在实际的实验中,我们应当采用尽可能多的方法去分析数据,使得实验更有意义。3.23.2 数据拟合在经济监测中的应用数据拟合在经济监测中的应用根据 1995 年到 2003 年中国 GDP 增长率变化情况,建立回归方程,具体数据如下:表 3.3.1 1995 年到 2003 年中国 GDP 增长率变化年份 1 2 3 4 5 6 7 8 9 GDP 10.5 9.6 8

19、.8 7.8 7.1 8 7.3 8 9.1数据来源:中国商业部 GDP 报表(GDP 为百分比)为了研究的方便,年份从 1995 年到 2003 年分别用 1 到 9 这 9 个数字代替.由表 3.1 可以看出 GDP 的增长率先减后增,如果采用线性回归,由于拟合误差太大,严重影响了预测的效果.观察其变化规律采用抛物线回归的方法是比较合适的,令拟合多项式为 knkkxaxE0)((3.1)我们采用的是抛物线的形式,故 n=2,即 2210)(xaxaaxe(3.2)根据“最小二乘法原理”对于对数据(其中)应使n( ,)1,2, ;iix y inN=93=最小值21( )NiiiFyF x当

20、时,则(3.2)中的系数满足方程组:n=2 )()(2423120322102210yxxaxaxaxyxaxaxayxaxaa(3.3)式子中的是未知数,系数,常数项.210,aaaNikikxNx1111()Nkkiiix yx yN k=0,1,2,3,4 按照上面的过程,对表中的数据进行拟合,我们首先对方程组的系数和常数项作如下的处理:为了让数据精确表达我们想要的结果,对不能除尽的系数,小数点后保留 6 位;对常数项则保留小数点后 4 位.这样得到的增广矩阵如下: (3.4)003+2.3252e 15333 2025 285367.8000 2025 285 4576.2000 28

21、5 45 9经过计算,最后得到的回归方程如下: 20.1435x1.6547x-12.197y(3.5)当 n=2 时,拟合图像为:表 3.3.2 数据拟合下的误差表年份 实际值 拟合值 误差 1 10.5 10.6858 0.1858 2 9.6 9.462 -0.13843 8.8 8.5244 -0.27564 7.8 7.874 0.07425 7.1 7.511 0.4116 8 7.435 -0.56527 7.3 7.6456 0.34568 8 8.1434 0.14349 9.1 8.9282 -0.1718初步计算其中的最大误差为-0.57, 误差范围相对较小,拟合曲线与元

22、数据基本重合,因此该拟合曲线可以较为准确的预测GDP的发展趋势。3.33.3 模型评价模型评价该方法具有如下优点:(1)计算结果惟一,计算量小,便于在PLC、单片机等硬件设备上实现;(2)可精确、方便地实现多年份的GDP增长变化进行实时监测;(3)当所需要的检测数据改变时,只需调整对应多项式的系数,不必改动其它程序设定,能真正的做到拟合用途多元化;(4)保留了原有数据的发展趋势,又增加了数据的拟合发展趋势,让经济学家能够更直观的发现经济中的发展态势,对国家的经济政策作出调整提供了有力的依据。参考文献参考文献1李庆扬. 数值分析. 武汉:华中科技大学出版社,2006,64692程毛林. 数据拟合函数的最小二乘积分法. 大学数学,2006,22(1):70743张韵华,奚梅成,陈效群 数值计算方法与算法(第二版) 科学出版社 2006,70804曾长雄.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论