数据的n次拟合多项式讲解_第1页
数据的n次拟合多项式讲解_第2页
数据的n次拟合多项式讲解_第3页
数据的n次拟合多项式讲解_第4页
数据的n次拟合多项式讲解_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据的 n 次拟合多项式 第一章第一章 绪论绪论 1.1 课题国内外研究动态,课题研究背景及意义 1.2 国内外的研究现状 1.3 发展趋势 第二章第二章 数据拟合的基本理论数据拟合的基本理论 2.1 最小二乘曲线拟合 2.2 线性拟合函数 2.3 二次拟合函数 2.4 多项式拟合函数 2.5 小结 第三章第三章 数据拟合的应用实例数据拟合的应用实例 3.1 数据拟合在物理实验中的应用 3.2 数据拟合在经济监控中的应用 3.3 模型评价 参考文献参考文献 附录附录 第一章 绪论 1.1 课题国内外研究动态,课题研究背景及意义 数学分有很多学科,而它主要的学科大致产生于商业计算的需要、了解数

2、字间的关系、测量土地及预测天文事件。而在科技飞速发展的今天数学也早已 成为众多研究的基础学科。尤其是在这个信息量巨大的时代,实际问题中得到 的离散数据的处理也成为数学研究和应用领域中的重要的课题。 在解决实际工程问题和科学实验的过程中,经常需要通过研究某些变量之 间的函数关系,帮我们去认识事物内在的规律和本质属性,这些变量间的未知 的关系一般隐含在从观测、试验而得到的一组离散的数据之中。所以,是否能 够根据一组试验观测数据来找到变量之间的相对准确的函数关系成为了解决工 程实际问题的关键。 在实际问题中,通过观测数据能否正确揭示某些变量之间的关系,进而正 确认识事物的内在规律与本质属性,往往取决

3、于两方面因素。其一是观测数据 的准确性或准确程度,这是因为在获取观测数据的过程中一般存在随机测量误 差,导致所讨论的变量成为随机变量。其二是对观测数据处理方法的选择,即 到底是采用插值方法还是用拟合方法1-3,插值方法之中、拟合方法之中又选用 哪一种插值或拟合技巧来处理观测数据。插值问题忽略了观测误差的影响,而 拟合问题则考虑了观测误差的影响。但由于观测数据客观上总是存在观测误差, 而拟合函数大多数情况下是通过经验公式获得的,因此要正确揭示事物的内在 规律,往往需要对大量的观测数据进行分析,尤为重要的是进行统计分析。统 计分析的方法有许多,如方差分析、回归分析等。数据拟合虽然较有效地克服 了随

4、机观测误差的影响,但从数理统计的角度看,根据一个样本计算出来的拟 合函数(系数),只是拟合问题的一个点估计,还不能完全说明其整体性质。因 此,还应该对拟合函数作区间估计或假设检验,如果置信区间太大或包含零点, 则由计算得到的拟合函数系数的估计值就毫无意义。 所以,据科学和工程问题可以通过比如采样、实验等方法而得到若干的离 散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲 线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说, 如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数“最 优的” 靠近那些数据点,按照误差最小的原则为最优标准来构造

5、出函数。我们 称这个函数为拟合函数。 现在,对数据点进行函数拟合以获得信息模型是许多工程应用领域的一个 核心问题。而为了适应这个多元化的世界中,为了能够满足各种各样的应用领 域的要求,针对他们而对各种拟合方法的改进和研究也从未停止过。 1.1.1 国内外的研究现状国内外的研究现状 在通过对国内外有关的学术刊物(如计算机科学 、 宇航学报 、 中原工 学院学报等)、国际国内有关学术会议和网站的论文进行分析。数据拟合的研 究和应用主要是面对各种工程问题,有着系统的研究和很大的发展。通过研究 发展使得数据拟合有着一定的理论研究基础。尤其是关于数据拟合基本的方法 最小二乘法4-9的研究有着各种研究成果

6、。 但是,由于现实问题的复杂性,数据拟合还拥有很好的研究空间,还有很 多能够优化和创新的问题需要去研究和探索。各种算法的改进和应用以及如何 得到合适的模型一直是一个比较热门的研究领域。 例如,国内外文献里提出了很多基于形状的描述方法,比如傅氏描述子法、 多边形法、累积角法等, 其中以二次曲线和超二次曲线来拟合物体的边界形状 并进行物体的描述已获得广泛应用。现在,我们应用高次隐式多项式曲线来作为 物体的几何模型受到广泛的重视。应用高次隐式多项式曲线和曲面10-15为各个 领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据 点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,

7、为业务信息建模 所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有 着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析 式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。 所以说,在现在这个各个工程领域飞速发展的今天,数据拟合在实际应用与研 究中仍然有着不小的发展空间 1.2 发展趋势 应用高次隐式多项式曲线和曲面为各个领域的数据进行可视化建模还没有 广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据 点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本 无法比拟,这主要是因为隐式多项式曲线有着精确的表达

8、能力,隐式多项式曲 线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具 有着天然的数据噪声过滤能力和修补能力。 隐式多项式曲线的信息建模近年有了很大的发展。对隐式多项式曲线进行 分析看出,MinMax 算法十分精确地拟合了数据点的形状,并且非常的稳定, 只需要对 3L 集合的权值参数调整问题做进一步的研究,MinMax 等隐式多项式 曲线的拟合算法抛弃了需要迭代的优化算法,只需要求解一个线性方程组就能 够确定隐式多项式曲线方程的系数,可以说已经趋于成熟。我们可以预见,把 这种建模思想应用到各种数据点集合之中必将带来很大的发展空间。 随着计算机的广泛应用,利用计算机相关软件解数

9、据拟合问题也已经成为 了不可缺少的步骤。 第二章第二章 数据拟合的基本理论数据拟合的基本理论 科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据, 根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲线)或者更 加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说,如果数 据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数最优的靠 近那些数据点,按照误差最小的原则为最优的标准来构造出函数。 在科学计算中经常要建立实验数据的数学模型。给定函数的实验数据,需 要用比较简单和合适的函数来逼近(或拟合)实验数据。这种逼近的特点是: (1) 是需要适度的精度的;

10、(2) 实验数据有一些小的误差; (3) 对于一些问题,可能有一些特殊的信息能够用来选择实验数据的数学 模型。 逼近离散数据的基本方法就是曲线拟合,常采用最小二乘拟合。 曲线拟合问题的数学描述是,已知一组(二维)数据,i = 1,2,n(即平),(y x i i 面上的 n 个点,i = 1,2,n),互不相同,寻找一个函数(曲线)y = f(x),),(y x i iix 使得 f(x)在某种准则下与所有的数据点最接近,即曲线拟合得最好。 2.12.1 最小二乘法的基本原理最小二乘法的基本原理 从整体上考虑近似函数 )(xp 同所给数据点 ),( ii yx (i=0,1,m)误差 iii

11、yxpr)( (i=0,1,m)的大小,常用的方法有以下三种:一是误差 iii yxpr)( (i=0,1,m)绝对值的最大值 i mi r 0 max ,即误差 向量 T m rrrr),( 10 的范数;二是误差绝对值的和 m i i r 0,即误差向量 r 的 1 范数;三是误差平方和 m i i r 0 2 的算术平方根,即误差向量 r 的 2范数;前两种 方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2范数的平方, 因此在曲线拟合中常采用误差平方和 m i i r 0 2 来 度量误差 i r (i=0,1,m)的整 体大小。 数据拟合数据拟合的具体作法是:对给定数据 )

12、,( ii yx (i=0,1,,m),在取定的函 数类中,求 )(xp ,使误差 iii yxpr)( (i=0,1,m)的平方和最小,即 m i i r 0 2 m i ii yxp 0 2 min)( 从几何意义上讲,就是寻求与给定点 ),( ii yx (i=0,1,m)的距离平方和为 最小的曲线 )(xpy (图 6-1)。函数 )(xp 称为拟合函数拟合函数或最小二乘解,最小二乘解,求求 拟合函数拟合函数 p(x)p(x)的方法称为曲线拟合的最小二乘法。的方法称为曲线拟合的最小二乘法。 在曲线拟合中,函数类可有不同的选取方法. 61 2.2 线性拟合函数原理线性拟合函数原理 给定一

13、组数据,做拟合直线,均方误差为 (6.2) 是二元函数,的极小值要满足 整理得到拟合曲线满足的方程: (6.3) 或 称式(6.3)为拟合曲线的法方程。用消元法或克莱姆法则解出方程: a= = 2.3 二次拟合函数二次拟合函数 给定数据序列,用二次多项式函数拟合这组数据。 设,作出拟合函数与数据序列的均方误差: (6.4) 由多元函数的极值原理,的极小值满足 整理得二次多项式函数拟合的法方程: (6.5) 解此方程得到在均方误差最小意义下的拟合函数。方程组(6.5)称为多项式拟 合的法方程,法方程的系数矩阵是对称的。当拟保多项式阶时,法方程的系数矩阵 是病态的,在计算中要用双精度或一些特殊算法

14、以保护解的准确性。 2.42.4 多次拟合函数多次拟合函数 假设给定数据点 ),( ii yx (i=0,1,m),为所有次数不超过 )(mnn 的多项式 构成的函数类,现求一 n k k kn xaxp 0 )( ,使得 min)( 00 2 0 2 m i m i n k i k ikiin yxayxpI (1) 当拟合函数为多项式时,称为多项式拟合,满足式(1)的 )(xpn 称为最小二乘 拟合多项式。特别地,当当 n=1n=1 时,称为线性拟合或直线拟合。时,称为线性拟合或直线拟合。 显然 m i n k i k ik yxaI 0 2 0 )( 为 n aaa, 10 的多元函数,

15、因此上述问题即为求 ),( 10n aaaII 的极值 问题。 由多元函数求极值的必要条件,得 njxyxa a I m i j i n k i k ik j , 1 , 0, 0)(2 00 (2) 即 njyxax n k m i i j ik m i kj i , 1 , 0,)( 000 (3) (3)是关于 n aaa, 10 的线性方程组,用矩阵表示为 m i i n i m i ii m i i n m i n i m i n i m i n i m i n i m i i m i i m i n i m i i yx yx y a a a xxx xxx xxm 0 0 0 1

16、 0 0 2 0 1 0 0 1 0 2 0 00 1 (4) 式(3)或式(4)称为正规方程组或法方程组。 可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。 从式(4)中解出 k a (k=0,1,,n),从而可得多项式 n k k kn xaxp 0 )( (5) 可以证明,式(5)中的 )(xpn 满足式(1),即 )(xpn 为所求的拟合多项式。我 们把 m i iin yxp 0 2 )( 称为最小二乘拟合多项式 )(xpn 的平方误差,记作 m i iin yxpr 0 2 2 2 )( 由式(2)可得 m i n k m i i k iki yxayr 000

17、2 2 2 )( (6) 多项式拟合的一般方法可归纳为以下几步:多项式拟合的一般方法可归纳为以下几步: (1)(1) 由已知数据画出函数粗略的图形由已知数据画出函数粗略的图形散点图,确定拟合多项式的次数散点图,确定拟合多项式的次数 n n; (2)(2) 列表计算列表计算 m i j i njx 0 )2 , 1 , 0( 和和 m i i j i njyx 0 )2 , 1 , 0( ; (3)(3) 写出正规方程组,求出写出正规方程组,求出 n aaa, 10; (4)(4) 写出拟合多项式写出拟合多项式 n k k kn xaxp 0 )( 。 2.5 本章小结本章小结 本章阐述了数据拟

18、合的基本理论及其方法。用最小二乘法论理引出了线性以及二次曲 线拟合的方法,并推广至多元拟合。分别详细介绍了各种方法的理论及其公式。并分别对 曲线拟合以及多元拟合的求解的基本步骤做出了归纳。通过本章可以掌握数据拟合的基本 方法以及理论基础。 第三章第三章 MATLAB 解应用问题实例解应用问题实例 3.13.1 数据拟合在物理实验中的应用数据拟合在物理实验中的应用 现在有一为了测量线性电阻元件伏安特性的物理实验。实验数据见表3-1。 表3-1 测量线性电阻元件伏安特性的实验数据 i / A i I/ V i Ui/ A i I/ V i U 10060.0495 20.00917O.0616 3

19、0.020280.0737 40.030390.0828 50.0394100.0929 由于试验的目的是研究关于线性电阻的伏安特性,所以设拟合多项式为 (3-1) 01 / V/ AUaa I 将数据表代入数据拟合的基本公式里,得此实验的正则方程组 01 01 100.45545 0.4550.02952.9010 aa aa = 它的解为a0= 0.1062 ,a1= 96.5662 因此这一组数据的最小二乘法拟合为 U/V=0.1062+96.5662I/A n=1时,其各拟合图像为: 利用最最小二乘法来分析物理实验里所测得的实验数据,我们可以根据测 得的数据拟合出近似函数,并得到比较精

20、确的解。总之,在实际的实验中,我 们应当采用尽可能多的方法去分析数据,使得实验更有意义。 3.23.2 数据拟合在经济监测中的应用数据拟合在经济监测中的应用 根据 1995 年到 2003 年中国 GDP 增长率变化情况,建立回归方程,具体数据如下: 表 3.3.1 1995 年到 2003 年中国 GDP 增长率变化 年份 1 2 3 4 5 6 7 8 9 GDP 10.5 9.6 8.8 7.8 7.1 8 7.3 8 9.1 数据来源:中国商业部 GDP 报表(GDP 为百分比) 为了研究的方便,年份从 1995 年到 2003 年分别用 1 到 9 这 9 个数字代替.由表 3.1

21、可 以看出 GDP 的增长率先减后增,如果采用线性回归,由于拟合误差太大,严重影响了预测的效 果.观察其变化规律采用抛物线回归的方法是比较合适的,令拟合多项式为 k n k kx axE 0 )( (3.1) 我们采用的是抛物线的形式,故 n=2,即 2 210 )(xaxaaxe (3.2) 根据“最小二乘法原理”对于对数据(其中)应使n( ,)1,2, ; ii x y inN=9 3 =最小值 2 1 ( ) N ii i FyF x 当时,则(3.2)中的系数满足方程组:n=2 )( )( 24 2 3 1 2 0 3 2 2 10 2 210 yxxaxaxa xyxaxaxa yx

22、axaa (3.3) 式子中的是未知数,系数,常数项. 210 ,aaa N i k i k x N x 1 1 1 1 () N kk ii i x yx y N k=0,1,2,3,4 按照上面的过程,对表中的数据进行拟合,我们首先对方程组的系数和常数项作如下的 处理:为了让数据精确表达我们想要的结果,对不能除尽的系数,小数点后保留 6 位;对常数 项则保留小数点后 4 位.这样得到的增广矩阵如下: (3.4) 003+2.3252e 15333 2025 285 367.8000 2025 285 45 76.2000 285 45 9 经过计算,最后得到的回归方程如下: 2 0.143

23、5x1.6547x-12.197y (3.5) 当 n=2 时,拟合图像为: 表 3.3.2 数据拟合下的误差表 年份 实际值 拟合值 误差 1 10.5 10.6858 0.1858 2 9.6 9.462 -0.1384 3 8.8 8.5244 -0.2756 4 7.8 7.874 0.0742 5 7.1 7.511 0.411 6 8 7.435 -0.5652 7 7.3 7.6456 0.3456 8 8 8.1434 0.1434 9 9.1 8.9282 -0.1718 初步计算其中的最大误差为-0.57, 误差范围相对较小,拟合曲线与元数据 基本重合,因此该拟合曲线可以较

24、为准确的预测GDP的发展趋势。 3.33.3 模型评价模型评价 该方法具有如下优点: (1)计算结果惟一,计算量小,便于在PLC、单片机等硬件设备上实现; (2)可精确、方便地实现多年份的GDP增长变化进行实时监测; (3)当所需要的检测数据改变时,只需调整对应多项式的系数,不必改动其 它程序设定,能真正的做到拟合用途多元化; (4)保留了原有数据的发展趋势,又增加了数据的拟合发展趋势,让经济学家能够更直 观的发现经济中的发展态势,对国家的经济政策作出调整提供了有力的依据。 参考文献参考文献 1李庆扬. 数值分析. 武汉:华中科技大学出版社,2006,6469 2程毛林. 数据拟合函数的最小二乘积分法. 大学数学,2006,22(1):7074 3张韵华,奚梅成,陈效群 数值计算方法与算法(第二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论