最小二乘法的原理及在建模中的应用分析_第1页
最小二乘法的原理及在建模中的应用分析_第2页
最小二乘法的原理及在建模中的应用分析_第3页
最小二乘法的原理及在建模中的应用分析_第4页
最小二乘法的原理及在建模中的应用分析_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、最小二乘法的原理及在建模中 的应用分析学校代码:本科毕业论文(题目:最小二乘法的原理及在建模中的应用分析学生姓名:学院:系别:专业:班级:指导教师:副教授二0 一年六月内蒙古工业大学本科毕业论文摘要最小二乘法是一种最基本、最重要的计算技巧与方法 . 它在建模中有着广泛的应 用, 用这一理论解决讨论问题具有简明、清晰的特点 , 特别在大量数据分析的研究中 具有十分重要的作用和地位 . 随着最小二乘法理论不断的完善 , 其基本理论与应用已 经成为一个不容忽视的研究课题 .本文共分三部分 .绪论主要介绍最小二乘法的起源、基本概念以及本文的主要工 作 ; 第一章阐述了最佳平方逼近和曲线拟合的算法 ,并

2、做出二者的流程图 ,接着对曲线 拟合的线性和非线性模型给出求解方法 ,最后总结出常用的模型函数以及线性化方法 第二章首先通过解决实际算例 , 阐述如何克服病态方程 , 然后通过预测研究生招生人 数, 阐明它在建模中的作用 , 并作简单的分析 ,最后做出了总结 .关键词 :最小二乘法 ;最佳平方逼近 ;曲线拟合 ; 病态方程 ; MatlabAbstractLeast-square method is one of the most fundamental and most important calculation methods and skills in modeling. It is w

3、idely used in solving this theory, discuss the problem with concise, clear characteristics, especially in the research of data analysis plays a very important role and status. With the least square theory constantly, perfect the basic theory and application has become a serious research topic.The pa

4、per has three parts are mainly introduced. Introduction to the origin of least squares, basic concepts and the main job, The first chapter describes best square approximation and the curve fitting, the algorithm and the flowchart, then both of the curve fitting is linear and nonlinear model of solvi

5、ng method, and finally summarizes common model function and linearization method, The second chapter first through solving practical examples, this paper discusses how to overcome the pathological equation, and then through the prediction of graduate student recruit students number, expounds its rol

6、e in modeling and simple analysis, finally made a summary.Keywords: Least-square method; The best square approximation;The curve fitting; Psychopathic equation; Matlab目录绪论 1第一章最小二乘法概述 31.1预备知识 31.2最佳平方逼近问题 41.3曲线拟合问题 61.4曲线拟合的模型分类 81.4.1 线性模型 81.4.2 非线性模型 111.5总结 13第二章 最小二乘法在建模中的应用 162.1应用举例 162.2病态

7、方程 182.3建模分析 202.4总结 25参考文献 26附录A最佳平方逼近流程图 27附录B曲线拟合流程图 29附录C部分Matlab程序 31谢辞 36内蒙古工业大学本科毕业论文绪论在科学研究中 ,为了揭示某些相关量之间的关系 ,找出其规律 ,往往需要做数据拟 合, 其常用方法一般有传统的插值法、最佳一致逼近多项式、最佳平方逼近、最小二 乘拟合、三角函数逼近、帕德(Pade)逼近等,以及现代的神经网络逼近、模糊逼近、 支持向量机函数逼近、小波理论等 .其中 , 最小二乘法是一种最基本、最重要的计算技巧与方法 . 它在建模中有着广 泛的应用,用这一理论解决讨论问题简明、清晰 ,特别在大量数

8、据分析的研究中具有 十分重要的作用和地位 .随着最小二乘理论不断的完善 ,其基本理论与应用已经成为 一个不容忽视的研究课题 .1. 最小二乘法的起源与基本概念1805年勒让德 (Legendre) 发表的论著 计算彗星轨道的新方法 附录中, 最早提 到最小二乘法 ,Legendre 之所以能做出这个发现 , 是因为他没有因袭前人的方法要 设法构造出 k 个方程去求解 , 他认识到关键不在于使某一方程严格符合 , 而在于要使 误差以一种平衡的方式分配到各个方程,具体地说,他寻求这样的 值,使得 n2(Xi0 Xi1 1Xik k)达到最小.i11809年, 高斯 (Gauss) 发表论著天体运动

9、理论 , 对其误差进行了研究 , 再该书 末尾, 他写了一节有关“数据结合”的问题 , 以及其简单的手法导出误差分布 - 正态分 布,并用最小二乘法加以验证.关于最小二乘法,Gauss宣称自1795年以来他一直使用这个原理.这立刻引起了 Legendre的强烈反击,他提醒说科学发现的优先权只能以出版物确定 ,并严斥Gauss 剽窃了他人的发明 .他们间的争执延续了多年 .因而,这俩位数学家之间关于优先权 的争论仅次于牛顿 (Newton) 和莱布尼兹 (Leibniz) 之间关于微积分发明的争论 . 现在 一般认为,二人各自独立的发明了最小二乘法.尽管早在10年前,Gauss就使用这个原 理,

10、但第一个用文字形式发表的是Lege ndre.最小二乘法在 19世纪初发明后 ,很快得到欧洲一些国家的天文学家和测地学家 的广泛关注.同时,误差的分布是“正态”的 ,也立刻得到天文学家的关注 .正态分布 作为一种统计模型 ,在 19世纪极为流行,一些学者甚至把 19世纪的数理统计学称为 正态分布的统治时代 .综上可知 ,Legendre 和 Gauss 发现最小二乘法是从不同的角度人手的 : 一个是为 解线性方程组 ,一个是寻找误差函数 ;一个用的是整体思维 , 考虑方程组的均衡性 ,一 个用的是逆向思维 ,首先接受经验事实 ,一个是纯代数方法 , 一个致力于应用 .相比而 言, 高斯不愧为数

11、学王子 ,他把最小二乘法推进得更远、更深刻 , 这极大地推进了数理 统计学的发展 .发展至今 ,其已在各个方面有了应用 .其基本原理如下 .基本原理: 在自然科学和工程实践中 ,经常会遇到寻求经验公式问题 .由实验或观 测得到一组数据(x,yj(i 1,2,L m),而各xi是不同的,且设y f(xj,通过这些数据, 我们求一曲 线 y Sn(x) , 在函数 空间 span i,i 1, ,n 中寻找一个 逼近 函数 y f(x)由于观测有误差,因此i Sn(Xi) f(Xi)并不为零但要求mmi2Sn(xi) f(xi)2 mini 1i 1这就是曲线拟合的最小二乘问题.2.选题背景与本文

12、的主要工作在科学研究中 ,为了揭示某些相关量之间的关系 ,找出其规律 ,往往需要求解其函数解析式.一种方法是采用插值逼近法,即所构造的近似函数 (X)在已知节点Xi上必 须满足(Xi) yi要求逼近函数(Xi)与被逼近函数f(x)在各已知点Xi处的误差为零, 即要求(x)的曲线必须通过所有的点,常用的插值法有拉格朗日(Lagrange)插值,牛 顿(Newton)插值,埃尔米特(Hermite)插值等.另一方面 ,由于观测数据较多 ,一般不用插值法 ,而是用拟合的方法 .即只要找到 一条曲线 ,即能反映给定数据的一般趋势 ,又不出现局部较大的波动即可 ,只要 (X) 与 f (X) 的偏差满足

13、某种要求就行了 . 这种数据间的非确定关系需要统计方法来描述 , 最常用的方法就是数据拟合 . 数据拟合就是找一种函数的解析表达式或近似表达式 来描述这组数据间的函数关系 ,通常用到最小二乘法 .数据拟合的最小二乘法通过最 小化误差的平方和 ,寻找数据的最佳函数 .利用最小二乘法可以简便地求得未知的数 据,并使得这些求得的数据与实际数据之间误差的平方和为最小.本文就是在这样的背景下 , 第一章主要介绍了最小二乘法的原理 ,对最佳平方逼 近和曲线拟合给出求解方法 ,总结了非线性模型下最小二乘法的求法 . 第二章主要讲 述其在实际中的应用 ,以及如何克服法方程病态的方法 .最后通过实例阐述其在建模

14、中的作用.第一章最小二乘法概述最小二乘法通过最小化误差的平方和来寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平 方和为最小.在下面的章节中我们主要分析最小二乘法的原理,分别对最佳平方逼近和曲线拟合做了简单概述,重点对曲线拟合的非线性模型给出总结.1.1预备知识定义1.1设在区间(a,b)上非负函数(x),满足条件:b1) x n (x)dx 存在(n 0,1,L);a2) 对非负的连续函数g(x),若g(x)(x)dx则在(a,b)上g(x) 0就称(x)为区间(a,b)上的权函数.定义1.2设f(x),g(x) a,b,(x)是a,

15、b上的权函数,积分b(f,g)= (x)g(x)f (x)dxa称为函数f (x)与g(x)在a,b上的内积.定义1.3内积若满足下列四条公理:1) (f,g) (g, f)2) (cf ,g) c( f ,g), c 为常数3) (f1 f2,g) (f1,g) (f 2,g)4) (f, f) 0,当且仅当 f 0 时(f, f) 0则连续函数空间Ca,b上就形成一个内积空间.若f (fl丄fn)T , g (gl,L gn)T则其n内积定义为(f ,g)fkgkk 1定义1.4设A Rnn为非奇异矩阵,称(Co nd (A)? 1) Co nd(A)v | A |J| A Jv为矩阵的条

16、件数 ,其中?v为Rnn 中的某种矩阵范数.则对方程组Ax b(1)如果条件数Con d(A)v很大(Co nd(A)? 1),则称为病态方程组(或A为病态). 当Cond(A)v相对较小时,称为良态方程组(或A是良态的).定义1.5设在a,b给定函数系 0, 1,L , n,若满足条件m(i, j)(x) j(x) k(Xi)i 10,i kA 0,i k则称函数系 k是a,b上带权为(x)的正交函数系.n定义1.6对于给定的函数f(x) Ca,b,若n次多项式s (x)ajXj满足关系j 0b2b2f (x) s (x) dx min f (x) s(x) dx (1-1) as(x) p

17、n a其中pn为所有不超过n次的多项式,则称s (x)为f (x)在区间a,b上的n次最佳平方 逼近多项式.定义1.7对于给定函数f(x) Ca,b,如果存在s (x) span i,i 1, , n使s(x)2dx(1-2)bb(x) f (x) s (x)2dxmin (x)f (x)aS(x) a则称s (x)是f(x)在空间 中的最佳平方逼近函数1.2最佳平方逼近问题最佳平方逼近问题就是对于给定的一个函数,用另一个函数去逼近它.如图1.1所示原函数逼近函数图1.1最佳平方逼近图由公式(1-1)和公式(1-2)要求在给定的函数类中span i,i1, m24中找到一个函数*S (x) a

18、0 0 a1 1 L ana1nak k(x)0(n m)使S* (x)满足(x)f(x) S (x)2dx minS(x)(x) f (x)S (x)2dx函数类 一般可取比较低次的多项式集合或其他较简单的函数类其中,(x)( 0)是a,b上给定的权函数,它表示不同的点地位的强弱,它的地位越重要,从而权(x)也 越大.其求解步骤概括如下:Step1做出函数f(x)图形并寻找规律Step2设定数学模型,给出函数空间 span i,i 1, , nStep3利用最佳平方逼近原理求出S*(x),满足(x)f(x)* 2S (x) dxminS*(x)表示为nS*(x)ak k(x)k 0(x)是权

19、函数,具体S* (x)的求出,相当于求解法方程(0,0)(°, 1)L(°, n)a°(f,°)(1,°)(1, 1)L(1, n)a1(f,1)MMLMMM(n,°)(n, 1)L(n, n)an(f,n)Step4求出误差(x)f (X)* 2S (x) dxStep5分析并找出模型的优缺点,求误差,若误差大,则应重新建立函数空间,最佳平方逼近流程图见附录 A.1.3曲线拟合问题要求在给定的函数类中span i, i 1, n找到一个函数nS (x) a0 0 a1 1 L an nak k(x) (n<m)k 0使S* (

20、x)满足m2ii 1mS (xi)f(xi)2S(xi)i 1f(xi)2这里S (x) a0 0 a1 1 Lan n这种求逼近S*(x)的方法就称为曲线拟合的最小二乘法.函数类一般可取比较低次的多项式集合或其它较简单的函数类m实用中 , 为了使问题提法更具有一般性 , 常对最小二乘法中i2 加权平方 , 即i1mi1(xi)S(xi)2f (xi)2其中,(x)( 0)是a,b上给定的权函数,它表示不同的点(Xi,y)地位的强弱,例如点 (xiyi)处的权(刃)可以用来表示数据(xiy)在实验中重复的次数,也可以用来表示数 yi的准确度,yi越准确,它的地位越重要,从而权(xi)也越大满足

21、关系式m m m2 * 2 2i2(xi)S*(xi) f (xi)2 Sm( xi)n(xi)S(xi) f (xi)2i 1i 1S(x)i 1称为上述最小二乘问题的最小二乘解 . 概括如下 :Step1 将数据点描在坐标纸上寻找规律Step2 设定数学模型 , 给出函数空间 span i,i 1, ,nStep3 利用最小二乘法求的 S*(x), 其中 , S*(x) 满足m*2(xi) yi S*(x)2i1m 2 min(xi)yi S(xi)i1S(x) 可表达为S(x)nai i(x)i1S*(x) 表为S*(x)nai* i(x)i1(x) 是权函数具体S* (x)的求出,相当

22、于求解法方程s11s12s1na1d1s21s22s2na2d2M=Msn1sn2snnandndim(xj)yj i(xj ),sijm(xk)i(xk)j(xk),1 ijnStep4求出误差 (1, 2丄n)的大小,即| |2m2ii 1Step5分析并找模型的优缺点,求误差,若误差大,则应重新设立模型,曲线拟合 最小二乘法流程图见附录 B.1.4曲线拟合的模型分类实际应用中,由于观测数据较多,最常用的方法就是曲线拟合曲线拟合即只要 找到一条曲线,即能反映给定数据的一般趋势,又不出现局部较大的波动即可,只要 拟合函数与原函数的偏差满足某种要求就行了 .对于误差,很大程度依赖于模型的选 取

23、,本节重点介绍了选取不同模型的方法1.4.1线性模型已知观测点如图,需要拟合线性函数,如图1.3所示.Y=aX+b0XI刃対冶图1.3线性拟合图设直线方程的表达式为y a bx要根据所测量的已知数据求出最佳的a和b.对满足线性关系的一组测量数据(xi, yi),假定自变量xi的误差可以忽略,则在同一 xi下,点yi和直线上的点a bxi的偏差di如 下所示d1 y1 a bx1d2 y2 a bx2Mdn yn a bXn显然大多时候测量点不可能都在直线上ndi21D对a和b分别求一阶偏导数为n2i 1yi再求二阶偏导数为显然,一般令 d12 d 22nyi1nadn2为最小值,即a bxi

24、2nbXii 12nXi yii 1勺a22Db22D孑2Db22n2nXin2Xi1满足最小值条件,令一阶偏导数为零:引入平均值1 nXi n i 11 nyin i 1则有2Xi1nanbxii 1nbi 1X20xy2Xii 1nXi yii 1y a bx 0xyaxbx 0解得aybxbxy""2 xxy2x(1-3)将a , b值带入线性方程y abx,即得到线性方程.为了加深对最小二乘拟合原理的理解,现举出如下例子,通过举例使大家对最小 二乘拟合有所掌握.例1.1已知一组实验数据如表1-1所示,求它的拟合曲线.表1-1数据表i12345Xi24589yi2.0

25、12.983.505.025.47首先把这些数据画出来如下图1.4所示.图1.4散点图发现这些点在一条直线附近,故可选则线性函数作拟合曲线.即令P(x) a bx 作数学模型.其次,由已知有m 5,求得m 5,5552Xi 28,x 190 , yii 1i 1i 1518.98 ,Xi yi 1122.83于是法方程为5a 28b 18.98 28a 190b 122.83 由公式 (1-3) 得, 并解此方程组得a 1.00578b 0.498253故所得的拟合函数为y 1.00578 0.498253 x1.4.2 非线性模型在许多实际问题中 , 变量之间的关系并不都是线性的 , 也就是

26、说变量之间存在非 线性关系 ,此时就需要建立非线性模型才能对实际问题给出合理的解释 . 对于非线性 模型一般有两种处理方法 :一种是进行一些变换 , 将非线性问题化成线性问题来求解 另一种是不能化成线性问题 , 而是直接使用非线性模型 .比如模型xy 0 1e这是一个非线性模型,但令% ex即可化为y对的线性模型y 0 1x%同样 , 对于多项式模型2y 01x2xLpxp只要令 x1 x,x2 x2,L,xp xp,就可以得到线性模型y 01x12x2 Lpxp在比如 , 非线性模型bx y ae e(1-4)两边取自然对数 , 得ln y lna bx(1-5)令%y ln y, 0 ln

27、 a, 1b就可以得到线性模型%y01x有些非线性模型是不能化成线性模型的 , 比如模型y aebx当b未知时,我们就不能通过对两边取对数化成线性模型,只能采取非线性最小二乘法求解.非线性模型一般可记为yi f(xi, ), i 1,2,L ,n式中,y是因变量;xi (xi,xi2,L ,xik)T是自变量;(o, i,L , p)t为未知参数向量;i : N(0, 2), i 1,2,L ,n,且互相独立.仍采用最小二乘法估计参数,即求使nQ( ) W f(xi,)2i 1达到最小的$,称为的非线性最小二乘估计.若函数f对参数连续可微时,可以利 用微分法,建立正规方程组,求解使Q()达到最

28、小的$.将Q()函数分别对参数j求 偏导,并令其为0,得P+1个方程| j ?jn2 (yii 1f(xi,$)Q| j ?jj0,0,1,L ,p非线性最小二乘估计$就是上时的解.例1.2设一发射源的发射强度公式为atI与t的数据如表1-2.表1-2发射源数据表ti0.20.30.40.50.60.70.8Ii3.162.381.751.341.000.740.56试用最小二乘法确定10与a0.由公式(1-4)和(1-5),先求数据表如表1-3所示.表1-3 ti与In h的数据表ti0.20.30.40.50.60.70.8In I i1.15060.86710.55960.29270.0

29、000-0.301-0.5798由最小二乘拟合原理,得7a0 3.51.98913.5a0 2.03a10.1858则其解为a01.73a 2.89所以10 e305.64即发射强度公式近似为指数拟合图为1.5所示.2.89tI5.64e图1.5发射源指数拟合图1.5总结综上所述,最小二乘法就是以最小二乘原理为依据,同时解出一组未知参量的最佳值,最后确定函数解析式的方法.同时,它所做出的曲线拟合能够清晰地表现出变 量间的函数关系,还能通过数据点与曲线的偏离程度大致估计观测误差.特别适用于 通过实验求解未知形式的函数关系式或者用简单的解析式近似复杂的表达式,是科学实验中对数据处理的一种重要方法.

30、其中最小二乘法最重要的一步就是由所给出 的数据,建立模型函数,根据经验,有以下图作参考,如图1.6到图1.13所示(k 0).k图1.6函数y k图形x-0.1-0.2-0.3-0.4-0.5-0.6-0.7-0.8-0.9-1k图1.7函数y -图形x12010080604020图1.8函数y x2 kx图形形图1.9函数yx2kx图图1.10函数y kx图形 图1.11函数y klnx图形0.90.80.70.60.50.40.30.20图1.12函数y kex图形图1.13函数y ke x图形由实际数据,建立出比较合适的模型,在求解模型的系数中可以借助计算机软件 如matlab,最终得到

31、比较理想的拟合函数.当然,有些时候也可以先把拟合的模型化为比较好处理的函数,例如,对函数y lnx,可以令X ln x,Y y,只要拟合X和Y的函数,再把x和y回代即可,以下给 出常用函数与丫 AX B之间的变换,如表1-4所示.表1-4线性化变化函数y f(x)线性化形式丫 aX b变量与常数变换ay bx1 y a bx1X -,Y y xd yx c1dy xy ccX xy,Y y1 . d a , b cc1 y.ax b1 . ax by1X x,Yyxy - ax b11.a byx11X ,Y xya b,b ay aln x by aln x bX In x,Y yaxy c

32、eIn y ax In cX x,Y In y b In cay cxIn y aln x In cX In x,Y In y b In c2y ax b1y 2 ax b1X x,Y y 2dxy cxeln dx ln c xX x,Y 2 x b In c,a dl丫彳ax1 ceIn 丄 1 ax In c yX x,Y In 丄 1 yb In c,l为给疋常数在实际中,由于数据的不确定性与不稳定性,因为给出的函数过于简单往往并不能真实反映实际问题,而过于复杂,又很难处理总之,对不同的实际问题,应灵活建立数学模型,结合计算机软件,准确的拟合出模型函数第二章 最小二乘法在建模中的应用随

33、着科学技术的发展,实验数据处理越来越方便但也提出了新的课题,就是在 选择数据处理方法时应该比以往更为慎重因为稍有不慎,就会根据正确的实验数据 得出不确切的乃至错误的结论因此本章将结合实例让大家更深一步体会最小二乘 法在建模中的应用2.1应用举例例2.1已知一组离散数据如表2-1,试用二次多项式进行曲线拟合,并求出误差.表2-1数据表i01234Xi00.250.500.751.00yf (Xi)1.00001.28401.64872.11702.7183首先将数据点描于坐标纸上,如图2.1所示.2.82.6 n2.4.2.22 L181614121IILILIi00.10.20.30.40.5

34、0.60.70.80.91图2.1散点图然后利用公式计算内积,写出法方程,其法方程为52.5玄8.76802.5 1.875 a5.4514解得内蒙古工业大学本科毕业论文ao 0.89968ai 1.70784故拟合所得的曲线为s*(x) Pi(x)0.89968 1.70784x经计算所得的误差为ei .f(X)Pi(x)20.916对于给定的离散数据也可以用二次多项式拟合,故当其是二次多项式时,经计算得法方程为52.51.875a。8.76802.51.8751.562ai5.45141.8751.5621.382a24.4015解得a0 1.00510ai 0.86468a20.8431

35、6故拟合曲线为2P2(x)1.0051 0.86468x 0.84316x .经计算得误差为f(Gi 1P2(X)20.0166126故从误差可以看出,P2(x)比Pi(x)好.拟合如图2.2所示.图2.2 一次函数与二次函数对比图内蒙古工业大学本科毕业论文332.2病态方程在最小二乘解法中,当取span1,x,x2时,系数矩阵的条件数为386.79;当取span1,x,x2,x3时,系数矩阵的条件数为 8.3909 103;取span1,x,x2,x3,x4时,系数矩阵的条件数为2.3336 105.故可知法方程为病态方程组.克服病态方程组的方法为正交多项式方法,其拟合原理与用多项式作拟合的

36、原理类同,所不同的是用首项系数为1的正交多项式系 Po(x), Pi(x),L , Pn(x)代替函数系 o(x), !(x)丄,n(x).解决病态方程组常用方法就是施密特设12,L , i线性无关,若取则向量组(Schmidt)正交化方法.其步骤如下:(s,s s(1, 1)1)2 £2,1)(1,1)S,2)2)(%$" s 1(s 1, s 1)s是两两正交的非零向量组,则将11, 2,L , s是标准正交向量组.,ss单位化,即令例2.2用正交多项式方法求在例2.1中的离散数据的二次多项式曲线拟合首先利用公式依次求出0.00,0.25,0.50,0.75,1.00上

37、关于权函数 (xi) 1的正交多项式 P0 (x) , P1(x), P2(x).得:11, P0(x)1 ,21,112281P1(x) x, P2(x) (x)(x丄)12228然后由正交多项式po, P1, P2求出曲线拟合的二次多项式的系数 ao, a1 , a2.由解得551 25(P1, pjP1 (Xi) P1 (Xi)(x)2i 1i 128551、21 2(P2, P2)P2(x)P2(Xi)(为-)2-20.0546875i 15i 128(Po, Po)5(f,Po)f(GPo(N)8.7680i 15(f, Pl)f(X)Pi(X)1.067415(f, P2)f(x)

38、p2(x) 0.04613751(f,P0)1.7536(P0, P0)(f, P1)1.70784(P1, P1)a2(仁 P2)(P2, P2)0.843657所以得出的二次拟合多项式为*s (x) a°p0(x) a1P1(x) a2P2(x)1.00513 0.86418x 0.84365 x2所得的拟合曲线如图2.3所示.图2.3二次曲线拟合图由此可以看出,采用正交多项式所得的有效数字更多,故更为精确.2.3建模分析例2.3以下表2-2显示出我国若干年份的研究生实际招生人数 ,请运用此表和所 学的数值计算理论,尝试选择合适的算法来测算2011和2012年可能的招生人数.表2

39、-2研究生招生计划年份199920002001200220032004200520062007200820092010人数(万)8.712.815.620.2626.732.637.039.842.044.847.553.4为了计算的简便,将年份由1999-2010变为第1-12年,即预测第十三年和第十四 年的招生人数.分析此题,是根据以往经验,预测出第十三年和第十四年的招生人数,所以此题可用最小二乘法进行拟合,并进行预测.由Matlab做出实际人数如图2.4所示.10o o o o o D6 5 4 3 2 1 >万<数人生招图2.4研究生散点图由图形看不出有明显规律,所以对此题

40、做以下几种拟合,找到最优值.由于多项 式的高次不稳定性,所以只做一次、二次、三次以及幕函数、指数函数和对数函数的 拟合.模型一:一次函数拟合由Matlab拟合程序如下%求一次函数拟合系数x=1:12 y=8.7,12.8,15.6,20.26,26.7,32.6,37.0,39.8,42.0,44.8,47.5,53.4 polyfit(x,y,1)%运行结果ans =4.05875.3815% 以合后两图的对比x=1:12y=8.7,12.8,15.6,20.26,26.7,32.6,37.0,39.8,42.0,44.8,47.5,53.4y0=4.0587*x+5.3815plot(x,

41、y,'b',x,y0,'-r')%求误差r0波动图及误差平方d0x=1:12y=8.7,12.8,15.6,20.26,26.7,32.6,37.0,39.8,42.0,44.8,47.5,53.4y0=4.0587*x+5.3815r0=y-y0d0=r0*r0'plot(x,r0)%运行结果r0 =-0.7402 -0.6989 -1.9576 -1.35631.0250 2.86633.20761.94890.0902 -1.1685 -2.5272 -0.6859d0 =38.2920由以上得一次拟合多项式为y0=4.0587x+5.3815做出

42、一次拟合图形与实际图形的比较图2.5,以及误差图2.6.605040302010原人数y0拟合人数0 11110246802年份43)2万(1人0招-1-2-3024681012年份图2.5 一次函数比较图图2.6 一次函数误差图计算得一次拟合函数误差平方和为d0 38.2920模型二:二次函数拟合由Matlab拟合如下(程序见附录C,下同)y仁-0.1098x 2+5.4858x+2.0518做出二次拟合图形与实际图形的比较图2.7,以及误差图2.8.6050,万数人生招403020二次拟合函数原函数6-年份IT-3年份C-J ,万数人生招图2.7二次函数比较图计算得二次拟合函数误差平方和为

43、图2.8二次函数误差图d1= 22.2100模型三:三次函数拟合由Matlab拟合如下y2=-0.0085x 3+0.0554x2 +4.5922+3.2079做出三次拟合图形与实际图形的比较图2.9,以及误差图2.10.555045403530252015105-原函数024年份8101243万(1 '0 L-1 -2 .10 12图2.9三次函数比较图图2.10三次函数误差图计算得三次拟合函数误差平方和为d2= 21.3849模型四:幕函数拟合由Matlab拟合如下y3=7.5454x0.7832做出幕函数拟合图形与实际图形的比较图2.11,以及误差图2.12.内蒙古工业大学本科毕

44、业论文605040302010幂函数原函数年份TJ4图2.12幕函数误差图图2.11幕函数比较图计算得幕函数拟合函数误差平方和为d3= 26.5155模型五:对数函数拟合由Matlab拟合如下y4=0.6433 +18.6840log(x)做出对数函数拟合图形与实际图形的比较图2.13,以及误差图2.14.50) 万(40对数函数3020104原函数影24680 160年份0-210-808-4-6248106年份6)4(212035图2-14对数函数误差图图2-13对数函数比较图计算得对数拟合函数误差平方和为d4= 200.233模型六:指数函数拟合由Matlab拟合如下y5=13.5949

45、e0.1190做出指数函数拟合图形与实际图形的比较图2.15,以及误差图2.16.601 " p 161 " p 14)281 一 *万(0'h指数函数人-2F*qV原函数招-4 1-6 » . . -85040302010) 万(024681012年份024681012年份图2-15指数函数比较图图2-16指数函数误差图计算得指数拟合函数误差平方和为内蒙古工业大学本科毕业论文d5= 186.497综合上述六种模型,得到如表2-3表2-3研究生拟合各方案比较误拟拟拟合的函数表达式差合合模型平2020方1112和一次函y0=4.0587x+5.381538.

46、58.62.数拟合292144203063一次函2y1= -0.1098x +5.4858x+2.051822.54.57.数拟合210811332002二次函32y2=-0.0085x +0.0554x +4.5922+3.207921.53.55.数拟合384594033961幂函数o0.7832y3=7.5454x26.56.59.拟合515250611505对数函y4=0.6433 +18.6840log(x)20048.49.数拟合.23566951384指数函L A O LC0.1190y5=13.5949e18663.71.数拟合.49860930711经过比较,当拟合函数为三次

47、时,误差的平方和最小,观察此函数,可得出2011年招生人数为53.5946,2012年招生人数55.0331.由于本题所给出的实际数据为间断式的离散型 ,并且所给数据极少,这样,用最 小二乘法就存在不稳定性,建议只用拟合函数预测2011和2012年.当然,最后招生的 人数也需要根据国家的政策而定.2.4总结最小二乘法是一个重要的方法,在工程技术中被广泛应用,用其解决实际问题除了 先要建立正确的模型外,拟合出模型中的参数也是一个十分重要的环节,如果能较好 地拟合出模型中的参数,则有利于实际问题的解决.拟合模型中的参数,常用的有两种方法:一是作线性拟合,二是作非线性拟合,作 线性拟合相对说来要容易

48、些,而作非线性拟合要困难一些,一般根据实验数据直接作 图后, 观察图形,应用以往经验 ,可直接选取合适的函数空间即可 . 本论文对非线性拟合做了较为详细的总结 , 但由于本文作者水平有限 ,还希望大 家给予意见 .参考文献1 王青建.数学史简编 M. 北京.科学出版社 .1998.2 丁天彪.数值计算方法 M. 河南.黄河水利出版社 ,2003.3 张池平.计算方法M.北京.科学出版社,2006.4 张韵华. 数值计算方法与算法 M. 北京. 科学出版社 ,2006.5 徐跃良. 数值分析 M. 四川. 西南交通大学出版社 ,2005.6 杜廷松, 沈艳军, 覃太贵. 数值分析及实验 M. 北京. 科学出版社 .2006 年2 月.7 关治, 陆金甫. 数值方法 M. 北京. 清华大学出版社 .2006 年 2月.8 同济大学计算数学教研室 . 数值分析基础 M. 上海. 同济大学出版 .2005 年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论