版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、最小二乘法的应用研究摘要最小二乘法是从误差拟合角度对回归模型进行参数估计或系统辨识, 并在参数估计、系统辨识以及预测、预报等众多领域中得到极为广泛的应用 .然而 , 最小二乘法因其抽象、难懂常常不能被准确理解 . 本文探讨了最小二乘法的基本 原理及其各种变形的拟合方法 , 其中包括 : 一元线性最小二乘法拟合、 多元线性拟 合、多项式拟合、非线性拟合 , 并且讨论了用镜像映射和切比雪夫多项式解“病 态”矛盾方程组的基本原理和方法 , 在此基础上给出了几种最小二乘法程序的设 计原理.关键词: 最小二乘法 , 线性拟合 , 曲线拟合 , 切比雪夫多项式Study on the Applicatio
2、n about Method of Least SquareAbstractLeast square was used to estimate parameters and identify system of regression model, by the point of error fitting. And it has widely application in the parameters estimate, system identification, prediction, forecasting and other fields. However, the least squ
3、are method because of its abstract and difficul,t often can not be accurately understanding. The least square method's principle and the various kinds of fitting methods such as the linear least square fitting, multiple linear fitting, polynomial fitting a nonlinear fitting are dealt with. And d
4、iscussed using mirror and Chebyshev polynomial solution pathological contradictory equations basic principles and methods. Finally some kinds of the principle of the programs on the least square method are given.Key Words:least square method, linear fitting, curve fitting, Chebyshev polynomial目录一、最小
5、二乘法的统计学原理 1二、曲线拟合 21. 一元线性拟合22. 多元线性拟合43. 多项式拟合54. 非线性最小二乘法拟合65. 多项式回归的高精度快速算法7三、应用最小二乘法的几个问题 9四、程序设计原理 101.线性拟合程序的设计原理102.多元线性拟合程序的设计原理103.Shehata 方程 uk1sk2s 的拟合程序设计原理 11k1 s k2 s结束语 11参考文献 1217、最小二乘法的统计学原理1基本最小二乘法 , 其统计学原理是 :设物理量 y 与l 个变量 x1,x2,xl 间的依赖关系式为f(x1,x2,xl,a0,a1,an),其中 a0,a1,an 是方程中需要确定的
6、 n 1个参数 .最小二乘法就是通过 m m n 1 个实验点 ( xi1, xi 2, xil ,yi)(i 1,2, , m)确定出一组参数值(a0,a1,an) ,使由这组参数得出的函数值y=f (xi1,xi2,xil ,a0,a1,an)与实验值 yi 间的偏差平方和m2s(a0,a1,an)(yi y)i1取得极小值 .在设计实验时 , 为了减小随机误差 ,一般进行多点测量 , 使方程式个数大于待 求参数的个数 , 即m n 1. 这时构成的方程组叫做矛盾方程组 .通过用最小二乘法 进行统计处理 , 将矛盾方程组转换成未知数个数和方程个数相等的正规方程组 ,再进行求解得出 a0,a
7、1,an .由微分学的求极值方法可知 a0 , a1, an 应满足下列方程组ayi 0 (i 1,2,n),这样就实现矛盾方程组向正规方程组的转换 .、曲线拟合1. 一元线性拟合 2设变量 y与 x成线性关系 , 即 y a0 a1x. 现在已知 m个实验点 xi,yi(i 1,2,m) , 求两个未知参数 a0,a1. 方法一 由最小二乘法原理 , 参数 a0,a1应使ms(a0,a1)(yi a0 a1xi)i1取得极小值 .根据极小值的求法 , a0 和a1应满足sm2 (yi a0 a1xi ) 0 a0i 1sm2 (yi a0 a1xi )xi 0 a1i 1a1 m1 ma01
8、xiyimi 1mi 1m m ma0xi a1xi2xi yii1 i 1 i 1这就是含有两个未知数和两个方程的正规方程组从中解得 a0,a1, 即mm(1)a1 ( xi yi mxy) /( xi2 mx2)i 1 i 1a0 y a1x其中1 m1 mx 1xi,y 1yi ,mi1mi 1线性相关系数 R lxy / l xxl yy , 式中2 2 2 2 lxyxi yi mxy , l xxxi mx ,lyyyi my ,i 1 i1 i1相关系数是用来衡量实验点的线性特性 方法二 将 xi ,yi (i 1,2, ,m) 代入 y a0 a1x 得矛盾方程组(2)y1 a
9、0 a1x1y2 a0 a1x2ym a0 a1xm1x1y11x2,By21xmymA则( 2)式可写成BAa0a1则有ATB AT Aa0a1所以a0a1(AT A) 1ATB.其中 A称为结构矩阵 , B称为数据矩阵 , AT A称为信息矩阵 , ATB称为常数矩阵 .为了定量地给出 y a0 a1x与实验数据之间线性关系的符合程度 , 可以用相关系数 r 来衡量. 它定义为mmmmxi yixjyir m m m xi2Xii 1 i1i1j1i 1myi2yii 1 i1r值在0 r 1中, r值越接近 1, x与y的线性关系越好 . r 为正时,直线斜率 为正,称为正相关; r为负
10、时,直线斜率为负,称为负相关. r接近于 0 时,测量数据 点分散或之间为非线性 . 不论测量数据好坏都能求出 a0和a1 ,所以我们必须有一种 判断测量数据好坏的方法 , 用来判断什么样的测量数据不宜拟合 , 判断的方法是 r r0时,测量数据是非线性的 . r0称为相关系数的起码值 , 与测量次数 n有关,如 图表所示 .相关系数起码值 r0nr0nr0nr031.00090.798150.64140.990100.765160.62350.959110.735170.60660.917120.708180.59070.874130.684190.57580.834140.661200.5
11、61在进行一元线性拟合之前应先求出 r值,再与r0比较,若 r r0,则x和 y具有 线性关系 , 可求回归直线;否则反之 .2. 多元线性拟合n设变量 y与n个变量 x间存在线性关系 , y a0ajxj.设变量 xj的第i次测j1量值为 xij ,对应的函数值为 yi(i 1,2, ,m), 则偏差平方和m m ns(a0,a1, ,an)(yi y)2(yi a0ajxij )2i1 i 1 j1为使 s取极小值 , 得正规方程组为 :sa02 (yi a0aj xij ) 0i1 j 1sanmn2 (yi a0ajxij )xi1 0i1 j 1mn2 (yi a0aj xij )x
12、in 0i 1 j1nmmma0xij ajyij 1 i1i1m n m mxik a0xij xik ajj 1 j 1 i1 i 1k 1,2, ,n.(xik yi )将实验数据 (xij , yi )代入上述正规方程组中 , 即得出未知参数 a0,a1, ,an.3. 多顶式拟合n对于 n次多项式 yajxj ,令 xj xj(j 0,1,2, ,n) ,则可转化为线性形式j0ny a0ajxj 这是曲线化直 .对于i 1,2, , m个实验点有 xij xij ,代入多元线性j1拟合的正规方程 :n m m m n m mma0xij ajyixika0( xij xik )aj(
13、xikyi),j 1 i1 i 1 i 1 j 1 i 1 i 1可直接得出多项式最小二乘拟合的正规方程nmxijj 0 i 1mxik yi (k 0,1,2, ,n) ; i1矩阵形式 :1xi12xi22xi23xi33 xi4 xin1xin2xi0xi01xi12xixinxina0n1xin 1n2xia1a2xin ma n0xi0yi1xi1yi2xi yinxi yim式中 代表 , 这是一个具有 n 1个参数 a0,a1,a2, ,an 和 n 1个方程的线性方程 i1组,可用高斯迭代法求出这些未知参数 , 得出回归方程 .4. 非线性最小二乘法拟合将非线性关系 y f (
14、x1,x2, , xi ,b1,b2 , ,bn )直接代入偏差平方和表达式中 ,采用极小值的求法得出 b1,b2, ,bn的数值 , 此方法常常较为繁琐 .为此, 先将函数展开 成泰勒级数 , 忽略高次项 , 化成线性形式后按线性拟合的方法求出参数 , 经多次逼 近可得到满足精度要求的结果 .计算步骤 :(1) 设所求参数真值为 bj (j 1,2, ,n) , 另取初值 b(j0) , 其差值 j bj b(j0) ,故 bj bj(0) j .(2) 将函数f(x1,x2, ,xl ,b1,b2, ,bn)在 b(j0) 处展开成泰勒级数 . 由于初值 b(j0) 与真值 bj 应当很接
15、近 , 故可以略去函数的泰 勒展开式高次项 , 取得一阶近似展开式 :bfi1 1bfin n,式中fi(0) f (xi1,xi2, ,xil ,b1(0) ,b2(0) , ,bn(0) )fi f(xi1,xi2, ,xil ,b1,b2, ,bn)(i 1,2, ,m.m为实验点数 )(3) 令 xijfi,yi fi fi(0),ajj ,则展开式可以写为 :bjny xi1a1 xi2a2xinanxijaj ,j1这是线性关系式的特殊形式 .(4) 将多元线性最小二乘法拟合的正规方程式应用于上式 , 得出其正规方程 组:nm( xij xik )aj(xik yi)(k 1,2,
16、 ,n)j 1 i 1i1x12x22x1nx2nxm1xm2xmna (a1, a2 , ,an)Ty (y1,y2, ,ym)T (f1 f1(0) , f2 f2(0) , ,fm fm(0)T,则上式成为 :T a T y.(5) 以高斯消元法或其它方法求解正规方程,即可得出aj 即 j ,求出 bj b(j0) j, 此式是一个近似式 ,因而得出的 bj也是一个近似值 .将首次求出的 bj 值赋给 b(j0) 作为新的初值 , 重复上述过程 , 再求出新的 j 值, 从而得到新的初值 , 反 复迭代,直到得出足够精度的 bj 为止.5. 多项式回归的高精度快速算法多项式回归分析在回归
17、分析方法中具有特别重要的地位. 在多项式回归分析的矩阵运算中 , 解决数字病态问题则成为重要问题之一 . 为此采取两个措施 :第一, 因为正规方程的条件数是矛盾方程组的平方倍 , 所以首先采用镜像影射法解矛盾 方程组, 不解正规方程组;第二 ,采用切比雪夫多项式 , 使矛盾方程组系数矩阵正交 化,使条件数进一步减小 . 采用这两种有效方法后 , 多项式逐次分析的运算工作就 容易了, 并且提高了精度 .算法原理 :(1) 运用切比雪夫多项式降低矛盾方程的条件数 . 对矛盾方程组的系数矩阵X x(0) , x(1), ,x(n) ,向量 x(0) , x(1) , ,x(n)的 线性相关程度与 X
18、 矩阵的条件数有密切关系 .当系数矩 阵为正交向量时条件数最小 .因此, 如果将多项式回归转化成切比雪夫多项式回归 就能将条件数降低到尽可能小的程度 .(2) 将测量数据化为 1,1区间的数据 yk. 将一般多项式的测量数据x1 x2xn线性影射到 1,1内, 就能把一般多项式的回归问题转化成切比雪夫回归问题 .(3) 对数据 xk 拟合切比雪夫多项式 . 对y a0 a1T1(x2) a2T2 ( x2 ) 用切比雪夫多项式拟合数据 (xk,yk), k 1,2, , n,并经过模型方次和参数的最小 二乘估计 , 算出 ai , i 1,2, ,n.(4) 由切比雪夫多项式还原成普通多项式
19、. 这种算法能在一次输入实验数据 后,系统自动根据残差平方和的 F 检验快速确定方次并求出参数 .例如3,某振动 筒式压力传感器的静态标定数据 ,在 95%的置信带内,运行建模程序得到静态频率 - 压力特性为二次多项式;f (p) 6850.41 16000.21p 141.781p2三、应用最小二乘法的几个问题最小二乘法虽然在数据处理方面具有显著的效果 , 但如果使用不当会导致很 大的误差 ,甚至错误的结果 . 因此,在应用时必须注意以下几个问题 :(1) 慎重选择拟合关系式在实际问题中 , 适当选择拟合关系式是一项十分谨慎的工作 , 它将直接影响计 算的工作量和结论 .(2) 自变量的选择
20、在实际工作中 , 对一组实验 (xi , yi )数据按不同的拟合形式 , 结果会不一样 .特 别注意当两个变量都有一定误差时 , 应当使用双变量最小二乘法进行处理 , 否则可 以使用单变量最小二乘法 .(3) 加权最小二乘法此法是应用于实验测量值 yi非等精度的情况下的拟合方法 . 它不同程度的消 除误差因素 , 结果更准确可靠 .设拟合函数为 y f(x),当x值取xi时 y的实测值为 yi,取 i yi f(xi) .加 权偏差平方和m 2 m 2swi iwi yi f (xi ) ,i1 i 1式中 wi为i个实验点的权重因子 .选取合适的权重因子 wi 可获得高精度的拟合参 数.四
21、、程序设计原理1. 线性拟合程序的设计原理 4对于给定的实验数据 ( xi , yi ), i 1,2, n, 求作拟合直线 y a bx ,使总误差nQyi (a bxi ) 2 为最小.i1再由数学中极值求法得 LS 公式 :nn2 b(xi x)(yi y) / (xi x)2i 1 i 1a y bx ,y 1n yi .ni11n式中 x 1xi ,ni12. 多元线性拟合程序的设计原理n对 式 y a0aj xj , 设 变 量 xj 的 第 i 次 测 量 值 为 xij , 对 应 的 函 数 值j1yi (i 1, 2, n偏)差平方和m m ns(a0,a1,an)(yi
22、y)2(yi a0ajxij)2 ,i 1 i1 j 1 求其极小值得正规方程组n mmma0( xij )ajyi ,j 1 i1i1n n m mxika0( xij xik )aj(xij xik ) (k 1,2, ,n),j1 j 1 i1 i 1式中: m为实验点数 , n为未知参数个数 , x(m, n)为变量 xj( j 1,2, ,n)在第i (i 1,2, , m)次测量中的取值 xij ; y(m)为函数第 i次测量值 yi, c(m,n 1)为正规 m m m m方程组的系数xij 和 xij xik , 第 n 1 列存放yi 和 xik yi ; a(n) 为存放未
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《国民经济核算与》课件
- 工艺品买卖合同模板
- 房屋拆除施工合同书参考例
- 《基因突变上》课件
- 妙笔绘花颜融情醉秋香-初中语文八年级上册 第三单元《学习描写景物》 情境化公开课一等奖创新教学设计
- 统编版语文三年级上册第五单元习作我们眼中的缤纷世界 公开课一等奖创新教学设计(共两课时)
- 2024年抗静电剂项目资金申请报告代可行性研究报告
- 年产xxx轻质硅酸钙砌块项目可行性研究报告(投资方案)
- 年产xx内燃机项目可行性研究报告(项目建议书)
- 凸板门项目可行性研究报告
- 四川省情知识考试复习题库(含答案)
- 保洁人员安全作业培训
- 高中家长会主题班会课件
- 2023年四川天府银行招聘考试真题
- IT运维驻场人员管理制度
- 第2节-第1课时-微生物的基本培养技术-课件【新教材】人教版高中生物选择性必修3
- 与信仰对话 课件-2024年入团积极分子培训
- 弱电智能化工程施工方案与技术措施
- 2024届高考语文复习二元思辨类作文(无答案)
- 猩红热课件完整版本
- 2024年国家开放大学(电大)-学前教育(本科)考试近5年真题集锦(频考类试题)带答案
评论
0/150
提交评论