版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
25.非线性回归现实世界中严格的线性模型并不多见,它们或多或少都带有某种程度的近似;在不少情况下,非线性模型可能更加符合实际。对变量间非线性相关问题的曲线拟合,处理的方法主要有:(1)首先确定非线性模型的函数类型,对于其中可线性化问题则通过变量变换将其线性化,从而归结为前面的多元线性回归问题来解决;(2)若实际问题的曲线类型不易确定时,由于任意曲线皆可由多项式来逼近,故常可用多项式回归来拟合曲线;(3)若变量间非线性关系式已知(多数未知),且难以用变量变换法将其线性化,则进行数值迭代的非线性回归分析。一)可变换为线性的非线性回归表1典型的函数及线性化方法"函数君称.国数盍达式?线性化方法.取曲线函歎J1b—=住一一.■yxv=—u=—VX冠函數J尹二OY»V=111J11-111X指数函数.y=*v=Invu=xry=aebx^v=Inv起二丄型l,X对数函数.y-a-i-31nx■-v-yu=InW型函数十二+"v=—u=e~x卢在很多场合,可以对非线性模型进行线性化处理,尤其是可变换为线性的非线性回归,运用最小二乘法进行推断,对线性化后的线性模型,可以应用REG过程步进行计算。例1有实验数据如下:X1.11.21.31.41.51.61.71.81.922.12.22.32.4109.940.420.024.511.07.34.92.71.81.40.80.0.0.2Y55932952292322试分别采用指数回归(y二aebx)方法进行回归分析。代码:dataexam25_l;inputxy;cards;109.95TOC\o"1-5"\h\z40.4520.0924.5311.027.391.74.951.82.721.91.8221.492.10.822.20.32.30.22.40.22run;procsgplotdata=exam25_l;scatterx=xy=y;run;proccorrdata=exam25_1;varxy;run;datanew1;setexam25_1;v=log(y);run;procsgplotdata=new1;scatterx=xy=v;title'变量代换后数据’;run;procregdata=newl;varxv;modelv=x;printcli;title'残差图’;plotresidual.*predicted.;run;datanew2;setexam25_l;yl=14530.28*exp(-4.73895*x);run;procgplotdata=new2;ploty*x=1yl*x=2/overlay;symbolv=doti=nonecv=red;symbol2i=smcolor=blue;title'指数回归图’;run;运行结果:CORK过程2变量:J卜2变量:I¥简单统计量变量1-1均值标准差总和最小值最大值1.H4XK)0.4183324.500001.KJO(Jt)24000016.1392929.4S037225.950000.2000010fl9500DPearson相关系数,N-14Proby|r|under110:Rho-01.00000■0.71104【).■0.711041.000000.£)014读取的观测数H使用的观测数14方差分柄自由度平方和均方F值Pr>F模型151.0910651.0910S750.31<0001误差1?D.810630.06755校正合计13b1.901心均方根误差0.25991K方09344因娈量均值1.29U«+调整R方(1皈丨变异系数20,13438盏数估计值自由度参数估计值准差标误t值Pr>|t|1忤1匕「cepL19,583990.30945<.0001X1-4.J3395().17232-27.50<.0001
程序说明:(1)调整后的R2=0.9831,说明拟合程度很好;F检验的P值=0.0001<a=0.05,拒绝原假设,故直线回归的斜率不为0;将线性回归系数代入,得到原回归方程y=14530.28*e4.73895x残差图趋势,符合残差随机正态分布的假设(不带其它明显趋势)。二、多项式回归一般函数都可用多项式来逼近,故多项式回归分析可用来处理相当广泛的非线性问题。对观测数据(xt,yt),t=1,…,N.多项式回归模型为:yt=+0[兀+仇工;+…++8,,Fl,2,令y=,x=X]—T™—'B=1A-力i•s=左2,1-ryxn"■xjV_电」则模型可写为:Y=XB+e当X列满秩时,用最小二乘估计B=(XX丄1XY可求得其多项式回归方程。但由于(XX)-1的计算既复杂又不稳定,故一般采用正交多项式法来进行多项式回归。多项式模型可以直接应用GLM(广义线性模型)求解。例2市种畜场奶牛群1—12月份(X1),产犊母牛平均产奶量(y)的资料如程序数据步中,试对该资料配置一个合适的回归方程。代码:dataexam25_2;inputx1y;x2=x1*x1;datalines;3833.433476.763811.583466.223769.473395.423565.743807.083481.993817.033372.823884.52run;procsgplotdata=exam25_2;scatterx=x1y=y;title'原始数据散点图’;run;procregdata=exam25_2;modely=x1x2;run;运行结果:原始数据故点图MDMDa1REG过稈模型:a1REG过稈模型:MODEL1
国变量:y读取的观测数I2悚用的观测数I2山差分新]源自由度平方和均方F值Pr>1模型23325941662S71U.890.0009误差J)886019644.56254校正合计11421195均方根送差99.21977R方0.7896因娈量均值3540.17167调整F?方0.7429变异系数2.72569哄下涮象的残姜与回归凰:yAlM过程源白由度平方和r均方卜值hr>卜模型2332594.3259166297.163016.890.0009988601.06299844.5625校正合计11421195.3888R方变异系数根MSEy均值0.78S54499.219773640.172源自由度1型SS均方1值Pr>1x111I.仃帧Ii.nosnn.on0.9741x1*x11332583.3210332533.321033.780.0003源自由度111型SS均方r值Pr>rx1I314325.5414314325.541431.S30.0003x1*x11332583.3210332583.32100.0003参数估计值标准误差t值Pr>|t|1nteroept4117.201364102.545490540.15<.0001x1-204,93067836,2683725-!).650.[]0(Hx1*x115.7856992.7158(3775.810.0003程序说明:(1)观察数据的散点图,更适合二次多项式拟合,也可以测试几种不同次数的多项式拟合选择其中最优的;(2)将回归系数代入多项式方程得到:y=4117.20136-204.93668x1+15.78570x12三、不能变换为线性的非线性回归该类非线性回归分析就是利用最小二乘准则来估计回归系数〃,使得残差平方和最小。一般来用数值迭代法来进行,先选定回归系数的初值/30,按照给定的步长和搜索方向逐步迭代,直到残差平方和达到最小。有5种常用的非线性回归迭代方法:高斯-牛顿法(Gauss-Newton)、最速下降法(梯度法)、牛顿法(Newton)、麦夸特法(Marquardt)、正割法(DUD)。高斯-牛顿法在初值选取适当,且可逆时非常有效,但在其他情形,其求解较为困难,对此,Marguardt对其中的正则系数阵作适当修正,得到了改进算法。(二)PROCNLIN过程步对于不能线性化的非线性模型。其估计不能直接运用经典的最小二乘法,而需要运用其他估计方法,如加权最小二乘法、直接搜索法、直接最优法与Taylor级数展开法进行线性逼近此时可以利用NLIN过程步实现相应的计算,它是采用最小误差平方法及迭代推测法来建立一个非线性模型,估计参数默认采用高斯-牛顿迭代法。NLIN过程不保证一定可以算出符合最小误差平方法之标准的参数估计值。基本语法:PROCNLINdata=数据集</可选项>;PARMS参数名二数值;MODEL因变量二表达式</可选项〉;BOUNDS不等式;〉CONTROL变量;〉der.参数名二表达式;〉<OUTPUTout=输出数据集</可选统计量>;>说明:(1)NLIN的可选项包括:outest=输出数据集输出每步迭代的结果;best=n只输出最好的n组残差平方和;method=gauss|marquardt|newton|gradient|dud|设定参数估计的迭代方法,默认为gauss(没有der.语句);PARMS语句指定参数并赋值,一般包括参数名、初始值(GridSearch可以帮助选择合适的初始值)、迭代准则;例如:parmsb0=0b1=1to10b2=1to10by2b3=1,10,100;bounds语句用于设定参数的约束,主要是不等式约束,约束间用逗号分隔。例如,boundsa<=20,b>30,1<=c<=10;der.语句用于计算模型关于各参数的偏导数,相应格式为:一阶偏导数:der•参数名=表达式;二阶偏导数:der•参数名•参数名=表达式;例如,对于模型modely=b0*(l—exp(-bl*x));二阶偏导数表达式:der.b0.bl二x*exp(-b1*x);例3根据对已有数据的XY散点图的观察和分析,发现Y随X增长趋势是减缓的,并且Y趋向一个极限值,我们认为用负指数增长曲线来拟合模型较为合适。代码:dataexpd;inputxy;datalines;0200.570300.720400.810500.870600.910700.940800.950900.971000.981100.991201.001300.991400.991501.001601.001700.991801.001901.002000.992101.00=10method=gauss;procnlin=10method=gauss;parmsb0=0to2by0.5b1=0.01to0.09by0.01;modely=b0*(1-exp(-bl*x));der.b0=1-exp(-bl*x);der.bl=b0*x*exp(-bl*x);outputout=expoutp=ygs;run;goptionsreset=globalgunit=pctcback=whiteborderhtitle=6htext=3ftext=swissbcolors=(back);procgplotdata=expout;ploty*xygs*x/haxis=axislvaxis=axis2overlay;symbolli=nonev=pluscv=redh=2.5w=2;symbol2i=joinv=nonel=1h=2.5w=2;axis1order=20to210by10;axis2order=0・5to1.1by0.05;title1'y=b0*(1-exp(-b1*x)';NOTENOTE:Convergenceoriterionnettitle2'procnlinmethod=gauss';run;运行结果:NLIN过程
因变量T网格搜索bObl平方和i.()()[)()().(JO11()L00000.05000.0I6S1.00000.06000.05521.()(![)()0,03000,0666100000.07000.00731.00000.ODDO0.1365i.o(|[)o0,09000,1708100000.02000.41931.50000.01000.9757L00000.01002,1653NLIN过程因豐量y
方法:Gauss~N<mI.on迭代阶段迭代bOb1平方和01.uouo0.04000.0U14U10.99010.04190.0005802Q.画20.04200.OOO&7730.99520.04200.000&7T4t).脚汐0.0-^(10.OOO&77估计汇总方法GaussNewton迭代IR2.552E-7PPG(bl)1.()281-8RIJC(b1)匚抽-1「7Object2.56E-10目标0.000677读取的观测20愉用的观测20缺失的观测UNuLe:Ariinteri;epLwuurioLifiedlorIhisniudeI.源自由度平方和均方rva1ue近似Pr>r模型217.67176.9359275733<.0001渓差1U0.0005770.000032未校正合计2017.6723参数怙计值近似标准淒差近似95%査信限bO0.99
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华师大版初中科学6.1信息的传递和通信
- 天弘爱理财APP整合方案
- 外勤医疗服务管理制度
- 异常情况和事故处理管理制度
- 表格制作方法
- 1《古诗三首》核心素养分层学习任务单-2022-2023学年三年级语文下册新课标(部编版)
- 2024年合作办理客运从业资格证理论考试题
- 2024年北京汽车客运资格证考试题目
- 2024年宣城客运从业资格证报名考试题目
- 2024年本溪客运从业资格证模拟考试练习题
- 房产中介个合伙人合同范本
- 农村土地承包租赁合同范本版
- 【新能源汽车充电方案设计3500字(论文)】
- 深基坑开挖与支护施工监理实施细则
- GB/T 43910-2024物流仓储设备术语
- 2024年富宁县国有资本经营集团有限公司招聘笔试参考题库附带答案详解
- JBT 7538-2016 管道用篮式过滤器
- 体育过程性评价实施方案
- MSDS中文版(锂电池电解液)
- 新版Join-In四年级上英语期中试卷
- 【客舱服务质量与空中乘务员综合素质浅论4800字(论文)】
评论
0/150
提交评论