实验五相关和回归分析_第1页
实验五相关和回归分析_第2页
实验五相关和回归分析_第3页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验五相关和回归分析相关分析是指对变量之间的相关关系进行描述与度量的一种分析方法,简单相关分析通常指对两变量间相关关系的研究, 其目的是确定两个变量之间是否存在相关关系,并对其相关关系的强度进行度量,常用方法是考察两个变量的散点图和计算变量间的相关系数。多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验、 参数的估计与检验、回归诊断与预测。很多非线性回归问题都可以转化为线性回归问题处理,如多项式回归、指数回归、对数回归、幕函数回归等。5.1 实验目的掌握使用SAS进行简单相关分析和多元线性回归分析及非线性回归分析的方法。5.2 实验内容一、用INSIGHT模块作简单相关分

2、析与一元线性回归分析二、用“分析家”作多元线性回归分析三、使用REG过程作回归分析四、一元非线性回归分析5.3 实验指导一、用INSIGHT模块作简单相关分析与一元线性回归分析【实验5-1】比萨斜塔是一建筑奇迹,工程师关于塔的稳定性作了大量研究工作,塔的斜度的测量值随时间变化的关系提供了很多有用的信息,表5-1给出了 1975年至1987年的测量值(sy5_1.xls)。表中变量“斜度”表示塔上某一点的实际位置与假如塔为垂直时它所 处位置之偏差再减去 2900mm。表5-1比萨斜塔的斜度年份x75767778798081828384858687斜度 y(1/10mm)6426446566676

3、73688696698713717725742757试分析y(斜度)关于年份x的相关关系,写出y关于x的线性回归方程,并利用所建回 归方程预测1988年时比萨斜塔的斜度值。1. 数据的导入首先将上表在 Excel中处理后导入成 SAS数据集Mylib.sy5_1 ,如图5-1所示,其中x 表示年份y表示斜度。2. 制作散点图制作斜度y与年份x的散点图, 步骤如下:在INSIGHT中打开数据集(2) 选择菜单"Analyze (分析) 点图)”(3) 在打开的“ Scatter Plot (Y X)选定X变量:x,如图5-2左所示。以便判断变量之间的相关性。Mylib.sy5_1 。S

4、catter Plot (Y X)(散"对话框中选定 Y变量:Y; 单击“ 0K”按钮,得到斜度y与年份x的散点图,如图5-2右所示。 从散点图中可以看出,斜度 y与年份x之间具有一定的线性关系。图5-2 斜度y与年份x的散点图3. 相关系数计算在INSIGHT中打开数据集Mylib.sy5_1。(1) 选择菜单“ Analyze (分析)"宀“ Multivariate (Y X)(多变量)”(2) 在打开的“ Multivariate (Y X) ”对话框中选定 Y变量:y;选定X变量:x,如图5-3 左所示。.i凰y :孑:N拧推国蚩星廿4S卑丿JS寸13x:1381

5、1-00*0 :玷9M :75J0BCC ;97»QDOV厂0.99W图5-3计算相关系数Tables”' CORRlht- C-relftUtiriSiy0W1 |图5-4相关系数的检验(3) 单击“ 0K ”按钮,得到结果如图 5-3右所示。 结果显示斜度y与年份x的样本相关系数很大,为0.994。为了检验总体变量y与x的相关系数是否为零,选择菜单:p-values”,得到相关系数为零的原假设的p值,如图5-4所示。由于p值很小,应拒绝原假设,可以认为斜度y与年份x之间均存在着显著的正相关关系。4. 一元线性回归在INSIGHT中打开数据集Mylib.sy5_1。(1)

6、选择菜单“ AnalyzeFit(Y X)(拟合)”打开“ Fit(Y X) ”对话框。(2) 在“ Fit(Y X) ”对话框中,选择变量Y,单击“ Y”按钮,将Y设为响应变量;选择变量x,单击“ X”按钮,将x设为自变量,如图5-5左所示。(3)单击Output按钮,在“ Fit(Y X) ”输出选项表中增加选中 要求输出残差的正态 QQ图,如图5-5右所示。Residual Normal 复选项,TfcUR?:3Fira»?iirT Tr-lii nte?jjT IhII Qras> i 1. / C. L f ildi1 !;£ F ax uic1. 9% I

7、二 L «订沙 fy PETUrtET UUBBkrltF Dt&pwatiiu lotted 氏赠 latrlxiitiwstco 匚.it iarn*:.nj.i|pLLi *urLab.:EFJ “ Mix J by FTedi ctndIEEesL dm j H :ns.1 QQ ail grri贮 Errri-1 I-rt-il GE)口 拱IhUit亠匚丄訂忙.兀氏OPsra>ElTlc FrafileFi'arifiTii; -yr.M-tMcnpzu.:trie Cjot-te jCT jCdlJ-LGl1 ; I ' -(M | Wcc

8、l I IfrttlQtl fodtpjt j Reii"阳 |8ri latrlxSiaiiTyFSt1£宙 lbKla of Vir 5 ariLEi'Lifr-l 亦匚上Tpt I / 1CLK)liH lfl3TVT-G III / III1 Tai fl:l 1MT0 W HlOt) TWU图5-5“ Fit(Y X) ”输出选项设置(4)两次单击“ OK”按钮,得到分析结果。显示的结果分为若干张表,其中第二张表给出回归方程:Y 61.1209 9.3187X方程表明回归直线截距的估计值为-61.1209,斜率的估计值为 9.3187,如图5-6左下。回归

9、系数9.3187表示比萨斜塔的“斜度”年平均增加 9.3187。XfrJal图5-6 回归方程与散点图第三张表是带有回归直线的散点图,给出了回归的图形表示,如图5-6右。图的下面是参数回归拟合表(图5-7)。PMEtrlr tgL'rM 沁n I1 LtiudciirrorCurveDi EJ-=e .Pol >TLCffi L 31J 5DI ”lean SqvareOFi 1-E-on Square R-Sq'xareI Stat肝 、H1 15BO4H8351: ;17.4805.汕恥胆蘇 13.腮IQL图5-7参数回归拟合表其中判定系数 R-Square ( R2

10、) = 0.9880,指出x能够解释Y的98.8%的信息。还有1 -98.8% =1.2%的信息不能被解释,这些信息由其他变量和随机因素所解释。第四张拟合汇总表(图5-8 )中Mean of Response ti . 一知”厂Tmti c f Res-ponse 693 623 ;0. 9af A(响应变量的均值) 693.6923是变量 Y 的样本平均 “如 鮭程丽;啊 恤值,Root MSE (均方残差平方根)4.181是对各观测图5-8拟合汇总表点在直线周围分散程度的一个度量值,为随机误差£的标准差(也是实测值 Y的标准差)的无偏估计。Adj R-Sq是修正的判定系数。第五张

11、方差分析表(图 5-9)包含对回归方程的显著检验,其中F统计量的值:904.12MSE17.4805MSM 15804.4835F检验的p值 0.0001,表示模型 显著有效。即认为 Y与自变量x之间的 线性回归关系显著。第六张川型检验表提供了与方差分 析表一样的检验,如图5-10所示。 An 3 lys.l t _ of. .arl.(-昼理空丄一 EL. _1 舸L 吐舸竺 n_L H 土上.'iodel'"'- T; 150Q4."+B3&-'TOBOL诊厂-乙;顽i哄心1119Z2S57 :17. 49j>5C 血t&a

12、mp;I12 1599& T的2 :irTyrie 111 TesteD-Suj, of SumzJlc ±fi SiJlkLl tjF StatPi > FK115814. 48: j3.4,904.12右 0001图5-9方差分析表图5-10山型检验表第七张参数估计表给出了回归直线截距和斜率的估计值及其显著性检验等内容。这里截距的t检验的p值=0.0333 = 0.05,表明截距项是显著非零的, 斜率的t检验p值 0.0001 , 表明斜率显著非零,即自变量 x对因变量Y有显著的线性关系,如图 5-11所示。rParanrttrHe tiraiespaildhlbD

13、FEstLnaleSil ErrortStEltFt >|t|T&ltidLnceVi±r "nflallIalerceul1-6L. l20i25. L298-2. <3 .0.03330| i1 .j0. 3W?L j,0?:<.00011.00001.C0W图5-11参数估计表5.回归诊断在显示窗的底部有一个残差R_Y和预测值P_Y的散点图(图5-12左)。从图 中看出,数据点随机地散布在零线附近, 表明模型中残差等方差、 独立性的假设没 有问题。从残差的QQ图(图7-12右)可以 初步判定残差来自正态分布总体。为了进一步检验残差为正态分布的

14、假定,回到数据窗口。可以看到残差 正残差的正态性。图5-12残差和预测值的散点图及残差的QQ图R_Y和预测值P_Y已加到数据集之中,可以用Distribution(Y)来验(1)选择菜单"Analyze (分析)”"Distribution (Y)(分布)”,打开"Distribution (Y) ”对话框。在数据集 Mylib.sy5_1的变量列表中,选择 R_Y,然后单击“ Y ”按钮,R_Y被选 为分析变量。单击“ Output”按钮,打开“ Distribution (Y)(分布)”对话框。 仅选中“ Tests for Normality ”复选框,如图

15、 5-13所示。图5-13 仅选中“ Tests for Normality ” 复选框*T竟昨Hi-iiiilltyTest StatlstU刊|j-iralucSWlmTilk0.0. B875KeHc fiorflv-血rn-ov0,1 kgg 1>B 1500Croier-von MisesCl屹硏缶>.2500AMeTSflrrDrliris以1 触il? .>« 3W0图5-14残差分布的正态性检验表(4)两次单击“ 0K”按钮得到结果。在“ Tests for Normality ”(正态性检验)表(图 5-14)中看到,4种检验方法的p值均 大于0.

16、05,不能拒绝原假设,表明可以接受残差正态性的假定。6.利用回归方程进行预测当回归模型中各参数都通过了显著性检验,模型整体的拟合效果也不错时,就可以用所建立的模型进行预 测了。即通过自变量 X的取值来预测因变量 y的取值,例如,年份X为88时,计算斜度y的预测值(均值)可以进行如下操作:(1)回到数据窗口,点击数据表的底部,在第一个空行的X列中填入88,并按Enter键(图5-15)。(2) Y的预测值被自动计算出并显示在P_Y列之中。如此可以得到任意多个预测值。11 IfttJ ImJTI ntIB!14£ 1 TP ¥11,ITLIli !iT7._Jii-n . u.

17、jy ><?. Ofc? 闵W -I17§ 闘E H-m«f 1- 2曲Y &GL F匿生Kn- 2 3 f 5- S 6K4 6B4 即HE抵肌町盟Z-ElDUO 7fl3L UL1D応沖曲'IL71"-4 64S4 77T E4A4Z -T. 3Q. 5.7 D图5-15 回归预测从图5-15可以看到,年份x为88时,斜度y的预测值为758.9231。注意:仅当拟合窗口打开时才可按上述方法计算预测值。二、用“分析家”作多元线性回归分析【实验5-2】某研究人员需要分析我国固定资产投资状况的影响因素,选取5个可能的影响因素:国内生产总值

18、、商品房屋销售额、财政支出、社会消费品零售总额、 进出口总额, 统计19872001共15年的各项指标如表 5-2 所示(sy5_2.xls)所示。试在0.05的显著性水 平下进行多元回归分析,判断哪些因素对固定资产投资有着显著影响,给出回归方程。表5-215年的统计数据年度固定投资总额国内生产总值商品房屋销售额财政支出社会消费品零售总额进出口总额19873791.711962.511009672262.1858203084.219884753.814928.314721642491.2174403821.819894410.416909.216375422823.788101.44155.9

19、1990451718547.920182633083.598300.15560.119915594.521617.823785973386.629415.67225.819928080.126638.142659383742.210993.79119.6199313072.334634.486371414642.312462.111271199417042.146759.4101849505792.6216264.720381.9199520019.2658478.1125772696823.722062023499.9199622913.5567884.6142712927937.55247

20、74.124133.8199724941.1174462.6179947639233.5627298.926967.2199828406.1778345.22513302710798.1829152.526857.7199929854.7182067.462987873413187.6731134.729896.3200032917.7389442.23935442315886.534152.639274.2200137213.4995933.34862751718902.5837595.242193.31. 生成数据集在“分析家”中直接打开上面的Excel数据表(sy5_2.xls),选择编

21、辑状态,修改每个变量的属性,将变量名分别改为:年度:n、固定投资总额:y、国内生产总值:x1、商品房屋销售额:x2、财政支出:x3、社会消费品零售总额:x4、进出口总额:x5。以数据集Mylib.sy5_2存盘。2. 全回归分析1)选择主菜单“ Statistics (统计)” f “ Regressio n (回归)”f“ Lin ear (线性)”,打开"Lin ear Regression (线性回归)”对话框。2)选择变量列表中的变量y ,单击 “ Depe nde nt ”按钮,选定响应变量,选择变量列表中的变量 x1、x2、x3、x4、x5,单击 “ Explanator

22、y ” 按钮,选定解释变量,如图5-16所示。L3J1E4UTEXDn i; 5衫_2ysi:-fiMe ipdtliPrtEiiclJffxPiQlgJ 園mB foilTit ME图 8-16 Linear Regressio n 对话框«1爭 tgffi4311. 1'<忑豐曲口 rfr:di卩.盜fc 4111251社H一0-册创 o. omnsi -0- 9腔u -O.?i£iD3 -0-O9&J6ra.r*iiEterIrrerr90E-TT137 n 1 HR" Ql MB1E11ZI). T7Q3A -:亠 .- HT <

23、;f&Lo£a. ob “ 九:aw-J 2T-E32-0-&1or 01 as0.CL1C0.4昶.3 I.13)单击“ OK ”按钮,得到分析结果如图5-17所示。SoiUfCEBP5ul诫SqutrnsBeui SquareFlodAl注爲E 別舵1E£7.%fir*r22ll4nE45T114I pETrder.t E=an r Hsf:* 6.171ESI2.剛SfiR-3qmrtE卵抚4Idj g-Sqfl. 99£2ihr RIG rrKEKVjre .:3eli rOEILlDtplfidtt1!. !J oj 1 dL>l

24、e : J/ d _' tftft 015Af.HLysL:!图5-18选择逐步回归法回归方程及x1和x2的系数检验均为图5-17多元回归分析结果分析结果包括方差分析表、拟合的汇总信息以及回归系数估计值与显著性检验。方差分析表中显示模型的作用是显著的( F统计量的值为1567.35, p值<0.0001<0.05 = a)。参数显著性检验表明,进入回归的5个自变量,其作用在其它变量进入回归的前提下并不都是显著的。例如 x3、x4、x5的作用就不显著。因此有必要适当选择变量建立一个“最 优”的回归方程。3. 逐步回归分析1)重复上面 2 中 1),在“ Lin ear Reg

25、ression (线 性回归)”对话框(图 5-16)中,单击“ Model ”按 钮,打开“ Linear Regression: Model ” 对话框。在“ Method ”选项卡中选择“ Stepwise selection (逐步 选择法)”,如图5-18所示。两次单击“ OK ”按钮,得到分析结果。2)在显示结果中,第1步记录了只有x1进入回 归方程的回归分析结果,其中回归方程和系数的检验 均为显著,此时R2=0.9911, C(p)=58.5161 ;接着第2 步是自变量x1和x2进入回归方程后的回归分析结果,显著,但常数项检验不显著。接着第3步是自变量x1、x2和x3进入回归方

26、程后的回归分析结果。其中回归方程及所有系数检验均为显著,常数项检验也显著。且R2=0.9984提高了,C(p)=5.5226 减少了。由Q ffnivrH; R-San * 仏翔* Cgl 3】陆遮槪*hFBWkpI¥3 “園 TkliHFr > FTiifc-13IWZtTRZ?-盘跟皿<wOU|Srrsr狎aw»C-slie- led TueaJ4iiZTSSMtJPtrnB*'Frt>lLAr|i.Eh-jvig i s it UiuK h > F0申炉»S.計H4M4< lainxl«. -31M13a飾UE

27、K+S& It - .'JWln2a M0?lt3iTTS1SWr TH u 4x3. .民虹由«4I-jrfitlM: iMDbr Ji* 旳,iBC7®'itpiLie Selmkffk.典第了VfcrLibh» iLnnd CCpi * U flAELMlyplsTorlftiwc-Eq侶FHF> A1BI3 0FTM5P齐WTT雅與itut a< QDL11-T AL421记交£诒TotiI14FirjimiiriJvirtue1?emrTvpb n 裁 TrviiLv rr > r-3S2S,rra,弭

28、laoesin电於 QkflQTfcilC- JIMJQ.'jauizIB1W7JS3LI ji&LZl LClElMrti : nndltlfltfiiTjlbiTTVu"Lhle- iZ Inejeii- R-squAj* = Q.seas ttij Etc1=za.-xa日F 'VaHvnctScutceCFLa «fS 口Sgujurtr ?iLn±F f : Fl«drlC«Tect e4 Tet iE.忖L<.1915957477:61H2.11Eillx-iteSi fclTHfI SS fTliir

29、Pr > Bci.ert-ept llK2K 3L«HCUT. Z5&L1 o. ami 0LljEZZ*l§LT»17942E. DfiMiiarii u. u<iQKi| (X SUHz-4n.d?r hUibM 7.二叭却L3f】L wtkbLEA 3eil iTd Ike hwJe -u? i!|Jfl.h.jui 【IIje 臥Ofl從 Leve-L鼬 ociiHr rCkLe 和 ilie 山営同 i3urJfL«nce 沱氓】f«r ffliry lftT« rbt <飢irtrMltiftM*

30、刊T町机|>LtepitrttTedR-stwrflLfibrTuf In E-quhrett-Squrt匸诚r巧lhhr > F1HLOrML(I.LLSIL5LMBH :2*532.砒严EILUu.打d3即CLKfiEl 血 f<LtUa.«£>Li:图5-19逐步回归第1、2步、3步及最后结果在图5-19右下中指出在0.05的检验水平下,不能再有其它变量进入模型。比较R2和C(p)的值(图5-19右),应取包含变量XI、X2和X3的第三个模型作为较优的模型,对应的回 归方程是:y 3023.27814 0.36911x14.回归诊断进行回归诊断

31、的步骤如下:1)重复上面2中1),在打开的“ Lin ear Regression (线性回归)”对话框中,单击“Plots” 按钮。在打开的"Linear Regression :Plots”对话框中,选择"Residual”选项卡, 按图5-20所示选择有关复选框。2)两次单击“ OK ”按钮,得到回归诊 断结果,在“分析家”窗口的项目管理器中 依次双击“ Residual Plots ” 下的“ Plot of STUDET vs PRED ” 和 “Plot of RESIDUAL vs NQQ ”得到标准化后的残差图(图0.00078157x22.09048X35

32、-21左)和残差的图5-20 Linear Regression: Plots对话框QQ图(图5-21右)。从标准化后的残差图(图5-21左)看出,数据点随机地散布在零线附近,表明模型中误差等方差、独立性的假设没有问题。残差的QQ图(图5-21右)近似一条直线,可以初步判定残差来自正态分布总体,所建回归模型是有效的。3)对残差作进一步检验:在上述操作打开的"Lin ear Regressi on(线性回归)”对话框中,单击“ Save Data” 按钮。在打开的" Lin ear Regressi on: Save Data”对话框中,选中"Create and

33、savediagnostics data”复选框,并将列表中的第 二项“ RESIDUAL Residuals ”添加到左边方 框内,如图5-22所示。两次单击“ 0K ”后得到分析结果。4)在“分析家”窗口的项目管理器中双击 “ Diagnostics ”下的 “ Diagnostics Table” 可以看到在数据集中生成了残差数据,如图图 5-22 Linear Regression : Save Data对话框5-23所示。图5-23生成残差数据将“ Diagnostics Table”存盘(sy5_2_r)后在“分析家”中打开。5)选择主菜单“ Statistics (统计)”“ D

34、escriptive (描述性统计)”“ Distributions (分布)”,打开“ Distributions ”对话框,选择变量列表中的_RESID,单击“ Analysis ”按钮,选定分析变量,如图5-24左所示。图5-24设置选项6) 单击“ Fit (拟合)”按钮,在打开的对话框中选择拟合的分布类型:Normal,使用样本估计量(Sample estimates),如图5-24右所示。7) 两次单击“ OK”按钮,并在分析家窗口的项目管理器中双击“Fitted Distributions ofsy5_2”项,得到对残差_RESID的正态分布检验结果,如图5-25所示。Tbr r

35、ig JVARTATF ProGcdureFitted Dlewlhutlc-n fw EE£1DPiraieter-j iar ElbnB) DistrlhiilliriFaraiwTi&r SyiM】 EdTlr)ai«I£e<m.n>_3Std Dev468.9158GocdTEEt Tets for H>ri-al Pi >IributicnTeelp TaluBrKcdih朋址眄SHm*00.1G317IM2Ft> D>0,1 COcriner-wn Nlsetv-sq0. O&&Z2H4Pr&

36、gt; r-SQXhSDQAnrierE<tT"DarltnEA-SqD. 3B4r399(31Ft> A-Sq>0.250图5-25残差分布检验结果三种检验均有p值0.05,因此不能拒绝残差来自正态总体的假定。5. 预测通过回归诊断得知模型:y 3023.278140.36911x10.00078157x22.09048x3是合适的,可以用于预测。1)假定02, 03年国内生产总值(x1 )、商品房屋销售额(x2)、财政支出(x3)的数据 已存入数据集Mylib.sy5_2_new中,如图所示。fl-rl>31lacooc535ZT151T2CCi3150d

37、DDSTDOODi.tl图5-26 数据集 Mylib.sy5_2_new2)重复上面逐步回归步骤,并在图 5-16所示的“ Lin ear Regression (线性回归)”对话 框中,单击“ predictio ns ”按钮,打开“ Lin ear Regressio n: predictio ns ” 对话框。按图 5-27 所示进行预测的In put (输入)、Output (输出)设置。Pralioi Iqa I 帖吠一jjtlr口內cOH vrj(inh| lafT'l*-HPhfedlri iddfitlaral dta<» Isle wi“Tie:_h

38、rutk硕匸趾厂fPprdi"i| 旧"fli+pu1*ElL 过 BK94lctlQneAdd rshfublls3Add Pf idictinrn I ni Ik图5-27“Linear Regression: predictions” 对话框predict ions ”可以看至 U3) 两次单击“ OK”,得到结果。在分析家的项目管理器中点击“ 预测结果,如图5-28所示。-t .1 i'-i.-IliOt Tuesday, lay 11* 100ts国丸宁产总位a®-时政吏出1r120000十21 M221EOOOO5700000026StiOLo

39、verPpprFrdixtcdtrc-dictl-QEjpTCdi:li<?XlOte进出口总刚rUiit 迓 y11 Jilty142G&3B0b41049.704477, 4224fi314faft442278. 3751MiLT2图5-28预测结果三、使用REG过程作回归分析【实验5-3】某种水泥在凝固时放出的热量 y(cal/g)与水泥中四种化学成分 x1, x2, x3, x4有关,现测得13组数据,如表 5-3 (sy5_3.xls)所示。试从中选出主要的变量,建立y关于它们的线性回归方程。表5-3热量y与四种化学成分的实测数据x1x2x3x4y72666078.51

40、29155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483.81166912113.31068812109.41. 建立数据集输入以下代码建立数据集sy5_3并显示:data mylib.sy5_3;input x1 x2 x3 x4 y;cards;72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182

41、293.12147426115.9140233483.81166912113.31068812109.4Title '数据集 sy5_3'Proc print ;run;运行结果如图所示。Qts-11?sea21155?a1bi:Il i.:4-1外旷亿5752536552*iii.e13?!1?gine.?i1u1LBS2MIE13. V恂Z14/4i :. i111W23?48B12131?19rDiU101.J图5-29 数据集sy5_32. 向后逐步剔出法进行回归执行以下代码:proc reg data = Mylib.sy5_3;var y x1 - x4;model

42、 y = x1 - x4/selection=backward;plot residual. * predicted.;run;输出结果如下:Thr- RK FrediJT1-loctel: naoatit-jpcjjclrnt Tari.szle : yEliiinst i mn;1All TarinbLes Imered: JL Square and C(p - OQOOjUjalyshy船“曲uSourceUlM fi-fSnjiiaTQHSqu.ruF MLujeFr > ?Nodel电2&fiT. B9144閔吐8?4B&111.ISC. 0001Frrr8&#

43、171;7t 843645. 9B?35C'DITEC t cd Tol al12S71S. K3tflP.irafteierSt inck-rdTirliMeEsilnaTtErrsrTree II SS FOIU£ Pr ) FIntercom62. 4053770. D7O9t:k14552O'. 790. 3W111b 55110A 74477器心14- 34 CL 0TOg120. S3 CO 7Li. 7237Z'2i724Eolso cl mog*30.10151a 754710.109050; 02o.狛常-o.ice(X 7005Q 2469

44、75 04 o. 9441丄 euurJlir:二归2图5-30向后逐步剔除的第0步(全回归)d r llLlxuallytLL 21 Ep 1?iri ihle kQ Rentowd:Square = Q 9S2Y and C(p) » 孔 01S2Ari-ilyj! h of 7 -iTi wpSaureeDFka cfKmdiSquireP 也lumPr > F32667. T4Q35卿.2&346lt&B3<i WttLError:讥屮:严5r 33IJ3UCaxxcted Ttai1.2T15. T49O9PaTolhetEFSiandardj

45、rEttotTyp* II 5S FValue Pr > FTem“Ttl emi14.1423S136. Bim25 6T & 0007X11F 1319+a lrroo3EO 5D7W ES.Ol < DOOl0.4LS11X 196613flJ弱甜IL 03 a Of 177如萌*0.1T3299. 93176i.es 0.2064Bound. £lumibdr! IS. 116. 6图5-31向后逐步剔除的第1步H 曲扯业也丄irimatloa: Sten亠Bild mb 1 >=HeI oeeI: h Scfuar e &. 9767 at

46、uJ C(p) 2- 6702AnelT?!? frf Tar1 m<e9.a oflemDF旳UtTMSquareFPr > FF!. ilelZ263T- SE.E&?132B. 929SD22. 50<. DM1Errcir10BT. 9M4B9.TOMGCaireetefl Tc-lalU713. TfeSDEP.3T31-tl5TT*二陶l,T日VirUbleErrotType S£ f l&lueFt > IIntercept52. 57735乙 2SB173062- M41S52B. §1<aocoi11L <

47、;f-EM兀12130152X-a 6&235Q* OL56E1207b 782272W.58< waitn condl 11 百总应虚匕甘丄;II. 22t)&图5-32向后逐步剔除法第2步Iill variables left In the*re si golf lean l 和 tte (L1000zha.iary «>f E-o-tv-ard Ellnirati ?nStepVoTtiblrTirtbrrInPfl-TTiolASqu"旦ft-SqUiTEC(p)F 柏 lu1s0. oocoCl3. 0iIB2CL 02D. B9592

48、20B 00372, &划1.860. 3DM图5-33向后逐步剔除法结果汇总向后逐步剔除法的分析结果给出回归模型:Y = 52.57735 + 1.46831x1 + 0.66225x2残差对预测值的散点图显示如下:VOKK.CSiEG. KJ祐Iv : I2.I7TS'N13-9-十Heq U-97B?6+D.97U2卡PKTS-4JJI3!+U'-1-十1-Z1+-4i1 111TD?5£0屿90351«価110IISPiredlicted 如 Ilf图5-34残差散点图3. 结果分析采用向后逐步剔除法回归的第0步是做全回归,结果如图5-30所

49、示,所有系数均未通过检验(P值均大于0.05),向后逐步剔除法第1步将变量x3剔除,结果如图5-31所示,其中x2和x4的系数仍不能通过检验,接下来第2步将变量x4剔除,结果如图5-32所示,此时的回归方程及 x1和x2的系数均能通过检验,残差对预测值的散点图(图5-34)基本正常符合模型假定,所以方程Y = 52.57735 + 1.46831 X1 + 0.66225x2为有效回归方程。四、一元非线性回归分析【实验5-4】已知数据如表5-4(sy5_4.xls)所示。试分别采用指数回归、对数回归、幕 函数回归和倒幕函数回归4种非线性回归方法进行回归分析,并选择一个较好的回归方程。表5-4

50、实验数据X1.11.21.31.41.51.61.71.81.922.12.22.32.4Y109.9540.4520.0924.5311.027.394.952.721.821.490.820.30.20.221. 生成数据集运行下面程序生成并显示数据集sy5_4,如图5-35所示。data sy5_4;input x y;cards;lb;nir:1.1109.951.240.451.320.091.424.531.511.021.67.391.74.951.82.721.91.8221.492.10.822.20.32.30.22.40.22>run;title'数据集sy

51、5_4'proc print;run;fcfl-o I? 3 JI 1 1- I 1 1 1 *7L .U.L nvL. n.L HL40.4G :D,O 24.13 'L(2 倆 4.5!iLfl?LOJ.2 】日 U.2U 1J2图5-35 数据集sy5_4%GSJC.GPlull2. 对x和y作相关分析执行如下代码:/*画x和y的散点图*/goptions ftext='宋体'proc gplot data = sy5_4;plot y*x;title 'x和y的散点图' symbol v=dot i=none cv=orange ; run

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论