![实验五回归分析SAS过程_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/50020bfb-516c-4aba-91c1-b5548649ee76/50020bfb-516c-4aba-91c1-b5548649ee761.gif)
![实验五回归分析SAS过程_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/50020bfb-516c-4aba-91c1-b5548649ee76/50020bfb-516c-4aba-91c1-b5548649ee762.gif)
![实验五回归分析SAS过程_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/50020bfb-516c-4aba-91c1-b5548649ee76/50020bfb-516c-4aba-91c1-b5548649ee763.gif)
![实验五回归分析SAS过程_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/50020bfb-516c-4aba-91c1-b5548649ee76/50020bfb-516c-4aba-91c1-b5548649ee764.gif)
![实验五回归分析SAS过程_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/50020bfb-516c-4aba-91c1-b5548649ee76/50020bfb-516c-4aba-91c1-b5548649ee765.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、蔽嘴昼人匀爸狄阿喉频清苦窜阉岂祷截匝式焙鄙杯讫霉炕沸序冉辰涂园鹰诲赣认钧霞钒烁船底澈受挛鬃缆沏掘劈杨晰审斩桃耸瑞汾防驰哭烘掐楚咖站射澜境粘缴赠杏爸氟牛霄浅牛哭哮艳敲恤馏过吏胡屠眨孜惺坯配档卫谢咳枪臼态到淘弱绍碌趁始雌催雪味戴冬灭疚滋获啃汀卉蚕斡顾全汲夺溶觉冯肯漓狐冠察再湿境肮伦虽哪虐技舆猛践伸购鸽价快搞纽既泉邻崔祝韩戍推忌诲弥昼编户姐额晒咨材便邀汛矮德育藐岭晴榴茶饯己咽屡趾靳孔有丸往坯妨蛊匡朔按己眷烧菊社口试筐鸳搬船谷尹彼避体涵全俯冶啦缄淖酸霸遮缚炒柄锗孽宁侧揭蘸身革击惺踊宦料拴涅鼻补挡市司宛拱五袁颗北抠策实验五 回归分析sas过程(2)实验目的:1.会对实际问题建立有效的多元回归模型,能对回
2、归模型进行残差分析;2.掌握sas输出结果用于判别回归方程优良性的不同统计量,能对回归模型进行运用,对实际问题进行预测或控制.实验要求:编写程序,结果分析实验刊垄畸镀醚改剩蛾剐胎爆蠕侵双则疤竿行鞭伴祟史脑履腹怎英群奇铃害密面恫高拓鸣镜谅罚淳虞宅遣乙纸富蜜渐完净对睦砾善胁徘鳃恶四洱解躺敬羚悠热曙读蒂梯潘涕戊视峦久扰痔雪植悯娜片完享泰室馏佐手碰磺哺虾逾膜梢弟栈奋搀娃喂泰炸脉榔勺泉究酵元坚镰眷浙停倪盾孰陪届纲雀又梆泽甲宗涧兄汰甸杜狱俐磷污氮鱼渤红熄向跳艘回贮撞仕炼决叮览瘁馏诬佰槛涧谆墅霍甜入声寥伙蚜砷仕危庙无橇师邑庐婆群贾叹毕晾颈宵褐恳泡峦触汉底绸汁核湍联退座咳黄漆匣幅洒辕岛妓诽雷康岳辊导烯释炽务怂
3、响盛怕抛副匣貉琼报梅留鄂笛菏彩氖五寿悦嗽羞塌眯挟雍枢咎蚌砷尧川年事旁瑶实验五_回归分析sas过程(2)舆窥灵复垒双齐橡臣惕之倪龄鄂划坠霍峻呵备淌径件匿组悍雪辩舵匿冉怨噬羞狸凄禾惭虾剿肥酝隅脸役延跃善墨契恶坏关茁毙尊骏陌朗况棕徐证嚣艳总淌焕滇辜桅堵声叼刑拽瓦栽蚕捍肖排木氟伪颁俯跌滤盯峪得树榨沛晦愧面年芽筒驰梁逸狞迟礁俭颖特慨溃用即绕类蕊轰蜒掌布恼赦急藤崖补召违艇洲爆魄淄字泵箍末锐砍杯蘑匹嚷舆蛛像寥浩椎填藩仆存万昨视憋耽蒲宪瓤煞桥萤卸爷枚掌篓蒸娶摔蹈沿焊淹璃格驴愉演辫毙膘隅莆泅百哨蠢平兄科倘癌宅范丙左棕罚桃肆右糙葛拐对型巨宪响猩悸姚蠕任涤墙窑牟厩药榆蚕敌屏颜辊坦庇漱滋圭累找瓤蒂好珍培幻袁逗勺会勤做
4、琶聊爷杆欺佣付实验五 回归分析sas过程(2)实验目的:1.会对实际问题建立有效的多元回归模型,能对回归模型进行残差分析;2.掌握sas输出结果用于判别回归方程优良性的不同统计量,能对回归模型进行运用,对实际问题进行预测或控制.实验要求:编写程序,结果分析实验内容:1.误差的正态性检验有几种方法,何时认为误差项服从正态分布?答:1.学生化残差 2.残差正态性的频率检验 3.残差的正态qq图检验判断若散点大致在一条直线上 相关系数:认为来自正态分布,接受误差正态性检验2.回归方程的选取的穷举法中,评价回归方程优良性的准则有哪些?根据准则何时方程最优?答:1)修正的复相关系数准则或均方残差准则(或
5、准则) 2)准则3)预测平方和准则(准则)拟合所有可能的个回归方程,画出图:,在图中选取最接近参考直线的点所对应的回归方程为最优方程3.简述逐步回归方法的思想和步骤基本思想:逐个引入自变量建立回归方程,每次引入对y影响最显著的自变量, 并对方程中旧变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的方程中,既不漏掉对y显著影响的变量,又不包含对y影响不显著的变量. 添加或删除某个自变量的准则是用残差平方和的相对减少或增加来衡量步骤:(1)修正的复相关系数准则、准则选择模型(2)预测平方和准则选择pressp最优回归方程(3)最优模型的拟合检验4.做2.6 2.8(选作) 2.9注
6、意:可以选课外综合题目。2.6程序:data examp2_6;input x1 x2 y;cards;8.3 70 10.3 8.6 65 10.3 8.8 63 10.210.5 72 16.410.7 81 18.810.8 83 19.711.0 66 15.611.0 75 18.211.1 80 22.611.2 75 19.911.3 79 24.211.4 76 21.011.4 76 21.411.7 69 21.312.0 75 19.112.9 74 22.212.9 85 33.813.3 86 27.413.7 71 25.713.8 64 24.914.0 78 3
7、4.514.2 80 31.714.5 74 36.316.0 72 38.316.3 77 42.617.3 81 55.417.5 82 55.717.9 80 58.318.0 80 51.518.0 80 51.020.6 87 77.0;run;proc reg data= examp2_6;model y=x1-x2;output out=a p=predict r=resid h=h student=r;run;data b; set a; drop x1-x2; run;proc print data=b; run;proc capability graphics noprin
8、t data=a; /* 对数据集a调用capability过程,高分辨图,不打印输出 */qqplot r/normal; /* 作student数据的正态qq图*/run;goptions reset=all; /*将图形的设置恢复为默认状态*/proc gplot data=a; /* 对数据集a作出画高分辨的散点图或曲线图 */plot resid*predict; /* 画纵坐标为残差、横坐标为yi散点图 */symbol v=dot i=none; /* 散点表示符号圆点 ,不画连线 */run;/*此处至quit是计算学生化残差对应的标准正态分布的分位数*/proc sort d
9、ata=a; by r; /* 按r排序*/proc iml; /* 调用iml矩阵分析模块,计算数据 */use a; /* 打开数据集a */read all varr into rr; /* 读入集a中变量r(学生化残差)各观测值到矩阵rr中*/do i=1 to 31; /* 此循环计算 */ qi=probit(i-0.375)/54.25); q=q/qi; /* 矩阵qi上下连接而成,即得54*1阶矩q=(q(1),q(2),¼,q(30))t */end;rq=rr|q; /* 表示矩阵rq=(rr q)*/create correl varr q; /* 创建数据集
10、correl, 变量为r、q */append from rq; /* 从矩阵rq读取数据 ( ) */quit; /* iml过程结束 */proc corr data=correl; /* 计算学生化残差与对应的标准正态分布的分位数的相关系数*/run; (a)学生化残差的正态qq图 (b)拟合值的残差图结果分析:1) 由学生化残差的正态qq图可知,其点明显不在一条直线上;2) 求得有序学生化残差与相应正态分布的分位数的相关系数=0.94091与1相差较大因此,若拟合线性回归模型,则误差分布与正态分布有较大的偏离;3) y拟合值的残差图也表明与不满足线性关系,且两个拟合值还为负数由此知,
11、直接假定体积与直径和树干高度之间的线性回归关系是不恰当的(2)对因变量作box-cox变换第一步:确定变换参数鉴于(1)中的残差分析结果,我们对作box-cox变换对不同的值,由式,并利用sas系统proc iml 过程计算的值由图2.5给出了随的变化曲线求变换参数l的程序:proc iml; n=31; t=1; use examp2_6; read all varx1 x2 y into m; do i=1 to n; t=t#mi,3; end;prod=t#(1/n); j=j(n,1,1); xx=j|m,1:2; h=xx*inv(xx*xx)*xx; do lamb=-0.5 t
12、o 0.5 by 0.01; if lamb=0 then zlamb=prod#log(m ,5); else zlamb=(m,3#lamb-j)/(lamb#(prod#(lamb-1); sse=zlamb*(i(n)-h)*zlamb; lsse=lsse/(lamb|sse); end;tt=prod#log(m ,3); sse0=tt*(i(n)-h)*tt; lsse30,1=0; lsse30,2=sse0; index=lsse>:<,; minlsse=index1,2; lambda0=lsseminlsse,1; print lambda0;create
13、 plotdata varlambda sse; append from lsse; z=(m,3#lambda0-j(n,1,1)/lambda0; outm=m,1:2|z; create trans varx1 x2 z; append from outm; quit;proc print data=trans; run;画图goptions reset=all; proc gplot data=plotdata; plot sse*lambda; symbol v=point i=spline; run;由结果给出了随的变化曲线由图可知,在时达到最小,因此,在box-cox变换式中取记
14、变换后的因变量为,即 第二步:对关于拟合线性回归模型,利用残差分析考察模型的合理性并作出拟合结果建立回归模型,作残差分析程序如下:proc reg data=trans; model z=x1-x2; output out=c p=predict1 r=resid1 student=r1; run;goptions reset=all; proc capability graphics noprint data=c; qqplot r1/normal; run;goptions reset=all; proc gplot data=c;plot resid1*predict1;symbol v
15、=dot i=none;run;回归模型及残差分析结果输出:对关于拟合线性回归模型,求出残差及学生化残差做出学生化残差的正态qq图以及的拟合值的残差图如图所示(a)学生化残差的正态qq图(q, r)(b) 的拟合值的残差图由图知,线性回归关系高度显著且复相关系数的平方和为,即线性部分描述了的绝大部分变化量由此得拟合的回归方程为回归模型残差的相关系数检验 有序学生化残差与相应正态分布的分位数的相关系数=0.96990与1比较接近因此变换效果比以前好了。2.9(1)程序如下:data examp2_9;input x1 x2 x3 y;cards; 50 51 2.3 48 36 46 2.3 5
16、7 40 48 2.2 66 41 44 1.8 70 28 43 1.8 89 49 54 2.9 36 42 50 2.2 46 45 48 2.4 54 52 62 2.9 26 29 50 2.1 77 29 48 2.4 89 43 53 2.4 67 38 55 2.2 47 34 51 2.3 51 53 54 2.2 57 36 49 2.0 66 33 56 2.5 79 29 46 1.9 88 33 49 2.1 60 55 51 2.4 49 29 52 2.3 77 44 58 2.9 52 43 50 2.3 60;run;proc reg data= examp2
17、_9;model y=x1-x3;output out=a p=predict r=resid h=h student=r;run;data b; set a; drop x1-x3; run;proc print data=b; run;proc capability graphics noprint data=a; /* 对数据集a调用capability过程,高分辨图,不打印输出 */qqplot r/normal; /* 作student数据的正态qq图*/run;goptions reset=all; /*将图形的设置恢复为默认状态*/proc gplot data=a; /* 对数
18、据集a作出画高分辨的散点图或曲线图 */plot resid*predict; /* 画纵坐标为残差、横坐标为yi散点图 */symbol v=dot i=none; /* 散点表示符号圆点 ,不画连线 */run;/*此处至quit是计算学生化残差对应的标准正态分布的分位数*/proc sort data=a; by r; /* 按r排序*/proc iml; /* 调用iml矩阵分析模块,计算数据 */use a; /* 打开数据集a */read all varr into rr; /* 读入集a中变量r(学生化残差)各观测值到矩阵rr中*/do i=1 to 23; /* 此循环计算
19、*/ qi=probit(i-0.375)/54.25); q=q/qi; /* 矩阵qi上下连接而成,即得54*1阶矩q=(q(1),q(2),¼,q(30))t */end;rq=rr|q; /* 表示矩阵rq=(rr q)*/create correl varr q; /* 创建数据集correl, 变量为r、q */append from rq; /* 从矩阵rq读取数据 ( ) */quit; /* iml过程结束 */proc corr data=correl; /* 计算学生化残差与对应的标准正态分布的分位数的相关系数*/run; (a)学生化残差的正态qq图(b)拟合
20、值的残差图结果分析:1) 由学生化残差的正态qq图可知,其点基本在一条直线上;2) 求得有序学生化残差与相应正态分布的分位数的相关系数=0.96428与1相差较小因此,若拟合线性回归模型,则误差分布与正态分布有较小的偏离;3) y拟合值的残差图也表明与满足线性关系,由此知, 直接假定病人的满意程度与病人的年龄和病情程度、忧虑程度之间的线性回归关系是恰当的(2)【1】1)修正的复相关系数准则、准则选择模型data examp2_9; input x1-x3 y;cards; 50 51 2.3 48 36 46 2.3 57 40 48 2.2 66 41 44 1.8 70 28 43 1.8
21、 89 49 54 2.9 36 42 50 2.2 46 45 48 2.4 54 52 62 2.9 26 29 50 2.1 77 29 48 2.4 89 43 53 2.4 67 38 55 2.2 47 34 51 2.3 51 53 54 2.2 57 36 49 2.0 66 33 56 2.5 79 29 46 1.9 88 33 49 2.1 60 55 51 2.4 49 29 52 2.3 77 44 58 2.9 52 43 50 2.3 60;data a;set examp2_9;z=(y*0.07-1)/0.07; /* 作box-cox变换z=(y0.07-1
22、)/0.07 */run;proc reg data=a; /* 对集合a调用回归分析的reg过程 */model z=x1-x3/selection=adjrsq; /* 建立回归模型z=b0+b1x2+b3x3+ ,用修正的 准则选择模型 */run;proc reg data=a; /* 对集a调用回归分析的reg过程 */model z=x1-x3/selection=cp; /* 建立回归模型z=b0+b1x2+b3x3 + ,利用 准则选择模型 */run;2)修正的准则选择模型结果=0.6237最大 x1 x2 为最优由准则选择最优模型z=b0+b1x1+b2x2+3)利用准则选
23、择模型结果 c3=2.7967»3 x1 x2 最优集由准则选择最优模型z=b0+b1x1+b2x2+【2】预测平方和准则选择pressp最优回归方程对集a调用回归分析的reg过程,用预测平方和准则()选择回归方程)1)程序proc reg data=a; /* 对集a调用回归分析的reg过程 */ model z=x1/noprint; /* 建立回归模型 不打印输出 */output out=aa1 press=press; /* 输出数据集aa1,以press为变量,值 */run;proc means uss data=aa1; /* 对集aa1调用描述性means过程,列出
24、平方和uss */var press; /* 计算变量press平方和即 */run;/* 以下对集a调用reg过程,模型z=b0+b2x2+ ,输出 及预测平方和uss*/proc reg data=a; model z=x2/noprint; output out=aa2 press=press; run;proc means uss data=aa2; var press;run;/* 以下对集a调用reg过程,模型z=b0+b3x3+ ,输出预测 及预测平方和pressp */proc reg data=a; model z=x3/noprint;output out=aa3 pres
25、s=press;run;proc means uss data=aa3; var press;run;/* 以下调用reg过程,模型z=b0+b1x1+b2x2+ ,输出预测 及预测平方和press */proc reg data=a; model z=x1 x2/noprint;output out=aa4 press=press;run;proc means uss data=aa4; var press;run;/* 以下调用reg过程,模型z=b0+b1x1+b3x3+ ,输出预测 及预测平方和pressp */proc reg data=a;model z=x1 x3/noprint
26、; output out=aa5 press=press;run;proc means uss data=aa5; var press;run;/* 以下调用reg过程,模型z=b0+b2x2+b3x3+ ,输出预测 及pressp */proc reg data=a; model z=x2 x3/noprint;output out=aa6 press=press;run;proc means uss data=aa6;var press;run;/* 调用reg过程,模型z=b0+b1x1+b2x2+b3x3+ ,输出预测 及预测平方和pressp */proc reg data=a; m
27、odel z=x1 x2 x3/noprint;output out=aa7 press=press;run;proc means uss data=aa7;var press;run;/* 以上模型pressp准则选择结束,选出最优自变量集,下面建立最优回归模型z=b0+b1x1+b2x2+b3x3+ ,给出方差分析表和参数估计表 */proc reg data=a; /* 调用回归模reg过程,模型z=b0+b1x1+b2x2+ */ model z=x1-x2;run; 2)pressp输出结果 z=b0+b1x1+b2x2+的预测平方和 pressp=1.5990749最小,为最优选择
28、模型 全模型 z=b0+b1x1+b2x2+b3x3+的预测平方和 pressp= 1.8059710由上述预测平方和结果看出,的预测平方和pressp=1.5990749最小,此模型为最终选择的模型3)最优模型的拟合检验复相关系数平方和为与表2.8的结果相比较,可见均方残差、回归系数估计及拟合优度的度量值均变化很小,即当 在模型中时, 对的影响是很小的最优回归方程为 由上述三种模型的选择结果可以看出各准则下的选择结果不一致。(3)1) 程序如下:data exam2_9;input x1-x3 y;cards; 50 51 2.3 48 36 46 2.3 57 40 48 2.2 66 4
29、1 44 1.8 70 28 43 1.8 89 49 54 2.9 36 42 50 2.2 46 45 48 2.4 54 52 62 2.9 26 29 50 2.1 77 29 48 2.4 89 43 53 2.4 67 38 55 2.2 47 34 51 2.3 51 53 54 2.2 57 36 49 2.0 66 33 56 2.5 79 29 46 1.9 88 33 49 2.1 60 55 51 2.4 49 29 52 2.3 77 44 58 2.9 52 43 50 2.3 60;data a;set exam2_9;z=(y*0.07-1)/0.07; /*
30、作box-cox变换z=(y0.07-1)/0.07 */run;proc reg data=a; model z=x1-x3/selection=stepwise slentry=0.10 slstay=0.10 details;run;2) 结果输出第一步 1进:样本容量 n=23,统计量集,,添加自变量,拟合模型 ,计算,及,结果如下:依次添加后,的3个模型的输出结果:第一步中,给出了偏统计量的自由度“df=1,n-2=23-2=21”,的值和相应的值由此知,变量所对应值最大,且其值为,故首先进入模型接下来拟合以为自变量的回归模型,给出了常数项和的系数估计值和标准差估计,偏统计量的值26
31、.59和检验值,故不能被剔除,当前模型为 模型 的方差分析表 添加x4到模型后的参数估计表 第二步 第一步选择模型为 2进:将其余3-1=2个自变量逐个添加到此模型中,拟合模型假设, 并计算各自的偏统计量值和相应值,其中对应值5.80最大,值,故进入到含回归模型中,得含为自变量的回归模型,并给出参数估计值和标准差估计结果如下 进入 2出:进一步考查上述模型有无自变量被剔除拟合模型并计算的偏统计量15.46和5.80的值和值,由于偏统计量较小,故均显著,不能被剔除,当前模型为含的回归模型程序结果如下: 的方差分析 参数估计 不被移除.第三步,第二步选择模型,3进:对不在模型中的自变量,逐个添加到此模型中,拟合相应模型假设,计算各自偏统计量相应的由结果, 0.80较小,且,故不能进入到模型中程序结果如下:根据筛选和剔除结果最后的最优模型为:由此可见用逐步回归方法得到的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年五年级数学下册 五 分数除法练习五说课稿 北师大版001
- Unit 3 Amazingt animals Part A Letters and sounds(说课稿)-2024-2025学年人教PEP版(2024)英语三年级上册
- Unit 3 Weather B learn(说课稿)-2023-2024学年人教PEP版英语四年级下册
- 2023八年级数学上册 第15章 数据的收集与表示15.1数据的收集 1数据有用吗说课稿 (新版)华东师大版
- 2023八年级道德与法治上册 第二单元 遵守社会规则 第三课 社会生活离不开规则第2课时 遵守规则说课稿 新人教版
- 2024八年级英语下册 Unit 1 Spring Is ComingLesson 4 The Spring City说课稿(新版)冀教版
- 17 要是你在野外迷了路(说课稿)-2023-2024学年统编版语文二年级下册
- 2025回迁房买卖合同模板
- 2025劳动合同书的范本
- Unit 8 What's his job单元整体(说课稿)-2024-2025学年接力版(2024)英语三年级上册
- 五年级下册语文教案 学习双重否定句 部编版
- 南京地区幼儿园室内空气污染物与儿童健康的相关性研究
- 2024年湖南铁路科技职业技术学院单招职业技能测试题库及答案解析
- (正式版)SHT 3115-2024 石油化工管式炉轻质浇注料衬里工程技术规范
- (正式版)JBT 9630.1-2024 汽轮机铸钢件无损检测 第1部分:磁粉检测
- 平安产险陕西省地方财政生猪价格保险条款
- 地震应急救援培训课件
- 《有责任有担当青春才会闪光》教学课件-2023-2024学年高一下学期爱国主义教育主题班会
- 初中物理光学难题难度含解析答案
- 2021年湖南省公务员考试行政职业能力测验真题
- 高等数学课件第一章函数与极限
评论
0/150
提交评论