回归分析试验课试验8_第1页
回归分析试验课试验8_第2页
回归分析试验课试验8_第3页
回归分析试验课试验8_第4页
回归分析试验课试验8_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验报告八实验课程:回归分析实验课专业:统计学年级:姓名:学号:指导教师:完成时间:得分:教师评语:学生收获与思考:实验八含定性变量的回归模型(4学时)一、实验目的1.掌握含定性变量的回归模型的建模步骤3.运用SAS计算含定性变量的各种回归模型的各参数估计及相关检验统计量二、实验理论与方法在实际问题的研究中,经常会遇到一些非数量型的变量。如品质变量;性别;战争与和平。我们把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定性变量。定性变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。自变量含有定性变量的时候,我们一般引进虚拟变量,将这些定性变量数量化。

2、例如研究粮食产量问题,y为粮食产量,x为施肥量,另外考虑气候问题,分为正常年份和干旱年份两种情况,这个问题数量化方法就是引入一个0-1型变量D,令D=1表示正常年份,D=0表示干旱年份,粮食产量的回归模型为:yi=Bo+BiXi+p2D+i因变量是定性变量时,一般用logistic回归模型(分组数据的logistic回归模型,未分组数据的logistic回归模型,多类别的logistic回归模型),probit回归模型等。三 .实验内容1 .用DAT能建立一个永久SA蹴据集,数据集名为xt103,数据见表21;对数据集xt103,建立y对公司规模和公司类型的回归,并对所得到的模型进行解释。2

3、.研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归, 并解释回归方程的含义。3 .某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1”=工作,“2”=读研,“3”=出国留学。性别“1”=男生,“0”=女生。用多类别的Logisitic回归分析影响毕业去向的因素。四 .实验仪器计算机和SASa件五 .实验步骤和结果分析1 .用DAT能建立一个永久SA蹴据集,数据集名为xt103,数据见表21;对数据集xt103

4、,建立y对公司规模和公司类型的回归,并对所得到的模型进行解释。方差分析源自由度方和乎均方F值PrF模型21504.41333752.2066772.504。误差17176.3866710.37569校正合计191680,80000均方根误差3.22113R方0.0951囚变量均值19.40000调整R方0.8827变异系数16.60377R检验中R方为0.8951,可以认为回归拟合效果较好。回归方程通过F检验,说明模型是显著成立的。参数怙计值变量自由度参数估计值准差标误t值PrIt|1ntercept1 33.874071.8138618.63,0001x11 -0,101740.00889-

5、1L44,0001x218.05547 L459115.52*0001由参数估计表,可以看出,全部变量都是显著的,回归方程为:y=33.87-0.102x18.06x2其中,x2是虚拟变量,当公司类型为“互助”时,x2为0,为“股份”时,x2为1。由方程可知,x2为1,即股份制公司的保险革新措施速度y会更大。股份制公司采取保险革新措施的积极性比互助型公司高,股份制公司建立在共同承担风险上,更愿意革新。公司规模越大,采取保险革新措施的倾向越大:大规模公司保险制度的更新对公司的影响程度比小规模公司大。SAS程序:dataxt103;inputyx1x2;/*引入虚拟变量,将公司类型的互助设为 0,

6、股份设为 1*/cards;1715102692021175030一022104002770122100191200429001623802816411527211129513868131851212241201661133051301241142461Jrun;procregdata=xt103;modely=x1x2;run;2 .研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。模型信息:模型信息数据集WORK.WJZ晌应变量

7、y晌应水平数2模型二元Logit优化方法Fisher评分法模型解出的是y=0的概率。检脸全局零假设:BETA=0检脸卡方自由度Pr卡方似然比6.66661S0098评分6.11291S0134Wald5,062810*0244由三个检验中,统计量的P值都小于0.05,可以认为模型是显著的。优比估计值效应点估计值95%Wald置信限h0.001卡方xl29.9133Q.0Q7。x224.3做0.1137x426.46140.0395三个变量都是显著的。以x4=1”,即参加工作,为参照。最大似然估计值分析参数y自由度估计值标准误差Wald卡方Pr卡方1ntercept21 -19,11626.38

8、278.97000.00271ntercept31 -18.00957.01626.58880.0W3xl210.16700.05688.64980.0033xl31-0.01150.06520.03120.8598x2210.03770.04080.85080.3563x2310.12200.05854.34260.0372x421Q.003900.002931.76841836x4310.01010.003986.40590.0114由模型可以看出:exp(-19.1160.17xi0.038x20.004x4)p(y=2):1exp(-19.1160.17x10.038x20.004x4

9、)exp(-18.01-0.012x10.122x20.0101x4)exp(-18.01-0.012x10.122x20.0101x4)1exp(-19.1160.17XI0.038x20.004X4)exp(-18.01-0.012XI0.122x20.0101M)p(y=3)=从参数估计表中,与参加工作的同学相比,读研的(y=2)的同学相比,读研的同学其专业课成绩更好(x1的P值=0.003),而外语成绩(x2的p彳1=0.356)和经济状况(x4的P值=0.184)没有显著差异;出国留学的(y=3)学生其专业课成绩和参加工作的没有显著差异,外语成绩和经济状况则更好。Sas程序:data

10、a;inputx1x2x3x4y;cards;9565.0160026362.0085018253.0070026088.0085037265.0175018585.00100039595.00120029292.0195026363.0085017875.0190019078.0050018283.0175028065.0185038375.0060026090.0065037590.0180026383.0170018575.0075027386.0095028666.01150039363.00130027372.0085018660.0195027663.00110019686.007

11、5027175.01100016372.0185026088.0065016795.0150018693.0055016376.0065018686.0075027685.0165018292.0195037360.00800 182一 85.0一 1-750 27575.0075017263.0165018188.0085039296.01950 2Jrun;procprint;run;proclogistic;classx3;modely(ref=3)=x1x2x3x4/link=glogitaggregatescale=none;run;proclogistic;classx3;mode

12、ly(ref=3)=x1x2x4/link=glogitaggregatescale=none;run;proclogistic;classx3;modely(ref=1)=x1x2x4/link=glogitaggregatescale=none;run;六.收获与思考七.思考题当自变量是定性变量的时候,我们需要引进虚拟变量进行数量化,当定性变量有n个水平的时候,我们该引进多少的虚拟变量,否则会怎样?不妨试试在sas中试试会出现什么问题。答:当定性变量有n个水平时应该引进n-1个虚拟变量。否则最后一个虚拟变量无法用最小二乘估计计算出来。例:X1-X3为虚拟变量。Dataa;inputx1x2

13、x3xy;cards;|1001.26751001.35771001.40781001.58820101.71650101.76660101.80680101.85700011.22680011.35690011.46700011.4472Jprocregdata=a;modely=x1-x3x;run;参数估计参数估计变量变量自由度自由度估计估计准差标误t 值值PfItlirtercepiB42149394433789510001xlB764450D.7299B10470001x2B -10825W151276-7.1540001x3QQ-*X120103263220556.27。iyXI公

14、司类型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份表 22X3没有参数估计结果。因为表 21x1x2x3出现完全共线性,x1x2均为0时即代表了x31.序号h(m)y序号h(m)y11.500141.76121.520151.78031.540161.80141.560171.82051.581181.84061

15、.600191.86171.620201.88181.640211.90091.660221.921101.681231.940111.700241.961121.720251.981131.740262.001表 23J丁p专业课X1英语X2性别X3月生活费X4毕业去向y19565.01600226362.00850138253.00700246088.00850357265.01750168585.001000379595.001200289292.01950296363.008501107875.019001119078.005001128283.017502138065.018503148375.006002156090.006503167590.018002176383.017001188575.007502197386.009502208666.0115003219363.0013002227372.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论