第十七章多因素回归分析简介资料_第1页
第十七章多因素回归分析简介资料_第2页
第十七章多因素回归分析简介资料_第3页
第十七章多因素回归分析简介资料_第4页
第十七章多因素回归分析简介资料_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十七章多因素回归分析的Stata实现本章使用的 Stata 命令:多因素回归regress depvar in depvars逐步回归stepwise , opti ons : comma ndLogistic回归logistic depvar in depvars weight生存时间数据设定stset timevar weight , failure(failvar=nu mlist)Cox回归stcox varlist例 17-4 某研究者为了研究某种避孕药对人体血糖的影响,分别在正在使 用这种避孕药的人群、6 个月前曾经使用过这种避孕药的人群、从未使用过避孕 药的人群中各随机抽取 6

2、 人。考虑到血糖可能与年龄有关,所以该研究者不仅测 定了这 18 位对象的血糖,而且也记录了这 18 位对象的年龄,具体资料见表 17 4。请根据研究问题作统计分析。表 17-4 三种避孕药使用情况下的年龄(X,岁)与血糖水平(Y , mg%)现服药者曾服药者从未服药者XYXYXY201202412628135211222613032137231242713234138231262913135137241252913435139241273013637144本研究的问题是比较三种用药情况下的血糖平均水平是否不同,因此首先考虑以下总体均数的情况。解:Stata 数据如下:xyg1g2201200

3、121122012312401231260124125012412701241261026130102713210291311029134103013610281350032137003413800351370035139003714400Stata 命令如下:reg y x g1 g2结果:Source |+SSdfMSNumber of obs =18F( 314) = 83.88F(3,Model | 717.6845573 239.228186Prob F=0.0000Residual | 39.926553714 2.85189669R-squared=0.9473+Adj R-cq

4、uared一0 9360Total | 757.61111117 44.5653595Root MSE=1.6888y | Coef. Std. Err. t P|t|95% Conf. Interval+-x | 1.067797 . 17951275.95 0.000.68278011.452813g1 | -.42655371.452834-0.29 0.773-3.5425722.689465g2 |-2.5875712.202234-1.17 0.260-7.3108932.135752cons | 102.56216.05306716.94 0.00089.57961115.544

5、7g1 代表曾服药者和未服药者的比较,p=0.773,说明曾服药者和未服药者血 糖平均水平没有差别。g2 代表现服药者和未服药者的比较,p=0.260,说明现服 药者和未服药者血糖平均水平没有差别。接着比较曾服药者和现服药者:test g1= g2结果:(1) g1 - g2 = 0F( 1,14)=2.66Prob F =0.1252P=0.1252,曾服药者和现服药者血糖平均水平没有差别例 17-5 为了研究影响肥胖者瘦素(Leptin )的主要危险因素,某研究者调 查了某医院肥胖门诊的 500 名肥胖就诊者的瘦素、年龄、体重指数、总胆固醇、甘油三酯、是否患糖尿病、是否患高血压、饮食、运动

6、、服药情况等,并用逐步 线性回归模型分析影响瘦素的主要因素。为了简化问题,仅取自变量为年龄(Xi,岁)、体重指数(X2, kg/m2)、总胆固醇(X3, mmol/L)、是否患糖尿病(X4,患糖尿病为 1,不患糖尿病为 0)和是否患高血压(X5,患高血压为 1,不患高血压 为 0),应变量为瘦素(丫,ng/ml)。为了说明的方便,这里仅从 500 名肥胖就诊 者中随机取30 例,具体数据如表 17-11 所示,试用逐步线性回归分析寻找主要 的影响因素。表 17-11 例 17-5 的数据X1X2X3X4X5YX1X2X3X4X5YX1X2X3X4X5Y6331.0 14.1 0010.4392

7、9.06.8 018.56029.5 13.0 019.14327.78.5106.56631.1 15.3 0010.45828.814.2 109.45127.6 11.8 119.34329.57.3 008.23428.15.5 115.35730.7 12.9 1011.16329.7 15.5 008.43228.94.5 005.14927.98.8 007.14928.910.1 006.56027.9 12.4 119.73829.56.2 016.74428.78.6 008.95530.712.8 1110.35728.511.6 018.63928.36.8 005.6

8、5230.79.9 1110.33426.85.3 003.05430.5 11.3 019.45126.9 10.9 009.14429.39.0 006.95329.1 11.2 007.13025.84.9 113.86229.5 14.7 1011.45428.3 12.8 008.16030.3 12.9 1111.8Stata 数据如下:X1X2X3X4X5丫633114.10010.44327.78.5106.55127.611.8119.35730.712.91011.14927.98.8007.13829.56.2016.75728.511.6018.63426.85.300

9、34429.39006.96229.514.71011.439296.8018.56631.115.30010.44329.57.3008.26329.715.5008.44928.910.1006.54428.78.6008.93928.36.8005.65430.511.3019.45329.111.2007.15428.312.8008.16029.513019.15828.814.2109.43428.15.5115.33228.94.5005.16027.912.4119.75530.712.81110.35230.79.91110.35126.910.9009.13025.84.9

10、113.86030.312.91111.8Stata 命令:stepwise, pr(0.15): reg y x1 x2 x3 x4 x5结果:beg in with full modelp = 0.7123 = 0.1500 removi ng x3p = 0.3424 = 0.1500 removi ng x5Source |SSdfMSNumber of obs =30+F( 326) = 35.37F(Model | 114.1954793 38.0651597Prob F=0.0000Residual |27.984520426 1.07632771R-squared=0.8032

11、+Adj R.squared 0 7805Total | 142.17999929 4.9027586Root MSE=1.0375y | Coef. Std. Err. t P|t|95% Co nf. I ntervalx1 |.1348869 .02308935.840.000.0874261.1823477x2 |.5445848 .17951913.030.005.1755789135916x4 |1.044741 .39815862.620.014.22631431.863168_cons | -14.67888 4.653129-3.15 0.004-24.24352 -5.11

12、4233最后的回归方程为 =14.679 0.135X,0.545X21.045X4可以认为年龄 Xi,体重指数 X2和患糖尿病 X4是影响瘦素的主要因素,年龄 Xi增大 1岁,估计瘦素平均升高 0.135 ng/ml;体重指数增大 1 个单位,估计瘦 素平均升高 0.545ng/ml;患糖尿病患者的瘦素比非糖尿病患者平均升高1.045ng/ml,这些自变量均有统计学意义。例 17-6 为了研究荨麻疹史(1 为有,0 为无)及性别(1 为男,0 为女)是 否对慢性气管炎(1 为病例,0 为对照)有影响,某病例对照研究的研究结果见 表 17-13 所示,试用 logistic 回归进行统计分析。

13、表 17-13 慢性气管炎的影响因素荨麻疹史X1性别X2慢性气管炎丫频数f000990019001015301113810011101201101511130Stata数据为:x1x2yf000990019001015301113810011101201101511130Stata 命令为:logistic y x1 x2 weight=f结果为:Logistic regressi onNumber of obs =556LR chi2(2)=8.91Prob chi2 =0.0116Log likelihood = -380.93403Pseudo R2 =0.0116y | Odds Ra

14、tio-kStd. Err. z P|z|95% Con f. I ntervalx1 | 2.125665 .54948482.920.0041.2807343.528016x2 | 1.005203 .17577220.030.976.71352781.41611说明性别不是慢性气管炎的危险因素,而荨麻疹史是慢性气管炎的危险因素,OR=2.125。例 17-7 某研究者对经某医院手术治疗的 30 例癌症患者进行了为期 5 年的临床随访观察,收集了每一患者的性别(X1=1 为男性,X1=0 为女性)、年龄(X2,岁)、从癌症确诊日期到手术日期的等候时间(X3,月)、从癌症确诊到研 究结束的时

15、间(即生存时间 t,月),采用变量丫指示研究结束时每一手术患者的 生存情况(丫=1 为死亡,丫=0 为截尾)。具体数据见表 17-16 所示。试分析性别、 年龄、手术等待时间是否为死亡的危险因素。表 17-16 30 例癌症患者手术后生存时间分析NotYX1X2X3NotYX1X2X3NotYX1X2X3161066231131105810211611568271067211241105392219115893810631613440056823221154104111066101454115262429116075151065151559104892535115576121059101681

16、1661926441155671510621217101165182745115188181064918151162222856015559201058819121164162958115061026105672014115515306001573Stata 数据为:NotYX1X2X3161066232710672138106316411106610515106515612105910715106212818106499201058810261056711311058101241105391344005681454115261559104891681166191710116518181511

17、6222191211641620141155152116115682219115892322115410242911607253511557264411556274511518285601555295811506306001573Stata 命令为:stset t,failure( y=1)stcox x1 x2 x3结果:Cox regressi on - Breslow method for tiesNo. of subjects =30Number of obs =30No. of failures =27Time at risk =810LR chi2(3)=39.31Log likelihood =-51.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论