第十七章多因素回归分析的Stata实现_第1页
第十七章多因素回归分析的Stata实现_第2页
第十七章多因素回归分析的Stata实现_第3页
第十七章多因素回归分析的Stata实现_第4页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十七章多因素回归分析的Stata 实现本章使用的 Stata命令:多因素回归逐步回归Logistic 回归生存时间数据设定Cox 回归regress depvar indepvarsstepwise , options : commandlogistic depvar indepvars weightstset timevar weight , failure(failvar=numlist)stcox varlist例 17-4 某研究者为了研究某种避孕药对人体血糖的影响,分别在正在使用这种避孕药的人群、 6 个月前曾经使用过这种避孕药的人群、从未使用过避孕药的人群中各随机抽取 6 人。考

2、虑到血糖可能与年龄有关, 所以该研究者不仅测定了这 18 位对象的血糖,而且也记录了这18 位对象的年龄,具体资料见表 17 4。请根据研究问题作统计分析。表 17-4三种避孕药使用情况下的年龄(X ,岁)与血糖水平 ( Y ,mg)现服药者曾服药者从未服药者XYXYXY201202412628135211222613032137231242713234138231262913135137241252913435139241273013637144本研究的问题是比较三种用药情况下的血糖平均水平是否不同,因此首先考虑以下总体均数的情况。解: Stata 数据如下:xyg1g22012001211

3、22012312401231260124125012412701241261026130102713210291311029134103013610281350032137003413800351370035139003714400Stata命令如下:reg y x g1 g2结果:Source |SSdfMSNumber of obs =18-+-F(3,14) = 83.88Model | 717.6845573 239.228186Prob > F= 0.0000Residual | 39.926553714 2.85189669R-squared= 0.9473-+-Adj R-

4、squared = 0.9360Total | 757.61111117 44.5653595Root MSE= 1.6888-y |Coef. Std. Err. tP>|t|95% Conf. Interval-+-x |1.067797.17951275.95 0.000.68278011.452813g1 |-.42655371.452834-0.290.773-3.5425722.689465g2 |-2.5875712.202234-1.170.260-7.3108932.135752_cons |102.5621 6.05306716.940.00089.57961115.

5、5447-g1 代表曾服药者和未服药者的比较,p=0.773,说明曾服药者和未服药者血糖平均水平没有差别。 g2 代表现服药者和未服药者的比较,p=0.260,说明现服药者和未服药者血糖平均水平没有差别。接着比较曾服药者和现服药者:testg1= g2结果:( 1)g1 - g2 = 0F( 1,14) =2.66Prob > F =0.1252P=0.1252,曾服药者和现服药者血糖平均水平没有差别。例 17-5 为了研究影响肥胖者瘦素( Leptin )的主要危险因素,某研究者调查了某医院肥胖门诊的 500 名肥胖就诊者的瘦素、年龄、体重指数、总胆固醇、甘油三酯、是否患糖尿病、是否患

6、高血压、饮食、运动、服药情况等,并用逐步线性回归模型分析影响瘦素的主要因素。 为了简化问题,仅取自变量为年龄 ( X1,岁)、体重指数 (X2,kg/m2)、总胆固醇 (X3,mmol/L) 、是否患糖尿病( X4,患糖尿病为 1,不患糖尿病为 0)和是否患高血压( X5,患高血压为 1,不患高血压为 0),应变量为瘦素( Y, ng/ml)。为了说明的方便,这里仅从 500 名肥胖就诊者中随机取 30 例,具体数据如表 17-11 所示,试用逐步线性回归分析寻找主要的影响因素。表 17-11 例 17-5 的数据X1X2X3X4XX1X2X 3X4XYX 1X 2X3X4XYY5556331

7、.014.10010.43929.06.8018.56029.513.0019.14327.78.5106.56631.115.30010.45828.814.2109.45127.611.8119.34329.57.3008.23428.15.5115.35730.712.91011.16329.715.5008.43228.94.5005.14927.98.8007.14928.910.1006.56027.912.4119.73829.56.2016.74428.78.6008.95530.712.81110.35728.511.6018.63928.36.8005.65230.79.9

8、1110.33426.85.3003.05430.511.3019.45126.910.9009.14429.39.0006.95329.111.2007.13025.84.9113.86229.514.71011.45428.312.8008.16030.312.91111.8Stata数据如下:X1X2X3X4X5Y633114.10010.44327.78.5106.55127.611.8119.35730.712.91011.14927.98.8007.13829.56.2016.75728.511.6018.63426.85.30034429.39006.96229.514.7101

9、1.439296.8018.56631.115.30010.44329.57.3008.26329.715.5008.44928.910.1006.54428.78.6008.93928.36.8005.65430.511.3019.45329.111.2007.15428.312.8008.16029.513019.15828.814.2109.43428.15.5115.33228.94.5005.16027.912.4119.75530.712.81110.35230.79.91110.35126.910.9009.13025.84.9113.86030.312.91111.8Stata

10、命令:stepwise, pr(0.15): reg y x1 x2 x3 x4 x5结果:begin with full modelp = 0.7123 >= 0.1500 removing x3p = 0.3424 >= 0.1500 removing x5Source |SSdfMSNumber of obs =30-+-F(3,26) = 35.37Model | 114.1954793 38.0651597Prob > F= 0.0000Residual | 27.984520426 1.07632771R-squared= 0.8032-+-Adj R-squar

11、ed = 0.7805Total | 142.179999294.9027586Root MSE= 1.0375-y |Coef. Std. Err.tP>|t|95% Conf. Interval-+-x1 |.1348869.02308935.840.000.0874261.1823477x2 |.5445848.17951913.030.005.175578.9135916x4 |1.044741.39815862.620.014.22631431.863168_cons |-14.678884.653129-3.150.004 -24.24352 -5.114233-最后的回归方

12、程为?Y14.6790.135X10.545X 21.045X 4可以认为年龄 X1,体重指数 X2 和患糖尿病 X4 是影响瘦素的主要因素,年龄 X1 增大 1 岁,估计瘦素平均升高 0.135 ng/ml;体重指数增大 1 个单位,估计瘦素平均升高 0.545 ng/ml;患糖尿病患者的瘦素比非糖尿病患者平均升高 1.045 ng/ml,这些自变量均有统计学意义。例 17-6 为了研究荨麻疹史( 1 为有, 0 为无)及性别( 1 为男,0 为女)是否对慢性气管炎( 1 为病例, 0 为对照)有影响,某病例对照研究的研究结果见表 17-13 所示,试用 logistic 回归进行统计分析。

13、表 17-13 慢性气管炎的影响因素荨麻疹史 X1性别 X2慢性气管炎 Y频数 f000990019001015301113810011101201101511130Stata 数据为:x1x2yf000990019001015301113810011101201101511130Stata命令为:logistic y x1 x2 weight=f结果为:Logistic regressionNumber of obs=556LR chi2(2)=8.91Prob > chi2=0.0116Log likelihood = -380.93403Pseudo R2=0.0116-y | O

14、dds Ratio Std. Err.z P>|z|95% Conf. Interval-+-x1 |2.125665.54948482.920.0041.2807343.528016x2 |1.005203.17577220.030.976.71352781.41611-说明性别不是慢性气管炎的危险因素,而荨麻疹史是慢性气管炎的危险因素, OR=2.125。例 17-7某研究者对经某医院手术治疗的30 例癌症患者进行了为期5年的临床随访观察,收集了每一患者的性别(X1=1 为男性, X1=0 为女性)、年龄( X2,岁)、从癌症确诊日期到手术日期的等候时间( X3,月)、从癌症确诊到研

15、究结束的时间 (即生存时间 t,月),采用变量 Y 指示研究结束时每一手术患者的生存情况( Y=1 为死亡, Y=0 为截尾)。具体数据见表 17-16 所示。试分析性别、年龄、手术等待时间是否为死亡的危险因素。表 17-1630 例癌症患者手术后生存时间分析No t Y X1X2X3NotY X1X2X3NotY X1X2X3161066231131105810211611568271067211241105392219115893810631613440056823221154104111066101454115262429116075151065151559104892535115576

16、1210591016811661926441155671510621217101165182745115188181064918151162222856015559201058819121164162958115061026105672014115515306001573Stata数据为:NotYX1X2X31610662327106721381063164111066105151065156121059107151062128181064992010588102610567113110581012411053913440056814541152615591048916811661917101

17、165181815116222191211641620141155152116115682219115892322115410242911607253511557264411556274511518285601555295811506306001573Stata命令为:stsett,failure( y=1)stcox x1 x2 x3结果:Cox regression -Breslow method for tiesNo. of subjects =30Number of obs=30No. of failures =27Time at risk=810LR chi2(3)= 39.31Log likelihood =-51.89934Prob >

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论