第十七章多因素回归分析简介_第1页
第十七章多因素回归分析简介_第2页
第十七章多因素回归分析简介_第3页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十七章多因素回归分析的Stata 实现本章使用的 Stata命令:多因素回归逐步回归Logistic 回归生存时间数据设定Cox 回归regressdepvar indepvarsstepwise , options : commandlogistic depvar indepvars weightstset timevar weight , failure(failvar=numlist) stcox varlist例 17-4 某研究者为了研究某种避孕药对人体血糖的影响,分别在正在使用这种避孕药的人群、 6 个月前曾经使用过这种避孕药的人群、从未使用过避孕药的人群中各随机抽取 6 人。考

2、虑到血糖可能与年龄有关,所以该研究者不仅测定了这 18 位对象的血糖,而且也记录了这 18 位对象的年龄,具体资料见表 174。请根据研究问题作统计分析。表 1 7-4 三种避孕药使用情况下的年龄(X ,岁)与血糖水平 (Y,mg)现服药者曾服药者从未服药者XYXYXY201202412628135211222613032137231242713234138231262913135137241252913435139241273013637144本研究的问题是比较三种用药情况下的血糖平均水平是否不同,因此首先考虑以下总体均数的情况。解: Stata数据如下:xyg1g2201200121122

3、012312401231260124125012412701241261026130102713210291311029134103013610281350032137003413800351370035139003714400Stata命令如下:reg y x g1 g2结果:Source|SSdfMSNumber ofobs =18-+-F(3,14)=83.88Model|717.6845573239.228186Prob F=0.0000Residual|39.9265537142.85189669R-squared=0.9473-+-AdjR-squared=0.9360Total|

4、757.6111111744.5653595RootMSE=1.6888-y|Coef.Std.Err.tP|t|95% Conf.Interval-+-x|1.067797.17951275.950.000.68278011.452813g1|-.42655371.452834-0.290.773-3.5425722.689465g2|-2.5875712.202234-1.170.260-7.3108932.135752_cons|102.56216.05306716.940.00089.57961115.5447-g1 代表曾服药者和未服药者的比较, p=0.773,说明曾服药者和未服药

5、者血糖平均水平没有差别。 g2 代表现服药者和未服药者的比较, p=0.260,说明现服药者和未服药者血糖平均水平没有差别。接着比较曾服药者和现服药者:testg1= g2结果:( 1)g1 - g2 = 0F( 1,14) =2.66Prob F =0.1252P=0.1252,曾服药者和现服药者血糖平均水平没有差别。例 17-5 为了研究影响肥胖者瘦素( Leptin)的主要危险因素,某研究者调查了某医院肥胖门诊的 500 名肥胖就诊者的瘦素、年龄、体重指数、总胆固醇、甘油三酯、是否患糖尿病、是否患高血压、饮食、运动、服药情况等,并用逐步线性回归模型分析影响瘦素的主要因素。为了简化问题,仅

6、取自变量为年龄( X1,岁)、体重指数(X2,kg/m2)、总胆固醇 (X3,mmol/L) 、是否患糖尿病( X4,患糖尿病为 1,不患糖尿病为 0)和是否患高血压( X5,患高血压为 1,不患高血压为 0),应变量为瘦素(Y,ng/ml)。为了说明的方便,这里仅从 500名肥胖就诊者中随机取30 例,具体数据如表17-11 所示,试用逐步线性回归分析寻找主要的影响因素。表 17-11 例 17-5 的数据X1X2X3X4X5 YX1X2X3X4X5 YX1X2X3X4X5 Y6331.014.10010.43929.06.8018.56029.513.0019.14327.78.5106.

7、56631.115.30010.45828.814.2109.45127.611.8119.34329.57.3008.23428.15.5115.35730.712.91011.16329.715.5008.43228.94.5005.14927.98.8007.14928.910.1006.56027.912.4119.73829.56.2016.74428.78.6008.95530.712.81110.35728.511.6018.63928.36.8005.65230.79.91110.33426.85.3003.05430.511.3019.45126.910.9009.14429

8、.39.0006.95329.111.2007.13025.84.9113.86229.514.71011.45428.312.8008.16030.312.91111.8Stata数据如下:X1X2X3X4X5Y633114.10010.44327.78.5106.55127.611.8119.35730.712.91011.14927.98.8007.13829.56.2016.75728.511.6018.63426.85.30034429.39006.96229.514.71011.439296.8018.56631.115.30010.44329.57.3008.26329.715.

9、5008.44928.910.1006.54428.78.6008.93928.36.8005.65430.511.3019.45329.111.2007.15428.312.8008.16029.513019.15828.814.2109.43428.15.5115.33228.94.5005.16027.912.4119.75530.712.81110.35230.79.91110.35126.910.9009.13025.84.9113.86030.312.91111.8Stata命令:stepwise,pr(0.15): reg y x1 x2 x3 x4 x5结果:beginwith

10、fullmodelp =0.7123= 0.1500removingx3p =0.3424= 0.1500removingx5Source|SSdfMSNumber ofobs =30-+-F(3,26)=35.37Model|114.195479338.0651597Prob F=0.0000Residual|27.9845204261.07632771R-squared=0.8032-+-AdjR-squared=0.7805Total|142.179999294.9027586RootMSE=1.0375-y|Coef.Std.Err.tP|t|95% Conf.Interval-+-x

11、1|.1348869.02308935.840.000.0874261.1823477x2|.5445848.17951913.030.005.175578.9135916x4|1.044741.39815862.620.014.22631431.863168_cons|-14.678884.653129-3.150.004-24.24352-5.114233-最后的回归方程为?14.6790.135X10.545X21.045X4Y可以认为年龄 X1,体重指数 X2 和患糖尿病 X4 是影响瘦素的主要因素,年龄X1 增大 1 岁,估计瘦素平均升高0.135 ng/ml;体重指数增大 1 个单

12、位,估计瘦素平均升高 0.545 ng/ml;患糖尿病患者的瘦素比非糖尿病患者平均升高 1.045 ng/ml,这些自变量均有统计学意义。例 17-6 为了研究荨麻疹史( 1 为有, 0 为无)及性别( 1 为男, 0 为女)是否对慢性气管炎( 1 为病例, 0 为对照)有影响,某病例对照研究的研究结果见表 17-13 所示,试用 logistic 回归进行统计分析。表 17-13 慢性气管炎的影响因素荨麻疹史 X1性别 X2慢性气管炎 Y频数 f000990019001015301113810011101201101511130Stata 数据为:x1x2yf0009900190010153

13、01113810011101201101511130Stata命令为:logistic y x1 x2 weight=f结果为:Logistic regressionNumber of obs=556LR chi2(2)=8.91Prob chi2=0.0116Log likelihood= -380.93403Pseudo R2=0.0116-y |Odds RatioStd. Err.zP|z|95%Conf.Interval-+-x1|2.125665.54948482.920.0041.2807343.528016x2|1.005203.17577220.030.976.7135278

14、1.41611-说明性别不是慢性气管炎的危险因素,而荨麻疹史是慢性气管炎的危险因素, OR=2.125。例 17-7 某研究者对经某医院手术治疗的 30 例癌症患者进行了为期 5 年的临床随访观察,收集了每一患者的性别( X1=1 为男性, X1=0 为女性)、年龄( X2,岁)、从癌症确诊日期到手术日期的等候时间( X3,月)、从癌症确诊到研究结束的时间(即生存时间 t,月),采用变量 Y 指示研究结束时每一手术患者的生存情况( Y=1 为死亡, Y=0 为截尾)。具体数据见表 17-16 所示。试分析性别、年龄、手术等待时间是否为死亡的危险因素。表 17-1630 例癌症患者手术后生存时间

15、分析No t Y XXXNotY XXXNotY XXX12312312316106623113110581021161156827106721124110539221911589381063161344005682322115410411106610145411526242911607515106515155910489253511557612105910168116619264411556715106212171011651827451151881810649181511622228560155592010588191211641629581150610261056720141155153

16、06001573Stata数据为:NotYX1X2X31610662327106721381063164111066105151065156121059107151062128181064992010588102610567113110581012411053913440056814541152615591048916811661917101165181815116222191211641620141155152116115682219115892322115410242911607253511557264411556274511518285601555295811506306001573Stata命令为:stsett,failure( y=1)stcoxx1 x2 x3结果:Coxregression-BreslowmethodfortiesNo.ofsubjects=30Number of obs=30No.offailures=27Timeatrisk=810LR chi2(3)=39.31Loglikelihood=-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论