版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医用SAS统计分析第五(dìwǔ)讲3/2/20231第一页,共七十五页。
一、多元线性回归
基本概念
多元线性回归简称多元回归,是研究一个应变量与多个自变量间线性依存关系数量(shùliàng)变化规律的一种方法。
多元线性回归方程式中:b0为回归方程常数项,bj(j=1,2,┅,m)为偏回归系数,即在其他自变量固定的条件下,Xj改变(gǎibiàn)一个单位时应变量的改变(gǎibiàn)量。
3/2/20232第二页,共七十五页。多元线性回归方程的应用
预测应变量的估计值
探索影响(yǐngxiǎng)应变量y的主要因素当X为某一定值时,估计应变量y的容许区间当X为某一定值时,估计其应变量的总体均数的置信区间3/2/20233第三页,共七十五页。语句格式
同单变量线性回归基本相同。procreg[选项];model应变量=自变量名列/[选项];必选语句,定义回归分析模型procreg语句的[选项]data=数据集指明回归分析(fēnxī)所用的数据集。
outset=数据集指定一个输出数据集,用以存储回归分析所得的参数估计。
simple输出每个变量的简单统计结果。3/2/20234第四页,共七十五页。model语句的[选项]selection=method规定变量筛选方法,method可以是以下几种选项:
forward(或f)前进法,按照sle规定的P值从无到有依次选一个变量进入模型
backward(或b)后退法,按照sls规定的P值从含有全部变量的模型开始,以次剔除一个变量。
stepwise逐步(zhúbù)法,按照sle的标准依次选入变量,同时对模型中现有的变量按sls的标准剔除不显著的变量。注:[选项]中没有selection语句时,模型中含有全部自变量的回归模型。
sle=概率值入选标准,规定变量入选模型的显著性水平,前进法默认为0.5,逐步法默认为0.15。
sls=概率值剔除标准,指定变量保留在模型的显著性水平,后退法默认为0.1,逐步法默认为0.15。3/2/20235第五页,共七十五页。
stb
输出各自变量的标准偏回归系数。
cli输出个体y值的95%容许区间上下限
clm
输出预测值均值的95%可信区间上下限。
P输出实际(shíjì)值Yi,预测值、残差及其标准误。
tol
输出各自变量的容许值。0≤tol值≤1,越接近于0,共线性越严重。
vif输出各自变量的方差膨胀因子。当vif≥10时,可认为多元共线性严重存在。
collin要求详细分析自变量之间的共线性,给出信息矩阵的特征根、条件指数和方差比,当条件指数≥10,方差比>0.5时,可认为存在多元共线性。
collinoint
与选择项collin作用相同,但不包括回归常数。
R
进行预测值的残差分析(即异常值识别与强影响分析),输出学生化残差值和Cook’s距离D值。当学生化残差值>2时,所对应的点可能是异常点,当D值>0.5时,可认为对应的变量值对回归函数是强影响点。3/2/20236第六页,共七十五页。
完全多元线性回归
例7-710名女中学生的体重(tǐzhòng)(X1,kg),胸围(X2,cm),胸围的呼吸差(X3,cm)及肺活量(Y,ml)的资料如下表所示。现作应变量Y对自变量X1,X2,X3的三元线性回归方程。datamreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1x2x3/stb;run;3/2/20237第七页,共七十五页。Model:MODEL1DependentVariable:YAnalysisofVarianceSumofMeanSourceDFSquaresSquareFValueProb>FModel31250109.0678416703.022595.6170.0355Error6445140.9322274190.15537CTotal91695250RootMSE272.37870R-square0.7374DepMean2315.00000AdjR-sq0.6061C.V.11.76582
3/2/20238第八页,共七十五页。ParameterEstimatesParameterStandardTforH0:VariableDFEstimateErrorParameter=0Prob>|T|INTERCEP1-3035.5363542168.6738473-1.4000.2111X1160.93182336.297137981.6790.1442X2137.80833422.980808911.6450.1510X31101.379460121.974703100.8310.4377StandardizedVariableEstimateINTERCEP0.00000000X10.46445689X20.39174762X30.253994503/2/20239第九页,共七十五页。
逐步回归
简介
逐步回归是筛选自变量的常用的方法之一。筛选自变量的方法还有前进法,后退法和最优回归子集法。逐步回归法是依据事先给定的两个显著性水平SLE和SLS,将自变量逐个引入方程,同时每引入一个新变量后,对已选入的变量要进行逐个检验,将不显著的变量剔除,这样保证最后所得的变量都有显著性。自变量间的多重共线性(multicollinearity)
整个回归方程的统计检验P<α,而各偏回归系数的检验均出现(chūxiàn)P>α的矛盾现象。偏回归系数的估计值明显与实际情况不符,或者是偏回归系数的符号与专业知识的情况相反。3/2/202310第十页,共七十五页。据专业知识,该自变量与应变量间关系密切,而偏回归系数检验结果P>α。增加(或删除)一个变量,或者改变(或去除)一个观察值,引起回归系数估计值发生大的变化。多重共线性是引起上述问题的重要原因。解决(jiějué)多重共线性的办法
用主成分估计等有偏估计替代最小二乘估计。用逐步回归等方法筛选自变量。如上例7-7,整个回归模型P=0.0355,而b0,b1,b2,b3P值均大于0.05。估计变量之间存在共线性问题。3/2/202311第十一页,共七十五页。程序(chéngxù)7-13datastepreg1;inputx1x2x3y@@;cards;35690.7160040742.5260040642.0210042743.0265037721.1240045681.5220043784.3275037662.0160044703.2275042653.02500;procreg;modely=x1-x3/stbtolvifcollincollinointR;modely=x1-x3/selection=stepwisesle=0.25sls=0.25stb;run;3/2/202312第十二页,共七十五页。
例(《医学统计学》王洁贞主编,例15.1)
某科研协作组调查某煤矿Ⅱ期高血压病患者40例,X1为工作面污染程度等级,X2为井下工龄(年),X3为体重(kg),X4为吸烟年限(niánxiàn)(年),X5为饮酒年限(niánxiàn)(年),Y为收缩压(kPa),试作多元线性回归分析。datastepreg2;infile'd:\sas\sas5\wang15_1.txt';inputidx1x2x3x4x5y@@;procreg;modely=x1-x5/stbtolvifcollincollinointr;modely=x1-x5/selection=stepwisesle=0.05sls=0.05stb;run;3/2/202313第十三页,共七十五页。
二、多元线性相关
研究多个变量间线性关系的一种统计分析方法。变量间相关系数有以下三类:
简单相关系数它是说明(shuōmíng)两个变量相关程度和方向(不考虑其他变量的影响)的统计指标(ri,j)。
偏相关系数它是当其他变量固定时,说明某两个变量间相关程度和方向的统计指标(如r12,3)。
复相关系数R亦称为全相关系数。说明应变量与各自变量的线性关系的密切程度。
决定系数R2复相关系数的平方。它说明应变量的变异中由各自变量的改变而引起的占多少。如R2=0.8,则说明应变量的变异中有80%由自变量的改变而引起的。3/2/202314第十四页,共七十五页。
程序7-12datamcorr1;infile'd:\sas\sas5\mcorr1.txt';inputx1x2x3y@@;proccorrnosimple;/*禁止一些简单统计量的输出*/varx1x2x3y;/*包括(bāokuò)了所有变量,实际可以省略*/proccorrnosimple;varx1x2;partialx3;/*partial语句的作用是固定x3*/proccorrnosimple;varx1x2;partialx3y;/*partial语句的作用是固定x3和y*/run;3/2/202315第十五页,共七十五页。
三、Logistic回归分析
简介
Logistic回归模型是适用(shìyòng)于应变量(因变量)为分类变量的回归分析。当应变量为分类变量时,如应变量结果为二分类变量的发病、不发病,生存、死亡等,是不能用多元线性回归模型(Y=β0+Σβixi)来分析各种危险因素与应变量之间的关系的。因为应变量Y只能取值为1和0。不符合线性回归模型中应变量Y应具有正态分布和方差齐性的要求,同时线性回归模型得到的Y值会出现大于1或小于0的不合理结果,显然不能用线性回归建立预测模型。
以发病为例,发病的概率为P,不发病的概率为1-P,0≤P≤1。公式(gōngshì)等号左边简称为logit(P),即logit(P)=β0+Σβixi可证明(zhèngmíng),无论Y得何值,均0<P<1。上式可推导为:3/2/202316第十六页,共七十五页。
Logistic回归的应用
logistic回归在流行病学和临床流行病学等方面应用广泛,既可用于前瞻性的队列研究,又可用于回顾性的病例(bìnglì)对照研究。常用于:病因学分析(fēnxī);预后(yùhòu)分析;鉴别诊断;评价治疗措施;毒物的半数效量和联合作用3/2/202317第十七页,共七十五页。Logistic回归的分类
按应变量的类型分类为:
两分类的Logistic回归
非条件logistic回归
即研究对象未经过配对(pèiduì)。(在SAS中调用logistic模块进行统计)。
条件logistic回归
即在配对病例对照研究中的1:1和1:M及N:M配对。(在SAS中调用Phreg模块进行统计)。
多分类有序反应变量的Logistic回归(在SAS中调用logistic模块进行统计)。多分类无序反应变量的Logistic回归(在SAS中调用Catmod模块进行统计)。本讲主要介绍两分类Logistic回归
3/2/202318第十八页,共七十五页。
两分类(fēnlèi)非条件Logistic回归
语法格式
Proclogistic[data=数据集][选项];model应变量名=自变量名列/[选项];[freq<变量名>];可选项,指明频数变量。output<out=数据集><pred|p=变量名>;
output语句创建一个新的SAS数据集,其含有每个个体的原始数据,pred|p=变量名为在out=数据集中含有每个个体预测概率。【Proc语句的[选项]】
order=data规定按照数据集中反应变量水平出现的先后顺序进行运算。
descending(或des)规定按照反应变量降序水平进行运算。3/2/202319第十九页,共七十五页。
注意:以上两个选项非常重要,如死亡为1,存活为0,为了得到死亡对存活的概率(或者说是死亡的危险),应选择(xuǎnzé)此两个选项之一,否则得到的是存活对死亡的概率,因为logistic回归模型是自动按反应变量值为小的来拟合方程的。反之,如果死亡为0,存活为1,可不选此两项之一,【model语句的[选项]】
selection=forward(或f)|backward(或b)|stepwise(或s)|score规定变量的筛选方法,分别为向前、向后、逐步和最优子集法。缺省时为none,拟合全回归模型。
sle=概率值指定变量进人模型的显著水平,缺省为0.05。
sls=概率值指定变量剔除模型的显著水平,缺省为0.05。
CL计算输出所有回归参数的可信区间。3/2/202320第二十页,共七十五页。clodds=pl计算输出OR的可信区间。
scale=noneaggregate要求对模型进行拟合优度检验。
例9-4
40例病人的治愈情况Y(Y=0表示(biǎoshì)未愈,Y=1表示(biǎoshì)治愈,病情严重程度X1(X1=0表示(biǎoshì)不严重,X1=1表示(biǎoshì)严重),年龄X2为连续变量,治疗方法X3(X3=0表示(biǎoshì)新方法,X3=1表示(biǎoshì)一般疗法),数据如表9.6,试作logistic回归分析。程序9-4datac;infile'd:\sas\sas5\cx9_4.txt';inputyx1-x3;proclogisticdes;/*按降序水平进行运算*/modely=x1-x3/scale=noneaggregate;/*对模型进行拟合优度检验*/Outputout=bp=pr;/*在数据集b中含有每个个体的预测概率值*/
run;3/2/202321第二十一页,共七十五页。
TheLOGISTICProcedureDataSet:WORK.C数据集名ResponseVariable:Y反应变量YResponseLevels:2反应变量水平数2NumberofObservations:40观察值40LinkFunction:Logit联系(liánxì)函数logit
ResponseProfile反应变量的描述Ordered顺序值ValueYCount计数值11172023
3/2/202322第二十二页,共七十五页。
DevianceandPearsonGoodness-of-FitStatistics
模型(móxíng)的拟合优度检验Pr>CriterionDFValueValue/DFChi-SquareDeviance3136.32311.17170.2344Pearson3129.55830.95350.5402ModelFittingInformationandTestingGlobalNullHypothesisBETA=0
模型拟合信息和整体偏回归系数为0的假设检验InterceptInterceptandCriterionOnlyCovariatesChi-SquareforCovariates判断的准则仅有截距所有变量协变量的卡方AIC56.54855.413.SC58.23762.169.-2LOGL54.54847.4137.135with3DF(p=0.0677)Score..6.630with3DF(p=0.0847)3/2/202323第二十三页,共七十五页。
AnalysisofMaximumLikelihoodEstimates
最大似然法估计值分析(fēnxī)ParameterStandardWaldPr>StandardizedOddsVariableDFEstimateErrorChi-SquareChi-SquareEstimateRatioINTERCPT13.70252.14422.98170.0842..X11-0.61570.71350.74460.3882-0.1718770.540X21-0.09390.06362.18120.1397-0.3093360.910X31-1.52360.73964.24300.0394-0.4248130.218
AssociationofPredictedProbabilitiesandObservedResponses
模型回代判别分析Concordant=71.9%(一致率)Somers'D=0.448Discordant=27.1%(非一致率)Gamma=0.452Tied=1.0%(结点率)Tau-a=0.224(391pairs)c=0.7243/2/202324第二十四页,共七十五页。治愈(zhìyù)的概率模型为:例2
为了探讨冠心病发生的有关危险因素(yīnsù),对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明见下表。试用logistic逐步回归分析方法筛选危险因素。3/2/202325第二十五页,共七十五页。表冠心病8个可能的危险因素与赋值因素变量名赋值说明年龄(niánlíng)(岁)X1<45=1,4554=2,5564=3,65=4高血压史X2无=0,有=1高血压家族史X3无=0,有=1吸烟X4不吸=0,吸=1高血脂史X5无=0,有=1动物脂肪摄入X6低=0,高=1体重指数(BMI)X7<24=1,24<26=2,26=3A型性格X8否=0,是=1冠心病Y对照=0,病例=1
3/2/202326第二十六页,共七十五页。程序(chéngxù)dataex16_2;infile'd:\sas\sas5\log2.txt';inputx1-x8y;proclogisticdes;modely=x1-x8/selection=stepwisesle=0.1sls=0.1clodds=pl
;run;3/2/202327第二十七页,共七十五页。条件Logistic回归
条件Logistic回归分析是用phreg(proportionalhazardregression,比例风险回归)模块完成的。Phreg模块主要用于Cox回归的计算)
语法格式
在data步先建立(jiànlì)一个时间哑变量,一般为time=1-case;(如病例case=1,对照case=0,则病例哑变量time=0,对照哑变量time=1,要求病例的time要小,对照的time要大)。如果病例case=0,对照case=1,时间哑变量为time=case。
Procphreg[选项];model<时间哑变量*对照指示变量名(数值)>=<自变量名列>/[选项];3/2/202328第二十八页,共七十五页。Strata<配对组指示变量名>;Freq<频数变量名>;【Procphreg[选项]】;nosummary不打印输出事件和截尾数值。
simple输出模型中变量的简单统计描述【model过程[选项]】
ties=discrete
用离散的logistic模型替代比例风险模型。此句必选!selection=forward(或f)|backward(或b)|stepwise(或s)|score规定变量的筛选方法,分别为向前(xiànɡqián)、向后、逐步和最优子集法。缺省时为none,拟合全回归模型。3/2/202329第二十九页,共七十五页。
sle=概率值指定变量进人模型的显著水平,缺省为0.05。
sls=概率值指定变量剔除模型的显著水平,缺省为0.05。
risklimits计算输出(shūchū)RR的可信区间。
alpha=概率值
指定RR的(1-α)可信区间,缺省时为0.05。
1:1配对条件Logistic回归例9-8为研究胃癌的危险因素,某医学院用103对1:1配对资料,这里选用其中10对三个因素,即X1(蛋白质摄入量0,1,2,3),X2(不良饮食习惯0,1,2,3)及X3(精神因素0,1,2)。数据如表9.11。试作条件Logistic回归分析。3/2/202330第三十页,共七十五页。表9.1110对胃癌的1:1配对(pèiduì)数据对号病例对照X1X2X3X1X2X3123456789101001101132331212113201201212221101120020032020002010001000003/2/202331第三十一页,共七十五页。程序datalog1_2;doid=1to10;docase=0to1;inputx1-x3@@;time=case;output;end;end;cards;130101032130012020120100111121
022200111000112000332220222000;procphreg;modeltime*case(1)=x1-x3/ties=discreteselection=stepwisesle=0.25sls=0.25;strataid;run;3/2/202332第三十二页,共七十五页。ThePHREGProcedureDataSet:WORK.LOG1_2DependentVariable:TIME反应变量timeCensoringVariable:CASE截尾变量caseCensoringValue(s):1截尾值为1TiesHandling:DISCRETE结点处理(chǔlǐ)方法为discreteSummaryoftheNumberofEventandCensoredValuesPercentStratumIDTotalEventCensoredCensored1121150.002221150.00┆┆┆┆┆┆101021150.00--------------------------------------------------------------Total20101050.003/2/202333第三十三页,共七十五页。
Step1:VariableX3isentered.Themodelcontainsthefollowingexplanatoryvariables.X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8637.1586.705with1DF(p=0.0096)Score..5.538with1DF(p=0.0186)Wald..3.139with1DF(p=0.0764)3/2/202334第三十四页,共七十五页。Step2:VariableX2isentered.Themodelcontainsthefollowingexplanatoryvariables.X2X3TestingGlobalNullHypothesis:BETA=0WithoutWithCriterionCovariatesCovariatesModelChi-Square-2LOGL13.8633.72410.139with2DF(p=0.0063)Score..7.229with2DF(p=0.0269)Walt..2.467with2DF(p=0.2913)NOTE:No(additional)variablesmetthe0.25levelforentryintothemodel.3/2/202335第三十五页,共七十五页。AnalysisofMaximumLikelihoodEstimatesParameterStandardWaldPr>RiskVariableDFEstimateErrorChi-SquareChi-SquareRatio
变量自由度参数(cānshù)估计值标准误wald卡方值P值RR值X211.1653510.810802.065790.15063.207X312.0671571.639441.589850.20737.902SummaryofStepwiseProcedureVariableNumberScoreWaldPr>StepEnteredRemovedInChi-SquareChi-SquareChi-Square1X315.5385.0.01862X223.4594.0.0629胃癌(wèiái)患病的概率模型为:3/2/202336第三十六页,共七十五页。
1:M或N:M的条件Logistic回归
1:M配比是一个病例配M个对照,N:M配比是N个病例配M个对照。使用的SAS语句和1:1配对基本是一致的。
例题某北方(běifāng)城市研究喉癌发病的危险因素,用1:2配对的病例-对照研究方法进行了调查。先选取了6个可能的危险因素并节录25对数据,各因素的赋值说明见下表1,资料列于表2。试作条件Logistic逐步回归。
3/2/202337第三十七页,共七十五页。表1喉癌(hóuái)的危险因素与赋值说明
因素变量名赋值说明咽炎X1无=1,偶尔=2,经常=3吸烟量(支/日)X20=1,1~4=2,5~9=3,10~20=4,>20=5声嘶史X3无=1,偶尔=2,经常=3摄食新鲜蔬菜X4少=1,经常=2,每天=3摄食水果X5很少=1,少量=2,经常=3癌症家族史X6无=0,有=1是否患喉癌Y病例=1,对照=03/2/202338第三十八页,共七十五页。表2喉癌1:2配对病例-对照调查(diàochá)资料整理表配比组号
iYX1X2X3X4X5X6
j11351110011133001113302113113001113200121320
i
┊┊┊┊
┊┊┊
251141111011132001113303/2/202339第三十九页,共七十五页。
程序(chéngxù)datalog1_4;infile'd:\sas\sas5\log1_4.txt';doi=1to25;doj=1to3;inputyx1-x6;time=1-y;output;end;end;procphregnosummary;modeltime*y(0)=x1-x6/ties=discreteselection=stepwisesle=0.1sls=0.1risklimits;stratai;run;3/2/202340第四十页,共七十五页。四、生存分析简介
概念
生存分析是将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。
生存分析的数据(shùjù)
完全数据
即掌握研究事件的起点,又掌握终点的生存时间资料为完全数据,一般用t来表示。
不完全数据①因迁移原因失去联系;②死于其他原因;③在总结分析时仍然生存。生存分析中称这种不完全数据为截尾数据、删失数据、终检数据(censoreddata)。
生存率(survivalrate)又称累积生存概率,即个体活过时点t的概率,用S(t)表示。3/2/202341第四十一页,共七十五页。
生存分析的三种变量(biànliàng)1.目标变量
即生存时间,常记为t。2.协变量
可以是研究因素,也可以是排除其影响的因素,常记为x1,x2,┄,xp。3.截尾变量
常记为censor或d等。
生存分析的任务
估计生存率;比较生存率;寻找影响因素。
生存分析的方法
参数法已知生存时间T服从某特定的分布类型,对分布的参数作统计描述与推断。常见的有:Weibull分布,指数分布,正态分布等。相应的SAS过程为lifereg。非参数法不知生存时间T的分布类型或不符合特定的分布类型,对整个分布或某个特征作统计描述与推断。常用乘积极限3/2/202342第四十二页,共七十五页。法(productlimitmethod)和寿命表法(lifetablemethod)估计生存率和中位生存时间等;用时序检验(log-ranktest),Wilcoxon检验和似然比检验等作分组比较。相应的SAS过程为:lifetest
半参数法
不知生存时间分布确切类型,用模型(móxíng)的方法对模型(móxíng)的部分参数作统计描述与推断。常用的是Cox模型(móxíng)。相应的SAS过程为:phreg。注:半参数法与参数法可用来研究多个因素对生存时间的影响,非参数法难以实施多因素生存分析。
非参数法的lifetest过程语法格式:PROCLIFETEST[选项];TIME<生存时间变量*截尾指示变量(数值)>;3/2/202343第四十三页,共七十五页。STRATA<分组变量名列>;(指定比较的分组变量,按分组变量名列分别进行(jìnxíng)分析和比较。)TEST<协变量名列>;(指定协变量名列,检验生存时间与该变量是否有关)Freq<变量名>;(指定频数变量名)PROC过程[选项]
1.method=方法指定估计生存率所用的方法:
PL
要求用乘积极限法(即Kaplan-Meier
法)估计生存率并计算中位生存时间等,为缺省方法。
LT
要求用寿命表法估计生存率等。2.intervals=(初值to终值by步长)或width=数值只能在指定方法为寿命表法时使用。用寿命表法分析时,程序会自动3/2/202344第四十四页,共七十五页。
给定生存时间的区间。如果人为规定生存时间的分组区间,则需用该选项指定。3.Plots=绘图类型要求输出生存分析图。可供输出的图形有:
S
对生存函数S(t)作图。横、纵坐标分别为t,S(t)。
H
对风险函数作图。横、纵坐标分别为t,H(t)。小样本资料的乘积极限法(Kaplan-Meier法)例15-1
25例某种癌症的患者在不同的日期随机(suíjī)分配至两治疗组,分别以A、B两种治疗方法进行治疗。治疗后继续对这些病人进行随访至到2003年5月31日结束。资料如表15.1所示,数字后又+号者为删失值。试进行生存率分析。3/2/202345第四十五页,共七十五页。datalife1;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;12852586363220365452496-528-560-676131318237076180195210232300396-490-540;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;3/2/202346第四十六页,共七十五页。TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=1SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft
生存时间生存率死亡概率(gàilǜ)生存率标准误死亡例数生存例数0.0001.0000000128.0000.91670.08330.079811152.0000.83330.16670.107621058.0000.75000.25000.12503963.000...4863.0000.58330.41670.142357220.0000.50000.50000.144366365.0000.41670.58330.142375452.0000.33330.66670.136184496.0000.25000.75000.125093528.000*...92560.000*...91676.000*...90*CensoredObservation3/2/202347第四十七页,共七十五页。SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)
四分位数点估计95%可信区间(qūjiān)75%.220.000.50%292.50063.000496.00025%60.50052.000365.000Mean272.083StandardError62.231
生存时间均数均数的标准误NOTE:Thelastobservationwascensoredsotheestimateofthemeanisbiased.3/2/202348第四十八页,共七十五页。
TheLIFETESTProcedureProduct-LimitSurvivalEstimatesGROUP=2SurvivalStandardNumberNumberTSurvivalFailureErrorFailedLeft0.0001.00000001313.0000.92310.07690.073911218.0000.84620.15380.100121123.0000.76920.23080.116931070.0000.69230.30770.12804976.0000.61540.38460.134958180.0000.53850.46150.138367195.0000.46150.53850.138376210.0000.38460.61540.134985232.0000.30770.69230.128094300.0000.23080.76920.1169103396.0000.15380.84620.1001112490.000*...111540.000*...110*CensoredObservation3/2/202349第四十九页,共七十五页。SummaryStatisticsforTimeVariableTPoint95%ConfidenceIntervalQuantileEstimate[Lower,Upper)75%300.000195.000.50%195.00070.000300.00025%70.00018.000195.000Mean192.692StandardError40.963SummaryoftheNumberofCensoredandUncensoredValuesGROUPTotalFailedCensored%Censored1129325.000021311215.3846Total2520520.00003/2/202350第五十页,共七十五页。
SDF||||||1.0+*AB|||S|||u|A*---Ar|||v|BB|i||AAv0.8+||a|B---|Bl|AA||D|*Bi|||s||B------------Bt0.6+||r|A-----------------Ai|BB|b||A-----------------Au|||t|B-B|i||A---------Ao0.4+||n|B--B|||A-----AF|B-------B|u|||n||Ac|B-----------Bt0.2+|i||o|Bn||||0.0+|||||+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-050100150200250300350400450500550600650700T3/2/202351第五十一页,共七十五页。
TestofEqualityoverStrata
Pr>TestChi-SquareDFChi-SquareLog-Rank时序(shíxù)检验0.664010.4152Wilcoxon秩和检验0.327210.5673-2Log(LR)似然比检验
1.036210.30873/2/202352第五十二页,共七十五页。例王洁贞主编《医学统计学》例14.1P202手术(shǒushù)疗法组:52789296105123145136*157*182*209*224*手术+化疗组:7995117175203102*157*199*216*246*2693/2/202353第五十三页,共七十五页。datalife2;dogroup=1to2;inputn;doi=1ton;inputt@@;ift<0thencensor=1;elsecensor=0;t=abs(t);output;end;end;cards;1252789296105123145-136-157-182-209-224117995117175203-102-157-199-216-246269;proclifetestplots=(s)formchar(1,2,7)='|-+';timet*censor(1);stratagroup;run;3/2/202354第五十四页,共七十五页。
大样本资料(zīliào)的寿命表法
例2王洁贞主编《医学统计学》例14.2P2063/2/202355第五十五页,共七十五页。
datalife3;inputtcensorfg@@;/*t:月数的下限;censor:1=死亡,0=失访;f:人数(rénshù);g:分组变量*/cards;0181000171517011131411300119121190017142704213122130221912219032251322502231112310423710237012;proclifetestmethod=Ltwidth=6plots=(s)formchar(1,2,7)='|-+';timet*censor(0);stratag;freqf;run;3/2/202356第五十六页,共七十五页。
TheLIFETESTProcedureLifeTableSurvivalEstimatesG=1ConditionalEffectiveConditionalProbabilityIntervalNumberNumberSampleProbabilityStandard[Lower,Upper)FailedCensoredSizeofFailureErrorSurvival
区间的上下限死亡数失访数校正人数死亡概率(gàilǜ)死亡概率(gàilǜ)标准误期初生存率068020.00.40000.10951.00006125111.50.43480.14620.60001218406.00.66670.19250.3391182420
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北农业大学现代科技学院《生态学》2021-2022学年第一学期期末试卷
- 2024年度软件开发项目风险评估合同2篇
- 2024版合作协议:工程联营6篇
- 工程技术咨询合同范本
- 提成协议合同书
- 2024年度租赁合同-商业设备2篇
- 2024年度新能源技术研发与授权许可合同
- 2024年度二手房定金支付合同6篇
- 合伙人协议合同2篇
- 2024年度工厂能源供应与节能改造合同3篇
- 大学生职业规划大赛成长赛道参赛作品
- 劳务结算单模板
- EXCEL小游戏-青蛙跳
- 园林景观工程报价表Excel模板
- 汽车灯系的种类、功用及使用.ppt
- 三年级美术上册《天然的纹理》教案
- 印度住宿发票201011
- 污水处理厂土建工程施工进度计划横道图
- PSPC作业指导书用书
- 安培环路定理及应用PPT课件
- TS3000在航天炉煤化工中应用
评论
0/150
提交评论