医学统计学高级统计学习题_第1页
医学统计学高级统计学习题_第2页
医学统计学高级统计学习题_第3页
医学统计学高级统计学习题_第4页
医学统计学高级统计学习题_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2、完全随机设计2因素(A、B)2水平的析因试验SS如可分解为ssa、ssb和ssab三部分重复测量数据方差分析要求资料满足球对称检验多元线性回归的应用可归纳于影响因素分析、归纳与预测和统计控制三方面5、Logistic回归暴露组与非集露组发病的优势比0Rj=l,说明因素Xj对疾病发生不起作用;ORj乂说明因素Xj是疾病的危险因子,ORjVl,说明Xj是疾病的保护因子6、Logistic模型变量逐步选择的方法有前进法、后退法和逐步法7、生存分析时个体的生存时间可以确切获得时称为完全数据,个体的生存时间为删失值时得不到确切的生存时间,称为不完全数据8、生存分析时如估计生存率、生存曲线及中位生存时间常采用Kaplan-Meier法,如果是频数表资料时则采用寿命表法进行分析:生存分析时如果对不同组的生存率进行比较常采用log-rank检验和Breslow检验9、cox回归应变量为生存时间和结局1、简述生存分析数据产生删失的原因及删失数据的分类原因:1)研究截止日期时,终点事件仍未出现;2)失访,不知终点事件是否发生以及何时发生;3)病人中途退出;4)死于终点事件以外的其他事件分类:左删失、区间删失、右删失2、Logistic回归的应用流行病学危险因素分析:临床试验数据分析;分析药物或毒物的剂量反应:预测与判别生存分析资料的特点D同时考虑生存时间和生存结局:通常含有删失数据:生存时间的分布通常不服从正态分布重复测量设计资料方差分析的注意事项(后两项不确宦)球对称检验2)无平行对照的单组重复测量数据分析需注意与随机区组方差分析的区别与联系重复测量数据不同时间点的两两比较需设立对比矩阵进行计数(立性)资料重复测量数据,统汁需用广义估计方程?5)要求各组例数相等?1、前后测量设计与配对设计的区别配对设计同一对子的两个实验单位可以随机分配处理,且效果可以同期观察,而前后测量设计不行,且前后测量设汁推论处理是否有效需假设时间对观测结果没有影响前后测量设计的前后两次观测结果通常与差值不独立前后测量设计除了分析平均差值外,还可以进行相关回归分析2、重复测量设计与随机区组设计的区别重复测量设计区组内各时间点是固泄的,不能随机分配重复测量设计区组内实验单位彼此不独立重复测虽:数据若用随机区组方差分析的方法比较组间差异,需满足球对称假设,若不满足球对称,则至少处理组内效应的F界值需校正3、重复测量设计ANOVA注意事项(见上第4题)重复测量数据多重比较包括哪些内容(不确左)1)时间差别多重比较时间趋势比较时间点多重比较多元线性回归模型应用条件线性、独立性、正态性、方差齐性多元线性回归分析步骤1)根拯样本数据求得多元线性回归方程:2)对回归方程及各自变量做假设检验,并对方程的拟合效果及各自变疑的作用大小作出评价多元线性回归中自变量的选择方法有哪些1)全局择优法:校正决泄系数Re?选择法、Cp选择法逐步选择法:前进法、后退法、逐步回归法多元线性回归的应用影响因素分析预测与估计)统计控制多元线性回归的注意事项举例说明多元线性回归中自变量的类型有哪些?并阐述$类自变量的计算机赋值处理办法自变量可为:连续变量、分类变量或有序变量1)连续变量:以原始观察值赋值即可,若Y与X不呈线性关系,可对X作某种变换,以增大R22)分类变量:二分类用0,1表示,如男=0,女刃:多分类如有g个类别,则用g-1个哑变量表示,如用表示四医法,X】=0表示其他,X2=l表示中西医结合法,X2=0表示其他有序变量:轻=1,中=2,重=3,或用哑变虽表示9.2、简述什么是多重共线性?多重共线性可能引起的不良后果及解决办法有哪些?多重共线性是指一些自变量之间存在较强的线性关系。不良后果:2)增大参数估计值的标准误,降低t值;2)回归方程不稳泄,增减某几个观察值会使估汁值变化很大;3)t检验不准确,误将应保留在方程中的重要变量舍弃:4)估计值的正负号可能与客观实际不一致办法:1)剔除某个造成共线性的自变量,重新建立回归方程;2)将一组具有多重共线性的自变量合并成一个变量:3)采用逐步回归法筛选变量10、Logistic回归的应用(见上第2题)11、Logistic回归应用的注意事项变量的取值形式:如连续变量可以考虑分组表示,并用哑变量形式赋值样本含量应足够大选择变量时要结合专业背景及研究目的,不应盲目相信统计数据结果4)有序Logistic回归的平行性假设检验5)SPSS和SAS中有序Logistic回归结果的区别模型拟合优度检验(后三项老师说不需要掌握)生存分析资料特点(见上第3题)举例说明生存分析中包含哪两种数据?并阐述其产生的原因完全数据和不完全数据(删失数据),原因见上第1题生存分析的统计方法包括哪些内容D描述分析;2)比较分析:3)影响因素分析15、Cox比例风险回归模型的假泄条件(比例风险假定:对数线性假左)及检验假左条件的方法有哪些?比例风险假左:各危险因素的作用不随时间变化而变化对数线性假立:模型中的协变量应与对数风险比呈线性关系方法(感觉不能考):分类协变量分别绘制K-M生存曲线,曲线无交叉证明满足;或分别以时间t为横轴,ln[-lnS帽(t)]为纵轴画图,平行i正明满足:连续协变疑将每个协变量与对数生存时间的交互作用项[Xln&)]放入回归模型中,交互项无统计学意义则证明满足16、Cox回归中风险比例假定条件不成立时解决方法有哪些1)将不成比例关系的协变量作为分层变量,然后再用其余变量进行多元Cox回归模型分析:2)采用参数回归模型替代Cox回归模型进行分析17、多元线性回归、Logistic回归及Cox回归模型的相同点1)自变量可以是连续变疑、有序分类变量和无序分类变量:2)自变量之间可能存在多重共线性;3)自变量之间可能存在交互作用:4)均可采用逐步回归法筛选变虽;5)均可进行影响因素的分析、混杂因素的校正、预测分析等。18、多元线性回归、Logistic回归及Cox回归模型的不同点(见书上Cox回归章节后的图)D应变量及分布不同(连续正态、分类二项、两分类和生存时间):2)只有Cox回归模型允许删失存在;3)模型结构不同;4)参数估讣方法不同(最小二乘、最大似然、最大似然);5)参数解释不同(Y平均改变量、OR、RR的自然对数改变量);6)预测指标不同(Y、p、S(t)):7)后两者样本含量要求高19、Logistic回归的类型有哪些D两分类的12)多分类有序变屋的3)多分类无序变量的〜D非条件Logistic回归(研究对象未配对);2)条件~(配对)简述复相关系数和偏相关系数的区别复相关系数为应变量Y与多个自变量间的线性相关程度,偏相关系数为剔除其他自变量影响之后的Y与某个自变量或两个自变疑之间的相关程度简述偏回归系数与标准化偏回归系数的区别前者因各自变量的测量单位不同,不能直接用其绝对值比较自变量间对Y的影响强度,而后者经过标准化处理,可以用来比较自变量间对Y的影响强度22、Logistic回归与Cox回归模型中偏回归系数的含义Logistic回归:Xj每增加一个单位所引起的优势比OR的自然对数的改变量Cox回归:Xj每增加一个单位所引起的相对危险度RR的自然对数的改变量23、多重回归分析时自变量筛选方法如何选择,如何判断一个模型是否较优?自变量数目较少时选择全局择优法,数目多时选择逐步回归法可用决定系数R2来判断模型拟合程度,R2越接近于1说明模型拟合度越好24、Logistic回归分析中ABO血型数据直接用1,2,3,4赋值是否正确,请改正不正确,需设立哑变呈:Xi、X2、X3,并如下赋值:0型=0,0,0;A型=1,0,0:B型=0,1,0:AB型=0,0,11、交互作用:当某个因素的单独效应随另一因素变化而变化时,则称这两个因素间存在交互作用2、偏回归系数:Bj表示在英他变量保持不变时,Xj增加或减少一个单位时Y的平均变化量3、复相关系数:用来度量应变量Y打多个自变量间的线性相关程度,即观察值Y与估计值Y帕之间的相关程度4、中位生存时间:又称生存时间的中位数,表示刚好有50%的个体其存活期大于该时间5、偏相关系数:表示剔除其他自变量影响之后,应变疑Y与某个自变量或两个自变量之间的线性相关程度1、析因设计:是指以多因素(两个及以上)为研究对象,探求各因素的主效应和因素间的交互效应的一种实验设计方式哄狼效应:是指英他因素的水平固左时,同一因素不同水平间的差别£效应:是指某一因素各水平间的平均差别4、K炖:当某因素的各个单独效应随另一因素变化而变化时,则称这两个因素间存在交互作用5、重复测量数据(设计):分析同一研究对象的同一测量指标在不同时间点多次测疑结果的实验设计方式称为~6、球对称假设:重复测量误差的协方差矩阵经正交对比变换后,与单位矩阵1/4成比例,则称数据满足球对称假设,满足球对称假设的重复测量数据可以用随机区组方差分析的方法来进行分析偏回归系数:见上第2题复相关系数:见上第3题9、决定系数:R2表示自变量能够解释应变量Y变化的百分比,R2约接近1说明模型拟合程度越好10、偏回归平方和:从回归方程中剔除某个自变量后所引起的回归平方和的减少量,表示在含有其他自变量的情况下该自变量对应变量Y的回归贡献11、标准化【叩JI系数:将原始数据减去相应变量的均数后再除以该变量的标准差得到标准化的数据,用标准化的数据计算得出的回归方程的回归系数称为标准化回归系数12、偏相关系数:见上第5题13、事言丁兵线忡:是指回归方程中的一些自变量之间存在较强的线性关系,从而降低了回归方程的可靠性14、残差:是指观察值Yi与估计值Yi帽之差,正常情况下残差服从正态分布15、离群点:多元线性回归的残差分析中,标准化残差的绝对值大于2的点称为离群点16、OR位含义:是衡量危险因素作用大小比数比例亦称优势比,在Logistic回归中某自变疑(危险因素)的ORj表示扣除了其他自变量影响后该自变量的作用17、Logistic回归系数:是指Xj每改变一个单位所引起的优势比OR的自然对数的改变量’I1?分,:是将事件的结果和出现这一结果所经历的时间结合起来分析的一类统计分析方法间:从尼始事件到终点事件之间所经历的时间跨度为生存时间完全数拯:生存分析时个体的生存时间可以确切获得时称~21、不完全数据•:生存分析时个体的生存时间为删失值时得不到确切的生存时间,称为〜22、件右沁表示观察对象的生存时间T大于时间t的概率,常用S(t)表示,称为累积生存概率,简称生存率23、 精?:表示某时段开始时存活的个体,到该时段结束时仍存活的可能性24、死匚概来:表示某时段开始时存活的个体,在该时段内死亡的可能性中位(半数)生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论