已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分析一个存分析数据所想到的 出现的问题往往多于结论,吴喜之 阎洁 中国人民大学 统计学院 2004年12月,从教科书可期待什么?,整齐的数据(可能有些缺失值) 选好的意义明确的变量 完全确定的研究目标 按照一定的模型进行拟合 得到可合理解释的结果和漂亮的输出 根据理论(条件当然满足)做出解释 一切都令人满意,但是在实际中,数据形式和想象的差别可能很大 可能很难摸清大量变量的内在含义和关系 研究目标经常无法事先确定 没有任何现成的理论来确定什么模型合适 得到各种从统计或医学均不易解释的输出 永远不知数据是否满足一些定理和方法的条件 还需面对许多医学和统计的决策 这些决策很难说哪个“对”或“错”,我们的数据,一个鼻咽癌数据* 只有136个观测值 其中仅有129个可用 一共41个变量,其中包括,性别;病人诊断资料,如原发症状、原发部位、病理分级、B症状有无、国际预兆指数、国际预兆指数合并B症状、淋巴结大小、肿瘤M分期、WHO得分、分化程度、肿瘤T分期、淋巴结单双侧、肿瘤TNM分期等指标;病人治疗资料,如治疗方案、化疗方案、化疗周期;病人治疗近期效果资料,放疗疗效、化疗疗效、总初次治疗疗效;病人远期疗效资料,复发资料-是否复发、复发时间、复发部位、复发肿瘤的TNM分期,合并症资料-是否发生合并症、合并症发生时间,生存资料-是否死亡(指因癌症死亡)、生存时间。,我们面对的第一个决策问题,我们所关心的是复发还是死亡 没有任何理论上的理由来排斥哪一个 它们都和医疗效果相关,但是 从实践的角度,复发数据显然比死亡完整 因此我们仅以复发事件作为考虑重点 这里我们只考虑和此目的有关的22个变量(其中20个为“自变量”),常规的分析方法,进行“复发时间”的常规生存分析 这些方法包括: 简单寿命表 Kaplan-Meier分析 Cox比例风险模型 等等,生命表,Kaplan-Meier方法,为了检验复发时间与哪些因素有关 通常采用了以下三种检验方法: Log Rank检验 Breslow检验 Tarone-Ware检验 三者的区别在于其检验统计量对不同时间的事件赋予的权重不同。,Kaplan-Meier方法,根据三种检验结果可知 有显著影响意义的因素包括: T分期、放疗疗效、化疗疗效、总初次治疗疗效 可能有意义的因素包括: 性别、原发症状、ipi和b症、有无转移、化疗周期数等 于是可以估计生存函数(画图),一些变量的三种检验结果,一些累积生存函数估计图,有些可以区别明显 有些不明显 有些看不出来,生存函数图(性别区分),生存函数图 (关于T分期),生存函数图 (关于初次疗效),生存函数图 (ipi和b症),生存函数图 (放疗疗效?),EN:巩固治疗,CR:完全治愈,PR:部分治愈, S:轻微缓解(或者是没变化) PD:肿瘤进展,生存函数图 (化疗疗效?),EN:巩固治疗,CR:完全治愈,PR:部分治愈, S:轻微缓解(或者是没变化) PD:肿瘤进展,Cox Regression,自变量:20个变量 逐步回归:Forward:LR Ordinal变量处理:当作分类变量。,Cox Regression,注: M分期为”有无转移” T分期为“肿瘤组织学分期”,选中了M分期和T分期,Cox Regression,生存函数图(TM分期),对这些结果的解释企图:,确诊时的T分期和M分期对于肿瘤的复发有显著影响。 确诊时其T分期较早的话,则治疗后复发的可能性要小于T分期较晚的人群,即使复发,其复发时间也相对要晚一些。 M分期也是一样。 因此,能在癌症早期及时发现是鼻咽癌诊治的一个重点。,三种检验不一致时的解释 :,控制“有无B症状”因素,分析放疗效果与复发的关系 其复发时间分布的Log Rank检验结果并不显著,p-值=0.0744,而另外两个检验的结果是显著的,Breslow检验, p-值=0.0280,Tarone-Ware检验, p-值=0.0403,三种检验不一致时的解释 :,多数文献只进行Log Rank检验,而很少用后两种 这三种检验有什么区别呢? 看看这些检验背后的机理 这三个检验的零假设都是检验各组间生存分布相同 三个检验的统计量均是基于比较每个时点的实际发生事件数与期望发生事件数,三种检验不一致时的解释 :,这三个检验的主要区别在于对不同时间点的权重不同: Log Rank检验对每个事件的权重相同,无论其发生早晚 Breslow检验按照在风险中的个体数对事件加权,而在风险中的个体时间而减少,因此早期发生的事件权重晚期发生的事件权重大 Tarone Ware检验按照在风险中的个体数的平方根对事件加权,因此结果则介于前面二者之间,对早期事件的权重要小于Breslow检验,大于Log Rank检验,因而其统计量和p-值也介于二者之间,三种检验不一致时的解释 :,面对以上的分析数据,可以认为:放疗效果对于复发来讲,是有显著影响的 但是其影响更多的是对早期复发,而对晚期复发的影响可能要小一些,定序变量看作分类变量或者定量变量?,一些方便(傻瓜)软件默认地把定序变量看作分类变量来处理 如果我们把这些Ordinal变量作Interval变量来处理的话,用同样的Forward:LR方法和自变量,结果又将如何呢?,最后我们发现结果和上面完全不同。作为分类变量处理时,“T分期”和“M分期”作为两个重要变量被筛选出来 而作为连续变量处理时,“国际预后指数(ipi)合并B症状”则是唯一被选中的变量,定序变量看作分类变量或定量变量?,这种结果该如何解释? 哪个结果更可信呢? 问题是在什么情况下,定序变量可作连续变量来处理,什么情况可作分类变量来处理呢?,定序变量看作分类变量或定量变量?,对分类变量而言,常将缺失数据作为单独一组(如问卷调查中的“不知道”) 这种处理在数据整理中为保证数据的工整是无可指责的 但是如果在分析中依然将其作为单独一组参与分析,则可能对结果会有影响,缺失数据处理,而将缺失值不纳入分析时,输出为,不将缺失值(未进行化疗者)去掉,有,数据量问题,数据量不够导致本该检测出的差别检测不出来 在对“有无转移”进行分析时,我们可以得到以下检验结果:,“有无转移”真的没有影响吗?,从医学专业知识来判断,“有无转移”对于肿瘤预后而言是有显著影响的 那究竟是什么地方出了问题呢? 可以察看一下数据量 “有转移”的病例数为6例,其中有3例是删失数据,只有3例发生了终点事件, “无转移”病例数有33例发生了终点事件, 拿这样两组人群进行比较时,由于一组人群数量太少而不能检出其差别。,数据量问题,数据量不够导致错误结论,从专业知识出发,“ipi合并B症状”变量得分越高的人群其疾病的严重性越高,而从上面的分析数据,可以看到得分为2的人群其平均复发时间要长于得分为1的人群 为什么?,数据量问题,这样一个不合适结论是由数据量不够而导致,作研究时,不能盲目看结果,还要充分考虑样本量。这一点在很多的文献中也是被忽略掉的。片面观察结果,会忽视了结果的可靠性。,分类数据的合并问题,在治疗方案的分析中,发现“治疗方案”并不是一个显著因素。,分类数据的合并问题,但是观察其数据发现,化疗患者只有2人发生了终点事件,这一类样本量较少。,分类数据的合并问题,如把“化疗” 一类剔除,并把“先放后化”、“先化后放”、“化放化”三类合并之后,则有,如把“化疗”一类剔除,并把“先放后化”、“先化后放”两类合并为“化放结合”之后,则会有,结果差别很大;到底应该如何操作呢?,混杂因素,依然举“治疗方案”的例子,如将“性别”作为分层变量来控制其混杂效应,则对于男性:,混杂因素,而对于女性:,混杂因素,对于全体(控制性别影响之后):,值得思考,用决策树方法(C5.0)进行分析 将“是否复发”(1为非复发,2为复发)作为目标变量,将其余20个变量作为X变量,分析这些X变量与“复发”的关系,用决策树方法进行分析,用决策树方法进行分析,得到如下规则。如其中黑体显示部分表示:T分期为2,性别为2,国际预兆指数为2的病例有7例,其中71.4%为复发者,用决策树方法进行生存数据的分析,有两点要注意: 1)决策树方法是一种数据挖掘算法,它对于样本量的要求要比一般统计方法要大 2)决策树方法不能充分利用生存时间信息,其结果的可靠性有待商讨。 不过该方法还是可以作为规律初步探索的工具。,用决策树方法进行分析,对于连续数据进行离散化时,如本例中的淋巴结大小,按照淋巴结的实际厘米数将病例划分为四组,none,6cm 这些分割点看上去是根据“专业经验”而选择的,它们不见得是合适的 如何确定分割点,而不是人为地、随意地进行指定呢? 或者根本没必要将连续变量进行离散?,分隔点问题,许多分隔据说是鉴于医学经验 这些医学分隔又有没有统计的支持呢? 上面的分隔很规整:3cm、6cm及以上 类似于“无信息”先验分布 有没有“无信息”先验分布呢? 谁也说不清哪个空间是“原始空间”还是“变换后的空间” 下面的图形可能有些启发,“无信息”vs“经验”,“等间隔”和“内紧外松”的互相变换,“等间隔”和“外紧内松”的互相变换,“等间隔”和“下紧上松”的互相变换,“等间隔”和“下紧上松”的互相变换,把连续变量换成离散变量的现象非常普遍。这包括社会、经济、医疗卫生等几乎生活的所有方面 这是不是前计算机时代的以定性为主的思维方式的继续呢? 但可以肯定的是,离散化不仅失去大量信息、造成处理复杂化,而且必然会产生分隔点确定的合理性问题 也给产生各种“猫腻”留出了大量的空间,分隔点问题,二维列联表,在我们数据中共有21个变量(包括“是否复发”)在理论上可以组成210个二维列联表,但是其中有143个有一个以上空格 在67个无空穴(共210个)二维列联表中Pearson统计量卡方检验的p值只有4个小于0.05,二维列联表,共有134个二维列联表能用不太费时间的Fisher精确检验,但只有18个p值小于0.05,从二维列联表分析,我们可以看到B症状的有无和T分期有密切关系 实际上,有B症状的人中T分期较严重的比例要大于无B症状的人。 而且在列联表分析中也可以看到有B症状的病例其放疗疗效也劣于无B症状者。 是否复发和T分期显著相关,列联表的相关性分析虽然
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 供应商选择培训
- 治安宣传教育活动
- 1.2太阳对地球的影响(教学设计)高一地理同步高效课堂(人教版2019必修一)
- 信息技术(第2版)(拓展模块) 教案 拓展模块5 5.1 认识人工智能
- T-ZFDSA 21-2024 决明子烧茄子制作标准
- 高中物理第三章相互作用2弹力课件新人教版必修
- 如何利用市场营销战略打造企业竞争优势
- 部编版六年级语文上册第七单元《伯牙鼓琴》教学课件
- 施工升降机安全教育讲座
- 六年级上心理健康教育教案
- 信用社(银行)借新还旧申请书(精编版)
- (完整版)苏教版五年级数学上册知识点归纳总结
- lampsite LTE 站点配置指导v1.1
- 市政工程钢筋混凝土管砂石基础垫层量计算公式
- 第七章 生态旅游标准与认证
- 美能达807si相机中文说明书
- 莆田市人教版四年级数学上册期中测试卷
- 输血科标准操作规程SOP文件
- 县人大常委会预算审查监督暂行办法
- 结肠代食道术护理体会
- 中大型集团公司 信息化建设 信息中心工作职责 明细
评论
0/150
提交评论