RXC表资料统计分析与错误辨析_第1页
RXC表资料统计分析与错误辨析_第2页
RXC表资料统计分析与错误辨析_第3页
RXC表资料统计分析与错误辨析_第4页
RXC表资料统计分析与错误辨析_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学培训班,RC表资料的统计分析与错误辨析 胡良平 军事医学科学 生物医学统计咨询中心,第一类:22表 ,四型,(一)横断面研究设计22表; (二)队列研究设计22表; (三)病例-对照研究设计22表; (四)配对研究设计22表。,RC表的分类、分型 以及统计分析方法的合理选择,第二类:RC表,四型,(一)双向无序列联表; (二)单向有序列联表; (三)双向有序且属性不同的列联表; (四)双向有序且属性相同的列联表。,第三类:高维表,三型,(一)结果变量为“二值变量” 的高维表; (二)结果变量为“多值有序变量”的高维表; (三)结果变量为“多值名义变量”的高维表。,列联表分类,第一部分:R

2、C表的四型,1、双向无序列联表; 2、结果变量为有序变量的单向 有序列联表; 3、双向有序且属性不同的列联 表; 4、双向有序且属性相同的列联 表。,1型资料举例1 (双向无序RC表),例1计算方法 (双向无序RC表),因表中小于5的理论频数没有或很少,故这样的双向无序列联表资料可以用一般的卡方检验来处理。,1型资料举例2 (双向无序RC表),例2计算方法 (双向无序RC表),因表中小于5的理论频数超过了总格子数的1/5,故这样的双向无序列联表资料应选用Fisher的精确检验来处理。 理论频数=(行合计)(列合计)/N,2型资料举例 (单向有序RC表),例3计算方法 (结果变量为有序变量的单向

3、有序RC表),(1)秩和检验; (2)Ridit分析; (3)有序变量的Logistic 回归分析。 (关键是对结果变量打分计算),3型资料举例 (双向有序且属性不同RC表),3型资料计算方法 (双向有序且属性不同RC表),双向有序且属性不同的二维列联表有四个分析目的: 其一、检验各组结果之间的差别; 其二、研究两有序变量之间的相关性; 其三、研究两有序变量之间是否呈直线 关系; 其四、各行(或列)频数分布是否相同。,3型资料计算方法 (双向有序且属性不同RC表),其一、检验各组结果之间的差别; 用秩和检验等方法处理资料; 其二、研究两有序变量之间的相关性; 用Spearman秩相关分析处理资

4、料; 其三、研究两有序变量之间是否呈直线关系; 用线性趋势检验处理资料; 其四、各行(或列)频数分布是否相同; 用卡方检验或Fisher精确检验处理资料。,4型资料举例 (双向有序且属性相同RC表),4型资料计算方法 (双向有序且属性相同RC表),双向有序且属性不同的二维列联表有一个分析目的:即两种检测方法检测的结果是否一致。 可选用的统计分析方法为: (1)Kappa检验(或称为一致性检验); (2)特殊模型分析(复杂,少用),第二部分,RC表资料统计分析常见错误的辨析与释疑,1、对单向有序资料未进行 统计分析直接得出结论,两种术式治疗单侧声带麻痹的比较,原作者对23例喉支架术(9例)及喉神

5、经再支配术(14例)的患者手术前及手术后进行了比较观察,各术式声音评估情况见表1:,对差错的辨析 原作者未对资料进行统计分析就直接得出结论,显然是错误的,本资料应属于结果变量为有序变量的单向有序列联表资料,原表设计不利于进行相应的统计分析,先把上表修改如下:,两种手术方法术前声音评估情况(修改表),释疑 在保证两组之间重要的非处理因素均衡的前提下,适当增大样本含量,并采用适合于分析单向有序列联表资料的秩和检验或Ridit分析,作出专业结论。,释疑 严格地说,若两组患者均在各时间点被重复测量了疗效(有序变量),应按具有重复测量设计定性资料的方式整理和分析资料。,2、双向有序且属性相同资料未进行统

6、计分析直接得出结论,240喉癌MRI分期评价,原作者目的预评价MRI在喉癌术前T分期中的价值。采用方法为:对59例喉癌的MRI资料进行回顾性分期,并与纤维喉镜及手术病理对照。结果见下表:,附表 各期喉癌MRI和 纤维喉镜分期结果,总准确率:MRI:92%(54/59);纤维喉镜:73%(43/59);P0.01 结论 MRI能准确判断会厌前间隙(PES)、喉旁间隙(PGS)浸润及软骨破坏,因而可显著提高喉癌术前分期的准确性,对临床治疗方案选择具有重要意义。,对差错的辨析 采用两种分析方法分别测定同一人群,测定结果都分为正确、未确定、错误,从资料类型看,应属于双向有序且属性相同的列联表资料,原作

7、者未经相应的统计分析直接得出结论,显然是不合适的。为便于作统计分析先把上表修改如下:,各期喉癌MRI和纤维喉镜分期结果(修改表),释疑 原作者真正的目的是想分析这两种检测方法的检测结果之间是否具有一致性,因而应选用与之相应的一致性检验,即kappa 检验。,3、误用卡方检验处理 单向有序列联表资料,溶菌酶和乳铁蛋白在慢性鼻窦炎钩突粘膜中的表达,采用免疫组化ABC法,检测溶菌酶(LZ)和乳铁蛋白(LF)在17侧健康和70侧慢性鼻窦炎患者(分为单纯炎症组和合并鼻息肉组)钩突粘膜中的表达情况。分别得到以下两表和结论:,从资料类型上看,需要进行秩和检验或Ridit分析,其实再看一看每一时期两组的样本含

8、量,就会发现样本含量太小,每组分为四个疗效级别而例数只有9例和14例,即使两组间疗效真正存在差别,也可能由于样本例数太小,无法提供充足的信息而不能得出差异具有统计学意义的结论来。,表1 溶菌酶在各组钩突 粘膜中的表达状况,表2 乳褐质在各组钩突 粘膜中的表达状况,原作者的分析方法:卡方检验。结果 LZ在单纯炎症组钩突粘膜杯状细胞中表达较健康对照组加强(P0.05) 。,表3 上颌窦鳞癌病理分级与RAS、 P53及PCNA的表达关系,结论:RAS基因表达与上颌窦鳞癌病理分级有关,多见于高分化鳞癌中(卡方检验P=0.02); P53基因表达与上颌窦鳞癌病理分级无关(P0.05)。,对差错的辨析 由

9、上表可以看出:原因变量(病理分级)的三个水平之间具有一定的顺序,是一个有序变量。而基因ras(或p53)的表达与否只有两个水平,相当于阴性(0)和阳性(1),可以看成是顺序的一种特例。,因而可将其视为双向有序的列联表资料。原作者对其进行一般的2检验,只能得出不同病理分级的上颌窦鳞癌之间的ras(或p53)基因表达率差异是否具有统计学意义。并不能说明原作者的实验目的,即上颌窦鳞癌病理分级与ras(或p53)基因表达率之间有相关关系(需要用Spearman秩相关分析)。,释疑 应根据作者实验目的采用适合此资料的Spearman秩相关分析法。 变换原表如下: 表1上颌窦鳞癌病理分级与RAS、P53基

10、因表达关系,程序运行结果: ras基因表达与否与病理分级之间的相关性分析: rs=0.41822,P=0.00720.05。 故可以认为P53基因表达与否与上颌窦鳞癌病理分级之间的相关性无统计学意义。,5、列表与分析所用的资料详略不同,误用Ridit分析处理四格表资料 本题资料来源同错误一: 原作者在研究RAS蛋白在上颌窦鳞癌与内翻性乳头状瘤中表达差异时得实验结果见下表:,表1ras蛋白在上颌窦鳞癌及内翻性乳头状瘤中的表达,原作者得出结论:ras蛋白表达阳性率及强度在上颌窦鳞癌与乳头状瘤间差异无显著性(Ridit检验,P0.05)。,对差错的辨析 该资料的分组变量是一个名义变量,而结果变量(即

11、表达强度)是一个具有四个等级的有序变量,所以该资料是一个“结果变量为有序变量的单向有序的2X4列联表资料”,用Ridit 分析适宜。但是原作者在分析两组表达阳性率时,就不应该使用Ridit分析了。,因为ras蛋白的表达与否是一个具有两个水平的无序变量,这时的资料类型为一般的四格表资料。而Ridit分析是处理结果变量为有序变量的单向有序列联表资料的统计分析方法,不适用于一般的四格表资料。,释疑 要研究ras蛋白表达阳性率在上颌窦鳞癌与乳头状瘤间差异有无统计学意义,应该采用适合一般四格表资料的统计分析方法。 如果总频数n40,没有小于5的理论频数,就可以使用一般2检验。,经检查:n=6040,最小

12、理论频Tc=20X25/60=8.33335, 可以用一般的2检验: 2=0.034290.05。 重新编制表如下:,故可以得出专业结论: ras蛋白的阳性表达率在上颌窦鳞癌与内翻性乳头状瘤之间的差异无统计学意义。,6、表格制作不规范,不便于进行卡方检验 例1声门上型喉癌颈淋巴结隐匿性转移一 文中,有如下表格: 喉癌分化程度与颈淋巴结隐匿性转移 分化程度 例 数 转移例数 转移率(%) 高分化 27 9 33.0 中分化 40 14 35.0 低分化 33 15 45.0,表1 喉癌分级与隐匿型转移 分级 例数 转移例数 转移率(%) t1 6 2 33.0 t2 31 8 25.0 t3 3

13、8 18 47.0 t4 25 10 40.0,表格编制欠合理,误用 统计计算方法不易及时发现,表2 喉癌分级与隐匿型转移 分级 未转移例数 转移例数 合计 t1 4 2 6 t2 23 8 31 t3 20 18 38 t4 15 10 25 合计 62 38 100,表1的修改结果,对差错的辨析 该表中小于5的理论频数的个数超过了总格子数的1/5,故不适合用一般的卡方检验处理此资料。,释疑 由两张表格前后对比可见:表2中38*6/1005 、62*6/1005,故此表资料不适合用一般卡方检验处理。原作者由于表格编制不规范而误用计算方法还不知道,并且还将合计数误当作转移例数带入公式计算,导致

14、计算错误,此题应进行Fisher精确检验。,7、滥用生存率且以率代替假设检验 鼻腔鼻窦软组织肉瘤47例分析一 文中,有如下结论:横纹肌肉瘤3年生存率4/6(66.7%),5年生存率3/5(60.0%);纤维肉瘤3年生存率4/5 (80.0 %),5年生存率1/4(25.0%);脂肪肉瘤3年生存率2/4(50.0%),5年生存率1/3(33.3%);其他3年生存率2/5(40.0%),5年生存率0%。,对差错的辨析与释疑 此题中各种肉瘤例数太少,只能用绝对例数表示有关结果,不适合求生存率。原作者只凭几例病例即得出各种肉瘤患者的生存质量,属于滥用相对数。,释疑 宜用表格列出各种肉瘤患者的生存人数、

15、死亡人数,不计算生存率。,8、用t检验处理定性资料(结果变量为有序变量的二维列联表资料) 原文题目:分泌性中耳炎免疫球蛋白检测和抗原变态反应,实验选取了32例分泌性中耳炎患者,治疗前对32例鼓室穿刺抽出液和治疗前、治疗后3个月采取外周血,测IgA、IgM、IgG,随机将32例患者分为两组,实验组18人、对照组14人.,治疗方法:实验组为强的松+4000U的-糜蛋白酶混合液,每周注射1次共2次,每日口服酮替分1mg,连续1月,口服诺氟沙星2.0g连续1周,3%的麻黄素滴鼻;对照组为仅注射糜蛋白酶,剂量和时间同治疗组,每日口服诺氟沙星2.0g连续1周,3%的麻黄素滴鼻。,原作者得出的结果之一:32

16、例患者均完成随访,治疗3个月后,治疗组有效6例,痊愈12例,对照组无效3例,有效4例,痊愈7例。经t检验(t=2.367,P0.05),两组间差异有显著性。,对差错的辨析 根据原文资料描述将数据列表如下: 例 数 组别 疗效: 痊愈 有效 无效 合计 治疗 12 6 0 18 对照 7 4 3 14,疗效:“痊愈、有效、无效”是一个有序的结果变量,而且观察结果为例数。从表中可看出,这是一个结果变量为单向有序的二维列联表资料,原作者采用分析定量资料的t检验,显然是错误的。,释疑 此资料适合选用结果变量为有序变量的单向有序列联表资料的统计分析方法:秩和检验或Ridit分析。这里用秩和检验,检验结果

17、为:H=339312,查2表,得Hc 20.05=3.84,接受H0,拒绝H1。结论:治疗组与对照组疗效之间的差别无统计学意义,与原作者的结论相反。,例11:我“会用”秩和检验啦!,表3 CAM-1和CD44s的表达与食管癌TNM分期的关系 - 分期 n X/n H P - a 7 3/7 b 10 8/10 6.1191 0.0134 23 21/23 -,(例11)续,表3 CAM-1和CD44s的表达与食管癌TNM分期的关系 - 分期 阳性数 阴性数 合计 - a 3 4 7 b 8 2 10 21 2 23 -,正确列表格式,有1/2格内理论频数小于5, 故宜选用Fisher的精确检验。,例12:用卡方检验实现 定性资料的相关分析,年龄 例数 ! (岁) X:+ + + 20 215 67 8 30 9 89 131 40 248 168 4 2=503.776,P0.0001 结论:年龄与指标X的取值间有直线相关关系。(对吗?),分析与释疑,分析上面的资料前,应先叫出列联表的正确名称,然后

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论