




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、卡方检验及卡方检验及SPSSSPSS分析分析 Chi-Square Test 主要内容主要内容 v第一节第一节 四格表资料的四格表资料的 检验检验 v第二节第二节 配对四格表资料的配对四格表资料的 检验检验 v第三节第三节 四格表资料的四格表资料的Fisher确切概率法确切概率法 v第四节第四节 行行列表资料的列表资料的 检验检验 v第五节第五节 多个样本率间的多重比较多个样本率间的多重比较 2 2 2 SPSS统计分析统计分析 v交叉表交叉表(Crosstabs)过程 (一)四格表(fourfold data)资料的x2检验 (二)配对(paired data)资料的x2检验 (三)RC表资
2、料的x2检验 (四)两分类变量有无关联分析及列联系数C v卡方卡方(Chi-Square)过程 (五)拟合问题-比较样本与已知总体的分布 第一节第一节 四格表资料的四格表资料的 检验检验 x2 test of fourfold data 2 目的:目的:推断两个总体率(构成比)是否有差推断两个总体率(构成比)是否有差 别(和率的别(和率的u u检验等价)检验等价) 要求:要求:两样本的两分类个体数排列成四格表两样本的两分类个体数排列成四格表 资料资料 2 xv 值计算 Pearson卡方值: 自由度: T TA 2 2 )( ) 1)(1(CR 一、一、 检验的基本思想检验的基本思想 2 x
3、分布分布 2 x 2 x 实例分析实例分析 例例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞地塞 米松(对照组)降低颅内压的疗效。将米松(对照组)降低颅内压的疗效。将200例颅内压增高症患例颅内压增高症患 者随机分为两组,结果见表者随机分为两组,结果见表7-1。问两组降低颅内压的总体有。问两组降低颅内压的总体有 效率有无差别?效率有无差别? 表表7-1 两组降低颅内压有效率的比较两组降低颅内压有效率的比较 检验基本步骤检验基本步骤 2 计算理论频数: 计算 统计量 2 n nn T cR RC 建立检验假设 : 两总体阳性率相等 : 两总体
4、阳性率不等 c p 21 H0 H1 21 2222 2 (9990.48)(5 13.52)(75 83.52)(21 12.48) 90.4813.5283.5212.48 12.86 1) 12)(12( 值的校正值的校正 v 四格表 检验的条件: 1) 2) 3) v 校正公式: 2 公式;用不校正的且 2 ,540Tn 公式;用校正的个格子且至少 2 , 51140Tn 需用确切概率法或, 140Tn T TA 2 2 )5 . 0( 2 )()()( )2/( 2 2 dbcadcba nncbad SPSS操作过程操作过程 v建立数据文件:chis01.sav 数据格式:包括4行
5、3列的频数格式,3个变量即行变量 (group)、列变量(effect)和频数变量(freq)。 v说明频数变量:数据 加权个案 Data Weight Cases v x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs v结合例7-1数据(chis01.sav)演示操作过程。 分类数据录入格式分类数据录入格式 v频数格式:用数据 加权个案(Weight Cases)过 程以指明反映频数的变量。 v枚举格式: 交叉表(交叉表(Crosstabs)过程)过程 vCrosstabs过程用于对分类资料和有序分类资料进行 统计
6、描述和统计推断。 v该过程可以产生2维至n 维列联表,并计算相应的百 分数指标。 v统计推断包括了常用的x2检验、Kappa值,分层X2 (X2M-H),以及四格表资料的确切概率(Fishers Exact Test)值。 Crosstabs过程祥解过程祥解 v 界面说明界面说明 -行Rows框用于选择行列表中的行变量。 -列Columns框用于选择行列表中的列变量。 -层Layer框指定分层变量,即控制变量。如果要指定 不同的分层变量做分析,则将其选入Layer框,并 用Previous和Next钮设为不同层。 -Display clustered bar charts 复选框:显示复式条图
7、 -Suppress table复选框:不在输出结果中给出行列 表。 Crosstabs过程祥解过程祥解 v界面说明界面说明 精确(Exact)子对话框:针对22以上的行列表 设计计算确切概率的方法。 统计量(Statistics)子对话框:用于定义所需计算 的统计量 -Chi-square 复选框:计算pearson卡方值,对四格表 资料自动给出校正卡方检验和确切概率法结果。 -Correlations复选框:计算行列变量的pearson相关系 数和Spearman等级相关系数。 Crosstabs过程祥解过程祥解 v界面说明界面说明 -Kappa复选框:计算Kappa值,即内部一致性系数,
8、 介于00.7071之间; -Risk复选框:计算比数比OR值、RR值; -McNemanr复选框:进行配对卡方检验的McNemanr 检验(一种非参数检验) -Cochrans and Mantel-Haenszel statistics复选框:计 算X2M-H统计量、X2CMH,可在下方输出H0假设的OR 值,默认为1。 Crosstabs过程祥解过程祥解 v界面说明界面说明 单元格(Cells)子对话框:用于定义列联表单元格 中需要计算的指标。 -Counts复选框:是否输出实际观察数(Observed) 和理论频数(Expected) -Percentages复选框:是否输出行百分数(
9、Row)、 列百分数(Column)以及合计百分数(Total) -Residuals复选框:选择残差的显示方式 格式(Format)子对话框:用于选择行变量是升序 还是降序排列。 SPSS结果输出结果输出 group* effect 交叉制表group* effect 交叉制表 995104 90.513.5104.0 752196 83.512.596.0 17426200 174.026.0200.0 计数 期望的计数 计数 期望的计数 计数 期望的计数 实验组 对照组 group 合计 有效无效 effect 合计 SPSS结果输出(续)结果输出(续) 结论:结论:x2=12.857,
10、 df=1,双侧双侧PKappa 0.4一致性一般 Kappa0.4一致性较差 SPSS结果输出结果输出 卡方检验卡方检验 .013a 58 McNemar 检验 有效案例中的 N 值 精确 Sig. (双侧) 使用的二项式分布。 a. 对称度量对称度量 .455.1153.762.000 58 Kappa一致性度量 有效案例中的 N 值渐进标准误差 a 近似值 Tb近似值 Sig. 不假定零假设。 a. 使用渐进标准误差假定零假设。 b. 结论:配对结论:配对x2检验的检验的P0.05,可以认为两种方法的检测结果差别,可以认为两种方法的检测结果差别 显著,免疫荧光法的总体阳性检出率要高于乳胶
11、凝集法;对两种显著,免疫荧光法的总体阳性检出率要高于乳胶凝集法;对两种 检测方法的一致性检验检测方法的一致性检验Kappa=0.455,P0.01,说明两种方法的,说明两种方法的 吻合度有统计学意义,但吻合度一般。吻合度有统计学意义,但吻合度一般。 第四节第四节 行列表资料的表资料的 检验检验 test of RC table 2 行行列表资料列表资料 多个样本率比较时,有R行2列,称为R 2表; 两个样本的构成比比较时,有2行C列,称2C表; 多个样本的构成比比较,以及双向无序分类资料关联 性检验时,称为R C表。 检验统计量检验统计量 2 2 (1) (1)(1) R C A n n n
12、行数列数 一、多个样本率的比较一、多个样本率的比较 疗法 有效 无效 合计 有效率(%) 物理疗法组 199 7 206 96.60 药物治疗组 164 18 182 90.11 外用膏药组 118 26 144 81.94 合计 481 51 532 90.41 例7-6 某医师研究物理疗法、药物治疗和外用膏药 三种疗法治疗周围性面神经麻痹的疗效,资料见表 7-8。问三种疗法的有效率有无差别? 表7-8 三种疗法有效率的比较 0 H : 321 ,即三种疗法有效率相等 1 H :三种疗法有效率不全相等 05.0 04.21) 1 51144 26 51206 7 481206 199 (53
13、2 222 2 2) 12)(13( 查 2 界值表得005.0P。按05.0检验水准拒绝 0 H, 接受 1 H,可以认为三种疗法治疗周围性面神经麻痹 的有效率有差别。 检验步骤: SPSS操作过程(行操作过程(行列表卡方检验)列表卡方检验) v建立数据文件:chis02.sav(例7-6数据) 数据格式:包括6行3列的频数格式,3个变量分别为 行变量、列变量和频数变量。 v说明频数变量:数据 加权个案 Data Weight Cases v x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs v结合例7-6数据(c
14、his02.sav)演示操作及界面。 SPSS结果输出结果输出 SPSS结果输出(续)结果输出(续) 卡方检验卡方检验 21.038a2.000 21.5592.000 20.9031.000 532 Pearson 卡方 似然比 线性和线性组合 有效案例中的 N 值df 渐进 Sig. (双侧) 0 单元格(.0%) 的期望计数少于 5。最小期望 计数为 13.80。 a. 结论:按结论:按=0.05检验水准拒绝检验水准拒绝H0,接受,接受H1,可以,可以 认为三种疗法治疗周围性面神经麻痹的总体有效率认为三种疗法治疗周围性面神经麻痹的总体有效率 有差别。有差别。 二、样本构成比的比较二、样本
15、构成比的比较 例7-7 某医师在研究血管紧张素I转化酶(ACE)基因 I/D多态(分3型)与2型糖尿病肾病(DN)的关系时, 将249例2型糖尿病患者按有无糖尿病肾病分为两组, 资料见表7-9。问两组2型糖尿病患者的ACE基因型 总体分布有无差别? 表7-9 DN组与无DN组2型糖尿病患者ACE基因型分布的比较 检验步骤检验步骤 0 H:两组总体构成比相同 1 H:两组总体构成比不同 05. 0 91. 7) 1 57138 36 120111 48 72111 42 (249 222 2 2) 13)(12( 查 2 界值表得025. 001. 0 P。按05. 0检验水准 拒绝 0 H ,
16、接受 1 H,可认为 DN 与无 DN 的 2 型糖尿病 患者的 ACE 基因型分布不同。 三、双向无序分类资料的关联性检验三、双向无序分类资料的关联性检验 表中两个分类变量皆为无序分类 变量的行 列表资料,又称为双向无序 表资料。 注意: 双向无序分类资料为两个或多个样 本,做差别检验(例7-7);若为单样本, 做关联性检验(例7-8) 。 CR CR 例例 7-8 测得某地测得某地5801人的人的ABO血型和血型和MN血型结果血型结果 如表如表7-10,问两种血型系统之间是否有关联?,问两种血型系统之间是否有关联? 表7-10 某地5801人的血型 MN 血型 ABO 血型 M N MN
17、合计 O 431 490 902 1823 A 388 410 800 1598 B 495 587 950 2032 AB 137 179 32 348 合计 1451 1666 2684 5801 (单样本,做关联性检验)(单样本,做关联性检验) 表7-10资料,可用行列表资料 检验来推 断两个分类变量之间有无关系(或关联);若有关 系,可计算Pearson列联系数C进一步分析关系的 密切程度: 2 2 C n 列联系数C取值范围在00.7071之间。0表 示完全独立;0.7071表示完全相关。 2 检验步骤检验步骤 0 H:两种血型系统间无关联 1 H:两种血型系统间有关联 05. 0
18、222 2 43149032 5801(1) 1823 14511823 1666348 2684 213.16 (4 1)(3 1)6 查 2 界值表得 P0.05。按05. 0检验水准 拒绝 0 H,接受 1 H,可认为两种血型系统间 有关联,其 Pearson 列联系数为 2 2 213.16 0.1883 5801213.16 C n 由于列联系数C=0.1883,数值较小,故认为两 种血型系统间虽然有关联性,但关系不太密切。 SPSS操作过程操作过程 v 建立数据文件:chis04.sav 数据格式:包括12行3列的频数格式,三个变量分别为行变 量、列变量和频数变量。 v 说明频数变
19、量:数据 加权个案 Data Weight Cases v x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs v 统计量Statistics: Chi-square 名义 相依系数Contingency coefficient SPSS输出结果输出结果 ABO* MN 交叉制表ABO* MN 交叉制表 4314909021823 456.0523.6843.51823.0 3884108001598 399.7458.9739.41598.0 4955879502032 508.3583.6940.22032.0 1
20、3717932348 87.099.9161.0348.0 1451166626845801 1451.01666.02684.05801.0 计数 期望的计数 计数 期望的计数 计数 期望的计数 计数 期望的计数 计数 期望的计数 o A B AB ABO 合计 MNMN MN 合计 卡方检验卡方检验 213.162a6.000 248.1436.000 51.3361.000 5801 Pearson 卡方 似然比 线性和线性组合 有效案例中的 N 值df 渐进 Sig. (双侧) 0 单元格(.0%) 的期望计数少于 5。最小期望 计数为 87.04。 a. 对称度量对称度量 .188.
21、000 5801 相依系数按标量标定 有效案例中的 N 值近似值 Sig. 不假定零假设。 a. 使用渐进标准误差假定零假设。 b. 1 1行列表中的各格行列表中的各格T T11,并且,并且11T T5 5的格子数不的格子数不 宜超过格子总数的宜超过格子总数的1/51/5,否则可能产生偏性。处理,否则可能产生偏性。处理 方法有三种:方法有三种: (1 1)增大样本含量以达到增大理论频数的目的(首选)。)增大样本含量以达到增大理论频数的目的(首选)。 (2 2)根据专业知识,删去理论频数太小的行或列,或将理根据专业知识,删去理论频数太小的行或列,或将理 论频数太小的行或列与性质相近的邻行或邻列合
22、并。如:论频数太小的行或列与性质相近的邻行或邻列合并。如: 不同年龄组可以合并,但不同血型就不能合并。不同年龄组可以合并,但不同血型就不能合并。 (3 3)改用双向无序)改用双向无序R RC C表的表的FisherFisher确切概率法。确切概率法。 四、行四、行列表资料列表资料 检验的注意事项检验的注意事项 2 第五节第五节 多个样本率间的多重比较多个样本率间的多重比较 Multiple comparison of sample rates 一、基本思想一、基本思想(卡方(卡方分割法)分割法) 因分析目的不同,k个样本率两两比较的次数不 同,故重新规定的检验水准的估计方法亦不同。通 常有两种
23、情况: 1多个实验组间的两两比较 分析目的为 k 个实验 组间,任两个率均进行比较时,须进行 2 k 次独立的四格 表 2 检验,再加上总的行列表资料的 2 检验,共 1 2 k 次检验假设。故检验水准 用下式估计 1 2 = k + 式中 2 ) 1( )!2( ! 2 ! 2 kk k k k ,k为样本率的个数。 2实验组与同一个对照组的比较 分析目 的为各实验组与同一个对照组的比较,而各实 验组间不须比较。其检验水准 用下式估计 2(1)k 式中k为样本率的个数。由该式估计的检验 水准 较保守( 通常较小) 。 例7-9 对例7-6中表7-8的资料进行两 两比较,以推断是否任两种疗法治
24、疗周围性 面神经麻痹的有效率均有差别? 检验步骤检验步骤 0 H: 21 ,即任两对比组的总体有效率相等 1 H: 21 ,即任两对比组的总体有效率不等 05. 0 本例为3个实验组间的两两比较 0.05 0.05/40.0125 3(3 1)/2 1 表7-12 三种疗法有效率的两两比较 按0125. 0 检验水准, 物理疗法组与药物治疗 组拒绝 0 H,接受 1 H;物理疗法组与外用膏药组拒绝 0 H,接受 1 H;药物治疗组与外用膏药组不拒绝 0 H。 可认为物理疗法与药物治疗、外用膏药的有效率均 有差别,还不能认为药物治疗与外用膏药的有效率 有差别。结合表 7-8 资料,可认为物理疗法
25、组的总体 有效率高于其它两组,但尚不能认为药物治疗组与 外用膏药组的总体有效率不等。 例 7-10 以例7-6表7-8资料中的药物治疗组为对照组, 物理疗法组与外用膏药组为试验组,试分析两试验组与 对照组的总体有效率有无差别? 0 H: CT ,即各试验组与对照组的总体有效率相等 1 H: CT ,即各试验组与对照组的总体有效率不等 05. 0 本例为各实验组与同一对照组的比较本例为各实验组与同一对照组的比较 0125. 0 ) 13(2 05. 0 物理疗法组与药物治疗组比较:76. 6 2 ,0125. 0P 外用膏药组与药物治疗组比较:59. 4 2 ,0125. 0P 第三节第三节 四
26、格表资料的四格表资料的Fisher确切概率法确切概率法 Fisher probabilities in fourfold data (一)适用条件(一)适用条件 T1或 n40 P (二)基本思想(超几何分布)(二)基本思想(超几何分布) ! )!()!()!()!( ndcba dbcadcba P i 在四格表周边合计不变的条件下,直接计算表内四个数据的各 种组合之概率。找出 的所有表格并将概率求 和,若这些表的合计P ,则推翻H0假设。 TATA原表 (三)检验步骤(三)检验步骤 假设H0、H1 2. 计算最小理论频数 及 值TA 边缘合计不变条件下,变动表中数据 3. 找出边缘合计中的
27、最小值 min m min T min T min m 对应的格子中的数据从0 到 ,排出所有 可能的四格表。 5. 选出 值的所有表,分别求P 值后相加。 TATA原表 病人分型阳性数阴性数合计阳性率% 活动型1(2.4)14(12.6)156.67 稳定型3(1.6)7(8.4)1030.00 合计4212516.00 表 7 两型慢性布氏病的PHA皮试反应 (四)应用 (结合实例) 表表 8 确切概率法计算表(四格表周边合计不变)确切概率法计算表(四格表周边合计不变) 序号( i )阳性阴性P( i ) 0 0 15 2.40.0166 4 6 1 1 14 1.40.1423 3 7 2 2 13 0.4 2 8 3 3 12 0.6 1 9 4 4 11 1.60.1079 0 10 TA SPSS操作过程操作过程 v建立数据文件:chis05.sav(表7数据) 数据格式:包括4行3列的频数格式,3个变量即行变量 (group)、列变量(effect)和频数变量(freq)。 v说明频数变量:数据 加权个案 Data Weight Cases v x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Stat
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 卫生管理证书考试的影响因素试题及答案
- 药物疗效评估标准考试试题及答案
- 心理咨询师考试中学员心理疏导策略试题及答案
- 心理咨询师考试角色扮演演练试题及答案
- 药物经济学方法应用试题及答案
- 深入讨论卫生管理考点试题及答案
- 知识分享与专利的试题及答案
- 单招大专笔试题及答案
- 衛生管理與服務效率考題
- 药物信息传播方式试题及答案
- GA/T 1356-2018国家标准GB/T 25724-2017符合性测试规范
- 杜威《民主主义与教育》课件
- 强夯监理实施细则
- 2022邮储银行综合柜员(中级)理论考试题库大全-上(单选、多选题)
- 《财务风险的识别与评估管理国内外文献综述》
- 《三角形的外角》优秀课件
- 如何进行社会调查研究课件
- 鹌鹑蛋脱壳机的设计
- 项目管理进度表模板(全流程)
- 锅炉专业术语解释及英文翻译对照
- 《小石潭记》作业设计
评论
0/150
提交评论