列联表的独立性检验课件_第1页
列联表的独立性检验课件_第2页
列联表的独立性检验课件_第3页
列联表的独立性检验课件_第4页
列联表的独立性检验课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.5 列联表的独立性检验一、二维 列联表列表如下:令: 吸烟与肺癌列联表患肺癌不患肺癌总计吸烟603292不吸烟31114总计6343106为了调查吸烟是否对肺癌有影响,对63位肺癌患者及43位非患者(对照组)调查了其中的吸烟人数.22列联表二、二维 列联表的独立性检验列表如下: 称为Pearson 统计量 检验统计量例1 随机抽取某校男生35名,女生31,进行体育达标考核,结果如下表 问体育达标水平是否与性别有关?体育达标考核情况表达 标未 达 标合 计 男 15 20 35 女 13 18 31合 计 28 38 66体育达标水平与性别无关体育达标水平与性别有关(1)建立假设其结论为:体

2、育达标水平与性别无关.因此在0.05显著性水平下,接受原假设.R函数chisq.test ( ) xchisq.test(x, correct=F)R程序如下输出结果为 Pearsons Chi-squared testdata: x X-squared = 0.0057, df = 1, p-value = 0.9397因此在0.05显著性水平下,接受原假设.92页例2.14自己看2.5.2 Fisher精确检验不满足时, 用Pearson近似效果很差, 一般采用Fisher精确检验.在使用Pearson 独立性检验时, 要注意格子的期望频数小于5的格子数不超过总格子数的20%,且没有一个格

3、子的期望频数小于1Fisher精确检验对于单元频数小的表格特别适用四表格的Fisher精确检验频数四表格合计对应的概率四表格1合计假设边缘频数固定分别服从二项分布表示有属性A的个体中有属性B的条件概率表示没有属性A的个体中有属性B的条件概率则属性A和属性B相互独立即有属性A的个体中有属性B的个体的频率与没有属性A的个体中有属性B的个体的频率应该没有显著的差异.即有表示有属性A的个体中有属性B的比例高表示有属性A的个体中有属性B的比例低即即四表格的检验问题, 即属性A和B的独立性检验问题有Fisher精确检验的统计量假设边缘频数都固定事实上, 确定了, 其它三个值也就确定了则 有下面四种取值2

4、3 3 2 4 1 5 03 0 2 1 1 2 0 3利用公式可以计算出 取2, 3, 4, 5的概率在独立的原假设下, 取这些值的概率是不同的, 但各种取值都不会是小概率事件,过大或过小都可能拒绝原假设拒绝域形式为Fisher精确检验的计算比较复杂, 所以一般用于n比较小的四表格.例:为了解某种新药的疗效是否提高, 将42位病人随机分组注射两种药物, 试验结果如下表所示药物有效无效合计新8210旧141832合计222042R程序如下新药疗效没有提高新药疗效有提高 xfisher.test(x, alternative = greater)输出结果为Fishers Exact Test f

5、or Count Data data: x p-value = 0.04849 alternative hypothesis: true odds ratio is greater than 1 95 percent confidence interval: 1.010589 Inf sample estimates: odds ratio 4.950963拒绝原假设,认为备则假设成立.优势比优势比:属性A时,有属性B与没有属性B的优势.称条件概率与之比为当个体有为当个体没有属性A时, 有属性B与没有属性B的优势,称这两个优势的比为优势比下列结论成立:如果在有属性A的个体中有B的比例高, 则优

6、比OR1;如果在有属性A的个体中有B的比例低,则优比OR1如果属性A和属性B相互独立, 则优比OR=1.优势比大于1与新药较旧药疗效有提高等价.三、三维 列联表关于某项政策调查所得结果观点:赞成观点:不赞成低收入中等收入高收入低收入中等收入高收入男201055810女25157279大致可以看出女性赞成的多,低收入赞成的多三维 列联表观点赞成低收入中等收入高收入男202015女25157观点不赞成低收入中等收入高收入男5810女279性别男低收入中等收入高收入赞成201015不赞成5810性别女低收入中等收入高收入赞成25157不赞成279低收入中等收入高收入男252825女272216 低收入中等收入高收入赞成201015不赞成5810是是否否收入的“低”、“中”、“高”用代码1、2、3代表;性别的“女”、“男”用代码0、1代表;观点“赞成”和“不赞成”用1、0代表。有些计算机数据对于这些代码的形式不限(可以是数字,也可以是字符串)。 七.在SPSS数据表中的形式表是二维的,用变量和样本值表示先将定性变量数量化: 小 结 1. 非参数检验在假设检验中不对参数作明确的推断,也不涉及样本取自何种分布的总体。它的适用范围较广。常用的非参方法较为简便。易于理解掌

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论