版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1.2 1.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用 在统计学中,独立性检验就是检验两个分类变量是在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。否有关系的一种统计方法。 所谓所谓“分类变量分类变量”,就是指个体所属的类别不同,就是指个体所属的类别不同,也也称为称为属性变量属性变量或或定型变量定型变量。例如性别,是否吸烟,宗教。例如性别,是否吸烟,宗教信仰,国籍,等等信仰,国籍,等等 在日常生活中,我们常常关心两个分类变量之间是在日常生活中,我们常常关心两个分类变量之间是否有关系,例如吸烟是否与患肺癌有关系?性别是否对否有关系,例如吸烟是否与患肺
2、癌有关系?性别是否对于喜欢数学课程有影响等等。于喜欢数学课程有影响等等。 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表2 22 21.1.在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌
3、的比重是 0.54%0.54%2.28%2.28%2. 2. 通过图形直观判断通过图形直观判断二维二维条形图条形图3.3.通过图形直观判断通过图形直观判断患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例等高等高条形图条形图 独立性检验 通过数据和图表分析,得到结通过数据和图表分析,得到结论是:论是:吸烟与患肺癌有关吸烟与患肺癌有关结论的可靠结论的可靠程度如何?程度如何? 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d引入一个随机变量引入一个随机变
4、量:卡方统计量卡方统计量作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准 。dcban其中dbcadcbabcadnk22 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965由由2 22 2列联表,得列联表,得29965 7775 49 42 209956.632 10.8287817 2148 9874 91k故有故有99.9%99.9%的把握认为的把握认为“患肺癌与吸烟有
5、患肺癌与吸烟有关系关系”。解:解:a+b+c+da+b+c+db+db+da+ca+c总计总计c+dc+dd dc ca+ba+bb ba a总计总计一般地,对于两个分类变量一般地,对于两个分类变量x x和和y y。x x有两类取值:有两类取值:即类即类 和和 (如吸烟与不吸烟);(如吸烟与不吸烟);y y也有两类取值:也有两类取值:即类即类 和和 (如患病与不患病)。于是得到下列样(如患病与不患病)。于是得到下列样本频数的本频数的2 22 2列联表为:列联表为:x1x2y2y1y1y2x1x2 用卡方统计量来确定在多大程度上可以认为用卡方统计量来确定在多大程度上可以认为“两个分类变量有关系两
6、个分类变量有关系”的方法称为这两个分类变的方法称为这两个分类变量的独立性检验。量的独立性检验。要推断要推断“x x和和y y有关系有关系”,可按下面的步骤进行:,可按下面的步骤进行:(3 3)查对临界值表,作出判断。)查对临界值表,作出判断。(2 2)根据)根据2 22 2列联表与公式计算列联表与公式计算 的值;的值;k2k0k0k0.050.0250.0100.0050.0013.8415.0246.6357.87910.828p( ) 0.500.400.250.150.100.4550.7081.3232.0722.706(1 1)根据题意,列)根据题意,列2 22 2列联表;列联表;例
7、例. .在某医院在某医院, ,因为患心脏病而因为患心脏病而住院的住院的665665名男性病人中名男性病人中, ,有有214214人秃顶人秃顶; ;而另外而另外772772名不是名不是因为患心脏病而住院的男性病因为患心脏病而住院的男性病人中有人中有175175秃顶秃顶. .用独立性检验用独立性检验方法判断秃顶与患心脏病是否方法判断秃顶与患心脏病是否有关系有关系? ?解:秃顶与患心脏病列联表解:秃顶与患心脏病列联表患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437所以我们有所以我们有99.9%99.9%的把握认为的把握认为
8、“秃顶与患秃顶与患心脏病有关心脏病有关”21437 (214 597 175 451)16.373 10.828389 1048 665 772k根据根据2 22 2列联表得列联表得练练1 1 为考察高中生的性别与是否喜欢数学课程之间的关为考察高中生的性别与是否喜欢数学课程之间的关系。在某城市的某校高中生随机抽取系。在某城市的某校高中生随机抽取300300名学生。得到名学生。得到如下列联表:如下列联表:性别与喜欢数学课程列联表性别与喜欢数学课程列联表喜欢喜欢不喜欢不喜欢总计总计男男37378585122122女女3535143143178178总计总计7272228228300300 由表中数
9、据计算得到由表中数据计算得到k k2 2的观测值的观测值k4.514k4.514。能够。能够以以9595的把握认为高中生的性别与是否喜欢数学课程的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?之间有关系吗?为什么? 解:解: 我们所得到的我们所得到的 的观测值的观测值 超超过过3.8413.841,这就意味着,这就意味着“性别与是否喜欢性别与是否喜欢数学课程之间有关系数学课程之间有关系”这一结论是错误的这一结论是错误的可能性约为可能性约为0.050.05,即有,即有95%95%的把握认为的把握认为“性别与是否喜欢数学课程之间有关系性别与是否喜欢数学课程之间有关系”。2k514.
10、4k练练2: ( p15)甲乙两个班级进行一门考试甲乙两个班级进行一门考试, ,按照学生考试成绩优秀和按照学生考试成绩优秀和不优秀统计后不优秀统计后, ,得到如下列联表得到如下列联表: :优秀优秀不优秀不优秀总计总计甲班甲班103545乙班乙班73845总计总计177390画出列联表的条形图画出列联表的条形图, ,并通过图形判断成绩与班级是否并通过图形判断成绩与班级是否有关有关. .根据列联表的独立性检验根据列联表的独立性检验, ,判断成绩与班级是否判断成绩与班级是否有关系。有关系。100%90%80%70%60%50%40%30%20%10% 0%优秀优秀不优秀不优秀列联表的条形图:列联表的条形图: 由图及表直观判断,好像由图及表直观
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024设备委托开发版合同
- 2024软件订购合同书范本版
- 2024装饰合同范本
- 2024门面店铺转让合同协议
- 2024合同签署申请书范文
- 深圳大学《新闻传播学研究方法》2021-2022学年第一学期期末试卷
- 办公用房房屋租赁合同(2篇)
- 初三学生关于诚信的演讲稿5篇
- 写给老婆的检讨书范文(6篇)
- 关于文员类实习报告模板锦集6篇
- 2024年公安智能外呼项目合同
- 河南省信阳市2024-2025学年七年级上学期期中历史试题(含答案)
- GB/T 44570-2024塑料制品聚碳酸酯板材
- 2024年学校食堂管理工作计划(六篇)
- 体育赛事组织服务协议
- 天车工竞赛考核题
- 民办非企业单位理事会制度
- 临床输血的护理课件
- 民生银行在线测评真题
- 人教版(PEP)小学六年级英语上册全册教案
- 第二章 旅游线路类型及设计原则
评论
0/150
提交评论