版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2课时列联表与独立性检验1.掌握分类变量的含义.2.通过实例,理解2×2列联表的统计意义.3.通过实例,了解2×2列联表独立性检验及其应用.1.分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d2.等高堆积条形图(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征;(2)如果通过直接计算或等高堆积条形图发现aa+b和cc3.独立性检验(1)概念:利用随机变量χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;(2)χ2的计算公式:χ2=;(3)独立性检验的基本思想:独立性检验的基本思想类似于反证法,要判断“两个分类变量有关系”,首先假设该结论不成立,即H0:两个分类变量相互独立成立.在该假设下所构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2的观测值很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据推断H0不成立;(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);(5)应用独立性检验解决实际问题的主要环节①提出零假设H0:X和Y相互独立,并给出在问题中的解释;②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;③根据检验规则得出推断结论;④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.(6)独立性检验中几个常用的小概率值和相应的临界值:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8281.判断正误.(正确的画“√”,错误的画“×”)(1)2×2列联表中的数据是两个分类变量的频数.()(2)等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.()(3)χ2的大小是判断事件A和B是否相关的统计量.()(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.()(5)独立性检验的方法就是用的反证法.()2.观察下面各等高堆积条形图,其中两个分类变量关系最强的是()3.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是()A.均值 B.方差C.独立性检验 D.回归分析4.第19届亚运会于2023年9月23日在中国杭州举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,下表为“性别与会俄语”的2×2列联表,则a-b+d=.性别是否会俄语合计会俄语不会俄语男ab20女6d合计18505.(2024·南通模拟)已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界值表如下:α0.100.050.0250.0100.005xα2.7063.8415.0246.6357.879则最大有的把握说变量X,Y有关系(填百分数).分类变量与列联表【例1】(1)(多选)根据如图所示的等高堆积条形图,下列叙述正确的是()A.吸烟患肺病的频率约为0.2 B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05 D.吸烟与患肺病无关系(2)如下是一个2×2列联表,则m+n=.XY合计y1y2x1a3545x27bn合计m73s听课记录解题技法分类变量的两种统计表示形式(1)等高堆积条形图:根据等高堆积条形图的高度差判断两分类变量是否有关联及关联强弱;(2)2×2列联表:直接利用2×2列联表中的数据进行计算分析,用定量的方式判断两分类变量是否有关联及关联强弱.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:XY合计y1y2x1aba+bx2cdc+d合计a+cb+da+b+c+d对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为()A.a=9,b=3,c=2,d=1 B.a=9,b=2,c=3,d=1C.a=2,b=3,c=1,d=9 D.a=3,b=1,c=2,d=9分类变量关联性的判断【例2】(2024·滕州模拟)某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:患心脏病无心脏病秃发20300不秃发5450根据表中数据得到χ2≈15.968,因为χ2>10.828,则断定中年人秃发与患心脏病有关系.那么这种判断出错的可能性为()A.0.001 B.0.05C.0.025 D.0.01听课记录解题技法如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是()A.90% B.95%C.99% D.99.5%独立性检验的应用【例3】(2022·全国甲卷17题)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)根据小概率值α=0.1的独立性检验,能否认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:χ2=n(α0.1000.0500.010xα2.7063.8416.635解题技法独立性检验的一般步骤(1)根据样本数据制作2×2列联表;(2)根据公式χ2=n(ad(3)比较χ2与临界值的大小关系,作统计推断.某地区的一种传染病与饮用水的调查表如下:饮用水是否得病合计得病不得病干净水52466518不干净水94218312合计146684830(1)这种传染病是否与饮用水的卫生程度有关?请说明理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宋元城市规划发展的特点
- 绿色能源的兴起
- 对外汉语国画的课件
- 价值星系理论解释与价值与价值创造机制的构建
- 初中化学演示实验
- 大学和工作的人生规划
- 品管圈PDCA案例-中医医院减少住院患者艾灸烫伤率医院改善成果汇报
- 即兴表演课件
- 小学数学苏教版三年级上册第一单元两三位数乘一位数《笔算乘法(不连续进位)》教学课件
- 2025年元旦晚会模板喜庆红灯笼
- 建筑工程设计过程控制流程图
- EN779-2012一般通风过滤器——过滤性能测定(中文版)
- 宴会设计与服务
- 压力容器常规设计
- 道路两侧乔木修剪的施工方案
- 量学看盘决策系统使用说明
- 肉羊养殖小区设计图
- 年级组长工作手册1
- 动物医学-毕业论文
- actl是当前世界治疗癌症的领先技术
- 警服+春秋执勤服
评论
0/150
提交评论