




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.3列联表与独立性检验1.通过实例,理解分类变量与2×2列联表的统计意义.能用等高堆积条形图、列联表探讨两个分类变量的关系.2.通过实例,了解χ2的含义及应用,理解独立性检验的基本思想,独立性检验的实施步骤,并能应用解决实际问题.3.通过2×2列联表统计意义的学习,体会数学抽象的素养.4.借助χ2计算公式进行独立性检验,培养数学运算和数据分析的素养.知识点一分类变量与列联表(一)教材梳理填空1.分类变量我们经常会使用一种特殊的随机变量,以区别不同的
或
,这类随机变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的
,称为列联表.现象性质频数表[微思考]
如何用列联表判定两个分类变量是否有关系?
提示:利用列联表中的数据计算,若P(Y=1|X=0)=P(Y=1|X=1),则说明两分类变量无影响,若P(Y=1|X=0)≠P(Y=1|X=1),则说明两分类变量有影响.XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d3.等高堆积条形图(1)等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)如果直接观察等高堆积条形图发现P(Y=1|X=0)与P(Y=1|X=1)相差很大,就可以判断两个分类变量之间有关系.(二)基本知能小试1.判断正误(1)分类变量中的变量与函数中的变量是同一概念.
(
)(2)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系.
(
)答案:(1)×
(2)√2.下列关于等高堆积条形图的叙述正确的是
(
)A.从等高堆积条形图中可以精确地判断两个分类变量是否有关系B.从等高堆积条形图中可以看出两个变量频数的相对大小C.从等高堆积条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对解析:在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高堆积条形图中仅能够找出频率,无法找出频数.答案:C
3.为了解某挑战赛中是否接受挑战与受邀者的性别是否有关系,得到关于分类变量X,Y的列联表如下:则表中a,b处的值分别为________.解析:∵a+21=73,∴a=52.b=a+8=52+8=60.答案:52,60性别挑战合计不接受挑战(Y=0)接受挑战(Y=1)男生(X=0)a2173女生(X=1)82533合计b46106知识点二独立性检验(一)教材梳理填空1.定义:利用χ2的取值推断分类变量X和Y
的方法称为χ2独立性检验,读作“卡方独立性检验”,简称
.3.小概率值α的检验规则(1)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;(2)当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.是否独立独立性检验4.临界值表5.应用独立性检验解决实际问题包括的主要环节(1)提出零假设H0:X和Y
,并给出在问题中的解释;(2)根据抽样数据整理出2×2列联表,计算
的值,并与
比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.α0.10.050.010.0050.001xα2.706____________6.6357.879________3.84110.828相互独立临界值xα[微思考]
有人说:“根据小概率值α=0.01的独立性检验认为吸烟和患肺癌有关”,是指“每100个吸烟者中就会有1个患肺癌.”你认为这种观点正确吗?为什么?提示:观点不正确.“根据小概率值α=0.01”说明的是吸烟与患肺癌有关程度的概率值,不是患肺癌的百分数.(二)基本知能小试1.判断正误(1)在独立性检验中,若χ2越大,则两个分类变量有关系的可能性越大.
(
)(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的.
(
)答案:(1)√
(2)×2.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且根据小概率值α=0.01的独立性检验认为这个结论是成立的.下列说法中正确的是
(
)A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有解析:这是独立性检验,根据小概率值α=0.01的独立性检验认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.答案:D
3.根据下表计算:χ2≈________(保留3位小数).性别X是否看电视Y合计不看电视(Y=0)看电视(Y=1)男(X=0)3785122女(X=1)35143178合计72228300题型一用2×2列联表分析两变量间的关系
[探究发现]借助列联表,通过比较哪些值来反映出两个分类变量的相互影响?提示:将P(Y=1|X=0)与P(Y=1|X=1)的值相比较.若近似相等,则表明两分类变量无关;若有差异,则表明两分类变量有关系.
[学透用活][典例1]在对人们饮食习惯的一次调查中,从某一居民小区中共调查了124位居民,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用P(Y=1|X=0)与P(Y=1|X=1)判断二者是否有关系.饮食年龄合计六十岁以上(Y=0)六十岁以下(Y=1)以蔬菜为主(X=0)432164以肉类为主(X=1)273360合计7054124(1)作2×2列联表时,关键是对涉及的变量分清类别,同时计算时要准确无误.(2)利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将P(Y=1|X=0)与P(Y=1|x=1)的值相比,可直观地反映出两个分类变量间是否相互影响.则当m取下面何值时,X与Y之间没有影响
(
)A.8
B.9C.14 D.19XY合计Y=0Y=1X=0101828X=1m26m+26合计10+m44m+54题型二用等高堆积条形图分析两变量间的关系
[学透用活]在等高堆积条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论,这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.[典例2]为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:分组尿液定性合计阳性(Y=0)阴性(Y=1)病人组(X=0)29736对照组(X=1)92837合计383573试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?等高堆积条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.利用等高条形图判断两个分类变量是否相关的步骤(1)收集数据,统计结果;(2)列出2×2列联表,计算频率粗略估计;(3)画等高条形图,直观分析.
心情性格合计性格内向(Y=0)性格外向(Y=1)心情紧张(X=0)332213545心情不紧张(X=1)94381475合计4265941020图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类型有关.题型三有关独立性检验的计算
[学透用活]1.用χ2进行独立性检验的依据独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量独立”成立,计算随机变量χ2的值,如果χ2值很大,说明假设不合理.χ2越大,两个分类变量有关系的可能性越大.2.独立性检验与反证法的异同点
(1)两者都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.(2)但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生;而独立性检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生.性别休闲方式合计运动(Y=0)非运动(Y=1)男生(X=0)
女生(X=1)
合计
(2)根据小概率值α=0.05的独立性检验,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?[解]
(1)补全2×2列联表如下.利用χ2进行独立性检验的步骤(1)列表:列出2×2列联表.(2)求值:计算出χ2的值.(3)判断:与临界值xα比较,得出事件有关的可能性大小,作出判断.
[对点练清]1.[变设问]根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动?2.[变条件,变设问]若增加条件n=100,问能否根据小概率值α=0.1的独立性检验,可认为“性别与休闲方式有关”?解:零假设为H0:性别与休闲独立,即性别与休闲方式无关.3.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:根据列联表的独立性检验,能否根据小概率值α=0.005的独立性检验,认为员工工作态度与支持企业改革之间有关系?工作态度对待改革态度合计积极支持(Y=0)不太支持(Y=1)工作积极(X=0)544094工作一般(X=1)326395合计86103189题型四独立性检验的综合应用
[学透用活][典例4]某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有50人,一年后对两班进行测试,成绩分别如表1和表2所示(总分:150分):表1表2成绩[80,90)[90,100)[100,110)[110,120)[120,130)频数42015101成绩[80,90)[90,100)[100,110)[110,120)[120,130)频数11123132(1)现从甲班成绩位于[90,120)内的试卷中抽取9份进行试卷分析,用什么抽样方法更合理?并写出最后的抽样结果;(2)根据所给数据可估计在这次测试中,甲班的平均分是101.8,请你估计乙班的平均分,并计算两班平均分相差几分;(3)完成下面2×2列联表,你能否根据小概率值α=0.05的独立性检验,认为
“这两个班在这次测试中成绩的差异与实施课题实验有关”吗?并说明理由.班级成绩合计成绩小于100分(Y=0)成绩不小于100分(Y=1)甲班(X=0)a=______2650乙班(X=1)12d=______50合计3664100(3)补全列联表如下.班级成绩合计成绩小于100分(Y=0)成绩不小于100分(Y=1)甲班(X=0)a=242650乙班(X=1)12d=3850合计3664100[方法技巧](1)独立性检验在实际中有着广泛的应用,是对实际生活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者生产都有一定的指导作用.(2)近几年高考中较少单独考查独立性检验,经常与统计、概率等知识综合,频率分布表、频率分布直方图与独立性检验融合在一起是常见的考查形式,一般需要根据条件列出2×2列联表,计算χ2的值,从而解决问题.[对点练清]某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断能否根据小概率值α=0.05的独立性检验,认为“该校学生的每周平均体育运动时间与性别有关”.P(χ2≥xα)0.100.050.0100.005xα2.7063.8416.6357.879运动时间性别合计男生(Y=0)女生(Y=1)不超过4小时(X=0)453075超过4小时(X=1)16560225合计21090300[课堂思维激活]一、综合性——
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学工程石油化工工艺知识点解析
- 《电路基础知识》:初中电路与物理原理教案
- 销售业务合同主要条款一览表
- 方出轨离婚协议书
- 人工智能与新质生产力对全球价值链的影响
- 地理信息系统GIS专业知识应用题
- 古诗词鉴赏方法:初中阶段
- 低空经济对无人机产业标准化的推动
- 餐饮外卖业务量统计表
- 甜高粱制取酒精系统项目创业计划书
- 2025年全国统一高考数学试卷(全国一卷)含答案
- 会计领军考试题库及答案
- 会计领军人才试题及答案
- 前期物业服务合同解除权法律问题研究
- (广东省卷)2025年中考考前最后一卷生物试卷(含答案)
- 体育聘用合同协议书模板
- 多校下学期期中考试八年级语文试卷(PDF版含答案)-1
- 2024年安徽省初中(八年级)学业水平考试初二会考生物+地理试卷真题
- 2024年江西省中考生物·地理合卷试卷真题(含答案)
- 车间安全环保培训知识
- 水库课程设计案例
评论
0/150
提交评论