人教A版高中数学(选择性必修三)同步培优讲义专题8.5 列联表与独立性检验(重难点题型精讲)(原卷版)_第1页
人教A版高中数学(选择性必修三)同步培优讲义专题8.5 列联表与独立性检验(重难点题型精讲)(原卷版)_第2页
人教A版高中数学(选择性必修三)同步培优讲义专题8.5 列联表与独立性检验(重难点题型精讲)(原卷版)_第3页
人教A版高中数学(选择性必修三)同步培优讲义专题8.5 列联表与独立性检验(重难点题型精讲)(原卷版)_第4页
人教A版高中数学(选择性必修三)同步培优讲义专题8.5 列联表与独立性检验(重难点题型精讲)(原卷版)_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题8.5列联表与独立性检验(重难点题型精讲)1.分类变量为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.2.2×2列联表假设两个分类变量X和Y,它们的可能取值分别为{SKIPIF1<0,SKIPIF1<0}和{SKIPIF1<0,SKIPIF1<0},其2×2列联表为2×2列联表给出了成对分类变量数据的交叉分类频数.3.等高堆积条形图常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显(即SKIPIF1<0和SKIPIF1<0相差很大),就判定两个分类变量之间有关系.

(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道两个分类变量有关系的概率大小.4.独立性检验(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.则SKIPIF1<0.(2)利用SKIPIF1<0的取值推断分类变量X和Y是否独立的方法称为SKIPIF1<0独立性检验,读作“卡方独立性检验”,简称独立性检验.

(3)SKIPIF1<0独立性检验中几个常用的小概率值和相应的临界值.【题型1列联表的应用】【方法点拨】利用列联表直接计算SKIPIF1<0和SKIPIF1<0,如果两者相差很大,就判断两个分类变量之间有关系的可能性较大.【例1】(2023·全国·高二专题练习)假设有两个分类变量x与y的2×2列联表如下表:yyxabxcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(

)A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=4【变式1-1】(2022春·福建厦门·高二阶段练习)在一次独立性检验中,得出列联表如图:且最后发现,两个分类变量A和B没有任何关系,则a的可能值是(

)AA合计B2008001000B180a180+a合计380800+a1180+aA.200 B.720 C.100 D.180单元测试)假设两个分类变量X和Y,他们的取值分别为{x1,yy总计xaba+bxcdc+d总计a+cb+da+b+c+d对于以下数据,对同一样本说明X与Y有关的可能性最大的一组是(

)A.a=10,b=5,c=8,d=6 B.a=9,b=5,c=7,d=8C.a=12,b=6,c=9,d=5 D.a=12,b=8,c=6,d=7【变式1-3】(2022·全国·高三专题练习)假设有两个分类变量X和Y的2×2列联表如下:注:K2的观测值k=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=n(aA.a=45,c=15 B.a=40,c=20 C.a=35,c=25 D.a=30,c=30【题型2等高堆积条形图的应用】【方法点拨】可以从等高堆积条形图中直观判断列联表数据的频率特征,这种直观判断的不足之处在于不能直接给出推断“两个分类变量有关系”犯错误的概率.【例2】(2022春·吉林·高二阶段练习)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是(

)A.是否倾向选择生育二胎与户籍无关B.是否倾向选择生育二胎与性别有关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数【变式2-1】(2022春·全国·高二期末)观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量χ2的观测值最小的是(

A. B.C. D.【变式2-2】(2023·全国·高二专题练习)观察下列各图,其中两个分类变量x,y之间关系最强的是(

)A. B.C. D.【变式2-3】(2023·高二课时练习)为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是(

)A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果【题型3独立性检验的应用】【方法点拨】可以利用独立性检验来推断两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法:(1)根据实际问题需要的可信程度(或容许犯错误概率的上界)确定临界值SKIPIF1<0;(2)利用公式,由观测数据计算得到SKIPIF1<0的值;(3)对照临界值表,即可得出结论.【例3】(2023·江西上饶·统考一模)新型冠状病毒感染,主要是由新型冠状病毒引起的,典型症状包括干咳、发热、四肢无力等,部分人群会伴有流鼻涕、拉肚子等症状.病人痊愈的时间个体差异也是比较大的,新型冠状病毒一般2-6周左右能恢复.某兴趣小组为进一步了解新型冠状病毒恢复所需时间,随机抽取了200名已痊愈的新型冠状病毒患者(其中有男性100名,女性100名)进行调查,得到数据如下表所示:痊愈周数性别1周2周3周4周5周6周大于6周男性4502412622女性24022161064若新型冠状病毒患者在3周内(含3周)痊愈,则称患者“痊愈快”,否则称患者“痊愈慢”.(1)分别估计男、女新型冠状病毒患者“痊愈快”的概率?(2)完成下面2×2列联表,并判断是否有95%的把握认为患者性别与痊愈快慢有关?痊愈快慢性别痊愈快痊愈慢总计男性女性总计附:K2P0.0500.0100.001k3.8416.63510.828【变式3-1】(2023春·河南安阳·高三阶段练习)2021年7月24日中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(以下简称“双减”),各省、市精心组织实施,强化目标管理,治理校外培训行为.为了调查人们对“双减”的满意程度,抽取了男、女各25人对“双减”的满意度进行调查,统计数据如表所示.满意非常满意合计男性18725女性61925合计242650(1)根据上表,如果随机抽查1人,那么抽到此人对“双减”满意的概率是多少?抽到此人对“双减”非常满意且是女性的概率是多少?(2)能否有99.9%附:K2=nP(0.0500.0100.001k3.8416.63510.828【变式3-2】(2023·内蒙古·模拟预测)国际足联世界杯(FIFAWorldCup),简称“世界杯”,是由全世界国家级别球队参与,象征足球界最高荣誉,并具有最大知名度和影响力的足球赛事.2022年卡塔尔世界杯共有32支球队参加比赛,共有64场比赛.某社区随机调查了街道内男、女球迷各200名,统计了他们观看世界杯球赛直播的场次,得到下面的列联表:少于32场比赛不少于32场比赛总计男球迷a+20a+20女球迷a+40a总计(1)求a的值,并完成上述列联表;(2)若一名球迷观看世界杯球赛直播的场次不少于32场比赛,则称该球迷为“资深球迷”,请判断能否有95%参考公式:K2=n参考数据:P0.100.050.0100.001k2.7063.8416.63510.828【变式3-3】(2023春·湖南·高三阶段练习)人们曾经相信,艺术家将是最后被AⅠ所取代的职业,但技术的进步已经将这一信念敲出了裂痕,这可能是AⅠ第一次引起人类的恐慌,由novalAⅠ,DALL-E2等软件创作出来的给画作品风格各异,乍看之下,已与人类绘画作品无异,AⅠ会取代人类画师吗?某机构随机对60人进行了一次调查,统计发现认为会取代的有42人,30岁以下认为不会取代的有12人,占30岁以下调查人数的25(1)根据以上数据完成如下2×2列联表:年龄理解情况总计会取代不会取代30岁以下1230岁及以上总计4260(2)依据小概率值α=0.010的独立性检验,能否认为年龄与理解情况有关?并说明原因.α0.100.050.0100.0050.001x2.7063.8416.6357.87910.828参考公式:χ2=n【题型4独立性检验与统计知识的综合应用】【方法点拨】独立性检验与统计知识结合在一起考查是一个很好的结合点,解题的关键是正确从图表中得到相关数据.【例4】(2023·全国·模拟预测)某省级综合医院共有1000名医护员工参加防疫知识和技能竞赛,其中男性450人,为了解该医院医护员工在防疫知识和技能竞赛中的情况,现按性别采用分层抽样的方法从中抽取100名医护员工的成绩(单位:分)作为样本进行统计,成绩均分布在400~700分之间,根据统计结果绘制的医护员工成绩的频率分布直方图如图所示,将成绩不低于600分的医护员工称为优秀防疫员工(1)求a的值,并估计该医院医护员工成绩的平均数、中位数(同一组中的数据用该组区间的中点值作代表);(2)若样本中优秀防疫员工有女性10人,完成下列2×2列联表,并根据小概率值α=0.05的独立性检验,能否认为该医院医护员工的性别与是否为优秀防疫员工有关联?优秀防疫员工非优秀防疫员工合计男女合计(3)采用分层抽样的方法从样本中成绩在450,500,600,700的医护员工中抽取8人,再从这8人中随机抽取3人,记被抽取的3名医护员工中优秀防疫员工的人数为随机变量X,求X的分布列及数学期望.附:χ2=nα0.100.050.0100.0050.001x2.7063.8416.6357.87910.828【变式4-1】(2023·高二单元测试)相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.某市一健身连锁机构对其会员进行了统计,制作成如下两个统计图,图1为会员年龄分布图(年龄为整数),图2为会员一个月内到健身房次数分布扇形图.若将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类,将一个月内到健身房锻炼16次及以上的会员称为”健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图的数据,补全下方2×2列联表,并判断是否有95%的把握认为“健身达人”与年龄有关?年轻人非年轻人合计健身达人健身爱好者合计附:P0.100.050.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828K(2)将(1)中相应的频率作为概率,该健身连锁机构随机选取3名会员进行回访,设3名会员中既是“年轻人”又是“健身达人”的人数为随机变量X,求X的分布列和数学期望.【变式4-2】(2023春·河南安阳·高三阶段练习)某超市为改善某产品的销售状况并制订销售策略,统计了过去100天该产品的日销售收入(单位:万元)并分成六组制成如图所示的频率分布直方图.(1)求a的值并估计过去100天该产品的日销售收入的平均值x;(同一区间数据以中点值作代表)(2)该超市过去100天中有30天将该商品降价销售,在该商品降价的30天中有18天该产品的日销售收入不低于0.6万元,判断能否有97.5%的把握认为该商品的日销售收入不低于0.6万元与该日是否降价有关.附:K2=nP0.0500.0250.010k3.8415.0246.635【变式4-3】(2023秋·浙江嘉兴·高三期末)为积极响应“反诈”宣传教育活动的要求,某企业特举办了一次“反诈”知识竞赛,规定:满分为100分,60分及以上为合格.该企业从甲、乙两个车间中各抽取了100位职工的竞赛成绩作为样本.对甲车间100位职工的成绩进行统计后,得到了如图所示的成绩频率分布直方图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论