版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第03讲8.3列联表与独立性检验(8.3.1分类变量与列联表+8.3.2独立性检验)课程标准学习目标①了解分类变量与数值变量的区别,了解回归与相关的区别。②通过实例,理解通过比较相关比率,利用2×2列联表或等高图可以初步检验两个随机变量的独立性.理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。③理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。本节课要求会通过比较相关比率,判断两个随机变量的独立性.会对简单的数据分析案例进行初步独立性分析.恰当构造卡方统计量及利用小概率事件原理实现对两个分类变量的是否独立的科学检验.能解决简单的与独立性检验相关的实际问题知识点1:分类变量与列联表(1)分类变量为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,这随机变量称为分类变量.(2)列联表①2×2列联表给出了两个分类变量数据的交叉分类频数.②定义一对分类变量和,我们整理数据如下表所示:合计合计知识点2:独立性检验(1)独立性检验定义:利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.(2)独立性检验公式:其中(注意使用公式时分子的平方不要忽略了)【即学即练1】(2024上·江西九江·高二统考期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有(
)把握喜欢篮球与性别有关.0.050.010.0050.0013.8416.6357.87910.828A. B. C. D.【答案】B【详解】,有把握认为与性别有关,故选:B.题型01通过等高堆积条形图判断两个分类变量是否存在差异【典例1】(2014·吉林长春·统考三模)观察下列各图,其中两个分类变量x,y之间关系最强的是(
)A. B.C. D.【典例2】(2017·广东佛山·统考一模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的(
)A.样本中的女生数量多于男生数量B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C.样本中的男生偏爱两理一文D.样本中的女生偏爱两文一理【典例3】(2012下·山东青岛·高二山东省青岛第一中学校考期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高条形图,则下列说法正确的是(
)A.喜欢使用手机支付与性别无关B.样本中男生喜欢使用手机支付的约C.样本中女生喜欢使用手机支付的人数比男生多D.女生比男生喜欢使用手机支付的可能性大些【变式1】(2021·高二课时练习)在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大(
)A.与 B.与C.与 D.与【变式2】(2023·四川达州·统考一模)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是(
)A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数C.样本中选择物理学科的人数较多D.样本中男生人数少于女生人数题型02独立性检验的概念及辨析【典例1】(2024上·全国·高三专题练习)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为(
)A.变量与不独立,这个结论犯错误的概率不超过B.变量与不独立,这个结论犯错误的概率不超过C.变量与独立,这个结论犯错误的概率不超过D.变量与独立,这个结论犯错误的概率不超过【典例2】(2024·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为()附:,附表:0.050.013.8416.635A.7 B.8 C.9 D.10【变式1】(2024上·全国·高三专题练习)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为(
)参考公式:,其中.参考数据:A. B. C. D.【变式2】(多选)(2024上·全国·高三期末)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中,由列联表中的数据计算得.参照附表,下列结论正确的是()附表:A.根据小概率值的独立性检验,分析认为“药物有效”B.根据小概率值的独立性检验,分析认为“药物无效”C.根据小概率值的独立性检验,分析认为“药物有效”D.根据小概率值的独立性检验,分析认为“药物无效”题型03卡方的计算【典例1】(2024上·湖南长沙·高三湖南师大附中校考阶段练习)为检验预防某种疾病的两种疫苗的免疫效果,随机抽取接种疫苗的志愿者各100名,化验其血液中某项医学指标(该医学指标范围为,统计如下:该项医学指标接种疫苗人数1050接种疫苗人数3040个别数据模糊不清,用含字母的代数式表示.(1)为检验该项医学指标在内的是否需要接种加强针,先从医学指标在的志愿者中,按接种疫苗分层抽取8人,再次抽血化验进行判断.从这8人中随机抽取4人调研医学指标低的原因,记这4人中接种疫苗的人数为,求的分布列与数学期望;(2)根据(1)化验研判结果,医学认为该项医学指标低于50,产生抗体较弱,需接种加强针,该项医学指标不低于50,产生抗体较强,不需接种加强针.请先完成下面的列联表,若根据小概率的独立性检验,认为接种疫苗与志愿者产生抗体的强弱有关联,求的最大值.疫苗抗体合计抗体弱抗体强疫苗疫苗合计附:,其中.0.250.0250.0051.3235.0247.879【典例2】(2024·云南楚雄·云南省楚雄彝族自治州民族中学模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.甲球员是否上场球队的胜负情况合计胜负上场4045未上场3合计42(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.(i)当甲球员上场参加比赛时,求球队赢球的概率;(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)附:,.0.150.100.050.0250.0100.0012.0722.7063.8415.0246.63510.828【典例3】(2024上·广西北海·高二统考期末)在对人们休闲方式的一次调查中,共调查了120人,其中女性70人,男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据完成以下列联表;休闲方式性别看电视运动合计女男合计(2)能否有把握认为性别与休闲方式有关系?附:,其中.0.150.10.050.0250.010.0012.0722.7063.8415.0246.63510.828【变式1】(2024上·四川成都·高三成都七中校考期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计301000.10.050.010.0050.0012.7063.8416.6357.87910.828计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”(
)附:,.A.0.001 B.0.05 C.0.01 D.0.005【变式2】(2024上·江西鹰潭·高二统考期末)积化和差的重要应用在于求解傅里叶级数.为了解学生掌握该组公式的情况,在高一、高三两个年级中随机抽取了100名学生进行考查,其中高三年级的学生占,其他相关数据如下表:合格不合格总计高三年级学生54高一年级学生16总计100(1)请完成2×2列联表,依据小概率值1的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.附表及公式:0.10.050.010.0050.0012.7063.8416.6357.87910.828其中【变式3】(2024上·福建泉州·高三统考期末)教育部印发的《国家学生体质健康标准》,要求学校每学年开展全校学生的体质健康测试工作.某中学为提高学生的体质健康水平,组织了“坐位体前屈”专项训练.现随机抽取高一男生和高二男生共60人进行“坐位体前屈”专项测试.高一男生成绩的频率分布直方图如图所示,其中成绩在的男生有4人.高二男生成绩(单位:)如下:10.212.86.46.614.38.316.815.99.717.518.618.319.423.019.720.524.920.525.117.5(1)估计高一男生成绩的平均数和高二男生成绩的第40百分位数;(2)《国家学生体质健康标准》规定,高一男生“坐位体前屈”成绩良好等级线为,高二男生为.已知该校高一年男生有600人,高二年男生有500人,完成下列列联表,依据小概率值的独立性检验,能否认为该校男生“坐位体前屈”成绩优良等级与年级有关?等级年级良好及以上良好以下合计高一高二合计附:,其中.0.050.0100.0050.0013.8416.6357.87910.828题型04独立性检验的基本思想【典例1】(2024·四川绵阳·绵阳南山中学实验学校校考模拟预测)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计30100计算可知,根据小概率值α=________的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”()附:,n=a+b+c+d.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828A.0.001 B.0.05C.0.01 D.0.005【典例2】(2024上·全国·高三专题练习)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对学生体育锻炼的经常性有影响,为此随机抽取了40名学生,按照性别和体育锻炼情况整理得到如下的列联表:性别锻炼合计不经常经常女生51015男生52025合计103040(1)根据上表数据,依据小概率值的独立性检验,能否认为性别因素会影响学生体育锻炼的经常性?(2)如果将表中的数据都扩大为原来的倍,在相同的检验标准下,得到与(1)中不一样的结论.(i)求的最小值;(ii)如果抽样方式不变,你认为(1)和(2)的结论哪个更可靠,并说明理由.附:,其中0.10.050.010.0050.0012.7063.8416.6357.87910.828【变式1】(多选)(2024上·安徽·高三合肥市第八中学校联考开学考试)电影《八角笼中》是由王宝强导演并参演的一部电影,讲述了年轻人为理想而努力奋斗的故事.该电影一上映就引起了广大观众的热议,票房也超出了预期,现随机抽取若干名观众进行调查,所得数据统计如下表所示,则(
)喜欢该电影不喜欢该电影男性观众16040女性观众14060附:.0.100.050.010.0012.7063.8416.63510.828A.若在被调查的观众中随机抽取1人,则抽到喜欢该电影的男性观众的概率为B.在被调查的观众中,男性不喜欢该电影的比例高于女性C.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异D.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异【变式2】(2024上·全国·高三专题练习)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳性别合计男女爱好402060不爱好203050合计6050110已知,0.050.010.0013.8416.63510.828则以下结论正确的是(
)A.根据小概率值的独立性检验,爱好跳绳与性别无关B.根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001C.根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D.根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”题型05独立性检验解决实际问题【典例1】(2024·湖南长沙·统考一模)某厂为了考察设备更新后的产品优质率,质检部门根据有放回简单随机抽样得到的样本测试数据,制作了如下列联表:产品优质品非优质品更新前2416更新后4812(1)依据小概率值的独立性检验,分析设备更新后能否提高产品优质率?(2)如果以这次测试中设备更新后的优质品频率作为更新后产品的优质率.质检部门再次从设备更新后的生产线中抽出5件产品进行核查,核查方案为:若这5件产品中至少有3件是优质品,则认为设备更新成功,提高了优质率;否则认为设备更新失败.①求经核查认定设备更新失败的概率;②根据的大小解释核查方案是否合理.附:0.0500.0100.0013.8416.63510.828【典例2】(2024上·吉林·高二长春市第二实验中学校联考期末)李连贵熏肉大饼是吉林省四平市极具传统特色的美味小吃,有着悠久的历史,创始于1908年,距今已经有着一百多年的历史了.李连贵熏肉大饼的制作方法十分考究,选用猪肉和面粉为主要原料,将猪肉制作成熏肉,在加上公丁香,肉䓕,沙仁等几十种配料謷煮,最后加入调料抹在饼内,夹肉而食,吃起来外酥里软,美味可口,是一道集美味和药膳于一体的美味佳肴,很多外地游客慕名前往四平品尝.某调查机构从年龄在岁的游客中随机抽取100人,对是否有意向购买熏肉大饼进行调查,结果如下表:年龄/岁抽取人数有意向购买熏肉大饼的人数(1)若以年龄40岁为分界线,由以上统计数据完成下面的列联表,并依据小概率值的独立性检验,能否认为购买熏肉大饼与人的年龄有关?年龄低于岁的人数年龄不低于岁的人数总计有意向购买熏肉大饼的人数无意向购买熏肉大饼的人数总计(2)用样本估计总体,用频率估计概率,从年龄在的所有游客中随机抽取3人,设这3人中打算购买熏肉大饼的人数为,求的分布列和数学期望.【参考数据及公式】,其中.【变式1】(2024上·甘肃·高三统考阶段练习)第18届亚洲杯将于2024年1月12日在卡塔尔举行,该比赛预计会吸引亿万球迷观看.为了了解某校大学生喜爱观看足球比赛是否与性别有关,该大学记者站随机抽取了100名学生进行统计,其中女生喜爱观看足球比赛的占女生人数的,男生有10人表示不喜欢看足球比赛.(1)完成下面列联表,试根据小概率值的独立性检验,判断能否认为喜爱观看足球比赛与性别有关联?男女合计喜爱看足球比赛不喜爱看足球比赛合计60(2)在不喜爱观看足球比赛的观众中,按性别用分层随机抽样的方式抽取8人,再从这8人中随机抽取2人参加校记者站的访谈节目,设抽到的男生人数为,求的分布列和期望.附:,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828【变式2】(2024上·广东·高三统考期末)学校为了让学生的学习与活动两不误,在延时课开设篮球、书法两项活动,为了了解学生的选择意向,随机调查了部分同学,得到如下列联表.性别选择篮球选择书法男生4010女生2525(1)根据上表,分别估计该校男、女生选择篮球的概率;(2)试根据小概率值的独立性检验,分析性别与选择意向是否有关联.附:,其中.0.050.0250.010.0050.0013.8415.0246.6357.87910.828A夯实基础B能力提升A夯实基础一、单选题1.(2024下·全国·高二随堂练习)下列关于独立性检验的说法正确的是()A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以确定两个变量之间是否具有某种关系C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大2.(2024下·全国·高二随堂练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:每年体检每年未体检合计老年人7年轻人6合计50已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是(
)A. B.C. D.3.(2024下·全国·高二随堂练习)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是(
)A.
B.
C.
D.
4.(2024下·全国·高二随堂练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是()日落云里走夜晚天气下雨未下雨出现255未出现2545参考公式:临界值参照表:0.10.050.010.0050.0012.7063.8416.6357.87910.828A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关D.出现“日落云里走”,据小概率值的独立性检验,可以认为夜晚会下雨5.(2024上·全国·高三专题练习)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:优秀非优秀总计甲班乙班总计105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.列联表中c的值为20,b的值为50D.由列联表可看出成绩与班级有关系6.(2024上·全国·高三专题练习)假设有两个变量x与y的列联表如下表:abcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(
)A.,,, B.,,,C.,,, D.,,,7.(2024·全国·高三专题练习)在新高考改革中,浙江省新高考实行的是7选3的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)选物理不选物理总计男生340110450女生140210350总计480320800表一选生物不选生物总计男生150300450女生150200350总计300500800表二试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关(
)附:A.选物理与性别有关,选生物与性别有关B.选物理与性别无关,选生物与性别有关C.选物理与性别有关,选生物与性别无关D.选物理与性别无关,选生物与性别无关8.(2024·全国·高三专题练习)在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:优秀非优秀合计甲班人数50乙班人数20合计30110附:,其中.根据独立性检验,可以认为数学考试成绩与班级有关系的把握为(
)A. B. C. D.二、多选题9.(2024上·山西运城·高三校考期末)某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定列联表时,由于某些因素缺失了部分数据,而获得如下列联表,下列结论正确的是(
)满意不满意合计男10女合计90参考公式与临界值表,其中.0.1000.0500.0250.0100.0012.7063.8415.0246.63510.828A.满意度的调查过程采用了分层抽样的抽样方法B.50名女生中对课后延时服务满意的人数为20C.的观测值为9D.根据小概率的独立性检验,不可以认为“对课后延时服务的满意度与性别有关系”10.(2024上·贵州·高三统考开学考试)某学校高三年级于2023年5月初进行了一次高三数学备考前测考试.按照分数大于或等于120的同学评价为“优秀生”,其它分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,成绩优秀的概率为,根据表(2)的数据可断定下列说法正确的是(
)班级战绩合计优秀生潜力生甲班10b乙班c30合计105表(1)0.050.010.0013.8416.63510.828表(2)A.列联表中c的值为30,b的值为35B.列联表中c的值为20,b的值为45C.根据列联表中的数据,有95%的把握认为成绩与班级有关D.根据列联表中的数据,没有95%的把握认为成绩与班级有关三、填空题11.(2024下·全国·高二随堂练习)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:药物疾病合计未患病患病服用a50未服用50合计8020100若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为.(其中且)(参考数据:,)附:,α0.10.050.010.0050.001xα2.7063.8416.6357.87910.82812.(2024下·全国·高二随堂练习)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:了解不了解总计年龄不小于60岁aba+b年龄小于60岁cdc+d总计a+cb+da+b+c+d给出下列4组数据:①;②;③;④.则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是.(填序号)四、解答题13.(2024上·河南焦作·高二统考期末)近年来,直播带货逐渐兴起,成为乡村振兴的新动力,为了解甲、乙两个推销农产品的直播间的销售情况,统计了两个直播间一段时间内观众下单的相关数据,得到如下的表格:下单的观众数未下单的观众数甲直播间12080乙直播间6080(1)分别估计甲、乙直播间的观众下单的概率;(2)是否有的把握认为两个直播间观众的下单意愿有差异?附.0.050.010.0013.8416.63510.82814.(2024上·山东日照·高三山东省五莲县第一中学校考期末)某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗,为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80及以上的花苗为优质花苗.
(1)求图中a的值,并求综合评分的中位数;(2)填写下面的列联表,并根据小概率值的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.优质花苗非优质花苗合计甲培育法20乙培育法10合计附:,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828B能力提升15.(2024上·河北唐山·高三统考期末)目前,国际上常用身体质量指数(BodyMassIndex,缩写BMI)来测量人体胖瘦程度以及是否健康,其计算公式是.中国成人的BMI数值标如下表所示:BMI<18.5≥28体重情况过轻正常超重肥胖为了解某单位职工的身体情况,研究人员从单位职工体检数据中,采用分层随机抽样方法抽取了90名男职工、50名女职工的身高和体重数据,计算得到他们的BMI值,并进行分类统计,如右表所示:性别BMI合计过轻正常超重肥胖男106011990女15255550合计25851614140(1)参照附表,对小概率值a逐一进行独立性检验,依据检验,指出能认为职工体重是否正常与性别有关联的a的一个值;(2)在该单位随机抽取一位职工的BMI值,发现其BMI值不低于28.由上表可知男女职工的肥胖率都为0.1,视频率为概率,能否认为该职工的性别是男还是女的可能性相同?若认为相同则说明理由,若认为不相同,则需要比较可能性的大小.a0.10.050.010.0050.0012.7063.8416.6357.87910.828附:16.(2024上·广东汕头·高三统考期末)《国家学生体质健康标准》是我国对学生体质健康方面的基本要求,是综合评价学生综合素质的重要依据.为促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平,某学校从全校学生中随机抽取200名学生进行“是否喜欢体育锻炼”的问卷调查.获得如下信息:①男生所占比例为;②不喜欢体育锻炼的学生所占比例为;③喜欢体育锻炼的男生比喜欢体育锻炼的女生多50人.(1)完成列联表,依据小概率值的独立性检验,分析喜欢体育锻炼与性别是否有关联?性别体育锻炼合计喜欢不喜欢男女合计(2)(ⅰ)从这200名学生中采用按比例分配的分层随机抽样方法抽取20人,再从这20人中随机抽取3人.记事件“至少有2名男生”、“至少有2名喜欢体育锻炼的男生”、“至多有1名喜欢体育锻炼的女生”.请计算和的值.(ⅱ)对于随机事件,,,试分析与的大小关系,并给予证明参考公式及数据:,.0.100.050.0100.0012.7063.8416.63510.828第03讲8.3列联表与独立性检验(8.3.1分类变量与列联表+8.3.2独立性检验)课程标准学习目标①了解分类变量与数值变量的区别,了解回归与相关的区别。②通过实例,理解通过比较相关比率,利用2×2列联表或等高图可以初步检验两个随机变量的独立性.理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。③理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。本节课要求会通过比较相关比率,判断两个随机变量的独立性.会对简单的数据分析案例进行初步独立性分析.恰当构造卡方统计量及利用小概率事件原理实现对两个分类变量的是否独立的科学检验.能解决简单的与独立性检验相关的实际问题知识点1:分类变量与列联表(1)分类变量为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,这随机变量称为分类变量.(2)列联表①2×2列联表给出了两个分类变量数据的交叉分类频数.②定义一对分类变量和,我们整理数据如下表所示:合计合计知识点2:独立性检验(1)独立性检验定义:利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.(2)独立性检验公式:其中(注意使用公式时分子的平方不要忽略了)【即学即练1】(2024上·江西九江·高二统考期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有(
)把握喜欢篮球与性别有关.0.050.010.0050.0013.8416.6357.87910.828A. B. C. D.【答案】B【详解】,有把握认为与性别有关,故选:B.题型01通过等高堆积条形图判断两个分类变量是否存在差异【典例1】(2014·吉林长春·统考三模)观察下列各图,其中两个分类变量x,y之间关系最强的是(
)A. B.C. D.【答案】D【详解】观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强.故选:D【典例2】(2017·广东佛山·统考一模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的(
)A.样本中的女生数量多于男生数量B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C.样本中的男生偏爱两理一文D.样本中的女生偏爱两文一理【答案】D【详解】解:由条形图知女生数量多于男生数量,故A正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;男生偏爱两理一文,故C正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.故选:D.【典例3】(2012下·山东青岛·高二山东省青岛第一中学校考期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高条形图,则下列说法正确的是(
)A.喜欢使用手机支付与性别无关B.样本中男生喜欢使用手机支付的约C.样本中女生喜欢使用手机支付的人数比男生多D.女生比男生喜欢使用手机支付的可能性大些【答案】D【详解】A错误,根据等高条形图,喜欢和不喜欢使用手机支付的比例因性别差距很明显,所以喜欢使用手机支付与性别有关;B错误,样本中男生喜欢使用手机支付的约为40%;女生比男生喜欢使用手机支付的可能性大些,由于不知道男女生人数,所以不能认定女生喜欢使用手机支付的人数是否比男生多.所以C错误,D正确.故选:D【变式1】(2021·高二课时练习)在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大(
)A.与 B.与C.与 D.与【答案】C【详解】由等高条形图可知与的值相差越大,|ad-bc|就越大,相关性就越强.故选:C【变式2】(2023·四川达州·统考一模)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是(
)A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数C.样本中选择物理学科的人数较多D.样本中男生人数少于女生人数【答案】C【详解】根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确;根据等高条形图图2可知样本中男生人数多于女生人数,故D错误;样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误.故选:C.题型02独立性检验的概念及辨析【典例1】(2024上·全国·高三专题练习)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为(
)A.变量与不独立,这个结论犯错误的概率不超过B.变量与不独立,这个结论犯错误的概率不超过C.变量与独立,这个结论犯错误的概率不超过D.变量与独立,这个结论犯错误的概率不超过【答案】B【详解】因为时,所以,所以变量与不独立,且这个结论犯错误的概率不超过.故选:B.【典例2】(2024·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为()附:,附表:0.050.013.8416.635A.7 B.8 C.9 D.10【答案】C【详解】根据题意,不妨设,于是,由于依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,于是最小值为.故选:C【变式1】(2024上·全国·高三专题练习)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为(
)参考公式:,其中.参考数据:A. B. C. D.【答案】C【详解】设男生人数为,则女生人数为,且,可得列联表如下:男生女生合计喜欢滑冰不喜欢滑冰合计所以,因为有的把握认为是否喜欢滑冰和性别有关,所以,解得,所以,结合选项只有,故选:C.【变式2】(多选)(2024上·全国·高三期末)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中,由列联表中的数据计算得.参照附表,下列结论正确的是()附表:A.根据小概率值的独立性检验,分析认为“药物有效”B.根据小概率值的独立性检验,分析认为“药物无效”C.根据小概率值的独立性检验,分析认为“药物有效”D.根据小概率值的独立性检验,分析认为“药物无效”【答案】BC【【详解】因为,所以,所以根据小概率值的独立性检验,分析认为“药物无效”;根据小概率值的独立性检验,分析认为“药物有效”;故选:BC.题型03卡方的计算【典例1】(2024上·湖南长沙·高三湖南师大附中校考阶段练习)为检验预防某种疾病的两种疫苗的免疫效果,随机抽取接种疫苗的志愿者各100名,化验其血液中某项医学指标(该医学指标范围为,统计如下:该项医学指标接种疫苗人数1050接种疫苗人数3040个别数据模糊不清,用含字母的代数式表示.(1)为检验该项医学指标在内的是否需要接种加强针,先从医学指标在的志愿者中,按接种疫苗分层抽取8人,再次抽血化验进行判断.从这8人中随机抽取4人调研医学指标低的原因,记这4人中接种疫苗的人数为,求的分布列与数学期望;(2)根据(1)化验研判结果,医学认为该项医学指标低于50,产生抗体较弱,需接种加强针,该项医学指标不低于50,产生抗体较强,不需接种加强针.请先完成下面的列联表,若根据小概率的独立性检验,认为接种疫苗与志愿者产生抗体的强弱有关联,求的最大值.疫苗抗体合计抗体弱抗体强疫苗疫苗合计附:,其中.0.250.0250.0051.3235.0247.879【答案】(1)分布列见解析,(2)列联表见解析,2【详解】(1)从医学指标在的志愿者中,按接种疫苗分层抽取8人中,接种疫苗有2人,接种疫苗有6人,由题意可知,可能取值为,,的分布列为:234则;(2)列联表如下:疫苗抗体合计抗体弱抗体强疫苗100疫苗100合计60140200则,由题意可知,,整理得,,解得或,又,则,所以,故的最大值为2.【典例2】(2024·云南楚雄·云南省楚雄彝族自治州民族中学模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.甲球员是否上场球队的胜负情况合计胜负上场4045未上场3合计42(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.(i)当甲球员上场参加比赛时,求球队赢球的概率;(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)附:,.0.150.100.050.0250.0100.0012.0722.7063.8415.0246.63510.828【答案】(1)列联表见解析;有99%的把握认为球队的胜负与甲球员是否上场有关.(2)(i);(ii)【详解】(1)解:根据题意,可得的列联表:甲球员是否上场球队的胜负情况合计胜负上场40545未上场235合计42850零假设:球队的胜负与甲球员是否上场无关此时,所以,有99%的把握认为球队的胜负与甲球员是否上场有关.(2)解:由甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.(i)设事件:甲球员上场打前锋,事件:甲球员上场打中锋,事件:甲球员上场打后卫,事件:球队赢球,则,所以,当甲球员上场参加比赛时,球队赢球的概率:.(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,甲球员打中锋的概率为.【典例3】(2024上·广西北海·高二统考期末)在对人们休闲方式的一次调查中,共调查了120人,其中女性70人,男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据完成以下列联表;休闲方式性别看电视运动合计女男合计(2)能否有把握认为性别与休闲方式有关系?附:,其中.0.150.10.050.0250.010.0012.0722.7063.8415.0246.63510.828【答案】(1)列联表见解析;(2)没有的把握认为性别与休闲方式有关.【详解】(1)休闲方式性别看电视运动合计女403070男203050合计6060120(2)易知,由卡方公式可知:,故没有的把握认为性别与休闲方式有关.【变式1】(2024上·四川成都·高三成都七中校考期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计301000.10.050.010.0050.0012.7063.8416.6357.87910.828计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”(
)附:,.A.0.001 B.0.05 C.0.01 D.0.005【答案】B【详解】完善列联表如下:被某病毒感染未被某病毒感染合计注射疫苗104050未注射疫苗203050合计3070100假设:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.因为:,而,所以根据小概率值的独立性检验,推断不成立.即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.故选:B【变式2】(2024上·江西鹰潭·高二统考期末)积化和差的重要应用在于求解傅里叶级数.为了解学生掌握该组公式的情况,在高一、高三两个年级中随机抽取了100名学生进行考查,其中高三年级的学生占,其他相关数据如下表:合格不合格总计高三年级学生54高一年级学生16总计100(1)请完成2×2列联表,依据小概率值1的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.附表及公式:0.10.050.010.0050.0012.7063.8416.6357.87910.828其中【答案】(1)填表见解析;认为“对公式的掌握情况”与“学生所在年级”有关;(2)分布列见解析;期望为.【详解】(1)由100名学生中高三年级的学生占,可知高三年级的学生有60人,高一年级的学生有40人.补充完整的列联表,如下:合格不合格合计高三年级的学生54660高一年级的学生241640合计7822100提出零假设:“对公式的掌握情况”与“学生所在年级”无关.根据列联表中的数据,得.根据小概率值的独立性检验,我们推断H₀不成立,即认为“对公式的掌握情况”与“学生所在年级”有关,此推断犯错误的概率不大于0.001.(2)由(1)得,高一年级的学生对公式的掌握情况合格的频率为.依题意,得则,,,.所以的分布列为0123.【变式3】(2024上·福建泉州·高三统考期末)教育部印发的《国家学生体质健康标准》,要求学校每学年开展全校学生的体质健康测试工作.某中学为提高学生的体质健康水平,组织了“坐位体前屈”专项训练.现随机抽取高一男生和高二男生共60人进行“坐位体前屈”专项测试.高一男生成绩的频率分布直方图如图所示,其中成绩在的男生有4人.高二男生成绩(单位:)如下:10.212.86.46.614.38.316.815.99.717.518.618.319.423.019.720.524.920.525.117.5(1)估计高一男生成绩的平均数和高二男生成绩的第40百分位数;(2)《国家学生体质健康标准》规定,高一男生“坐位体前屈”成绩良好等级线为,高二男生为.已知该校高一年男生有600人,高二年男生有500人,完成下列列联表,依据小概率值的独立性检验,能否认为该校男生“坐位体前屈”成绩优良等级与年级有关?等级年级良好及以上良好以下合计高一高二合计附:,其中.0.050.0100.0050.0013.8416.6357.87910.828【答案】(1)15,16.35(2)详见解析【详解】(1)依题意得,抽取高二男生20人,所以抽取高一男生40人.因为高一男生成绩在[5,10)的男生有4人,所以,解得.由,解得.由样本估计总体,可估计高一男生成绩的平均数.由,可知样本数据的第40百分位数是第8项和第9项数据的均值,高二男生“坐位体前屈”成绩在[5,15)有7人,[15,20)有8人,所以第40百分位数在[15,20)中,故.由样本估计总体,可估计高二男生成绩的第40百分位数为16.35.(2)根据样本,知高一男生成绩良好及以上占,良好以下占,高二男生成绩良好及以上占,良好以下占,由样本估计总体,可得列联表如下:良好及以上良好以下合计高一300300600高二300200500合计6005001100零假设为:该校男生“坐位体前屈”成绩等级与年级之间无关.根据列联表中的数据,得根据小概率值的独立性检验,我们推断不成立,即认为“坐位体前屈”成绩等级与年级有关,此推断犯错误的概率不大于.题型04独立性检验的基本思想【典例1】(2024·四川绵阳·绵阳南山中学实验学校校考模拟预测)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计30100计算可知,根据小概率值α=________的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”()附:,n=a+b+c+d.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828A.0.001 B.0.05C.0.01 D.0.005【答案】B【详解】完善2×2列联表如下:被某病毒感染未被某病毒感染合计注射疫苗104050未注射疫苗203050合计3070100零假设为H0:“给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.因为χ2=,所以根据小概率值的独立性检验,推断H0不成立,即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.故选:B.【典例2】(2024上·全国·高三专题练习)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对学生体育锻炼的经常性有影响,为此随机抽取了40名学生,按照性别和体育锻炼情况整理得到如下的列联表:性别锻炼合计不经常经常女生51015男生52025合计103040(1)根据上表数据,依据小概率值的独立性检验,能否认为性别因素会影响学生体育锻炼的经常性?(2)如果将表中的数据都扩大为原来的倍,在相同的检验标准下,得到与(1)中不一样的结论.(i)求的最小值;(ii)如果抽样方式不变,你认为(1)和(2)的结论哪个更可靠,并说明理由.附:,其中0.10.050.010.0050.0012.7063.8416.6357.87910.828【答案】(1)根据的独立性检验,没有充分证据推断不成立,因此认为成立,即学生体育锻炼的经常性与学生性别没有关系(2)(i)的最小值为8,(ii)在抽样方式不变的情况下,(2)中的结论更可靠,理由见解析【详解】(1):学生体育锻炼的经常性与学生性别没有关系.根据的独立性检验,没有充分证据推断不成立,因此认为成立,即学生体育锻炼的经常性与学生性别没有关系.(2)(i)当表中的数据都扩大为原来的倍时,根据的独立性检验,若推断不成立,即在犯错误的概率不超过0.01的前提下认为学生体育锻炼的经常性与学生性别有关系.则有:,解得,又,故的最小值为8.(ii)在抽样方式不变的情况下,(2)中的结论更可靠.这是因为对于随机样本而言,频率具有随机性,我们的推断可能犯错误,样本容量越小,犯错误的可能性会越大,因此在抽样方式不变的前提下,样本容量大的结果更可靠.【变式1】(多选)(2024上·安徽·高三合肥市第八中学校联考开学考试)电影《八角笼中》是由王宝强导演并参演的一部电影,讲述了年轻人为理想而努力奋斗的故事.该电影一上映就引起了广大观众的热议,票房也超出了预期,现随机抽取若干名观众进行调查,所得数据统计如下表所示,则(
)喜欢该电影不喜欢该电影男性观众16040女性观众14060附:.0.100.050.010.0012.7063.8416.63510.828A.若在被调查的观众中随机抽取1人,则抽到喜欢该电影的男性观众的概率为B.在被调查的观众中,男性不喜欢该电影的比例高于女性C.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异D.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异【答案】AC【详解】根据题意,喜欢该电影的男性观众有160人,可得,所以A正确;由男性不喜欢该电影的比例为,女性不喜欢该电影的比例为,可得,所以B错误;由,因为,所以C正确,D错误.故选:AC.【变式2】(2024上·全国·高三专题练习)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳性别合计男女爱好402060不爱好203050合计6050110已知,0.050.010.0013.8416.63510.828则以下结论正确的是(
)A.根据小概率值的独立性检验,爱好跳绳与性别无关B.根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001C.根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D.根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”【答案】A【详解】由题知因为,所以爱好跳绳与性别无关且这个结论犯错误的概率超过0.001,故A正确,B错误,又因为,所以有99%以上的把握认为“爱好跳绳与性别有关,或在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别有关.故C和D错误.故选:A.题型05独立性检验解决实际问题【典例1】(2024·湖南长沙·统考一模)某厂为了考察设备更新后的产品优质率,质检部门根据有放回简单随机抽样得到的样本测试数据,制作了如下列联表:产品优质品非优质品更新前2416更新后4812(1)依据小概率值的独立性检验,分析设备更新后能否提高产品优质率?(2)如果以这次测试中设备更新后的优质品频率作为更新后产品的优质率.质检部门再次从设备更新后的生产线中抽出5件产品进行核查,核查方案为:若这5件产品中至少有3件是优质品,则认为设备更新成功,提高了优质率;否则认为设备更新失败.①求经核查认定设备更新失败的概率;②根据的大小解释核查方案是否合理.附:0.0500.0100.0013.8416.63510.828【答案】(1)可以认为设备更新后能够提高产品优质率(2)①0.05792;②合理【详解】(1)零假设为:设备更新与产品的优质率独立,即设备更新前与更新后的产品优质率没有差异.由列联表可计算,依据小概率值的独立性检验,我们可以推断不成立,因此可以认为设备更新后能够提高产品优质率.(2)根据题意,设备更新后的优质率为0.8.可以认为从生产线中抽出的5件产品是否优质是相互独立的.①设表示这5件产品中优质品的件数,则,可得②实际上设备更新后提高了优质率.当这5件产品中的优质品件数不超过2件时,认为更新失败,此时作出了错误的判断,由于作出错误判断的概率很小,则核查方案是合理的.【典例2】(2024上·吉林·高二长春市第二实验中学校联考期末)李连贵熏肉大饼是吉林省四平市极具传统特色的美味小吃,有着悠久的历史,创始于1908年,距今已经有着一百多年的历史了.李连贵熏肉大饼的制作方法十分考究,选用猪肉和面粉为主要原料,将猪肉制作成熏肉,在加上公丁香,肉䓕,沙仁等几十种配料謷煮,最后加入调料抹在饼内,夹肉而食,吃起来外酥里软,美味可口,是一道集美味和药膳于一体的美味佳肴,很多外地游客慕名前往四平品尝.某调查机构从年龄在岁的游客中随机抽取100人,对是否有意向购买熏肉大饼进行调查,结果如下表:年龄/岁抽取人数有意向购买熏肉大饼的人数(1)若以年龄40岁为分界线,由以上统计数据完成下面的列联表,并依据小概率值的独立性检验,能否认为购买熏肉大饼与人的年龄有关?年龄低于岁的人数年龄不低于岁的人数总计有意向购买熏肉大饼的人数无意向购买熏肉大饼的人数总计(2)用样本估计总体,用频率估计概率,从年龄在的所有游客中随机抽取3人,设这3人中打算购买熏肉大饼的人数为,求的分布列和数学期望.【参考数据及公式】,其中.【答案】(1)列联表见解析,购买熏肉大饼与人的年龄有关(2)分布列见解析,【详解】(1)列联表如下:年龄低于岁的人数年龄不低于岁的人数总计有意向购买熏肉大饼的人数无意向购买熏肉大饼的人数总计零假设为购买熏肉大饼与人的年龄无关.根据表中数据计算得:,所以依据小概率值的独立性检验,我们推断不成立,即购买熏肉大饼与人的年龄有关,该推断犯错误的概率不超过.(2)由已知得,,,,,,.所以随机变量的分布列为:所以.【变式1】(2024上·甘肃·高三统考阶段练习)第18届亚洲杯将于2024年1月12日在卡塔尔举行,该比赛预计会吸引亿万球迷观看.为了了解某校大学生喜爱观看足球比赛是否与性别有关,该大学记者站随机抽取了100名学生进行统计,其中女生喜爱观看足球比赛的占女生人数的,男生有10人表示不喜欢看足球比赛.(1)完成下面列联表,试根据小概率值的独立性检验,判断能否认为喜爱观看足球比赛与性别有关联?男女合计喜爱看足球比赛不喜爱看足球比赛合计60(2)在不喜爱观看足球比赛的观众中,按性别用分层随机抽样的方式抽取8人,再从这8人中随机抽取2人参加校记者站的访谈节目,设抽到的男生人数为,求的分布列和期望.附:,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828【答案】(1)列联表见解析,认为喜爱观看足球比赛与性别有关联.(2)分布列见解析,【详解】(1)根据表格数据可知抽取的女生共40人,喜欢观看足球比赛的女生为人,可得得列联表如下:男女合计喜爱看足球比赛501060不喜爱看足球比赛103040合计6040100根据列联表中的数据计算得,根据小概率值的独立性检验,即认为喜爱观看足球比赛与性别有关联.(2)按照分层随机抽样的方式抽取8人,根据抽样比可知其中男生2人,女生6人,则的可能取值为,,,所以的分布列为012期望值.【变式2】(2024上·广东·高三统考期末)学校为了让学生的学习与活动两不误,在延时课开设篮球、书法两项活动,为了了解学生的选择意向,随机调查了部分同学,得到如下列联表.性别选择篮球选择书法男生4010女生2525(1)根据上表,分别估计该校男、女生选择篮球的概率;(2)试根据小概率值的独立性检验,分析性别与选择意向是否有关联.附:,其中.0.050.0250.010.0050.0013.8415.0246.6357.87910.828【答案】(1);;(2)性别与选择意向有关联.【详解】(1)以频率估计概率,所以该校男生选择篮球的概率为,所以该校女生选择篮球的概率为.(2)结合题意:,整理计算得:,故能在犯错误的概率不超过0.01的条件下认为性别与选择意向有关.A夯实基础B能力提升A夯实基础一、单选题1.(2024下·全国·高二随堂练习)下列关于独立性检验的说法正确的是()A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以确定两个变量之间是否具有某种关系C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大【答案】D【分析】根据独立性检验的意义分别判断各选项.【详解】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;对于B,独立性检验并不能确定两个变量相关,故错误;对于C,是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;对于D,根据卡方计算的定义可知该选项正确;故选:D.2.(2024下·全国·高二随堂练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:每年体检每年未体检合计老年人7年轻人6合计50已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是(
)A. B.C. D.【答案】D【分析】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.【详解】因为,,,,,,所以,,,,.故选:D.3.(2024下·全国·高二随堂练习)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是(
)A.
B.
C.
D.
【答案】B【分析】根据题意,由等高条形图的意义分析可得答案.【详解】根据题意,在等高的条形图中,当,所占比例相差越大时,越有把握认为两个分类变量,之间有关系,由选项可得:B选项中,,所占比例相差无几,所以最有把握认为两个分类变量,之间没有关系,故选:B4.(2024下·全国·高二随堂练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是()日落云里走夜晚天气下雨未下雨出现255未出现2545参考公式:临界值参照表:0.10.050.010.0050.0012.7063.8416.6357.87910.828A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关D.出现“日落云里走”,据小概率值的独立性检验,可以认为夜晚会下雨【答案】D【分析】应用古典概型的概率求法求概率判断A、B,应用卡方计算公式求卡方值,与临界值比较,应用独立检验的基本思想得到结论,判断C、D.【详解】由列联表知:100天中有50天下雨,50天未下雨,因此夜晚下雨的概率约为,A正确;未出现“日落云里走”,夜晚下雨的概率约为,B正确;,因此据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关,C正确,D错误.故选:D5.(2024上·全国·高三专题练习)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:优秀非优秀总计甲班乙班总计105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.列联表中c的值为20,b的值为50D.由列联表可看出成绩与班级有关系【答案】D【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.【详解】依题意,解得,由解得.补全列联表如下:优秀非优秀总计甲班乙班总计105甲班的优秀率为,乙班的优秀率为,,所以成绩与班级有关.所以D选项正确,ABC选项错误.故选:D6.(2024上·全国·高三专题练习)假设有两个变量x与y的列联表如下表:abcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(
)A.,,, B.,,,C.,,, D.,,,【答案】B【分析】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.【详解】对于A,,对于B,,对于C,,对于D,显然B中最大,该组数据能说明x与y有关系的可能性最大,故选:B.7.(2024·全国·高三专题练习)在新高考改革中,浙江省新高考实行的是7选3的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)选物理不选物理总计男生340110450女生140210350总计480320800表一选生物不选生物总计男生150300450女生150200350总计300500800表二试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关(
)附:A.选物理与性别有关,选生物与性别有关B.选物理与性别无关,选生物与性别有关C.选物理与性别有关,选生物与性别无关D.选物理与性别无关,选生物与性别无关【答案】C【分析】结合题干数据,以及公式,分别计算物理和生物学科的值,与比较,分析即得解【详解】由题意,先分析物理课是否与性别有关:根据表格数据,结合题干表格数据,,因此,有充分证据推断选择物理学科与性别有关再分析生物课是否与性别有关:根据表格数据,结合题干表格数据,,因此,没有充分证据推断选择生物学科与性别有关故选:C8.(2024·全国·高三专题练习)在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:优秀非优秀合计甲班人数50乙班人数20合计30110附:,其中.根据独立性检验,可以认为数学考试成绩与班级有关系的把握为(
)A. B. C. D.【答案】D【分析】先完成列联表,再计算,与临界值进行比较,最后下结论【详解】优秀非优秀合计甲班人数50乙班人数20合计30110由题表中的数据可得:,因为,所以可以认为数学考试成绩与班级有失系的把握为.故选:D二、多选题9.(2024上·山西运城·高三校考期末)某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定列联表时,由于某些因素缺失了部分数据,而获得如下列联表,下列结论正确的是(
)满意不满意合计男10女合计90参考公式与临界值表,其中.0.1000.0500.0250.0100.0012.7063.8415.0246.63510.828A.满意度的调查过程采用了分层抽样的抽样方法B.50名女生中对课后延时服务满意的人数为20C.的观测值为9D.根据小概率的独立性检验,不可以认为“对课后延时服务的满意度与性别有关系”【答案】AD【分析】根据题意计算男女比例,即可判断A选项;计算满意的总人数人数,根据男生满意人数即可得女生满意人数判断B选项;由列联表中数据计算的值即可判断C、D选项.【详解】A选项,因为在校学生中有400名男生,500名女生,随机调查了40名男生和50名女生,男女比例始终是4:5,所以采用了分层抽样的方法,故A正确;B选项,调查的90人中,对学校课后延时服务满意的人数为,其中男生满意的人数为,所以女生满意的人数为30,女生不满意的人数为20,故B错误;C选项,由B选项的分析,补全列联表如下:满意不满意合计男301040女302050合计603090由列联表可得,故C错误;D选项,:对课后延时服务的满意度与性别无关,由,根据小概率的独立性检验,没有充足的证据推断不成立,即不能认为“对课后延时服务的满意度与性别有关系”,故D正确.故选:AD.10.(2024上·贵州·高三统考开学考试)某学校高三年级于2023年5月初进行了一次高三数学备考前测考试.按照分数大于或等于120的同学评价为“优秀生”,其它分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,成绩优秀的概率为,根据表(2)的数据可断定下列说法正确的是(
)班级战绩合计优秀生潜力生甲班10b乙班c30合计105表(1)0.050.010.0013.8416.63510.828表(2)A.列联表中c的值为30,b的值为35B.列联表中c的值为20,b的值为45C.根据列联表中的数据,有95%的把握认为成绩与班级有关D.根据列联表中的数据,没有95%的把握认为成绩与班级有关【答案】BC【分析】根据题目条件计算判断AB,再由卡方的计算判断CD.【详解】因为在这105人中随机抽取1人,成绩优秀的概率为,所以“优秀生”的人数为,“潜力生”的人数为,所以,,故A错B对;因为,所以有95%的把握认为成绩与班级有关,故C对D错.故选:BC.三、填空题11.(2024下·全国·高二随堂练习)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:药物疾病合计未患病患病服用a50未服用50合计8020100若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为.(其中且)(参考数据:,)附:,α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【答案】46【分析】根据公式列不等式求解.【详解】由题意可得,整理得,所以或,解得或,又因为且,所以,所以a的最小值为46.故答案为:46.12.(2024下·全国·高二随堂练习)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:了解不了解总计年龄不小于60岁aba+b年龄小于60岁cdc+d总计a+cb+da+b+c+d给出下列4组数据:①;②;③;④.则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是.(填序号)【答案】③【分析】根据当的值越大时,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度物流运输车辆承包经营合同
- 2024年度某科技公司与服务商关于云存储服务的服务合同
- 2024年度光伏发电项目运营与维护合同
- 2024年度版权转让合同:著名音乐专辑版权交易
- 抗风湿手环市场发展现状调查及供需格局分析预测报告
- 2024年度广告发布合同广告内容和投放时间
- 2024年度健康保险与福利计划合同
- 2024年度在线教育平台建设与运营合同
- 2024年度云服务合同(含云计算和云存储服务)
- 2024年度办公设备采购供应合同
- 教科版小学科学三年级上册单元测试题附答案(全册)
- 工程项目审核现场踏勘记录表
- 第七讲社会主义现代化建设的教育、科技、人才战略教学课件
- 安全护理:穿脱隔离衣
- 最新:河北省另收费用一次性物品管理目录(2022版)
- 柴油发电机组技术规范书
- 电力设计企业员工激励机制
- (完整版)装饰装修工程监理细则(详解)最新(精华版)
- 钢管、钢坯堆码作业安全规定
- (砌筑工)砌筑工安全教育考试试题含答案
- X市选调生工作调研报告
评论
0/150
提交评论