列联表与独立性检验(原卷版)_第1页
列联表与独立性检验(原卷版)_第2页
列联表与独立性检验(原卷版)_第3页
列联表与独立性检验(原卷版)_第4页
列联表与独立性检验(原卷版)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

:列联表与独立性检验【知识梳理】考点一:分类变量为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.考点二:2×2列联表1.2×2列联表给出了成对分类变量数据的交叉分类频数.2.定义一对分类变量X和Y,我们整理数据如下表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d像这种形式的数据统计表称为2×2列联表.考点三:独立性检验1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.2.χ2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.3.独立性检验解决实际问题的主要环节(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.【题型归纳】题型一:分析联列表1.(2022春·广西河池·高二统考期末)假设有两个变量x与y的列联表如下表:abcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为()A.,,, B.,,,C.,,, D.,,,2.(2021春·天津河北·高二统考期末)为比较甲、乙两所学校学生的数学学习水平,经过抽样并测试得到如下关于和的列联表:学校数学成绩合计不优秀优秀()甲校()乙校()合计根据上表得到乙校数学成绩优秀的频数和样本容量数分别是()A.和 B.和 C.和 D.和3.(2022春·河南三门峡·高二校考阶段练习)在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若有99.9%把握认为性别与是否喜欢该学科有关,则可以推测N的最小值为()附,A.400 B.300 C.200 D.100题型二:等高堆积条形图的应用4.(2023春·四川成都·高二统考期中)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是()A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数C.样本中选择物理学科的人数较多D.样本中男生人数少于女生人数5.(2022春·全国·高二期末)观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量的观测值最小的是()A. B.C. D.6.(2023春·高二课时练习)为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是()A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果题型三:由χ2进行独立性分析7.(2023春·河南南阳·高二校联考期中)已知两个分类变量X,Y的可能取值分别为和,通过随机调查得到样本数据,再整理成如下的2×2列联表:10ab30若样本容量为75,且,则当判断X与Y有关系的把握最小时,a的值为()A.5 B.10 C.15 D.178.(2023春·河南南阳·高二校联考期中)在易怒与患心脏病这两个变量的计算中,有以下结论:①当由独立性检验可知有90%的把握认为易怒与患心脏病有关时,那么在100个易怒的人中有90人患心脏病;②由的观测值得到有90%的把握认为易怒与患心脏病有关系,是指有10%的可能性使得推断出现错误;③由独立性检验可知有90%的把握认为易怒与患心脏病有关,是指在犯错误的概率不超过10%的前提下,可以认为某人是否患心脏病与是否易怒有关,其中正确结论的个数是()A.3 B.2 C.1 D.09.(2023春·江西宜春·高二宜春市第三中学校考期中)某课外兴趣小组通过随机调查,利用2×2列联表和,经查阅临界值表知,则下列判断正确的是()A.每100个数学成绩优秀的人中就会有1名是女生C.有99%的把握认为“数学成绩优秀与性别无关”D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”题型四:卡方的计算10.(2023春·陕西西安·高二校考阶段练习)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵不严重的A城市和交通拥堵严重的城市分别随机调查了20名市民,得到如下列联表:A总计认可13518不认可71522总计202040附:.P(K2≥k)k根据表中的数据,下列说法中正确的是()A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”C.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”D.可以在犯错误的概率不超过0.025的前提下认为“是否认可与城市的拥堵情况有关”11.(2023·高二课时练习)某学校调查学生对2022年卡塔尔世界杯的关注是否与性别有关,随机抽样调查了110名学生,进行独立性检验,列联表及临界值表如下:男生女生合计关注50不关注20合计301105附:,其中.则下列说法中正确的是()A.有97.5%的把握认为学生对卡塔尔世界杯的关注与性别无关B.男生不关注卡塔尔世界杯的比例低于女生关注卡塔尔世界杯的比例C.在犯错误概率不超过1%的前提下可认为学生对卡塔尔世界杯的关注为性别有关D.在犯错误概率不超过1%的前提下可认为学生对卡塔尔世界杯的关注与性别无关12.(2023·高二课时练习)某中学为调查高一年级学生的选科倾向,随机抽取了300人,其中选考物理的有220人,选考历史的有80人,统计各选科人数如表所示,则下列说法中正确的是().选考类别选择科目思想政治地理化学生物物理类80100145115历史类50453035参考数据:,其中.附表:0.01A.选考物理类的学生中选择政治的比例比选考历史类的学生中选择政治的比例高B.选考物理类的学生中选择地理的比例比选考历史类的学生中选择地理的比例高C.参照附表,根据小概率值的独立性检验,我们认为选择生物与选考类别无关D.参照附表,根据小概率值的独立性检验,我们认为选择生物与选考类别有关题型五:列联表与独立性检验综合问题13.(2023春·四川宜宾·高二四川省高县中学校校考期中)某实验中学的暑期数学调研学习小组为调查本校学生暑假玩手机的情况,随机调查了位同学月份玩手机的时间单位:小时,并将这个数据按玩手机的时间进行整理,得到下表:玩手机时间人数将月份玩手机时间为小时及以上者视为“手机自我管理不到位”,小时以下者视为“手机自我管理到位”.(1)请根据已知条件完成下面的列联表,并判断是否有的把握认为“手机自我管理是否到位与性别有关”;手机自我管理到位手机自我管理不到位合计男生女生合计(2)根据(1)中的条件,在抽查的“手机自我管理不到位”的人中按性别分层抽样抽取名,这名“手机自我管理不到位”的人中恰有位男生和位女生喜欢体育运动,现在从这名“手机自我管理不到位”的人中随机抽取人,求这个人中男女生均有,并且个人中有人喜欢体育运动的概率.独立性检验临界值表:14.(2023春·湖南张家界·高二慈利县第一中学校考期中)溺水、校园欺凌、食品卫生、消防安全、道路交通等与学生安全有关的问题越来越受到社会的关注和重视.学校安全工作事关学生的健康成长,关系到千万个家庭的幸福和安宁,关系到整个社会的和谐稳定.为了普及安全教育,某市准备组织一次安全知识竞赛.某学校为了选拔学生参赛,按性别采用分层抽样的方法抽取200名学生进行安全知识测试,根据200名同学的测试成绩得到如下表格:性别了解安全知识的程度得分不超过85分的人数得分超过85分的人数男生20100女生3050(1)现从得分超过85分的学生中根据性别采用分层随机抽样抽取6名学生进行安全知识培训,再从这6名学生中随机抽取3名学生去市里参加竞赛,求这3名学生中有至少一名女生的概率;(2)根据小概率值的独立性检验,能否推断该校男生和女生在了解安全知识的程度与性别有关?附:参考公式,其中.下表是独立性检验中几个常用的小概率值和相应的临界值a15.(2023春·江西赣州·高二统考期中)通勤是指从家中往返工作地点的过程,随着城市的扩张及交通技术的进步,人们可以在距离工作地点较远的地方居住,并以通勤来上班,某传媒公司通过对200名受访者每天平均通勤时间的统计,得到如下频数分布表.通勤时间(单位:时)人数40806020把通勤时间超过1小时的称为通勤困扰程度高,不超过1小时的称为通勤困扰程度不高.已知200名受访者中,中年人有90人,其余为青年人,中年人中通勤困扰程度高的有30人.(1)请完成以下列联表,并判断是否有90%的把握认为,青年人与中年人的通勤困扰程度有差异;青年人中年人总计通勤困扰程度高通勤困扰程度不高总计(2)从200名样本人群中随机抽取1人,A表示“抽取的人是青年人”,B表示“抽取的人通勤困扰程度高”,记,求S的值,并证明:附:,当时,表明有90%的把握判断变量有关联.【双基达标】一、单选题16.(2023春·陕西宝鸡·高二校联考阶段练习)通过随机调查名性别不同的社区居民是否喜欢看电视剧,得到如下的列联表:男女总计喜欢不喜欢总计由公式算得:,附:,其中参照附表,得到的正确结论是()A.有的把握认为“居民是否喜欢看电视剧”与性别有关B.有的把握认为“居民是否喜欢看电视剧”与性别有关C.有的把握认为“居民是否喜欢看电视剧”与性别有关D.有的把握认为“居民是否喜欢看电视剧”与性别有关17.(2023·高二课时练习)通过随机询问110名不同的大学生是否爱好某项运动,得到了如下的列联表:男女合计爱好402060不爱好203050总计6050110附表:参照附表,能得到的正确结论是().A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”18.(2023·高二单元测试)疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗的预防效果,在进行动物试验时,得到如下统计数据:未发病发病总计未注射疫苗30注射疫苗40总计7030100现从试验动物中任取一只,取得“注射疫苗”的概率为0.5,则下列判断中错误的是().A.注射疫苗发病的动物数为10B.某个发病的小动物为未注射疫苗动物的概率为D.该疫苗的有效率约为80%19.(2023·高二课时练习)利用独立性检验来考察两个分类变量和是否有关系时,通过查列联表计算得4.964,那么认为与有关系,这个结论错误的可能性不超过()20.(2022·高二单元测试)某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得,则根据这一数据以及临界值表,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度()参考数据如下:,.A.低于 B.低于 C.高于 D.高于21.(2023·江西·高二校联考阶段练习)2022年11月21日第22届世界杯在卡塔尔开幕,是历史上首次在中东国家举办,也是第二次在亚洲国家举办的世界杯足球赛.某校“足球社团”调查学生喜欢足球是否与性别有关,现从全校学生中随机抽取了人,若被抽查的男生与女生人数之比为5:3,男生中喜欢足球的人数占男生的,女生中喜欢足球的人数占女生的.经计算,有95%的把握认为喜欢足球与性别有关,但没有99%的把握认为喜欢足球与性别有关.(1)请完成下面的列联表,并求出k的值;喜欢足球不喜欢足球合计男生女生合计(2)将频率视为概率,用样本估计总体,从全校男学生中随机抽取3人,记其中喜欢足球的人数为X,求X的分布列及数学期望.附:,其中.22.(2023春·内蒙古赤峰·高二赤峰二中校考阶段练习)为了满足同学们多元化的需求,某学校决定每周组织一次社团活动,活动内容丰富多彩,有书法、象棋、篮球、舞蹈、古风汉服走秀、古筝表演等.同学们可以根据自己的兴趣选择项目参加,为了了解学生对该活动的喜爱情况,学校采用给活动打分的方式(分数为整数,满分100分),在全校学生中随机选取1200名同学进行打分,发现所给数据均在内,现将这些数据分成6组并绘制出如图3所示的样本频率分布直方图.(1)请将样本频率分布直方图补充完整,并求出样本的平均数(同一组中的数据用该组区间的中点值作代表);(2)从这1200名同学中随机抽取,经统计其中有男同学70人,其中40人打分在,女同学中20人打分在,根据所给数据,完成下面的下,能否认为对该活动的喜爱程度与性别有关(分数在内认为喜欢该活动)?喜欢不喜欢合计男同学女同学合计附:,.【高分突破】一:单选题23.(2022春·江苏常州·高二校考阶段练习)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为()参考公式:,其中.参考数据:A. B. C. D.24.(2023春·高二课时练习)根据分类变量x与y的观察数据,计算得到.依据下面给出的临界值表,可知下列判断中正确的是()A.有95%的把握认为变量x与y独立B.有95%的把握认为变量x与y不独立C.变量x与y独立,这个结论犯错误的概率不超过10%D.变量x与y不独立,这个结论犯错误的概率不超过10%25.(2022·高二课时练习)为研究市民性别和喜欢某项体育运动是否有关,某校社团学生在部分市民中进行了一次调查,得到下表:该项运动的喜好性别合计男性女性喜欢140不喜欢80合计已知男性喜欢该项运动的人数占男性人数的,女性喜欢该项运动的人数占女性人数的,则下列说法不正确的是()A.列联表中的值为60,的值为120B.有的把握认为市民性别和喜欢该项运动有关系C.随机对一路人进行调查,有的可能性对方喜欢该项运动D.没有的把握认为市民性别和喜欢该项运动有关系26.(2022·高二课时练习)在某次世界运动会上,为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了名参赛运动员进行调查,所得数据如下所示.男性运动员女性运动员对主办方表示满意对主办方表示不满意参考数据:现有如下说法:①在参与调查的名运动员中任取人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有的把握认为“是否对主办方表示满意与运动员的性别有关”.正确说法的个数为()A. B. C. D.27.(2022·高二课时练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是()日落云里走夜晚天气下雨未下雨出现255未出现2545参考公式:临界值参照表:A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.有99%的把握判断“日落云里走”是否出现与夜晚天气有关D.出现“日落云里走”,有99%的把握判断夜晚会下雨二、多选题28.(2023春·江苏常州·高二常州高级中学校考期中)已知两个分类变量、,由它们的样本数据计算得到的观测值,的部分临界值表如下:以下判断正确的是()A.在犯错误的概率不超过的前提下认为变量、有关系B.在犯错误的概率不超过的前提下认为变量、没有关系C.有的把握说变量、有关系D.有的把握说变量、没有关系29.(2023春·河南南阳·高二校联考期中)某机构为了调查某地中学生是否喜欢数学课与性别之间的关系,通过抽样调查的方式收集数据,经过计算得到,由,可知下列结论正确的是()A.有95%的把握认为该地中学生是否喜欢数学课与性别无关B.有95%的把握认为该地中学生是否喜欢数学课与性别有关C.在犯错误的概率不超过5%的前提下,可以认为该地中学生是否喜欢数学课与性别无关D.在犯错误的概率不超过5%的前提下,可以认为该地中学生是否喜欢数学课与性别有关30.(2023·高二课时练习)某中学为了解性别因素是否对本校学生体育锻炼的经常性有影响,从本校所有学生中随机调查了50名男生和50名女生,得到如下列联表:经常锻炼不经常锻炼男4010女3020a经计算,则可以推断出()A.该学校男生中经常体育锻炼的概率的估计值为B.该学校男生比女生更经常锻炼C.有95%的把握认为男、女生在体育锻炼的经常性方面有差异D.有99%的把握认为男、女生在体育锻炼的经常性方面有差异31.(2023春·广东江门·高二校考阶段练习)下列命题正确的是()附:,则乙组数据的线性相关性更强B.已知样本数据的方差为4,则的标准差是4C.在检验A与B是否有关的过程中,根据所得数据算得,则有99%的把握认为A和B有关D.对具有线性相关关系的变量x、y,有一组观测数据,其线性回归方程是,且,则实数的值是32.(2023春·吉林长春·高二长春十一高校考阶段练习)昆明市第三中学在课外活动中新增了攀岩项目,为了解学生对攀岩的喜好和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制如图所示的等高堆积图,则()参考公式及数据其中axaA.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多C.若参与调查的男、女生人数均为100,依据的独立性检验,认为对攀岩的喜好和性别有关D.无论参与调查的男、女生人数为多少,依据的独立性检验,认为对攀岩的喜好和性别有关33.(2023·高二课时练习)卡塔尔足球世界杯比赛于2022年11月揭开战幕,随机询问100人是否喜欢足球,得到如下的列联表:喜欢足球不喜欢足球总计男351550女252550总计6040100参考公式(其中)常用小概率值和临界值表:参照临界值表,下列结论正确的是()A.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别无关”B.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别有关”C.根据小概率值的独立性检验,认为“喜欢足球与性别有关”D.根据小概率值的独立性检验,认为“喜欢足球与性别无关”三、填空题34.(2023春·湖南长沙·高二长郡中学校考阶段练习)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有_________人.(请将所有可能的结果都填在横线上)附表:,其中.35.(2023·高二课时练习)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的,若有的把握但没有的把握认为是否喜欢网络游戏和性别有关,则被调查的学生中男生可能有______人.附表:,其中.36.(2023·高二课时练习)给出下列四个说法:①只有两个变量有相关关系,所得到的回归模型才有预测价值;②通过回归方程可以估计和观测变量的取值和变化趋势;③线性回归方程对应的直线至少经过其样本数据点,,,…,中的一个点;④在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法.其中,说法正确的是______.(写出所有满足要求的说法序号)37.(2023·高二课时练习)某种疾病可分为A、B两种类型,为了解该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者人数是男性患者的2倍,男性患A型疾病的人数占男性患者的,女性患A型疾病的人数占女性患者的.参照附表(见本节末),若本次调查得出“在犯错误的概率不超过0.005的前提下认为‘所患疾病的类型’与‘性别’有关”的结论,则被调查的男性患者至少有______人.【答案】12【分析】根据独立性检验的解题步骤,首先列列联表,利用公式求值,建立不等式,可得答案.【详解】设男性患者有x人,则女性患者有2x人,得2×2列联表如下:A型病B型病总计男x女2x总计3x四、解答题38.(2023春·江西抚州·高二南城县第二中学校考阶段练习)通过随机询问某地100名高中学生在选择座位时是否挑同桌,得到如下列联表:男生女生合计挑同桌304070不挑同桌201030总计50501001,其中.(1)从这50名男生中按是否挑同桌采取分层抽样的方法抽取一个容量为5的样本,现从这5名学生中随机选取3名做深度采访,求这3名学生中恰有2名挑同桌的概率;(2)根据以上列联表,是否有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关?39.(2023·高二课时练习)为了检测甲、乙两名工人生产的产品是否合格,一共抽取了40件产品进行测量,其中甲产品20件,乙产品20件,分别称量产品的重量(单位:克),记重量不低于66克的产品为“合格”,作出茎叶图如图:(1)分别估计甲、乙两名工人生产的产品重量不低于80克的概率;(2)根据茎叶图填写下面的列联表,并判断能否有的把握认为产品是否合格与生产的工人有关?甲乙合计合格不合格合计附:生对中国航天事业的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为,统计得到以下列联表,经计算,有97.5%的把握认为该校学生对中国航天事业的了解与性别有关,但没

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论