第04讲 列联表与独立性检验(原题版)_第1页
第04讲 列联表与独立性检验(原题版)_第2页
第04讲 列联表与独立性检验(原题版)_第3页
第04讲 列联表与独立性检验(原题版)_第4页
第04讲 列联表与独立性检验(原题版)_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

备战2024年高考《解读•突破•强化》一轮复习讲义(新高考)第04讲列联表与独立性检验【考试要求】1.掌握分类变量的含义.2.通过实例,理解2×2列联表的统计意义.3.通过实例,了解2×2列联表独立性检验及其应用.知识点一分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d知识点二独立性检验(1)小概率值α的临界值:对于任何小概率值α,可以找到相应的正实数xα,使得关系P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大;(2)χ2的计算公式:χ2=n((3)独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);(5)应用独立性检验解决实际问题的主要环节:①提出零假设H0:X和Y相互独立,并给出在问题中的解释;②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;③根据检验规则得出推断结论;④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.(6)独立性检验中几个常用的小概率值和相应的临界值:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8281.下列判断正确的是()A分类变量中的变量与函数的变量是同一概念. ()B等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小. ()C独立性检验的方法就是用的反证法. ()Dχ2的大小是判断事件A与B是否相关的统计量. ()2.观察下面各等高堆积条形图,其中两个分类变量关系最强的是 ()3.(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌4.下面是一个2×2列联表:XY合计y1y2x1a2173x2222547合计b46120则表中的a=,b=.

X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界值表如下:αxα则最大有的把握说变量X,Y有关系(填百分数).

考点一等高条形图例12018年12月28日,广州市地铁14号线开通,在一定程度上缓解从化到广州市区交通的拥堵,为了了解市民对地铁14号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析了其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论不一定正确的是(

)A.样本中男性比女性更关注地铁14号线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁14号线的开通的关注度更高【对点演练1】(多选)根据如图所示的等高堆积条形图,下列叙述正确的是 ()A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05D.吸烟与患肺病无关系【对点演练2】(2022下·山东临沂·高二统考期中)某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为.知识点二列联表例2.(2022下·海南·高二统考期末)为考查某种营养品对儿童身高增长的影响,用一部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表:由表可知下列说法正确的是(

)身高合计有明显增长无明显增长食用该营养品a1050未食用该营养品b3050合计6040100参考公式:,其中.参考数据:A.B.C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是D.根据小概率值的独立性检验,可以认为该营养品对儿童身高增长有影响【对点演练1】(2023·云南昆明·校联考一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:项目种子处理种子未处理总计得病32101133不得病192213405总计224314538根据以上数据,则(

)A.种子是否经过处理决定是否生病B.种子是否经过处理跟是否生病无关C.种子是否经过处理跟是否生病有关D.以上都是错误的【对点演练2】(2024·高三课时练习)如表是一个2×2列联表,则表中,的值分别为()合计2173222547合计46120A.94,72 B.52,50C.52,74 D.74,52考点三独立性检验角度1独立性检验思想的辨析例3(2023上·全国·高三专题练习)下列关于独立性检验的说法正确的是()A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以确定两个变量之间是否具有某种关系C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大【对点演练1】(2022上·广东东莞·高三校考阶段练习)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为(

)A.变量与不独立,这个结论犯错误的概率不超过B.变量与不独立,这个结论犯错误的概率不超过C.变量与独立,这个结论犯错误的概率不超过D.变量与独立,这个结论犯错误的概率不超过【对点演练2】(2023·陕西榆林·统考三模)若由一个列联表中的数据计算得,则(

)A.能有的把握认为这两个变量有关系B.能有的把握认为这两个变量没有关系C.能有的把握认为这两个变量有关系D.能有的把握认为这两个变量没有关系【对点演练3】(2023上·全国·高三专题练习)(多选)根据分类变量x与y的观察数据,计算得到χ2=2.974,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是()αxαA.根据小概率值α=0.05的独立性检验,分析变量x与y相互独立B.根据小概率值α=0.05的独立性检验,分析变量x与y不相互独立C.变量x与yD.变量x与y角度2卡方的计算与应用例4.(2023·全国·模拟预测)某超市对一种商品受顾客的喜爱程度进行100份问卷调查,得到了如下的列联表,从100人中随机抽取1人,抽到喜爱该商品的男顾客的概率为.喜爱该商品不喜爱该商品合计男顾客10女顾客35合计100则有超过(

)的把握认为喜爱该商品与性别有关.下面的临界值表供参考:A. B. C. D.【对点演练1】(2023上·全国·高三专题练习)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计30100计算可知,根据小概率值α=________的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”()附:,n=a+b+c+d.αxα角度3根据结论求参数(范围)例5.(2020·河南濮阳·统考二模)2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为(

)附:,其中.【对点演练1】在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若有99.9%把握认为性别与是否喜欢该学科有关,则可以推测N的最小值为(

)附,A.400 B.300 C.200 D.100【对点演练2】(2023上·陕西·高三校联考阶段练习)第19届亚运会将于2023年9月23日至10月8日在杭州举行,某网络直播平台调研“大学生是否喜欢观看体育比赛直播与性别有关”,从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据.喜欢观看不喜欢观看男生女生通过计算,有95%以上的把握认为大学生喜欢观看直播体育比赛与性别有关,则在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为(

)附:,其中.A.55 B.57 C.58 D.60角度4独立性检验思想的实际应用例6(2022·全国甲卷·改编)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)根据小概率值α=0.1的独立性检验,能否认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:χ2=n(α0.1000.0500.010xα2.7063.8416.635【对点演练1】(2023上·全国·高三专题练习)(多选)“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有2000多亿元的餐桌浪费,被倒掉的食物相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”.某机构为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了90位来店就餐的客人,制成如下所示的列联表,通过计算得到K2的观测值为9认可不认可40岁以下202040岁以上(含40岁)4010已知,,则下列判断正确的是()A.在该餐厅用餐的客人中大约有66.7%的客人认可“光盘行动”B.在该餐厅用餐的客人中大约有99%的客人认可“光盘行动”C.根据小概率值α=0.01的独立性检验,认为“光盘行动”的认可情况与年龄有关D.根据小概率值α=0.001的独立性检验,认为“光盘行动”的认可情况与年龄有关【对点演练2】为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验.为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,结果如下表.记成绩不低于70分的为“成绩优良”.分数[50,60)[60,70)[70,80)[80,90)[90,100]甲班频数56441乙班频数13655由以上统计数据列出2×2列联表,并判断能否依据小概率值αχ2独立性检验认为“成绩优良与教学方式有关”.1.下面是一个列联表,其中a、b处填的值分别为(

)总计a217322527总计b46100A.52、54B.54、52C.94、146D.146、942.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下的列联表,则χ2约为 ()班级数学成绩合计优秀不优秀甲班113445乙班83745合计1971903.为考察A,B两种药物预防某疾病的效果,进行药物实验,分别得到如下等高堆积条形图:根据图中信息,在下列各项中,说法最佳的一项是()B的预防效果优于药物A的预防效果A的预防效果优于药物B的预防效果A,B对该疾病均有显著的预防效果A,B对该疾病均没有预防效果4.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+dX与Y有关系的可信程度不小于97.5%,则c=()5.(2022上·黑龙江牡丹江·高三牡丹江市第二高级中学校考阶段练习)某课外兴趣小组通过随机调查,利用2×2列联表和,经查阅临界值表知,则下列判断正确的是(

)A.每100个数学成绩优秀的人中就会有1名是女生C.有99%的把握认为“数学成绩优秀与性别无关”D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”6.(2023上·全国·高三专题练习)2020年以来,为了抗击新冠肺炎疫情,教育部出台了“停课不停学”政策,全国各地纷纷采取措施,通过网络进行教学,为莘莘学子搭建学习的平台.在线教育近几年蓬勃发展,为学生家长带来了便利,节省了时间,提供了多样化选择,满足了不同需求,也有人预言未来的教育是互联网教育.与此同时,网课也存在以下一些现象,自觉性不强的孩子网课学习的效果大打折扣,授课教师教学管理的难度增大.基于以上现象,开学后某学校对本校课学习情况进行抽样调查,抽取25名女生,25名男生进行测试、问卷等,调查结果形成以下2×2列联表,通过数据分析,认为认真参加网课与学生性别之间(

)认真上网课不认真上网课合计男生52025女生151025合计203050参考数据:A.不能根据小概率的的独立性检验认为两者有关B.根据小概率的的独立性检验认为两者有关C.根据小概率的的独立性检验认为两者有关D.根据小概率的的独立性检验认为两者无关7.(2023·山东菏泽·统考二模)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的,女性喜爱足球的人数占女性人数的,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有(

)人aA.10 B.11 C.12 D.138.(多选)(2023上·全国·高三专题练习)炎炎夏日,许多城市发出高温预警,凉爽的昆明成为众多游客旅游的热门选择,为了解来昆明旅游的游客旅行方式与年龄是否有关,随机调查了100名游客,得到如下列联表,零假设为:旅行方式与年龄没有关联,则下列说法正确的有(

)小于40岁不小于40岁自由行3819跟团游2023附:,其中.A.在选择自由行的游客中随机抽取一名,其小于40岁的概率为B.在选择自由行的游客中按年龄分层抽样抽取6人,再从中随机选取2人做进一步的访谈,则所选2人中至少有1人不小于40岁的概率为C.根据D.根据9.(多选)(2023·全国·高二专题练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了A地区的100天日落和夜晚天气,得到如下2×2列联表,并计算得到χ2≈19.05,下列小波对A地区天气的判断正确的是()日落云里走夜晚天气下雨未下雨出现255未出现2545A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.依据α=0.005的独立性检验,认为“日落云里走”是否出现与夜晚天气有关D.依据α=0.005的独立性检验,若出现“日落云里走”,则认为夜晚一定会下雨10.(2019上·四川资阳·高三统考阶段练习)如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为.11.(2023上·全国·高三专题练习)已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=的χ2独立性检验,分析喜欢该项体育运动与性别有关.12.(2023上·高二课时练习)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以在犯错误的概率不超过的前提下认为该学校15至16周岁的男生的身高与体重之间有关系.身高体重超重不超重总计偏高415不偏高31215总计71320附表:13.(2023·四川绵阳·四川省绵阳南山中学校考模拟预测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若有95%的把握认为是否追星和性别有关,则调查样本中男生至少有人.参考数据及公式如下:14.(2023·全国·模拟预测)某校为了解本校学生课间进行体育活动的情况,随机抽取了60名男

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论