专题15独立性检验(原卷版)_第1页
专题15独立性检验(原卷版)_第2页
专题15独立性检验(原卷版)_第3页
专题15独立性检验(原卷版)_第4页
专题15独立性检验(原卷版)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题15独立性检验【考点预测】1、列联表设,为两个变量,它们的取值分别为和,其样本频数列联表(列联表)如下:总计总计2、独立性检验基于小概率值的检验规则是:当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断H0不成立,可以认为X和Y独立.这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(testofindependence).下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值0.10.050.010.0050.0012.7063.8416.6357.87910.8283、应用独立性检验解决实际问题的大致步骤(1)提出零假设:X和Y相互独立,并给出在问题中的解释;(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.【典型例题】例1.(2023·山东烟台·高二统考期中)1.两个分类变量X和Y,其2×2列联表如表,对同一样本,以下数据能说明X与Y有关联的可能性最大的一组为(

).XY合计369m8合计14A. B. C. D.例2.(2023·山西大同·高二山西省浑源中学校考期中)利用独立性检验来考察两个分类变量和是否有关系时,通过查列联表计算得4.964,那么认为与有关系,这个结论错误的可能性不超过(

)0.1000.0500.0100.0050.0012.7063.8416.6357.87910.828A.0.001 B.0.005 C.0.01 D.0.05例3.(2023·湖南长沙·高二长沙麓山国际实验学校校考期中)为了发展学生的兴趣和个性特长,培养全面发展的人才.某学校在不加重学生负担的前提下.提供个性、全面的选修课程.为了解学生对于选修课《学生领导力的开发》的选择意愿情况,对部分高二学生进行了抽样调查,制作出如图所示的两个等高条形图,根据条形图,下列结论正确的是(

)A.样本中不愿意选该门课的人数较多B.样本中男生人数多于女生人数C.样本中女生人数多于男生人数D.该等高条形图无法确定样本中男生人数是否多于女生人数例4.(2023·山西太原·高二统考期中)某校高二年级为研究学生数学成绩与语文成绩的关系,采取有放回的简单随机抽样,从高二学生中抽取样本容量为200的样本,将所得数学成绩与语文成绩的样本观测数据整理如下:语文成绩合计优秀不优秀数学成绩优秀503080不优秀4080120合计90110200(1)根据的独立性检验,能否认为数学成绩与语文成绩有关联?(2)在人工智能中常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.现从该校学生中任选一人,表示“选到的学生语文成绩不优秀”,表示“选到的学生数学成绩不优秀”.请利用样本数据,估计的值.附:.0.050.010.0013.8416.63510.828例5.(2023·浙江宁波·高二宁波市北仑中学校考期中)数学兴趣小组为研究本校学生数学成绩与语文成绩的关系,采取有放回的简单随机抽样,从学校抽取样本容量为200的样本,将所得数学成绩与语文成绩的样本观测数据整理如下:语文成绩合计优秀不优秀数学成绩优秀503080不优秀4080120合计90110200(1)根据的独立性检验,能否认为数学成绩与语文成绩有关联?(2)根据列联表的信息,表示“选到的学生语文成绩不优秀”,表示“选到的学生数学成绩不优秀”,求的值;(3)现从数学成绩优秀的样本中,按分层抽样的方法选出8人组成一个小组,从抽取的8人里再随机抽取3人参加数学竞赛,求这3人中,语文成绩优秀的人数的概率分布列及数学期望.附:.例6.(2023·河南南阳·高二校联考期中)清明节是我国的传统节日,某企业计划在清明节组织员工活动,准备从“参观烈士陵园”和“植树”两个活动方案中确定一个,为此随机调查了200名员工,让他们选择自己倾向的活动方案,调查结果按照员工的年龄分类,得到下面的列联表:参观烈士陵园植树35岁以下的员工346635岁及以上的员工5644(1)求倾向植树的员工中年龄在35岁以下的概率;(2)是否有99%的把握认为该公司员工对清明节活动的倾向与年龄有关?附:.0.10.050.012.7063.8416.635例7.(2023·河南南阳·高二校联考期中)被赞誉为“波士顿比利”的美国知名跑者比尔·罗杰斯曾经说过:“跑步是全世界最棒的运动.”坚持跑步可以增强体质、提高免疫力、改善精神状态.某数学兴趣小组从某地大学生中随机抽取200人,调查他们是否喜欢跑步,得到的数据如下表所示.喜欢跑步不喜欢跑步总计男生50120女生30总计200(1)分别估计该地男、女大学生喜欢跑步的概率;(2)能否有的把握认为该地大学生是否喜欢跑步与性别有关?参考公式:,其中.参考数据:0.100.050.0100.0012.7063.8416.63510.828例8.(2023·安徽芜湖·高二校考期末)某初中为了了解学生对消防安全知识的掌握情况,开展了网上消防安全知识考试.对参加考试的男生、女生各随机抽查40人,根据考试成绩,得到如下列联表:男生女生合计考试成绩合格302050考试成绩不合格102030合计404080(1)根据上面的列联表,依据小概率值的独立性检验,能否认为考试成绩是否合格与性别有关;(2)在考试成绩不合格的30人中按性别利用按比例分配的分层抽样的方法随机抽取6人,再从这6人中随机抽取3人,记这3人中男生的人数为,求的分布列和数学期望.附:,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828例9.(2023·重庆沙坪坝·高二重庆八中校考期末)第24届冬季奥林匹克运动会于2022年2月在中国北京张家口举行.为调查不同地域青少年对冰雪运动的了解情况,某机构抽样调查了北京、天津、上海、重庆等四个城市的部分高中学生,调查问卷共20个题目.(1)若某个参加调查的同学能确定其中10个题目的答案,其余10个题目中,有5个题目他能够答对的概率均为0.6,另外5个题目他能够答对的概率均为0.2,求该同学答对题目个数的均值;(2)将重庆和上海并为“南方组”,北京和天津并为“北方组”,通过调查得到如下列联表:地域了解程度合计不了解非常了解南方组53112165北方组96139235合计149251400请在参考数据②中选择一个,根据的独立性检验,分析受调群体中对冰雪运动的了解程度是否存在南北差异.参考公式:参考数据:①,,.②独立性检验常用小概率值和相应临界值:a0.10.050.010.0050.0012.7063.8416.6357.87910.0828例10.(2023·辽宁铁岭·高二昌图县第一高级中学校考期末)2022年新型冠状“奥密克戎”病毒肆虐,冠状肺炎感染人群年龄大多数是50岁以上的人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期中位数为5,平均数为7.1,方差为5.06.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:年龄潜伏期合计长潜伏期非长潜伏期50岁以上3011014050岁及50岁以下204060合计50150200(1)依据小概率值的独立性检验,可否认为“长潜伏期”与年龄有关?(2)假设潜伏期Z服从正态分布,其中近似为样本平均数,近似为样本方差.现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(3)以题日中的样本频率估计概率,设1000个病例中恰有个属于“长潜伏期”的概率是,当k为何值时,取得最大值?附:.0.10.050.012.7063.8416.635若随机变量Z服从正态分布,则,,,.【过关测试】一、单选题1.(2023·山西太原·高二统考期中)某市对机动车单双号限行进行了调查,在参加调查的2748名有车人中有1760名持反对意见,2652名无车人中有1400名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否相关时,用下列哪种方法最有说服力(

)A.平均数 B.方差 C.独立性检验 D.回归直线方程2.(2023·河南南阳·高二校联考期中)已知两个分类变量X,Y的可能取值分别为和,通过随机调查得到样本数据,再整理成如下的2×2列联表:10ab30若样本容量为75,且,则当判断X与Y有关系的把握最小时,a的值为(

)A.5 B.10 C.15 D.173.(2023·河南南阳·高二校联考期中)在易怒与患心脏病这两个变量的计算中,有以下结论:①当由独立性检验可知有90%的把握认为易怒与患心脏病有关时,那么在100个易怒的人中有90人患心脏病;②由的观测值得到有90%的把握认为易怒与患心脏病有关系,是指有10%的可能性使得推断出现错误;③由独立性检验可知有90%的把握认为易怒与患心脏病有关,是指在犯错误的概率不超过10%的前提下,可以认为某人是否患心脏病与是否易怒有关,其中正确结论的个数是(

)A.3 B.2 C.1 D.04.(2023·上海黄浦·高二上海市大同中学校考期末)某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得,则根据这一数据以及临界值表,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度(

)参考数据如下:,.A.低于 B.低于 C.高于 D.高于5.(2023·河南焦作·高二焦作市第一中学校联考期中)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为(

)参考公式:,其中.参考数据:A. B. C. D.6.(2023·湖北武汉·高二湖北省武昌实验中学校考期末)某医疗研究所为了检查新研发的疫苗对某种病毒的预防作用,把1000只已注射疫苗的小白鼠与另外1000只未注射疫苗的小白鼠的感染记录作比较,提出原假设:“这种疫苗不能起到预防该病毒传染的作用.”并计算得,则下列说法正确的是()A.这种疫苗对预防该病毒传染的有效率为1%B.若某人未使用疫苗,则他有99%的可能性传染该病毒C.有99%的把握认为“这种疫苗能起到预防该病毒传染的作用”D.有1%的把握认为“这种疫苗能起到预防该病毒传染的作用”7.(2023·山东滨州·高二统考期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为(

)附:,附表:0.050.013.8416.635A.7 B.8 C.9 D.10二、多选题8.(2023·全国·高二期末)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下的2×2列联表(个别数据暂用字母表示):幸福感强幸福感弱总计阅读量多1872阅读量少3678总计9060150计算得:,参照下表:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828对于下面的选项,正确的为(

)A.根据小概率值的独立性检验,可以认为“阅读量多少与幸福感强弱无关”B.C.根据小概率值的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”D.9.(2023·山东青岛·高二统考期末)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下的列联表(个别数据暂用字母表示):幸福感强幸福感弱总计阅读量多1872阅读量少3678总计9060150计算得:,参照下表:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828对于下面的选项,正确的为(

)A.根据小概率值的独立性检验,可以认为“阅读量多少与幸福感强弱无关”B.C.根据小概率值的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”D.10.(2023·河南南阳·高二校联考期中)某机构为了调查某地中学生是否喜欢数学课与性别之间的关系,通过抽样调查的方式收集数据,经过计算得到,由,可知下列结论正确的是(

)A.有95%的把握认为该地中学生是否喜欢数学课与性别无关B.有95%的把握认为该地中学生是否喜欢数学课与性别有关C.在犯错误的概率不超过5%的前提下,可以认为该地中学生是否喜欢数学课与性别无关D.在犯错误的概率不超过5%的前提下,可以认为该地中学生是否喜欢数学课与性别有关11.(2023·山西吕梁·高二校联考期中)卡塔尔足球世界杯比赛于2022年11月揭开战幕,随机询问100人是否喜欢足球,得到如下的列联表:喜欢足球不喜欢足球总计男351550女252550总计6040100参考公式(其中)常用小概率值和临界值表:0.050.0100.0053.8416.6357.879参照临界值表,下列结论正确的是(

)A.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别无关”B.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别有关”C.根据小概率值的独立性检验,认为“喜欢足球与性别有关”D.根据小概率值的独立性检验,认为“喜欢足球与性别无关”三、填空题12.(2023·天津南开·高二天津四十三中校考期中)某学校对全校进行统计抽查,抽出50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总数喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总数262450根据表中数据得到.则在犯错误的概率不超过______的前提下,认为“玩电脑游戏与认为作业多少”有关系参考数据表:0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.82813.(2023·上海黄浦·高二上海市向明中学校考期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则女生至少有_____人.参考数据及公式如下:0.0500.0100.0013.8416.63510.828,.14.(2023·北京·高二北理工附中校考期末)某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了人,计算发现,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是______.附:常用小概率值和临界值表:15.(2023·江苏·高二期末)为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:礼让斑马线行人不礼让斑马线行人男性司机人数4015女性司机人数2025若以为统计量进行独立性检验,则的值是__________.(结果保留2位小数)参考公式四、解答题16.(2023·湖南·高二校联考期中)甲、乙两地到某高校实施“优才计划”,即通过笔试,面试,模拟技能这3项考核程序后直接签约一批优秀毕业生,已知3项程序分别由3个考核组独立依次考核,当3项考核程序均通过后即可签约.2022年,该校数学系100名毕业生参加甲地“优才计划”的具体情况如下表(不存在通过3项程序考核放弃签约的情况):人数性别参加考核但未能签约的人数参加考核并能签约的人数男生3515女生4010今年,该校数学系毕业生小明准备参加两地的“优才计划”,假定他参加各程序的结果相互不影响,且他的辅导员作出较客观的估计:小明通过甲地的每项程序的概率均为,通过乙地的各项程序的概率依次为,,.(1)依据小概率值的独立性检验,判断这100名毕业生去年参加甲地“优才计划”能否签约与性别是否有关联?(2)若小明通过甲、乙两地的程序的项数分别记为X,Y,分别求出X与Y的数学期望.参考公式与临界值表:,.0.100.050.0102.7063.8416.63517.(2023·江西·高二校联考期中)某校为普及安全知识,随机抽取了400名学生开展一次校园安全知识答题活动.满分100分,计分分为两类:60分及以上为合格,60分以下为不合格.统计结果如下:合格不合格男生40%15%女生25%20%(1)判断能否有的把握认为“校园安全知识答题合格与性别有关”;(2)现从答题不合格的学生中按性别分层抽样抽取7人,再从7人中任选4人进行安全知识学习,求恰好抽到一名女生的概率.附:列联表参考公式:,其中.临界值表:0.1000.0500.0250.0100.0012.7063.8415.0246.63510.82818.(2023·山东青岛·高二校考期中)老旧小区改造一头连着民生,一头连着发展,是百姓看得见、摸得着的贴心工程,包括多层住宅加装电梯、外墙保温等工程.为积极推动现有多层住宅加装电梯工作,促进居民意见统一与达成共识,某市城建局制定了《既有多层住宅加装电梯不同楼层业主出资指导区间方案》(以下简称《方案》)并广泛征求居民意见.工作人员随机调研了某小区多幢五层楼的居民,得到如下数据:楼层1楼2楼3楼4楼5楼意见同意不同意同意不同意同意不同意同意不同意同意不同意户数812911119128164然后依据小概率值的独立性检验进行判断;(1)完成列联表,并说明能否据此推断同意《方案》与居住楼层高于三层有关;同意《方案》不同意《方案》合计四层或五层户数一、二、三层户数合计(2)如果表中的数据都扩大为原来的10倍,在相同的检验标准下,再用独立性检验推断同意《方案》与居住楼层高于三层之间的关联性,结论还一样吗?请你试着解释其中的原因.附:.0.0500.0100.0013.8416.63510.828零假设为:同意《方案》与居住楼层高于三层无关,因此依据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即同意《方案》与居住楼层高于三层没有关系(2)如果表中的数据都扩大为原来的10倍,经计算得依据小概率值的独立性检验,可以推断不成立,因此可以认为不成立,即同意《方案》与居住楼层高于三层有关,此推断犯错误的概率不大于0.01原因是每个数据都扩大为原来的10倍,相当于样本量变大为原来的10倍,导致推断结论发生了变化.19.(2023·山东滨州·高二统考期中)根据交管部门有关规定,驾驶电动自行车必须佩戴头盔,保护自身安全,某市去年上半年对此不断进行安全教育.下表是该市某主干路口去年连续5个月监控设备抓拍到的电动自行车驾驶员不戴头盔的统计数据:月份12345不戴头盔人数120100907565(1)请利用所给数据求不戴头盔人数与月份之间的回归直线方程;(2)交管部门统计连续5年来通过该路口的电动车出事故的100人,分析不戴头盔行为与事故是否伤亡的关系,得到下表,能否有95%的把握认为不戴头盔行为与事故伤亡有关?不戴头盔戴头盔伤亡1510不伤亡2550参考数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论