9.10独立性检验答案_第1页
9.10独立性检验答案_第2页
9.10独立性检验答案_第3页
9.10独立性检验答案_第4页
9.10独立性检验答案_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.10独立性检验课标要求精细考点素养达成1.掌握运用二维列联表的方法,会求χ2的值,并给出判断列联表及其统计意义通过学习列联表及其统计的意义,利用独立性检验求χ2的值,提升学生的数学运算素养独立性检验的应用2.理解独立性检验的基本思想,明确独立性检验的基本步骤,并能利用独立性检验解决实际问题独立性检验与频率分布直方图、概率的综合应用通过学习独立性检验与频率分布直方图、概率的综合应用,提升学生的数据分析与逻辑推理素养1.(概念辨析)(多选)下面结论正确的是().A.若事件X,Y关系越密切,则由统计数据计算得到的χ2的值越大B.假设检验的原理和反证法相似C.如果χ2的观测值很大,那么在一定程度上说明假设不合理D.由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,若某人数学成绩优秀,则他有99%的可能物理成绩优秀答案AB2.(对接教材)下面是2×2列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为().A.94,72 B.52,50 C.52,74 D.74,52答案C解析因为a+21=73,所以a=52.又a+22=b,所以b=74.3.(对接教材)已知变量X,Y,由它们的样本数据计算得到χ2的观测值χ2≈4.328,χ2的部分临界值表如下:P(χ2≥xα)0.100.050.0250.0100.005xα2.7063.8415.0246.6357.879则最大有的把握说变量X,Y有关系(填百分数).

答案95%解析因为χ2≈4.328>3.841=x0.05,所以在犯错误的概率不超过0.05的前提下认为变量X,Y有关系,所以最大有95%的把握说变量X,Y有关系.4.(易错自纠)某医疗机构通过抽样调查(样本容量n=1000),利用2×2列联表和χ2统计量研究患肺病是否与吸烟有关.计算得χ2=4.453,经查阅临界值表知P(χ2≥3.841)≈0.05,现给出四个结论,其中正确的是().A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”答案C解析由已知数据可得,有10.05=95%的把握认为“患肺病与吸烟有关”.5.(2023·全国甲卷(理))为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).(1)设其中两只小鼠中对照组小鼠数目为X,求X的分布列和数学期望;(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)对照组:17.318.420.120.421.523.224.624.825.025.426.126.326.426.526.827.027.427.527.628.3实验组:5.46.66.86.97.88.29.410.010.411.214.417.319.220.223.623.824.525.125.226.0①求40只小鼠体重的中位数m,并完成下面2×2列联表:<m≥m对照组实验组②根据2×2列联表,能否有95%的把握认为药物对小鼠生长有抑制作用.参考数据:P(χ2≥x0)0.100.050.010x02.7063.8416.635解析(1)依题意,X的可能取值为0,1,2,则P(X=0)=C200C202C402=1978,P(X=1)=C201C20所以X的分布列为X012P192019故E(X)=0×1978+1×2039+2×1978(2)①依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由于原数据已经排好,所以我们只需要观察对照组第一排数据与实验组第二排数据即可,可得第11位数据为14.4,后续依次为17.3,17.3,18.4,19.2,20.1,20.2,20.4,21.5,23.2,23.6,…,故第20位为23.2,第21位数据为23.6,所以m=23.2+23.62=23.4故列联表为:<m≥m合计对照组61420实验组14620合计202040②由①可得,χ2=40×(6×6-14×14)220×20×20×20=6.400>3所以能有95%的把握认为药物对小鼠生长有抑制作用.列联表及其统计意义典例1(多选)某医疗研究机构为了了解免疫与注射疫苗的关系,进行一次抽样调查,得到数据如表1.表1免疫不免疫合计注射疫苗101020未注射疫苗63440合计164460表2P(χ2≥x0)0.100.0500.0100.001x02.7063.8416.63510.828参考公式:χ2=n(ad-bc)2(则下列说法中正确的是().A.χ2≈8.35B.P(χ2≥6.635)≈0.001C.我们有99%以上的把握认为免疫与注射疫苗有关系D.我们有99.9%以上的把握认为免疫与注射疫苗有关系答案AC解析由表中数据,得χ2=60×(10×34-6×10)220×40×16×44≈8.352≈8.35,所以A正确;因为P(χ2≥6.635)≈0.010,所以B错误;我们有99%以上的把握认为免疫与注射疫苗有关系,所以C正确;我们没有99.9%以上的把握认为免疫与注射疫苗有关系,所以1.根据公式计算出χ2的观测值,并对照临界值表给出判断结果;2.利用计算结果,可以更好地优化调查方法,提高统计的实际价值.训练1(多选)某市为了研究该市空气中的PM2.5浓度和SO2浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SO2浓度(单位:μg/m3),得到如下所示的2×2列联表:SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010经计算χ2=100×(64×10−16×10)280×20×74×26≈7.4844,则可以推断出(附:χ2=n(P(χ2≥x0)0.0500.0100.001x03.8416.63510.828A.该市一天空气中PM2.5浓度不超过75μg/m3,且SO2浓度不超过150μg/m3的概率估计值是0.64B.若2×2列联表中的天数都扩大到原来的10倍,则χ2的观测值不会发生变化C.有超过99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与SO2浓度有关答案ACD解析补充完整列联表如下:SO2PM2.5[0,150](150,475]合计[0,75]641680(75,115]101020合计7426100对于A,该市一天中空气中PM2.5浓度不超过75μg/m3,且SO2浓度不超过150μg/m3的概率估计值为64100=0.64,故A正确对于B,χ2=n(ad-bc)2(a+b)(c+d)(a+对于C,D,因为7.4844>6.635,根据临界值表可知,在犯错的概率不超过1%的条件下,即有超过99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关,故C,D均正确.独立性检验的应用典例2为加强素质教育,提升学生综合素养,某中学为高一年级提供了“书法”和“剪纸”两门选修课.为了了解选择“书法”或“剪纸”是否与性别有关,调查了高一年级1500名学生的选择倾向,随机抽取了100人,统计选择两门课程人数如下表:(1)补全2×2列联表;选书法选剪纸共计男生4050女生共计30(2)是否有95%的把握认为选择“书法”或“剪纸”与性别有关?(计算结果保留到小数点后三位,例如:3.841)参考附表:P(χ2≥x0)0.1000.0500.025x02.7063.8415.024参考公式:χ2=n(ad-解析(1)根据题意补全2×2列联表,如下:选书法选剪纸共计男生401050女生302050共计7030100(2)根据列联表中数据,得χ2=100×(40×20-10×30)250×50×70×30≈4.762>3所以有95%的把握认为选“书法”或“剪纸”与性别有关.(1)独立性检验的一般步骤:①根据样本数据制成2×2列联表;②根据公式χ2=n(ad-bc)2(a+b)(c+(2)解独立性检验的应用问题的关注点①两个明确:明确两类主体;明确研究的两个问题.②两个准确:准确画出2×2列联表;准确理解χ2.(3)理解独立性检验在统计中的实际意义.训练2为了了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:线上学习前成绩x145130120105100线上学习后成绩y110901027870求y关于x的线性回归方程;参考公式:b^=∑i=1n(xi-(2)针对全班50名同学(30名男生,20名女生)的线上学习满意度调查中,男生满意率为70%,女生满意率为80%,填写下面2×2列联表,判断能否在犯错误的概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?满意人数不满意人数合计男生女生合计附:χ2=n(ad-P(χ2≥x0)0.0500.0100.001x03.8416.63510.828解析(1)因为x=145+130+120+105+1005=120y=110+90+102+78+705=90所以b^=∑i=15(xi-xa^=yb^x=900.8×120=所以y关于x的线性回归方程为y^=0.8x6(2)填写列联表如下:满意人数不满意人数合计男生21930女生16420合计371350提出假设H0:学生线上学习满意度与学生性别无关,所以χ2=50×(21×4-16×9)230×20×37×13=300481≈0.624<所以在犯错误概率不超过0.01的前提下,不能认为线上学习满意度与学生性别有关.决策问题典例为落实十三五规划节能减排的国家政策,某职能部门对市场上两种设备的使用寿命进行调查统计,随机抽取A型和B型设备各100台,得到如图所示的频率分布直方图:(1)估算A型设备的使用寿命的第80百分位数;(2)将使用寿命超过2500小时和不超过2500小时的台数填入下面的列联表:超过2500小时不超过2500小时总计A型B型总计根据上面的列联表,能否有99%的把握认为使用寿命是否超过2500小时与型号有关?(3)现有一项工作需要10台同型号设备同时工作2500小时才能完成,工作期间设备损坏立即更换同型号设备(更换设备时间忽略不计),A型和B型设备每台的价格分别为1万元和0.6万元,A型和B型设备每台每小时耗电分别为2度和6度,电价为0.75元/度.只考虑设备的成本和电费,用频率估计概率,你认为应选择哪种型号的设备,请说明理由.参考公式:X2=n(ad参考数据:P(χ2≥x0)0.0500.0100.001x03.8416.63510.828解析(1)因为前3组的频率之和为(0.0002+0.0004+0.0006)×500=0.6,前4组频率之和为(0.0002+0.0004+0.0006+0.0005)×500=0.85,所以第80百分位数一定位于[3000,3500),故第80百分位数为3000+0.8−0.60.85−0.6×500=3400(小时)(2)由频率分布直方图可知,A型超过2500小时的有100×(0.0006+0.0005+0.0003)×500=70(台),则A型不超过2500小时的有10070=30(台);B型超过2500小时的有100×(0.0006+0.0003+0.0001)×500=50(台),则B型不超过2500小时的有10050=50(台),故2×2列联表如下:超过2500小时不超过2500小时总计A型7030100B型5050100总计12080200因为χ2=200×(70×50−30×50)2100×100×120×80≈8.333>6所以有99%的把握认为使用寿命是否超过2500小时与型号有关.(3)因为A型设备每台更换的频率为30100=0.3,所以10台A型设备估计要更换3台B型设备每台更换的频率为50100=0.5,所以10台B型设备估计要更换5台选择A型设备的总费用y1=(10+3)×1+10×2×0.75×2500×104=16.75(万元),选择B型设备的总费用y2=(10+5)×0.6+10×6×0.75×2500×104=20.25(万元),故选择A型设备.1.在概率与统计的问题中,决策的工具是样本的数字特征或有关概率.决策方案的最佳选择是将概率最大(最小)或数学期望最大(最小)的方案作为最佳方案,这往往借助于函数、不等式或数列的有关性质去实现.2.独立性检验常与统计中的频率分布直方图、概率知识自然交汇,不要割裂其内在联系.训练某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,经统计得到如下数据:x12345678y1126144.53530.5282524根据以上数据,绘制了如图所示的散点图,观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型y=a+bx和指数函数模型y=cedx分别对两个变量的关系进行拟合,已求得用指数函数模型拟合的回归方程为y^=96.54e-0.2x,lny与x的相关系数r1=(1)用反比例函数模型求y关于x的经验回归方程.(2)用相关系数(精确到0.01)判断上述两个模型哪一个拟合效果更好,并用其估计产量为10千件时每件产品的非原料成本.(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元?请说明理由.参考数据其中μ∑i=18uiuu∑∑i=18∑0.61×6185.5e2183.40.340.1151.5336022385.561.40.135参考公式:回归方程y^=a^+b^x中斜率和截距计算公式b^=∑i=1nxiy相关系数r=∑i=1nxiyi-nx解析(1)令u=1x,则y=a+bx可转化为因为y=3608=45所以b^=183.4−8×0.34×451.53−8×0.115=610.61则a^=yb^u=45100×0.34所以y^=11+100u所以y关于x的经验回归方程为y^=11+100(2)y与1x的相关系数r2=610.61×6185.5≈6161.4≈0因为|r1|<|r2|,所以用反比例函数模型拟合效果更好.当x=10时,y=10010+11=21(元所以当产量为10千件时,每件产品的非原料成本估计为21元.(3)①若产品单价为100元,记企业利润为X千元,当订单为9千件时,每件产品的成本为1009+21元,企业的利润为611当订单为10千件时,每件产品的成本为31元,企业的利润为690千元,则企业利润X的分布列为X611690P0.80.2所以E(X)=611×0.8+690×0.2=626.8(千元).②若产品单价为90元,记企业利润为Y千元,当订单为10千件时,每件产品的成本为31元,企业的利润为590千元;当订单为11千件时,每件产品的成本为10011+21元,企业的利润为659则企业利润Y的分布列为Y590659P0.30.7所以E(Y)=590×0.3+659×0.7=638.3(千元).因为626.8<638.3,所以企业要想获得更高利润,产品单价应选择90元.一、单选题1.给出下列实际问题,其中不可以用独立性检验解决的是().A.喜欢参加体育锻炼与性别是否有关B.喝酒者得胃病的概率C.喜欢喝酒与性别是否有关D.青少年犯罪与上网成瘾是否有关答案B解析独立性检验是对两个分类变量是否有关进行检验,A,C,D选项中均是对两个分类变量是否有关进行检验,而B选项不是.2.某市对公共场合禁烟进行网上调查,在参与调查的2500名男性市民中有1000名持支持态度,2500名女性市民中有2000人持支持态度,在运用数据说明市民对在公共场合禁烟是否支持与性别有关系时,用()方法最有说明力.A.平均数与方差 B.回归直线方程 C.独立性检验 D.概率答案C解析因为独立性检验研究的是两个分类变量之间的相关关系,所以市民对在公共场合禁烟是否支持与性别有关系时,用独立性检验最有说明力.3.为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的2×2列联表中,由列联表中的数据计算得χ2≈9.616.参照附表,下列结论正确的是().附表:P(χ2≥x0)0.0500.0250.0100.0050.001x03.8415.026.6357.87910.828A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”C.有99%以上的把握认为“药物有效”D.有99%以上的把握认为“药物无效”答案C解析因为χ2≈9.616,即7.879<χ2<10.828,所以有99%以上的把握认为“药物有效”.4.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于().A.3 B.4 C.5 D.6附:P(χ2≥xα)0.050.025xα3.8415.024答案A解析列2×2列联表如下:YXy1y2合计x1102131x2cd35合计10+c21+d66故χ2=66×[10(35−c)-21c]231×35×(10+c)(56-c)≥5.024.把选项二、多选题5.某大学为了了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联表,则可以推断出().满意不满意男3020女4010P(χ2≥x0)0.1000.0500.010x02.7063.8416.635A.该学校男生对食堂服务满意的概率的估计值为3B.调研结果显示,该学校男生比女生对食堂服务更满意C.有95%的把握认为男、女生对该食堂服务的评价有差异D.有99%的把握认为男、女生对该食堂服务的评价有差异答案AC解析对于A,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A正确;对于B,该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B错误;因为χ2=100×(30×10−20×40)250×50×70×30≈4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异6.为预防近视,某校对“学生性别和喜欢躺着看书”是否有关做了一次调查,其中被调查的男女生人数相同,男生喜欢躺着看书的人数占男生人数的25,女生喜欢躺着看书的人数占女生人数的45,若有95%的把握认为是否喜欢躺着看书和性别有关,则调查人数中男生人数不可能是(附:χ2=n(ad-P(χ2≥x0)0.050.010x03.8416.635A.5 B.10 C.21 D.15答案ABC解析由题意知被调查的男女生人数相同,设男生的人数为5m(m∈N*),由题意可列出2×2列联表:男生女生合计喜欢躺着看书2m4m6m不喜欢躺着看书3mm4m合计5m5m10mχ2=n=10m·(2因为有95%的把握认为是否喜欢躺着看书和性别有关,所以3.841≤5m3<6.解得11.523≤5m<19.905,因为m∈N*,所以5m的可能取值为15.故选ABC.三、填空题7.下面是一个2×2列联表:y1y2合计x1a2173x222527合计b46100则表中a,b的值分别为.

答案52,54解析a=7321=52,b=10046=54.8.某校团委对“学生性别和喜欢足球是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢足球的人数占男生人数的45,女生喜欢足球的人数占女生人数的35.若有95%的把握认为是否喜欢足球和性别有关,则调查人数中男生至少有答案45解析设男生有x人,则女生有x人,可得2×2列联表如下:喜欢足球不喜欢足球总计男生4515x女生3525x总计75352x若有95%的把握认为是否喜欢足球和性别有关,则χ2=2x·45x·25x-15x·35x275x·35x·x·四、解答题9.为了有针对性地提高学生体育锻炼的积极性,某校需要了解学生是否经常锻炼与性别因素有关,为此随机对该校100名学生进行问卷调查,得到如下列联表.经常锻炼不经常锻炼总计男35女25总计100已知从这100名学生中任选1人,经常锻炼的学生被选中的概率为12(1)完成上面的列联表;(2)根据列联表中的数据,判断能否有90%的把握认为该校学生是否经常锻炼与性别因素有关.附:χ2=n(ad-bcP(χ2≥x0)0.10.050.010.001k2.7063.8416.63510.828解析(1)设这100名学生中经常锻炼的学生有x人,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论