新教材人教a版选择性必修第三册8.3.1-8.3.2分类变量与列联表独立性检验学案_第1页
新教材人教a版选择性必修第三册8.3.1-8.3.2分类变量与列联表独立性检验学案_第2页
新教材人教a版选择性必修第三册8.3.1-8.3.2分类变量与列联表独立性检验学案_第3页
新教材人教a版选择性必修第三册8.3.1-8.3.2分类变量与列联表独立性检验学案_第4页
新教材人教a版选择性必修第三册8.3.1-8.3.2分类变量与列联表独立性检验学案_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.3列联表与独立性检验8.3.1分类变量与列联表8.3.2独立性检验核心知识目标核心素养目标1.通过典型案例的探究,了解独立性检验的基本思想.2.会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题.1.通过学习独立性检验的基本思想,提升逻辑推理的素养.2公式,培养数学运算的素养.3.借助等高堆积条形图,培养直观想象的素养.(1)分类变量:特殊的随机变量以区别不同的现象或性质,分类变量的取值可以用实数表示.(2)2×2列联表①定义:列出的两个分类变量的频数表,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{0,1},其样本频数列联表为:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+da+b+c+d最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数.最后一列的前两个数是事件{X=0}和{X=1}中样本点的个数.右下角格中的数是样本空间中样本点的总数.(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.(2)观察等高堆积条形图发现aa+b(1)零假设或原假设假定H0:P(Y=1|X=0)=P(Y=1|X=1),通常称H002=n(ad-bc)2(a+(2)临界值:任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xαα2大小的标准.概率值α越小,临界值xα越大.(3)基于小概率值α的检验规则:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α.当χ2<xα时,没有充分证据推断H02的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.(4)χ2独立性检验中几个常用的小概率值和相应的临界值如下.αxα1.下列变量中不属于分类变量的是(B)(A)性别 (B)吸烟(C)宗教信仰 (D)国籍解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.2.(2021·浙江宁波高二检测)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列统计结论不正确的是(D)(A)样本中的女生数量多于男生数量(B)样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量(C)样本中的男生偏爱两理一文(D)样本中的女生偏爱两文一理解析:由等高堆积条形图知女生数量多于男生数量,故A正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;男生偏爱两理一文,故C正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.故选D.×2列联表:xy合计y1y2x135a70x2151530合计50b100其中a,b处填的值分别为.

解析:由a+35=70,得a=35,由a+15=b,得b=50.答案:35,502的说法中,正确的有.(填序号)

①χ2的值越大,两个分类变量的相关性越大;②χ2的计算公式是χ2=n(③若求出χ2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.解析:对于①,χ2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.答案:③④用2×2列联表分析两变量间的关系[例1]在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁及以上的有70人,六十岁以下的有54人.六十岁及以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b解:用Ω表示调查的124人构成的集合,考虑以Ω为样本空间的古典概型,对于Ω中的每一位,定义分类变量X和Y如下:X=0Y=02×2列联表如下XY合计Y=0Y=1X=0432164X=1273360合计7054124将表中数据代入公式得aa+bcc+d显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.(1)作2×2列联表时,关键是对涉及的变量分清类别.要对Ω中的对象定义分类变量X和Y,计算时要准确无误.(2)利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b与cc+d(变式训练1:假设有两个分类变量X与Y,它们的可能取值分别为{0,1},其2×2列联表为XY合计Y=0Y=1X=0101828X=1m26m+26合计10+m4454+m当m取下面何值时,X与Y的关系最弱()(A)8 (B)9 (C)14 (D)19解析:由10×26=18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.故选C.利用等高堆积条形图判断两个分类变量是否相关[例2]某学校对高三学生做了一项调查,发现在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用图形判断考前心情紧张与性格类型是否有关系.解:作列联表如下:性格内向性格外向合计考前心情紧张332213545考前心情不紧张94381475合计4265941020相应的等高堆积条形图如图所示.图中阴影部分表示考前心情紧张与考前心情不紧张的学生中性格内向的学生的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类型有关.利用等高堆积条形图判断两个分类变量是否相关的步骤(1)收集数据,统计结果.(2)列出2×2列联表,计算频率、粗略估计.(3)画等高堆积条形图,直观分析.变式训练2:为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟合计子女吸烟23783320子女不吸烟6785221200合计9156051520利用等高堆积条形图判断父母吸烟对子女吸烟是否有影响.解:等高堆积条形图如下.观察图形可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.独立性检验[例3]在传染病学中,通常把从致病刺激物侵入机体内或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期,因此我们应该注意做好良好的防护措施和隔离措施.某研究团队统计了某地区10000名患者的相关信息,得到如表表格:潜伏期/天(0,2](2,4](4,6](6,8](8,10](10,12](12,14]人数6001900300025001600250150(1)潜伏期受诸多因素的影响,为研究潜伏期与年龄的关系,通过分层抽样从10000名患者中抽取200人进行研究,完成下面的2×2列联表,并根据小概率值α=0.001的独立性检验,判断潜伏期与患者年龄是否有关?年龄潜伏期合计潜伏期≤8天潜伏期>8天60岁以上(含60岁)15060岁以下30合计200(2)依据上述数据,将频率作为概率,且每名患者的潜伏期是否超过8天相互独立.为了深入研究,该团队在这一地区抽取了20名患者,其中潜伏期不超过8天的人数最有可能是多少?附:χ2=n(αxα解:(1)由表中数据可知,潜伏期大于8天的人数为1600+250+150补充完整的2×2列联表如下:年龄潜伏期合计潜伏期≤8天潜伏期>8天60岁以上(含60岁)1302015060岁以下302050合计16040200零假设为H0:潜伏期与患者年龄无关.根据列联表中的数据,计算得χ2=200×(130×20根据小概率值α=0.001的独立性检验,推断H0不成立,即潜伏期与患者年龄有关,此推断犯错误的概率不超过0.001.(2)该地区10000名患者中潜伏期不超过8天的人数为600+1900+3000+2500=8000,将频率视为概率,则潜伏期不超过8天的概率为800010所以抽取的20名患者中潜伏期不超过8天的人数最有可能是20×45应用独立性检验解决实际问题的步骤(1)提出零假设H0:X与Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α.当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.(4)在X与Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.变式训练3:随着手机的日益普及,学生使用手机给学校管理和学生发展带来诸多不利影响.为保护学生视力,让学生在学校专心学习,防止沉迷网络和游戏,促进学生身心健康发展,教育部于2021年1月15日下发文件《关于加强中小学生手机管理工作的通知》,对中小学生的手机使用和管理作出了相关的规定.某研究型学习小组调查研究“中学生使用手机对学习的影响”,对某校80名学生调查得到部分统计数据如下表,记A为事件:“学习成绩优秀且不使用手机”;B为事件:“学习成绩不优秀且不使用手机”,且已知事件A的频率是事件B的频率的2倍.学习成绩是否使用手机合计不使用使用优秀a12不优秀b26合计(1)求表中a,b的值,并补全表中所缺数据;(2)根据小概率值α=0.005的独立性检验,判断中学生使用手机对学习是否有影响?参考数据:χ2=n(αxα解:(1)由已知得a+b补全表中所缺数据如下:学习成绩是否使用手机合计不使用使用优秀281240不优秀142640合计423880(2)零假设为H0:中学生使用手机与学习成绩无关,即中学生使用手机对学习没有影响.根据列联表中的数据,计算得χ2=80×(28×26根据小概率值α=0.005的独立性检验,推断H0不成立,即认为中学生使用手机对学习有影响,此推断犯错误的概率不超过0.005.1.(2020·宁阳县第四中学高二期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高堆积条形图,则下列说法正确的是(D)(A)喜欢使用手机支付与性别无关(B)样本中男生喜欢使用手机支付的约为60%(C)样本中女生喜欢使用手机支付的人数比男生多(D)女生比男生喜欢使用手机支付的可能性大些解析:A错误,根据等高堆积条形图,喜欢和不喜欢使用手机支付的比例因性别差距很明显,所以喜欢使用手机支付与性别有关;B错误,样本中男生喜欢使用手机支付的约为40%;女生比男生喜欢使用手机支付的可能性大些,由于不知道男、女生人数,所以不能确定女生喜欢使用手机支付的人数是否比男生多,所以C错误.D正确.故选D.2.通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到统计量χ2≈4.892,参照附表,得到的正确结论是(C)αxα(A)有99%以上的把握认为“爱好该项运动与性别有关”(B)有99%以上的把握认为“爱好该项运动与性别无关”(C)在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”(D)在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”3.独立性检验所采用的思路是:要研究A,B两类变量彼此相关,首先假设这两类变量彼此,在此假设下构造随机变量χ2,如果χ2较大,那么在一定程度上说明假设.

答案:无关不成立[例1](2021·江西高三二模)2021年春节期间,防疫常态化要求减少人员聚集,某商场为了应对防疫要求,但又不影响群众购物,采取推广使用“某某到家”线上购物App,再由物流人员送货到家,如图(1)为从某社区随机抽取100位年龄在[10,70)的人口年龄段的频率分布直方图,如图(2)是该样本中各年龄段使用了“某某到家”线上购物App人数占比的频率柱状图.(1)从样本中年龄在[60,70)的人中,随机抽取两人,估计都不使用“某某到家”线上购物App的概率;(2)若把年龄低于40岁(不含)的人称为“青年人”,根据小概率值α=0.001的独立性检验,能否认为“青年人”更愿意使用“某某到家”线上购物App,填写下列2×2联表,并做出判断.是否使用App年龄合计“青年人”非“青年人”使用App没有使用App合计参考数据:αxαχ2=n(解:(1)样本中年龄在[60,70)的共有6人,其中1人会使用“某某到家”线上购物App,记为a,b,c,d,e,A(其中A表示使用了App),从中抽取两人,有ab,ac,ad,ae,aA,bc,bd,be,bA,cd,ce,cA,de,dA,eA,共有15种不同情况,都不使用App的情况有10种,故随机抽取两人,估计都不使用“某某到家”线上购物App的概率为1015=2(2)根据统计图表知:是否使用APP年龄合计“青年人”非“青年人”使用App502070没有使用App102030合计6040100零假设为H0:“青年人”与使用“某某到家”线上购物App无关,根据列联表中的数据,计算得χ2=100×(50×20-20×10根据小概率值α=0.001的独立性检验,推断H0不成立,即认为“青年人”更愿意使用“某某到家”线上购物App,此推断犯错误的概率不超过0.001.[例2](2021·辽宁高三二模)某社区工作人员为了总结工作中的经验和不足,设计了一份调查问卷,满分100分,随机发给100名男性居民和100名女性居民,分数统计如下:100名男性居民评分频数分布表分组频数[50,60)3[60,70)12[70,80)72[80,90)8[90,100]5合计100100名女性居民评分频数分布表分组频数[50,60)5[60,70)15[

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论