




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
考向预测核心素养利用2×2列联表和卡方独立性检验判断两个变量的数据分析、数学运算基础知识=基础知识=回顾走进教材表示.列联表:列出的两个分类变量的频数表,称为列联表.2×2列联表为合计abCd合计以Q为样本空间的古典概型。设X和Y为定义在2上,取值于{0,1}的成对分类变量.Ho:分类变量X和Y独立.通常称Ho为零假设或原假设.假设我们通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示:XY合计abCd合计d对于任何小概率值a,可以找到相应的正实数xa,使得下面关系成立:P(²≥xa)=a.我们称xa为α的临界值,这个临界值就可作为判断x²大小的标准,概率值α越小,临界值xa越大.基于小概率值a的检验规则是:当x²≥xa时,我们就推断Ho不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当x²<xa时,我们没有充分证据推断Ho不成立,可以认为X和Y独立.这种利用x²的取值推断分类变量X和Y是否独立的方法称为x²独立性检验,读作“卡方独立性检验”,简称独立性检验.1.(人A选择性必修第三册P¹34练习T₁改编)为调查中学生近视情况,测得某校男生150名中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力()A.回归分析B.均值与方差C.独立性检验D.概率2.(人A选择性必修第三册P¹34练习T₄改编)为了判断高三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:男女7α根据表中数据,得到.则认为选修文科与性别有关系出错的可能性不大于本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性不大于0.05.3.(人A选择性必修第三册Pi32例3改编)随着国家三孩政策的放开,为了调查一线城市和非一线城市的三孩生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线合计愿生不愿生合计a根据小概率值α=0.010的独立性检验,可以得到的结论是.答案:生育意愿与城市级别有关一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)独立性检验是检验两个分类变量是否有关的一种统计方法.()(2)独立性检验得到的结论一定是正确的.()(3)独立性检验的样本不同,其结论可能不同.()(4)若事件X,Y关系越密切,则由观测数据计算得到的x²越小。()1.(列联表意义不明致误)下面是2×2列联表:ab则表中a,b的值分别为()所以a=52.又a+22=b,所以b=74.2.(独立性检验理解不当致误)(2022·揭阳模拟)随机询问50名大学生调查爱好某项运动是否和性别有关.利用2×2列联表计算得x²=8.333,则下列结论正确的是()αA.在犯错误的概率不大于0.005的前提下认为“是否爱好该项运动与性别有关"B.在犯错误的概率不大于0.005的前提下认为“是否爱好该项运动与性别无关"C.在犯错误的概率不大于0.001的前提下,认为“是否爱好该项运动与性别有关"D.在犯错误的概率不大于0.001的前提下,认为“是否爱好该项运动与性别无关"解析:选A.因为8.333>7.879,由附表知,在犯错误的概率不大于0.005的前提下,认为“是否爱好该项运动与性别有关”,故选A.核心考点一共研核心考点一共研A.吸烟患肺病的频率约为0.2D.不能判断吸烟与患肺病之间的关系三个季度,该直播间每个季度的收入都比上一季度的收入翻了一番,其前三季度的收入情况如图所示,则()A.该直播间第三季度总收入是第一季度总收入的3倍B.该直播间第二季度化妆品收入是第三季度化妆品收入的C.该直播间第一季度化妆品收入是第三季度化妆品收入白D.该直播间第三季度服装收入低于前两个季度的服装收入之和解析:选B.对于选项A,因为该直播间每个季度的收入都比上一季度的收入翻了一番,所以第三季度的总收入是第一季度的2×2=4倍,故A错误;对于选项B,设第一季度的总收入为a,则第二季度、第三季度的总收入分别为2a,4a,第二季度的化妆品收入为2a×20%=0.4a,第三季度的化妆品收入为4a×30%=1.2a,所以第二季度化妆品收入是第三季度化妆品收入的,故B正确;对于选项C,第一季度的化妆品收入为a×10%=0.1a,所以第一季度化妆品收入是第三季度化妆品收入的,故C错误;对于选项D,第一、二季度服装收入和为a+2a-0.1a-0.4a=2.5a,第三季度服装收入为4a-1.2a=2.8a,故D错误.故选B.3.(2022.上海华师大二附中高二月考)假设有两个分类变量X和Y,它们的值域分别为{xi,x2}和{yi,y2},其2×2列联表为XYabCd合计对同一样本,以下数据能说明X与Y有关的可能性最大的一组为()解析:选D.对于同一样本,lad-bc|越小,说明X与Y相关性越弱,ad-bc|越大,说明X与Y相关性越强,通过计算知,对于A、B、C都有lad-bdl=|10-12|=2;对于选项D,有|ad-bc|=|15-8|=7,显然7>2.4.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面"性别与会俄语"的2×2列联表中,a-b+d=性别不会俄语男ab女6d解析:由2×2列联表的性质,可得:a=18-6=12,b=20-12=8,6+d=30-20,可得d=4,所以a-b+d=8.答案:8求解参数的方法(1)根据等高堆积条形图的高度差直接判断.(2)直接利用2×2列联表的性质,建立方程即可求参数.考点二独立性检验(多维探究)复习指导:通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验的基本思想、方法及初步应用.角度1简单的独立性检验问题例1]某校推广新课改,在两个程度接近的班进行试验,一班为新课改班级,二班为非课改班级,经过一个学期的教学后对期末考试进行分析评价,规定:总分超过550(或等于550分)为优秀,550以下为非优秀,得到以下列联表:非优秀一班二班(2)依据小概率值α=0.01的独立性检验,能否认为推广新课改与总成绩是否优秀有关系?a非优秀合计一班二班合计(2)零假设为Ho:推广新课改与总成绩是否优秀无关.根据列联表中的数据,得到,故根据小概率值α=0.01的独立性检验,我们推断Ho不成立,即认为推广新课改与总成绩是否优秀有关系,此推断犯错误的概率不大于0.01.角度2独立性检验与统计、概率的综合问题例2(2022.四川雅安5月三模改编)高铁在出行方式中越来越受欢迎,某部门利用大数据随机抽取了出行人群中的100名旅客进行调查统计,得知在40岁及以下的旅客中乘坐高铁出行的占(1)请完成下面的2×2列联表,并依据小概率值α=0.001的独立性检验,分析能否认为乘坐高铁出行与年龄有关;40岁及以下合计不乘坐高铁合计(2)为提升服务质量,该部门从这100名旅客中按年龄采用分层随机抽样的方法选取5人参加座谈会,会后再进行抽奖活动,奖品共三份,由于年龄差异,规定40岁及以下的旅客若中奖,则每人得800元,40岁以上的旅客若中奖,则每人得1000元,设三份奖品总金额为X元,求X的分布列与数学期望.【解】40(人).α(1)由已知可得,样本中40岁及以下乘坐高铁出行的有2×2列联表如下:40岁及以下合计不乘坐高铁合计零假设为Ho:乘坐高铁出行与年龄无关.根据小概率值α=0.001的独立性检验,我们推断Ho不成立,即认为乘坐高铁出行与年龄有关,此推断犯错误的概率不大于0.001(2)采用分层随机抽样的方法,则从40岁及以下的人中抽取3人,从40岁以上的人中抽取2人,X的所有可能取值为2400,2600,2800.故分布列如下:XP(1)在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;lad-bc|越大,说明两个变量之间关系越强.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得到结论.独立性检验的一般步骤:①根据样本数据制成2×2列联表;②根据公式计算得到x的值;③比较x²的值与临界值的大小关系,作统计推断,跟踪训练|(2022·西藏拉萨那曲第二高级中学高三月考)某中学随机抽查了50名同学的每天课外阅读时间,得到如下统计表:时长(min)人数44αα(1)求这50名同学的平均阅读时长(用区间中点值代表每个人的阅读时长);(2)在阅读时长位于[40,50]的4人中任选2人,求甲同学被选中的概率;(3)进一步调查发现,语文成绩和每天的课外阅读时间有很大关系,每天的课外阅读时间多于半小时称为"阅读迷",语文成绩达到120分视为优秀,根据每天的课外阅读时间和语文成绩是否优秀,制成一个2×2列联表:阅读迷非阅读迷合计3不优秀2合计依据小概率值α=0.01的独立性检验,能否认为语文成绩是否优秀与课外阅读时间有关?解:(1)设这50名同学的平均阅读时长为xmin,故这50名同学的平均阅读时长为26.6min.(2)设这4名学生中分别为甲、乙、丙、丁,从这4名学生中任取2名学生,所有的样本点有:(甲,乙),(甲,丙),(甲,丁),(乙,丙),(乙,丁),(丙,丁),共6个,其中,事件“甲同学被选中”所包含的样本点有:(甲,乙),(甲,丙),(甲,因此,所求概率为(3)零假设为Ho:语文成绩是否优秀与课外阅读时间无关.由列联表中的数据计算得因此,根据小概率值a=0.01的独立性检验,我们推断Ho不成立,即认为语文成绩是否优秀与课外阅读时间有关,此推断犯错误的概率不大于0.01. 课后达标一检测1.下面的等高条形图可以说明的问题是()A.“心脏搭桥"手术和"血管清障"手术对“诱发心脏病”的影响是绝对不同的B.“心脏搭桥"手术和"血管清障”手术对“诱发心脏病”的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D."心脏搭桥"手术和"血管清障"手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:选D.由等高条形图可知“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的频率不同,所以“心脏搭桥"手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握,所以选项D正确,故选D.2.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,得到“偏爱蔬菜还是肉类与性别α为7.879.故选C.3.(多选)假设有两个分类变量X和Y,其2×2列联表如下表所示:XY合计a合计在犯错误的概率不超过0.05的前提下,下面哪个选项可以认为变量X,Y有小,且不满足犯错误的概率不超过0.05的条件,而其他选项均满足.4.小波同学为了验证谚语“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表,并计算得到x²≈19.05,下列小波对地区A天气判断不正确的是()日落云里走夜晚天气下雨未下雨合计出现5未出现合计αB.未出现“日落云里走”夜晚下雨的概率约C.做出“‘日落云里走’是否出现与当晚是否下雨有关”这一推断犯错误的概率不大于0.001D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨解析:选D.据列联表,100天中有50天下雨,50天未下雨,因此下雨的概率约为,A正确;同样,未出现“日落云里走”夜晚下雨,B正确;因为x²≈19.05>10.828=x0.001,所以做出“‘日落云里走’是否出现与当晚是否下雨有关”这一推断犯错误的概率不大于0.001,C正确;有关只是说可能性,不代表一定下雨,D错误.故选D.5.(多选)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算x²≈5.059,则可以推断出()性别是否满意合计满意不满意男性9女性8合计αA.该俱乐部的男性会员对运动场所满意的概率的估计值B.调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意C.做出“男性会员、女性会员对运动场所的评价有差异”这一推断犯错误的概率不大于0.05D.做出“男性会员、女性会员对运动场所的评价有差异”这一推断犯错误的概率不大于0.01解析:选ABC.对于选项A,该俱乐部男性会员对运动场所满意的概率的估计值,故A正确;对于选项B,该俱乐部女性会员对运动场所满意的概率的估计值,,故B正确;因为x²≈5.059>3.841=xo.os,所以依据小概率值α=0.05的独立性检验,我们认为男性会员、女性会员对运动场所的评价有差异,此推断犯错误的概率不大于0.05,故C正确,D错误.6.(多选)某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表.是否爱好拳击性别合计男女爱好拳击不爱好拳击合计经计算得.之后又对被研究者的身高进行了统计,得到男、女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是()aA."爱好拳击运动与性别有关",这个结论犯错误的概率不超过0.01B.在100个男生中,至少有一个人爱好打拳击C.男生身高的平均数为175,男生身高的标准差为16D.女生身高的平均数为164,女生身高的标准差为3解析:选AD.x²≈6.895>6.635=x0.01,A对;显然B错;男生身高的标准差为4,C错;显然D对,故选AD.7.(2022·赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层随机抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答,选题情况如下表:(单位:人)性别题型几何题男同学8女同学8根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过α,所以推断犯错误的概率不超过8.(2022·黑龙江模拟)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:性别合计无效有效男性患者女性患者6合计设Ho:服用此药的效果与患者的性别无关,则x²≈(小数点后保留3位有效数字),从而得出结论;服用此药的效果与患者的性别有关,这种判断出错的概率不大于.解析:由公式计算得,因为xx>3.841=x₀.05根据α=0.05的独立性检验,分析服用此药的效果与患者的性别有关,判断出错的概率不大于0.05.名患者中的一部分患者采用了外科疗法,另一部分患者采用了化学疗法,并根据两种治疗方法的治愈情况绘制了等高堆积条形图,如下:(1)根据图表完善以下关于治疗方法和治愈情况的2×2列联表;合计未治愈治愈外科疗法合计(2)依据小概率值α=0.05的独立性检验,分析此种疾病治愈率是否与治疗方法有关.α解:(1)根据等高条形图,采用化学疗法的治愈率为30%,由列联表得化学疗法治愈的人数为18人,故采用化学疗法的人共有18÷30%=60人,采用外科疗法的有40人,其中治愈的有40×50%=20人.所以列联表如下表:合计未治愈治愈外科疗法合计(2)零假设为Ho:设此种疾病治愈率与治疗方法无关.~4.075>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,我们推断Ho不成立,即认为此种疾病治愈率与治疗方法有关,此推断犯错误的概率不大于0.05.“幸福指数”低,房租支出不超过月收的租户“幸福指数”高.为了了解甲、乙两小区租户的幸福指数高低,随机抽取甲、乙两小区的租户各100户进行调查.甲小区租户的月收入以[0,3],(3,6),(6,9),(9,12),[12,15](单位:千元)分组的频率分布直方图如图所示.乙小区租户的月收入(单位:千元)的频数分布表如下:月收入户数92(1)设甲、乙两小区租户的月收入相互独立,记M表示事件“甲小区租户的月收入低于6千元,乙小区租户的月收入不低于6千元”,把频率视为概率,求(2)利用频率分布直方图,求所抽取的甲小区100户租户的月收入的中位数;(3)若甲、乙两小区每户的月租费分别为2千元、1千元.请根据条件完成下面的2×2列联表,并依据小概率值α=0.001的独立性检验,分析幸福指数与租住的小区是否有关.租住小区幸福指数合计幸福指数低幸福指数高甲小区租户乙小区租户合计附:临界值表α解:(1)记A表示事件“甲小区租户的月收入低于6千元”,记B表示事件“乙小区租户的月收入不低于6千元”,甲小区租户的月收入低于6千元的频率为(0.060+0.160)×3=0.66,故P(A)的估计值为0.66;乙小区租户的月收入不低于6千元的频率为,故P(B)的估计值为0.35.因为甲、乙两小区租户的月收入相互独立,所以事件M的概率的估计值为P(M)=P(A)P(B)=0.66×0.35=0.231.(2)设甲小区所抽取的100户租户的月收入的中位数为t,则0.060×3+(t-3)×0.160=0.5,解得t=5.(3)零假设为Ho:幸福指数与租住的小区无关,租住小区幸福指数合计幸福指数低幸福指数高甲小区租户乙小区租户合计根据2×2列联表中的数据,依据小概率值α=0.001的独立性检验,我们认为Ho不成立,即认为幸福指数与租住的小区有关,此推断犯错误的概率不大于0.001.11.(多选)(2022.梅
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甘肃省静宁一中2017届高三上学期第二次模拟政治试题(含答案)
- 各类物流模式的比较与应用试题及答案
- 2024年预算员备考攻略试题及答案
- 预算员高分技巧总结试题及答案
- 2025-2030中国高纯氟聚合物管材行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030中国高级伤口护理生物制剂行业市场发展趋势与前景展望战略分析研究报告
- 2025-2030中国高端西餐市场投资建议及营销模式创新策略研究报告
- 投资咨询工程师的市场适应策略试题及答案
- 2025-2030中国高温高压热电阻行业风险评估及发展潜力研究报告
- 2025-2030中国高流量型蓄能器行业市场发展趋势与前景展望战略研究报告
- 2024中央戏剧学院教师招聘考试笔试试题
- 2024年心理咨询师考试题库及参考答案(考试直接用)
- 皮骨牵引病人护理课件
- 手术中低温烫伤的情况
- (分层作业)全册部编版六年级语文下册
- 窦桂梅介绍教学课件
- 三废环保管理培训
- 微型断路器知识培训课件
- T-CAAMTB 116-2023 汽车车门锁扣性能要求和试验方法
- 《静电的危害及消除》课件
- Booking a room at the hotel(入住酒店英语)
评论
0/150
提交评论