高二数学考点讲解练(人教A版2019选择性必修第一册)8.3列联表与独立性检验-2022-2023学年高二数学考点讲解练(人教A版2019选择性必修第三册)(原卷版+解析)_第1页
高二数学考点讲解练(人教A版2019选择性必修第一册)8.3列联表与独立性检验-2022-2023学年高二数学考点讲解练(人教A版2019选择性必修第三册)(原卷版+解析)_第2页
高二数学考点讲解练(人教A版2019选择性必修第一册)8.3列联表与独立性检验-2022-2023学年高二数学考点讲解练(人教A版2019选择性必修第三册)(原卷版+解析)_第3页
高二数学考点讲解练(人教A版2019选择性必修第一册)8.3列联表与独立性检验-2022-2023学年高二数学考点讲解练(人教A版2019选择性必修第三册)(原卷版+解析)_第4页
高二数学考点讲解练(人教A版2019选择性必修第一册)8.3列联表与独立性检验-2022-2023学年高二数学考点讲解练(人教A版2019选择性必修第三册)(原卷版+解析)_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.3列联表与独立性检验备注:资料包含:1.基础知识归纳;考点分析及解题方法归纳:考点包含:完善列联表;列联表分析;等高条形图;独立性检验的概念及辨析;卡方的计算;独立性检验的基本思想;独立性检验解决实际问题课堂知识小结考点巩固提升知识归纳独立性检验:(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828注意:(1)越大相关性越强,反之越弱;(2)附表中P(K2≥k)是两个统计学变量无关的概率;考点讲解考点讲解考点1:完善列联表例1.为了解性别因素是否对某班学生打篮球的经常性有影响,对该班40名学生进行了问卷调查,得到如下的22列联表:经常打篮球不经常打篮球合计男生420女生820合计40则_________,_________.【变式训练】1.下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45AB女婴E35C总计98D180那么__________.2.下面是一个2×2列联表;总计35a70151530总计50b100其中,a、b处的值分别为________、________.考点2:列联表分析例2.2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:了解不了解总计年龄不小于60岁aba+b年龄小于60岁cdc+d总计a+cb+da+b+c+d给出下列4组数据:①;②;③;④.则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是______.(填序号)【变式训练】1.假设有两个变量x与y的列联表如下表:abcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(

)A.,,, B.,,,C.,,, D.,,,2.把两个分类变量的频数列出,称为(

)A.三维柱形图 B.二维条形图 C.列联表 D.频率分布直方图考点3:等高条形图例3.某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为_______.【变式训练】1.为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是(

)A.是否倾向选择生育二胎与户籍无关B.是否倾向选择生育二胎与性别有关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数2.观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量的观测值最小的是(

)A. B.C. D.考点4:独立性检验的概念及辨析例4.(多选)下列命题中正确的是(

)A.在回归分析中,成对样本数据的样本相关系数r的绝对值越大,成对样本数据的线性相关程度越强B.在回归分析中,可用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好C.比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越差D.对分类变量X与Y,统计量的值越大,则判断“X与Y有关系”的把握程度越大【变式训练】1.某课外兴趣小组通过随机调查,利用2×2列联表和统计量研究数学成绩优秀是否与性别有关.计算得,经查阅临界值表知,则下列判断正确的是(

)A.每100个数学成绩优秀的人中就会有1名是女生B.若某人数学成绩优秀,那么他为男生的概率是0.010C.有99%的把握认为“数学成绩优秀与性别无关”D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”2.“独立性检验”中,在犯错误的概率不超过0.05的前提下认为事件A和B有关,则算出的数据满足()A. B. C. D.3.下列关于回归分析与独立性检验的说法正确的是(

)A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系考点5:卡方的计算例5.广西新高考改革方案已正式公布,根据改革方案,将采用“”的高考模式,其中,“3”为语文、数学,外语3门参加全国统一考试,选择性考试科目为政治,历史、地理、物理、化学、生物6门,由考生根据报考高校以及专业要求,结合自身实际,首先在物理和历史中选择1门,再从政治、地理、化学、生物中选择2门,形成自己的“高考选考组合”.(1)若某学生根据方案进行随机选科,求该生恰好选到“物化生”组合的概率;(2)由于物理和历史两科必须选择1科,某校想了解高一新生选科的需求,随机选取100名高一新生进行调查,得到如下统计数据,判断是否有95%的把握认为“选科与性别有关”?选择物理选择历史合计男生4050女生合计30100附:,.0.100.050.0250.010.0052.7063.8415.0246.6357.879【变式训练】1.根据表中的数据,及观测值则在犯错误的概率不超过___________前提下,认为选择舞蹈与性别有关.篮球舞蹈合计男13720女2810合计151530其中的参考数据:0.050.0250.0103.8415.0246.6352.第24届冬季奥林匹克运动会于2022年2月4日在北京开幕.吉祥物“冰墩墩”以其可爱的外形迅速火爆出圈,其周边产品更是销售火热,甚至达到“一墩难求”的现象某购物网站为了解人们购买“冰墩墩”的意愿,随机对90个用户(其中男30人,女60人)进行问卷调查,得到如下列联表:有购买意愿没有购买意愿合计男16女16合计30(1)完成上述列联表,并回答是否有的把握认为“购买意愿”与性别有关?(2)若以这90个用户的样本的概率估计总体的概率,现再从该购物网站所有用户中,采用随机抽样的方法每次抽取1名用户,抽取4次,记被抽取的4名用户对“冰墩墩”有购买意愿的人数为,若每次抽取的结果是相互独立的,写出的分布列,并求期望和方差.参考公式:,其中.临界值表:0.100.050.0100.0050.0012.7063.8416.6357.87910.828考点6:独立性检验的基本思想例6.在一个列联表中,由其数据计算得,认为两个变量有关系犯错误的概率不超过________.附:常用的小概率值和临界值表【变式训练】1.为了解高中生选科时是否选择物理与数学成绩之间的关系,学校抽取了50名高中生,通过问卷调查,得到以下数据:选物理不选物理数学成绩优异207数学成绩一般1013由以上数据,计算得到,则有______的把握认为是否选择物理与数学成绩有关系.2.某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了人,计算发现,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是______.附:常用小概率值和临界值表:考点7:独立性检验解决实际问题例7.根据分类变量x与y的观察数据,计算得到.依据下面给出的临界值表,0.500.400.250.150.100.050.0250.0100.0050.4550.7081.3232.0722.7063.8415.0246.6357.879可知下列判断中正确的是(

)A.有95%的把握认为变量x与y独立B.有95%的把握认为变量x与y不独立C.变量x与y独立,这个结论犯错误的概率不超过10%D.变量x与y不独立,这个结论犯错误的概率不超过10%【变式训练】1.某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得,则根据这一数据以及临界值表,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度(

)参考数据如下:,.A.低于 B.低于 C.高于 D.高于2.这两天刷屏网络社交平台,最热的莫过于“地摊经济”.五菱荣光推出的一款“摆摊神车”,更是赚足眼球与热度.在资本市场,与“地摊经济”相关的概念股持续走强,在港股上市的五菱汽车股价一度飙升近130%.截至2022年11月3日,超过10只“地摊经济”概念个股收盘涨停.小商品城、茂业商业、广百股份、百大集团等股票继续涨停.随着各地政策的放开,“地摊经济”成了经济复苏的新动力,一方面拉动就业人数上升,另一方面带动消费.某市为研究地摊经济商户与年龄的相关程度,随机调查了100位成人市民,统计数据如下:不小于40岁小于40岁合计地摊经济商户12ym非地摊经济商户x3270合计n50100(1)求出列联表中字母x,y,m,n的值;(2)①从此样本中,对地摊经济商户按年龄采取分层抽样的方法抽出5人进行深入调研,其中不小于40岁的人应抽多少人?②从独立性检验角度分析,能否有90%以上的把握认为该市成人市民是否为地摊经济商户与年龄是否小于40岁有关?附:,其中.0.150.100.050.250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828【答案】(1),,,;知识小结知识小结独立性检验:(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828注意:(1)越大相关性越强,反之越弱;(2)附表中P(K2≥k)是两个统计学变量无关的概率;巩固提升巩固提升一、单选题1.北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为(

)参考公式:,其中.参考数据:A. B. C. D.2.根据分类变量与的观察数据,计算得到,依据下表给出的独立性检验中(

)A.有的把握认为变量与独立B.有的把握认为变量与不独立C.变量与独立,这个结论犯错误的概率不超过D.变量与不独立,这个结论犯错误的概率不超过3.对分类变量和进行独立性检验的零假设为(

)A.:分类变量和独立B.:分类变量和不独立C.:D.:分类变量和相关联4.相关变量x,y的散点图如图,若剔除点,根据剩下数据得到的统计量中,较剔除前数值变大的是(

)A.r B. C. D.5.第24届冬季奥林匹克运动会于2022年在北京举办,为了解某城市居民对冰雪运动的关注情况进行了一次调查统计,根据独立性检验,处理所得数据之后发现,若依据的独立性检验,则认为关注冰雪运动与性别无关;若依据的独立性检验,则认为关注冰雪运动与性别有关,则的值可能为(

)0.1000.0500.0100.0012.7063.8416.63510.828A.3.448 B.6.537 C.6.677 D.10.9346.某医疗研究所为了检查新研发的疫苗对某种病毒的预防作用,把1000只已注射疫苗的小白鼠与另外1000只未注射疫苗的小白鼠的感染记录作比较,提出原假设:“这种疫苗不能起到预防该病毒传染的作用.”并计算得,则下列说法正确的是()A.这种疫苗对预防该病毒传染的有效率为1%B.若某人未使用疫苗,则他有99%的可能性传染该病毒C.有99%的把握认为“这种疫苗能起到预防该病毒传染的作用”D.有1%的把握认为“这种疫苗能起到预防该病毒传染的作用”7.假设2个分类变量和的列联表如下:合计a10c30合计40100对于同一样本,以下数据能说明和有关系的可能性最大的一组是(

)A., B.,C., D.,8.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是(

)日落云里走夜晚天气下雨未下雨出现255未出现2545参考公式:临界值参照表:0.10.050.010.0050.0012.7063.8416.6357.87910.828A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.有99%的把握判断“日落云里走”是否出现与夜晚天气有关D.出现“日落云里走”,有99%的把握判断夜晚会下雨二、多选题9.下列说法正确的是(

)A.,越小,该正态分布对应的正态密度曲线越扁平B.运用最小二乘法得到的线性回归直线-定经过样本中心C.相关系数越接近1,y与x相关的程度就越弱D.利用进行独立性检验时,的值越大,说明有更大的把握认为两事件有关系10.若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得到“吸烟与患肺癌有关”的结论,且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是(

)A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有三、填空题11.在一个2×2列联表中,由计算得,则判断“这两个变量有关系”时,判断出错的可能性是________.参考临界值表:0.100.050.0102.7063.8416.63512.为了了解高中学生对乡村音乐的态度和性别的关系,现随机抽取50名学生进行调查,根据调查结果得到,则由此认为“喜欢乡村音乐与性别有关”出错的概率不超过______.附:,其中.0.100.050.0250.0100.0052.7063.8415.0246.6357.87913.有两个分类变量X和Y,其中一组观测值为如下的2×2列联表:合计a1550合计204565其中a,均为大于5的整数,则a=______时,有的把握认为“X和Y之间有关系”.14.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的2×2列联表,则根据列联表可知:年轻人非年轻人总计经常用流行用语12525150不常用流行用语351550总计16040200有______的把握认为经常用流行用语与年轻人有关系.附:,四、解答题15.中国射击队在东京奥运会上共获得4金1银6铜,共11枚奖牌的成绩,创下了中国射击队奥运参赛史上奖牌数最多的新纪录.现从某射击训练基地随机抽取了20名学员(男、女各10人),统计他们的射击环数,数据如下表所示:男生897976101086女生10986879788若射击环数大于或等于9环,则认为成绩优异;否则,认为成绩不优异.根据所给数据,建立列联表,并判断是否有90%的把握认为成绩优异与性别有关.参考公式和数据:,16.国内某奶茶店以茶饮和甜品为主打,运用复合创新思维顺势推出最新一代立体复合型餐饮业态,在武汉、重庆、南京都有分布,该公司现对两款畅销茶饮进行推广调查,得到下面的列联表;A款B款男性8020女性6040(1)根据上表,分别估计男、女购买这款茶饮,选购A款的概率;(2)能否有99%的把握认为选购哪款茶饮与性别有关?参考公式:,其中.参考数据:8.3列联表与独立性检验备注:资料包含:1.基础知识归纳;考点分析及解题方法归纳:考点包含:完善列联表;列联表分析;等高条形图;独立性检验的概念及辨析;卡方的计算;独立性检验的基本思想;独立性检验解决实际问题课堂知识小结考点巩固提升知识归纳独立性检验:(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828注意:(1)越大相关性越强,反之越弱;(2)附表中P(K2≥k)是两个统计学变量无关的概率;考点讲解考点讲解考点1:完善列联表例1.为了解性别因素是否对某班学生打篮球的经常性有影响,对该班40名学生进行了问卷调查,得到如下的22列联表:经常打篮球不经常打篮球合计男生420女生820合计40则_________,_________.【答案】

16

16【分析】完善列联表,即可得解;【详解】解:依题意可得列联表如下:经常打篮球不经常打篮球合计男生420女生820合计40故;故答案为:;;【变式训练】1.下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45AB女婴E35C总计98D180那么__________.【答案】82【分析】根据列联表,可得方程,解之即可得到结论.【详解】解:由题意,,,,,,,,,故答案为:82.2.下面是一个2×2列联表;总计35a70151530总计50b100其中,a、b处的值分别为________、________.【答案】

35

50【分析】根据列联表即得.【详解】由题意结合列联表可得:,.故答案为:35;50.考点2:列联表分析例2.2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:了解不了解总计年龄不小于60岁aba+b年龄小于60岁cdc+d总计a+cb+da+b+c+d给出下列4组数据:①;②;③;④.则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是______.(填序号)【答案】③【分析】根据当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,计算每组的值,比较大小可得答案。【详解】当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,在①中,,在②中,,在③中,,在④中,,故居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是③,故答案为:③【变式训练】1.假设有两个变量x与y的列联表如下表:abcd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(

)A.,,, B.,,,C.,,, D.,,,【答案】B【分析】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.【详解】对于A,,对于B,,对于C,,对于D,显然B中最大,该组数据能说明x与y有关系的可能性最大,故选:B.2.把两个分类变量的频数列出,称为(

)A.三维柱形图 B.二维条形图 C.列联表 D.频率分布直方图【答案】C【分析】根据三维柱形图、二维条形图、列联表和频率分布直方图的定义和特征依次判断即可.【详解】三维柱形图和二维条形图,是粗略地判断两个分类变量是否相关,故不合题意;列联表,是将两个分类变量的频数列表,故符合题意;频率分布直方图,显示各组频数分布情况又易于显示各组之间频数的差别,故不合题意.故选:C考点3:等高条形图例3.某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为_______.【答案】68【分析】根据等高堆积条形图进行数据分析,即可得到答案.【详解】由等高堆积条形图进行数据分析,这100名学生中经常锻炼的人数为:.故答案为:68【变式训练】1.为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是(

)A.是否倾向选择生育二胎与户籍无关B.是否倾向选择生育二胎与性别有关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数【答案】D【分析】结合所给比例图,依次分析判断4个选项即可.【详解】对于A,城镇户籍中选择生育二胎,农村户籍中选择生育二胎,相差较大,则是否倾向选择生育二胎与户籍有关,A错误;对于B,男性和女性中均有选择生育二胎,则是否倾向选择生育二胎与性别无关,B错误;对于C,由于男性和女性中均有选择生育二胎,但样本中男性40人,女性60人,则倾向选择生育二胎的人员中,男性人数与女性人数不同,C错误;对于D,倾向选择不生育二胎的人员中,农村户籍有人,城镇户籍有人,农村户籍人数少于城镇户籍人数,D正确.故选:D.2.观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量的观测值最小的是(

)A. B.C. D.【答案】B【分析】直接由等高条形图中所占比例相差越小,随机变量的观测值越小判断即可.【详解】等高的条形图中所占比例相差越小,随机变量的观测值越小.故选:B.考点4:独立性检验的概念及辨析例4.(多选)下列命题中正确的是(

)A.在回归分析中,成对样本数据的样本相关系数r的绝对值越大,成对样本数据的线性相关程度越强B.在回归分析中,可用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好C.比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越差D.对分类变量X与Y,统计量的值越大,则判断“X与Y有关系”的把握程度越大【答案】ABD【分析】根据相关系数、决定系数、残差平方和,以及统计量的意义直接判断可得.【详解】相关系数的绝对值越大,相关程度越强,A正确;决定系数越大,拟合效果越好,故B正确;残差平方和越小,模拟效果越好,故C错误;统计量的值越大,分类变量X与Y相互独立的概率越小,即判断“X与Y有关系”的把握程度越大,故D正确.故选:ABD【变式训练】1.某课外兴趣小组通过随机调查,利用2×2列联表和统计量研究数学成绩优秀是否与性别有关.计算得,经查阅临界值表知,则下列判断正确的是(

)A.每100个数学成绩优秀的人中就会有1名是女生B.若某人数学成绩优秀,那么他为男生的概率是0.010C.有99%的把握认为“数学成绩优秀与性别无关”D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”【答案】D【分析】计算的观测值,对照阅临界值表知,即可得出统计结论.【详解】∵,∴有99%的把握认为“数学成绩优秀与性别有关”,即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”.所以ABC错误,故选:D2.“独立性检验”中,在犯错误的概率不超过0.05的前提下认为事件A和B有关,则算出的数据满足()A. B. C. D.【答案】C【分析】通过的观测值,对照临界值表,得出统计结论.【详解】由临界值表可知:当时,满足在犯错误的概率不超过0.05的前提下认为事件和有关,0.500.400.250.150.100.050.0250.0100.0050.0010.460.711.322.072.713.845.026.647.8810.83结合选项可知,故选:C.3.下列关于回归分析与独立性检验的说法正确的是(

)A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系【答案】C【分析】根据回归分析及独立性检验的概念即得.【详解】回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,通过回归分析预测和估计两个变量之间具有的相关关系;独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.故ABD错误,C正确.故选:C.考点5:卡方的计算例5.广西新高考改革方案已正式公布,根据改革方案,将采用“”的高考模式,其中,“3”为语文、数学,外语3门参加全国统一考试,选择性考试科目为政治,历史、地理、物理、化学、生物6门,由考生根据报考高校以及专业要求,结合自身实际,首先在物理和历史中选择1门,再从政治、地理、化学、生物中选择2门,形成自己的“高考选考组合”.(1)若某学生根据方案进行随机选科,求该生恰好选到“物化生”组合的概率;(2)由于物理和历史两科必须选择1科,某校想了解高一新生选科的需求,随机选取100名高一新生进行调查,得到如下统计数据,判断是否有95%的把握认为“选科与性别有关”?选择物理选择历史合计男生4050女生合计30100附:,.0.100.050.0250.010.0052.7063.8415.0246.6357.879【答案】(1);(2)有95%的把握认为“选科与性别有关,理由见解析.【分析】(1)列举出所有的高考选考组合情况,从而计算出概率;(2)将列联表补充完整,进而计算出卡方,与3.841比较后得到结论.(1)该生高考选考组合有以下情况:(物理,政治,地理),(物理,政治,化学),(物理,政治,生物),(物理,地理,化学),(物理,地理,生物),(物理,化学,生物),(历史,政治,地理),(历史,政治,化学),(历史,政治,生物),(历史,地理,化学),(历史,地理,生物),(历史,化学,生物),共12种情况,其中(物理,化学,生物)为其中的一种,故恰好选到“物化生”组合的概率为(2)将列联表填写完整,如下:选择物理选择历史合计男生401050女生302050合计7030100故所以有95%的把握认为“选科与性别有关.【变式训练】1.根据表中的数据,及观测值则在犯错误的概率不超过___________前提下,认为选择舞蹈与性别有关.篮球舞蹈合计男13720女2810合计151530其中的参考数据:0.050.0250.0103.8415.0246.635【答案】0.025【分析】由列联表中的数据,计算的值,对照表中的参考数据,比较即可得到答案.【详解】解:由列联表中的数据可得,,所以在犯错误的概率不超过0.025的前提下,认为选择舞蹈与性别有关.故答案为:0.025.2.第24届冬季奥林匹克运动会于2022年2月4日在北京开幕.吉祥物“冰墩墩”以其可爱的外形迅速火爆出圈,其周边产品更是销售火热,甚至达到“一墩难求”的现象某购物网站为了解人们购买“冰墩墩”的意愿,随机对90个用户(其中男30人,女60人)进行问卷调查,得到如下列联表:有购买意愿没有购买意愿合计男16女16合计30(1)完成上述列联表,并回答是否有的把握认为“购买意愿”与性别有关?(2)若以这90个用户的样本的概率估计总体的概率,现再从该购物网站所有用户中,采用随机抽样的方法每次抽取1名用户,抽取4次,记被抽取的4名用户对“冰墩墩”有购买意愿的人数为,若每次抽取的结果是相互独立的,写出的分布列,并求期望和方差.参考公式:,其中.临界值表:0.100.050.0100.0050.0012.7063.8416.6357.87910.828【答案】(1)列联表见解析,没有的把握认为“购买意愿”与性别有关.(2)分布列见解析,,.【分析】(1)根据列联表和独立性检验的定义以及方法直接求解即可.(2)根据二项分布的概念,求出概率列出分布列,即可求解数学期望和方差.【详解】(1)由图表可知,没有购买意愿的男性有人,有购买意愿的女性有人,所以列联表如下:有购买意愿没有购买意愿合计男161430女441660合计603090,所以没有的把握认为“购买意愿”与性别有关.(2)由题意,有购买意愿的比例为,可能的取值有,且,,,,,,所以分布列如下:01234所以,考点6:独立性检验的基本思想例6.在一个列联表中,由其数据计算得,认为两个变量有关系犯错误的概率不超过________.附:常用的小概率值和临界值表【答案】##【分析】根据的值结合临界值表可得出结论.【详解】,故认为两个变量有关系犯错误的概率不超过.故答案为:.【变式训练】1.为了解高中生选科时是否选择物理与数学成绩之间的关系,学校抽取了50名高中生,通过问卷调查,得到以下数据:选物理不选物理数学成绩优异207数学成绩一般1013由以上数据,计算得到,则有______的把握认为是否选择物理与数学成绩有关系.【答案】95%【分析】根据卡方值与临界值比较,即可求解.【详解】因为,,所以有95%的把握认为是否选择物理与数学成绩有关.故答案为:95%2.某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了人,计算发现,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是______.附:常用小概率值和临界值表:【答案】【分析】由的观测值结合临界值表了得出结论.【详解】由已知可得,所以市政府断言市民收入增减与旅游需求有关的可信度是.故答案为:.考点7:独立性检验解决实际问题例7.根据分类变量x与y的观察数据,计算得到.依据下面给出的临界值表,0.500.400.250.150.100.050.0250.0100.0050.4550.7081.3232.0722.7063.8415.0246.6357.879可知下列判断中正确的是(

)A.有95%的把握认为变量x与y独立B.有95%的把握认为变量x与y不独立C.变量x与y独立,这个结论犯错误的概率不超过10%D.变量x与y不独立,这个结论犯错误的概率不超过10%【答案】D【分析】依据表中给出的独立性检验求解.【详解】解:因为,且,所以依据表中给出的独立性检验知:变量x与y不独立,这个结论犯错误的概率不超过10%,故选:D【变式训练】1.某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得,则根据这一数据以及临界值表,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度(

)参考数据如下:,.A.低于 B.低于 C.高于 D.高于【答案】C【分析】根据临界值表求得正确答案.【详解】由于,而,所以可信度高于.故选:C2.这两天刷屏网络社交平台,最热的莫过于“地摊经济”.五菱荣光推出的一款“摆摊神车”,更是赚足眼球与热度.在资本市场,与“地摊经济”相关的概念股持续走强,在港股上市的五菱汽车股价一度飙升近130%.截至2022年11月3日,超过10只“地摊经济”概念个股收盘涨停.小商品城、茂业商业、广百股份、百大集团等股票继续涨停.随着各地政策的放开,“地摊经济”成了经济复苏的新动力,一方面拉动就业人数上升,另一方面带动消费.某市为研究地摊经济商户与年龄的相关程度,随机调查了100位成人市民,统计数据如下:不小于40岁小于40岁合计地摊经济商户12ym非地摊经济商户x3270合计n50100(1)求出列联表中字母x,y,m,n的值;(2)①从此样本中,对地摊经济商户按年龄采取分层抽样的方法抽出5人进行深入调研,其中不小于40岁的人应抽多少人?②从独立性检验角度分析,能否有90%以上的把握认为该市成人市民是否为地摊经济商户与年龄是否小于40岁有关?附:,其中.0.150.100.050.250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828【答案】(1),,,;(2)①人;②不能有90%以上的把握认为该市成人市民是否为地摊经济商户与年龄是否小于40岁有关.【分析】(1)由列联表求出x,y,m,n的值;(2)①利用分层抽样的定义求出不小于40岁的应抽人数;②计算出卡方,与2.706比较后得到结论.【详解】(1)由图表可得:,,,,即,,,.(2)①因为地摊经济商户为30人,不小于40岁的为12人,共抽5人,故不小于40岁的应抽人.②,故不能有90%以上的把握认为该市成人市民是否为地摊经济商户与年龄是否小于40岁有关.知识小结知识小结独立性检验:(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828注意:(1)越大相关性越强,反之越弱;(2)附表中P(K2≥k)是两个统计学变量无关的概率;巩固提升巩固提升一、单选题1.北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为(

)参考公式:,其中.参考数据:A. B. C. D.【答案】C【分析】设男生人数为,则女生人数为,且,写出列联表并根据卡方计算公式,结合题意确定卡方值的范围,即可确定的取值范围,进而确定男生可能人数.【详解】设男生人数为,则女生人数为,且,可得列联表如下:男生女生合计喜欢滑冰不喜欢滑冰合计所以,因为有的把握认为是否喜欢滑冰和性别有关,所以,解得,所以,结合选项只有,故选:C.2.根据分类变量与的观察数据,计算得到,依据下表给出的独立性检验中(

)A.有的把握认为变量与独立B.有的把握认为变量与不独立C.变量与独立,这个结论犯错误的概率不超过D.变量与不独立,这个结论犯错误的概率不超过【答案】D【分析】根据独立性检验的含义进行判断可得.【详解】由题意,,所以有的把握认为变量与不独立,即变量与不独立,这个结论犯错误的概率不超过.故选:D3.对分类变量和进行独立性检验的零假设为(

)A.:分类变量和独立B.:分类变量和不独立C.:D.:分类变量和相关联【答案】A【分析】由零假设的定义即可得到答案.【详解】在判断两个分类变量之间是否有关联时,需要判断假定关系:是否成立,通常称为零假设或原假设.零假设:分类变量和独立故选:A.4.相关变量x,y的散点图如图,若剔除点,根据剩下数据得到的统计量中,较剔除前数值变大的是(

)A.r B. C. D.【答案】B【分析】由散点图可知,剔除点后相关性更强,依次判断4个选项即可.【详解】由散点图可知,负相关,剔除点后,相关性更强,故更接近,变小,A错误;相关指数变大,残差平方和变小,B正确,D错误;变小,C错误.故选:B.5.第24届冬季奥林匹克运动会于2022年在北京举办,为了解某城市居民对冰雪运动的关注情况进行了一次调查统计,根据独立性检验,处理所得数据之后发现,若依据的独立性检验,则认为关注冰雪运动与性别无关;若依据的独立性检验,则认为关注冰雪运动与性别有关,则的值可能为(

)0.1000.0500.0100.0012.7063.8416.63510.828A.3.448 B.6.537 C.6.677 D.10.934【答案】C【分析】依题意及所给表格数据得到的取值范围,即可判断;【详解】解:由题知的范围为,因此可能为6.677.故选:C6.某医疗研究所为了检查新研发的疫苗对某种病毒的预防作用,把1000只已注射疫苗的小白鼠与另外1000只未注射疫苗的小白鼠的感染记录作比较,提出原假设:“这种疫苗不能起到预防该病毒传染的作用.”并计算得,则下列说法正确的是()A.这种疫苗对预防该病毒传染的有效率为1%B.若某人未使用疫苗,则他有99%的可能性传染该病毒C.有99%的把握认为“这种疫苗能起到预防该病毒传染的作用”D.有1%的把握认为“这种疫苗能起到预防该病毒传染的作用”【答案】C【分析】由已知,根据题意给的卡方值,应用独立性检验的基本思想可以得到结论.【详解】由已知,,说明假设不合理的程度为99%,即这种疫苗不能起到防范病毒的作用不合理的程度约为99%,所以有99%的把握认为这种疫苗能起到预防病毒的作用.故选:C.7.假设2个分类变量和的列联表如下:合计a10c30合计40100对于同一样本,以下数据能说明和有关系的可能性最大的一组是(

)A., B.,C., D.,【答案】B【分析】根据列联表和独立性检验的相关知识,知当,一定时,,相差越大,就越大,从而和有关系的可能性越大,再结合选项判断即可.【详解】解:,根据列联表和独立性检验的相关知识,知当,一定时,,相差越大,与相差就越大,就越大,即和有关系的可能性越大,结合选项,知B中与其他选项相比相差最大.故选:B.8.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是(

)日落云里走夜晚天气下雨未下雨出现255未出现2545参考公式:临界值参照表:0.10.050.010.0050.0012.7063.8416.6357.87910.828A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.有99%的把握判断“日落云里走”是否出现与夜晚天气有关D.出现“日落云里走”,有99%的把握判断夜晚会下雨【答案】D【分析】应用古典概型的概率求法求概率判断A、B,应用卡方计算公式求卡方值,与临界值比较,应用独立检验的基本思想得到结论,判断C、D.【详解】由列联表知:100天中有50天下雨,50天未下雨,因此夜晚下雨的概率约为,A正确;未出现“日落云里走”,夜晚下雨的概率约为,B正确;,因此有99%的把握判断“日落云里走”是否出现与夜晚天气有关,C正确,D错误.故选:D二、多选题9.下列说法正确的是(

)A.,越小,该正态分布对应的正态密度曲线越扁平B.运用最小二乘法得到的线性回归直线-定经过样本中心C.相关系数越接近1,y与x相关的程度就越弱D.利用进行独立性检验时,的值越大,说明有更大的把握认为两事件有关系【答案】BD【分析】根据正态曲线的几何特征,判断选项A;由回归直线方程的性质,判断选项B和C;【详解】解:对于A,根据正态曲线的几何特征,可知当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论