概率与统计的综合运用(13大核心考点)(讲义)(原卷版)-2024年高考数学二轮复习讲练测(新教材新高考)_第1页
概率与统计的综合运用(13大核心考点)(讲义)(原卷版)-2024年高考数学二轮复习讲练测(新教材新高考)_第2页
概率与统计的综合运用(13大核心考点)(讲义)(原卷版)-2024年高考数学二轮复习讲练测(新教材新高考)_第3页
概率与统计的综合运用(13大核心考点)(讲义)(原卷版)-2024年高考数学二轮复习讲练测(新教材新高考)_第4页
概率与统计的综合运用(13大核心考点)(讲义)(原卷版)-2024年高考数学二轮复习讲练测(新教材新高考)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题21概率与统计的综合运用【目录】 2 3 4 6 10考点一:求概率及随机变量的分布列与期望 10考点二:超几何分布与二项分布 11考点三:概率与其它知识的交汇问题 13考点四:期望与方差的实际应用 14考点五:正态分布与标准正态分布 16考点六:统计图表及数字特征 18考点七:线性回归与非线性回归分析 21考点八:独立性检验 24考点九:与体育比赛规则有关的概率问题 27考点十:决策型问题 28考点十一:递推型概率命题 30考点十二:条件概率、全概率公式、贝叶斯公式 32考点十三:高等背景下的概统问题 33概率统计在高考中扮演着很重要的角色,概率统计解答题是新高考卷及多数省市高考数学必考内容,考查热点为古典概型、相互独立事件的概率、条件概率、超几何分布、二项分布、正态分布、统计图表与数字特征、回归分析、离散型随机变量的分布列、期望与方差的实际应用等.回顾近几年的高考试题,可以看出概率统计解答题,大多紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题者要求考生会收集,整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.考点要求考题统计考情分析统计图表及数字特征2023年乙卷第17题,12分2023年II卷第19题,12分2022年II卷第19题,12分【命题预测】预测2024年高考,以解答题形式出现,具体估计为:(1)以解答题压轴题形式出现,考查数学抽象、数学建模、逻辑推理与数学运算四大核心素养.(2)热点是与体育比赛规则有关的概率问题及高等背景下的概统问题.期望与方差2023年上海卷第19题,14分2023年I卷第21题,12分2022年甲卷第19题,12分2021年I卷第18题,12分独立性检验2023年甲卷第17题,12分2022年I卷第20题,12分

(一)涉及的概率知识层面主要考查随机变量的概率分布与数学期望,一定要根据有关概念,判断是等可能事件、互斥事件、相互独立事件还是独立重复试验,以便选择正确的计算方法,进行概率计算及离散型随机变量的分布列和数学期望的计算,也要掌握几种常见常考的概率分布模型:离散型有二项分布、超几何分布,连续型有正态分布.考查运用概率知识解决简单实际问题的能力,1、离散型随机变量的期望与方差一般地,若离散型随机变量的分布列为称为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.称为随机变量的方差,它刻画了随机变量与其均值的偏离程度,其算术平方根为随机变量的标准差.(1)离散型随机变量的分布列的性质=1\*GB3①;=2\*GB3②.(2)均值与方差的性质若,其中为常数,则也是随机变量,且(3)分布列的求法=1\*GB3①与排列、组合有关分布列的求法.由排列、组合、概率知识求出概率,再求出分布列.=2\*GB3②与频率分布直方图有关分布列的求法.可由频率估计概率,再求出分布列.=3\*GB3③与互斥事件有关分布列的求法.弄清互斥事件的关系,利用概率公式求出概率,再列出分布列.=4\*GB3④与独立事件(或独立重复试验)有关分布列的求法.先弄清独立事件的关系,求出各个概率,再列出分布列.(4)常见的离散型随机变量的概率分布模型=1\*GB3①二项分布;=2\*GB3②超儿何分布.2、常见的连续型概率分布模型正态分布.(二)概率分布与不同知识背景结合考查对实际问题的解决能力1、与数列结合的实际问题2、与函数导数结合的实际问题3、与分段函数求最值、解不等式结合的实际问题4、与统计结合的实际问题5、与其他背景结合的实际问题1.(2023•乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,,2,.试验结果如下:试验序号12345678910伸缩率545533551522575544541568596548伸缩率536527543530560533522550576536记,2,,,记,,,的样本平均数为,样本方差为.(1)求,;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)2.(2023•新高考Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值,将该指标大于的人判定为阳性,小于或等于的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为(c);误诊率是将未患病者判定为阳性的概率,记为(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率(c)时,求临界值和误诊率(c);(2)设函数(c)(c)(c).当,,求(c)的解析式,并求(c)在区间,的最小值.3.(2023•甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:.试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数,再分别统计两样本中小于与不小于的数据的个数,完成如下列联表;对照组试验组(ⅱ)根据中的列联表,能否有的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.1000.0500.0102.7063.8416.6354.(2023•上海)2023年6月7日,21世纪汽车博览会在上海举行,已知某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示:红色外观蓝色外观棕色内饰128米色内饰23(1)若小明从这些模型中随机拿一个模型,记事件为小明取到红色外观的模型,事件为小明取到棕色内饰的模型,求(B)和,并判断事件和事件是否独立;(2)该公司举行了一个抽奖活动,规定在一次抽奖中,每人可以一次性从这些模型中拿两个汽车模型,给出以下假设:假设1:拿到的两个模型会出现三种结果,即外观和内饰均为同色、外观和内饰都异色、以及仅外观或仅内饰同色;假设2:按结果的可能性大小,概率越小奖项越高;假设3:该抽奖活动的奖金额为:一等奖600元,二等奖300元、三等奖150元;请你分析奖项对应的结果,设为奖金额,写出的分布列并求出的数学期望.5.(2023•新高考Ⅰ)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.(1)求第2次投篮的人是乙的概率;(2)求第次投篮的人是甲的概率;(3)已知:若随机变量服从两点分布,且,,2,,,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.6.(2022•新高考Ⅰ)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,表示事件“选到的人卫生习惯不够良好”,表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为.(ⅰ)证明:;(ⅱ)利用该调查数据,给出,的估计值,并利用(ⅰ)的结果给出的估计值.附:.0.0500.0100.0013.8416.63510.8287.(2022•新高考Ⅱ)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间,的概率;(3)已知该地区这种疾病患者的患病率为,该地区年龄位于区间,的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,,求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001.考点一:求概率及随机变量的分布列与期望求离散型随机变量的分布列及期望的一般步骤:(1)根据题中条件确定随机变量的可能取值;(2)求出随机变量所有可能取值对应的概率,即可得出分布列;(3)根据期望的概念,结合分布列,即可得出期望(在计算时,要注意随机变量是否服从特殊的分布,如超几何分布或二项分布等,可结合其对应的概率计算公式及期望计算公式,简化计算)【例1】(2024·河南驻马店·高三河南省驻马店高级中学校联考期末)一只蚂蚁位于数轴处,这只蚂蚁每隔一秒钟向左或向右移动一个单位长度,设它向右移动的概率为,向左移动的概率为.(1)已知蚂蚁2秒后所在位置对应的实数为非负数,求2秒后这只蚂蚁在处的概率;(2)记蚂蚁4秒后所在位置对应的实数为,求的分布列与期望.【变式1-1】(2024·河北邯郸·高三磁县第一中学校考阶段练习)某学校为了学习、贯彻党的二十大精神,组织了“二十大精神”知识比赛,甲、乙两位教师进行答题比赛,每局只有1道题目,比赛时甲、乙同时回答这一个问题,若一人答对且另一人答错,则答对者获得10分,答错者得分;若两人都答对或都答错,则两人均得0分.根据以往答题经验,每道题甲、乙答对的概率分别为,且甲、乙答对与否互不影响,每次答题的结果也互不影响.(1)求在一局比赛中,甲的得分的分布列与数学期望;(2)设这次比赛共有3局,若比赛结束时,累计得分为正者最终获胜,求乙最终获胜的概率.【变式1-2】(2024·辽宁葫芦岛·高三统考期末)某校高一年级开设建模,写作,篮球,足球,音乐,朗诵,素描7门选修课,每位同学须彼此独立地选3门课程,其中甲选择篮球,不选择足球,丙同学不选素描,乙同学没有要求.(1)求甲同学选中建模且乙同学未选中建模的概率;(2)用表示甲、乙、丙选中建模的人数之和,求的分布列和数学期望.考点二:超几何分布与二项分布超几何分布与二项分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.一般地,在含有件产品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,其中,且,称为超几何分布列.一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,则.此时称随机变量服从二项分布,记作,并称为成功概率.此时有.【例2】(2024·河南南阳·高三南阳中学校考阶段练习)假设某市大约有800万网络购物者,某电子商务公司对该地区n名网络购物者某年度上半年前6个月内的消费情况进行统计,发现消费金额(单位:万元)都在区间内,其频率分布直方图如图所示,若频率分布直方图中的a,b,c,d满足,且从左到右6个小矩形依次对应第一至六小组,第五小组的频数为2400.(1)求a,b,c,d的值;(2)现用分层抽样方法从前4组中选出18人进行网络购物爱好调查,①求在各组应该抽取的人数;②在前2组所抽取的人中,再随机抽取3人,记这3人来自第一组的人数为X,求随机变量X的分布列与数学期望.【变式2-1】(2024·云南昆明·统考一模)聊天机器人(chatterbot)是一个经由对话或文字进行交谈的计算机程序.当一个问题输入给聊天机器人时,它会从数据库中检索最贴切的结果进行应答.在对某款聊天机器人进行测试时,如果输入的问题没有语法错误,则应答被采纳的概率为80%,若出现语法错误,则应答被采纳的概率为30%.假设每次输入的问题出现语法错误的概率为10%.(1)求一个问题的应答被采纳的概率;(2)在某次测试中,输入了8个问题,每个问题的应答是否被采纳相互独立,记这些应答被采纳的个数为,事件()的概率为,求当最大时的值.【变式2-2】(2024·江苏苏州·校联考模拟预测)为不断改进劳动教育,进一步深化劳动教育改革,现从某单位全体员工中随机抽取3人做问卷调查.已知某单位有N名员工,其中是男性,是女性.(1)当时,求出3人中男性员工人数X的分布列和数学期望;(2)我们知道,当总量N足够大而抽出的个体足够小时,超几何分布近似为二项分布.现在全市范围内考虑.从N名员工(男女比例不变)中随机抽取3人,在超几何分布中男性员工恰有2人的概率记作;有二项分布中(即男性员工的人数)男性员工恰有2人的概率记作.那么当N至少为多少时,我们可以在误差不超过0.001(即)的前提下认为超几何分布近似为二项分布.(参考数据:)考点三:概率与其它知识的交汇问题在知识交汇处设计试题是高考命题的指导思想之一,概率作为高中数学具有实际应用背景的主要内容,除与实际应用问题相交汇,还常与排列组合、函数、数列等知识交汇.求解此类问题要充分理解题意.根据题中已知条件,联系所学知识对已知条件进行转化.这类题型具体来说有两大类:1、所给问题是以集合、函数、立体几何、数列、向量等知识为载体的概率问题.求解时需要利用相关知识把所给问题转化为概率模型,然后利用概率知识求解.2、所给问题是概率问题,求解时有时需要把所求概率转化为关于某一变量的函数,然后利用函数、导数知识进行求解;或者把问题转化为与概率变量有关的数列递推关系式,再通过构造特殊数列求通项或求和.【例3】(2024·全国·模拟预测)乒乓球被称为我国的“国球”,是一种深受人们喜爱的球类体育项目.在某高校运动会的女子乒乓球单打半决赛阶段,规定:每场比赛采用七局四胜制,率先取得四局比赛胜利的选手获胜,且该场比赛结束.已知甲、乙两名运动员进行了一场比赛,且均充分发挥出了水平,其中甲运动员每局比赛获胜的概率为,每局比赛无平局,且每局比赛结果互不影响.(1)若前三局比赛中,甲至少赢得一局比赛的概率为,求乙每局比赛获胜的概率;(2)若前三局比赛中甲只赢了一局,设这场比赛结束还需要比赛的局数为,求的分布列和数学期望,并求当为何值时,最大.【变式3-1】(2024·江苏南通·统考一模)已知正六棱锥的底面边长为2,高为1.现从该棱锥的7个顶点中随机选取3个点构成三角形,设随机变量表示所得三角形的面积.(1)求概率的值;(2)求的分布列,并求其数学期望.【变式3-2】(2023·广东·统考一模)已知正四棱锥的底面边长和高都为2.现从该棱锥的5个顶点中随机选取3个点构成三角形,设随机变量表示所得三角形的面积.(1)求概率的值;(2)求随机变量的概率分布及其数学期望.考点四:期望与方差的实际应用数学期望反映的是随机变量取值的平均水平,而方差则是反映随机变量取值在其平均值附近的离散程度.现代实际生活中,越来越多的决策需要应用数学期望与方差来对事件发生大小的可能性和稳定性进行评估,通过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.(1)若我们希望实际的平均水平较理想,则先求随机变量的期望,当时,不应认为它们一定一样好,还需要用来比较这两个随机变量的方差,确定它们的偏离程度.(2)若我们希望比较稳定性,应先考虑方差,再考虑均值是否相等或接近.(3)方差不是越小就越好,而是要根据实际问题的需要来判断.【例4】(2024·北京顺义·高三北京市顺义区第一中学校考阶段练习)为了解顾客对五种款式运动鞋的满意度,厂家随机选取了2000名顾客进行回访,调查结果如表:运动鞋款式ABCDE回访顾客(人数)700350300250400满意度注:①满意度是指:某款式运动鞋的回访顾客中,满意人数与总人数的比值;②对于每位回访顾客,只调研一种款式运动鞋的满意度.假设顾客对各款式运动鞋是否满意相互独立,用顾客对某款式运动鞋的满意度估计对该款式运动鞋满意的概率.(1)从所有的回访顾客中随机抽取1人,求此人是C款式运动鞋的回访顾客且对该款鞋满意的概率;(2)从A、E两种款式运动鞋的回访顾客中各随机抽取1人,设其中满意的人数为,求的分布列和数学期望;(3)用“”和“”分别表示对A款运动鞋满意和不满意,用“”和“”分别表示对B款运动满意和不满意,试比较方差与的大小.(结论不要求证明)【变式4-1】(2024·山东潍坊·高三统考期末)某人从地到地有路程接近的2条路线可以选择,其中第一条路线上有个路口,第二条路线上有个路口.(1)若,,第一条路线的每个路口遇到红灯的概率均为;第二条路线的第一个路口遇到红灯的概率为,第二个路口遇到红灯的概率为,从“遇到红灯次数的期望”考虑,哪条路线更好?请说明理由.(2)已知;随机变量服从两点分布,且,.则,且.若第一条路线的第个路口遇到红灯的概率为,当选择第一条路线时,求遇到红灯次数的方差.【变式4-2】(2024·北京海淀·高三统考期末)甲、乙、丙三人进行投篮比赛,共比赛10场,规定每场比赛分数最高者获胜,三人得分(单位:分)情况统计如下:场次12345678910甲8101071288101013乙9138121411791210丙121191111998911(1)从上述10场比赛中随机选择一场,求甲获胜的概率;(2)在上述10场比赛中,从甲得分不低于10分的场次中随机选择两场,设表示乙得分大于丙得分的场数,求的分布列和数学期望;(3)假设每场比赛获胜者唯一,且各场相互独立,用上述10场比赛中每人获胜的频率估计其获胜的概率.甲、乙、丙三人接下来又将进行6场投篮比赛,设为甲获胜的场数,为乙获胜的场数,为丙获胜的场数,写出方差,,的大小关系.考点五:正态分布与标准正态分布解决正态分布问题有三个关键点:(1)对称轴标准差分布区间.利用对称性可求指定范围内的概率值;由,分布区间的特征进行转化,使分布区间转化为特殊区间,从而求出所求概率.注意在标准正态分布下对称轴为.【例5】(2024·江苏南通·高三海安高级中学校考阶段练习)某大型公司招聘新员工,应聘人员简历符合要求之后进入考试环节.考试分为笔试和面试,只有笔试成绩高于75分的考生才能进入面试环节,已知2023年共有1000人参加该公司的笔试,笔试成绩.(1)从参加笔试的1000名考生中随机抽取4人,求这4人中至少有一人进入面试的概率;(2)甲、乙、丙三名应聘人员进入面试环节,且他们通过面试的概率分别为.设这三名应聘人员中通过面试的人数为,求随机变量的分布列和数学期望.参考数据:若,则,【变式5-1】(2024·贵州铜仁·校联考模拟预测)某地区教育局数学教研室为了了解本区高三学生一周用于数学学习时间的分布情况,做了全区8000名高三学生的问卷调查,现抽取其中部分问卷进行分析(问卷中满时长为12小时),将调查所得学习时间分成,,,,,6组,并绘制成如图所示的频率分布直方图(同一组中的数据用该组区间的中点值为代表).参考数据:若随机变量服从正态分布,则,,.

(1)求a的值;(2)以样本估计总体,该地区高三学生数学学习时间近似服从正态分布,试估计该地区高三学生数学学习时间在内的人数;(3)现采用分层抽样的方法从样本中学习时间在,内的学生随机抽取8人,并从这8人中再随机抽取3人作进一步分析,设3人中学习时间在内的人数为变量X,求X的期望.【变式5-2】(2024·河南开封·河南省兰考县第一高级中学校联考模拟预测)《山东省高考改革试点方案》规定:年高考总成绩由语文、数学、外语三门统考科目和思想政治、历史、地理、物理、化学、生物六门选考科目组成,将每门选考科目的考生原始成绩从高到低划分为、、、、、、、共8个等级,参照正态分布原则,确定各等级人数所占比例分别为、、、、、、、,选择科目成绩计入考生总成绩时,将至等级内的考生原始成绩,依照(、分别为正态分布的均值和标准差)分别转换到、、、、、、、八个分数区间,得到考生的等级成绩.如果山东省年某次学业水平模拟考试物理科目的原始成绩,.(1)若规定等级、、、、、为合格,、为不合格,需要补考,估计这次学业水平模拟考试物理合格线的最低原始分是多少;(2)现随机抽取了该省名参加此次物理学科学业水平测试的原始分,若这些学生的原始分相互独立,记为被抽到的原始分不低于分的学生人数,求的数学期望和方差.附:当时,,.考点六:统计图表及数字特征1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示,故每组样本的频率为组距(3)直方图中每组样本的频数为频率总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【例6】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年200位居民家庭的月平均用水量(单位:吨),将数据按照,分成6组,制成了如图所示的频率分布直方图.(1)求直方图中的值;(2)该市决定设置议价收费标准,用水量低于的居民家庭按照“民用价”收费,不低于的按照“商业价”收费,为保障有的居民能享受“民用价”,请设置该标准;(3)以每组数据的中点值作为该组数据的代表,分别是.规定“最佳稳定值”是这样一个量:与各组代表值的差的平方和最小.依此规定,请求出的值.【变式6-1】(2024·全国·模拟预测)当代大学生有着购物、精神、文化、社交等多元化需求,这些需求促进大学城商圈的发展.某媒体调查了全国各地大学城中数千名消费者在大学城里的月均消费额及月均消费次数,从中随机抽取500名消费者,把他们的月均消费额(单位:千元)按照,,,,,分组,得到如下频率分布直方图:统计他们的月均消费次数,得到如下频数分布表:月均消费次数12345678人数406080120120502010(1)从全国各地大学城中随机抽取8000名消费者,估计这8000名消费者中月均消费额大于2000元的人数及样本中500名样本消费者的月均消费额的众数及平均数.(2)从月均消费次数超过5次的样本消费者中按照月均消费次数分层抽样,从中抽取n个人,抽取的月均消费6次的人数比月均消费8次的多4人.①求n的值;②若从抽取的n个人中再随机抽取2个人给予礼品奖励,求这2人的月均消费次数不都是6次的概率.【变式6-2】(2024·北京·高三东直门中学校考阶段练习)4月23日是联合国教科文组织确定的“世界读书日”.为了解某地区高一学生阅读时间的分配情况,从该地区随机抽取了500名高一学生进行在线调查,得到了这500名学生的日平均阅读时间(单位:小时),并将样本数据分成、、、、、、、、九组,绘制成如图所示的频率分布直方图.(1)求频率分布直方图中的值;(2)为进一步了解这500名学生数字媒体阅读时间和纸质图书阅读时间的分配情况,从日平均阅读时间在、、三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人,记日平均阅读时间在内的学生人数为,求的分布列和数学期望;(3)以样本的频率估计概率,从该地区所有高一学生中随机抽取8名学生,用表示这8名学生中恰有名学生日平均阅读时间在内的概率,其中.当最大时,请直接写出的值.(不需要说明理由)考点七:线性回归与非线性回归分析线性回归分析的原理、方法和步骤:(1)利用图表和数字特征可以对数据做简单的分析,但是用回归直线方程可以对数据的未来值进行预测.在选取数据观察的时候,要注意大量相对稳定的数据比不稳定的数据更有价值,近期的数据比过去久远的数据更有价值.(2)判断两组数据是否具有线性相关关系的方法:散点图,相关系数.(3)相关指数与相关系数在含有一个解释变量的线性回归模型中是等价的量,都是用来判断线性回归模型拟合效果好不好的量.(4)利用换元法,可以将一元非线性回归转化为线性回归.【例7】(2024·河南三门峡·高三统考期末)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区外来务工人数x/万3456就地过年人数y/万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程.(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;②若A区的外来务工人员中甲、乙选择就地过年的概率分别为p,,其中,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p的取值范围.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.【变式7-1】(2024·四川成都·石室中学校考模拟预测)某医科大学实习小组为研究实习地昼夜温差与感冒人数之间的关系,分别到当地气象部门和某医院抄录了1月至3月每月5日、20日的昼夜温差情况与因感冒而就诊的人数,得到如表资料:日期1月5日1月20日2月5日2月20日3月5日3月20日昼夜温差x(℃)1011131286就诊人数y(个)222529261612该小组确定的研究方案是:先从这6组数据中随机选取4组数据求线性回归方程,再用剩余的2组数据进行检验.参考公式:,.(1)求剩余的2组数据都是20日的概率;(2)若选取的是1月20日、2月5日、2月20日、3月5日这4组数据.①请根据这4组数据,求出y关于x的线性回归方程;②若某日的昼夜温差为7℃,请预测当日就诊人数.(结果保留整数).【变式7-2】(2024·湖南衡阳·高三衡阳市八中校联考阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1∼10分别对应年份2013∼2022.

根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:752.2582.54.512028.35表中,.(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型?并说明理由;(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大?附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.考点八:独立性检验解独立性检验应用问题的注意事项.(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)在列联表中注意事件的对应及相关值的确定,不可混淆.(3)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.(4)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.【例8】(2024·河南·模拟预测)轻食是餐饮的一种形态、轻的不仅仅是食材分量,更是食材烹饪方式简约,保留食材本来的营养和味道,近年来随着消费者健康意识的提升及美颜经济的火热,轻食行业迎来快速发展.某传媒公司为了获得轻食行业消费者行为数据,对中国轻食消费者进行抽样调查.统计其中400名中国轻食消费者(表中4个年龄段的人数各100人)食用轻食的频率与年龄得到如下的频数分布表.使用频率偶尔1次3015510每周1~3次40403050每周4~6次25404530每天1次及以上552010(1)若把年龄在的消费者称为青少年,年龄在的消费者称为中老年,每周食用轻食的频率不超过3次的称为食用轻食频率低,不低于4次的称为食用轻食频率高,根据小概率值的独立性检验判断食用轻食频率的高低与年龄是否有关联;(2)从每天食用轻食1次及以上的样本消费者中按照表中年龄段采用按比例分配的分层随机抽样,从中抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,,,求的分布列与期望;(3)已知小李每天早餐、晚餐都食用轻食,且早餐与晚餐在低卡甜品、全麦夹心吐司、果蔬汁3种轻食中选择一种,已知小李在某天早餐随机选择一种轻食,如果早餐选择低卡甜品、全麦夹心吐司、果蔬汁,则晚餐选择低卡甜品的概率分别为,求小李晚餐选择低卡甜品的概率.参考公式:,.附:0.100.050.010.0050.0012.7063.8416.6357.87910.828【变式8-1】(2024·全国·高三专题练习)例某市近年来空气污染较为严重,现随机抽取一年(365天)内100天的空气中PM2.5指数的检测数据,统计结果如下:PM2.5指数空气质量优良轻微污染轻度污染中度污染中度重污染重度污染天数413183091115记某企业每天由空气污染造成的经济损失为S(单位:元),PM2.5指数为x.当x在区间内时对企业没有造成经济损失;当x在区间内时对企业造成的经济损失成直线模型;当PM2.5指数为150时造成的经济损失为500元;当PM2.5指数为200时,造成的经济损失为700元;当PM2.5指数大于300时造成的经济损失为2000元.(1)试写出的表达式;(2)试估计在本年内随机抽取一天,该天经济损失S大于500元且不超过900元的概率;(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面列联表,并根据小概率值的独立性检验,分析该市本年度空气重度污染是否与供暖有关.非重度污染重度污染合计供暖季非供暖季合计100附:0.250.150.100.050.0250.0100.0050.0011.3232.0722.7063.8415.0246.6357.87910.828,其中.【变式8-2】(2024·重庆·高三统考期末)2024年1月18日是中国传统的“腊八节”,“腊八”是中国农历十二月初八(即腊月初八)这一天.腊八节起源于古代祭祀祖先和神灵的仪式,后逐渐成为民间节日,盛行于中国北方.为调查不同年龄人群对“腊八节”民俗文化的了解情况,某机构抽样调查了某市的部分人群.(1)在100名受调人群中,得到如下数据:年龄了解程度不了解了解30岁以下162450岁以上1644根据小概率值的独立性检验,分析受调群体中对“腊八节”民俗的了解程度是否存在年龄差异;(2)调查问卷共设置10个题目,选择题、填空题各5个.受调者只需回答8个题:其中选择题必须全部回答,填空题随机抽取3个进行问答.某位受调者选择题每题答对的概率为0.8,知道其中3个填空题的答案,但不知道另外2个的答案.求该受调者答对题目数量的期望.参考公式:①.独立性检验常用小概率值和相应临界值:0.10.050.010.0050.0012.7063.8416.6357.87910.828②随机变量X,Y的期望满足:考点九:与体育比赛规则有关的概率问题1、在与体育比赛规则有关的问题中,一般都会涉及分组,处理该类问题时主要借助于排列组合.对于分组问题,要注意平均分组与非平均分组,另外,在算概率时注意“直接法”与“间接法”的灵活运用.2、与体育比赛有关的问题中最常见的就是输赢问题,经常涉及“多人淘汰制问题”“三局两胜制问题”“五局三胜制问题”“七局四胜制问题”,解决这些问题的关键是认识“三局两胜制”“五局三胜制”等所进行的场数,赢了几场与第几场赢,用互斥事件分类,分析事件的独立性,用分步乘法计数原理计算概率,在分类时要注意“不重不漏”.3、在体育比赛问题中,比赛何时结束也是经常要考虑的问题,由于比赛赛制已经确定,而比赛的平均场次不确定,需要对比赛的平均场次进行确定,常用的方法就是求以场数为随机变量的数学期望,然后比较大小.4、有些比赛会采取积分制,考查得分的分布列与数学期望是常考题型,解题的关键是辨别它的概率模型,常见的概率分布模型有:两点分布、超几何分布、二项分布、正态分布,要注意分布是相互独立的,超几何分布不是,值得注意的是,在比赛中往往是伪二项分布,有的只是局部二项分布.【例9】(2024·江西抚州·高三金溪一中校考阶段练习)甲、乙两人准备进行羽毛球比赛,比赛规定:一回合中赢球的一方作为下一回合的发球方.若甲发球,则本回合甲赢的概率为,若乙发球,则本回合甲赢的概率为,每回合比赛的结果相互独立.经抽签决定,第1回合由甲发球.(1)求第4个回合甲发球的概率;(2)设前4个回合中,甲发球的次数为,求的分布列及期望.【变式9-1】(2024·福建福州·高三福建省福州第一中学校考开学考试)第24届冬季奥运会于2022年2月4日至20日在中国举行,其中冰壶比赛项目是本届奥运会的正式比赛项目之一,冰壶比赛的场地如图所示,其中左端(投掷线的左侧)有一个发球区,运动员在发球区边沿的投掷线将冰壶掷出,使冰壶沿冰道滑行,冰道的右端有一圆形的营垒,以场上冰壶最终静止时距离营垒区圆心O的远近决定胜负.某学校冰壶队举行冰壶投掷测试,规则为:①每人至多投3次,先在点M处投第一次,冰壶进入营垒区得3分,未进营垒区不得分;②自第二次投掷开始均在点A处投掷冰壶,冰壶进入营垒区得2分,未进营垒区不得分;③测试者累计得分高于3分即通过测试,并立即终止投掷.已知投掷一次冰壶,甲得3分和2分的概率分别为0.1和0.5,乙得3分和2分的概率分别为0.2和0.4,甲,乙每次投掷冰壶的结果互不影响.(1)求甲通过测试的概率;(2)设为本次测试中乙的得分,求的分布列,【变式9-2】(2024·湖南长沙·高三长沙一中校考阶段练习)甲、乙两人组成“虎队”代表班级参加学校体育节的篮球投篮比赛活动,每轮活动由甲、乙两人各投篮一次,在一轮活动中,如果两人都投中,则“虎队”得3分;如果只有一个人投中,则“虎队”得1分;如果两人都没投中,则“虎队”得0分.已知甲每轮投中的概率是,乙每轮投中的概率是;每轮活动中甲、乙投中与否互不影响.各轮结果亦互不影响.(1)假设“虎队”参加两轮活动,求:“虎队”至少投中3个的概率;(2)①设“虎队”两轮得分之和为,求的分布列;②设“虎队”轮得分之和为,求的期望值.(参考公式)考点十:决策型问题求解决策型问题的求解流程为:第一步:先确定函数关系式;第二步:列出分布列,求出期望;第三步:根据期望进行最后的决策.【例10】(2024·福建福州·高三福建师大附中校考阶段练习)核酸检测也就是病毒和的检测,是目前病毒检测最先进的检验方法,在临床上主要用于新型冠状乙肝、丙肝和艾滋病的病毒检测.通过核酸检测,可以检测血液中是否存在病毒核酸,以诊断机体有无病原体感染.某研究机构为了提高检测效率降低检测成本,设计了如下试验,预备份试验用血液标本,从标本中随机取出份分为一组,将样本分成若干组,从每一组的标本中各取部分,混合后检测,若结果为阴性,则判定该组标本均为阴性,不再逐一检测;若结果为阳性,需对该组标本逐一检测.以此类推,直到确定所有样本的结果:份阳性,份阴性.若每次检测费用为元(为常数),记检测的总费用为元.(1)当时,求的分布列和数学期望.(2)以检测成本的期望值为依据,在与中选其一,应选哪个?【变式10-1】(2024·河北衡水·统考模拟预测)随着移动网络的飞速发展,人们的生活发生了很大变化,其中在购物时利用手机中的支付宝、微信等APP软件进行扫码支付也日渐流行开来.某商场对近几年顾客使用扫码支付的情况进行了统计,结果如下表:年份20162017201820192020年份代码x12345使用扫码支付的人次y(单位:万人)512161921(1)观察数据发现,使用扫码支付的人次y与年份代码x的关系满足经验关系式:,通过散点图可以发现y与x之间具有相关性.设,利用与x的相关性及表格中的数据求出y与x之间的回归方程,并估计2021年该商场使用扫码支付的人次;(2)为提升销售业绩,该商场近期推出两种付款方案:方案一:使用现金支付,每满200元可参加1次抽奖活动,抽奖方法如下:在抽奖箱里有8个形状、大小完全相同的小球(其中红球有3个,黑球有5个),顾客从抽奖箱中一次性摸出3个球,若摸到3个红球,则打7折;若摸出2个红球则打8折,其他情况不打折.方案二:使用扫码支付,此时系统自动对购物的顾客随机优惠,据统计可知,采用扫码支付时有的概率享受8折优惠,有的概率享受9折优惠,有的概率享受立减10元优惠.若小张在活动期间恰好购买了总价为200元的商品.(i)求小张选择方案一付款时实际付款额X的分布列与数学期望;(ii)试比较小张选择方案一与方案二付款,哪个方案更划算?附:最小二乘法估计公式:经过点的回归直线为相关数据:(其中.【变式10-2】(2024·全国·高三专题练习)在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.系统就能正常工作.设三台设备的可靠度均为,它们之间相互不影响.(1)要使系统的可靠度不低于0.992,求的最小值;(2)当时,求能使系统正常工作的设备数的分布列;(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可给该产业园带来约50万的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.8,更换设备硬件总费用为0.8万元;方案2:花费0.5万元增加一台可靠度是0.7的备用设备,达到“一用三备”.请从经济损失期望最小的角度判断决策部门该如何决策?并说明理由.考点十一:递推型概率命题递推型概率命题,综合性较强,主要有以下类型:1、求通项公式:关键与找出概率或数学期望的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式.2、求和:主要与数列中的倒序求和错位求和、裂项求和.3、利用等差、等比数列的性质,研究单调性、最值或求极限.【例11】(2024·全国·模拟预测)在2023年成都大运会的射击比赛中,中国队取得了优异的比赛成绩,激发了全国人民对射击运动的热情.某市举行了一场射击表演赛,规定如下:表演赛由甲、乙两位选手进行,每次只能有一位选手射击,用抽签的方式确定第一次射击的人选,甲、乙两人被抽到的概率相等;若中靶,则此人继续射击,若未中靶,则换另一人射击.已知甲每次中靶的概率为,乙每次中靶的概率为,每次射击结果相互独立.(1)若每次中靶得10分,未中靶不得分,求3次射击后甲得20分的概率;(2)求第n次射击的人是乙的概率.【变式11-1】(2024·山东·高三山东省实验中学校考阶段练习)某品牌女装专卖店设计摸球抽奖促销活动,每位顾客只用一个会员号登陆,每次消费都有一次随机摸球的机会.已知顾客第一次摸球抽中奖品的概率为;从第二次摸球开始,若前一次没抽中奖品,则这次抽中的概率为,若前一次抽中奖品,则这次抽中的概率为.记该顾客第n次摸球抽中奖品的概率为.(1)求的值,并探究数列的通项公式;(2)求该顾客第几次摸球抽中奖品的概率最大,请给出证明过程.【变式11-2】(2024·贵州黔西·高三兴义第一中学校联考阶段练习)马尔科夫链是概率统计中的一个重要模型,因俄国数学家安德烈·马尔科夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第次的状态有关,与第,,,…次状态无关,即.已知甲盒子中装有2个黑球和1个白球,乙盒子中装有2个白球,现从甲、乙两个盒子中各任取一个球交换放入另一个盒子中,重复次这样的操作.记甲盒子中黑球个数为,恰有2个黑球的概率为,恰有1个黑球的概率为.(1)求,和,;(2)证明:为等比数列(且);(3)求的期望(用表示,且).考点十二:条件概率、全概率公式、贝叶斯公式【例12】俗话说:“人配衣服,马配鞍”.合理的穿搭会让人舒适感十足,给人以赏心悦目的感觉.张老师准备参加某大型活动,他选择服装搭配的颜色规则如下:将一枚骰子连续投掷两次,两次的点数之和为3的倍数,则称为“完美投掷”,出现“完美投掷”,则记;若掷出的点数之和不是3的倍数,则称为“不完美投掷”,出现“不完美投掷”,则记;若,则当天穿深色,否则穿浅色.每种颜色的衣物包括西装和休闲装,若张老师选择了深色,再选西装的可能性为,而选择了浅色后,再选西装的可能性为.(1)求出随机变量的分布列,并求出期望及方差;(2)求张老师当天穿西装的概率.【变式12-1】(2024·辽宁辽阳·高三统考期末)某中学选拔出20名学生组成数学奥赛集训队,其中高一学生有8名、高二学生有7名、高三学生有5名.(1)若从数学奥赛集训队中随机抽取3人参加一项数学奥赛,求抽取的3名同学中恰有2名同学来自高一的概率.(2)现学校欲对数学奥赛集训队成员进行考核,考核规则如下:考核共4道题,前2道题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论