专题10.1 概率与统计的综合运用【十一大题型】(举一反三)(新高考专用)(解析版)2024年高考数学二轮复习_第1页
专题10.1 概率与统计的综合运用【十一大题型】(举一反三)(新高考专用)(解析版)2024年高考数学二轮复习_第2页
专题10.1 概率与统计的综合运用【十一大题型】(举一反三)(新高考专用)(解析版)2024年高考数学二轮复习_第3页
专题10.1 概率与统计的综合运用【十一大题型】(举一反三)(新高考专用)(解析版)2024年高考数学二轮复习_第4页
专题10.1 概率与统计的综合运用【十一大题型】(举一反三)(新高考专用)(解析版)2024年高考数学二轮复习_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第第页专题10.1概率与统计的综合运用【十一大题型】【新高考专用】TOC\o"1-3"\h\u【题型1条件概率、全概率公式、贝叶斯公式】 3【题型2求概率及随机变量的分布列与期望】 5【题型3超几何分布与二项分布】 9【题型4正态分布及其应用】 12【题型5概率与其它知识的交汇问题】 14【题型6期望与方差的实际应用】 19【题型7统计图表问题】 26【题型8回归分析】 29【题型9独立性检验】 34【题型10决策型问题】 40【题型11独立性检验与统计图表的综合运用】 441、概率统计综合概率与统计是高考的热点内容,概率统计专题相关的知识点错综复杂又环环相扣,在高考考查中一般情况会对多个知识点进行综合考查.从近几年的高考情况来看,题量通常为“两小一大”,选择题、填空题考查比较全面;解答题重点考查概率统计主干知识,主要涉及古典概型、离散型随机变量的分布列和数学期望、回归分析、独立性检验等内容;试题难度中等,二轮复习时需要熟练掌握这些内容,加强练习.【知识点1古典概型中基本事件的求解方法】1.求样本空间中样本点个数的方法(1)枚举法:适合于给定的样本点个数较少且易一一列举出的问题.(2)树状图法:适合于较为复杂的问题,注意在确定样本点时(x,y)可看成是有序的,如(1,2)与(2,1)不同,有时也可看成是无序的,如(1,2)与(2,1)相同.(3)排列组合法:在求一些较复杂的样本点个数时,可利用排列或组合的知识.【知识点2条件概率与全概率公式的解题策略】1.求条件概率的常用方法(1)利用定义,分别求P(A)和P(AB),得.(2)借助古典概型概率公式,先求事件A包含的基本事件数n(A),再在事件A发生的条件下求事件B包含的基本事件数,即n(AB),得.2.利用全概率公式的思路(1)按照确定的标准,将一个复合事件分解为若干个互斥事件Ai(i=1,2,…,n);(2)求P(Ai)和所求事件B在各个互斥事件Ai发生条件下的概率P(B|Ai);(3)代入全概率公式计算.【知识点3离散型随机变量及其分布的解题策略】1.离散型随机变量分布列的求解步骤(1)明取值:明确随机变量的可能取值有哪些,且每一个取值所表示的意义;(2)求概率:要弄清楚随机变量的概率类型,利用相关公式求出变量所对应的概率;(3)画表格:按规范要求形式写出分布列;(4)做检验:利用分布列的性质检验分布列是否正确.2.求离散型随机变量ξ的均值与方差的步骤(1)理解ξ的意义,写出ξ可能的全部值.(2)求ξ取每个值的概率.(3)写出ξ的分布列.(4)由均值的定义求E(ξ).(5)由方差的定义求D(ξ).【知识点4二项分布与超几何分布、正态分布的解题策略】1.判断某随机变量是否服从二项分布的关键点:

(1)在每一次试验中,事件发生的概率相同.(2)各次试验中的事件是相互独立的.(3)在每一次试验中,试验的结果只有两个,即发生与不发生.2.超几何分布的关键点:

(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的概率分布.(2)超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.2.解决正态分布问题的三个关键点:

(1)对称轴x=μ;(2)标准差;(3)分布区间:利用对称性可求指定范围内的概率值;由μ,,分布区间的特征进行转化,使分布区间转化为3特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0.【知识点5频率分布直方图中的数字特征】1.众数、中位数、平均数的应用要点中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.2.频率分布直方图的数字特征(1)众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3)平均数:平均数在频率分布表中等于组中值与对应频率之积的和.【知识点6回归分析的常用结论】1.回归分析的三大常用结论(1)求解经验回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心.(2)根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.(3)根据的值可以判断两个分类变量有关的可信程度,若越大,则两分类变量有关的把握越大.【知识点7独立性检验的解题策略】1.变量相关性的判断在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.独立性检验的应用问题的解题策略解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)根据公式计算;(3)通过比较与临界值的大小关系来作统计推断.【题型1条件概率、全概率公式、贝叶斯公式】【例1】(2024·河南信阳·二模)随着城市经济的发展,早高峰问题越发严重,上班族需要选择合理的出行方式.某公司员工小明的上班出行方式有三种,某天早上他选择自驾,坐公交车,骑共享单车的概率分别为13,13,13,而他自驾,坐公交车,骑共享单车迟到的概率分别为14,15,16,结果这一天他迟到了,在此条件下,他自驾去上班的概率是(

)A.1237 B.1537 C.35【解题思路】设事件A表示“自驾”,事件B表示“坐公交车”,事件C表示“骑共享单车”,事件D“表示迟到”,利用全概率公式以及条件概率公式即可得到答案.【解答过程】设事件A表示“自驾”,事件B表示“坐公交车”,事件C表示“骑共享单车”,事件D“表示迟到”,由题意可知:P(A)=P(B)=P(C)=1则P(D)=P(A)PD|AP(AD)=P(A)PD|A若小明迟到了,则他自驾去上班的概率是P(A∣故选:B.【变式1-1】(2024·江苏宿迁·一模)人工智能领域让贝叶斯公式:PAB=PBAPA.0.1% B.0.4% C.2.4%【解题思路】根据题意,由贝叶斯公式代入计算,即可得到结果.【解答过程】记“视频是AI合成”为事件A,记“鉴定结果为AI”为事件B,则PA由贝叶斯公式得:PA故选:C.【变式1-2】(2024·山东临沂·一模)长时间玩手机可能影响视力,据调查,某学校学生中,大约有15的学生每天玩手机超过1h,这些人近视率约为12,其余学生的近视率约为3A.15 B.716 C.25【解题思路】根据全概率公式计算可得.【解答过程】设事件A为“任意调查一名学生,每天玩手机超过1h”,事件B则PA=1所以PA=1−P则PB故选:C.【变式1-3】(2024·四川德阳·模拟预测)质数(primenumber)又称素数,一个大于1的自然数,除了1和它本身外,不能被其他自然数整除,则这个数为质数,数学上把相差为2的两个素数叫做“孪生素数”.如:3和5,5和7……,在1900年的国际数学大会上,著名数学家希尔伯特提出了23个问题,其中第8个就是大名鼎鼎的孪生素数猜想:即存在无穷多对孪生素数.我国著名数学家张益唐2013年在《数学年刊》上发表论文《素数间的有界距离》,破解了困扰数学界长达一个半世纪的难题,证明了孪生素数猜想的弱化形式.那么,如果我们在不超过30的自然数中,随机选取两个不同的数,记事件A,这两个数都是素数;事件B:这两个数不是孪生素数,则PBA=A.1115 B.3745 C.1315【解题思路】根据条件概率的计算方法求得正确答案.【解答过程】不超过30的自然数有31个,其中素数有2,3,5,7,11,13,17,19,23,29共10个,孪生素数有3和5,5和7,11和13,17和29,共4组.所以PA=C所以PB故选:D.【题型2求概率及随机变量的分布列与期望】【例2】(2024·山东烟台·一模)联合国新闻部将我国农历二十四节气中的“谷雨”定为联合国中文日,以纪念“中华文字始祖”仓颉的贡献.某大学拟在2024年的联合国中文日举行中文知识竞赛决赛,决赛分为必答、抢答两个环节依次进行.必答环节,共2道题,答对分别记30分、40分,否则记0分;抢答环节,包括多道题,设定比赛中每道题必须进行抢答,抢到并答对者得15分,抢到后未答对,对方得15分;两个环节总分先达到或超过100分者获胜,比赛结束.已知甲、乙两人参加决赛,且在必答环节,甲答对两道题的概率分别45,13,乙答对两道题的概率分别为23,12,在抢答环节,任意一题甲、乙两人抢到的概率都为12(1)在必答环节中,求甲、乙两人得分之和大于100分的概率;(2)在抢答环节中,求任意一题甲获得15分的概率;(3)若在必答环节甲得分为70分,乙得分为40分,设抢答环节经过X道题抢答后比赛结束,求随机变量X的分布列及数学期望.【解题思路】(1)把得分之和大于100分的事件分拆,再利用相互独立事件及互斥事件的概率公式计算即得.(2)甲获得15分的事件是甲抢到答正确与乙抢到答错的事件和,再列式求出概率.(3)求出X的可能值及各个值对应的概率,列出分布列并求出数学期望.【解答过程】(1)两人得分之和大于100分可分为甲得40分、乙得70分,甲得70分、乙得40分,甲得70分、乙得70分三种情况,所以得分大于100分的概率p=1(2)抢答环节任意一题甲得15分的概率p=1(3)X的可能取值为2,3,4,5,由抢答任意一题甲得15分的概率为13,得抢答任意一题乙得15分的概率为2P(X=2)=(13P(X=4)=CP(X=5)=C所以X的分布列为:X2345P142832数学期望E(X)=2×1【变式2-1】(2024·广东·模拟预测)某公司是一家集无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种类型无人运输机性能都比较出色,但操控水平需要十分娴熟,才能发挥更大的作用.已知在单位时间内,甲、乙两种类型无人运输机操作成功的概率分别为34和1(1)随机选择两种无人运输机中的一种,求选中的无人运输机操作成功的概率;(2)操作员连续进行两次无人机的操作有两种方案:方案一:在初次操作时,随机选择两种无人运输机中的一种,若初次操作成功,则第二次继续使用该类型设备;若初次操作不成功,则第二次使用另一类型进行操作;方案二:在初次操作时,随机选择两种无人运输机中的一种,无论初次操作是否成功,第二次均使用初次所选择的无人运输机进行操作.假定方案选择及操作不相互影响,试比较这两种方案的操作成功的次数的期望值.【解题思路】(1)利用条件概率公式,即可求解;(2)首先确定两种方案成功次数X,Y的取值,根据独立事件概率公式求概率,再比较其数学期望.【解答过程】(1)用事件A1表示选择甲种无人运输机,用事件A用事件B表示“选中的无人运输机操作成功”则P(B)=P(A=(2)设方案一和方案二操作成功的次数分别为X,Y,则X,Y的所有可能取值均为0,1,2,方案一:PX=0PX=1PX=2所以EX方案二:PY=0PY=1PY=2所以EY所以EX【变式2-2】(2024·山东泰安·一模)某学校为了缓解学生紧张的复习生活,决定举行一次游戏活动,游戏规则为:甲箱子里装有3个红球和2个黑球,乙箱子里装有2个红球和2个黑球,这些球除颜色外完全相同,每次游戏从这两个箱子里各随机摸出2个球,且每次游戏结束后将球放回原箱,摸出一个红球记2分,摸出一个黑球记−1分,得分在5分以上(含5分)则获奖.(1)求在1次游戏中,获奖的概率;(2)求在1次游戏中,得分X的分布列及均值.【解题思路】(1)利用组合应用问题,结合古典概率公式求出摸到3个或4个红球的概率,再利用互斥事件求出概率.(2)求出X的可能值,及各个值对应的概率,列出分布列并求出期望.【解答过程】(1)设“在1次游戏中摸出i个红球”为事件Ai设“在1次游戏中获奖”为事件B,则B=A3∪PA3=所以在1次游戏中,获奖的概率PB(2)依题意,X所有可能取值为−4,−1,2,5,8,由(1)知,PX=−4=PAPX=2PX=5=PA所以X的分布列为:X−4−1258P11731数学期望EX【变式2-3】(2024·贵州贵阳·一模)猜灯谜,是我国独有的民俗文娱活动,是从古代就开始流传的元宵节特色活动.每逢农历正月十五传统民间都要把谜语写在纸条上并贴在彩灯上供人猜.在一次猜灯谜活动中,若甲、乙两名同学分别独立竞猜,甲同学猜对每个灯谜的概率为23,乙同学猜对每个灯谜的概率为1(1)甲、乙任选1个独立竞猜,求甲、乙恰有一人猜对的概率;(2)活动规定:若某人任选2个进行有奖竞猜,都猜对则可以在A箱中参加抽取新春大礼包的活动,中奖概率是23;没有都猜对则在B箱中参加抽取新春大礼包的活动,中奖概率是1(3)甲、乙各任选2个独立竞猜,设甲、乙猜对灯谜的个数之和为X,求X的分布列与数学期望.【解题思路】(1)根据相互独立事件及互斥事件的概率公式计算可得;(2)根据全概率概率公式计算可得;(3)依题意可得X的可能取值为0,1,2,3,4,求出所对应的概率,即可得到分布列与数学期望.【解答过程】(1)设A=“甲猜对一个灯谜”,B=“乙猜对一个灯谜”,则P因为甲、乙恰有一人猜对的事件为AB所以P(A=P(A)P(=2所以,甲、乙恰有一人猜对的概率为12(2)设C=“甲猜对两道题”,D=“甲中奖”,则P==8所以,甲同学抽中新春大礼包的概率47108(3)由(1)知PA=2易知甲、乙猜对灯谜的个数之和X的可能取值为0,1,2,3,4.则PX=0PX=1PX=2PX=3PX=4所以X的分布列为X01234P111311因此,X的数学期望E【题型3超几何分布与二项分布】【例3】(2024·吉林·模拟预测)已知某种疾病的某种疗法的治愈率为90%.若有1000位该病患者采取了这种疗法,且每位患者治愈与否相互独立,设其中被治愈的人数为X,P(X=k)>P(X=1000−k),则(

A.k≤499 B.k≤500C.k≥500 D.k≥501【解题思路】根据二项分布的概率列出P(X=k),P(X=1000−k)的表达式,由题意可得不等式,化简并结合指数函数性质,即可求得答案.【解答过程】由题意知X∼B(1000,0.9),故P(X=k)=C1000k由P(X=k)>P(X=1000−k)得C1000即0.92k−1000>0.12k−1000,即由于k∈N∗,故故选:D.【变式3-1】(2023·山东泰安·模拟预测)某人在n次射击中击中目标的次数为X,X∼Bn,p,其中n∈N∗,0<p<1,击中奇数次为事件A.若n=10,p=0.8,则PX=k取最大值时B.当p=12时,C.当0<p<12时,PAD.当12<p<1时,P(A)随着【解题思路】对于A,根据X∼B10,0.8直接写出PX=k,然后根据PX=k取最大值列式计算即可判断;对于B,根据X∼Bn,p,直接写出【解答过程】对于选项A,在10次射击中击中目标的次数X∼B10,0.8当X=k时对应的概率PX=k因为PX=k取最大值,所以P即C10即k+1≥410−k411−k因为k∈N且0≤k≤10,所以k=8,即k=8时概率P(X=8)对于选项B,DX=np1−p=n−对于选项C、D,∵PX=k∴PA1−P(A)=C∴PA当0<p<12时,0<1−2p<1,1−1−2pn当12<p<1时,−1<1−2p<0,1−2pn为正负交替的摆动数列,所以P(A)故选:C.【变式3-2】(22-23高二下·江苏南京·期中)口袋中有6个球(除颜色外其他属性都相同),其中3个黑球,2个红球,1个白球,ξ表示有放回的摸球3次,每次摸一个,取出红球的数目,η表示不放回的摸球3次,每次摸一个,取出黑球的数目,则下列结论成立的是(

)A.Eξ<EηC.Eξ=E【解题思路】分别求得Eξ与E【解答过程】ξ表示有放回的摸球3次,每次摸一个,取出红球的数目,ξ的可能取值为0,1,2,则ξ∼B(3,13)η表示不放回的摸球3次,每次摸一个,取出黑球的数目,η的可能取值为0,1,2,3,η满足超几何分布,则Eη=3×故选:A.【变式3-3】(2023·河南·模拟预测)32名业余棋手组队与甲、乙2名专业棋手进行车轮挑战赛,每名业余棋手随机选择一名专业棋手进行一盘比赛,每盘比赛结果相互独立,若获胜的业余棋手人数不少于10名,则业余棋手队获胜.已知每名业余棋手与甲比赛获胜的概率均为13,每名业余棋手与乙比赛获胜的概率均为14,若业余棋手队获胜,则选择与甲进行比赛的业余棋手人数至少为(A.24 B.25 C.26 D.27【解题思路】由二项分布及其期望计算即可.【解答过程】设选择与甲进行比赛且获胜的业余棋手人数为X,选择与乙进行比赛且获胜的业余棋手人数为Y;设选择与甲进行比赛的业余棋手人数为n,则选择与乙进行比赛的业余棋手人数为32-n.X所有可能的取值为0,1,2,⋅⋅⋅,n,则X~Bn,13Y所有可能的取值为0,1,2,⋅⋅⋅,32-n,则Y−B32−n,14所以获胜的业余棋手总人数的期望EX+Y=EX故选:A.【题型4正态分布及其应用】【例4】(2024·贵州贵阳·一模)设随机变量ξ服从正态分布N6,σ2,若Pξ<3a−4=PA.9 B.7 C.5 D.4【解题思路】由正态分布曲线的对称性可列方程求解.【解答过程】因为随机变量ξ服从正态分布N6,σ2所以3a−4+−a+2=6×2=12,解得故选:B.【变式4-1】(2024·全国·模拟预测)据统计,某快递公司的200名快递员每人每月派送的快递件数X服从正态分布,且X~N3000,σ2A.40 B.60 C.70 D.80【解题思路】先求得每月派送的快递件数不低于4000的快递员所占比例为0.3,结合正态分布曲线的对称性,即可求解.【解答过程】由题意知,每月派送的快递件数不低于4000的快递员所占比例为60200故每月派送的快递件数在2000,3000的快递员所占比例为1−0.3×22故每月派送的快递件数在2000,3000的快递员人数为200×0.2=40人.故选:A.【变式4-2】(2023·全国·模拟预测)在日常生活中,许多现象都服从正态分布.若X∼Nμ,σ2,记p1=Pμ−σ<X<μ+σ,p2=Pμ−2σ<X<μ+2σ,pA.1−p12 B.1−p22【解题思路】根据正态分布的对称性即可得所求.【解答过程】由题意知,X∼N30,25,则μ=30,σ=5,∴μ−2σ=20,μ+2σ=40结合正态曲线的对称性可得PX>40故选:C.【变式4-3】(2023·吉林白山·模拟预测)近年来,网络消费新业态、新应用不断涌现,消费场景也随之加速拓展,某报社开展了网络交易消费者满意度调查,某县人口约为50万人,从该县随机选取5000人进行问卷调查,根据满意度得分分成以下5组:50,60、60,70、⋯、90,100,统计结果如图所示.由频率分布直方图可认为满意度得分X(单位:分)近似地服从正态分布Nμ,σ2,且Pμ−σ<X<μ+σ≈0.6826,Pμ−2σ<X<μ+2σ≈0.9544,Pμ−3σ<X<μ+3σ≈0.9974,其中μ近似为样本平均数,

A.由直方图可估计样本的平均数约为74.5B.由直方图可估计样本的中位数约为75C.由正态分布估计全县X≥98.5的人数约为2.3万人D.由正态分布估计全县62.5≤X<98.5的人数约为40.9万人【解题思路】由频率分布直方图所给数据可计算出样本的平均数与中位数,即可判断AB选项;由PX≥98.5=1−Pμ−2σ<X<μ+2σ2由此即可判断C选项;由P62.5≤X<98.5【解答过程】对于A选项,由直方图可估计样本的平均数为x=55×0.015+65×0.02+75×0.03+85×0.025+95×0.01×10=74.5对于B选项,满意度得分在50,70之间的频率为0.015+0.02×10=0.35<0.5满意度得分在50,80之间的频率为0.015+0.02+0.03×10=0.65>0.5设样本的中位数为m,则m∈70,80由中位数的定义可得0.35+m−70×0.03=0.5,解得m=75,对于C选项,因为μ=74.5,σ=12,98.5=μ+2σ,所以,PX≥98.5所以,由正态分布可估计全县X≥98.5的人数约为50×0.0228≈1.14万人,C错;对于D选项,因为62.5=μ−σ,98.5=μ+2σ,所以,P=P所以,由正态分布可估计全县62.5≤X<98.5的人数约为50×0.8185≈40.9万人,D对.故选:C.【题型5概率与其它知识的交汇问题】【例5】(2024·四川·模拟预测)甲、乙两医院到某医科大学实施“小小医生计划”,即通过对毕业生进行笔试,面试,模拟诊断这3项程序后直接签约一批毕业生,已知3项程序分别由3个部门独立依次考核,且互不影响,当3项程序全部通过即可签约.假设该校口腔医学系170名毕业生参加甲医院的“小小医生计划”的具体情况如下表(不存在通过3项程序考核后放弃签约的现象).性别参加考核但未能签约的人数参加考核并能签约的人数合计男生582785女生424385合计10070170(1)判断是否有95%(2)该校口腔医学系准备从专业成绩排名前5名的毕业生中随机挑选2人去参加乙医院的考核,求专业排名第一的小华同学被选中的概率.参考公式与临界值表:K2=np0.1000.0500.0250.010k2.7063.8415.0246.635【解题思路】(1)依据列联表中的数据代入K2(2)列出所有的基本事件,再由古典概型的概率公式即可求出结果.【解答过程】(1)因为K2所以有95%(2)分别记专业成绩排名前5名的毕业生依次为A,B,C,D,E,则从这5人中随机选取2人的基本事件有:A,B,其中选出的这2人中包含专业成绩排名第一的基本事件有A,B,故所求概率为P=【变式5-1】(2024·陕西商洛·模拟预测)随着科学技术飞速发展,科技创新型人才需求量增大,在2015年,国家开始大力推行科技特长生招生扶持政策,教育部也出台了《关于“十三五”期间全面深入推进教育信息化工作的指导意见(征求意见稿)》为选拔和培养科技创新型人才做好准备.某调研机构调查了A、B两个参加国内学科竞赛的中学,从未获得区前三名及以上名次获得区前三名及以上名次A中学116B中学349(1)试判断是否有90%(2)用分层抽样的方法,从样本中获得区前三名及以上名次的学生中抽取5人,再从这5人中任选3人进行深度调研,求所选的3人中恰有2人来自B中学的概率.附:K2=nP0.100.050.0250.010k2.7063.8415.0246.635【解题思路】(1)补全列联表,计算K2(2)利用古典概型求解.【解答过程】(1)补全2×2列联表如下:未获得区前三名及以上名次获得区前三名及以上名次总计A中学11617B中学34943总计451560所以K2故没有90%(2)由题知,用分层抽样抽取的5人中,来自A中学的有2人,记为a,b,来自B中学的有3人,记为A,B,C,从这5人中任选3人进行深度调研,所有的结果有abA,abB,abC,aAB,aAC,aBC,bAB,bAC,bBC,ABC,共10种,其中恰有2人来自B中学的结果有aAB,aAC,aBC,bAB,bAC,bBC,共6种,故所求概率P=6【变式5-2】(2024·贵州贵阳·一模)某学校为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明、小红分别进行了为期一周的封闭强化训练,下表记录了两人在封闭强化训练期间每天加工模具成功的次数,其中小明第7天的成功次数a忘了记录,但知道36≤a≤55,a∈Z(yi,zi分别表示小明、小红第第一天第二天第三天第四天第五天第六天第七天序号x1234567小明成功次数y162020253036a小红成功次数z16222526323535(1)求这7天内小明成功的总次数不少于小红成功的总次数的概率;(2)根据小明这7天内前6天的成功次数,求其成功次数y关于序号x的线性回归方程,并估计小明第七天成功次数a的值.参考公式:回归方程y=b=i=1n参考数据:1×16+2×20+3×20+4×25+5×30+6×36=582;12【解题思路】(1)根据古典概型的概率公式计算可得;(2)先利用最小二乘法求出回归方程,再令x=7即可得解.【解答过程】(1)因为36≤a≤55,且a∈Z,所以a的取值共有55−36+1=20yi、zi分别表示小明、小红第又当小明成功的总次数不少于小红成功的总次数时,在i=16即16+20+20+25+30+36+a≥16+22+25+26+32+35+35,得a≥44,又36≤a≤55,所以44≤a≤55,且a∈Z所以小明成功的总次数不少于小红成功的总次数时,a的取值共有55−44+1=12情况,所以这7天内小明成功的总次数不少于小红成功的总次数的概率为1220(2)由题设可知i=16x=1+2+3+4+5+66所以b=582−6×7所以y关于序号x的线性回旧方程为y=当x=7时,y=估计小明第7天成功次数a的值为38.【变式5-3】(2024·四川泸州·二模)某校为了让学生有一个良好的学习环境,特制定学生满意度调查表,调查表分值满分为100分.工作人员从中随机抽取了100份调查表将其分值作为样本进行统计,作出频率分布直方图如图.(1)估计此次满意度调查所得的平均分值x(同一组中的数据用该组区间的中点值为代表);(2)在选取的100位学生中,男女生人数相同,规定分值在(1)中的x以上为满意,低于x为不满意,据统计有32位男生满意.据此判断是否有95%(3)在(2)的条件下,学校从满意度分值低于x分的学生中抽取部分进行座谈,先用分层抽样的方式选出8位学生,再从中随机抽取2人,求恰好抽到男女生各一人的概率.附:K2=nP(0.100.050.0100.0050.001K2.7063.8416.6357.87910.828【解题思路】(1)利用频率分布直方图平均数的求法求解即可;(2)利用(1)的结论及给定信息得到2×2列联表,再计算K2(3)求出8位业主中男女人数,利用列举法及古典概率公式即可得解.【解答过程】(1)根据频率分布直方图知,x=(45×0.012+55×0.016+65×0.020+75×0.024+85×0.018+95×0.010)×10=70所以此次满意度调查中物业所得的平均分值为70分.(2)由(1)及已知得2×2列联表如下:不满意满意总计男183250女302050总计4852100则K2的观测值为:K所以有95%(3)由(2)知满意度分值低于70分的业主有48位,其中男士18位,女士30位,用分层抽样方式抽取8位业主,其中男士3位,女士5位,记男士为a,b,c,记女士为1,2,3,4,5,从中随机抽取两位为监督员事件为:ab,ac,a1,a2,a3,a4,a5,bc,b1,b2,b3,b4,b5,c1,c2,c3,c4,c5,12,13,14,15,23,24,25,34,35,45,共计28个基本事件,其中抽到男女各一人有a1,a2,a3,a4,a5,b1,b2,b3,b4,b5,c1,c2,c3,c4,c5,共15个基本事件,所以恰好抽到男女各一人为监督员的概率为P=15【题型6期望与方差的实际应用】【例6】(2024·北京延庆·一模)第十四届全国冬季运动会雪橇项目比赛于2023年12月16日至17日在北京延庆举行,赛程时间安排如下表:12月16日星期六9:30单人雪橇第1轮10:30单人雪橇第2轮15:30双人雪橇第1轮16:30双人雪橇第2轮12月17日星期日9:30单人雪橇第3轮10:30单人雪橇第4轮15:30团体接力(1)若小明在每天各随机观看一场比赛,求他恰好看到单人雪橇和双人雪橇的概率;(2)若小明在这两天的所有比赛中随机观看三场,记X为看到双人雪橇的次数,求X的分布列及期望E(X);(3)若小明在每天各随机观看一场比赛,用“ξ1=1”表示小明在周六看到单人雪橇,“ξ1=0”表示小明在周六没看到单人雪橇,“ξ2=1”表示小明在周日看到单人雪橇,“【解题思路】(1)根据分类乘法计数原理及古典概型求解;(2)根据题意求出概率,列出分布列,求出期望即可;(3)分别计算Dξ【解答过程】(1)记“小明在每天各随机观看一场比赛,恰好看到单人雪橇和双人雪橇”为事件A.

由表可知,每天随机观看一场比赛,共有4×3=12种不同方法,其中恰好看到单人雪橇和双人雪橇,共有2×2=4种不同方法.所以P(A)=4(2)随机变量X的所有可能取值为0,1,2.根据题意,P(X=0)=CPX=1PX=2随机变量X的分布列是:X012P241数学期望EX(3)由题意,Pξ1=0所以Eξ1=0×因为Pξ2=0所以Eξ2=0×所以Dξ【变式6-1】(2023·北京东城·二模)某数学学习小组的7名学生在一次考试后调整了学习方法,一段时间后又参加了第二次考试.两次考试的成绩如下表所示(满分100分):学生1学生2学生3学生4学生5学生6学生7第一次82897892926581第二次83907595936176(1)从数学学习小组7名学生中随机选取1名,求该名学生第二次考试成绩高于第一次考试成绩的概率;(2)设xi(i=1,2,⋯,7)表示第i名学生第二次考试成绩与第一次考试成绩的差.从数学学习小组7名学生中随机选取2名,得到数据xi,xj(i)求X的分布列和数学期望EX(ii)设随机变量X,Y的的方差分别为DX,DY,试比较DX【解题思路】(1)利用古典概型直接计算即可;(2)(i)列出变量X的取值,分别求出对应的概率,列出分布列,利用公式直接求解数学期望即可;(ii)计算方差,利用方差的含义直接判断即可.【解答过程】(1)根据表中数据,可知这7名学生中有4名学生的第二次考试成绩高于第一次考试成绩,分别是学生1,学生2,学生4,学生5,则从数学学习小组7名学生中随机选取1名,该名学生第二次考试成绩高于第一次考试成绩的概率为4(2)(i)随机变量X可能的取值为0,1,2.这7名学生第二次考试成绩与第一次考试成绩的差分别为1,1,−3,3,1,−4,−5.X=0时,若xi−xj=0,有(1,1)若xi−xj=1若xi−xj=2,有(1,3),(1,3)故PX=0X=1时,若xi−xj=4,有(1,−3)若xi−xj=5,有(1,−4)故PX=1X=2时,若xi−xj=6,有(1,−5),(1,−5)若xi−x若xi−x故PX=2则随机变量X的分布列为:X012P322所以X的数学期望E(X)=0×3(ii)由(i)知DX这7名学生第二次考试成绩与第一次考试成绩的差分别为1,1,−3,3,1,−4,−5.随机变量Y可能的取值为0,1,2,3.Y=0时,若xi−xj=0,有(1,1)若xi−xj=1故PY=0Y=1时,若xi−xj=2,有(1,3),(1,3)故PY=1Y=2时,若xi−xj=4,有(1,−3)若xi−xj=5,有(1,−4)故PY=2Y=3时,若xi−xj=6,有(1,−5),(1,−5)若xi−x若xi−x故PY=3则随机变量Y的分布列为:Y0123P5422所以Y的数学期望E(Y)=0×5所以DY因为3449<1<11886【变式6-2】(2023·山东泰安·一模)某公司为活跃气氛提升士气,年终拟通过抓阄兑奖的方式对所有员工进行奖励.规定:每位员工从一个装有4个标有面值的阄的袋中一次性随机摸出2个阄,阄上所标的面值之和为该员工获得的奖励金额.(1)若袋中所装的4个阄中有1个所标的面值为800元,其余3个均为200元,求①员工所获得的奖励为1000元的概率;②员工所获得的奖励额的分布列及数学期望;(2)公司对奖励额的预算是人均1000元,并规定袋中的4个阄只能由标有面值200元和800元的两种阄或标有面值400元和600元的两种阄组成.为了使员工得到的奖励总额尽可能符合公司的预算且每位员工所获得的奖励额相对均衡,请对袋中的4个阄的面值给出一个合适的设计,并说明理由.【解题思路】(1)①根据古典概型公式计算即可;②写出随机变量的所有可能取值,求出对应概率,即可得分布列,再根据期望公式计算期望即可;(2)先根据题意可确定方案(800,800,200,200)和方案(400,400,600,600),分别求出两种方案的期望与方差,比较两者即可得出结论.【解答过程】(1)设员工所获得的奖励额为X,①PX=1000∴员工所获得的奖励额为1000元的概率为12②X所有可能的取值为400,1000,PX=400=C∴X的分布列为X4001000P11∴员工所获得的奖励额的期望为EX(2)根据公司预算,每个员工的平均奖励额为1000元,所以先寻找期望为1000元的可能方案,对于面值由800元和200元组成的情况,如果选择(200,200,200,800)的方案,因为1000元是面值之和的最大值,所以期望不可能为1000元,如果选择(800,800,800,200)的方案,因为1000元是面值之和的最小值,所以期望不可能为1000元,因此可能的方案是(800,800,200,200)记为方案1,对于面值600元和400元的情况,同理排除(600,600,600,400)和(400,400,400,600)的方案,所以可能的方案是(400,400,600,600)记为方案2,对于方案1,设员工所获得的奖励额为X1,X1可取PX=400=C22∴X1的期望为E方差DX对于方案2,设员工所获得的奖励额为X2,X1可取PX=800=C22∴X2的期望为E方差DX由于两种方案的奖励额都符合预算要求,但方案2的方差比方案1小,所以应选择方案2.【变式6-3】(2023·北京石景山·一模)某高校“植物营养学专业”学生将鸡冠花的株高增量作为研究对象,观察长效肥和缓释肥对农作物影响情况.其中长效肥、缓释肥、未施肥三种处理下的鸡冠花分别对应1,2,3三组.观察一段时间后,分别从1,2,3三组随机抽取40株鸡冠花作为样本,得到相应的株高增量数据整理如下表.株高增量(单位:厘米)4,77,1010,1313,16第1组鸡冠花株数92092第2组鸡冠花株数416164第3组鸡冠花株数1312132假设用频率估计概率,且所有鸡冠花生长情况相互独立.(1)从第1组所有鸡冠花中随机选取1株,估计株高增量为7,10厘米的概率;(2)分别从第1组,第2组,第3组的所有鸡冠花中各随机选取1株,记这3株鸡冠花中恰有X株的株高增量为7,10厘米,求X的分布列和数学期望EX;(3)用“ξk=1”表示第k组鸡冠花的株高增量为4,10,“ξk=0”表示第k组鸡冠花的株高增量为10,16厘米,k=1,2,3,直接写出方差Dξ【解题思路】(1)根据表格数据,第1组所有鸡冠花中随机选取1株,得7,10厘米的总数,由古典概型概率公式可得结果;(2)首先估计各组鸡冠花增量为7,10厘米的概率,然后可确定X所有可能的取值,根据独立事件概率公式可求得每个取值对应的概率,由此可得分布列;根据数学期望计算公式可求得期望;(3)由两点分布方差计算公式可求得Dξ1,Dξ【解答过程】(1)设事件A为“从第1组所有鸡冠花中随机选取1株,株高增量为7,10厘米”,根据题中数据,第1组所有鸡冠花中,有20株鸡冠花增量为7,10厘米,所以PA估计为20(2)设事件B为“从第2组所有鸡冠花中随机选取1株,株高增量为7,10厘米”,设事件C为“从第3组所有鸡冠花中随机选取1株,株高增量为7,10厘米”,根据题中数据,PB估计为1640=25根据题意,随机变量X的所有可能取值为0,1,2.3,且PX=0PX=1PX=2PX=3则X的分布列为:X0123P2111293所以EX=0×21(3)D理由如下:Pξ1=1Pξ2=1Pξ3=1所以Dξ【题型7统计图表问题】【例7】(2024·湖南·模拟预测)已知由小到大排列的4个数据1、3、5、a,若这4个数据的极差是它们中位数的2倍,则这4个数据的第75百分位数是(

)A.7 B.6 C.5 D.4【解题思路】根据极差和中位数概念得到关于a的方程,再利用百分位数的概念即可.【解答过程】由小到大排列的4个数据1、3、5、a,则a≥5,这四个数为极差为a−1,中位数为3+52因为这4个数据极差是它们中位数的2倍,则a−1=2×4,解得a=9,所以,这四个数由小到大依次为1、3、5、9,因为4×0.75=3,故这4个数据的第75百分位数是5+92故选:A.【变式7-1】(2024·辽宁·一模)下图是2022年5月一2023年5月共13个月我国纯电动汽车月度销量及增长情况统计图(单位:万辆),则下列说法错误的是(

)(注:同比:和上一年同期相比)

A.2023年前5个月我国纯电动汽车的销量超过214万辆B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆C.这13个月我国纯电动汽车月度销量的众数为52.2万辆D.和上一年同期相比,我国纯电动汽车月度销量有增有减【解题思路】根据统计图表数据一一分析即可.【解答过程】2023年前5个月我国纯电动汽车的销量为28.7+37.6+49+47.1+52.2=214.6万辆,即2023年前5个月我国纯电动汽车的销量超过214万辆,故A正确;将这13个月纯电动汽车的月度销量由小到大依次排列为28.7,34.7,37.6,45.7,47.1,47.6,49,52.2,52.2,53.9,54.1,61.5,62.4,则中位数为其中第7个数据,即49万辆,故B错误;这些数据中只有52.2出现2次,其他数据均只出现1次,故众数为52.2万辆,故C正确;2023年1月的同比增长率为负数,其它月份的同比增长率为正数,故和上一年同期相比,我国纯电动汽车月度销量有增有减,故D正确.故选:B.【变式7-2】(2024·重庆·一模)2023年10月31日,神舟十六号载人飞船返回舱在东风着陆场成功着陆,激发了学生对航天的热爱.某校组织高中学生参加航天知识竞赛,现从中随机抽取100名学生成绩的频率分布直方图如图所示,设这组样本数据的75%分位数为x,众数为y,则(

A.x=88,y=90 B.x=83,y=90C.x=83,y=85 D.x=88,y=85【解题思路】首先a=0.05,再根据百分位数和众数的计算方法即可.【解答过程】由题意得0.005+0.03+a+0.015×10=1,解得a=0.05因为0.05+0.3=0.35,0.05+0.3+0.5=0.85,则0.35<0.75<0.85,则样本数据的75%分位数位于80,90,则0.35+x−80×0.05=0.75,解得因为样本数据中位于成绩80,90之间最多,则众数为y=80+90故选:D.【变式7-3】(2024·四川攀枝花·二模)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔FlorenceNightingale设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法错误的是(

)A.2015年至2022年,知识付费用户数量逐年增加B.2015年至2022年,知识付费用户数量逐年增加量2018年最多C.2015年至2022年,知识付费用户数量的逐年增加量逐年递增D.2022年知识付费用户数量超过2015年知识付费用户数量的10倍【解题思路】利用题中所给的南丁格尔玫瑰图逐一考查所给选项,即可得解.【解答过程】对于A,由图可知,2015年至2022年,知识付费用户数量逐年增加,故A说法正确;对于B和C,知识付费用户数量的逐年增加量分别为:2016年,0.96−0.48=0.48;2017年,1.88−0.96=0.92;2018年,2.95−1.88=1.07;2019年,3.56−2.95=0.61;2020年,4.15−3.56=0.59;2021年,4.77−4.15=0.62;2022年,5.27−4.77=0.5;则知识付费用户数量逐年增加量2018年最多,知识付费用户数量的逐年增加量不是逐年递增,故B说法正确,C说法错误;对于D,由5.27>10×0.48,则2022年知识付费用户数量超过2015年知识付费用户数量的10倍,故D说法正确.综上,说法错误的选项为C.故选:C.【题型8回归分析】【例8】(2024·湖北武汉·模拟预测)随着科技发展的日新月异,人工智能融入了各个行业,促进了社会的快速发展.其中利用人工智能生成的虚拟角色因为拥有更低的人工成本,正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货销售金额得到逐步提升,以下为该公司自2023年8月使用虚拟角色直播带货后的销售金额情况统计.年月2023年8月2023年9月2023年10月2023年11月2023年12月2024年1月月份编号x123456销售金额y/万元15.425.435.485.4155.4195.4若y与x的相关关系拟用线性回归模型表示,回答如下问题:(1)试求变量y与x的样本相关系数r(结果精确到0.01);(2)试求y关于x的经验回归方程,并据此预测2024年2月份该公司的销售金额.附:经验回归方程y=bx+a,其中样本相关系数r=i=1参考数据:i=16xi【解题思路】(1)由题意根据参考公式线分别算得x,y以及(2)根据(1)中的数据以及参数数据依次算得b,【解答过程】(1)x=i=16所以r=i=1(2)由题意b=所以a=85.4−所以y关于x的经验回归方程为y=38.3x−48.7,所以预测2024年2月份该公司的销售金额为y=38.3×7−48.7=219.4万元.【变式8-1】(2024·四川巴中·一模)下图是某市2016年至2022年生活垃圾无害化处理量y(单位:万吨)与年份t的散点图.(1)根据散点图推断变量y与t是否线性相关,并用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2024年该市生活垃圾无害化处理量.参考数据:i=17yi=9.06,i=17参考公式:b=i=1nti【解题思路】(1)求出t以及相关数据,根据相关系数公式求出相关系数,即可得结论;(2)根据最小二乘法的估计公式,求得b,【解答过程】(1)根据散点图推断变量y与t线性相关,说明如下:由题意得t=i=17i=17故r=3.09由y与t的相关系数约为0.97表明,y与t线性相关,相关程度相当高;(2)由y=9.067则a=故y关于t的回归方程为y=0.85+0.11t将2024年对应的年份代码t=9代入回归方程得y故预测2024年该市生活垃圾无害化处理量约为1.84万吨.【变式8-2】(2024·全国·模拟预测)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为重庆市20142022年全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具有线性相关关系.(数据来源于重庆市统计局2023-05-06发布).年份201420152016201720182019202020212022全体居民人均可支配收入(元)183522011022034241532638628920308243380335666参考数据:i=19y参考公式:对于一组数据u1,v1,u2(1)设年份编号为x(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为y(单位:万元),求经验回归方程y=(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从2014∼2022中任取3年的数据进行分析,将选出的人均可支配收入超过3万的年数记为X,求随机变量X的分布列与数学期望.【解题思路】(1)利用最小二乘法计算回归方程,并计算预测值即可;(2)利用离散型随机变量的分布列及数学期望公式计算即可.【解答过程】(1)由题意得x=i=19i=19故b=故回归方程为y=0.22x+1.57又2023年的年份编号为10,将x=10代入y=0.22x+1.57得y=3.77(2)由图表知,人均可支配收入超过3万的年份有3年,故X的可能取值为0,1,2,3,则PX=0=CPX=2=C故随机变量X的分布列为:X0123P2045181故EX【变式8-3】(2024·全国·模拟预测)区块链技术被认为是继蒸汽机、电力、互联网之后的下一代颠覆性的核心技术.区块链作为“信任的机器”,将可能彻底改变整个人类社会价值传递的方式.2018年至2022年五年期间,中国的区块链企业数量逐年增长,居世界前列.现收集我国近5年区块链企业总数量相关数据,如表:年份20182019202020212022编号x12345企业总数量y(单位:千个)2.1563.7278.30524.27936.224(1)根据表中数据判断,y=a+bx与y=cedx(其中(2)根据(1)的结果,求y关于x的回归方程.(结果精确到小数点后第三位)(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛,比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为13,甲胜丙的概率为35,乙胜丙的概率为附:线性回归方程y=bx+参考数据:z=【解题思路】(1)根据数据的增长速度逐渐加快得到答案.(2)变换得到lny=lnc+dx(3)考虑A:甲与乙;B:甲与丙;C:丙与乙三种比赛情况,分别计算概率,再比较大小得到答案.【解答过程】(1)根据题表中数据可知区块链企业数量增加的速度逐渐变快,所以回归方程y=ce(2)对y=cedx两边取自然对数,得lny=lnc+dxi=15所以b=a=所以z关于x的回归直线方程为z=0.752x−0.060则y关于x的回归方程为y=(3)对于首场比赛的选择有以下三种情况:A:甲与乙;B:甲与丙;C:丙与乙.由于在每场比赛中,甲胜乙的概率为13,甲胜丙的概率为35,乙胜丙的概率为则甲公司获胜的概率分别是:PAPBPC因为925所以甲与丙两公司进行首场比赛时,甲公司获得“优胜公司”的概率最大.【题型9独立性检验】【例9】(2024·陕西安康·模拟预测)作为一个基于大型语言处理模型的文字聊天工具,ChatGPT走红后,大模型的热度持续不减,并日渐形成了“千模大战”的局面.百度的文心一言、阿里的通义千问、华为的盘古、腾讯的混元以及科大讯飞的星火等多种大模型正如火如茶的发布上线.现有某大模型给出了会员有效期30天的两种不同费用,100次的使用费为6元,500次的使用费为24元.后台调取了购买会员的200名用户基本信息,包括个人和公司两种用户,统计发现购买24元的用户数是140,其中个人用户数比公司用户数少20,购买6元的公司用户数是个人用户数的一半.(1)完成如下用户类别与购买意向的2×2列联表;购买6元购买24元总计个人用户公司用户总计(2)能否有99.5%附:K2临界值表如下:P0.100.050.0250.010.0050.001k2.7063.8415.0246.6357.87910.828【解题思路】(1)设购买24元的个人用户数为x,购买6元的公司用户数为y,列出方程求得x,y的值,即可得到2×2列联表;(2)由(1)中2×2列联表,利用公式求得K2【解答过程】(1)解:设购买24元的个人用户数为x,则购买24元的公司用户数为x+20,设购买6元的公司用户数为y,则购买6元的个人用户数为2y,则有2x+20=140y+2y=60,解得x=60,y=20所以用户类别与购买意向2×2列联表如下:购买6元购买24元总计个人用户4060100公司用户2080100总计60140200(2)解:由(1)中2×2列联表,可得K2所以有99.5%【变式9-1】(2024·陕西商洛·模拟预测)已知某校高一有600名学生(其中男生320名,女生280名).为了给学生提供更为丰富的校园文化生活,学校增设了两门全新的校本课程A,B,学生根据自己的兴趣爱好在这两门课程中任选一门进行学习.学校统计了学生的选课情况,得到如下的2×2列联表.选择课程A选择课程B总计男生200女生60总计(1)请将2×2列联表补充完整,并判断是否有99.9%(2)在所有男生中按列联表中的选课情况采用分层抽样的方法抽出8名男生,再从这8名男生中抽取3人做问卷调查,设这3人中选择课程A的人数为X,求X的分布列及数学期望.附:K2P0.010.0050.001k6.6357.87910.828【解题思路】(1)根据题意,得出2×2的列联表,利用公式求得K2(2)根据题意,得到选择课程A的人数为3人,选择课程B的人数为5人,得到X的所有可能取值,求得相应的概率,列出分布列,利用期望的公式,即可求解.【解答过程】(1)解:由男生320名,女生280名,结合表中数据,2×2列联表,如图所示,选择课程A选择课程B总计男生120200320女生60220280总计180420600可得K2所以有99.9%(2)解:抽出8名男生中,选择课程A的人数为:8×120选择课程B的人数为:8×200随机变量X的所有可能取值为0,1,2,3,可得PX=0PX=2则X的分布列为X0123P515151所以EX【变式9-2】(2024·山东淄博·一模)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.

年龄次数[20,30)[30,40)[40,50)[50,60]每周0~2次70553659每周3~4次25404431每周5次及以上552010(1)若把年龄在[20,40)的锻炼者称为青年,年龄在[40,60]的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值α=0.01的独立性检验判断体育锻炼频率的高低与年龄是否有关联;(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在[30,40)与[50,60]的人数分别为X,Y,ξ=X−Y,求ξ(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为13参考公式:χ附:α0.100.050.010.0050.001x2.7063.8416.6357.87910.828【解题思路】(1)求出卡方值并与临界值比较即可得到结论;(2)根据步骤列出分布列,利用数学期望公式即可得到答案;(3)利用全概率公式即可得到答案.【解答过程】(1)零假设:H0由题得2×2列联表如下:青年中年合计体育锻炼频率低12595220体育锻炼频率高75105180合计200200400χ2根据小概率值α=0.01的独立性检验推断H0即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于0.01.(2)由数表知,利用分层抽样的方法抽取的8人中,年龄在[30,40),[50,60]内的人数分别为1,2,依题意,ξ的所有可能取值分别为为0,1,2,所以P(ξ=0)=P(X=0,Y=0)+P(X=1,Y=1)=CP(ξ=1)=P(X=0,Y=1)+P(X=1,Y=0)+P(X=1,Y=2)=CP(ξ=2)=P(X=0,Y=2)=C所以ξ的分布列::ξ012P20315所以ξ的数学期望为E(ξ)=0×20(3)记小明在某一周星期六选择跑步、篮球、羽毛球,分别为事件A,B,C,星期天选择跑步为事件D,则P(A)=1P(D∣A)=1所以P(D)=P(A)P(D∣A)+P(B)P(D∣B)+P(C)P(D∣C)=所以小明星期天选择跑步的概率为715【变式9-3】(2024·陕西西安·一模)第18届亚洲杯将于2024年1月12日在卡塔尔举行,该比赛预计会吸引亿万球迷观看.为了了解某校大学生喜爱观看足球比赛是否与性别有关,该大学记者站随机抽取了100名学生进行统计,其中女生喜爱观看足球比赛的占女生人数的14,男生有10(1)完成下面2×2列联表,试根据独立性检验,判断是否有99.90男女合计喜爱看足球比赛不喜爱看足球比赛合计60(2)在不喜爱观看足球比赛的观众中,按性别用分层随机抽样的方式抽取8人,再从这8人中随机抽取2人参加校记者站的访谈节目,求抽到的男生人数为1人的概率.附:K2=nP0.0500.0100.001k3.8416.63510.828【解题思路】(1)根据题意计算即可完善列联表,代入公式计算可得χ2(2)结合分层抽样的定义求出男生2人,女生6人,然后列举所有的基本事件及所求事件包含的基本事件,利用古典概型概率公式求解即可.【解答过程】(1)根据表格数据可知抽取的女生共40人,喜欢观看足球比赛的女生为40×1可得得2×2列联表如下:男女合计喜爱看足球比赛501060不喜爱看足球比赛103040合计6040100根据列联表中的数据计算得χ2所以有99.90(2)按照分层随机抽样的方式抽取8人,根据抽样比可知其中男生2人,女生6人,记男生为a,b,女生为1,2,3,4,5,6,从8人中抽2人,所以可能结果如下:(a,b),(a,1),(a,2),(a,3),(a,4),(a,5),(a,6),(b,1),(b,2),(b,3),(b,4),(b,5),(b,6),(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共28种结果,设事件A表示“抽到男生人数为1人”,共12种结果,故P(A)=12【题型10决策型问题】【例10】(2024·江西南昌·一模)甲公司现有资金200万元,考虑一项投资计划,假定影响投资收益的唯一因素是投资期间的经济形势,若投资期间经济形势好,投资有25%的收益率,若投资期间经济形势不好,投资有10%的损益率;如果不执行该投资计划,损失为1万元.现有两个方案,方案一:执行投资计划;方案二:聘请投资咨询公司乙分析投资期间的经济形势,聘请费用为5000元,若投资咨询公司乙预测投资期间经济形势好,则执行投资计划;若投资咨询公司乙预测投资期间经济形势不好,则不执行该计划.根据以往的资料表明,投资咨询公司乙预测不一定正确,投资期间经济形势好,咨询公司乙预测经济形势好的概率是0.8;投资期间经济形势不好,咨询公司乙预测经济形势不好的概率是0.7.假设根据权威资料可以确定,投资期间经济形势好的概率是40%(1)求投资咨询公司乙预测投资期间经济形势好的概率;(2)根据获得利润的期望值的大小,甲公司应该执行哪个方案?说明理由.【解题思路】(1)由全概率公式即可得解;(2)方案一服从两点分布,由此求出对应的概率可得期望;方案二有三种情况,分别算出相应的概率,结合期望公式算出期望,比较两个期望的大小即可得解.【解答过程】(1)记投资期间经济形势好为事件B1,投资期间经济形势不好为事件B投资咨询公司预测投资期间经济形势好为事件A,则PB因此PA(2)若采取方案一,则该公司获得的利润值X万元的分布列是X50−20P0.40.6E(X)=50×0.4−20×0.6=8万元;若采取方案二:设该公司获得的利润值为Y万元,有以下情况,投资期间经济形势好,咨询公司乙预测经济形势为好,Y=49.5,其发生的概率为:PB投资期间经济形势好,咨询公司乙预测经济形势为不好,Y=−1.5,其发生的概率为:PB投资期间经济形势不好,咨询公司乙预测经济形势为好,Y=−20.5,其发生的概率为:PB投资期间经济形势不好,咨询公司乙预测经济形势为不好,Y=−1.5,其发生的概率为:PB因此,随机变量Y的分布列为:Y−20.5−1.549.5P0.180.50.32因此,E(Y)=−20.5×0.18−1.5×0.5+49.5×0.32=−3.69−0.75+15.84=11.4万元,因为E(X)<E(Y),所以甲公司应该选择方案二.【变式10-1】(2024·陕西西安·一模)某班组织投篮比赛,比赛分为A,B两个项目.比赛规则是:①选手在每个项目中投篮5次,每个项目投中3次及以上为合格;②第一个项目投完5次并且合格后才可以进入下一个项目,否则该选手结束比赛;③选手进入第二个项目后,投篮5次,无论投中与否均结束比赛.已知选手甲在A项目比赛中每次投中的概率都是0.5.(1)求选手甲参加A项目合格的概率;(2)已知选手甲参加B项目合格的概率为0.6.比赛规定每个项目合格得5分,不合格得0分.设累计得分为X,为使累计得分X的期望最大,选手甲应选择先进行哪个项目的比赛(每个项目合格的概率与次序无关)?请说明理由.【解题思路】(1)由题意选手甲需要在5次投篮中投中3,4或5次及格,再求解概率和即可;(2)分别分析先进行A项目和B项目的得分数学期望,再判断即可.【解答过程】(1)由题意选手甲需要在5次投篮中投中3,4或5次,每次中与不中的概率均为0.5,故合格的概率为C5(2)选手甲应选择先进行B项目,理由如下:由题意,若选手甲先参加A项目,则X的所有可能取值为0,5,10,则PX=0=1−0.5=0.5,PX=5所以累计得分X的期望EX若选手甲先参加B项目,则X的所有可能取值为0,5,10,则PX=0=1−0.6=0.4,PX=5所以累计得分X的期望EX所以为使累计得分的期望最大,选手甲选择先进行B项目比赛.【变式10-2】(2023·山东济宁·三模)某学校组织“学习党的二十大”知识竞赛,某班要从甲、乙两名同学中选出一人参赛,选拔方案如下:甲、乙两名同学各自从给定的5个问题中随机抽取3个问题作答,在这5个问题中,已知甲能正确作答其中3个,乙能正确作答每个问题的概率都是35,甲、乙两名同学作答问题相互独立.记甲答对题的个数为X,乙答对题的个数为Y(1)求甲、乙恰好答对2个问题的概率;(2)若让你投票选择一名发挥较稳定的同学参赛,你会选择哪名同学?请说明理由.【解题思路】(1)根据相互独立事件及互斥事件的概率公式计算可得;(2)由已知得X所有可能的取值为1,2,3,求出所对应的概率,即可得到分布列,从而求出EX,DX,在由Y~B3,35【解答过程】(1)设“甲、乙恰好答对2个问题的概率”为事件A,则P(A)=P(X=1)⋅P(Y=1)+P(X=2)⋅P(Y=0)==3(2)由已知得X所有可能的取值为1,2,3,所以P(X=1)=C31⋅C所以X的分布列为X123P331所以E(X)=1×3D(X)=1−由已知得Y~B3,35,所以E(Y)=3×因为EX=EY所以选择甲同学参赛.【变式10-3】(2023·上海闵行·二模)随着五一黄金周的到来,各大旅游景点热闹非凡,为了解A、B两个旅游景点游客的满意度,某研究性学习小组采用随机抽样的方法,获得关于A旅游景点的问卷100份,关于B旅游景点的问卷80份.问卷中,对景点的满意度等级为:非常满意、满意、一般、差评,对应分数分别为:4分、3分、2分、1分,数据统计如下:非常满意满意一般差评A景点5030515B景点353078假设用频率估计概率,且游客对A,B两个旅游景点的满意度评价相互独立.(1)从所有(人数足够多)在A旅游景点的游客中随机抽取2人,从所有(人数足够多)在B旅游景点的游客中随机抽取2人,估计这4人中恰有2人给出“非常满意”的概率;(2)根据上述数据,你若旅游,你会选择A、B哪个旅游景点?说明理由.【解题思路】(1)求出游客在A,B景点给出“非常满意”评价的概率,再利用互斥事件、独立重复事件的概率公式计算作答.(2)列出游客对A,B景点评分的分布列,并求出期望和方差,再比较大小作答.【解答过程】(1)设“这4人中恰有2人给出“非常满意”的评价”为事件C,由表中数据可知,游客在A景点给出“非常满意”评价的概率为50100游客在B景点给出“非常满意”评价的概率为3580则P(C)=((2)设一位游客对A景点的满意度评分为X,一位游客对B景点的满意度评分为Y,由数表中数据得X的分布为:X1234P3131Y的分布为:Y1234P1737则E(X)=4×0.5+3×0.3+2×0.05+1×0.15=3.15,D(X)=0.85E(Y)=4×7D(Y)=0.85显然E(X)=E(Y),D(X)>D(Y),所以选择Y景点.【题型11独立性检验与统计图表的综合运用】【例11】(2023·陕西西安·模拟预测)某研究小组为研究经常锻炼与成绩好差的关系,从全市若干所学校中随机抽取100名学生进行调查.经调查,得到这100名学生近期考试的分数的频率分布直方图.记分数在600分以上的为优秀,其余为合格.

经常锻炼不经常锻炼合计合格25优秀10合计100(1)请完成2×2列联表.并判断是否有99%的把握认为成绩优秀与体育锻炼有关;(2)现采取分层抽样的方法,从这100人中抽取10人,再从这10人中随机抽取5人进行进一步调查,记抽到5人中优秀的人数为X,求X的分布列.附:χ2=n【解题思路】(1)根据频率分布直方图计算出分数优秀的人数,继而完成2×2列联表,计算出χ2(2)由分层抽样法得到抽取的10人中的合格、优秀人数,从而确定从这10人中随机抽取5人中的优秀人数X的可能值,运用超几何分布概率公式计算即得X的分布列.【解答过程】(1)依题意,从全市若干所学校中随机抽取100名学生进行调查,由频率分布直方图知,分数在600分以上优秀的有100×(0.0125+0.0025)×20=30人,故经常锻炼且成绩优秀的有30−10=20人,由表知经常锻炼的共有45人.根据题意,可得到2×2列联表为:经常锻炼不经常锻炼合计合格254570优秀201030合计4555100由上表数据,可得χ2所以有99%的把握认为成绩优秀与是否经常体育锻炼有关.(2)根据频率分布直方图,可得大于600分的频率为0.0125+0.0025×20=0.3,小于600分的频率为1−0.3=0.7所以由分层抽样知,抽取的10人中合格有10×0.7=7人,优秀的为10×0.3=3人,则从这10人中随机抽取5人,优秀人数X服从超几何分布,由题意X的可能值为0,1,2,3.PX=0=C75C3所以随机变量X分布列为:X0123P1551【变式11-1】(2024·陕西西安·一模)体育强则中国强,体育承载着国家强盛、民族振兴的梦想.某学校从参加体育知识竞赛的学生中抽出200名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示,根据图形,回答下列问题.

(1)求m;(2)估计这次体育知识竞赛成绩的众数、平均数(同一组中的数据用该组区间的中点值为代表);(3)在抽出的200位学生中,若规定分数不低于80分的学生为获奖学生,已知这200名学生中男生与女生人数相同,男生中有20人获奖,请补充2×2列联表,并判断是否有99%的把握认为“体育知识竞赛是否获奖与性别有关”男生女生合计获奖20未获奖合计附:K2=nP0.050.0100.0050.001k3.8416.6357.87910.828【解题思路】(1)利用频率分布直方图的性质求参数即可.

(2)利用中位数,众数的求解公式计算即可.(3)列出列联表。求卡方判断即可.【解答过程】(1)m+0.015+0.025+0.035+m+0.005×10=1,所以m=0.01故m值为0.01.(2)平均数为:45×0.1+55×0.15+65×0.25+75×0.35+85×0.1+95×0.05=68.5易知众数为:75(3)列联表如下:男生女生合计获奖201030未获奖8090170合计100100200K2所以没有99%的把提认为“体育知识竞赛是否获奖与性别有关”.【变式11-2】(2024·陕西宝鸡·一模)随着计算机时代的迅速发展,人工智能也渗透到生活的方方面面,如:线上缴费、指纹识别、动态导航等,给人们的生活带来极大的方便,提升了生活质量,为了了解市场需求,某品牌“扫地机器人”公司随机调查了1000人,记录其年龄与是否使用“扫地机器人”得到如下统计图表:(分区间[20,30),[30,40),……[60,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论