版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE第9讲离散型随机变量的均值、方差和正态分布[考纲解读]1.理解取有限个值的离散型随机变量的均值、方差的概念,并能依据分布列正确求出期望与方差,并能解决一些实际问题.(重点、难点)2.借助直方图相识正态分布曲线的特点及曲线所表示的意义,驾驭正态曲线的相关性质,并能进行正确求解.[考向预料]从近三年高考状况来看,本讲是高考中的热点题型.预料2024年将会考查:①与分布列相结合求期望与方差,通过设置亲密贴近现实生活的情景,考查概率思想的应用意识和创新意识;②正态分布的考查,尤其是正态总体在某一区间内的概率.题型为解答题中的一问,试题难度不会太大,属中档题型.1.离散型随机变量的均值与方差若离散型随机变量X的分布列为Xx1x2…xi…xnPp1p2…pi…pn(1)均值:称E(X)=eq\o(□,\s\up1(01))x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的eq\o(□,\s\up1(02))平均水平.(2)D(X)=eq\i\su(i=1,n,)(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的eq\o(□,\s\up1(03))平均偏离程度,其算术平方根eq\r(DX)为随机变量X的标准差.2.均值与方差的性质(1)E(aX+b)=eq\o(□,\s\up1(01))aE(X)+b;(2)D(aX+b)=eq\o(□,\s\up1(02))a2D(X)(a,b为常数).3.两点分布与二项分布的均值、方差XX听从两点分布X~B(n,p)E(X)eq\o(□,\s\up1(01))peq\o(□,\s\up1(02))npD(X)eq\o(□,\s\up1(03))p(1-p)eq\o(□,\s\up1(04))np(1-p)4.正态曲线(1)正态曲线的定义函数φμ,σ(x)=eq\f(1,\r(2π)σ)e-eq\f(x-μ2,2σ2),x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数,称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线(μ是正态分布的期望,σ是正态分布的标准差).(2)正态曲线的特点①曲线位于x轴上方,与x轴不相交;②曲线是单峰的,关于直线eq\o(□,\s\up1(01))x=μ对称;③曲线在eq\o(□,\s\up1(02))x=μ处达到峰值eq\f(1,σ\r(2π));④曲线与x轴之间的面积为1;⑤当σ肯定时,曲线的位置由μ确定,曲线随着μ的改变而沿x轴平移;⑥当μ肯定时,曲线的形态由σ确定,eq\o(□,\s\up1(03))σ越小,曲线越“高瘦”,表示总体的分布越集中;eq\o(□,\s\up1(04))σ越大,曲线越“矮胖”,表示总体的分布越分散.
5.正态分布(1)正态分布的定义及表示假如对于任何实数a,b(a<b),随机变量X满意P(a<X≤b)=eq\i\in(a,b,)φμ,σ(x)dx(即x=a,x=b,正态曲线及x轴围成的曲边梯形的面积),则称随机变量X听从正态分布,记作X~N(μ,σ2).(2)正态分布的三个常用数据①P(μ-σ<X≤μ+σ)=eq\o(□,\s\up1(01))0.6826;②P(μ-2σ<X≤μ+2σ)=eq\o(□,\s\up1(02))0.9544;③P(μ-3σ<X≤μ+3σ)=eq\o(□,\s\up1(03))0.9974.1.概念辨析(1)随机变量不行以是负数,随机变量所对应的概率可以是负数,随机变量的均值不行以是负数.()(2)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的期望,σ是正态分布的标准差.()(3)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小.()(4)一个随机变量假如是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就听从或近似听从正态分布.()答案(1)×(2)√(3)√(4)√2.小题热身(1)已知随机变量X的分布列如下,X-202Peq\f(1,3)eq\f(1,3)eq\f(1,3)则E(X)与D(X)的值分别为()A.0,2 B.0,eq\f(8,3)C.2,0 D.eq\f(8,3),0答案B解析E(X)=(-2)×eq\f(1,3)+0×eq\f(1,3)+2×eq\f(1,3)=0,D(X)=(-2-0)2×eq\f(1,3)+(0-0)2×eq\f(1,3)+(2-0)2×eq\f(1,3)=eq\f(8,3).(2)设ξ~B(n,p),若E(ξ)=15,D(ξ)=11.25,则n=()A.45 B.50C.55 D.60答案D解析由eq\b\lc\{\rc\(\a\vs4\al\co1(Eξ=np=15,,Dξ=np1-p=11.25,))解得eq\b\lc\{\rc\(\a\vs4\al\co1(p=0.25,,n=60.))(3)(2024·凉山州模拟)已知随机变量ξ,且ξ~N(μ,σ2),若P(-3<ξ<-1)=P(3<ξ<5),则μ=()A.4 B.2C.1 D.0答案C解析依题意,P(-3<ξ<-1)=P(3<ξ<5),又区间(-3,-1)和(3,5)关于x=1对称,结合正态分布的学问,关于x=μ对称的区域所对应的概率相等,所以μ=1.(4)已知X的分布列为,且Y=aX+3,E(Y)=eq\f(7,3),则a为()A.1 B.2C.3 D.4答案B解析先求出E(X)=(-1)×eq\f(1,2)+0×eq\f(1,3)+1×eq\f(1,6)=-eq\f(1,3).再由Y=aX+3,得E(Y)=aE(X)+3.∴eq\f(7,3)=aeq\b\lc\(\rc\)(\a\vs4\al\co1(-\f(1,3)))+3.解得a=2.题型一离散型随机变量的均值、方差角度1离散型随机变量均值与方差的计算问题1.不透亮袋子中装有大小、材质完全相同的2个红球和5个黑球,现从中逐个不放回地摸出小球,直到取出全部红球为止,则摸取次数X的数学期望是()A.eq\f(18,5) B.eq\f(9,2)C.eq\f(36,7) D.eq\f(16,3)答案D解析当x=k时,第k次取出的必定是红球,而前k-1次中,有且只有1次取出的是红球,其余次数取出的皆为黑球,故P(X=k)=eq\f(C\o\al(1,k-1),C\o\al(2,7))=eq\f(k-1,21),于是得到X的分布列如下.X234567Peq\f(1,21)eq\f(2,21)eq\f(1,7)eq\f(4,21)eq\f(5,21)eq\f(2,7)故E(X)=2×eq\f(1,21)+3×eq\f(2,21)+4×eq\f(1,7)+5×eq\f(4,21)+6×eq\f(5,21)+7×eq\f(2,7)=eq\f(16,3).2.(2024·济南模拟)已知离散型随机变量X的分布列如表所示,若E(X)=0,D(X)=1,则P(X<1)=________.X-1012Pabceq\f(1,12)答案eq\f(2,3)解析∵E(X)=0,D(X)=1,∴eq\b\lc\{\rc\(\a\vs4\al\co1(a+b+c+\f(1,12)=1,,-1×a+0×b+1×c+2×\f(1,12)=0,,-12×a+02×b+12×c+22×\f(1,12)=1,))又a,b,c∈[0,1],∴a=eq\f(5,12),b=eq\f(1,4),c=eq\f(1,4),P(X<1)=P(X=-1)+P(X=0)=eq\f(5,12)+eq\f(1,4)=eq\f(2,3).角度2二项分布的均值、方差问题3.(2024·南阳模拟)设随机变量X~B(2,p),随机变量Y~B(3,p),若P(X≥1)=eq\f(5,9),则D(3Y+1)=()A.2 B.3C.6 D.7答案C解析∵随机变量X~B(2,p),P(X≥1)=eq\f(5,9),∴P(X=0)=Ceq\o\al(0,2)(1-p)2=eq\f(4,9).∴p=eq\f(1,3),∴D(Y)=np(1-p)=3×eq\f(1,3)×eq\b\lc\(\rc\)(\a\vs4\al\co1(1-\f(1,3)))=eq\f(2,3),∴D(3Y+1)=9D(Y)=6.4.(2024·泉州模拟)2024年,依托用户碎片化时间的消遣需求、共享需求以及视频态的信息负载力,短视频快速崛起.与此同时,移动阅读方兴未艾,从侧面反映了人们对精神富足的一种追求,在习惯了大众消遣所带来的短暂愉悦后,部分用户照旧对有着传统文学底蕴的肃穆阅读青睐有加.某读书App抽样调查了非一线城市M和一线城市N各100名用户的日运用时长(单位:分),绘制成频率分布直方图如下,其中日运用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下2×2列联表,并推断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户不活跃用户总计城市M城市N总计(2)以频率估计概率,从城市M中任选2名用户,从城市N中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望;(3)该读书App还统计了2024年4个季度的用户运用时长y(单位:百万小时),发觉y与季度(x)线性相关,得到回来直线方程为eq\o(y,\s\up6(^))=4x+eq\o(a,\s\up6(^)).已知这4个季度的用户平均运用时长为12.3百万小时,试以此回来方程估计2024年第一季度(x=5)该读书App用户运用时长约为多少百万小时.附:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(K2≥k0)0.0250.0100.0050.001k05.0246.6357.87910.828解(1)由已知条件可得以下2×2列联表:活跃用户不活跃用户总计城市M6040100城市N8020100总计14060200因为K2=eq\f(200×60×20-80×402,100×100×140×60)=eq\f(200,21)≈9.524>7.879,所以有99.5%的把握认为用户是否活跃与所在城市有关.(2)由统计数据可知,城市M中活跃用户占eq\f(3,5),城市N中活跃用户占eq\f(4,5).设从城市M中任选的2名用户中活跃用户数为X,则X~Beq\b\lc\(\rc\)(\a\vs4\al\co1(2,\f(3,5))).设从城市N中任选的1名用户中活跃用户数为Y,则Y听从两点分布,其中P(Y=1)=eq\f(4,5).由题意可得,ξ的全部可能的取值为0,1,2,3.P(ξ=0)=P(X=0)·P(Y=0)=Ceq\o\al(0,2)·eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(2,5)))2·eq\f(1,5)=eq\f(4,125);P(ξ=1)=P(X=0)·P(Y=1)+P(X=1)·P(Y=0)=Ceq\o\al(0,2)·eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(2,5)))2·eq\f(4,5)+Ceq\o\al(1,2)·eq\f(3,5)·eq\f(2,5)·eq\f(1,5)=eq\f(28,125);P(ξ=2)=P(X=1)·P(Y=1)+P(X=2)·P(Y=0)=Ceq\o\al(1,2)·eq\f(2,5)·eq\f(3,5)·eq\f(4,5)+Ceq\o\al(2,2)·eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,5)))2·eq\f(1,5)=eq\f(57,125);P(ξ=3)=P(X=2)·P(Y=1)=Ceq\o\al(2,2)·eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,5)))2·eq\f(4,5)=eq\f(36,125).所以ξ的分布列为ξ0123Peq\f(4,125)eq\f(28,125)eq\f(57,125)eq\f(36,125)E(ξ)=0×eq\f(4,125)+1×eq\f(28,125)+2×eq\f(57,125)+3×eq\f(36,125)=2.(3)由已知条件得eq\o(x,\s\up6(-))=eq\f(1+2+3+4,4)=2.5.又eq\o(y,\s\up6(-))=12.3,代入eq\o(y,\s\up6(^))=4x+eq\o(a,\s\up6(^)),得12.3=4×2.5+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=2.3,所以eq\o(y,\s\up6(^))=4x+2.3.将x=5代入上式,得eq\o(y,\s\up6(^))=4×5+2.3=22.3(百万小时),所以2024年第一季度该读书App用户运用时长约为22.3百万小时.角度3超几何分布的均值、方差问题5.(2024·青岛二中模拟)随着经济的发展和个人收入的提高,自2018年10月1日起,个人所得税起征点和税率依法进行调整.其中,纳税人的工资、薪金所得,先行以每月收入额减除费用五千元以及专项扣除和依法确定的其他扣除后的余额为应纳税所得额,依照个人所得税税率表,调整前后的计算方法如下表:个人所得税税率表(调整前)免征额3500元级数全月应纳税所得额税率(%)1不超过1500元的部分32超过1500元至4500元的部分103超过4500元至9000元的部分20………个人所得税税率表(调整后)免征额5000元级数全月应纳税所得额税率(%)1不超过3000元的部分32超过3000元至12000元的部分103超过12000元至25000元的部分20………(1)假如小李某月的工资、薪金等所得税前收入为7500元(无专项扣除和依法确定的其他扣除),请你帮小李算一下调整后小李的实际收入比调整前增加了多少?(2)某税务部门在小李所在公司利用分层抽样方法抽取某月100个不同级别员工的税前收入,并制成下面的频数分布表:收入/元[3000,5000)[5000,7000)[7000,9000)[9000,11000)[11000,13000)[13000,15000]人数304010875先从收入在[3000,5000)及[5000,7000)的员工中按分层抽样抽取7人,再从中选4人作为新纳税法学问宣讲员.用a表示抽到作为宣讲员的收入在[3000,5000)元的人数,b表示抽到作为宣讲员的收入在[5000,7000)元的人数.设随机变量Z=|a-b|,求Z的分布列、数学期望及方差.解(1)由于小李的工资、薪金等所得税前收入为7500元,按调整前起征点应纳个税为1500×3%+2500×10%=295(元).按调整后起征点应纳个税为2500×3%=75(元).比较两个纳税方案可知,按调整后起征点应纳个税比调整前少交220元.所以调整后小李的实际收入比调整前增加了220元.(2)①由频数分布表可知从收入在[3000,5000)及[5000,7000)的员工中抽取7个,其中收入在[3000,5000)内的有3人,收入在[5000,7000)内的有4人,再从这7人中选4人,所以Z的全部可能的取值为0,2,4.P(Z=0)=P(a=2,b=2)=eq\f(C\o\al(2,3)C\o\al(2,4),C\o\al(4,7))=eq\f(18,35),P(Z=2)=P(a=1,b=3)+P(a=3,b=1)=eq\f(C\o\al(1,3)C\o\al(3,4)+C\o\al(3,3)C\o\al(1,4),C\o\al(4,7))=eq\f(16,35),P(Z=4)=P(a=0,b=4)=eq\f(C\o\al(0,3)C\o\al(4,4),C\o\al(4,7))=eq\f(1,35).所以Z的分布列如下,Z024Peq\f(18,35)eq\f(16,35)eq\f(1,35)数学期望E(Z)=0×eq\f(18,35)+2×eq\f(16,35)+4×eq\f(1,35)=eq\f(36,35).方差D(Z)=eq\f(18,35)×eq\b\lc\(\rc\)(\a\vs4\al\co1(0-\f(36,35)))2+eq\f(16,35)×eq\b\lc\(\rc\)(\a\vs4\al\co1(2-\f(36,35)))2+eq\f(1,35)×eq\b\lc\(\rc\)(\a\vs4\al\co1(4-\f(36,35)))2=eq\f(1504,1225).(1)求离散型随机变量X的均值与方差的步骤①理解X的意义,写出X的全部可能取值.②求X取每个值的概率.③写出X的分布列.④由均值的定义求E(X).⑤由方差的定义求D(X).(2)留意性质的应用:若随机变量X的均值为E(X),则对应随机变量aX+b的均值是aE(X)+b,方差为a2D(X).(3)假如ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大削减计算量.见举例说明3.1.(2024·南充市高三摸底)设离散型随机变量X可能的取值为1,2,3,4,P(X=k)=ak+b,又X的数学期望为E(X)=3,则a-b=()A.eq\f(1,10) B.0C.-eq\f(1,10) D.eq\f(1,5)答案A解析设离散型随机变量ξ可能取的值为1,2,3,4.P(ξ=k)=ak+b(k=1,2,3,4),∴(a+b)+(2a+b)+(3a+b)+(4a+b)=1,即10a+4b=1,又ξ的数学期望E(ξ)=3,则(a+b)+2(2a+b)+3(3a+b)+4(4a+b)=3,即30a+10b=3,a=eq\f(1,10),b=0,∴a-b=eq\f(1,2.(2024·沈阳模拟)随着移动互联网的发展,与餐饮美食相关的手机软件层出不穷.为调查某款订餐软件上商家的服务状况,统计了10次订餐“送达时间”(单位:分),得到茎叶图如下:(1)请计算“送达时间”的平均数与方差;(2)依据茎叶图填写下表:送达时间35分钟以内(包括35分钟)超过35分钟频数AB频率CD(3)在(2)的状况下,以频率代替概率.现有3个客户用此软件订餐,求出在35分钟以内(包括35分钟)收到餐品的人数X的分布列,并求出数学期望.解(1)“送达时间”的平均数为eq\f(28+29+32+34+34+35+36+38+41+43,10)=35(分),方差为eq\f(1,10)×[(28-35)2+(29-35)2+(32-35)2+(34-35)2+(34-35)2+(35-35)2+(36-35)2+(38-35)2+(41-35)2+(43-35)2]=20.6.(2)A=6,B=4,C=0.6,D=0.4.(3)由题意知,在35分钟以内(包括35分钟)收到餐品的人数X的全部可能的取值为0,1,2,3.P(X=0)=Ceq\o\al(0,3)×0.60×0.43=0.064;P(X=1)=Ceq\o\al(1,3)×0.6×0.42=0.288;P(X=2)=Ceq\o\al(2,3)×0.62×0.4=0.432;P(X=3)=Ceq\o\al(3,3)×0.63×0.40=0.216.所以X的分布列如下,X0123P0.0640.2880.4320.216所以E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8(或X听从二项分布B(3,0.6),E(X)=3×0.6=1.8).3.(2024·漳州二模)某市电视台举办纪念红军长征成功学问回答活动,宣扬长征精神,首先在甲、乙、丙、丁四个不同的公园进行支持签名活动.公园甲乙丙丁获得签名人数45603015然后在各公园签名的人中按分层抽样的方式抽取10名幸运之星回答问题,从10个关于长征的问题中随机抽取4个问题让幸运之星回答,全部答对的幸运之星获得一份纪念品.(1)求此活动中各公园幸运之星的人数;(2)若乙公园中每位幸运之星对每个问题答对的概率均为eq\f(\r(2),2),求乙公园中恰好2位幸运之星获得纪念品的概率;(3)若幸运之星小李对其中8个问题能答对,而另外2个问题答不对,记小李答对的问题数为X,求X的分布列、期望及方差.解(1)甲、乙、丙、丁四个公园幸运之星的人数分别为eq\f(45,150)×10=3,eq\f(60,150)×10=4,eq\f(30,150)×10=2,eq\f(15,150)×10=1.(2)依据题意,乙公园中每位幸运之星获得纪念品的概率为Ceq\o\al(4,4)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(\r(2),2)))4=eq\f(1,4),所以乙公园中恰好2位幸运之星获得纪念品的概率为Ceq\o\al(2,4)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,4)))2eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4)))2=eq\f(27,128).(3)由题意,知X的全部可能取值2,3,4,听从超几何分布,P(X=2)=eq\f(C\o\al(2,8)C\o\al(2,2),C\o\al(4,10))=eq\f(2,15),P(X=3)=eq\f(C\o\al(3,8)C\o\al(1,2),C\o\al(4,10))=eq\f(8,15),P(X=4)=eq\f(C\o\al(4,8)C\o\al(0,2),C\o\al(4,10))=eq\f(1,3).所以X的分布列为X234Peq\f(2,15)eq\f(8,15)eq\f(1,3)期望E(X)=2×eq\f(2,15)+3×eq\f(8,15)+4×eq\f(1,3)=eq\f(16,5),方差D(X)=eq\f(2,15)×eq\b\lc\(\rc\)(\a\vs4\al\co1(2-\f(16,5)))2+eq\f(8,15)×eq\b\lc\(\rc\)(\a\vs4\al\co1(3-\f(16,5)))2+eq\f(1,3)×eq\b\lc\(\rc\)(\a\vs4\al\co1(4-\f(16,5)))2=eq\f(32,75).题型二均值与方差在决策中的应用(2024·南昌模拟)市面上有某品牌A型和B型两种节能灯,假定A型节能灯运用寿命都超过5000小时.经销商对B型节能灯运用寿命进行了调查统计,得到如下频率分布直方图,某商家因原店面需重新装修,需租赁一家新店面进行周转,合约期一年.新店面需安装该品牌节能灯5只(同种型号)即可正常营业.经了解,A型20瓦和B型55瓦的两种节能灯照明效果相当,都适合安装.已知A型和B型节能灯每只的价格分别为120元、25元,当地商业电价为0.75元/千瓦时.假定该店面正常营业一年的照明时间为3600小时,若正常营业期间灯坏了马上购买同型灯更换.(用频率估计概率)(1)若该商家新店面全部安装了B型节能灯,求一年内恰好更换了2只灯的概率;(2)若只考虑灯的成本和消耗电费,你认为该商家应选择哪种型号的节能灯,请说明理由.解(1)由频率分布直方图可知,B型节能灯运用寿命超过3600小时的频率为0.0010×(3800-3600)=0.2.用频率估计概率,得B型节能灯运用寿命超过3600小时的概率为eq\f(1,5).所以一年内一只B型节能灯在运用期间须要更换的概率为eq\f(4,5).所以一年内5只节能灯恰好更换了2只的概率为Ceq\o\al(2,5)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(4,5)))2×eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,5)))3=eq\f(32,625).(2)该商家应选择A型节能灯.理由如下:一共须要安装5只同种节能灯.若选择A型节能灯,一年共需花费5×120+3600×5×20×0.75×10-3=870(元).若选择B型节能灯,由于B型节能灯一年内需更换的只数听从二项分布Beq\b\lc\(\rc\)(\a\vs4\al\co1(5,\f(4,5))),所以一年需更换灯的只数的数学期望为5×eq\f(4,5)=4(只).所以一年共需花费(5+4)×25+3600×5×55×0.75×10-3=967.5(元).因为967.3>870,所以该商家应选择A型节能灯.解离散型随机变量的期望和方差应用问题的方法(1)求离散型随机变量的期望与方差关键是确定随机变量的全部可能值,写出随机变量的分布列,正确运用期望、方差公式进行计算.(2)要留意视察随机变量的概率分布特征,若属于二项分布,可用二项分布的期望与方差公式计算,则更为简洁.(3)在实际问题中,若两个随机变量ξ1,ξ2,有E(ξ1)=E(ξ2)或E(ξ1)与E(ξ2)较为接近时,就须要用D(ξ1)与D(ξ2)来比较两个随机变量的稳定程度.即一般地将期望最大(或最小)的方案作为最优方案,若各方案的期望相同,则选择方差最小(或最大)的方案作为最优方案.(2024·湖北四地七校联考)有甲、乙两家公司都须要聘请求职者,这两家公司的聘用信息如下:甲公司乙公司职位ABCD职位ABCD月薪/元6000700080009000月薪/元50007000900011000获得相应职位概率0.40.30.20.1获得相应职位概率0.40.30.20.1(1)依据以上信息,假如你是该求职者,你会选择哪一家公司?说明理由;(2)某课外实习作业小组调查了1000名职场人士,就选择这两家公司的意愿做了统计,得到以下数据分布:选择意愿人员结构40岁以上(含40岁)男性40岁以上(含40岁)女性40岁以下男性40岁以下女性选择甲公司11012014080选择乙公分析选择意愿与年龄这两个分类变量,计算得到的K2的观测值为k1=5.5513,则得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是多少?并用统计学学问分析,选择意愿与年龄变量和性别变量哪一个关联性更大?附:K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.P(K2≥k0)0.0500.0250.0100.005k03.8415.0246.6357.879解(1)设甲公司与乙公司的月薪分别为随机变量X,Y,则E(X)=6000×0.4+7000×0.3+8000×0.2+9000×0.1=7000,E(Y)=5000×0.4+7000×0.3+9000×0.2+11000×0.1=7000,D(X)=(6000-7000)2×0.4+(7000-7000)2×0.3+(8000-7000)2×0.2+(9000-7000)2×0.1=10002,D(Y)=(5000-7000)2×0.4+(7000-7000)2×0.3+(9000-7000)2×0.2+(11000-7000)2×0.1=20002,则E(X)=E(Y),D(X)<D(Y),我希望不同职位的月薪差距小一些,故选择甲公司;或我希望不同职位的月薪差距大一些,故选择乙公司.(2)因为k1=5.5513>5.024,依据表中对应值,得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是0.025,由数据分布可得选择意愿与性别两个分类变量的2×2列联表如下:选择甲公司选择乙公司总计男250350600女200200400总计4505501000计算K2=eq\f(1000×250×200-350×2002,600×400×450×550)=eq\f(2000,297)≈6.734,且K2=6.734>6.635,比照临界值表得出结论“选择意愿与性别有关”的犯错误的概率上限为0.01,由0.01<0.025,所以与年龄相比,选择意愿与性别关联性更大.题型三正态分布的应用1.设X~N(1,1),其正态分布密度曲线如图所示,那么向正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是()(注:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=68.26%,P(μ-2σ<X≤μ+2σ)=95.44%)A.7539 B.6038C.7028 D.6587答案D解析∵X~N(1,1),∴μ=1,σ=1,μ+σ=2,∵P(μ-σ<X≤μ+σ)=68.26%,∴则P(0<X≤2)=68.26%,则P(1<X≤2)=34.13%,∴阴影部分的面积为0.6587,∴点落入题图中阴影部分的概率P=eq\f(0.6587,1)=0.6587.∴正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是6587.故选D.条件探究若将本例中“正方形”改为“矩形”,“X~N(1,1)”变为“X~N(-1,1),阴影部分如图所示”,则落入阴影部分的点的个数的估计值是________.答案9547解析对于正态分布N(-1,1),可知μ=-1,σ=1,正态曲线关于直线x=-1对称,故P(0<X≤1)=eq\f(1,2)×[P(-3<X≤1)-P(-2<X≤0)]=eq\f(1,2)×[P(μ-2σ<X≤μ+2σ)-P(μ-σ<X≤μ+σ)]=eq\f(1,2)×(0.9544-0.6826)=0.1359,所以点落入题图中阴影部分的概率P=eq\f(1×3-0.1359,1×3)=0.9547,投入10000个点,落入阴影部分的个数约为10000×0.9547=9547.2.(2024·蚌埠三模)我市高三年级其次次质量检测的数学成果X近似听从正态分布N(82,σ2),且P(74<X<82)=0.42.已知我市某校有800人参与此次考试,据此估计该校数学成果不低于90分的人数为________.答案64解析因为数学成果X近似听从正态分布N(82,σ2),所以数学成果X关于X=82对称,因为P(74<X<82)=0.42.所以P(82<X<90)=0.42.P(X≥90)=P(X≤74)=eq\f(1-0.42×2,2)=0.08,所以我市某校有800人参与此次考试,据此估计该校数学成果不低于90分的人数为0.08×800=64.正态分布下两类常见的概率计算(1)利用正态分布密度曲线的对称性探讨相关概率问题,涉及的学问主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.(2)利用3σ原则求概率问题时,要留意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.1.设两个正态分布N(μ1,σeq\o\al(2,1))(σ1>0)和N(μ2,σeq\o\al(2,2))(σ2>0)的密度函数图象如图所示,则有()A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2答案A解析μ反映正态分布的平均水平,x=μ是正态曲线的对称轴,由图知μ1<μ2,σ反映正态分布的离散程度,σ越大,曲线越“矮胖”,表明越分散,σ越小,曲线越“高瘦”,表明越集中,由图知σ1<σ2.2.(2024·九江三模)已知某公司生产的一种产品的质量X(单位:千克)听从正态分布N(90,64).现从该产品的生产线上随机抽取10000件产品,其中质量在区间(82,106)内的产品估计有(若X~N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.6826,P(μ-2σ<X<μ+2σ)≈0.9544)()A.8185件 B.6826件C.4772件 D.2718件答案A解析依题意,μ=90,σ=8,∴P(82<X<106)=0.9544-eq\f(0.9544-0.6826,2)=0.8185,∴质量在区间(82,106)内的产品估计有10000×0.8185=8185件.组基础关1.(2024·保定二模)已知随机变量ξ听从正态分布N(μ,σ2),若P(ξ<2)=P(ξ>6)=0.1,则P(2≤ξ<4)为()A.0.7 B.0.5C.0.4 D.0.35答案C解析由P(ξ<2)=P(ξ>6)=0.1,可得μ=4,且P(2≤ξ<4)=eq\f(1,2)×(1-0.1×2)=0.4.2.已知随机变量X+Y=8,若X~B(10,0.6),则E(Y),D(Y)分别是()A.6和2.4 B.2和2.4C.2和5.6 D.6和5.6答案B解析由已知随机变量X+Y=8,所以Y=8-X.因此,求得E(Y)=8-E(X)=8-10×0.6=2,D(Y)=(-1)2D(X)=10×0.6×0.4=2.4.故选B.3.(2024·湖南湘西二模)已知甲、乙两台自动车床生产同一种零件,X表示甲车床生产1000件产品中的次品数,Y表示乙车床生产1000件产品中的次品数,经考察一段时间,X,Y的分布列分别是X0123P0.70.10.10.1Y012P0.50.30.2据此推断()A.甲比乙生产的产品质量好B.乙比甲生产的产品质量好C.甲与乙生产的产品质量相同D.无法推断答案A解析E(X)=0×0.7+1×0.1+2×0.1+3×0.1=0.6,E(Y)=0×0.5+1×0.3+2×0.2=0.7.由于E(Y)>E(X),故甲比乙生产的产品质量好.4.(2024·浙江嘉兴适应性训练)随机变量X的分布列如下表,且E(X)=2,则D(2X-3)=()X02aPeq\f(1,6)peq\f(1,3)A.2 B.3C.4 D.5答案C解析p=1-eq\f(1,6)-eq\f(1,3)=eq\f(1,2),E(X)=0×eq\f(1,6)+2×eq\f(1,2)+a×eq\f(1,3)=2⇒a=3,∴D(X)=(0-2)2×eq\f(1,6)+(2-2)2×eq\f(1,2)+(3-2)2×eq\f(1,3)=1.∴D(2X-3)=22D(X)=4.5.(2024·广州二模)从某班6名学生(其中男生4人,女生2人)中任选3人参与学校组织的社会实践活动.设所选3人中女生人数为ξ,则数学期望E(ξ)=()A.eq\f(4,5) B.1C.eq\f(7,5) D.2答案B解析因为ξ=0,1,2,所以P(ξ=0)=eq\f(C\o\al(3,4),C\o\al(3,6))=eq\f(1,5),P(ξ=1)=eq\f(C\o\al(2,4)C\o\al(1,2),C\o\al(3,6))=eq\f(3,5),P(ξ=2)=eq\f(C\o\al(1,4)C\o\al(2,2),C\o\al(3,6))=eq\f(1,5),因此E(ξ)=0×eq\f(1,5)+1×eq\f(3,5)+2×eq\f(1,5)=1.6.(2024·浙江金丽衢十二校第一次联考)五人进行过关嬉戏,每人随机出现左路和右路两种选择.若选择同一条路的人数超过2人,则他们每人得1分;若选择同一条路的人数小于3人,则他们每人得0分,记小强嬉戏得分为ξ,则E(ξ)=()A.eq\f(5,16) B.eq\f(11,16)C.eq\f(5,8) D.eq\f(1,2)答案B解析五人进行过关嬉戏,每人随机出现左路和右路两种选择.若选择同一条路的人数超过2人,则他们每人得1分;若选择同一条路的人数小于3人,则他们每人得0分,∴P(ξ=1)=Ceq\o\al(2,4)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))2·eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))2+Ceq\o\al(3,4)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))3eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))+Ceq\o\al(4,4)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))4=eq\f(11,16),P(ξ=0)=1-eq\f(11,16)=eq\f(5,16),∴E(ξ)=1×eq\f(11,16)+0×eq\f(5,16)=eq\f(11,16).7.已知抛物线y=ax2+bx+c(a≠0)的对称轴在y轴的左侧,其中a,b,c∈{-3,-2,-1,0,1,2,3},在这些抛物线中记随机变量ξ=“|a-b|的取值”,则ξ的数学期望E(ξ)为()A.eq\f(8,9) B.eq\f(3,5)C.eq\f(2,5) D.eq\f(1,3)答案A解析由于对称轴在y轴左侧,故-eq\f(b,2a)<0,故a,b同号,基本领件有3×3×7×2=126,ξ的可能取值有0,1,2三种.P(ξ=0)=eq\f(6×7,126)=eq\f(1,3),P(ξ=1)=eq\f(8×7,126)=eq\f(4,9),P(ξ=2)=eq\f(4×7,126)=eq\f(2,9),故期望值为0×eq\f(1,3)+1×eq\f(4,9)+2×eq\f(2,9)=eq\f(8,9),故选A.8.(2024·日照模拟)某市高三理科学生有15000名,在一次调研测试中,数学成果ξ听从正态分布N(100,σ2),已知P(80<ξ≤100)=0.40,若按成果分层抽样的方式取100份试卷进行分析,则应从120分以上的试卷中抽取的份数为________.答案10解析P(ξ>120)=eq\f(1,2)[1-2P(80<ξ≤100)]=0.10,所以应从120分以上的试卷中抽取100×0.10=10份.9.(2024·绵阳模拟)一个盒子装有3个红球和2个蓝球(小球除颜色外其他均相同),从盒子中一次性随机取出3个小球后,再将小球放回.重复50次这样的试验.记“取出的3个小球中只有2个红球,1个蓝球”发生的次数为ξ,则ξ的方差是________.答案12解析由题意知ξ~B(n,p),其中n=50,P=eq\f(C\o\al(2,3)C\o\al(1,2),C\o\al(3,5))=eq\f(6,10)=eq\f(3,5),所以D(ξ)=50×eq\f(3,5)×eq\f(2,5)=12.10.一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子中,每个盒子放一个小球,球的编号与盒子的编号相同时叫做放对了,否则叫做放错了.设放对的个数为ξ,则ξ的期望值为________.答案1解析将四个小球放入四个盒子,每个盒子放一个小球,共有Aeq\o\al(4,4)种不同放法,放对的个数ξ可取的值有0,1,2,4.其中,P(ξ=0)=eq\f(9,A\o\al(4,4))=eq\f(3,8),P(ξ=1)=eq\f(C\o\al(1,4)×2,A\o\al(4,4))=eq\f(1,3),P(ξ=2)=eq\f(C\o\al(2,4),A\o\al(4,4))=eq\f(1,4),P(ξ=4)=eq\f(1,A\o\al(4,4))=eq\f(1,24),所以E(ξ)=0×eq\f(3,8)+1×eq\f(1,3)+2×eq\f(1,4)+4×eq\f(1,24)=1.组实力关1.已知5台机器中有2台存在故障,现须要通过逐台检测直至区分出2台故障机器为止.若检测一台机器的费用为1000元,则所需检测费用的均值为()A.3200 B.3400C答案C解析设检测的机器的台数为X,则X的全部可能取值为2,3,4.P(X=2)=eq\f(A\o\al(2,2),A\o\al(2,5))=eq\f(1,10),P(X=3)=eq\f(C\o\al(1,2)C\o\al(1,3)A\o\al(2,2)+A\o\al(3,3),A\o\al(3,5))=eq\f(3,10),P(X=4)=eq\f(C\o\al(1,2)C\o\al(2,3)A\o\al(3,3)C\o\al(1,2),A\o\al(4,5))=eq\f(3,5),所以E(X)=2×eq\f(1,10)+3×eq\f(3,10)+4×eq\f(3,5)=3.5,所以所需检测费用的均值为1000×3.5=3500.2.(2024·巢湖模拟)某次考试共有12个选择题,每个选择题的分值为5分,每个选择题四个选项且只有一个选项是正确的,A学生对12个选择题中每个题的四个选项都没有把握,最终选择题的得分为X,B学生对12个选择题中每个题的四个选项都能推断其中有一个选项是错误的,对其他三个选项都没有把握,选择题的得分为Y,则D(Y)-D(X)的值为()A.eq\f(125,12) B.eq\f(35,12)C.eq\f(27,4) D.eq\f(23,4)答案A解析设A学生答对题的个数为m,则得分X=5m(分),m~Beq\b\lc\(\rc\)(\a\vs4\al\co1(12,\f(1,4))),D(m)=12×eq\f(1,4)×eq\f(3,4)=eq\f(9,4),所以D(X)=25×eq\f(9,4)=eq\f(225,4).同理,设B学生答对题的个数为n,则得分Y=5n(分),n~Beq\b\lc\(\rc\)(\a\vs4\al\co1(12,\f(1,3))),D(n)=12×eq\f(1,3)×eq\f(2,3)=eq\f(8,3),所以D(Y)=eq\f(8,3)×25=eq\f(200,3),所以D(Y)-D(X)=eq\f(200,3)-eq\f(225,4)=eq\f(125,12).3.(2024·梧州一模)某计算机程序每运行一次都随机出现一个五位数,A=a1a2a3a4a5,其中A的各位数中,a1=1,ak(k=2,3,4,5)出现0的概率为eq\f(1,3),出现1的概率为eq\f(2,3),记X=a2+a3+a4+a5,当程序运行一次时,X的数学期望E(X)=________;方差D(X)=________.答案eq\f(8,3)eq\f(8,9)解析由题意得,X~Beq\b\lc\(\rc\)(\a\vs4\al\co1(4,\f(2,3))),∴数学期望E(X)=4×eq\f(2,3)=eq\f(8,3),方差D(X)=4×eq\f(2,3)×eq\f(1,3)=eq\f(8,9).4.(2024·东北三省四市教研联合体模拟)某工厂有甲、乙两个车间生产同一种产品,甲车间有工人200人,乙车间有工人400人.为比较两个车间工人的生产效率,采纳分层抽样的方法抽取工人.甲车间抽取的工人记作第一组,乙车间抽取的工人记作其次组,并对他们中每位工人生产完成一件产品的时间(单位:min)进行统计,依据[55,65),[65,75),[75,85),[85,95]进行分组,得到下列统计图.(1)分别估算两个车间工人中,生产一件产品时间少于75min的人数;(2)分别估计两个车间工人生产一件产品时间的平均值,并推想哪个车间工人的生产效率更高;(3)从第一组生产时间少于75min的工人中随机抽取3人,记抽取的生产时间少于65min的工人人数为随机变量X,求X的分布列及数学期望.解(1)由题意,得第一组工人有20人,其中在75min内生产完成一件产品的有6人,∴甲车间工人中生产一件产品时间少于75min的人数为6×10=60.其次组工人有40人,其中在75min内生产完成一件产品的有40×(0.025+0.050)×10=30(人),∴乙车间的工人中生产一件产品时间少于75min的人数为30×10=300.(2)第一组的平均时间为eq\o(x,\s\up6(-))甲=eq\f(60×2+70×4+80×10+90×4,20)=78(min),其次组的平均时间为eq\o(x,\s\up6(-))乙=60×0.25+70×0.50+80×0.20+90×0.05=70.5(min).∵eq\o(x,\s\up6(-))甲>eq\o(x,\s\up6(-))乙,∴乙车间工人生产效率更高.(3)由题意,得第一组生产时间少于75min的工人有6人,其中生产时间少于65min的有2人,从中抽取3人,则X可能的取值为0,1,2,且P(X=0)=eq\f(C\o\al(0,2)C\o\al(3,4),C\o\al(3,6))=eq\f(4,20)=eq\f(1,5),P(X=1)=eq\f(C\o\al(1,2)C\o\al(2,4),C\o\al(3,6))=eq\f(12,20)=eq\f(3,5),P(X=2)=eq\f(C\o\al(2,2)C\o\
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公共场所的安全管理从识别到响应的全面培训
- 全面解析学生综合素养的培育与评价
- 企业数字化转型的成功案例分析
- 企业培训中心的现代教学环境设计策略与实践案例分享
- 互动式教学在数学课堂的应用实践
- 辽宁省2021-2022年七年级下学期数学期末考试试卷A卷
- 了解并利用植物生长周期助力现代农业发展
- 创新科技下的工业互联网安全防护新思路
- 安全生产教育培训心得体会(5篇)
- 从细节出发作文个性化评改术
- 广东省广州市越秀区2022-2023学年八年级上学期期末历史试题(含答案)
- 2025版国家开放大学专本科《计算机应用基础》一平台在线形考任务 (形考作业一至三)试题及答案
- 古代汉语专题-003-国开机考复习资料
- 【MOOC】跨文化交际通识通论-扬州大学 中国大学慕课MOOC答案
- 学历提升之路
- 【MOOC】信号与系统-西北工业大学 中国大学慕课MOOC答案
- 播音主持专业教学计划
- 《半导体的基本知识》教学设计
- GB/T 44787-2024静电控制参数实时监控系统通用规范
- 电梯困人应急演练方案
- 【初中历史】西晋的短暂统一和北方各族的内迁课件 2024-2025学年统编版七年级历史上册
评论
0/150
提交评论