




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
培优专题03概率统计
培优墨嚏(特钢帮塞提如、
题型1离散型随机变量及其分布列
r±T±TAT±T±TXT±T±TATATATATXTATATATATATXT^TATATXTAT±TATATAT±TXTAT±T±TAT±TAT±T±TXTATAT±TXTATATXTAT±TXTATAT±TATAT±TXTATATATAT±T±T±TAT±TATATAT±T±TXTXTATATXTX
点
离散型随机变量及其分布列问题,解题的思路是:
1、明确随机变量X可能取到的值并求出每一种情况下的概率
2、写出离散型随机变量的分布列
(1)离散型随机变量的分布列
一般地,设离散型随机变量X的可能取值为的,尤2,…,X",我们称X取每一个值方的概率P(X=M)=o,
i=l,2,"为X的概率分布列,简称为分布列.
(2)可以用表格来表示X的分布列,如下表
XXIX2XiXn
PPiP2PiPn
还可以用图形表示,如下图直观地表示了掷骰子试验中掷出的点数X的分布列,称为X的概率分布图.
3、必备知识:离散型随机变量的分布列的性质
(1),20,,=1,2,…,几;(2))i+p2+…+p〃=1.
i
1.(2025•贵州黔东南•模拟预测)某商场推出了购物抽奖活动,活动规则如下:如图,在点A,B,C,D,
E处各安装了一盏灯,每次只有一处的灯亮起.初始状态是点A处的灯亮起,程序运行次数的上限为"
(24〃46,«eN+),然后按下开始按扭,程序开始运行,第1次是与A相邻点处的其中一盏灯随机亮起,
第w次是与第"-1次灯亮处相邻点的其中一盏灯随机亮起.若在运行过程中,点A处的灯再次亮起,则游戏
结束,否则运行几次后游戏自动结束.在程序运行过程中,若点A处的灯再次亮起,则顾客获奖.已知顾客小
明参与了该购物抽奖活动.
⑴求程序运行2次小明获奖的概率;
(2)若”=4,求小明获奖的概率;
⑶若〃=6,记游戏结束时程序运行的次数为X,求X的分布列与期望.
【答案】⑴三⑵黑⑶分布列见解析,E(X)=4
12216
【分析】(1)分析小明两次获奖的情况有两种求+=]得到结果;
(2)根据题意分程序运行2次,小明获奖,程序运行4次,小明获奖,共有五种情况求和计算求解;
(3)根据〃=6,结合(1)(2)问分析,得到多种情况,分别求出概率得出X的分布列,再求数学期望.
【详解】(1)程序运行2次小明获奖的情况有A-A-E-A这两种,
其概率或二;x;+;x;=W
乙J乙乙JL乙
(2)当〃=4时,小明获奖的情况如下:程序运行2次,小明获奖;程序运行4次,小明获奖.
程序运行4次,小明获奖的情况有A—3-C—3—A,A-B-D-B-A,A-E-D-E-A,A-B-D-E-A,
4一七一。一3—4这五种,
其概率6」x'L'Wx'LL'LLLWxLLL包,
223232333223223322233216
121
故当〃=4时,小明获奖的概率尸=6+5=^
216
(3)当〃=6时,X的所有可能取值为2,4,5,6.
531
由(1)可知尸(X=2)=F,由(2)可知P(X=4)=丁,
12216
当X=5时,A-B-C-D-E-A,A-E-D-C-B-A,A-B-C-D-B-A,A-B-D-C-B-A
这四种情况,
廿百/n/v6c111110111115
其^f既;T'-P(X=5)=2x—x—x—x—x—F2x—x—x—x—x—=-----,
2323223233108
531585
P(X=6)=1-P(X=2)-P(X=4)—P(X=5)=1---------------------=——
12216108216
故X的分布列为
X2456
531585
P
12216108216
S3]525
^E(X)=2x—+4x—+5x—+6x—=4
12216108216
2.(2025・广东•一模)甲参加围棋比赛,采用三局两胜制,若每局比赛甲获胜的概率为P(O<0<1),输的
概率为1-0,每局比赛的结果是独立的.
2
⑴当p=§时,求甲最终获胜的概率;
⑵为了增加比赛的趣味性,设置两种积分奖励方案.方案一:最终获胜者得3分,失败者得—2分;方案二:
最终获胜者得1分,失败者得0分,请讨论选择哪种方案,使得甲获得积分的数学期望更大.
【答案】⑴2"0(2)答案见解析
【分析】(1)甲最终获胜有两种情况:前2局赢、三场输一场赢两场,据此求解概率;
(2)由(1)可得甲最终获胜的概率,分别计算两种方案下甲获得积分的数学期望,通过作差比较其大小
即可.
【详解】(1)记"甲最终以2:1获胜"为事件A,记"甲最终以2:0获胜"为事件B,"甲最终获胜"为事件C,
于是C=AB,A与8为互斥事件,
Q4
由于尸(A)=C;・p-p.(l-p)=力,P⑻=/=§,
则P(C)=P(A)+P(B)=3p2_203=1^,
即甲最终获胜的概率为二20.
(2)由(1)可知,P(C)=P(A)+P(B)=3p2-2p3,
若选用方案一,记甲最终获得积分为X分,则X可取3,-2,
p(X=3)=P(C)=3p2-2/,P(X=_2)=l_3/+2p3,
则X的分布列为:
X3-2
P3P2-2/l-3p?+2p3
贝"E(x)=9p2_6p3_2+6p2-4/=—iOp3+I5p2_2,
若选用方案二,记甲最终获得积分为y分,则y可取1,o,
尸0=1)=尸(c)=3p2-2p3P(Y=0)=1-3P2+2/,
则y的分布列为:
Y10
P3”-2炉l-3p-+2p}
则E(y)=3p2-2/,
所以£凶/丫)=一8/+12/-2=-4,一£|(2八20-1),
由于0<〃<1,则2P2—2p—l=2p(p—1)—1<0,
于是时,两种方案都可以选,
当0<p<g时,E(X)<E(Y),应该选第二种方案,
当3Vp<1时,E(X)>E(Y),应该选第一种方案.
3.(2025•山东•模拟预测)已知某种业公司培育了新品种的软籽石榴,从收获的果实中随机抽取了50个软
籽石榴,按质量(单位:g)将它们分成5组:[360,380),[380,400),[400,420),[420,440),[440,460],得
到如下频率分布直方图.
⑴用样本估计总体,估计该品种石榴质量的平均数;(同一组中的数据用该组区间的中点值作代表)
(2)在样本中从质量在区间[380,400),[400,420),[420,440)上的石榴中按分层随机抽样抽取7个石榴进行检测,
再从中抽取3个石榴作进一步检测.
(0)已知抽取的3个石榴不完全来自同一区间,求这3个石榴恰好来自不同区间的概率;
(回)记这3个石榴中质量在区间[420,440)上的个数为X,求X的分布列与数学期望.
69
【答案】⑴416g.(2)(0)—:(0)分布列见解析,-
【分析】(1)由平均数的计算公式求解即可;
(2)(回)先确定日80,400),[400,420),[420,440)上的石榴个数分别为2,2,3.再结合古典概型及条件概
率计算公式求解即可;(回)确定X的所有可能取值,再求得对应概率即可求解;
【详解】([)由题意知这50个软籽石榴质量的平均数为
20x[370x0.005+(390+410+450)x0.010+430x0.015]=416(g),
所以估计该品种石榴质量的平均数为416g.
(2)由题意知这7个石榴中,质量在区间[380,400),[400,420),[420,440)上的频率之比为
0.010:0.010:0.015=2:2:3,
所以抽取的质量在区间[380,400),[400,420),[420,440)上的石榴个数分别为2,2,3.
(0)记事件A="抽取的3个石榴不完全来自同一区间",事件3="这3个石榴恰好来自不同区间”,
Xg,小小C;C;C;12
则尸(A)=
35
12
所以「(冽&)=?翟35_6
34-17)
35
即所求概率为
「3418
(0)由题意知X的所有可能取值为0,L2,3,贝l]P(X=0)=^=»,P(X=1)=-^
35
c\c(21
文=2)=中
C厂35'
所以X的分布列为
X0123
418121
P
35353535
所以E(X)=Ox巴+1XG+2XU+3X-!-=2
''353535357
题型二:二项分布
TJiT±TXTXTXr±TATXTXT±TATATXTATATXTXTJiTATJiTXT±TJiTXTATATXT4iT±Trr4iTATXT±TATXT±TATXTXTXTXTATATXTXTJiTATXTdiTJiTJiTXTJiTJiTXTJiTXTATJiTJiTXTXTAT±TJiTXTAT±TXTXTATATJiTXTATA
点
二项分布问题,解题的思路是:
1、识题.
“重伯努利试验具有如下共同特征
(1)同一个伯努利试验重复做n次;(2)各次试验的结果相互独立.
2、研究方向
一般地,在“重伯努利试验中,设每次试验中事件A发生的概率为p(O<p<l),用X表示事件A发生的次数,
则X的分布列为:P(X=k)=C:pkQ_p)"T,k=0,1,2,…,"记作X〜8(%p).
3、必备知识:一般地,可以证明:如果X〜2(”,p),那么E(X)=〃p,O(X)=〃p(l-p).
1.(2024・贵州六盘水•模拟预测)深圳是一个沿海城市,拥有大梅沙等多样的海滨景点,每年夏天都有大
量游客来游玩.为了合理配置旅游资源,文旅部门对来大梅沙游玩的游客进行了问卷调查,据统计,其中|■的
人选择只游览海滨栈道,另外]的人选择既游览海滨栈道又到海滨公园游玩.每位游客若选择只游览海滨栈
道,则记1分;若选择既游览海滨栈道又到海滨公园游玩,则记2分.假设游客之间的旅游选择意愿相互独
立,视频率为概率.
⑴从游客中随机抽取2人,记这2人的合计得分为X,求X的分布列和数学期望;
⑵从游客中随机抽取〃个人(awN*),记这〃个人的合计得分恰为〃+1分的概率为P“,求£B;
1=1
⑶从游客中随机抽取若干人,记这些人的合计得分恰为鼠分(〃eN*)的概率为。“,随着抽取人数的无限增加,
。“是否趋近于某个常数?若是,求出这个常数;若不是,请说明理由.
【答案】⑴分布列见解析,g(2);一曾仁%是,!
【分析】(1)根据题意得到变量X的可能取值为2,3,4,结合独立事件的概率乘法公式,求得相应的概率,
列出分布列,利用期望的公式,求得期望.
(2)由这〃人的合计得分为“+1分,得到《=|.小弓)",结合乘公比错位相减法求和,即可求解.
(3)记"合计得〃分"为事件A,"合计得〃+1分"为事件B,得到%+1*=1(心2),结合数列的递推关系
式,进而求得数列的通项公式,得到答案.
【详解】(1)依题意,随机变量X的可能取值为2,3,4,
74731?3。
贝ljP(X=2)=(—)2=—,p(x=3)=C;x—x—=—,P(X=4)=(-)2=—
525'725525525
所以X的分布列如下表所示:
X234
4129
P
252525
412916
数学期望为石(X)=2x齐+3x齐+4x^=彳.
(2)由这〃人的合计得分为〃+1分,得其中只有1人既游览海滨栈道又到海滨公园游玩,
于是月=C|•(I)-1=即:=|.«-(|)",令数列{n-(|)"}的前”项和为S”,
贝llS“=lx—+2x(—)2+3x(―)3++nx(—)",
23
于是|S,=lx(|)+2x(|)++(n-l)x(|r+wx(|严,
2口(2力
两式相减得|S,=|+(|)2+(|)3++(I)"X(|)"+1=—f—一»x(|)"+1
1--
5
210+6〃21010+6九2
法-,m因此uS“二了-.”),
llti3_55+3〃/2、〃
所以=Pl+P2+,3++Pn=^Sn---T-'(T).
j=l/J5D
(3)在随机抽取的若干人的合计得分为〃-1分的基础上再抽取1人,则这些人的合计得分可能为〃分或〃+l
分,
记"合计得«分”为事件A,"合计得〃+1分"为事件B,A与B是对立事件,
P(B)=W*,4+,%=1(〃幻2),即=4(%-,)(〃22),
则P(A)=a,
33odo
由4=(2,得卬_;5=_舒9则数列他“一|5}是首项为一9方公比为-泊3等比数歹”,
见一'1=一方一/"汕,因止匕可[一》一,产伽油,
无限趋近于0,。”无限趋近于,,
随着〃的无限增大,
O
所以随着抽取人数的无限增加,%趋近于常数1
O
2.(2025,四川•模拟预测)某学校有2000人,为加强学生安全教育,某校开展了安全知识讲座,讲座结束
后,学校组织了一场安全知识测试,将测试成绩划分为"不够良好"或"良好",并得到如下列联表:
安全知识测试成绩
性别合计
不够良好良好
男8003001100
女700200900
合/p>
⑴根据小概率。=0.01的/独立性检验,能否认为本次安全知识测试成绩与性别有关联?
⑵设事件4="选到的学生是男生",事件3="选到的学生的测试成绩为‘良好'",用频率估计概率,通过计算
P(B\A)P(B\A\
比较扁F与4的大小•
P[B\A)♦(剧
其中,尸(X)表示事件X发生的概率.
n^ad-bc^
参考公式:*=其中〃=〃+Z?+c+d.
(a+b)(c+d)(Q+c)(/?+d)
参考数据:
a0.150.100.050.010
Xa2.0722.7063.8416.635
【答案】⑴认为了解安全知识测试成绩与性别有关,此推断犯错误的概率小于0.01
P(冽A)/(雨)
(>(B|A)P(B|A)
【分析】(1)利用独立性检验的方法求解判断即可;
P(B\A)P(B团
(2)利用条件概率公式求得与+4,可得结论.
.D(wB|A”jP(8|A)
【详解】(1)零假设为"。:该校学生了解安全知识测试成绩与性别没有关联.
根据列联表中的数据,经计算得到/=2000(800x200-700x300)2p6.734>6.635,
1500x500x900x1100
根据小概率值a=0.01的独立性检验,可以推断/成立,
即认为了解安全知识测试成绩与性别有关,此推断犯错误的概率小于0.01.
P(HA)_3J1_3
800Q
(2)因为P(例A)=同吟,所以ppA)~nx7=8
noo
因为尸(明=器7007292
所以=——x——=——
900-9977
尸(而A)尸(B困
因为2:<、3,所以
P(B\A)P(B|A)
3.(2025・山东•模拟预测)已知48两个不透明的袋子中均装有若干个大小,质地完全相同的红球和白球,
从A袋中摸出一个红球的概率是:,从8袋中摸出一个红球的概率是P.在每轮中,甲同学先选择一个袋子
摸一次球并放回,乙再选择一个袋子摸一次球并放回,则该轮结束.已知在每轮中甲选A,3两袋的概率均
为!.如果甲选A袋,则乙选B袋的概率为二;如果甲选8袋,则乙选8的概率为
~55
2
⑴若P=§,求在一轮中乙从8袋中摸出红球的概率;
⑵求在一轮中乙摸出红球的概率;
⑶若甲,乙两位同学进行了3轮摸球.乙同学认为,P越大,3轮摸球后他摸出2个红球的概率越大,你同
意他的观点吗?请说明理由.
71
【答案】⑴微(2)而(7。+1)⑶不同意乙的观点,理由见解析
【分析】(1)先利用全概率公式求出乙从8袋中摸球的概率,再利用乘法概率公式求解即可;
(2)利用全概率公式求解即可;
(3)由题意知3轮摸球后摸出红球的个数服从二项分布B(3,:(7p+l)j,利用二项分布的概率公式可得3
轮摸球后乙摸出2个红球的概率为盛(7。+1产(9-7p),令/(0=(Jp+1)2(*79-7小,利用导数求最
大时,P的值即可.
【详解】(1)设。="甲从A袋中摸球",E=”乙从B袋中摸球〃,C="乙摸出的是红球",
由全概率公式知,乙从2袋中摸球的概率P(E)=P(。)?(Ep)+P(5)P(E⑼=gxg+gx|=A,
777
所以在一轮中,乙从8袋中摸出红球的概率为尸(EC)=P(E)P(C|E)=^x§=^.
(2)在一轮中,乙摸出红球的概率P(C)=P(E)P(C|E)+尸闾P(C间=''0+A、(=七(70+1).
(3)由题意知3轮摸球后摸出红球的个数服从二项分布g13,2(7p+l)],
则3轮摸球后乙摸出2个红球的概率为
P=C[1(7P+1)[[l-:(7P+l)]=l^(7P+l)2(9-7p)(0<p<l),
设/(。)=(JP+1)2(9-7#,则/(0)=7(7。+1).(17-21p),
17
令尸(p)=o,解得。=苛,
1717
则当。<〃<五时,r(p)>o,〃p)单调递增,当五<p<i时,/,s)<o,〃p)单调递减,
所以当p=M17时,3轮摸球后乙摸出2个红球的概率最大,所以不同意乙的观点.
题型三:超几何分布
点
超几何分布问题,解题的思路是:
1、识题:超几何分布模型是一种不放回抽样
2、研究方向:一般地,假设一批产品共有N件,其中有〃件次品,从N件产品中随机抽取〃件(不放回),
用X表示抽取的w件产品中的次品数,则X的分布列为P(X=Q=竺%,k=m,m+1,机+2,…,工
CN
其中“,N,MEN*,M<N,n<N,m=max{0,n-N+M],r=mm[n,M].如果随机变量X的分布列具有
上式的形式,那么称随机变量X服从超几何分布.
3、必备知识:超几何分布的期望£(出=臂=叩仍为N件产品的次品率).
1.(2024•云南•一模)为节约水资源,某市对居民用水实行"阶梯水价"制度,其标准如下:
基础水价污水处理到户综合水价
项目月用水量
(元/m3)价(元/m3)
(元/m3)
第一阶梯不超过15m3的部分3.31.14.4
超过15m3但不超过27m3
第二阶梯4.91.16.0
的部分
第三阶梯超过27m3的部分6.41.17.5
例如:该市某户居民家庭某月用水量为18m3,则其该月应缴纳的综合水费(包括基础水费、污水处理费)
合计为4.4x15+6.0x(18-15)=84(元).
⑴若该市某户居民某月用水30m3,则该月应缴纳的综合水费为多少元?
(2)为了解该市居民月用水量的分布情况,通过抽样获得了该市100户居民某月的用水量数据(单位:m3),
整理得到如下频数分布表:
月用水
(3,7](7,川(11,15](15,19](19,23](23,27](27,31]
量
频数141828181255
(0)若该市相关部门采取分层抽样的方法,在这100户居民中,从月用水量在(15,19]和(19,23]两组内选
10户居民参与节水宣传活动,并决定在这10户居民中按抽签方式选出5户进行深度调研,设X,V分别为
月用水量在(15,19]和(19,23]中被选中进行深度调研的居民户数,记随机变量Z=|X-",求Z的分布列和
数学期望.
(国)以上表中的100户居民月用水量作为样本估计该市居民月用水量.现从该市随机抽取20户,记取到第
一阶梯水量的户数为4,当4=左时对应的概率为居,求号取得最大值时%的值.
一34
【答案】(1)160.5元⑵(国)分布列见解析,—;(回)12
【分析】(1)根据阶梯收费的制度即可求解,
(2)根据超几何分布的概率公式求解概率,即可求解分布列和期望,
(3)利用二项分布的概率公式,利用不等式求解最值.
【详解】(1)由题意可得,该户居民该月用水30立方米分三个阶梯收费,
4.4x15+6.0x(27-15)+7.5x(30-27)=160.5(元)
故该户居民该月应缴纳的综合水费为160.5元.
(2)(0)由表可知:月用水量为(15,19]和(19,23]的用户分别为18户和12户,
根据分层抽样,参与节水宣传活动的居民总共抽10户,
1Q1O
所以用水量在(15,19]的应抽取10x5=6户,用水量在(19,23]的应抽取10x3=4户
根据题意选出5户进行深度调研,可知随机变量Z的可能取值为1,3,5.
P(Z=l)=P(X=2,y=3)+尸(X=3,Y=2)=生詈」=罢]
p(z=3)=尸-4)+尸(X=4,y=i)=c"?:©=联=£
p(Z=5)=P(X=5,y=0)=M=5^=5
V_X|Q乙。乙什乙
故Z的分布列为
Z135
5_111
P
74242
£(Z)=1X|+3X11+5X±=^
则尺=尸仔=左)=4[|]]|「:(左=0,123,20),
(国)根据题意,
20-左
"3
<5J
kfinr5L5863
令4解得《
2.0—kz2、左+1
y55
处从<2。
ME15
又上eN*,故当左=12时,A取得最大值.
2.(2024•上海长宁•一模)2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海
国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会
者进行调查,并按年龄绘制了频率分布直方图,分组区间为[15,25),[25,35),[35,45),[45,55),[55,65),[65,75].
把年龄落在区间[15,35)内的人称为“青年人〃,把年龄落在区间[35,65)内的人称为“中年人",把年龄落在
[65,75]内的人称为“老年人”.
4频率
200名参会者的频率分布直方图
⑴求所抽取的"青年人"的人数;
(2)以分层抽样的方式从"青年人""中年人""老年人"中抽取10名参会者做进一步访谈,发现其中女性共4人,
这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.
①简述如何采用抽签法任选2人;
②设事件42人均为“中年人”,事件32人中至少有1人为男性,判断事件A与事件2是否独立,并说
明理由.
【答案】(1)80(2)①答案见解析;②事件A与事件B不独立,理由见解析
【分析】(])根据频率分布直方图求得。的值,然后求得“青年人"人数占比,从而可得"青年人"人数;
(2)①利用简单随机抽样设计抽签法任选2人即可;②根据独立事件判断公式,结合超几何分布概率问
题求解尸(A),尸(8),尸(AB),从而可得结论.
【详解】(1)由频率分布直方图可得(24+0.01x2+0.015x2)x10=1,解得:a=0.025,
又"青年人”占比为(0.015+0.025)xl0=0.4,
所以所抽取的“青年人"人数为200x0.4=80人;
(2)①先将10名参会者进行编号:1、2、L、10,并将10个号码写在完全相同的纸片上,
放入某容器中充分混合均匀,再取出2张,2张纸片上所对应的参会者就是要选取的人,
②"青年人""中年人""老年人"的人数之比为0.04:0.05:0.01=4:5:1,
所以10人中“中年人"共有5人,
2人均为“中年人"的概率P(A)=景=|,
Jo,
C213
2人中至少有1人为男性的概率P(B)=1-寸=百,
2人均为"中年人"且至少有1人为男性的概率尸=三,
因为尸(AB)^P(A).P(B),所以事件A与事件B不独立.
3.(2024・重庆・模拟预测)某中学为提升学生们的数学素养,激发大家学习数学的兴趣,举办了一场"数学
文化素养知识大赛”,分为初赛和复赛两个环节,初赛成绩排名前两百名的学生参加复赛.已知共有8000
名学生参加了初赛,现从参加初赛的全体学生中随机地抽取100人的初赛成绩作为样本,得到如下频率分
布直方图:
]频率/组距
0.030--------------1—I
。405060708090100学生初赛成绩
(百分制)
⑴规定初赛成绩中不低于90分为优秀,8090分为良好,7080分为一般,6070分为合格,60分以下
为不合格,若从上述样本中初赛成绩不低于80分的学生中随机抽取2人,求至少有1人初赛成绩优秀的概
率,并求初赛成绩优秀的人数X的分布列及数学期望;
⑵由频率分布直方图可认为该校全体参加初赛学生的初赛成绩Z服从正态分布其中〃可近似为
样本中的100名学生初赛成绩的平均值(同一组数据用该组区间的中点值代替),且02=65.已知小华的
初赛成绩为85分,利用该正态分布,估计小华是否有资格参加复赛?
(参考数据:A/65^8;若贝。尸(,一CT<Z<,+CF)Q0.6827,尸(〃一2cr<Z<4+2cr)k0.9545,
P(〃-3b<Z<4+3b卜0.9973.
171
【答案】⑴至少有1人初赛成绩优秀的概率为二,分布列见详解,£(X)=-.
(2)估计小华有资格参加复赛.
【分析】(1)根据频率分布直方图求得初赛成绩不低于80分的学生人数,再根据超几何分布写出随机变
量X的分布列,进而求得概率和数学期望;
(2)根据频率分布直方图估计正态分布的均值,进而利用3。原则估计全校参加初赛的学生中成绩不低于
85分的人数,即可估计小华是否有资格参加复赛.
【详解】(1)由频率分布直方图可知,
样本中位于区间[80,90)内的人数:0.015x10x100=15,
样本中位于区间[90,100]内的人数:0.005x10x100=5,
抽取的2人中成绩优秀的人数X可能的取值有0,1,2
尸斜=。)=£=11,P"=l)=智,P(X=2)=m=:
^20L20JOVz20AV
所以X的分布列为
X012
21151
P
383819
因此,至少有I人初赛成绩优秀的概率P(X21)=《+[=1,
381938
数学期望双X)=lx1|+2><,;.
JoLyZ
(2)由频率分布直方图可知:
〃二45x0.05+55x0.2+65x0.3+75x0.25+85x0.15+95x0.05=69,
由〃=65,得orp8,又ZN(69,65),
所以尸(ZZ85)=尸(ZNM+2b)=;[l-P(〃-2bWZ4〃+2b)]Q0.02275,
所以全校参加初赛学生中,不低于85分的约有8000x0.02275=182人,
因为182<200,所以估计小华有资格参加复赛.
题型四:成对数据的统计相关性
■TATATATATXTATATXTXTATATXTXTATXTXTXTXTATXTXT±TXTXTATATATATXT^AT^AT±^TAT±TXTXTATXTATATXTXTXTXTXTXTATXTATXTATATATXTATATATAT±TATATATXTXT±TXTXTXTXT^ATXTXTX,.i
点
成对数据的统计相关性问题,解题的思路是:
1、识题:两个变量间的关系有函数关系,相关关系和不相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系
2、研究方向:相关系数厂的计算
注意:相关系数是研究变量之间线性相关程度的量
假设两个随机变量的数据分别为(无1,%),(X2,>2),…,(X.,切),对数据作进一步的“标准化处理”处理,用
(x,—x)2,(y「y)2分别除和(z=1,2,...,w,x和y分别为x”&,
招和力,如…,%的均值),得卫二以二2,担二,丝二2,…,土二,,为简单起见,把上
IS*SyJ\SxSyJ\SxSyJ
r
述“标准化”处理后的成对数据分别记为(xj,yi'),(尤2',田),…,(Xj,y„),则变量x和变量y的样本相关系
数厂的计算公式如下:
Z(%,—%)(为一y)
3、必备工具:相关系数r的性质
(1)当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没
有线性相关关系.
(2)样本相关系数厂的取值范围为[—1,1].
当|〃|越接近1时,成对样本数据的线性相关程度越强;
当川越接近0时,成对样本数据的线性相关程度越弱.
(3)样本相关系数与标准化数据向量夹角的关系
厂=)夕=%x[Wcos,=cos供其中W=(xJ,x2',x„'),V=(yi',yi,y„'),|x'|=W=,,。为向量x'
和向量V的夹角).
1.(2025•山东日照•一模)近期根据中国消费者信息研究报告显示,超过40%的消费者更加频繁地使用网
上购物,某网购专营店统计了2025年1月5日到9日这5天到该专营店购物的人数》和时间第x天间的数
据,列表如下:
X12345
y75849398100
⑴由表中给出的数据判断是否可以用线性回归模型拟合人数,和时间第x天之间的关系?若可用,估计1
月10日到该专营店购物的人数;若不可用,请说明理由(人数用四舍五入法取整数,若相关系数H>。-75,
则线性相关程度很高,可以用线性回归模型拟合,r精确到0Q1);
(2)该专营店为了吸引顾客,推出两种促销方案.方案一:购物金额每满100元可减5元;方案二:一次性
购物金额超过8。。元可抽奖三次,每次中奖的概率均为:,且每次抽奖互不影响,中奖一次打9折,中奖
两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望
的角度分析选哪种方案更优惠.
参考数据:J4340x65.88.
£(乙-可(%-9)_
附:相关系数厂=I------------,&=取.
也(乙-丁)安他-才ZU一寸
Vi=ii=i1=1
【答案】⑴可用,109(2)选择方案二更划算
之a—元)(--丁)64
【分析】(1)先计算相关系数,=|广,=而京仁勿装人,再结合线性回归方程的
也(…)》(一『"340
VZ=1Z=1
知识求解即可;
(2)首先根据二项分布的概率公式求出X为600,800,900,1000的概率值,则方案二的期望可求,与方案一
的950进行比较即可判断.
【详解】(1)由表中数据可得元=3,歹=90,
555
£(%-可2=102(%-歹)2=4342&-元)(%-9)=64,
i=l;=11=1
ta-元)(%-歹)
i=l64
所以,=X0.97>0.75
忙(%一可欠(%一寸74340
Vz=i/■=1
所以可用线性回归模型拟合人数y与天数x之间的关系.
£(乙-丁)(%-9)
而2=J-----------------丝6.4
f(%-可210
Z=1
则&=歹—放=90-6.4x3=70.8所以5=6.4尤+70.8,
令x=6,可得9=109.2,所以1月10日到该专营店购物的人数约为109.
(2)若选方案一、需付款1000-50=95。元.
若选方案二、设需付款X元,则X的取值可能为600,800,900,1000,
);£
则尸(X=600)=C;x|="(X=800=Cx|\3_9
4I464
产);;2727
(X=900=Cxx—,P(X=1000)=C®x
64
19272759100
所以石(X)=600x—+800x—+900x—+1000x—<950,
6464646464
因此选择方案二更划算.
2.(2025•上海•模拟预测)为了检查一批零件的质量是否合格,检查员计划从中依次随机抽取零件检查:
第,次检查抽取,号零件,测量其尺寸加单位:厘米).检查员共进行了100次检查,整理并计算得到如下数
100100100
据:X%=52,X以=2428,2城=3。18.
Z=1i=li=l
⑴这批零件共有1000个.若在抽查过程中,质量合格的零件共有60个,估计这批零件中质量合格的零件数
量;
(2)若变量%与i存在线性关系,记为=加+区,求回归系数a的值;
⑶在抽出的100个零件中,检查员计划从中随机抽出20个零件进行进一步检查,记抽出的20个零件中有X
对相邻序号的零件,求X的数学期望.
示例零件序号为"1、2、4、5"与"1、2、3、5”时均恰有2对相邻序号的零件.
-5)
参考公式:(1)线性回归方程:y=ax+b,其中&=----------,b=y-ax.
f(吞-无)2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江交通职业技术学院《产品设计》2023-2024学年第二学期期末试卷
- 默契问答变态题目及答案
- 湖南水利水电职业技术学院《中国古代文学与作品选读二》2023-2024学年第二学期期末试卷
- 内蒙古经贸外语职业学院《生鲜农产品保藏与运销》2023-2024学年第二学期期末试卷
- 四川工商学院《中国哲学原著选读》2023-2024学年第二学期期末试卷
- 哈尔滨医科大学《儿童文学名著导读》2023-2024学年第二学期期末试卷
- 上海欧华职业技术学院《中医药健康与养生》2023-2024学年第二学期期末试卷
- 企业减污降碳协同增效的理论基础与发展趋势
- 绵阳飞行职业学院《英语文学导论(1)》2023-2024学年第二学期期末试卷
- 曲靖医学高等专科学校《生物医学光学》2023-2024学年第二学期期末试卷
- 工模外发管理流程模板
- 部编版高一上册语文第三课《百合花》课文原文教案及知识点
- 北京理工附中小升初分班考试真题
- 膀胱镜检查记录
- 英语社团活动课件
- 学前儿童发展心理学-情感
- 二年级下册数学教案 《生活中的大数》练习课 北师大版
- GB∕T 16762-2020 一般用途钢丝绳吊索特性和技术条件
- 电网施工作业票模板
- T∕CAEPI 31-2021 旋转式沸石吸附浓缩装置技术要求
- 国家级高技能人才培训基地建设项目实施管理办法
评论
0/150
提交评论