版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题十概率、统计
考点28随机事件的概率、古典概型与几何概型
题组
一、选择题
1.12023全国卷甲,5分]某校文艺部有4名学生,其中高一、高二年级各2
名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级
的概率为(D)
1112
%%D.-
[解析]记高一年级2名学生分别为由,a2,高二年级2名学生分别为瓦,b2,
则从这4名学生中随机选2名组织校文艺汇演的基本事件有(内,a2),
(%,瓦),(的也),(。2,比),(。2也),(瓦也),共6个,其中这2名学生来
自不同年级的基本事件有(的,瓦),(%_,&),(。2”1),(。2*2),共4个,所以
这2名学生来自不同年级的概率P=;=;,故选D.
2.[2023全国卷乙,5分]某学校举办作文比赛,共6个主题,每位参赛同学从
中随机抽取一个主题准备作文,则甲、乙两位参赛同学抽到不同主题的概率为
(A)
A.-B.-C.-D.-
6323
[解析]甲、乙两位同学抽到相同主题的情况有6种,故抽到不同主题的概率为
3.[2023全国卷乙,5分]设。为平面坐标系的坐标原点,在区域{(%,y)|lW
/+y2《4}内随机取一点,记该点为4,则直线。4的倾斜角不大于:的概率
为(C)
[解析]如图所示,题中所给区域为一圆环形区域,其面积为4TT-n=3n.由题
意,知2点应在图中阴影部分内(包含边界),其中NBO%=?,该部分区域的
面积占整个圆环面积的;,故所求概率为;,故选C.
44
4.[2022新高考卷I,5分]从2至8的7个整数中随机取2个不同的数,则这2
个数互质的概率为(D)
A.-11B.i1C.-2D.-
6323
[解析]从7个整数中随机取2个不同的数,共有21种取法,取得的2个数互质
的情况有{2,3},{2,5},{2,7},{3,4},{3,5},{3,7},[3,
8},{4,5},{4,7},{5,6},{5,7},{5,8},{6,7},{7,8},共
14种,根据古典概型的概率公式,得这2个数互质的概率为蓑=|.故选D.
5.[2022全国卷甲,5分]从分别写有1,2,3,4,5,6的6张卡片中无放回随
机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为(C)
A.-11B.i2C.-D.-2
5353
[解析]从写有1,2,3,4,5,6的6张卡片中无放回地抽取2张,共有15种取
法,它们分别是
(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),
(4,6),(5,6),其中卡片上的数字之积是4的倍数的是
(1,4),(2,4),(2,6),(3,4),(4,5),(4,6),共6种取法,所以所求概率是P=2=|.
故选C.
6.[2021全国卷乙,5分]在区间(0,)随机取1个数,则取到的数小于|的概率
为(B)
AA.-3c
4-i
机取1个数,则取到的数小于!的概率P=|咛=|.故选B.
7.[2021全国卷甲,5分]将3个1和2个0随机排成一行,则2个0不相邻的
概率为(C)
A.0.3B.0.5C.0.6D.0.8
[解析]把3个1和2个0排成一行,共有10种排法,分别是00111,1001L
11001,11100,01011,01101,OHIO,10101,10110,11010,其中2个0不
相邻的排法有6种,分别是01011,01101,OHIO,10101,10110,11010,所
以所求概率P=2=0.6.故选C.
10
8.[2020全国卷1,5分]设。为正方形4BCD的中心,在。,A,B,C,。中
任取3点,则取到的3点共线的概率为(A)
1214
A.-B.-C.-D.-
5525
[解析]根据题意作出图形,如图所示,在。中任取3点,有10种可
能情况,分别为(O4B),(CMC),(04。),(OBC),(OBD),(OCD),
(ABC),(ABD),(4CD),(BCD),其中取至U的3点共线有(04C)和(0BD)2
种可能情况,所以在。,A,B,C,D中任取3点,则取到的3点共线的概率为卷=
由故选A.
9.[2020新高考卷I,5分]某中学的学生积极参加体育锻炼,其中有96%的学
生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既
喜欢足球又喜欢游泳的学生数占该校学生总数的比例是(C)
A.62%B.56%C.46%D.42%
[解析]解法一不妨设该校学生总人数为100,既喜欢足球又喜欢游泳的学生人
数为x,则100X96%=100X60%—%+100X82%,所以X=46,所以既喜
欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.选C.
解法二设喜欢足球为事件2,喜欢游泳为事件B,由题意知,P(2)=0.6,P(B)=
0.82,P(AUB)=0.96,所以P(4CB)=P⑷+P(B)-P(AUB)=0.6+0.82-
0.96=0.46.故选C.
10.[2019全国卷II,5分]生物实验室有5只兔子,其中只有3只测量过某项指
标.若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为(B)
[解析]设3只测量过某项指标的兔子为a,B,C,另2只兔子为a力,从这5只
兔子中随机取出3只,则基本事件共有10种,分别为(4B,C),
(4B,d),Q4,B,b),(4C,a),Q4,C,b),Q4,a,b),
(B,C,a),(B,C,b),(B,a,b),(C,a,b),其中“恰有2只测量过该指标”的取法有
6种,分别为(4B,a),(A,B,b),Q4,C,a),(4C,b),(B,C,a),(B,C,b),因此所求的
概率为2=I,选B-
105
11.[2019全国卷III,5分]两位男同学和两位女同学随机排成一列,则两位女同
学相邻的概率是(D)
A.-11B.i1C.-1D.-
6432
[解析]将两位男同学分别记为AlA,两位女同学分别记为B],B2,则四位同学
排成一列,情况有A1A2B1B2,A1A2B2B1,A2A1B1B2,A2A1B2B1,
A1B1A2B2,A1B2A2B1,A2B1A1B29A2B2A1B1,B1A1A2B29B1A2A1B2,
B2A1A2B1,B2A2A1B1,A]B]B2A2,A1B2B1A2,A2B1B2A1,A2B2B1A1,
B1B2A1A2,BiB2A2A1,B2B1A1A2,B2B1A2A1,
B1A1B2A2,B1A2B2A1,B2A1B1A2,B2A2BlAl,共有24种,其中2名女同学相邻的
有12种,所以所求概率P=].故选D.
二、填空题
12.[2022全国卷乙,5分]从甲、乙等5名同学中随机选3名参加社区服务工
作,则甲、乙都入选的概率为j
TU
[解析]甲、乙等5名同学分别标记为的,。2,。3,。4,。5,其中甲标记为内,
乙标记为。2.从中随机选3名参加社区服务工作的事件有{的,"3},{的,
,。4},{。19'{。2,"4},{。29,a§}'{。3,"5},{。1,
a3,a4]>{的,a3,a5],{a2,a4,a5],{%,a4,a5),共计10种.甲、乙都入
aaaa
选的事件有{的,a2,a3)(i>2,aJ,[i>2Qs},共计3种,故所求概率
P10.
13.[2020江苏,5分]将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的
点数,则点数和为5的概率是,
[解析]将一颗质地均匀的正方体骰子先后抛掷2次,向上的点数共有36种情
况,其中点数和为5的情况有(1,4),(2,3),(3,2),(4,1),共4种,则所求概
率为e=J-
考点29抽样方法与用样本估计总体
题组一
一、选择题
1.12022全国卷乙,5分]分别统计了甲、乙两位同学16周的各周课外体育运动
时长(单位:h),得如下茎叶图:
5.
85306.3
75327.46
64218.12256666
9.0238
10.
则下列结论中错误的是(C)
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
[解析]对于A,甲同学周课外体育运动时长的中位数为空手=7.4,故选项A
正确;对于B,乙同学周课外体育运动时长大部分在8h以上,故平均数大于
8,故选项B正确;对于C,甲同学周课外体育运动时长大于8的概率为《=
0.375<0.4,故选项C错误;对于D,乙同学周课外体育运动时长大于8的概
率为兰=0.8125>0.6,故选项D正确.故选C.
16
2.[2021天津,5分]从某网络平台推荐的影视作品中抽取400部,统计其评分数
据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得
到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是(D)
频率/组距
[解析]由频率分布直方图可知评分在区间[82,86)内的影视作品的频率为0.05X
4=0.2,又共有400部影视作品,所以评分在区间[82,86)内的影视作品的数量为
400X0.2=80,故选D.[4T]
【易错点拨】频率分布直方图的纵轴不是频率,而是黑,即频率分布直方图
组距
中小矩形的面积表示频率.
3.[2020全国卷III,5分]设一组样本数据%1,£2,…,出的方差为0.01,则数
据10%,10x2,10xn的方差为(C)
A.0.01B.0.1C.1D.10
[解析]已知样本数据尤1,%2的方差为0.01,由方差的性质可得样本数据
10石,10x2,…,10久n的方差为X0.01=1,故选C.
4.[2019全国卷I,5分]某学校为了解1000名新生的身体素质,将这些学生
编号为1,2,...,1000,从这些新生中用系统抽样方法等距抽取100名学生进行
体质测验.若46号学生被抽到,则下面4名学生中被抽到的是(C)
A.8号学生B.200号学生C.616号学生D.815号学生
[解析]由系统抽样可知第一组学生的编号为1〜10,第二组学生的编号为11〜
20,……,最后一组学生的编号为991〜1000.设第一组取到的学生编号为“,
则第二组取到的学生编号为%+10,以此类推,所取的学生编号为10的倍数加
%.因为46号学生被抽到,所以%=6,所以616号学生被抽到,故选C.
二、填空题
5.[2020江苏,5分]已知一组数据4,2a,3-a,5,6的平均数为4,则a的值是2.
[解析]由平均数公式可得4+2a+(31a)+5+6=4,解得。=2.
6.[2019江苏,5分]已知一组数据6,7,8,8,9』0,则该组数据的方差是|.
[解析]数据6,7,8,8,9,10的平均数是6+7+818+9+1。=&,则方差是4+i+°:°+i+4=
66
5
3・
三、解答题
7.[2023全国卷乙,12分]某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理
效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机
地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的
伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为期,%(i=
1,2,…,10),试验结果如下:
试验序号i12345678910
伸缩率阳545533551522575544541568596548
伸缩率%536527543530560533522550576536
记Zj=Xi-yz(i=1,2,*1,z2,z10的样本平均数为z,样本方差为s?.
(1)求2,s2.
[答案]由题意,求出4的值如表所示,
试验序号i12345678910
4968-8151119182012
则2=卷X(9+6+8—8+15+11+19+18+20+12)=11,
2
s2=±x[(9-11)2+(6-II)+(8-11)2+(-8-11)2+(15-11)2+
(11-11)2+(19-11)2+(18-11)2+(20-II)2+(12-11)2]=61.
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩
率是否有显著提高(如果2篇,则认为甲工艺处理后的橡胶产品的伸缩率较
乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
[答案]因为2—=2V6A=V244,z=11=V121>V244,
所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸
缩率有显著提高.
8.[2020全国卷I,12分]某厂接受了一项加工业务,加工出来的产品(单位:
件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、
C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每
件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工
成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接
加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等
级,整理如下:
甲分厂产品等级的频数分布表
等级ABCD
频数一40202020
乙分厂产品等级的频数分布表
等级ABCD
频数28173421
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
[答案]由试加工产品等级的频数分布表知,
甲分厂加工出来的一件产品为A级品的概率的估计值为芸=0.4;
乙分厂加工出来的一件产品为A级品的概率的估计值为名=0.28.
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依
据,厂家应选哪个分厂承接加工业务?
[答案]由数据知甲分厂加工出来的100件产品利润的频数分布表为
利润6525-5-75
频数40202020
因此甲分厂加工出来的100件产品的平均利润为
65x40+25x20—5x20-75x20《广
-------------------------------=15.
100
由数据知乙分厂加工出来的100件产品利润的频数分布表为
利润70300-70
一频数一28173421
因此乙分厂加工出来的100件产品的平均利润为
70X28+30X17+0X34-70X21.八
-----------------------------------=10.
100
比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.
题组二
一、选择题
1.[2022全国卷甲,5分]某社区通过公益讲座以普及社区居民的垃圾分类知
识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回
答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确
率如图,则(B)
00%
95%
90%-----------•-------
<85%--•---------------
80%-----•--•-------•--
黑
H75%*------------------*—*讲座刖
70%■”•讲座后
65%
60
%;-----*-------------
o--*----------------
2J_____I____I____I_____I」_I____I.
345678910
居民编号
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
[解析]对于A,讲座前问卷答题的正确率的中位数是誓吃=72.5%,所以A
错误;对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,
85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B
正确;对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷
答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问
卷答题的正确率的标准差,所以C错误;对于D,讲座前问卷答题的正确率的
极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=
20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极
差,所以D错误.故选B.
2.[2021全国卷甲,5分]为了解某地农村经济情况,对该地农户家庭年收入进
行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
频率
根据此频率分布直方图,下面结论中不正确的是(C)
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
[解析]对于A,根据频率分布直方图知该地农户家庭年收入低于4.5万元的农户比
率估计为(0.02+0.04)X1=0.06,故A正确;
对于B,根据频率分布直方图知该地农户家庭年收入不低于10.5万元的农户比
率估计为(0.04+0.02+0.02+0.02)X1=0.10,故B正确;
对于C,根据频率分布直方图知该地农户家庭年收入的平均值估计为3X0.02+
4x0.04+5x0.10+6x0.14+7x0.20+8x0.20+9x0.10+10x0.10+
11x0.04+12x0.02+13x0.02+14x0.02=7.68(万元),故C错误;
对于D,根据频率分布直方图知该地农户家庭年收入介于4.5万元至8.5万元之
间的农户比率估计为(0.10+0.14+0.20+0.20)X1=0.64,故D正确.
3.[2019全国卷II,5分]演讲比赛共有9位评委分别给出某选手的原始评分,
评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7
个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(A)
A.中位数B.平均数C.方差D.极差
[解析]记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排
列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是
中位数,故选A.
【方法技巧】平均数能反映一组数据的平均水平;中位数是把一组数据从小到
大或从大到小排列,若该组数据的个数为奇数,则取中间的数据,若该组数据
的个数为偶数,则取中间两个数据的平均数.平均数和中位数都能反映一组数据
的集中趋势,标准差和方差都能反映一组数据的稳定程度.
二、填空题
4.[2019全国卷II,5分]我国高铁发展迅速,技术先进.经统计,在经停某站的
高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有
10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值
为0.98.
[解析]由题意得,经停该站的高铁列车中正点的列车总数约为10x0.97+20X
0.98+10X0.99=39.2,经停该站的高铁列车总数为10+20+10=40,所
以经停该站高铁列车所有车次的平均正点率约为要=0.98.
40
三、解答题
5.[2023新高考卷II,12分]某研究小组经过研究发现某种疾病的患病者与未患
病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病
者该指标的频率分布直方图:
频率/组距
o40
o.o38
o.o36
o.o34
o.
0.010---------------------------------------
。707580859095100105
未患病者
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为
阳性,小于或等于C的人判定为阴性,此检测标准的漏诊率是将患病者判定为
阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假
设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
[答案]由题图知(100-95)x0.002=1%>0.5%,所以95<c<100,
设X为患病者的该指标,
则p(c)=P(X<c)=(c-95)x0.002=0.5%,(从频率分布直方图中正确读
取相关数据是求解问题的关键)
解得c=97.5.
设丫为未患病者的该指标,
则q(c)=P(Y>c)=(100-97.5)X0.01+5x0.002=0.035=3.5%.
(2)设函数/(c)=p(c)+q(c).当ce[95,105]时,求/(c)的解析式,并求/(c)
在区间[95,105]的最小值.
[答案]当95WCW100时,(提醒:注意分类讨论思想的应用)
p(c)=(c-95)x0.002=0.002c-0.19,
q(c)=(100-c)x0.01+5x0.002=-0.01c+1.01,
所以/(c)=P(c)+q(c)=-0.008c+0.82;
当100<c<105时,
p(c)=5x0,002+(c-100)x0.012=0.012c-1.19,
q(c)=(105—c)x0.002=-0.002c+0.21,
所以/(c)=p(c)+q(c)=0.01c—0.98.
综上所述,穴c)=+882,95<c<100,
""卬八)(0.01c-0.98,100<c<105.
由一次函数的单调性知,函数/(c)在[95,100]上单调递减,在(100,105]上单
调递增,(提示:对于一次函数y=kx+b(k0),当时,函数单调递
增;当左<0时,函数单调递减)
作出/(c)在区间[95,105]上的大致图象(略),可得/(c)在区间[95,105]的最
小值/(c)min=/(100)=-0.008x100+0.82=0.02.
6.[2021全国卷乙,12分]某厂研制了一种生产高精产品的设备,为检验新设备
生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产
品,得到各件产品该项指标数据如下:
旧设备9.810.310.010.29.99.810.010.110.29.7
新设备10.110.410.110.010.110.310.610.510.410.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为7和7,样本方差分
别记为黄和登.
(1)求1,y,S2;
[答案]由题中数据可得,元=2X(9.8+10.3+10.0+10.2+9.9+9.8+
10.0+10.1+10.2+9.7)=10.0,歹=裔x(10.1+10.4+10.1+10.0+
10.1+10.3+10.6+10.5+10.4+10.5)=10.3,
s”总X[(9.8-10.0)24-(10.3-10.0)2+(10.0-10.0)2+(10.2-10.0)2+
(9.9-10.0)2+(9.8-10.0)2+(10.0-10.0)2+(10.1-10.0)2+
(10.2-10.0)2+(9.7-10.0)2]=0.036,
s上2x[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+
(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+
(10.4-10.3)2+(10.5-10.3)2]=0.04.
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果
7-丁之2传则认为新设备生产产品的该项指标的均值较旧设备有显著提
高,否则不认为有显著提高).
[答案]由(1)知歹一元=10.3-10.0=0.3,2=2]。。3;;0.04=
2,0.0076,
则0.3=70^09>2V0.0076=V0.0304,
所以可判断新设备生产产品的该项指标的均值较旧设备有显著提高.
7.[2020全国卷II,12分]某沙漠地区经过治理,生态系统得到很大改善,野生
动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的
200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得
到样本数据=1,2,…,20),其中期和%分别表示第i个样区的植物覆盖
2020
面积(单位:公顷)和这种野生动物的数量,并计算得2/=60,2%=
202020
1200,2(修一。2=80,£(%-=9000-?)(%—力=800.
i=li=li=l
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样
区这种野生动物数量的平均数乘以地块数);
1*20
[答案]由已知得样本平均数歹=92%=60,从而该地区这种野生动物数量的
zui=l
估计值为60X200=12000.
(2)求样本国,%)(»=1,2,...,20)的相关系数(精确到0.01);
[答案]样本(如%)(i=1,2,...,20)的相关系数
20
E(xt-x)(yi-y)
8002A/2八…
r=-.=—a0.94.
2020780X90003
区8-为2区历2
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表
性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的
抽样方法,并说明理由.
附:相关系数r=-1.414.
i=li=l
[答案]分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进
行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相
关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异
也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提
高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
8.[2019北京,12分]改革开放以来,人们的支付方式发生了巨大转变.近年来,移
动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式
的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两
种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分
布情况如下:
支付金额不大于2000元大于2000元
支付方式
仅使用A27人3人
仅使用B24人1人
(I)估计该校学生中上个月A,B两种支付方式都使用的人数;
[答案]由题知,样本中仅使用A的学生有27+3=30人,仅使用B的学生有
24+1=25人,
A,B两种支付方式都不使用的学生有5人.
故样本中A,B两种支付方式都使用的学生有100-30-25-5=40人.
估计该校学生中上个月A,B两种支付方式都使用的人数为益XI000=400.
(II)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2
000元的概率;
[答案]记事件C为“从样本仅使用B的学生中随机抽取1人,该学生上个月的
支付金额大于2000元”,则P(C)=/=0.04.
(III)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学
生中随机抽查1人,发现他本月的支付金额大于2000元.结合(II)的结果,能否
认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由.
[答案]记事件E为“从样本仅使用B的学生中随机抽查1人,该学生本月的支
付金额大于2000元”.
假设样本仅使用B的学生中,本月支付金额大于2000元的人数没有变化,则由
(II)知,P(E)=0.04.
答案示例1:可以认为有变化.理由如下:
P(E)比较小,概率比较小的事件一般不容易发生,一旦发生,就有理由认为本月支
付金额大于2000元的人数发生了变化.所以可以认为有变化.
答案示例2:无法确定有没有变化.理由如下:
事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的.所以无法
确定有没有变化.
考点30回归分析与独立性检验
题组一
一、选择题
1.12023天津,5分]调查某种群花萼长度和花瓣长度,所得数据如图所示.其
中相关系数r=0.8245,下列说法正确的是(C)
花萼长度
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈负相关
C.花瓣长度和花萼长度呈正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245
[解析]因为相关系数r=0.8245>0.75,所以花瓣长度和花萼长度的相关性较
强,并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的
数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误
故选C.
2.[2020全国卷I,5分]某校一个课外学习小组为研究某作物种子的发芽率y
和温度》(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,
由实验数据®,%)(i=1,2,...,20)得到下面的散点图:
由此散点图,在10。(:至40。(:之间,下面四个回归方程类型中最适宜作为发芽
率y和温度久的回归方程类型的是(D)
A.y—a+bxB.y—a+bx2C.y—a+bexD.y—a+binx
[解析]根据题中散点图,用光滑的曲线把图中各点依次连起来(图略),由图
并结合选项可排除A,B,C,故选D.
二、解答题
3.[2022全国卷甲,12分]甲、乙两城之间的长途客车均由4和B两家公司运营.
为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个
班次,得到下面列联表:
准点班次数未准点班次数
A24020
B21030
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
[答案]由题表可得a公司甲、乙两城之间的长途客车准点的概率为=
240+20
12
13,
B公司甲、乙两城之间的长途客车准点的概率为="
210+308
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属
公司有关?
附.1(2_」(ad-bc)2
叩,—(a+b)(c+d)(a+c)(b+d)'
P(K2>k)0.1000.0500.010
k2.7063.8416.635
500X(240X30-20X210)2
[答案]K2的观测值/c=«3.205>2.706
(240+20)x(210+30)x(240+210)x(20+30)
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有
关.
4.[2021全国卷甲,12分]甲、乙两台机床生产同种产品,产品按质量分为一级
品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件
产品,产品的质量情况统计如下表:
―"■级品二级品合计
甲机床15050200
乙机床12080200
合计一270130400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
[答案甘艮据表中数据知,甲机床生产的产品中一级品的频率是黑=0.75,乙
机床生产的产品中一级品的频率是黑=0.6.
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:依二,「*炉,
(a+b)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
[答案甘艮据列联表中的数据可得K2的观测值/C=以80二20::0)2=嘤
10.256.
因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产
品质量有差异.
5.[2019全国卷I,12分]某商场为提高服务质量,随机调查了50名男顾客和
50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联
表:
满意不满意
项顾客4010
女顾客3020
(1)分别估计男、女顾客对该商场服务满意的概率;
[答案]由调查数据知,男顾客中对该商场服务满意的比率为为=0.8,因此男顾
客对该商场服务满意的概率的估计值为0.8.
女顾客中对该商场服务满意的比率为为=0.6,因此女顾客对该商场服务满意的
概率的估计值为06
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
n(ad-bc)2
(a+匕)(c+d)(a+c)(匕+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
[答案]K2的观测值k=1%黑时詈2X4.762.
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差
异.
题组二
解答题
1.12023全国卷甲,12分]一项试验旨在研究臭氧效应,试验方案如下:选40
只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验
组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时
间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.218.820.221.322.523.225.8
26.527.530.132.634.334.835.6
35.635.836.237.340.543.2
试验组的小白鼠体重的增加量从小到大排序为
7.89.211.412.413.215.516.5
18.018.819.219.820.221.622.8
23.623.925.128.232.336.5
(1)计算试验组的样本平均数;
[答案]试验组的样本平均数为/X(7.8+9.2+11.4+12.4+13.2+15.5+
16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+
28.2+32.3+36.5)=19.8.
(2)(i)求40只小白鼠体重的增加量的中位数再分别统计两样本中小
于血与不小于血的数据的个数,完成如下列联表:
<m>m
对照组
试验组
[答案]将40个数据按照从小到大的顺序依次排列,得最中间的两个数据即第
20个和第21个数据分别为23.2和23.6,则40只小白鼠体重的增加量的中位数
列联表如下:
<m>m
对照组614
试验组146
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境
中与在正常环境中体重的增加量有差异?
n(ad-bc)2
(a+匕)(c+d)(a+c)(乃+d)
Pg>k)0.1000.0500.010
k2.7063.8416.635
n{ad-bc)2_4OX(6X6-14X14)2_
[答案]K2==6.4>3,841,
(a+b)(c+d)(a+c)(匕+d)20X20X20X20
故有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量
有差异.
2.[2022全国卷乙,12分]某地经过多年的环境治理,已将荒山改造成了绿水青
山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树
的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i12345678910总和
根部横截面0.060.040.080.080.050.050.070.070.060.6
材积量%0.250.400.220.540.510.340.360.460.420.403.9
101010
并计算得=0.038,2W=1.6158=0.2474.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
10
ZXi
[答案]估计该林区这种树木平均一棵的根部横截面积歹=+=詈=0.06,
10
Syioo
估计该林区这种树木平均一棵的材积量歹=号丁=詈=0.39.
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到
0.01);
1010
[答案]2(勾一元)3-刃=2勾%-10双=0.0134,
1=11=1
1010
£(%i—x)*2=£*-10叵y=0.002,
i=li=l
1010
£(%一9)2=£*—10(y)2=0.0948,
i=li=l
1010______________________________________________________
J2(%i-君22(%_歹)2=Vo.002x0.0948=V0.0001x1.896«0.01x
i=li=l
1.377=0.01377,
10
所以样本相关系数r=,1=1x鬻1〜0.97.
|10100.01377
2(Xi-x)2£(y-y)2
Ji=ii=i£
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根
部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利
用以上数据给出该林区这种树木的总材积量的估计值.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西南林业大学《传热传质学》2022-2023学年第一学期期末试卷
- 西京学院《汉文字学》2022-2023学年第一学期期末试卷
- 2024年01月11080工程数学(本)期末试题答案
- 西昌学院《中国少数民族文学史》2022-2023学年第一学期期末试卷
- 西北大学《计算物理》2022-2023学年第一学期期末试卷
- 《代谢调节盖》课件
- 《健康产品培训》课件
- ifrs17保险合同负债的计量模型
- 供稿合同模板
- 《施工合同司法解释(一)》第四十三条
- 2024年协议延期约定详细范本版
- 2023年北京市燕山初三二模英语试卷及答案
- 机场视频监控安全防范方案
- GB/T 44843-2024在用自动扶梯和自动人行道安全评估规范
- 计量经济学论文-城镇单位就业人员工资总额的影响因素
- 山东省聊城市2024-2025学年高一上学期11月期中物理试题
- 2024年秋新人教PEP版3年级上册英语教学课件 Unit 5 Part B Start to read
- 孙悟空课件教学课件
- 新能源行业光伏发电与储能技术方案
- 影视剧组安全管理规定及应对措施
- 四川省凉山州2023-2024学年七年级上学期期末检测历史试卷
评论
0/150
提交评论