




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
10/10
命题热点自测(十)统计与成对数据的统计分析
一、选择题
1.(2021·山东潍坊三模)某学校参加志愿服务社团的学生中,高一年级有50人,高二年级有30人,高三年级有20人,现用分层随机抽样的方法从这100名学生中抽取学生组成一个活动小组,已知从高二年级的学生中抽取了6人,则从高三年级的学生中应抽取的人数为()
A.2 B.3
C.4 D.5
C[设高三抽取的人数为x人,则
eq\f(6,30)
=
eq\f(x,20)
,即x=4.故选C.]
2.为了解某班学生每周购买零食的支出情况,利用分层随机抽样的方法抽取了15人进行调查,调查结果如表,估算全班学生每周购买零食的支出的方差是()
人数
平均支出/元
方差
男生
9
40
6
女生
6
35
4
A.10.3 B.11.2
C.12 D.13.4
B[估算全班学生每周购买零食的支出的平均数是
eq\x\to(x)
=
eq\f(1,15)
×(9×40+6×35)=38,
方差s2=
eq\f(9,15)
×[6+(40-38)2]+
eq\f(6,15)
×[4+(35-38)2]=11.2.
故选B.]
3.(2021·山东青岛高三开学考试)已知一个样本,样本容量为10,平均数为15,方差为3,现从样本中去掉一个数据15,此时样本的平均数为
eq\x\to(x)
,方差为s2,则()
A.
eq\x\to(x)
>15,s2<3 B.
eq\x\to(x)
<15,s2>3
C.
eq\x\to(x)
=15,s2>3 D.
eq\x\to(x)
=15,s2<3
C[设10个数据为x1,x2,...,x9,15,
所以
eq\x\to(x)
=
eq\f(15×10-15,9)
=15,
又因为s2=
eq\f((\a\vs4\al\co1(x1-15))2+(\a\vs4\al\co1(x2-15))2+…+(\a\vs4\al\co1(x9-15))2,9)
,
且
eq\f((\a\vs4\al\co1(x1-15))2+(\a\vs4\al\co1(x2-15))2+…+(\a\vs4\al\co1(x9-15))2+(\a\vs4\al\co1(15-15))2,10)
=3,
所以s2=
eq\f(30,9)
>3.故选C.]
4.已知变量x,y的关系可以用模型y=c·ekx拟合,设
eq\o(z,\s\up8(^))
=lny,其变换后得到一组数据如下:
x
16
17
18
19
z
50
34
41
31
由上表可得经验回归方程
eq\o(z,\s\up8(^))
=-4x+
eq\o(a,\s\up8(^))
,则c=()
A.-4 B.e-4
C.109 D.e109
D[由表格数据知:
eq\x\to(x)
=
eq\f(16+17+18+19,4)
=17.5,
eq\x\to(z)
=
eq\f(50+34+41+31,4)
=39.
由
eq\o(z,\s\up8(^))
=-4x+
eq\o(a,\s\up8(^))
,得-4×17.5+
eq\o(a,\s\up8(^))
=39,则
eq\o(a,\s\up8(^))
=109.
∴
eq\o(z,\s\up8(^))
=-4x+109,
由y=c·ekx,得
eq\o(z,\s\up8(^))
=lny=ln(c·ekx)=lnc+lnekx=lnc+kx,
∴lnc=109,即c=e109.故选D.]
5.(2021·山东省平邑县第一中学高三开学考试)某校1000名学生参加数学竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是()
A.频率分布直方图中a的值为0.004
B.估计这20名学生数学考试成绩的第60百分位数为80
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为160
B[由10×
eq(\a\vs4\al\co1(2a+3a+7a+6a+2a))
=1可得a=0.005,故A错误;
前三个矩形的面积和为10×
eq(\a\vs4\al\co1(2a+3a+7a))
=0.6,所以这20名学生数学考试成绩的第60百分位数为80,故B正确;
这20名学生数学考试成绩的众数为75,故C错误;
总体中成绩落在[60,70)内的学生人数为3a×10×1000=150,故D错误.
故选B.]
6.(2021·哈尔滨模拟)下列说法:
①残差可用来判断模型拟合的效果;
②设有一个经验回归方程:
eq\o(y,\s\up6(^))
=3-5x,变量x增加一个单位时,y平均增加5个单位;
③经验回归直线:
eq\o(y,\s\up6(^))
=
eq\o(b,\s\up6(^))
x+
eq\o(a,\s\up6(^))
必过点(
eq\x\to(x)
,
eq\x\to(y)
);
④在一个2×2列联表中,由主算得χ2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是()
A.0B.1C.2D.3
B[对于①,残差可用来判断模型拟合的效果,残差越小,拟合效果越好,∴①正确;对于②,经验回归方程
eq\o(y,\s\up6(^))
=3-5x中,变量x增加一个单位时,y平均减少5个单位,∴②错误;对于③,经验回归直线
eq\o(y,\s\up6(^))
=
eq\o(b,\s\up6(^))
x+
eq\o(a,\s\up6(^))
必过样本点的中心(
eq\x\to(x)
,
eq\x\to(y)
),∴③正确;对于④,在2×2列联表中,由计算得χ2=13.079,对照临界值得,有99.9%的把握确认这两个变量有关系,99.9%>99%,∴④正确.综上,其中错误的命题是②,共1个.]
7.(多选)(2021·广东罗湖区高三月考)下列说法正确的为()
A.当总体是由差异明显的几个部分组成时,通常采用分层随机抽样
B.若m为数据xi(i=1,2,3,…,2021)的中位数,则m=x1011
C.回归直线可能不经过样本点的中心(
eq\x\to(x)
,
eq\x\to(y)
)
D.若随机变量ξ~N(μ,σ2),且随机变量η=2ξ-1,则η~N(2μ-1,4σ2)
AD[A.当总体是由差异明显的几个部分组成时,通常采用分层随机抽样,故正确;
B.数据xi(i=1,2,3,…,2021)大小顺序不定,故错误;
C.回归直线一定经过样本点的中心(
eq\x\to(x)
,
eq\x\to(y)
),故错误;
D.因为随机变量ξ~N(μ,σ2),且随机变量η=2ξ-1,所以η~N(2μ-1,4σ2),故正确.故选AD.]
8.(多选)为了增强学生的冬奧会知识,弘扬奥林匹克精神,北京市多所中小学开展了冬奥会项目科普活动.为了了解学生对冰壶这个项目的了解情况,在北京市中小学中随机抽取了10所学校,10所学校中了解这个项目的人数如图所示:
若从这10所学校中随机选取2所学校进行这个项目的科普活动,记X为被选中的学校中了解冰壶的人数在30以上的学校个数,则()
A.X的取值范围为{0,1,2,3}
B.P(X=0)=
eq\f(1,3)
C.P(X=1)=
eq\f(8,15)
D.E(X)=
eq\f(3,5)
BC[X的取值范围为{0,1,2},了解冰壶的人数在30以上的学校有4所,P(X=0)=
eq\f(C\o\al(0,4)·C\o\al(2,6),C\o\al(2,10))
=
eq\f(1,3)
,
P(X=1)=
eq\f(C\o\al(1,4)·C\o\al(1,6),C\o\al(2,10))
=
eq\f(8,15)
,P(X=2)=
eq\f(C\o\al(2,4)·C\o\al(0,6),C\o\al(2,10))
=
eq\f(2,15)
,所以E(X)=0×
eq\f(1,3)
+1×
eq\f(8,15)
+2×
eq\f(2,15)
=
eq\f(4,5)
.故选BC.]
二、填空题
9.某工厂新旧两条生产线的产量比为7∶3,为了解该工厂生产的一批产品的质量情况,采用样本量比例分配的分层随机抽样方法从两条生产线抽取样本,并观测样本的质量指标值,计算得新生产线质量指标的均值为10,方差为1,旧生产线质量指标的均值为9,方差为2,由此估计,该批产品的质量指标的均值为________,方差为________.
9.71.51[依题意,该批产品的质量指标的均值为
10×
eq\f(7,10)
+9×
eq\f(3,10)
=
eq\f(70+27,10)
=9.7.
该批产品的质量指标的方差为
eq\f(7,10)
×[1+(10-9.7)2]+
eq\f(3,10)
×[2+(9-9.7)2]
=
eq\f(7,10)
×1.09+
eq\f(3,10)
×2.49=1.51.]
10.(2021·福建漳州三中三模)根据下面的数据:
x
1
2
3
4
y
32
48
72
88
求得y关于x的经验回归方程为y=19.2x+12,则这组数据相对于所求的经验回归方程的4个残差的方差为________.(注:残差是指实际观察值与估计值之间的差.)
3.2[把x=1,2,3,4依次代入经验回归方程
y=19.2x+12,所得估计值依次为:y1=31.2,y2=50.4,y3=69.6,y4=88.8,
对应的残差依次为:0.8,-2.4,2.4,-0.8,它们的平均数为0,
所以4个残差的方差为
s2=
eq\f(0.82+-2.42+2.42+-0.82,4)
=3.2.]
11.(2021·江苏如皋高三开学考试)习近平在党的十九大工作报告中提出,永远把人民对美好生活的向往作为奋斗目标.在这一号召的引领下,全国人民积极工作,健康生活,当前“日行万步”正成为健康生活的代名词.某学校工会积极组织该校教职工参与“日行万步”活动,并随机抽取了该校100名教职工,统计他们的日行步数,按步数分组,得到如下饼图:
各段日行步数人数比例
若从日行步数超过10千步的教职工中随机抽取两人,则这两人的日行步数恰好一人在10~12千步,另一人在12~14千步的概率是________;设抽出的这两名教职工中日行步数超过12千步的人数为随机变量X,则E(X)=________.
eq\f(1,2)
eq\f(3,4)
[由已知10~12千步的人数为10%×100=10,12~14千步的人数为6%×100=6,
因此任取2人,一人在10~12千步,另一人在12~14千步的概率是P=
eq\f(10×6,C\o\al(2,16))
=
eq\f(1,2)
.
X的可能取值为0,1,2,
P(X=0)=
eq\f(C\o\al(2,10),C\o\al(2,16))
=
eq\f(3,8)
,P(X=1)=
eq\f(1,2)
,P(X=2)=
eq\f(C\o\al(2,6),C\o\al(2,16))
=
eq\f(1,8)
,
所以E(X)=1×
eq\f(1,2)
+2×
eq\f(1,8)
=
eq\f(3,4)
.]
三、解答题
12.(2021·重庆市清华中学校高三月考)目前,新冠病毒引发的肺炎疫情在全球发生,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.
(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;
(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层随机抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表,依据小概率值α=0.025的独立性检验,能否推断潜伏期长短与患者年龄有关.
年龄
潜伏情况
合计
短潜伏者
长潜伏者
60岁及以上
90
60岁及以下
140
合计
300
(3)研究发现,有5种药物对新冠病毒有一定的抑制作用,其中有2种特别有效,现在要通过逐一试验直到把这2种特别有效的药物找出来为止,每一次试验花费的费用是500元,设所需要的试验费用为X,求X的分布列与数学期望X.
附表及公式:
χ2=
eq\f(nad-bc2,a+bc+da+cb+d)
,
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
.
[解](1)平均数
eq\x\to(x)
=(0.02×1+0.08×3+0.15×5+0.18×7+0.03×9+0.03×11+0.01×13)×2=6,
这500名患者中“长潜伏者”的频率为(0.18+0.03+0.03+0.01)×2=0.5,
所以“长潜伏者”的人数为500×0.5=250人.
(2)由题意补充后的列联表如下,
年龄
潜伏情况
合计
短潜伏者
长潜伏者
60岁及以上
90
70
160
60岁及以下
60
80
140
合计
150
150
300
零假设H0:潜伏期长短与患者年龄无关,则
χ2=
eq\f(300×90×80-60×702,150×150×160×140)
=
eq\f(75,14)
≈5.357>5.024=x0.025.
所以依据小概率值α=0.025的独立性检验,我们推断H0不成立,即认为潜伏期长短与患者年龄有关.
(3)由题意知,所需要的试验费用X所有可能的取值为1000,1500,2000,
P(X=1000)=
eq\f(A\o\al(2,2),A\o\al(2,5))
=
eq\f(1,10)
,
P(X=1500)=
eq\f(C\o\al(1,2)C\o\al(1,3)A\o\al(2,2)+A\o\al(3,3),A\o\al(3,5))
=
eq\f(3,10)
,
P(X=2000)=
eq\f(C\o\al(1,2)A\o\al(1,3)A\o\al(2,3)C\o\al(1,2),A\o\al(4,5))
=
eq\f(3,5)
eq\b\lc\(\rc\)(\a\vs4\al\co1(或PX=2000=\f(C\o\al(1,2)C\o\al(1,3)A\o\al(2,3),A\o\al(3,5))=\f(36,60)=\f(3,5)))
,
所以X的分布列为
X
1000
1500
2000
P
eq\f(1,10)
eq\f(3,10)
eq\f(3,5)
数学期望E(X)=1000×
eq\f(1,10)
+1500×
eq\f(3,10)
+2000×
eq\f(3,5)
=1750.
13.(2021·重庆市第十一中学校高三月考)某创业者计划在南山旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以入住天数的频率作为各自的“入住率”,收费标准x与入住率y的散点图如图.
x/(元/日)
100
150
200
300
450
t/天
90
65
45
30
20
(1)若从以上五家“农家乐”中随机抽取两家深入调查,记ξ为“入住率“超过0.6的农家乐的个数,求ξ的分布列;
(2)令z=lnx,由散点图判断
eq\o(y,\s\up8(^))
=
eq\o(b,\s\up8(^))
x+
eq\o(a,\s\up8(^))
与
eq\o(y,\s\up8(^))
=
eq\o(b,\s\up8(^))
z+
eq\o(a,\s\up8(^))
哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求经验回归方程;(
eq\o(a,\s\up8(^))
,
eq\o(b,\s\up8(^))
的结果精确到0.1)
(3)根据第(2)问所求的经验回归方程,试估计收费标准为多少时,100天销售额L最大?(100天销售额L=100×入住率×收费标准x)
参考数据:
eq\o(b,\s\up8(^))
=
eq\f(\i\su(i=1,n,x)iyi-n\o(\x\to(x))\o(\x\to(y)),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)
,
eq\o(a,\s\up8(^))
=
eq\x\to(y)
-
eq\o(b,\s\up8(^))
eq\x\to(x)
,
eq\x\to(x)
=240,
eq\i\su(i=1,5,x)
iyi=457.5,
eq\i\su(i=1,5,x)
eq\o\al(2,i)
=365000,
eq\o(z,\s\up8(-))
≈5.35,
eq\i\su(i=1,5,z)
iyi≈12.72,
eq\i\su(i=1,5,z)
eq\o\al(2,i)
≈144.24,
eq\x\to(z)
2≈28.57,e5≈148,e5.4≈221.
[解](1)ξ的所有可能取值为0,1,2,
则P(ξ=0)=
eq\f(C\o\al(2,3),C\o\al(2,5))
=
eq\f(3,10)
,
P(ξ=1)=
eq\f(C\o\al(1,2)C\o\al(1,3),C\o\al(2,5))
=
eq\f(6,10)
=
eq\f(3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论