2023高考数学复习练44 统计与成对数据的统计分析_第1页
2023高考数学复习练44 统计与成对数据的统计分析_第2页
2023高考数学复习练44 统计与成对数据的统计分析_第3页
2023高考数学复习练44 统计与成对数据的统计分析_第4页
2023高考数学复习练44 统计与成对数据的统计分析_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

微专题44统计与成对数据的统计分析

高考定位高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样

本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,

中等难度.

真题演练感悟高考练真题明方向

L(2022∙全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲

座效果,随机抽取IO位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类

知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则()

*讲座前

•讲座后

67891()居民编号

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

答案B

70%+7,%

解析对于A,讲座前问卷答题的正确率的中位数是——γ^=12.5%,所以A

错误;

对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,

90%,95%,100%,100%,其平均数显然大于85%,所以B正确;

对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正

确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正

确率的标准差,所以C错误;

对于D,讲座前问卷答题的正确率的极差是95%—60%=35%,讲座后问卷答题

的正确率的极差是100%—80%=20%,所以讲座前问卷答题的正确率的极差大于

讲座后问卷答题的正确率的极差,所以D错误.故选B.

2∙(2022∙全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计

一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截

面积(单位:π?)和材积量(单位:m)得到如下数据:

样本

12345678910总和

号i

根部

横截

0.040.060.040.080.080.050.050.070.070.060.6

面积

Xi

材积一

0.250.400.220.540.510.340.360.460.420.403.9

量,V,

IO10

并计算得玄斤=0.038,EIM=1.6158,

gx»,=0.2474.

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横

截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上

数据给出该林区这种树木的总材积量的估计值.

El(XLX)Cy∣~y)

附:相关系数r=.一,/1.896子1.377.

λ∕,⅛(XLX)2,⅛(%—))2

解(1)样本中10棵这种树木的根部横截面积的平均值X=m=0∙06(m2),

样本中10棵这种树木的材积量的平均值

y=⅛=0∙39(m3),

据此可估计该林区这种树木平均一棵的根部横截面积为0.06∏Λ平均一棵的材积

量为0.39m3.

10--10—

∑l(Xi—x)(V—y)∑jx∕yz^-IOxy

⑵——∏oςioς/ioςioZ

Λj⅛(XL尤)2⅛(y,-y)2y∣(,⅝^-10x2)(⅛j?-10√)

0.2474-10×0.06×0.390.01340.0134—

,=iQ----------97

√(0.038-10×0.062)(1.6158-10×0.392)√0.00018960∙01377''

(3)设该林区这种树木的总材积量的估计值为Fm3,

又已知树木的材积量与其根部横截面积近似成正比,

,0.06186

可ΓZ得BWF

解得y=l209(m3).

则该林区这种树木的总材积量估计为1209nA

3∙(2022∙新高考I卷)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生

习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调

查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对

照组),得到如下数据:

不够良好良好

病例组4060

对照组1090

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表

示事件”选到的人患有该疾病",与,(8-)_的比值是卫生习惯不够良

P(β∣A)P(B∣A)

好对患该疾病风险程度的一项度量指标,记该指标为R.

TP(Λ∣B)P(Λ∣B)

①证明ncl:R=----!~■----------;

P(Λ∣B)P(Λ∣B)

②利用该调查数据,给出P(AIB),P(AIB)的估计值,并利用①的结果给出R的估

计值.

2_________n(ad—be)2_______________

•ʌ(«+/?)(c+4)(α+C)(b+d)'

a0.0500.0100.001

3.8416.63510.828

Q,200X(40X90—60X10)】

(1)解F=^~50×150×100×100=24>6.635,

所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异∙

P(BA)

P(BIA)

P(BA)

P(3∣A)∙P(BIA)

⑵①证明R=P(BA)

P(B∣Λ)P(B∣A)

由题意知,只需证明一(6A)P(B∣A)P(AiB)P(AlB)^

--------=----------------即an可,

P(B∣Λ)P(B∣A)P(AIB)P(A∣B)

P(AB)P(AB)

,上P(A)P(A)p(AB)P(AB)

上式左边=--=--

P(AB)P(AB)PCAB)P(AB)

P(A)P(A)

P(AB)P(AB)

P(B)P(B)p(AB)-P(AB)

右边=---------------=---------------

P(AB)P(AB)P(AB)P(AB)

P(B)P(B)

左边=右边,故R=P(…(A⑻

P(A∣B)P(AIB)

②解由调查数据可知

402-101

P(AIB)=而=予P(A∣B)=100-10,

且P(AlB)=I—P(AIB)=;,

9

P(AE)=I-P(AlB)=讪,

2_9_

“,5W

所以R=WXT=6.

5lθ

热点聚焦分类突破研热点析考向

热点一用样本估计总体

I核心归纳

频率

1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示篇,频率=组距

、,频率

2.在频率分布直方图中各小长方形的面积之和为1.

3.利用频率分布直方图求众数、中位数与平均数.

(1)最高的小长方形底边中点的横坐标即众数.

(2)中位数左边和右边的小长方形的面积和相等.

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的

面积乘以小长方形底边中点的横坐标之和.

考向1统计图表与数字特征的应用

例1(1)(2022.西安模拟)某市中小学生人数和近视情况分别如图甲和图乙所示,为

了解该地区中小学生近视形成的原因,现用分层随机抽样的方法抽取5%的学生

进行调查,则样本容量和抽取的高中生近视人数分别为()

甲乙

A.750,100B.1500,100

C.1500,120D.750,120

(2)(多选)(2022.福州三模)空气质量指数(简称AQI)是能够对空气质量进行定量描

述的数据,AQl越小代表空气质量越好.甲、乙两地在9次空气质量监测中的AQl

数据如图所示,则下列说法正确的是()

空气质量指数(AQl)

A.甲地的AQI的平均值大于乙地

B.甲地的AQI的方差小于乙地

C.甲地的AQI的中位数大于乙地

D.甲地的空气质量好于乙地

答案(I)B(2)ABC

解析(1)由题意,样本容量为(18500+7500+4000)X5%=1500,

抽取的高中生近视人数为4000X5%X0.5=100,故选B.

(2)由AQl数据图知,甲地9次监测数据有7次均在50以上,只有两次在50以下,

并且与50相差较小,乙地9次监测数据有7次均在50以下,有两次在50附近,

并且与50相差很小,甲地的AQI的平均值大于50,乙地的AQI的平均值小于

50,甲地的AQl的平均值大于乙地,A正确;

甲地9次监测数据的折线图比较平滑,波动较小,乙地9次监测数据波动较大,

即甲地的AQl的方差小于乙地,B正确;

甲地9次监测数据的中位数大于50,乙地9次监测数据的中位数小于50,甲地的

AQl的中位数大于乙地,C正确;

甲地9次监测数据中有8个都高于乙地对应监测数据,再结合平均值、中位数看,

乙地的空气质量要好于甲地,D不正确.

考向2用样本的频率分布估计总体分布

例2为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小

鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠

给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用

某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下

直方图:

甲离子残留百分比直方图

频率

记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)

的估计值为0.70.

(1)求乙离子残留百分比直方图中α,人的值;

(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值

为代表).

解(1)由已知得0.70=α+0.20+0.15,

故π=0.35,

⅛=1-0.05-0.15-0.70=0.10.

(2)甲离子残留百分比的平均值的估计值为

2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.

乙离子残留百分比的平均值的估计值为

3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.

规律方法1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它

们所反映的情况有着重要的实际意义.

2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;

本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何

意义当成频率,导致样本数据的频率求错.

训练1(IX多选)(2022.济南质检)为了解某地农村经济情况,对该地农户家庭年收

入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:

频率

根据此频率分布直方图,下面结论中正确的是()

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%

C.估计该地农户家庭年收入的平均值不超过6.5万元

D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间

答案ABD

解析对于A,根据频率分布直方图可知,该地农户家庭年收入低于4.5万元的

农户比率估计为(0.02+0.04)X1×100%=6%,故A正确;

对于B,根据频率分布直方图可知,该地农户家庭年收入不低于10.5万元的农户

比率估计为(0.04+0.02+0.02+0.02)X1X100%=10%,故B正确;

对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值估计为3X0.02

+4X0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+ll×0.04

+12X0.02+13X0.02+14X0.02=7.68(万元),故C错误;

对于D,根据频率分布直方图可知,该地农户家庭年收入介于4.5万元至8.5万元

之间的农户比率估计为(0.10+0.14+0.20+0.20)*1X100%=64%>50%,故D正

确.

(2)某工厂A,B两条生产线生产同款产品,若产品按照一、二、三等级分类,则

每件可分别获利10元、8元、6元,现从A,B生产线生产的产品中各随机抽取

100件进行检测,结果统计如图:

①分别计算两条生产线抽样产品获利的方差,以此作为判断依据,说明哪条生产

线的获利更稳定;

②估计该厂产品产量为2000件时的利润以及一等级产品的利润.

一1

解①从A生产线随机抽取的100件产品获利的平均数Xl=而X(IOX20+8X60

+6X20)=8(元),

方差为s?=击XKIo-8)2χ20+(8—8)2χ60+(6-8)2χ20]=1.6,

1

从B生产线随机抽取的100件产品获利的平均数为光2=旃X(IOX35+8X40+

6X25)=8.2(元),

方差为Sa=击XKIo-82)2X35+(8—82)2X40+(6—8.2)2χ25]=2.36.

所以d<E,则A生产线的获利更稳定.

②从A,B生产线共随机抽取的200件产品获利的平均数为募X[10X(20+35)

+8*(60+40)+6*(20+25)]=8.1(元),

由样本估计总体,当产品产量为2000件时,估计该工厂获利2OOoX8.1=16

200阮).

因为从A,B生产线共随机抽取的200件产品中,A生产线生产的一等级产品有

20件,B生产线生产的一等级产品有35件,

由样本频率估计总体概率,得该工厂生产产品为一等级产品的概率估计值为

20+3511

200=405

当产品产量为2000件时,估计该工厂一等级产品获利200OXAXIo=5500(元).

热点二回归分析

I核心归纳

求经验回归方程的步骤

(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).

nn

(2)计算出无,y9Σ%?,ΣXM的值.

z=1i=∖

ΛΛ

(3)计算α,b.

(4)写出经验回归方程.

例3(2022•合肥二模)《中国统计年鉴2021》数据显示,截止到2020年底,我国

私人汽车拥有量超过24千万辆.下图是2011年至2020年十年间我国私人汽车拥

有量y(单位:千万辆)折线图.

()■)

(注:年份代码1〜10分别对应年份2011〜2020)

(1)由折线图能够看出,可以用线性回归模型拟合y与,的关系,请用相关系数加

以说明;

⑵建立y关于t的经验回归方程(系数精确到0.01),并预测2024年我国私人汽车

拥有量.

IO一一10-1()-

参考数据:y=15.5,苫(Lf)(V-y)=160.1,£(ʃ/-γ)2=311.4,J(/,—r)2=

82.5,√25550.5≈159.8,√25690.5≈160.3.

参考公式:相关系数

,∑1(U-1)(y/-y)

2

Ct∣-1)z∑1(.y∣-y)2

经验回归方程(=M+)中,斜率和截距的最小二乘估计公式分别为

nn——

^gQtLt)(V-y)∑ltiyi-nty

b=n^^^'=-7^ςΓ^

22

f∑l(ti-t)∑yfi-nt

a=y-bt.

解(1)由题意得,

IO_一

g5—t)(y—y)__________i6Q,ι160.1160.1nnnoo

飞(…)2兰『)∖2∙5X3U4=7≡Γ30∙9988

相关系数个0.9988,说明y与7的线性相关性很高,

所以可以用线性回归模型拟合y与f的关系.

10一

(2)由f=5.5,∑l(力一£)2=82.5,

所以Z?—82§2L94,

A—Λ—

因此Q=y—万,=15.5—1.94X5.5=4.83,

A

所以y=1.94f+4.83.

A

当t=14时,y=1.94×14+4.83=31.99.

据此可以预测,2024年我国私人汽车拥有量将达到31.99千万辆.

易错提醒L样本点不一定在经验回归直线上,但点(x,y)一定在经验回归直线上.

2.求Z时,灵活选择公式,注意公式的推导和记忆.

3.利用样本相关系数判断相关性强弱,看团的大小,而不是r的大小.

4.通过经验回归方程求的都是估计值,而不是真实值.

训练2(1)(2022.重庆诊断)已知变量X与y正相关,且由观测数据算得样本平均数;

=2,γ=10,则由观测数据得到的经验回归方程可能为()

Aj=-1.5x+11B.γ=-0.5x+ll

C.γ=0.5x+9D.y=1.5x+8

(2)(多选X2022.荷泽一模)某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、

扶方法”的号召,建立农业科技图书馆,供农民免费借阅,收集了近5年的借阅

数据如下表:

年份20162017201820192020

年份代码X1245

年借阅量N万册)-4.95.15.55.75.8

根据上表,可得y关于X的经验回归方程为;=0∙24x+;,下列结论正确的有()

A.α=4.68

B.借阅量49,5.1,5.5,5.7,5.8的75%分位数为5.7

C.y与X的线性相关系数r>0

D.2024年的借阅量一定不少于6.84万册

答案(I)C(2)ABC

解析(1)因为变量X与y正相关,所以经验回归方程中的斜率大于0,故A,B

错误;

对于C,y=0.5x+9,过点(2,10),故C正确;

对于D,y=L5x+8不过点(2,10),故D错误.故选C.

1

(2)对于A,X=WX(I+2+3+4+5)=3,

γ=∣×(4.9+5.1+5.5+5.7+5.8)=5.4,

Vy关于龙的经验回归方程为;=0.24x+Z,

ΛΛ

Λ5.4=0.24×3+α,解得α=4.68,故A正确;

对于B,5×75%=3.75,

故借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7,故B正确;

对于C,V0.24>0,

.∙.y关于X的线性相关系数r>0,故C正确;

Λ

对于D,线性回归方程为y=0.24x+4.68,

Λ

当X=9时,y=6.84,

故2024年的借阅量约为6.84万册,故D错误.

热点三独立性检验

I核心归纳

独立性检验的一般步骤

(1)根据样本数据列2X2列联表;

(2)根据公式/=((J,计算/的值;

ʌ∖a+b)(c+d)(a-rc)、”kb.+八a)ʌ

(3)查表比较/与临界值的大小关系,作统计判断./越大,对应假设事件HO成立

(两类变量相互独立)的概率越小,"o不成立的概率越大.

例4为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,

随机抽查了IOO天空气中的PM2∙5和SCh浓度(单位:μg∕m3),得下表:

SO2

[0,50](50,150](150,475]

[0,35]32184

(35,75]6812

(75,115]3710

⑴估计事件“该市一天空气中PM2.5浓度不超过75,且S02浓度不超过150”的

概率;

(2)根据所给数据,完成下面的2X2列联表:

PM2.5浓度SCh浓度合计

[0,150](150,475]

[0,75]

(75,115]

合计

(3)根据(2)中的列联表,依据小概率值α=0.01的炉独立性检验,能否认为该市一

天空气中PM2.5浓度与SCh浓度有关?

ɔ___________n(ad—be)1________

附:r=Ca+b)(c+√)(α+c)(⅛+√)

a0.0500.0100.001

Xa3.8416.63510.828

解(1)根据抽查数据,该市IOO天的空气中PM2.5浓度不超过75,且SCh浓度

不超过150的天数为32+18+6+8=64,

因此,该市一天空气中PM2.5浓度不超过75,且SCh浓度不超过150的概率的估

计值为磊=0.64.

(2)根据抽查数据,可得2X2列联表:

PM2.5SO2浓度

合计

浓度[0,150](150,475]

[0,75]641680

(75,115]101020

7426100

(3)零假设为Ho:该市一天空气中PM2.5浓度与SCh浓度无关.根据(2)的列联表得

IOOX(64X10^16X1012《84>6635=xoo.

z80×20×74×26001-

根据小概率值α=0∙01的*独立性检验,我们推断乩不成立,即认为该市一天空

气中PM2.5浓度与SCh浓度有关,此推断犯错误的概率不超过0.01.

易错提醒I.Z2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通

过表格查得无关的可能性.

2.在犯错误的概率不超过0.01的前提下认为两个变量有关,并不是指两个变量无

关的可能性为0.01.

训练3(1)某校团委对“学生性别和喜欢某视频APP是否有关”做了一次调查,

其中被调查的女生人数是男生人数的一半,男生喜欢某视频APP的人数占男生人

12

数的女生喜欢某视频APP的人数占女生人数的宗若依据小概率值α=0∙050

OJ

的独立性检验,认为喜欢某视频APP和性别有关,则男生至少有()

A.12人B.6人

C.10人D.18人

附:

a0.0500.010

Xa3.8416.635

2_________nQad-be)2________

(a+b)(c+d)(α+C)

(2)(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和

50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如表所示的列

联表,经计算*^4∙762,则下列结论正确的是()

性别

对食堂服务的满意度

凝-不满意

男3020

女4010

a0.1000.0500.010

Xa2.7063.8416.635

3

A.该校男生对食堂服务满意的概率的估计值为]

B.调研结果显示,该校男生比女生对食堂服务更满意

C.依据小概率值α=0∙050的独立性检验,可以认为男、女生对该食堂服务的评价

有差异

D.依据小概率值α=0.010的独立性检验,可以认为男、女生对该食堂服务的评价

有差异

答案(I)A(2)AC

X

解析(1)设被调查的男生人数为X,则被调查的女生人数为会则2X2列联表为

对某视频APP的态度

性别合计

喜欢不喜欢

X5x

男生X

66

XXX

女生

362

X3x

合计X

2~2

零假设为Ho:喜欢某视频APP和性别无关,

根据小概率值α=0.050的独立性检验,认为喜欢某视频APP和性别有关,

3x(XZ5XX)2

贝∕2≥3.841,即χ2=~~^-=^^3.841=xo.θ5θ,

χ-2'2-x

3.841X8

则X2F0.243,

3

又看y的为整数,

所以男生至少有12人.

⑵对于A,该校男生对食堂服务满意的概率的估计值为五3瓷0G=3W故A正确;

4()43

对于B,该校女生对食堂服务满意的概率的估计值为/历=]>*故B错误;

2

因为∕^4.762>3.841=XO.O5O,

所以根据小概率值α=0.050的独立性检验,可以认为男、女生对该食堂服务的评

价有差异,故C正确,D错误.

高分训练对接高考重落实迎高考

一、基本技能练

1.乡村旅游是以旅游度假为宗旨,以村庄野外为空间,以人文无干扰、生态无破

坏为特色的村野旅游形式.某机构随机调查了某地区喜欢乡村旅游的1000名游客,

这些游客都是在A,B,C,D,E这5个平台中的一个预订出游的(每名游客只选

择1个平台),得到一个不完整的统计图,如图所示.已知在E平台预订出游的人

数是在B平台预订出游的人数的1.75倍,则估计1000名游客中在B平台预订出

游的人数为()

A.100B.120

C.210D.300

答案B

解析设在B平台预订出游的人数与在E平台预订出游的人数分别为尤,y,

则y=L75x,且亮需=1—20%—17%—3O%=33%,

所以x+y=330,所以X=I20.

2∙(2022∙厦门模拟)厦门中学生助手通过统计已知某校有教职工560人,其中女职

工240人,现按性别用分层随机抽样的方法从该校教职工中抽取28人,则抽取的

男职工人数与抽取的女职工人数之差是()

A.2B.4

C.6D.8

答案B

解析某校有教职工560人,其中女职工240人,则男职工320人,

故男女职工人数之比为320瑞与4

现按性别用分层随机抽样方法从该校教职工中抽取28人,

则抽取的男职工人数与抽取的女职工人数之比为*

4

则抽取的男职工人数为28X]=16,

3

抽取的女职工人数为28X]=12,

故抽取的男职工人数与抽取的女职工人数之差是16-12=4.

故选B.

3∙(2022∙福州模拟)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它

不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙

两人在同一星期内日步数的折线统计图:

甲、乙日步数折线统计图―甲

■乙

星期-星期二星期三星期四星期五星期六星期日

则下列结论中不正确的是()

A.这一星期内甲的日步数的中位数为11600

B.这一星期内乙的日步数的30%分位数是7030

C.这一星期内甲的日步数的平均值大于乙

D.这一星期内甲的日步数的方差大于乙

答案B

解析对于A,甲的日步数从小到大排列为:2435,7965,9500,11600,12700,

16000,16800.

中位数是11600.故A正确;

对于B,因为7X30%=2∙l,所以乙的日步数的30%分位数是从小到大的第3个

数,为10060.故B不正确;

-1

对于C,Λ⅛=](16000+7965+12700+2435+16800+9500+11600)=11000,

xi=ɪ(14200+12300+7030+12970+5340+11600+10060)=10500.

所以X甲>尤乙故C正确;

对于D,甲的极端值,对方差的影响大,所以甲日步数的方差大于乙.故D正确.

4.(多选)为学习贯彻党的十九届六中全会精神,某单位组织“筑梦新时代”主题演

讲活动.9位评委对某位选手的具体评分如下:7.8,8.4,8.5,8.6,8.8,8.9,9.5,

9.7,9.9,则下列说法正确的是()

A.9位评委的评分的极差是2.1

B.9位评委的评分的中位数是8.8

C.9位评委的评分的平均分是8.8

D.9位评委的评分的方差是甚

答案ABD

解析9位评委的评分的极差是9.9-7.8=2.1,故A正确;

9位评委的评分的中位数是8.8,故B正确;

9位评委的评分的平均分是

7.8+8.4+8.5+8.6+8.8+8.9+9.5+9.7+9.980.1.”

----------------------------9----------------------------=-g-=8.9,故C错乐;

9位评委的评分的方差为?=∣×f(7.8-8.9)2+(8.4-8.9)2+(8.5-8.9)2+(8.6-

37231

8.9)2+(8.8-8.9)2+(8.9-8.9)2+(9.5-8.9)2+(9.7-8.9)2+(9.9-8.9)2]=^X^=^,

y/ɔ

故D正确.故选ABD.

5.(多选)下列说法正确的是()

A.将一组数据中的每一个数据都加上同一个常数后,方差不变

B.设具有线性相关关系的两个变量X,y的相关系数为r,则用越接近于0,X和y

之间的线性相关程度越强

C.在一个2X2列联表中,由计算得好的值,则炉的值越小,判断两个变量有关

的把握越大

D.若X〜N(l,σ2),P(X>2)=0.2,则P(OVXVI)=0.3

答案AD

解析对于A,方差反映一组数据的波动大小,将一组数据中的每个数据都加上

或减去同一个常数后,方差不变,故A正确;

对于B,具有线性相关关系的两个变量无,y的相关系数为r,则IH越接近于1,X

和y之间的线性相关程度越强,故B错误;

对于C,在一个2X2列联表中,由计算得了2的值,则炉的值越大,判断两个变

量有关的把握越大,故C错误;

对于D,=X〜N(l,哈,

:.P(0<X<1)=P(1<X<2)=P(X>1)-P(X>2)=0.5-0.2=0.3,故D正确.

故选AD.

6.(多选)(2022.济南模拟)某中学为了解高三男生的体能情况,通过随机抽样,获得

了200名男生的100米体能测试成绩(单位:秒),将数据按照[11.5,12),[12,12.5),…,

[15.5,16]分成9组,制成了如图所示的频率分布直方图.

由直方图推断,下列选项正确的是()

A.直方图中α的值为0.38

B.由直方图估计本校高三男生100米体能测试成绩的众数为13.75秒

C.由直方图估计本校高三男生100米体能测试成绩不大于13秒的人数为54

D.由直方图估计本校高三男生100米体能测试成绩的中位数为13.7秒

答案BC

解析对A,由于(0.08+0.16+0.3+α+0.52+0.3+0.12+0.08+0.04)X0.5=l,

所以α=0∙4,所以选项A错误;

对B,由频率分布直方图可知,[13.5,14)这一组对应的小长方形最高,所以估计

众数为『一=13.75(秒),所以选项B正确;

对C,由频率分布直方图知不大于13秒为前三组,前三组的人数为(0∙08+0∙16+

0.3)×0.5×200=54,所以选项C正确;

对D,由选项A可知,α=0.4,所以前四组的频率为(0.08+0.16+0.3+0.4)X0.5

=0.47,前五组的频率为(0.08+0.16+0.3+0.4+0.52)X0.5=0.73,所以中位数在

[13.5,14)这一组,设中位数为X秒,则(%—13.5)X0.52=0.5—0.47,解得XQI3.56,

所以选项D错误.综上,选BC.

7.某校高二年级共有学生IoOO人,其中男生480人,按性别进行分层,用分层随

机抽样的方法从高二全体学生中抽出一个容量为100的样本,若样本按比例分配,

则女生应抽取的人数为.

答案52

解析某校高二年级有学生IoOO人,男生480人,则女生520人,

设女生应抽取X人,则备=儡,

∙x=52.

故女生应抽取52人.

8.某设备的使用年限与所支出的维修费用的统计数据如下表:

使用年限M单位:年)23456

维修费用y(单位:万元)1.54.55.56.57.0

根据上表可得经验回归方程为;=1.3x+),据此模型预测,若使用年限为14年,

估计维修费约为万元.

答案18

2+3+4+5+6

解析X=ς=4,

1.5+4.5+5.5+6.5+7.0

y=s=5,

则样本点中心为(4,5),代入经验回归方程可得α=5—1.3X4=-0.2,y=l.3χ-

0.2,

当%=14时,(=1.3X14—0.2=18(万元),即估计使用14年时,维修费用是18

万元.

9.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周

末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中

培训的55名学员中有45名学员一次考试通过,接受周末分散培训的50名学员一

次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训

有关”犯错误的概率不超过.

2___________〃(ad—be)2__________

1∙^(α÷∕?)(c+√)(α+C)Cb^∖^d)

a0.050.0250.0100.001

Xa3.8415.0246.63510.828

答案0.025

解析零假设为Ho:能否一次考试通过与是否集中培训无关.

由题意,得到列联表如下:

培训方式

合计

集中分散

一次考过453075

一次未考过102030

5550105

105×(45×20-10×30)2

55X50X75X30-≈6.1O9>5.O24=XO.O25.

根据小概率值α=0.025的独立性检验推断Ho不成立,

即认为“能否一次考试通过与是否集中培训有关”,此推断犯错的概率不超过

0.025.

10.中国于2022年2月在北京成功地举办了第二十四届冬季奥林匹克运动会.共赴

冰雪之约,共享冬奥机遇,“冰雪经济”逐渐升温,“带动三亿人参与冰雪运动”

己从愿景变为现实,中国各地滑雪场的数量也由2015年的1255家增加到2021

年的3100家.下面是2016年至2021年中国滑雪场新增数量和滑雪场类型统计图,

下列说法中正确的序号是.

2O16~2O21年全国滑雪场新增数量趋势图-数量:家

201620172018201920202021

2020年滑雪场类型图2()21年滑雪场类型图

①2021年中国滑雪场产业中大众娱乐型滑雪场占比最高

②2016年至2021年中国滑雪场数量逐年上升

③2016年至2021年中国滑雪场新增数量逐年增加

@2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多

答案①②④

解析由扇形统计图可知,2021年中国滑雪场中大众娱乐型滑雪场占比最高,故

①正确;

由柱状图可知,2016年至2021年中国滑雪场数量逐年上升,故②正确;

由柱状图可知,2020年比2019年下降了,故③不正确;

2021年,业余玩家型滑雪场的数量为31OOX38%=1178(家),2020年,大众娱

乐型滑雪场的数量为(3100—385)X40%=1086(家),故④正确.

11.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两

台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计

如下表:

产口质量

机床

二级合计

等级一级品

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)根据小概率值α=0∙01的独立性检验,分析甲机床生产的产品质量与乙机床生

产的产品质量有无差异.

7

2___________n(ad-be)^__________

'X(α+b)(c+d)(α+C)Cb+d)

a0.0500.0100.001

Xa3.8416.63510.828

解(1)因为甲机床生产的200件产品中有150件一级品,

所以甲机床生产的产品中一级品的频率为端=点

因为乙机床生产的200件产品中有120件一级品,

所以乙机床生产的产品中一级品的频率为12品0=13

(2)零假设为Ho:

甲机床的产品质量与乙机床的产品质量没有差异.

根据2X2列联表中的数据,

zθ,400X(150*80—120*50)2400

付%=270×130×200×200=与■七10256,

因为1O.256>6.635=ΛO.OI,

所以推断“0不成立,

即认为甲机床的产品质量与乙机床的产品质量有差异.

12.2022年新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度

更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工

作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时

间全员覆盖.

(1)该校教职工有410人,高二学生有620人,高三学生有610人,

①用分层随机抽样的方法,求高一学生每天抽检人数;

②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来

自部分班级;方案二:分散来自所有班级.

你认为哪种方案更合理,并给出理由.

(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:

第X天12345

用时》(小时)1.21.21.11.01.0

①计算变量X和y的相关系数r(精确到0.01),并说明两变量线性相关的强弱;

②根据①中的计算结果,判定变量X和y是正相关,还是负相关,并给出可能的

原因.

n--

ΣCx-x)(y—y)

i=1

参考数据和公式:√10^3.16,相关系数r=

nn

Σ(x-x)2ΣCy∣-y)2

Z=Iz=l

450×5-410-620-610

解(①高一学生每天抽检人数为=122(人);

1)5

②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,分散抽

检可以全面检测年级中每班学生的状况,更有利于防控筛查工作.

-1-1

(2)①x=g(l+2+3+4+5)=3,y=ʒ(1.2+1.2+1.1+1+1)=1.1,

5_

所以Σ(Xi—x)(y∕—y)=—2×0.1+(—1)×0.1+1×(—0.l)+2×(—0.1)=—0.6,

Z=I

55

Σ(XLX)2=4+1+1+4=10,Σ(γz-γ)2=0.01+0.01+0.01+0.01=0.04.

z=lz=l

变量X和y的相关系数为r=

5

ΣCx-x)(y(—y)

____i=1____________—0.6____13―

Γ~5I5I√Tθ×√(λδ4-√Iθ^-0-95'

Λ/zɪ(XLX)22](yj-y)2

因为∣r∣>0∙75,可知两变量线性相关性很强;

②由rV0可知变量无和y是负相关,可能的原因:随着抽检工作的开展,学校相

关管理协调工作效率提高,因此用时缩短.

二、创新拓展练

13.(多选)下表是某生活超市

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论