统计讲义-2024届高三数学三轮复习_第1页
统计讲义-2024届高三数学三轮复习_第2页
统计讲义-2024届高三数学三轮复习_第3页
统计讲义-2024届高三数学三轮复习_第4页
统计讲义-2024届高三数学三轮复习_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年高考数学三轮冲刺之统计

一.抽样

【知识梳理】

1、对每一个调查对象都进行调查的方法,称为全面调查,又称普查.

2、在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为

个体.

3、根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作

出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样

本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简

称样本数据.

4、一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取〃(l<n<N)个

个体作为样本,

如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们

把这样的抽样方法叫做放回简单随机抽样;

如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率

都相等,我们把这样的抽样方法叫做不放回简单随机抽样.

放回简单随机抽样和不放回简单随机抽样统称简单随机抽样.

5、一般地,总体中有N个个体,它们的变量值分别为Yi,丫2,…,YN,则称

-Y1+Y2+-+YN_1.

NN白'

为总体均值,又称总体平均数.

如果总体的N个变量值中,不同的值共有左(左WN)个,不妨记为Yi,丫2,…,

Y,,其中Y,出现的频数力(i=l,2,3,…,左),则总体均值还可以写成加权平均数的形

_1k

6、如果从总体中抽取一个容量为九的样本,它们的变量值分别为%,.

则称

△=3,

n

为样本均值,又称样本平均数.

7、一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一

个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本

合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分

层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式

为比例分配.

【针对性训练】

1.从某年级500名学生中抽取60名学生进行体重的统计分析,就这个问题来说,下列说法

正确的是()

A.500名学生是总体

B.每个被抽取的学生是个体

C.抽取的60名学生的体重是一个样本

D.抽取的60名学生的体重是样本容量

2.某学校为了调查学生的学习情况,从每班随机抽取5名学生进行调查.若一班有45名学

生,将每一学生从01到45编号,请利用下面的随机数表选取5个编号,选取方法是从随机

数表的第2行的第7、8列开始由左向右依次选取两个数字(作为编号),如果选取的两个

数字不在总体内,则将它去掉,直到取走样本,则第四个编号为()

附随机数表(下面为随机数表的前3行):

03474373863696473661469863716233261680456011141095

97742467624281145720425332373227073607512451798973

16766227665650267107329079785313553858598897541410

A.32B.37C.42D.27

3.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任

意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()

A.简单随机抽样法B.抽签法

C.随机数表法D.分层抽样法

4.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方向,从

该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年

级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取一名学

生.

5.从甲、乙两种玉米苗中通过简单随机抽样各抽取10株,分别测得它们的株高(单位:

cm)如下:

甲:25414037221419392142

乙:27164427441640401640

试估计这两种玉米苗哪种长得高.

6.某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,用简单随机抽

样的方法获得了部分学生一周的锻炼时间(单位:力),数据整理后如下表所示.

甲66.577.58一一一

乙6789101112一

丙34.567.5910.51213.5

(1)估计这个学校高一年级的学生中,一周的锻炼时间超过10/7的比例;

(2)估计这个学校高一年级学生一周的平均锻炼时间.

7.甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量

为80的样本进行质量检测,若样本中有50件产品由甲设备生产,则乙设备生产的产品总数

为—件.

8.某高级中学共有学生3000名,各年级男、女生人数如下表:

高一年级高二年级高三年级

女生487Xy

男生5135602

已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.18.

(I)问高二年级有多少名女生?

(II)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学

生?

9.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.若用分层

抽样的方法,则40岁以下年龄段应抽取的人数是()

34破以下

40~5。岁~

A.10B.15C.20D.25

10.2013年至2019年我国二氧化硫的年排放量(单位:万吨)如表,则以下结论中正确的

是()

年份2013201420152016201720182019

排放量2217.921182043.91974.41859.11102.861014.6

A.二氧化硫排放量逐年下降

B.2018年二氧化硫减排效果最为显著

C.2017年至2018年二氧化硫减排量比2013年至2016年二氧化硫减排量的总和大

D.2019年二氧化硫减排量比2018年二氧化硫减排量有所增加

二.用样本估计总体

【知识梳理】

1、一般地,一组数据的第P百分位数是这样一个值,它使得这组数据中至少有P%的

数据小于或等于这个值,且至少有(100-P)%的数据大于或等于这个值.可以通过下

面的步骤计算一组九个数据的第P百分位数:

第1步:按从小到大排列原始数据;

第2步:计算,=〃xp%;

第3步:若,不是整数,而大于,的比邻整数为j,则第p百分位数为第j项数据;

若,是整数,则第p百分位数为第,项和第(z+1)项数据的平均数.

2、我们在初中学过的中位数,相当于是第50百分位数.除了中位数外,常用的百分位

数还有第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分

成四等份,因此称为四分位数.

3、假设一组数据是为,X”,用最表示这组数据的平均数,我们称

工支(%-司2为这组数据的方差,有时为了计算方差的方便,还可以写成

〃/=1

1n_2

—£瓦2-X.由于方差的单位是原始数据的单位的平方,为了使二者单位已知,我们

几/=1

对方差开平方,取它的算术平方根,即X)2,我们称为这组数据的标准差.

Vn,=1

4、如果总体中所有个体的变量值分别为Yi,丫2,…,YN,总体平均数为亍,则称

S2=,£(Z-斤为总体方差,S=VF为总体标准差.与总体均值类似,总体方差也

Ni=i

可以写成加权的形式.如果总体的N个变量值中,不同的值共有左(左<N)个,不妨

记为Yi,丫2,…,Y公其中Y,出现的频数力(,=1,2,3,…,左),则总体方差为

1k_

心仁加-吩

N,=1

如果一个样本中个体的变量值分别为%,内,…,/,样本平均数为亍,则称

为样本方差,s=J7为样本标准差.

【针对性训练】

11.将容量为100的样本数据按由小到大的顺序排列分成8个小组,如表所示,但第三组数

据被墨汁污染,则第三组的频率为()

组号12345678

频数1013141513129

A.0.14B.0.12C.0.03D.0.10

12.某制造商3月份生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单

位:〃〃〃),将数据分组如表:

分组频数频率

[39.95,39.97)10

[39.97,39.99)20

[39.99,40.01)50

[40.01,40.03]20

合计100

补充完成频率分布表,并在如图中画出频率分布直方图.

A频率/组距

25-

20-

15-

10-

5-

0--------1--------1--------1--------1_>,

39.9539.9739.9940.0140.03直彳5/mm

13.小明同学因发热而住院,如图是根据护士为他测量的体温所绘制的体温折线图.根据

图中的信息,回答下列问题:

(1)护士每隔几小时给小明测量一次体温?

(2)近三天来,小明的最高体温、最低体温分别是多少?

(3)从体温看,小明的病情是在恶化还是在好转?

(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么

时候出院?

9月7日9月8日9月9日

14.为了解某幼儿园儿童的身高情况,抽查该幼儿园120名儿童的身高绘制成如图所示

的频率分布直方图,则抽查的120名儿童中身高大于或等于98si且小于104c根的有(

名D.40名

15.某班的全体学生参加消防安全知识竞赛,成绩的频率分布直方图如图,数据的分组依

次为:[20,40),[40,60),[60,80),[80,100].估计本班学生的消防安全知识成

绩的90百分位数是()

D.95

16.为了了解和掌握某省2019年高考考生的实际答卷情况,随机地取出了100名考生的数

学成绩(单位:分),将数据分成了11组,制成了如图所示的频率分布表:

分组频数频率

[80,85)10.01

[85,90)20.02

[90,95)40.04

[95,100)140.14

[100,105)240.24

[105,110)150.15

[110,115)120.12

[115,120)90.09

[120,125)110.11

[125,130)60.06

[130,135]20.02

合计1001

则估计样本数据的第60,80百分位数分别是—和

17.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及

格.若同一组中数据用该组区间中点作为代表,则下列说法中正确的是()

A.成绩在[70,80)分的考生人数最多

B.不及格的考生人数为1000

C.考生竞赛成绩的平均分约70.5分

D.考生竞赛成绩的中位数为75分

18.样本中共有5个个体.其值分别为a,0,1,2,3.若该样本的平均值为1,则样本的

标准差为()

6

B.C.2D.&

5

19.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,

9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()

A.9.4,0.484B.9.4,0.016C.9.5,0.04D.9.5,0.016

20.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个

轮胎,将每个轮胎的宽度(单位:〃侬)记录下来并绘制出如下的折线图:

甲厂轮胎窗度乙厂轮胎宽度

(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;

(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供

的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其

波动情况,判断这两个工厂哪个厂的轮胎相对更好?

三.成对数据的统计相关性

【知识梳理】

1、两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这

种关系称为相关关系.如果从整体上看,当一个变量的值增加时,另一个变量的相应值

也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一

个变量的相应值呈现减少的趋势,则称这两个变量负相关.

2、一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,

我们就称这两个变量线性相关.

3、一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非

线性相关或曲线相关.

4、我们称

2a—x)(%—y)

丁—___闫___________________

\忙"瓜内)2

Vi=lV,=1

为变量X和变量y的样本相关系数.它是一个描述成对样本数据的数字特征,它的正负

性和绝对值的大小可以反映成对样本数据的变化特征:

当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个

数的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.

当「(0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个

数的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.

5、样本相关系数厂的大小取值范围:-l<r<l.它的绝对值大小可以反映成对样本数

据之间线性相关的程度.当|川越接近1时,成对样本数据的线性相关程度越强;当|川

越接近0时,成对样本数据的线性相关程度越弱.

【针对性训练】

21.下列说法中正确的是()

A.圆的面积与半径之间的关系是相关关系

B.气温与冷饮销售量之间的关系是函数关系

C.一定范围内,学生的成绩与学习时间具有正相关关系

D.人的体重与视力具有负相关关系

22.下列语句所表示的事件中的因素不具有相关关系的是()

A.瑞雪兆丰年B.读书破万卷,下笔如有神

C.吸烟有害健康D.喜鹊叫喜,乌鸦叫丧

23.根据变量x,y的观测数据得到的散点图如图所示,贝1()

B.变量尤与y负相关

C.变量x与y可能正相关,也可能负相关

D.变量尤与y没有相关性

24.下列散点图中,两个变量之间具有线性相关关系的是()

25.甲、乙、丙、丁四位同学各自对尤,y两变量的线性相关性做试验,并分别求得样本

相关系数r,如下表:则试验结果中x,y两变量有更强线性相关性的是()

甲乙丙T

r0.820.780.690.85

A.甲B.乙C.丙D.丁

26.若变量y与x之间的相关系数「=-0.9832,则变量y与龙之间()

A.不具有线性相关关系

B.具有线性相关关系

C.它们的线性相关关系还需要进一步确定

D.不确定

27.对两个变量x,y进行线性相关检验,得线性相关系数q=0.7859,对两个变量",v

进行线性相关检验,得线性相关系数弓=-0.9568,则下列判断正确的是()

A.变量尤与y正相关,变量M与n负相关,变量x与y的线性相关性较强

B.变量x与y负相关,变量”与v正相关,变量x与y的线性相关性较强

C.变量x与y正相关,变量〃与n负相关,变量M与v的线性相关性较强

D.变量尤与y负相关,变量〃与v正相关,变量”与V的线性相关性较强

28.关于两个变量x,y与其样本相关系数/•的说法中正确的有()

A.|「|越接近1,x与y的线性相关程度越强

B.若r=1或r=-l,则x与y的关系完全对应(即有函数关系)

C.若厂<0,则x增大时,y也相应增大

D.若0<11,贝!Jx与y之间的相关性为正相关

29.某单位一种大型设备的使用年限X(单位:年)与所支出的维修费用;y(单位:万元)

有如下统计资料:

X23456

y2.23.85.56.57

55

计算》与X之间的样本相关系数(精确到0.001,已知=9。,£寸740.8,

z=li=l

=112.3,折,8.9,1.4)并推断它们的相关程度.

1=1

30.关于两个变量x和y的数据如表所示:

X21232527293235

y711212466115325

求变量y与x的样本相关系数,并判断变量y与x之间是正相关还是负相关.

四.一元线性回归模型

【知识梳理】

Y—bx+〃+e

1、我们称',为Y关于x的一元线性回归模型,其中,Y称为因变量

E(e)=0,D(e)=(r2

或响应变量,x称为自变量或解释变量;。和6为模型的未知参数,。称为截距参数,

6称为斜率参数;e是Y与法+。之间的随机误差.模型中的Y也是随机变量,其值虽

然不能由变量x的值确定,但是却能表示为乐+。与e的和(叠加),前一部分由x所

确定,后一部分是随机的.

2、我们将<=+:称为Y关于x的经验回归方程,也称为经验回归函数或经验回归

公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法(这里的

“二乘”是平方的意思),求得的,,:叫做6,。的最小二乘估计.公式写为:

A£(%—x)(y—y)

b=i=1---------------

x)2-

i=l

A一A一

a=y-bx

3、对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的;称

为预测值,观测值减去预测值称为残差.

4、我们可以用决定系数R2来比较两个模型的拟合效果,R2的计算公式为

R2=]一旦-----------

Z(x-y)2

Z=1

在Rz表达式中,7)2与经验回归方程无关,残差平方和£(%-与经

i=li=l

验回归方程有关.因此R?越大,表示残差平方和越小,即模型的拟合效果越好;R2越

小,表示残差平方和越大,即模型的拟合效果越差.

【针对性训练】

31.某公司由于改进了经营模式,经济效益与日俱增.统计了2018年10月到2019年4月

的纯收益y(单位:万元)的数据,如下表:

月份十十一十二一二三四

月份代号r3456789

纯收益y66697381899091

得到y关于f线性回归方程为a=4.75—51.36.请预测该公司2019年6月的纯收益为(

A.94.11万元B.98.86万元C.103.61万元D.1083.6万元

32.下列散点图中,两个变量的关系适合用线性回归模型刻画的是()

A.0

c.0

33.如表提供了某厂节能降耗技术改造后生产A产品过程中记录的产量x(吨)与相应的生

产能耗y(吨)的几组对应数据,根据表中提供的数据,求出y关于尤的线性回归方程为

5=0.7x+0.35,那么表中r的值为,如果要生产8吨A产品,预测相对应的生产能耗

为—,

X3456

y2.5t44.5

34.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:

使用年限X23456

维修费用y2.23.85.56.57.0

若由资料知y对无成线性相关关系、试求:

(1)线性回归方程5=淡+4的回归系数g与&;

(2)估计使用年限为10年时,维修费用是多少?(参考公式:3=咛--------)

-MX2

i=l

35.某学生四次模拟考试时,其英语作文的减分情况如下表:

考试次数X1234

所减分数y4.5432.5

显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为(

A.y=0.7.r+5.25B.f=-O.6x+5.25C.y=-O.7x+6.25D.$=-0.7尤+5.25

36.2020年初,新型冠状病毒(COV7D-19)引起的肺炎疫情暴发以来,各地医疗机构采取

了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治

愈的患者人数如表所示:

周数(尤)12345

治愈人数(y)21736103142

由表格可得y关于x的回归方程为2=6/+〃,则此回归模型第4周的残差(实际值与预报

值之差)为()

A.5B.-13C.13D.0

37.两个变量的散点图如图,y关于x的回归方程可能是()

*

*

*

*

——*---->

°工

・■

A.y=1.22+1.32lnxB.y=2.31/+0.25

C.=-1.23x+1.21D.y=1.25元一0.42

38.某养殖场需要通过某装置对养殖车间进行恒温控制,为了解用电量y(RV-/7)与气温

x(°C)之间的关系,随机统计了某5天的用电量与当天气温,并制作了对照表:

气温(°C)34567

用电量(kW•h)2.5344.56

若利用线性回归方程预测x=10°C时的用电量为8.25AW/,则预测x=12°C时的用电量为

)

A.8.75kW-hB.9.86kW-hC.9.95kW-hD.12.24kW-h

39.下列说法错误的是()

A.将一组数据中的每个数据都加上或减去同一个常数后,方差不变

B.对于经验回归方程?=3-5x,当变量尤增加一个单位时,y平均增加5个单位

C.经验回归直线£=淡+力必过点(亍,歹)

D.曲线上的点与该点的坐标之间具有线性相关关系

40.为研究某种细菌在特定环境下随时间变化的繁殖情况,得到如表实验数据:

天数X(天)3456

繁殖个数y(千2.5344.5

个)

由最小二乘法得y与x的线性回归方程为》=%+0.35,则样本在(4,3)处的残差为()

A.-0.15B.0.15C.-0.25D.0.25

五.2X2列联表与独立性检验

【知识梳理】

1、我们可以用概率语言,将零假设改述为

Ho:分类变量X和Y独立.

在假定Ho的条件下,对于有放回简单随机抽样,当样本容量〃充分大时,统计学

家得到了/的近似分布,忽略/的实际分布与近似分布的误差后,对于任何小概率

2

值a,可以找到相应的正实数4,使得下面关系成立:P(X>xa)=a,我们称/为

a的临界值,这个临界值就可以作为判断/大小的标准.概率值a越小,临界值a越

大.当总体很大时,抽样有、无放回对炉的分布影响较小.

2、由P(%2N%)=a可知,只要把概率值a取得充分小,在假设Ho成立的情况下,

事件{/N%}是不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断

Ho不成立.不过这个推断有可能犯错误,但犯错误的概率不会超过a.

3、基于小概率值a的检验规则是:

当时,我们就推断Ho不成立,即认为X和Y不独立,该推断犯错误的概

率不超过a;

当时,我们没有充分证据推断Ho不成立,可以认为X和Y独立.

这种利用Z2的取值推断分类变量X和Y是否独立的方法称为『独立性检验,读作

“卡方独立性检验”,简称独立性检验.

4、/独立性检验中几个常见的小概率值和相应的临界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

例如,对于小概率值a=0.05,我们有如下的具体检验规则:

(1)当,2»%05=3.841时,我们推断Ho不成立,即认为X和Y不独立,该推断犯错

误的概率不超过0.05;

(2)当/<4。5=3.841时,我们没有充分证据推断Ho不成立,可以认为X和Y独立.

5、应用独立性检验解决实际问题包括以下环节:

(1)提出零假设Ho:X和Y相互独立,并给出在问题中的解释;

(2)根据抽样数据整理出2x2列联表,计算/的值,并与临界值S比较;

(3)根据检验规则得出推断结论;

(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的

影响规律.

6、独立性检验与反证法的相同与不同

反证法是在某种假设Ho之下,推出一个矛盾结论,从而证明Ho不成立;而独立性

检验是在零假设Ho之下,如果出现一个与Ho相矛盾的小概率事件,就推断Ho不成立,

且该推断犯错误的概率不大于这个小概率.另外,在全部逻辑推理正确的情况下,反证

法不会犯错误,但独立性检验会犯随机性错误.独立性检验的本质是比较观测值和期望

值之间的差异,由/所代表的这种差异的大小是通过确定适当的小概率值进行判断

的.

n(ad-be)2

16、力2的计算公式:/=

(a+b)(c+d)(a+c)(Z?+d)

【针对性训练】

41.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试

验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽

B,不服药服药

C,不服药服药D,不服药服药

42.户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有

关,对本单位的50名员工进行了问卷调查,得到了如下列联表,已知在这50人中随机抽取

1人抽到喜欢户外运动的员工的概率为则下列说法中正确的有()

喜欢户外运动不喜欢户外运动合计

男性a5b

女性10Cd

合计ef50

A.抽取的50人中喜欢户外运动的有30人

B.男性中喜欢户外运动的概率为d

5

C.匕=25,c=15

D.e=30,/=10

43.如表是不完整的2*2列联表,其中3c,d=2b,贝!Ja=

合计

%

a

%b55

cd

X?

合计120

44.下面是一个2x2列联表:

XY合计

y=0y=i

x=o35a70

X=1151530

合计50b100

其中a=,b=

45.给出下列实际问题,其中用独立性检验可以解决的问题有()

A.两种药物治疗同一种病是否有区别

B.吸烟者得肺病的概率

C.吸烟是否与性别有关系

D.网吧与青少年的犯罪是否有关系

46.某种常见疾病可分为I、II两种类型.为了解该疾病类型与地域、初次患该疾病的年

龄(以下简称初次患病年龄)的关系,在甲、乙两个地区随机抽取100名患者调查其疾病类

型及初次患病年龄,得到如下数据:

初次患病年龄甲地I型患者甲地n型患者乙地I型患者乙地II型患者

(单位:岁)(单位:人)(单位:人)(单位:人)(单位:人)

[10,20)8151

[20,30)4331

[30,40)3524

[40,50)3844

[50,60)3926

[60,70)21117

(1)从I型疾病患者中随机抽取1人,估计其初次患病年龄小于40岁的概率;

(2)记“初次患病年龄在[10,40)的患者”为“低龄患者”,“初次患病年龄在[40,

70)的患者”为“高龄患者”.根据表中数据,解决以下问题:

⑺将以下两个列联表补充完整,并判断“地域”“初次患病年龄”这两个变量中哪个变量

与该疾病的类型有关联的可能性更大.(直接写出结论,不必说明理由)

表一:

疾病类I型II型合计

型患者所在地域

甲地

乙地

合计100

表二:

疾病类型I型II型合计

初次患病年龄

低龄

高龄

合计100

W)记(0中与该疾病的类型有关联的可能性更大的变量为X.问:是否有99.9%的把握认

为“该疾病的类型与X有关?”

2

2n(ad-be)

(Q+b)(c+d)(a+c)(b+d)

尸(片.人)0.100.050.010.0050.001

2.7063.8416.6357.87910.828

47.在对人们休闲方式的一次调查中,根据数据建立如下的2x2列联表:

看书运动合计

男82028

女161228

合计243256

根据表中数据,得到小殁然昼著”67,所以我们至少有()的把握判

定休闲方式与性别有关系.(参考数据:P(^2..3.841)»0.05,尸(KL6.635)20.01)

A.99%B.95%C.1%D.5%

48.为了提高生产线的运行效率,工厂对生产线的设备进行了技术改造.为了对比技术改

造前后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度(单位:天)

数据,并绘制了如下茎叶图:

改造前II改造后

1-------------------

9865518

866543221012|2679

54413|2334567789

O4II223

(1)设所采集的40个连续正常运行时间的中位数为机,并将连续正常运行时间超过相和

不超过根的次数填入列联表:

超过机不超过m

改造前ab

改造后Cd

试写出“,b,c,d的值;

(2)根据(1)中的列联表,能否有99%的把握认为生产线技术改造前后的连续正常运行

时间有差异?

W4n(ad-bc¥

(。+b)(c+d)(〃+c)(b+d)

P(..k)0.050.0100.001

k3.8416.63510.828

49.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的

人次,整理数据得到下表(单位:天):

锻炼人次[0,200](200,400](400,600]

空气质量等级

1(优)21625

2(良)51012

3(轻度污染)678

4(中度污染)720

(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;

(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为

代表);

(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级

为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2x2列联表,并根据

列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有

关?

人次,,400人次>400

空气质量好

空气质量不好

n(ad-bcf

(a+b)(c+d)(Q+c)(b+d)

P(KL.k)0.0500.0100.001

k3.8416.63510.828

50.为了了解70岁以上人群对考取小型汽车驾照新规的态度,某研究单位对某市的一个大

型社区中70岁以上人员进行了随机走访调研,在48名男性人员中有36人持“积极响应”

态度、12人持“不积极响应”态度,在24名女性人员中持“积极响应”态度和持“不积极

响应”态度的各有12人.完成下面的列联表,并判断是否有95%的把握认为“对考小型汽

车驾照的态度与性别有关”.

积极响应不积极响应合计

男———

女———

合计———

2024年高考数学三轮冲刺之统计

参考答案与试题解析

抽样

1.从某年级500名学生中抽取60名学生进行体重的统计分析,就这个问题来说,下列说法

正确的是()

A.500名学生是总体

B.每个被抽取的学生是个体

C.抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论