统计与统计案例(解析版)-2023年新高考数学考前提分练习_第1页
统计与统计案例(解析版)-2023年新高考数学考前提分练习_第2页
统计与统计案例(解析版)-2023年新高考数学考前提分练习_第3页
统计与统计案例(解析版)-2023年新高考数学考前提分练习_第4页
统计与统计案例(解析版)-2023年新高考数学考前提分练习_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题九统计号藐计案/

一、考情分析

统计与统计案例也是考查热点,客观题与解答题都有可能考查,常考查的知识点有:抽样方法、用样本估

计总体、回归分析及独立性检验。

二、三年新高考真题屐示

1.(2020新高考山东卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机

抽查了100天空气中的PM2.5和SO2浓度(单位:μg∕m3),得下表:

SO2

[0,50](50,150](150,475]

PM2.5

[0,35]32184

(35,7516812

(75,115]3710

(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO?浓度不超过150”的概率;

(2)根据所给数据,完成下面的2x2列联表:

SO2

L0,150J(150,475J

PM2.5

[0,75]

(75,115]

(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与S。?浓度有关?

叫。2_n(ad-bCy

Ifi:ʌ一,

(Q+b)(c+d)(α+c)(b+d)

P(K2≥k)0.0500.0100.001

38416.63510.828

【解析】(1)由表格可知,该市1()()天中,空气中的尸M2.5浓度不超过75,FLSO2浓度不超过150的天数

有32+6+18+8=64天,

64

所以该市一天中,空气中的PM2.5浓度不超过75,且SO?浓度不超过150的概率为前=0.64

(2)由所给数据,可得2x2列联表为:

SO2

[0,150](150,475]合计

PM2.5

[0,75]641680

(75,115]101020

合计7426100

(3)根据2x2列联表中的数据可得

2n(ad-bc)2100×(64×10-16×10)23600.........

K=-------------------------=--------------------------------=-------≈7.4844>6.635,

(a+/?)(c+d)(a+c)(b+d)80×20×74×26481

1

因为根据临界值表可知,有99%的把握认为该市一天空气中PM2.5浓度JSO2浓度有关.

2.(2021新高考全国卷I)有一组样本数据为,x2,当,由这组数据得到新样本数据y,%,…,%,

其中y=x,+c(i=l,2,〃),C为非零常数,贝∣J()

A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同

C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同

【答案】CD

【解析】对于A,两组数据的平均数的差为c,故A错误:

对于3,两组样本数据的样本中位数的差是c,故5错误;

对于C,标准差O(K)=O(X,∙+c)=少(匕),

两组样本数据的样本标准差相同,故C正确;

对于£>,yi=xi+c{i=1,2,n),C为非零常数,

X的极差为XmaHfM,y的极差为(5+c)-(怎而+c)=怎皿-χmin,

两组样本数据的样本极差相同,故。正确.

故选CZZ

3.(2021新高考全国卷∏)下列统计量中,能度量样本花,々,,X”的离散程度的是()

A.样本x∣,%2,,N,的标准差B.样本F,/,…的中位数

C.样本看,工2,,,X”的极差D.样本无|,々,…,X”的平均数

【答案】AC

【解析】由标准差的定义可知,标准差考查的是数据的离散程度;

由中位数的定义可知,中位数考查的是数据的集中趋势;

由极差的定义可知,极差考查的是数据的离散程度;

由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC

4.(2022新高考全国卷I)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分

为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾

病的人群中随机调查了100人(称为对照组),得到如下数据:

不够良好良好

病例组4060

对照组1090

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

(2)从该地的人群中任选一人工表示事件“选到的人卫生习惯不够良好'’,B表示事件“选到的人患有该疾

P(g∣A).P(g∣A)

l的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R

P(AIA)JP(BIA)

P(A∣3)P(AIg)

(i)证明:

P(ZlB)P(AlA)

(ɪi)利用该调查数据,给出P(Al5),P(Al耳)的估计值,并利用(i)的结果给出R的估计值.

2

附公n(^ad-bc)

(α+b)(c+d)(a+c)(b+d)'

2

P(K≥k)0.0500.0100.001

k3.8416.63510.828

【解析】(1)由题意知.〃=200,

n(ad-be)2200(40×90-60×IO)2

K?==24>6.635,

(a+b)(c+d)(α+C)S+d)50×150×100×100

所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.

P(BlA)P{BIA)_P(AB)P(A)P(XB)P(A)

(2)⑴证明:

P(BIA)-P(B∣A)—P(A)P(AB)P(A)P(AB)

P(AB)P(B)P(Z后)P⑻_P(AIB)P(A∖B)

P(B)P(AB)P(B)P(AB)~Pa∣B)P(AiB)

(ii)由已知得P(AIB)=器40,P(AI豆)=需,

-60--90^≡∙^≡=6

乂P(Al8)=上,P(A∣B)=空,所以R

100100P(AlB)P(Al5)

5.(2022新高考全国卷∏)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);

(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;

(3)已知该地区这种疾病的患病率为().1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.

从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄

位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).

【解析】(1)平均年龄5=(5χ0.001+15χ0.002+25χ0.012+35χ0.017+45χ0.023

+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).

(2)设A={一人患这种疾病的年龄在区间[20,70)},所以

P(A)=I-P(A)=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89.

(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},

则由条件概率公式可得

P(BC)0.1%×0.023×10O.OO1×0.23

P(CIB)==0.0014375≈0.0014.

P(B)16%0.16

三、知以、方法、技能

1.简单随机抽样

(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取〃个个体作为样本(4N),如果每次抽取时

总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.

2.(1)最常用的简单随机抽样的方法:抽签法和随机数表法.

(2)抽签法与随机数表法的区别与联系

抽签法和随机数表法都是简单随机抽样的方法,但是抽签法适合在总体和样本都较少,容易搅拌均匀时使

用,而随机数表法除了适合总体和样本都较少的情况外,还适用于总体较多但是需要的样本较少的情况,

这时利用随机数表法能够快速地完成抽样.

3.应用简单随机抽样应注意的问题

(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体

容量和样本容量都较小时可用抽签法.

(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作

为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.

4.分层抽样的定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数

量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.

5.分层抽样问题类型及解题思路

(1)求某层应抽个体数量:按该层所占总体的比例计算.

(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.

(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.

6.制作频率分布直方图的步骤

第一步:求极差,决定组数和组距,组距=粽;

第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;

第三步:登记频数,计算频率,列出频率分布表;

第四步:画频率分布直方图.

7.解决频率分布直方图问题时要抓住3个要点

(1)直方图中各小长方形的面积之和为1.

(2)直方图中纵轴表示频篇率,故每组样本的频率为组距X京频才率,即矩形的面积.

(3)直方图中每组样本的频数为频率X总体数.

8.样本的数字特征

⑴众数

在一组数据中,出现次数最多的数据叫做这组数据的众数.

(2)中位数

将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数

(3)平均数

样本数据的算术平均数,即7=!(玉+々++⅞)∙

(4)百分位数

定义:一般地,一组数据的第P百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这

个值,且至少有(IoO—p)%的数据大于或等于这个值.

计算步骤:计算一组n个数据的第p百分位数的步骤:

第1步,按从小到大排列原始数据.

第2步,计算i="xp%.

第3步,若i不是整数,而大于i的比邻整数为则第P百分位数为第j项数据;若i是整数,则第P百分

位数为第i项与第(i+l)项数据的平均数.

9.用频率分布直方图估计众数、中位数、平均数的方法

(1)众数为频率分布直方图中最高矩形底边中点横坐标;

(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;

(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.

10.方差与标准差

(1)标准差是样本数据到平均数的一种平均距离.

(2)方差:Y=,[玉—'2+(Z—同2++(Xfl—y1(X,是样本数据,〃是样本容量,嚏是样本平均数).

(3)标准差X1-X++茏,T

11.平均数、方差公式的推广

若数据为,工2,.•・,斯的平均数为X,方差为F则数据∕nxι+α,mxι~∖-a,...,JnX的平均数为〃zx+”,

方差为m2s2.

12.平均数和方差是重要的数字特征,是对总体的一一种简明的阐述.平均数描述总体的平均水平,方差反映

了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理

论依据,一般先比较平均数,若平均数相同,再用方差来决定.

13.变量间的相关关系

(1)常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是相关关系;与函数关系不同,相

关关系是一种非确定性关系,带有随机性.

(2)相关关系与函数关系的异同点

相同点:两者均是指两个变量的关系.

不同点:

①函数关系是一种确定性关系,而相关关系是一种非确定性关系;

②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.

14.两个变量的线性相关

(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,

这条直线叫回归直线.

15.回归直线方程

(1)通过求Q=f(y.-。-月Xj)2的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离

Z=I

的平方和最小的方法叫做最小二乘法.该式取最小值时的α,夕的值即分别为6,b.

(2)两个具有线性相关关系的变量的一组数据:(和/),(Z,%),…,(%%),其回归方程为$=晟+&,

∑(%一ɪ)(ʃ,-y)∑xiyi-nx-y

B=旦-------------------------=∙i≡J---------------------

则∑U,∙-x)2∑x,2-∏x2

/=]Z=I

a=y-bx

16.相关系数

^(x,.-x)(χ-y)

r=IJl”,当r>0时,表示两个变量正相关:当「<0时,表示两个变量负相关.r

2

∑ai-^)-∑(yj-y)

V/=I√=ι

的绝对值越接近1,表示两个变量的线性相关性越避;r的绝对值越接近0,表示两个变量的线性相关性越

弱.通常当r的绝对值大于0.75时,便认为两个变量具有很强的线性相关关系.

17.样本点的中心GG)-•定在回归直线上

18.散点图

(1)散点图:将样本中n个数据点(Xi,yi)(i=l,2,...,n)描在平面

直角坐标系中得到的图形.

(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为正相关;

如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为负相关.

19.若所有样本点都在回归直线上,则M=1。

2

∑(yi-yi)

20•相关系数左=1一号:∙R2越大,说明残差平方和越小,即模型的拟合效果越好;/?2越小,

Σ(X-J)2

/=I

残差平方和越大,即模型的拟合效果越差.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献

率,R2越接近于1,表示回归的效果越好.

21.非线性回归问题的处理方法

一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模型研究呈非线性回归

关系的两个变量之间的关系:

(1)如果散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模;

(2)如果散点图中的点分布在一个曲线状带形区域,要先对变量作适当的变换,再利用线性回归模型来建模.

(3)非线性回归方程的求法

①根据原始数据(x,y)作出散点图;

②根据散点图,选择恰当的拟合函数.

22.分类变量

为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这

类随机变量称为分类变量.分类变量的取值可以用实数表示.

23.列联表

假设两个分类变量X和K它们的可能取值分别为{MM2}和其2×2列联表为

XY合计

71yι

X∖aba+b

X2cdc+d

合计a+cb+dα+8+c+d

2n(^ad-hc∖

24.其中n=a+b+c+d为样本容量.

(«+⅛)(c+√)(β+c)(^+t∕)

25.应用独立性检验解决实际问题大致应包括以下几个主要环节:

(1)提出零假设H0-.X和y相互独立,并给出在问题中的解释;

(2)根据抽样数据整理出2x2列联表,计算/的值,并与临界值从比较;

(3)根据检验规则得出推断结论;

(4)在X和y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规

律.

注意,上述几个环节的内容可以根据不同情况进行调整.例如,在有些时候,分类变量

的抽样数据列联表是问题中给定的.

四、新高考地区最新模拟武题精茎

一、单选题

1.(2023届河北省衡水市高三1月月考)为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层

随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天

睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为()

A.0.96B.0.94C.0.79D.0.75

【答案】B

QAA1O∩∩

【解析】该地区中学生每天睡眠时间的平均数为:—^^×9+-ɪ-×8=8.4(小时),

1200+O001200+800

该地区中学生每天睡眠时间的方差为:

———×Γ1+(9-8.4)2^∣+—型一×Γθ.5+(8-8.4)2^∣=0.94.故选B

1200+800L\7J12∞+800L'7J

2.(2023届福建省莆田第一中学高三上学期段考)为考查A,5两种药物预防某疾病的效果,进行动物实验,

分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是()

1药物M实验结果药物8实验结果

S9

8

O.7

O.6

O.5

OS.4

S3

S2

1

O.0

患病未患病

口服用药g未服用药Ul服用药2未服用药

A.药物8的预防效果优于药物A的预防效果

B.药物A的预防效果优于药物B的预防效果

C.药物4,B对该疾病均有显著的预防效果

D.药物A,B对该疾病均没有预防效果

【答案】B

【解析】根据两个表中的等高条形图知,药物A实验显示不服药与服药时患病差异较药物8实验显示明显

大,所以药物4的预防效果优于药物B的预防效果,故选B.

3.(2022届山东省济宁市高三二模)为研究变量X,y的相关关系,收集得到下面五个样本点(x,y):

X56.5788.5

y98643

若由最小二乘法求得y关于X的回归直线方程为y=τ.8x+α,则据此计算残差为0的样本点是()

A.(5,9)B.(6.5,8)C.(7,6)D.(8,4)

【答案】C

=7,连

【解析】由题意可知,U+6∙5+7+8∙5+89+8+6+4+3,

所以回归方程的样本中心点为(7,6),因此有6=-1.8χ7+α=>α=18.6,

所以y=T.8x+186,在收集的5个样本点中,(7,6)一点在y=τ.8χ+18.6上,故计算残差为0的样本点是

(7,6).故选C.

4.(2022届湖北省荆州中学等四校高三下学期四模)酒后驾驶是严重危害交通安全的行为,某交通管理部

门对辖区内四个地区(甲、乙、丙、丁)的酒驾治理情况进行检查督导,若“连续8天,每天查获的酒驾人

数不超过10”,则认为“该地区酒驾治理达标“,根据连续8天检查所得数据的数字特征推断,酒驾治理一定

达标的地区是()

A.甲地:均值为7,方差为2B.乙地:众数为3,中位数为2

C.丙地,均值为4,中位数为5D.丁地:极差为3,中位数为8

【答案】A

【解析】不妨设8天中,每天查获的酒驾人数从小到大为西,七,•,N

且χ,≥0其中i=l,2,3,,8

选项A,若不达标,则xti≥ll,由均值为7可知,则其余七个数中至少有一个数不等于7,由方差定义可知,

I71

222

^=-∑(X,∙-7)+-(X8-7)>2,这与方差为2矛盾,从而甲地一定达标,故A正确

ði=}θ

选项B:由众数和中位数的定义可知,当Xl=X2=。,x3=x4=∖,x5=xβ=x1=31Λ8=11时,乙地不达标,

故B错误

选项C:若不达标,则/≥U,由均值为7可知,因为中位数是5,所以思+毛=10

又因为均值为4,故ZXi=32,从而%+々+匕+々+与432-Il-IO=11,

/=I

且X∣≤X2≤X345≤%≤X7,则Xl=X2=0,工3=1,%=X5=Z=X7=5,Xli=Il满足题意,从而丙地有可能

不达标,故C错误

选项D:由极差和中位数的定义可知,当x∣=々=XJ=X&=%=々f=8,

玉=11时,丁地不达标,故D错误故选A

二、多选题

5.(2023届广东省揭阳市高三上学期期末)2022年前三个季度全国居民人均可支配收入27650元,比2021

年同期增长了约5.3%,图①为2021年与2022年前三季度全国及分城乡居民人均可支配收入的对比图;图

②为2022年前三季度全国居民人均消费支出及构成(其中全国居民人均可支配收入=城镇居民人均可支配

收入X城镇人口比重+农村居民人均可支配收入X农村人口比重),则下列说法正确的是()

2021年与2022年前三季度全国及分城乡居民

年前三季度全国居民人均消费支出及构成

人均可支配收入(单位,元)2022

40000-----------------------3594637482

35000-----------------------

30OOO”2“65工27650

25000-26

20000------

1372614600

15000——

10000——

5000——

0--------

全国居民城镇居民农村居民

2021年前三个季度■2022年前三个季度

人均可支配收入人均可支配收入

A.2022年前三个季度全国居民可支配收人的中位数一定高于2021年同期全国居民可支配收入的中位数

B.2022年城镇居民人数多于农村居民人数

C.2022年前三个季度全国居民在食品烟酒以及居住方面的人均消费超过了总消费的50%

D.2022年前三个季度全国居民在教育文化娱乐方面的人均消费支出超过了3700元

【答案】BC

【解析】对于选项A,图中信息体现的是平均数的差别,没有提供中位数的信息,不能作出判断,故选项A

错误;

对于选项B,设2022年城镇居民占全国居民的比重为居

贝IJ有37482xx+14600x(l-x)=27650,解得x°0.57,故选项B正确;

2022年前三个季度全国居民在食品烟酒以及居住方面的人均消费支出占总消费的比例分别为30%,24%,

故选项C正确;

2022年前三个季度全国居民在教育文化娱乐方面的人均消费支出为27650χl0%=2765(元),且2765<3700,

故选项D错误.故选BC.

三、填空题

6.(2023届广东省高三上学期第一次联考)一只红铃虫产卵数y和温度X有关,现测得一组数据

(x,,χ.)(z=l,2,∙∙∙,10),可用模型y=拟合,设Z=Iny,其变换后的线性回归方程为z=⅛χ-4,若

X1+X2+∙∙∙+X,0=3∞,,必…如I=*,e为自然常数,则C£=.

【答案】0.31

【解析】y=cC"经过Z=Iny变换后•,得到Z=Iny=C2》+Inq,根据题意Inq=-4,故q=e-",又

X1+Λ2+∙∙∙+X,0=3∞,故[=30,凹当…XO=e'°=>lny∣+ln%+…+lny∣o=5O,故4=5,于是回归方程为

2="一4一定经过(30,5),故3θA-4=5,解得3=0.3,即Q=0∙3,于是=OJe7.

7.(2022届江苏省南京市玄武区高三下学期适应性考试)己知样本数据小电,,x,,的平均数元与方差S?满

足如下关系式:一'(Y)-"∙(x)一,若已知15个数百,毛,,%的平均数为6,方差为9;现

ɔ——

nn

从原15个数中剔除不々,占,匕,当这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数

⅞.x7>,35的方差为.

【答案】8

【解析】根据题目所给的条件%+々++⅛=90,

x

X1+X2+∙+X5=40,所以%+7+•+%5=50,

所以剩余10个数的平均数为5.

22222222

x1+x2++X15-15X6=15×9,X1+X2++x5-5×8=5×5,

所以k+x/++√=330,所以这10个数的方差为33°,∖x5j=8

四、解答题

8.(2023届海南华侨中学高三上学期月考)进入高三时需要检测考试,并且命题是以高二每次月考成绩为

参照依据,在整个高二期间共有8次月考,某学生在高二前5次月考的数学成绩如下表:

高二月考第尢次12345

月考考试成绩y分85100100105110

(1)已知该学生的月考试成绩y与月考的次数X满足回归直线方程》=菽+4,若进入高三时检测考试看作

高二第9次月考考试,试估计该学生的进入高三时检测考试成绩:

(2)把该学生前5次月考的考试成绩写在纸片上,折成纸团放在不透明的箱中充分混合,从纸箱中随机抽出3

个纸团上写的月考成绩进行研究,设抽取的纸团上写的成绩等于平均值7的个数为4,求出。的分布列与数

学期望E(J).

Σ(χ,∙T(%-y)∑χ∕∙-呵

参考公式:A=-----------T---------,a=y-bx,

∑(X--J)2∑Λ2-∞2

/=1I=I

【解析】(1)由题可得(Jt2+;必5=3,

_85+100+100+105+110…

y=--------------------------------=100,

5

5

为玉=1x85+2x100+3x100+4x105+5x110=1555,

x:=I2+22+32+42+52=55,

1555-5×3×100UU

∑=5.5

55-5×32

&=5-阮=100-5.5*3=83.5,所以夕=5.5*+83.5,

当x=9时,9=5.5x9+83.5=133,即该学生的进入高二时检测考试成绩为133分;

(2)由题可知J可取0,1,2,则

P(9)=詈4总尸(一)=等亮

所以4的分布列为:

012

133

P

To5Io

E,(⅞)=0×-5-+l×-+2×-^-=-

''105105

9.(2022届重庆市第八中学校高三下学期调研)手机运动计步已经成为一种新时尚.某单位统计职工一天

行走步数(单位:百步)得到如下频率分布直方图.由频率分布直方图估计该单位职工一天行走步数的中

位数为125(百步),其中同一组中的数据用该组区间的中点值为代表.

(1)试计算图中的。、人值,并以此估计该单位职工一天行走步数的平均值小

(2)为鼓励职工积极参与健康步行,该单位制定甲、乙两套激励方案:记职工个人每日步行数为。,其超过

平均值7的百分数”竺幺XIo0,若e∈(0,10],职工获得一次抽奖机会;若ew(10,20],职工获得二次抽

奖机会;若£€(20,30],职工获得三次抽奖机会;若e∈(30,40],职工获得四次抽奖机会;若。超过50,职

工获得五次抽奖机会.设职工获得抽奖次数为〃.方案甲:从装有1个红球和2个白球的口袋中有放回的逐

个抽取〃个小球,抽得红球个数即表示该职工中奖几次;方案乙:从装有6个红球和4个白球的口袋中无

放回的逐个抽取〃个小球,抽得红球个数即表示该职工中奖几次;若某职工日步行数为15700步,以期望

为决策依据判断哪个方案更佳?

【解析】(1)由题意得:

(0.002+0.006+0.008+a+b+0.008+0.002+0.002)×20=l

0.5-(0.002+0.006+0.008)×20CC

110+------------------------------------------×20=125

20〃

解得α=0.012,⅛=0.010,

・・・0=(60X0.002+80X0.006+100X0.008+120×0.012+140×0.01+160×0.008

÷180×0.∞2+200×0.(X)2)×20=l25.6;

157-125.6«

(2)某职工日行步数3=157(百步),-125.6一,

职工获得三次抽奖机会,设职工中奖次数为X,在方案甲下X~8(3,g

则分布列为:

X0123

81261

P

27272727

E(X)=I;

在方案乙下:X的可能取值为0,1,2,3

C1C23

尸(X=O)=P(X=I)=⅛L=?

c:。30,1)C:。10

P(x=2)等=;ɪ

P(x=3)

jo乙有6

所以分布列为:

X0123

13\_ɪ

P2^

30H)6

E(X)=I.8,因为1<1.8,所以方案乙更佳.

10.(2023届河北省沧州市高三上学期12月教学质量监测)近年来,国家鼓励德智体美劳全面发展,舞蹈

课是学生们热爱的课程之一.某高中随机调研了本校2022年参加高考的90位考生是否喜欢跳舞的情况,经

统计,跳舞与性别情况如下表:(单位:人)

喜欢跳舞不喜欢跳舞

女性2535

男性525

(1)根据表中数据并依据小概率值α=0∙05的独立性检验,分析喜欢跳舞与性别是否有关联?

(2)用样本估计总体,用本次调研中样本的频率代替概率,从2022年本市考生中随机抽取3人,设被抽取的

3人中喜欢跳舞的人数为X,求X的分布列,数学期望E(X)和方差3(X)∙

∕7(αJ-⅛c)-

附:Z2n-a+b+c+d.

(a+⅛)(c+J)(a+c)(⅛+√)>

a0.100.050.0250.0100.005

xa2.7063.8415.0246.6357.879

【解析】(1)零假设:喜欢跳舞与性别无关联,

由题意,ɪ—OS")』.,

60×30×30×60

依据小概率值α=0∙05的独立.性检验,可推断Ho不成立,即认为喜欢跳舞与性别有关联.

(2)由题知,考生喜欢跳舞的概率P=∣^=g,不喜欢跳舞的概率为:

X的可能取值为0,I,2,3

P(X=O)=©啥P(X=I)=C*同W

所以X的分布列如下:

X0123

8421

P

279927

由x/M),数学期望E(X)=3xg=l,方差£>(X)=3X;X:4

11.(2023届福建省宁德市高级中学高三上学期期末)2022年是中国共产主义青年团成立IOO周年,某中

学为此举办了一次共青团史知识竞赛,并规定成绩在[80,100]内为成绩优秀.现对参赛的100名学生的竞赛

成绩进行统计,得到如下人数分布表.

成绩[60,70)[70,80)[80,90)[90,l∞]

人数20403010

(1)根据以上数据完成2x2列联表,并判断是否有95%的把握认为此次竞赛成绩与该学生是初中生还是高中

生有关:

优秀非优秀合计

初中生20

高中生45

合计

(2)为鼓励学生积极参加这次知识竞赛,学校后勤部给参与竞赛的学生制定了两种不同的奖励方案:

3

方案一:参加了竞赛的学生每人都可抽奖1次,且每次抽奖互不影响,每次中奖的概率均为:,抽中奖励价

值50元的食堂充值卡,未抽中无奖励;方案二:竞赛成绩优秀的抽奖两次,其余学生抽奖一次,抽奖者点

击抽奖按钮,即随机产生一个数字(01,2,…,9),若产生的数字能被3整除,则可奖励价值40元的食堂充

值卡,否则奖励20元的食堂充值卡(充值卡奖励可叠加).若学校后勤部财责人希望让学生得到更多的奖励,

则该负责人应该选择哪一种奖励方案,并说明理由.

n(ad-bCy

参考公式:.尤n=a+b+c+d.

(α+b)(c+d)(α+c)e+d)

附表:

0.1500.1000.0500.0100.005

k2.0722.7063.8416.6357.879

【解析】(1)优秀的人数为30+10=40,所以列取表如下:

优秀非优秀合计

初中生201535

高中生204565

合计4060100

o,100(20×45-15×20)^

m因为/=—\-------------L-6.593>3.841-

35×65×40×60

所以有95%的把握认为此次竞赛成绩与该学生是初中生还是高中生有关;

(2)方案一:一个学生获得食堂充值卡的金额的数学期望为g3x5O+(2xO=3(),

方案二:能被3整除的概率为已4=:2,

设一个优秀学生获得充值卡的金额数为X,则X=40,60,80,

P(χ=40)=-x-=-,P(X=6O)=C'2×-×-=-

55255525

224

p(χ=80)=—×-

5525

-l×40+-×60+^×80=56

因此E(X)=

252525

不优秀学生获得充值卡的金额数为:2x40+(3χ20=28,

56x9+28x"=39.2

所以一个学生获得充值卡的金额数的数学期望为:

100100

显然39.2>30,所以按照方案二满足要求.

12.(2023届山东省潍坊市高三上学期期中)2022年2月22日,中央一号文件发布,提出大力推进数字乡

村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台,对本乡村的农产品进行销售,在众多的

网红直播中,随机抽取了10名网红直播的观看人次和农产品销售量的数据,如下表所示:

观看人次X(万次)76827287937889668176

销售量y(百件)808775861007993688577

参考数据:∑(x,.-x)2=6OO,∑(y,.-γ)2=768,x=80.

/=1'/=1X

(1)已知观看人次X与销售量y线性相关,且计算得相关系数r=喏,求回归直线方程§=队+机

(2)规定:观看人次大于等于80(万次)为金牌主播,在金牌主播中销售量大于等于90(百件)为优秀,小

于90(百件)为不优秀,对优秀赋分2,对不优秀赋分1.从金牌主播中随机抽取3名,若用X表示这3

名主播赋分的和,求随机变量X的分布列和数学期望.

£”)(一

(附:b=nɔ,a=y-bx,相关系数r=∣“)

Σ(%T

Z=I

∑(χ∕-χ)(λ∙-y)

z(ɪ,-ɪ)(vʃ-ʃ)

i=l7'所以述

【解析】(1)因为一i=l

16√600×768

IO66011

所以∑X%-x)(%-y)=660,所以b=/=1

/=1\6OO-Tθ

Z(XT2

/=I

—1—11

γ=-(80+87++77)=83,α=γ-⅛χ=83--×80=-5,

所以回归直线方程为y=二x-5.

(2)金牌主播有5人,2人赋分为2,3人赋分为1,

则随机变量X的可能取值为3,4,5,

p(χ=3咦4p(χ=4)=罟=|,尸—5喈■

所以X的分布列为:

X345

133

P

105To

/13ɜ21

所以E(X)=3χ-5-+4x±+5χ3=m

v7105105

13.(2023届湖北省新高考协作体高三上学期考试)为了检测某种抗病毒疫苗的免疫效果,需要进行动物与

人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按[0,20),

[20,40),[40,60),[60,80),[80,100]分组,绘制频率分布直方图如图所示.试验发现小白鼠体内产生抗体

的共有160只,其中该项指标值不小于60的有110只.假设小白鼠注射疫苗后是否产生抗体相互独立.

(I)填写下面的2x2列联表,并根据列联表及a=0.05的独立性检验,判断能否认为注射疫苗后小白鼠产

生抗体与指标值不小于60有关.

单位:只

指标值

抗体合计

小于60不小于60

有抗体

没有抗体

合计

(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注

射疫苗,结果又有20只小白鼠产生抗体.

(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率P;

(ii)以(i)中确定的概率P作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记〃个人注射

2次疫苗后产生抗体的数量为随机变量X.试验后统计数据显示,当X=90时,P(X)取最大值,求参加人

体接种试验的人数”及E(X).

n(ad-bc)2

参考公式:Z2(其中“=α+6+c+d为样本容量)

(a+b)(c+d)(a+c](b+d)

参考数据:

P(∕≥z°)0.500.400.250.150.1000.0500.025

0.4550.7081.3232.0722.7063.8415.024

【解析】(1)由频率分布直方图,知200只小白鼠按指标值分布为:

在[0,20)内有0.0025*20x200=10(只);在[20,40)内有0.(X)625x20*200=25(只);

在[40,60)内有0.00875X20X200=35(只);在[60,80)内有0.025χ20x200=100(只);

在[80,100]内有0.0075X20X200=30(只).

由题意,有抗体且指标值小于60的有50只;而指标值小于60的小白鼠共有10+25+35=70(只),所以

指标值小于60且没有抗体的小白鼠有20只,同理,指标值不小于60且没有抗体的小白鼠有20只,故列

联表如下:

单位:只

指标值

抗体合计

小于60不小于60

有抗体50110160

没有抗体202040

合计70130200

零假设为:注射疫苗后小白鼠产生抗体与指标值不小于60无关联.

根据列联表中数据,得/=200x(50x20-20xlIO)-。4.945>3.841=.

160×40×70×130

根据a=0.05的独立性检验,推断/不成立,即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,

此推断犯错误的概率不大于0.05.

(2)(i)令事件A="小白鼠第一次注射疫苗产生抗体”,事件B="小白鼠第二次注射疫苗产生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论