高考数学二轮复习专项训练:统计与成对数据的统计分析(含答案及解析)_第1页
高考数学二轮复习专项训练:统计与成对数据的统计分析(含答案及解析)_第2页
高考数学二轮复习专项训练:统计与成对数据的统计分析(含答案及解析)_第3页
高考数学二轮复习专项训练:统计与成对数据的统计分析(含答案及解析)_第4页
高考数学二轮复习专项训练:统计与成对数据的统计分析(含答案及解析)_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025二轮复习专项训练23

统计与成对数据的统计分析

[考情分析]高考近几年考查热点,主要考查线性回归分析和独立性检验,以实际应用题的

形式出现,题目阅读量大,难度中档.

【练前疑难讲解】

一、用样本估计总体

1.统计中的四个数据特征:

(1)众数:在样本数据中,出现次数最多的那个数据.

(2)中位数:在样本数据中,将数据按从小到大顺序排列,位于最中间的数据.如果数据的个

数为偶数,就取中间两个数据的平均数作为中位数.

(3)平均数:样本数据的算术平均数,即X=)X1+X2+…+/).

(4)方差与标准差:

1——————

52=-[(%]—X)2+(X2-X)2H---H(x„—尤)2],

s=q;[(xi-Xy+(尤2-X)2H---l-(x„—X)2].

2.频率分布直方图的两个结论:

(1)小长方形的面积=组距>频<率赢=频率.

(2)各小长方形的面积之和等于1.

二、回归分析

1.经验回归直线;=晨+联经过样本点的中心(三,V),若无取某一个值,代入经验回归方

AAA

程y=bx+a中,可求出y的估计值.

2.样本相关系数:

当厂>0时,称成对样本数据正相关;当K0时,称成对样本数据负相关.

三、独立性检验

1.独立性检验的一般步骤

(1)根据样本数据列成2X2列联表;

(2)根据公式

/二/耳而喘毋E不,计算的值;

(3)查表比较/与临界值的大小关系,作统计判断.

2./的值越大,对应假设事件办成立(两类变量相互独立)的概率越小,”不成立的概率越

大.

一、单选题

1.(2024•黑龙江哈尔滨•一模)为了迎接2025年第九届亚冬会的召开,某班组织全班学生

开展有关亚冬会知识的竞赛活动.已知该班男生35人,女生25人.根据统计分析,男生

组成绩和女生组成绩的方差分别为s;、s;,该班成绩的方差为则下列结论中一定正确

的是()

B.T

A.s1

2

7s;+5s;D.八七

C.s1

12

2.(2024・天津和平•一模)某市为了减少水资源浪费,计划对居民生活用水实施阶梯水价制

度,为确定一个比较合理的标准,从该市随机调查了100位居民,获得了他们某月的用水

①估计居民月均用水量低于1.50?的概率为0.25;②估计居民月均用水量的中位数约为

2.1m3;③该市有40万居民,估计全市居民中月均用水量不低于3m3的人数为6万;④

根据这100位居民的用水量,采用样本量按比例分配的分层随机抽样的方法,抽取了容量

为20人的样本,则在用水量区间。52]中应抽取4人.

A.1B.2C.3D.4

二、多选题

3.(2024・湖南衡阳•模拟预测)中国雪乡哈尔滨的看雪最佳时间在11月中旬到次年的2月

上旬,某旅游公司设计了一款冰雪文创产品.试营销以来,这款冰雪文创产品定价x(单

位:元)与销量、(单位:万件)的数据如下表所示:

产品定价X(单位:元)99.51010.511

销量y(单位:万件)1110865

则下列结论正确的是()

参考公式:厂=1厂,•

\恒%-可5(%-刃~

VZ=1Z=1

555

参考数据:£(%—可=2.5,2(%-5)=26,£(—)(%-予)=-8,765«8.06.

i=li=li=l

A.产品定价x的平均值是10元

B.产品定价x与销量y存在正相关关系

C.产品定价X与销量y满足一元线性回归模型

D.产品定价x与销量V的相关系数r7-0.99

4.(23-24高三下•山东荷泽•开学考试)下列说法正确的是()

A.若随机变量X〜以2,0.2),则尸(X=2)=0.2

B.若经验回归方程?=族+&中的A>0,则变量了与'正相关

C.若随机变量x〜N(0,s,且P3<-J=p,贝|]尸[0<J<m=g-p

D.若事件A与B为互斥事件,则A的对立事件与8的对立事件一定互斥

三、填空题

5.(2024・山东济南•二模)现有A,2两组数据,其中A组有4个数据,平均数为2,方差

为6,8组有6个数据,平均数为7,方差为1.若将这两组数据混合成一组,则新的一组数

据的方差为.

6.(2024•广西•二模)设实数x,y(4<x<y),满足1,3,4,龙,》y+2的平均数与

50%分位数相等,则数据尤,》y+2的方差为.

四、解答题

7.(2024・安徽芜湖,二模)据新华社北京2月26日报道,中国航天全年预计实施100次左

右发射任务,有望创造新的纪录,我国首个商业航天发射场将迎来首次发射任务,多个卫

星星座将加速组网建设;中国航天科技集团有限公司计划安排近70次宇航发射任务,发射

290余个航天器,实施一系列重大工程任务.由于航天行业拥有广阔的发展前景,有越来越

多的公司开始从事航天研究,某航天公司研发了一种火箭推进器,为测试其性能,对推进

器飞行距离与损坏零件数进行了统计,数据如下:

飞行距离x(kkm)5663717990102110117

损坏零件数y(个)617390105119136149163

88

参考数据:元=86,y=112,82743,^x,2=62680

i=lz=l

⑴建立y关于x的回归模型9=赢+&,根据所给数据及回归模型,求y关于龙的回归方程

(B精确到0.1,&精确到1);

(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测

试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比

30%,请根据统计数据完成2x2列联表,并根据小概率值c=0.01的独立性检验,能否认为

推进器是否报废与保养有关?

保养未保养合计

报废20

未报废

合计60100

£(王-丁)(%-y)

附:回归方程亍=意+&中斜率和截距的最小二乘估计公式分别为-----------

£(乙-a

1=1

_2n(ad-bc}

a=y-bx,K=-------------------,n=a+b+c+d;

(a+b)(c+d)(a+c)(b+d)

2

P(K>kQ)0.250.10.050.0250.010.001

1.3232.7063.8415.0246.63510.828

8.(2022•全国•高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯

(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例

(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下

数据:

不够良好良好

病例组4060

对照组1090

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

⑵从该地的人群中任选一人,A表示事件"选到的人卫生习惯不够良好”,8表示事件"选到

的人患有该疾病".儒1与M的比值是卫生习惯不够良好对患该疾病风险程度的

一项度量指标,记该指标为R.

尸(A|B)P(A|B)

(回)证明:

P(A|B)-P(A|B)

(回)利用该调查数据,给出尸(Al3),P(A|心的估计值,并利用(回)的结果给出R的估计

值.

n{ad-bc)~

附K?=

(〃+b)(c+d)(a+c)(Z?+d)

P(K2>k]0.0500.0100.001

k3.8416.63510.828

【基础保分训练】

一、单选题

1.(23-24高三下•广东•开学考试)国家统计局发布的2018年至2022年我国居民消费水平

情况如图所示,则下列说法正确的是()

(居民消费水平:

农村居民消费水平>农村人口数+城镇居民消费水平x城镇人口数

农村人口数+城镇人口数

・金额/元

3799538289

38672

3490034043口居民消费水平

|—|31013

29004^7504574^叼农村居民消费水平

25245

3430口城镇居民消费水平

19336

15S2I16^(M

I1R39^

^^

9668^

^^S

20182019202020212022

A.2018年至2022年我国居民消费水平逐年提高

B.2018年至2022年我国城镇居民消费水平逐年提高

C.2018年至2022年我国居民消费水平数据的60%分位数为27504元

D.2022年我国城镇人口数比农村人口数的1.5倍还要多

2.(2023•贵州黔东南•模拟预测)"说文明话、办文明事、做文明人,树立城市新风尚!创

建文明城市,你我共同参与!”为宣传创文精神,华强实验中学高一(2)班组织了甲乙两

名志愿者,利用一周的时间在街道对市民进行宣传,将每天宣传的次数绘制成如下频数分

布折线图,则以下说法不正聊的为()

甲、乙志愿者宣传次数的频数分布折线图

A.甲的众数小于乙的众数B.乙的极差小于甲的极差

C.甲的方差大于乙的方差D.乙的平均数大于甲的平均数

3.(2024・海南•模拟预测)某机构统计了1000名演员的学历情况,制作出如图所示的饼状

图,其中本科学历的人数为630.现按比例用分层随机抽样的方法从中抽取200人,则抽取

的硕士学历的人数为()

博士及以上

A.11B.13C.22D.26

4.(2023・福建泉州•模拟预测)某市物价部门对某商品在5家商场的售价x(元)及其一天

的销售量V(件)进行调查,得到五对数据(七,%)(i=l,2,3,4,5),经过分析、计算,得

x=10,9=8,尤,V之间的经验回归方程是:夕=-3.2%+4,则相应于点(9510)的残差

为()

A.0.4B.1.5C.8D.9.6

二、多选题

5.(2024•河南三门峡•模拟预测)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随

机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如下所示的频率分

布直方图,则(同一组中的数据用该组区间的中点值作代表)()

A.m=0.030

B.样本质量指标值的平均数为75

C.样本质量指标值的众数小于其平均数

D.样本质量指标值的第75百分位数为85

6.(2024广东•二模)若y是样本数据占,%,鼻m4的平均数,则()

A.芯,々/3,匕的极差等于三,3,尤3,匕,,的极差

B.占,%,当,匕的平均数等于占,X2,玉,匕,y的平均数

C.百,尤2,工3,七的中位数等于再,工2,为3,匕,丫的中位数

D.国,%,毛,匕的标准差大于Xvx2,x3,x^,y的标准差

7.(2024・云南昆明•模拟预测)某城市在创建文明城市的活动中,为了解居民对“创建文明

城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个

容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分

如图所示.观察图形,则下列说法正确的是()

A.频率分布直方图中第三组的频数为15

B.根据频率分布直方图估计样本的众数为75分

C.根据频率分布直方图估计样本的中位数为74分

D.根据频率分布直方图估计样本的平均数为73分

8.(2024•湖北武汉•模拟预测)某科技公司统计了一款App最近5个月的下载量如表所

示,若y与x线性相关,且线性回归方程为9=-0.6彳+。,则()

月份编号X12345

下载量y(万次)54.543.52.5

A.'与x负相关B.a=5.6

C.预测第6个月的下载量是2.1万次D.残差绝对值的最大值为0.2

三、填空题

9.(2024・全国•模拟预测)某小组5位同学各抛掷一枚正方体骰子,将正面向上的点数按从

小到大的顺序记录下来,得到一组统计数据.已知这组数据的平均数为整数,最大值为

6,中位数为3,方差为1.6,则这组数据的众数为.

10.(2024・四川成都•一模)某区为了解全区12000名高二学生的体能素质情况,在全区高

二学生中随机抽取了1000名学生进行体能测试,并将这1000名的体能测试成绩整理成如下

频率分布直方图.根据此频率分布直方图,这1000名学生平均成绩的估计值为.

11.(2024・陕西西安•模拟预测)某企业近年来的广告费用尤(百万元)与所获得的利润V

(千万元)的数据如下表所示,已知V与X之间具有线性相关关系.

年份20182019202020212022

广告费用X/百万元1.51.61.71.81.9

润y/千万元1.622.42.53

⑴求y关于*的线性回归方程;

⑵若该企业从2018年开始,广告费用连续每一年都比上一年增加10万元,根据(1)中

所得的线性回归方程,预测2025年该企业可获得的利润.

_n_n__

参考公式:3=上。-----------T---------,a=y-bx.

丁『之x;-位2

i=li=l

12.(2024•全国•模拟预测)中国新能源汽车企业在10余年间实现了“弯道超车",使我国一

跃成为新能源汽车产量连续7年居世界第一的全球新能源汽车强国.某新能源汽车配件企业

积极加大科研力度,生产效益逐步攀升.该企业在今年I月份至5月份的生产利润V(单

位:亿元)关于月份尤的数据如下表所示:

月份X12345

生产利润y(亿元)268910

⑴试求y与尤之间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若

旧>0.75,则认为两个变量具有较强的线性相关性)

(2)为扩大生产,该企业在M大学启动了校园招聘,分别招聘A、B两个工程师岗位,两个

岗位都各设有3门笔试科目大学的硕士毕业生张无忌决定参加这次应聘,且每门科目考

12

试是否通过相互独立.若张无忌报考A岗位,每门笔试科目通过的概率依次为5,7,彳,

其中0<r<l;若张无忌报考B岗位,每门笔试科目通过的概率均为;.且张无忌只能报考

A,B两个岗位中的一个.若以笔试中通过科目数的数学期望为依据作出决策,得出张无忌

更有希望通过A岗位的笔试,试求t的取值范围.

附:参考数据:£仁-q2=10,±(%_讨=40,之1,T(y,T=i9.

i=li=li=l

相关系数『=i产।.

J决纱

13.(2024•湖南长沙•模拟预测)为了了解高中生运动达标情况和性别之间的关系,某调查

机构随机调查了100名高中生的情况,统计他们在暑假期间每天参加体育运动的时间,并

把每天参加体育运动时间超过30分钟的记为"运动达标",时间不超过30分钟的记为"运动

欠佳",已知运动达标与运动欠佳的人数比为3回2,运动达标的女生与男生的人数比为

201,运动欠佳的男生有5人.

⑴根据上述数据,完成下面2x2列联表,并依据小概率值c=0.05的独立性检验,能否认

为学生体育运动时间达标与性别因素有关系;

运动达标情况

性别合计

运动达标运动欠佳

男生

女生

合计

(2)现从"运动达标”的学生中按性别用分层随机抽样的方法抽取6人,再从这6人中任选2.

人进行体能测试,求选中的2人中恰有一人是女生的概率.

n(ad-bc)~

参考公式/=n—a+b+c+d.

(a+6)(c+d)(a+c)(b+d)

a0.10.050.01

Xa2.7063.8416.635

14.(2024・陕西•二模)为了引导学生阅读世界经典文学名著,某学校举办“名著读书日”活

动,每个月选择一天为“名著读书日",并给出一些推荐书目.为了了解此活动促进学生阅读

文学名著的情况,该校在此活动持续进行了一年之后,随机抽取了校内100名学生,调查

他们在开始举办读书活动前后的一年时间内的名著阅读数量,所得数据如下表:

多于5本少于5本合计

活动前3565100

活动后6040100

合计95105200

(1)试通过计算,判断是否有99.9%的把握认为举办该读书活动对学生阅读文学名著有促进

作用;

(2)已知某学生计划在接下来的一年内阅读6本文学名著,其中4本国外名著,2本国内名

著,并且随机安排阅读顺序.记2本国内名著恰好阅读完时的读书数量为随机变量X,求

X的数学期望.

n(ad-bc')2

参考公式:K2=n=a+b+c+d

(a+6)(c+d)(a+c)(6+d),

临界值表:

2

P(K>k0)0.100.050.0250.0100.0050.001

2.7063.8415.0246.6357.87910.828

【能力提升训练】

一、单选题

1.(2021•河南郑州,一模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行

业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是

()

80前3%90后从事互联网行业岗位分布图

技术39.6%

运营17%

市场13.2%

设计12.3%

职能9.8%

产品6.5%

其他■1.6%

注:90后指1990年及以后出生,80后指1980-1989年之间出生,80前指1979年及以前出

生.

A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上

B.互联网行业中从事技术岗位的人数超过总人数的20%

C.互联网行业中从事运营岗位的人数90后一定比80前多

D.互联网行业中从事技术岗位的人数90后一定比80后多

2.(2024・四川•模拟预测)某市教育主管部门为了解高三年级学生学业达成的情况,对高三

年级学生进行抽样调查,随机抽取了1000名学生,他们的学业达成情况按照从高到低都分

布在A,民C,RE五个层次内,分男、女生统计得到以下样本分布统计图,则下列叙述正确

的是()

女生学业达成男生学业达

频率分布直方图成分布扇形图

本频率/组距

3a-----------------------I-------------

2.5a--------------------

2a——----

1.5a-------------------------

a------------------------------

----------------->

oABCDE学业达

成层次

A.样本中A层次的女生比相应层次的男生人数多

B.估计样本中男生学业达成的中位数比女生学业达成的中位数小

C.。层次的女生和E层次的男生在整个样本中频率相等

D.样本中8层次的学生数和C层次的学生数一样多

3.(2022•天津和平♦模拟预测)某校随机抽取了400名学生进行成绩统计,发现抽取的学

生的成绩都在50分至100分之间,进行适当分组画出频率分布直方图如图所示,下列说法

正确的是()

A.直方图中尤的值为0.040

B.在被抽取的学生中,成绩在区间[70,80)的学生数为30人

C.估计全校学生的平均成绩为84分

D.估计全校学生成绩的样本数据的80%分位数约为93分

4.(2024・安徽合肥•模拟预测)某停车场在统计停车数量时数据不小心丢失一个,其余六个

数据分别是10,8,8,11,16,8,若这组数据的平均数、中位数、众数成等差数列,则

丢失数据的所有可能值的和为()

A.21B.24C.27D.32

5.(2024・河北•一模)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随

机抽取了7名男生,测量了他们的身高和体重得下表:

身高X(单位:cm)167173175177178180181

体重y(单位:kg)90545964677276

由表格制作成如图所示的散点图:

收单位:cm

100-

90-•

80-

70-••

60-.••

50--

40-

30-

20-

10-

166168170172174176178180102弹位:kg

由最小二乘法计算得到经验回归直线乙的方程为9其相关系数为小经过残差分

析,点(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线

4的方程为9=&x+电,相关系数为4.则下列选项正确的是()

B.bl<b2,al<a^,i[>r2

C.bx>b2,a1<a2,rx>r2D.bx>b2,a^>a-,,rx<r2

6.(2024・湖北荆州•三模)根据变量y和x的成对样本数据,由一元线性回归模型

Y=bx+a+e

得到经验回归模型y=bx+a,求得如图所示的残差图.模型误差

E(e>)=0,£)(e)=o-2

()

木残差

A.满足一元线性回归模型的所有假设

B.不满足一元线性回归模型的E(e)=O的假设

C.不满足一元线性回归模型的。⑻=/假设

D.不满足一元线性回归模型的E(e)=0和D(e)=(T2的假设

二、多选题

7.(23-24高三下•福建•开学考试)据国家统计局网站2023年9月15日消息,8月份,社

会消费品零售总额为37933亿元,同比增长4.6%(同比一般情况下是指本年第N月与去

年的第N月比).其中,除汽车以外的消费品零售额为33820亿元,增长5」%.1团8月份,

社会消费品零售总额为302281亿元,同比增长7.0%.其中,除汽车以外的消费品零售额为

271888亿元,增长7.2%.2022年8月至2023年8月社会消费品零售总额同比增速如下:

A.2023年1~8月份,社会消费品零售总额的月平均值约为25422.6亿元

B.2022年8月份,社会消费品零售总额约为36264.8亿元

C.除掉2022年8月至2023年8月社会消费品零售总额同比增速数据的最大值和最小

值所得数据的标准差比原数据的标准差小

D.2022年8月至2023年8月社会消费品零售总额同比增速数据的极差比中位数的8

倍还多

8.(2023•广东•二模)现有甲、乙、丙三位篮球运动员连续5场篮球比赛得分情况的记录数

据,已知三位球员得分情况的数据满足以下条件:

甲球员:5个数据的中位数是26,众数是24;

乙球员;5个数据的中位数是29,平均数是26;

丙球员:5个数据有1个是32,平均数是26,方差是9.6;

根据以上统计数据,下列统计结论一定正确的是()

A.甲球员连续5场比赛得分都不低于24分

B.乙球员连续5场比赛得分都不低于24分

C.丙球员连续5场比赛得分都不低于24分

D.丙球员连续5场比赛得分的第60百分位数大于24

9.(2024・湖北鄂州•一模)下列命题正确的是()

A.若样本数据的频率分布直方图为单峰不对称,且在右边"拖尾",则样本数据的平均

数大于中位数

B.若散点图的散点均落在一条斜率非。的直线上,则决定系数发=1

C.数据占,4,凡,匕,毛的均值为4,标准差为1,则这组数据中没有大于5的数

D.数据12,23,35,47,61的75百分位数为47

三、填空题

1O

10.(2024•河南新乡•二模)若一组数据4,%,%,%,%的平均数为3,方差为彳,则

这个数的平均数为,方差为.

%,a2,a3,%,%,96

11.(2024・广东•一模)已知a,b,c是正整数,且ae[10,20],fee(20,30],ce(30,40],

当a,b,c方差最小时,写出满足条件的一组a,b,。的值______.

四、解答题

12.(2024•河南•三模)PM2.5是指环境空气中直径小于或等于2.5微米的颗粒物.它能较

长时间悬浮于空气中,其在空气中含量越高,说明空气污染越严重.城市中的PM2.5成分

除扬尘等自然因素外,燃料的燃烧也是一个重要来源.某市环境检测部门为检测燃油车流

量对空气质量的影响,在一个检测点统计每日过往的燃油车流量x(单位:辆)和空气中

的PM2.5的平均浓度V(单位:)ig/m3).检测人员采集了50天的数据,制成2x2列联表

(部分数据缺失):

燃油车日流量x<1500燃油车日流量X21500合计

PM2.5的平均浓度y<1001624

PM2.5的平均浓度y»ioo20

合计22

⑴完成上面的2x2列联表,并根据小概率值0=0.005的独立性检验,能否认为PM2.5的平

均浓度小于100ng/m3与燃油车日流量小于1500辆有关联?

⑵经计算得V与x之间的回归直线方程为y=0.12x-73.86,且这50天的燃油车的日流量尤

的标准差工=249,PM2.5的平均浓度V的标准差s,=36.若相关系数「满足㈤20.75,则

判定所求回归直线方程有价值;否则判定其无价值.

①判断该回归直线方程是否有价值;

50

②若这50天的燃油车的日流量无满足=1.23x108,试求这50天的pM2.5的平均浓度

1=1

y的平均数歹(利用四舍五入法精确到o.i).

n^ad-bc^

参考公式:/二其中〃=a+/?+c+d.

(Q+b)(c+d)(a+c)(b+d)'

a0.010.0050.001

%6.6367.87910.828

,‘£(%-牙)(%-9)Ex^^rixy

回归方程亍=&+暮,其中3=上―-----------T--------------,a=y-bx;

£(七-元y而2

i=li=]

相关系数〃:i.

#(x,.-x)2^(y,.-y)2

Vz=li=l

参考数据:^-X1.23=0.0246,2492=62001,

J2397999x1548.55.

13.(2024•重庆,一模)实现"双碳目标"是党中央作出的重大战略决策,新能源汽车、电动

汽车是重要的战略新兴产业,对于实现"双碳目标”具有重要的作用.为了解某市电动汽车

的销售情况,调查了该市某电动汽车企业近6年产值情况,数据如下表所示:

年份201820192020202120222023

编号x123456

产值W百万辆91830515980

⑴若用模型y=a-e加拟合y与X的关系,根据提供的数据,求出y与X的经验回归方程

(精确到0.01);

(2)为了进一步了解车主对电动汽车的看法,从某品牌汽车4s店当日5位购买电动汽车和3

位购买燃油汽车的车主中随机选取4位车主进行采访,记选取的4位车主中购买电动汽车

的车主人数为X,求随机变量X的分布列与数学期望,

66

参考数据:X%=20.88,X%%=80.58,其中%=In%.

z=li=\

参考公式:对于一组数据(4其)«=1,2,3,…,其经验回归直线》=加+6的斜率截距的

〃——

^x^-nx-y

最小二乘估计分别为BR---------泊=y-bx.

力尤;-rix2

i=l

14.(2023・河北•模拟预测)5G技术对社会和国家十分重要.从战略地位来看,业界一般将

其定义为继蒸汽机革命、电气革命和计算机革命后的第四次工业革命.某科技集团生产

A,B两种5G通信基站核心部件,下表统计了该科技集团近几年来在A部件上的研发投入

x(亿元)与收益y(亿元)的数据,结果如下:

研发投入X(亿元)12345

收益y(亿元)3791011

⑴利用样本相关系数厂说明是否可以用线性回归模型拟合y与x的关系(当We[0.75,1]

时,可以认为两个变量有很强的线性相关性);

⑵求出y关于尤的经验回归方程,并利用该方程回答下列问题:

①若要使生产A部件的收益不低于15亿元,估计至少需要投入多少研发资金?(精确到

0.001亿元)

②该科技集团计划用10亿元对A,8两种部件进行投资,对B部件投资x(14x46)元所

获得的收益y近似满足>=0.9》-3+3.7,则该科技集团针对A,8两种部件各应投入多少

研发资金,能使所获得的总收益尸最大.

n.

附:样本相关系数

可(%-日

回归直线方程的斜率3=J-----------------,截距/=亍-5"

Z=1

15.(2024・全国•模拟预测)随着人工智能的进一步发展,ChatGPT逐渐进入大众视

野.ChatGPT是一种基于人工智能的语言模型,具备卓越的自然语言处理能力、广泛的知

识覆盖范围和富有创造性的回答能力,是人们学习、工作与生活中的出色助手.尽管如

此,也有部分人认为ChatGPT会对人类未来工作产生威胁,由于其在提高工作效率方面的

出色表现,将在未来取代一部分人的职业.现对200家IT企业开展调查,统计每家企业一

年内应用ChatGPT的广泛性及招聘人数的增减,得到数据结果统计如下表所示:

ChatGPT应用广泛性招聘人数减少招聘人数增加合计

广泛应用6050110

没有广泛应用405090

合计100100200

⑴根据小概率。=0.01的独立性检验,是否有99%的把握认为IT企业招聘人数的增减与

ChatGPT应用的广泛性有关?

⑵用频率估计概率,从招聘人数减少的企业中随机抽取30家企业,记其中广泛应用

ChatGPT的企业有X家,事件"X=L"的概率为尸(X=^).求X的分布列并计算使

P(X=Q取得最大值时女的值.

n(ad-be)2,

附:z2(a+b)(c+d)(a+c)(6+d)'其中〃=4+6+°+小

a0.10.050.01

Xa2.7063.8416.635

2025二轮复习专项训练23

统计与成对数据的统计分析

[考情分析]高考近几年考查热点,主要考查线性回归分析和独立性检验,以实际应用题的

形式出现,题目阅读量大,难度中档.

【练前疑难讲解】

一、用样本估计总体

1.统计中的四个数据特征:

(1)众数:在样本数据中,出现次数最多的那个数据.

(2)中位数:在样本数据中,将数据按从小到大顺序排列,位于最中间的数据.如果数据的个

数为偶数,就取中间两个数据的平均数作为中位数.

(3)平均数:样本数据的算术平均数,即X=)X1+X2+…+/).

(4)方差与标准差:

1——————

52=-[(%]—X)2+(X2-X)2H---H(x„—尤)2],

s=q;[(xi-Xy+(尤2-X)2H---l-(x„—X)2].

2.频率分布直方图的两个结论:

(1)小长方形的面积=组距>频<率赢=频率.

(2)各小长方形的面积之和等于1.

二、回归分析

1.经验回归直线;=晨+联经过样本点的中心(三,V),若无取某一个值,代入经验回归方

AAA

程y=bx+a中,可求出y的估计值.

2.样本相关系数:

当厂>0时,称成对样本数据正相关;当K0时,称成对样本数据负相关.

三、独立性检验

1.独立性检验的一般步骤

(1)根据样本数据列成2X2列联表;

(2)根据公式

/二/耳而喘毋E不,计算的值;

(3)查表比较/与临界值的大小关系,作统计判断.

2./的值越大,对应假设事件办成立(两类变量相互独立)的概率越小,”不成立的概率越

大.

一、单选题

1.(2024•黑龙江哈尔滨•一模)为了迎接2025年第九届亚冬会的召开,某班组织全班学生

开展有关亚冬会知识的竞赛活动.已知该班男生35人,女生25人.根据统计分析,男生

组成绩和女生组成绩的方差分别为s;、s;,该班成绩的方差为则下列结论中一定正确

的是()

B.T

A.s1

2

7s;+5s;D.八七

C.s1

12

2.(2024・天津和平•一模)某市为了减少水资源浪费,计划对居民生活用水实施阶梯水价制

度,为确定一个比较合理的标准,从该市随机调查了100位居民,获得了他们某月的用水

①估计居民月均用水量低于1.50?的概率为0.25;②估计居民月均用水量的中位数约为

2.1m3;③该市有40万居民,估计全市居民中月均用水量不低于3m3的人数为6万;④

根据这100位居民的用水量,采用样本量按比例分配的分层随机抽样的方法,抽取了容量

为20人的样本,则在用水量区间。52]中应抽取4人.

A.1B.2C.3D.4

二、多选题

3.(2024・湖南衡阳•模拟预测)中国雪乡哈尔滨的看雪最佳时间在11月中旬到次年的2月

上旬,某旅游公司设计了一款冰雪文创产品.试营销以来,这款冰雪文创产品定价x(单

位:元)与销量、(单位:万件)的数据如下表所示:

产品定价X(单位:元)99.51010.511

销量y(单位:万件)1110865

则下列结论正确的是()

参考公式:厂=1厂,•

\恒%-可5(%-刃~

VZ=1Z=1

555

参考数据:£(%—可=2.5,2(%-5)=26,£(—)(%-予)=-8,765«8.06.

i=li=li=l

A.产品定价x的平均值是10元

B.产品定价x与销量y存在正相关关系

c.产品定价X与销量y满足一元线性回归模型

D.产品定价X与销量y的相关系数3-0.99

4.(23-24高三下•山东荷泽•开学考试)下列说法正确的是()

A.若随机变量X〜建2,0.2),则尸(X=2)=0.2

B.若经验回归方程»=菽+&中的另>0,则变量尤与V正相关

C.若随机变量x〜N(0,s,且p[j<-S=p,则P[o<j<\=;-p

D.若事件A与3为互斥事件,则A的对立事件与3的对立事件一定互斥

三、填空题

5.(2024・山东济南•二模)现有A,2两组数据,其中A组有4个数据,平均数为2,方差

为6,8组有6个数据,平均数为7,方差为1.若将这两组数据混合成一组,则新的一组数

据的方差为.

6.(2024•广西•二模)设实数x,y(4<x<y),满足1,3,4,龙,》y+2的平均数与

50%分位数相等,则数据尤,》y+2的方差为.

四、解答题

7.(2024•安徽芜湖,二模)据新华社北京2月26日报道,中国航天全年预计实施100次左

右发射任务,有望创造新的纪录,我国首个商业航天发射场将迎来首次发射任务,多个卫

星星座将加速组网建设;中国航天科技集团有限公司计划安排近70次宇航发射任务,发射

290余个航天器,实施一系列重大工程任务.由于航天行业拥有广阔的发展前景,有越来越

多的公司开始从事航天研究,某航天公司研发了一种火箭推进器,为测试其性能,对推进

器飞行距离与损坏零件数进行了统计,数据如下:

飞行距离x(kkm)5663717990102110117

损坏零件数y(个)617390105119136149163

参考数据:于=86,9=112,£>,“=82743,^=62680

i=li=l

⑴建立y关于x的回归模型£=嬴+&,根据所给数据及回归模型,求y关于x的回归方程

(B精确到0.L6精确到1);

(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测

试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比

30%,请根据统计数据完成2x2列联表,并根据小概率值1=0.01的独立性检验,能否认为

推进器是否报废与保养有关?

保养未保养合计

报废20

未报废

合计60100

♦(%-元)(y-方

附:回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为b=―......................

可2

Z=1

_2n(ad-bc}

d=y-bx,K=-----------------------------,n=a+b+c+d;

(a+b)(c+d)(a+c)(b+d)

2

P(K>kQ)0.250.10.050.0250.010.001

1.3232.7063.8415.0246.63510.828

8.(2022•全国•高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯

(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例

(称为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论