2025年高考数学必刷题分类:第84讲、成对数据的统计分析(学生版)_第1页
2025年高考数学必刷题分类:第84讲、成对数据的统计分析(学生版)_第2页
2025年高考数学必刷题分类:第84讲、成对数据的统计分析(学生版)_第3页
2025年高考数学必刷题分类:第84讲、成对数据的统计分析(学生版)_第4页
2025年高考数学必刷题分类:第84讲、成对数据的统计分析(学生版)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第84讲成对数据的统计分析

知识梳理

知识点一、变量间的相关关系

1、变量之间的相关关系

当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相

关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重

要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规

律,对它们的关系作出判断.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种

确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随

关系.

2、散点图

将样本中的n个数据点(xi,yi)(i1,2,,n)描在平面直角坐标系中,所得图形叫做散点

图.根据散点图中点的分布可以直观地判断两个变量之间的关系.

(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关

关系,我们将它称为正相关,如图(1)所示;

(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关

关系,我们将它称为负相关,如图(2)所示.

3、相关系数

若相应于变量x的取值xi,变量y的观测值为yi(1in),则变量x与y的相关系数

nn

(xix)(yiy)xiyinxy

ri1i1,通常用r来衡量x与y之间的线性

nnnn

222222

(xix)(yiy)xinxyiny

i1i1i1i1

关系的强弱,r的范围为1r1.

(1)当r0时,表示两个变量正相关;当r0时,表示两个变量负相关.

(2)r越接近1,表示两个变量的线性相关性越强;r越接近0,表示两个变量间几

乎不存在线性相关关系.当|r|1时,所有数据点都在一条直线上.

(3)通常当r0.75时,认为两个变量具有很强的线性相关关系.

知识点二、线性回归

1、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.

对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程ybxa

的求法为

nn

(xix)(yiy)xiyinxy

i1i1

bnn

222

(xix)xinx

i1i1

aybx

nn

其中,1,1,(,)称为样本点的中心.

xxiyyixy

ni1ni1

2、残差分析

对于预报变量y,通过观测得到的数据称为观测值yi,通过回归方程得到的y称为预

测值,观测值减去预测值等于残差,eˆi称为相应于点(xi,yi)的残差,即有eˆiyiyˆi.残差

是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据

中是否存在可疑数据等,这方面工作称为残差分析.

(1)残差图

通过残差分析,残差点xi,eˆi比较均匀地落在水平的带状区域中,说明选用的模型比较

合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.

n

()通过残差平方和2分析,如果残差平方和越小,则说明选用的模型

2Q(yiyˆi)

i1

的拟合效果越好;反之,不合适.

(3)相关指数

n

2

(yiyˆi)

用相关指数来刻画回归的效果,其计算公式是:2i1.

R1n

2

(yiy)

i1

R2越接近于1,说明残差的平方和越小,也表示回归的效果越好.

知识点三、非线性回归

解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元

将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.

求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方

程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,

避免计算错误.

1、建立非线性回归模型的基本步骤:

(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;

(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非

线性关系);

(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用

反比例函数、二次函数、指数函数、对数函数、幂函数模型等);

(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;

(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;

(6)消去新元,得到非线性回归方程;

(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型

是否合适等.

知识点四、独立性检验

1、分类变量和列联表

(1)分类变量:

变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表:

①定义:列出的两个分类变量的频数表称为列联表.

②2×2列联表.

一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样

本频数列联表(称为2×2列联表)为

y1y2总计

x1abab

x2cdcd

nabcd

总计acbd

ac

从22列表中,依据与的值可直观得出结论:两个变量是否有关系.

abcd

2、等高条形图

(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等

高条形图表示列联表数据的频率特征.

ac

(2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系.

abcd

3、独立性检验

n(adbc)2

计算随机变量2利用2的取值推断分类变量X和Y是否独

(ab)(cd)(ac)(bd)

立的方法称为χ2独立性检验.

0.100.050.0100.0050.001

x2.7063.8416.6357.87910.828

【解题方法总结】

常见的非线性回归模型

(1)指数函数型ycax(a0且a1,c0)

两边取自然对数,lnylncax,即lnylncxlna,

ylny

令,原方程变为ylncxlna,然后按线性回归模型求出lna,lnc.

xx

(2)对数函数型yblnxa

yy

令,原方程变为ybxa,然后按线性回归模型求出b,a.

xlnx

(3)幂函数型yaxn

两边取常用对数,lgylgaxn,即lgynlgxlga,

ylgy

令,原方程变为ynxlga,然后按线性回归模型求出n,lga.

xlgx

(4)二次函数型ybx2a

yy

令,原方程变为,然后按线性回归模型求出,.

2ybxaba

xx

b

(5)反比例函数型ya型

x

yy

令1,原方程变为ybxa,然后按线性回归模型求出b,a.

x

x

必考题型全归纳

题型一:变量间的相关关系

例1.(2024·河北·高三校联考期末)下列四幅残差分析图中,与一元线性回归模型拟合精度

最高的是()

A.B.

C.D.

例2.(2024·天津蓟州·高三校考开学考试)对两个变量x,y进行线性相关检验,得线性相

关系数r10.8995,对两个变量u,v进行线性相关检验,得线性相关系数r20.9568,则

下列判断正确的是()

A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强

B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强

C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强

D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强

例3.(2024·宁夏吴忠·高三盐池高级中学校考阶段练习)在如图所示的散点图中,若去掉点

P,则下列说法正确的是()

A.样本相关系数r变大

B.变量x与变量y的相关程度变弱

C.变量x与变量y呈正相关

D.变量x与变量y的相关程度变强

变式1.(2024·四川成都·高三统考阶段练习)已知建筑地基沉降预测对于保证施工安全,实

现信息化监控有着重要意义.某工程师建立了四个函数模型来模拟建筑地基沉降随时间的变

化趋势,并用相关指数、误差平方和、均方根值三个指标来衡量拟合效果.相关指数越接近

1表明模型的拟合效果越好,误差平方和越小表明误差越小,均方根值越小越好.依此判断

下面指标对应的模型拟合效果最好的是()

A.

相关指数误差平方和均方根值

0.9498.4910.499

B.

相关指数误差平方和均方根值

0.9334.1790.436

C.

相关指数误差平方和均方根值

0.9971.7010.141

D.

相关指数误差平方和均方根值

0.9972.8990.326

变式2.(2024·高三课时练习)甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关

性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:

甲乙丙丁

r0.820.780.690.85

m106115124103

则能体现A,B两变量有更强的线性相关性的是()

A.甲B.乙C.丙D.丁

变式3.(2024·河北石家庄·统考三模)观察下列四幅残差图,满足一元线性回归模型中对随

机误差的假定的是()

A.

B.

C.

D.

变式4.(2024·全国·高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关

试验,并分别计算出相关系数r,则线性相关程度最高的是()

甲乙丙丁

r0.870.910.580.83

A.甲B.乙C.丙D.丁

变式5.(2024·全国·高三专题练习)给出下列有关线性回归分析的四个命题:

①线性回归直线未必过样本数据点的中心(x,y);

②回归直线就是散点图中经过样本数据点最多的那条直线;

③当相关系数r0时,两个变量正相关;

④如果两个变量的相关性越强,则相关系数r就越接近于1.

其中真命题的个数为()

A.1B.2C.3D.4

【解题方法总结】

判定两个变量相关性的方法

(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到

右下角,两个变量负相关.

(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越

强.

(3)经验回归方程:当bˆ>0时,正相关;当bˆ<0时,负相关.

题型二:一元线性回归模型

例4.(2024·天津蓟州·高三校考开学考试)为研究某种细菌在特定环境下,随时间变化的繁

殖情况,得到如下实验数据:

天数x(天)3456

繁殖个数y(千个)2.5344.5

由最小二乘法得y与x的线性回归方程为y0.7xa,则当x7时,繁殖个数y的预测值

为()

A.4.9B.5.25C.5.95D.6.15

例5.(2024·湖南长沙·高三长郡中学校联考阶段练习)某社区为了丰富退休人员的业余文化

生活,自2018年以来,始终坚持开展“悦读小屋读书活动”.下表是对2018年以来近5年该

社区退休人员的年人均借阅量的数据统计:

年份20182019202020212022

年份代码x12345

年人均借阅量y(册)y1y2162228

5

y

(参考数据:yi90)通过分析散点图的特征后,年人均借阅量关于年份代码x的回

i1

归分析模型为y5xm,则2024年的年人均借阅量约为()

A.31B.32C.33D.34

例6.(2024·辽宁·辽宁实验中学校考模拟预测)已知x,y的对应值如下表所示:

x02468

y1m12m13m311

若y与x线性相关,且回归直线方程为y1.6x0.6,则m()

A.2B.3C.4D.5

变式6.(2024·广西南宁·南宁二中校联考模拟预测)某单位在当地定点帮扶某村种植一种草

莓,并把这种原本露天种植的草莓搬到了大棚里,获得了很好的经济效益.根据资料显示,

产出的草莓的箱数x(单位:箱)与成本y(单位:千元)的关系如下:

x102030406080

yy1y2y3y4y5y6

(1)根据散点图可以认为x与y之间存在线性相关关系,请用最小二乘法求出线性回归方程

yˆbˆxaˆ(aˆ,bˆ用分数表示)

(2)某农户种植的草莓主要以300元/箱的价格给当地大型商超供货,多余的草莓全部以200

元/箱的价格销售给当地小商贩.据统计,往年1月份当地大型商超草莓的需求量为50箱、

1111

100箱、150箱、200箱的概率分别为,,,,根据回归方程以及往年商超草莓的

10525

需求情况进行预测,求今年1月份农户草莓的种植量为200箱时所获得的利润情况.(最后

结果精确到个位)

66

ˆ

附:xixyiy790,yi54,在线性回归直线方程yˆbxaˆ中

i1i1

n

xixyiy

ˆi1ˆ

bn,aˆybx.

2

xix

i1

变式7.(2024·江西·高三统考开学考试)某新能源汽车销售部对今年1月至7月的销售量进

行统计与分析,因不慎丢失一些数据,现整理出如下统计表与一些分析数据:

月份1月2月3月4月5月6月7月

月份代号x1234567

销售量y(单位:万辆)15.6mns37.739.644.5

其中y31.2.

(1)若m,n,s成递增的等差数列,求从7个月的销售量中任取1个,月销售量不高于27

万辆的概率;

7

2

(2)若yiy670.48,x与y的样本相关系数r0.99,求y关于x的线性回归方程

i1

yˆbˆxaˆ,并预测今年8月份的销售量(bˆ精确到0.1).

n

xixyiy

i1

附:相关系数r,线性回归方程yˆbˆxaˆ中斜率和截距的最小二

n2n2

xixyiy

i1i1

n

xixyiy

乘估计公式分别为bˆi1,ˆˆ.

n2aybx

xix

i1

参考数据:72.65,670.4825.89.

变式8.(2024·四川成都·高三石室中学校考开学考试)已知某绿豆新品种发芽的适宜温度在

6℃~22℃之间,一农学实验室研究人员为研究温度x(℃)与绿豆新品种发芽数y(颗)之

间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得

到如下散点图:

77

2

其中y24,(xix)(yiy)70,(yiy)=176.

i1i1

(1)运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?

$$$

(2)求出y关于x的线性回归方程ybxa,并预测在19℃的温度下,种子的发芽的颗数.

n

(xix)(yiy)

参考公式:相关系数ri1,回归直线方程$$$,其中

nnybxa

22

(xix)(yiy)

i1i1

n

(xix)(yiy)

i1$$

bn,aybx.参考数据:778.77.

2

(xix)

i1

变式9.(2024·安徽亳州·蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积x(单

位:公顷)和野生动物数量y的关系,某研究小组将该地区等面积花分为400个区块,从中

随机抽取40个区块,得到样本数据xi,yi(i1,2,,40),部分数据如下:

x…2.73.63.23.9…

y…50.663.752.154.3…

40404040

2

经计算得:xi160,yi2400,xix160,xixyiy1280.

i1i1i1i1

(1)利用最小二乘估计建立y关于x的线性回归方程;

(2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐

标系xOy下,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.设前者与

后者的斜率分别为k1,k2,比较k1,k2的大小关系,并证明.

附:y关于x的回归方程yabx中,斜率和截距的最小二乘估计公式分别为:

nn

xynxy

xiyinxyii

ˆi1,$$,ri1

bnaybxnn

222

222

xinxxinxyiny

i1i1i1

【解题方法总结】

求经验回归方程的步骤

题型三:非线性回归

例7.(2024·湖南·校联考模拟预测)若需要刻画预报变量w和解释变量x的相关关系,且从

已知数据中知道预报变量w随着解释变量x的增大而减小,并且随着解释变量x的增大,预

报变量w大致趋于一个确定的值,为拟合w和x之间的关系,应使用以下回归方程中的

(b0,e为自然对数的底数)()

A.wbxaB.wblnxaC.wbxaD.wbexa

例8.(2024·全国·高三专题练习)云计算是信息技术发展的集中体现,近年来,我国云计算

市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y

c2x

与年份代码x的关系可以用模型yc1e(其中e为自然对数的底数)拟合,设zlny,

得到数据统计表如下:

年份2018年2019年2020年2021年2022年

年份代码x12345

云计算市场规模y/千万元7.4112036.666.7

zlny22.433.64

由上表可得经验回归方程z0.52xa,则2025年该科技公司云计算市场规模y的估计值为

()

A.e5.08B.e5.6C.e6.12D.e6.5

例9.(多选题)(2024·福建厦门·厦门一中校考三模)在对具有相关关系的两个变量进行回

归分析时,若两个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,并引入

中间变量将其转化为线性关系,再利用最小二乘法进行线性回归分析.下列选项为四个同学

根据自己所得数据的散点图建立的非线性模型,且散点图的样本点均位于第一象限,则其中

可以根据上述方法进行回归分析的模型有()

xc

21

A.yc1xc2xB.y

xc2

xc2

C.yc1lnxc2D.yc1e

变式10.(2024·全国·高三专题练习)已知变量的关系可以用模型ykemx拟合,设zlny,

其变换后得到一组数据如下.由上表可得线性回归方程z3xa,则k()

x12345

z2451014

A.e3B.e2C.e2D.e3

变式11.(2024·全国·高三专题练习)某校课外学习小组研究某作物种子的发芽率y和温度x

(单位:C)的关系,由实验数据得到如图所示的散点图.由此散点图判断,最适宜作为发

芽率y和温度x的回归方程类型的是()

A.yabxB.yabx2b0

C.yabexD.yablnx

变式12.(2024·全国·高二专题练习)兰溪杨梅从5月15日起开始陆续上市,据调查统计,

得到杨梅销售价格(单位:Q元/千克)与上市时间t(单位:天)的数据如下表所示:

时间t/(单位:天)102070

销售价格Q(单位:元/千克)10050100

根据上表数据,从下列函数模型中选取一个描述杨梅销售价格Q与上市时间t的变化关系:

2t

Qatb,Qatbtc,Qab,Qalogbt.利用你选取的函数模型,在以下四个日期中,

杨梅销售价格最低的日期为()

A.6月5日B.6月15日C.6月25日D.7月5日

变式13.(2024·四川泸州·高三四川省泸县第四中学校考开学考试)抗体药物的研发是生物

技术制药领域的一个重要组成部分,抗体药物的摄入量与体内抗体数量的关系成为研究抗体

药物的一个重要方面.某研究团队收集了10组抗体药物的摄入量与体内抗体数量的数据,并

对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值,抗体药物摄入量为

x(单位:mg),体内抗体数量为y(单位:AU/mL).

10101010

2

tizitiziti

i1i1i1i1

29.2121634.4

(1)根据经验,我们选择ycxd作为体内抗体数量y关于抗体药物摄入量x的回归方程,将

ycxd两边取对数,得lnylncdlnx,可以看出lnx与lny具有线性相关关系,试根据

参考数据建立y关于x的回归方程,并预测抗体药物摄入量为25mg时,体内抗体数量y的

值;

(2)经技术改造后,该抗体药物的有效率z大幅提高,经试验统计得z服从正态分布

N:0.48,0.032,那这种抗体药物的有效率z超过0.54的概率约为多少?

L

附:①对于一组数据ui,vii1,2,,10,其回归直线vua的斜率和截距的最小二乘

n

uivinuv

µi1

估计分别为n,avu;

22

uinu

i1

②若随机变量Z~N,2,则有P(Z)0.6826,

P(2Z2)0.9544,P(3Z3)0.9974;

③取e2.7.

变式14.(2024·江西赣州·高三校考阶段练习)为了研究某种细菌随天数x变化的繁殖个数y,

收集数据如下:

天数x123456

繁殖个数y612254995190

(1)在图中作出繁殖个数y关于天数x变化的散点图,并由散点图判断ybˆxaˆ(a,bˆ为常数)

与c2x(为常数,且)哪一个适宜作为繁殖个数y关于天数x变化的

yˆc1ec1,c2c10,c20

回归方程类型?(给出判断即可,不必说明理由)

对于非线性回归方程c2x(为常数,且),令zlny,可以得到繁

(2)yˆc1ec1,c2c10,c20

殖个数的对数z关于天数x具有线性关系及一些统计量的值.

666

2

xyzxixxixyiyxixziz

i1i1i1

3.5062.833.5317.50596.5712.09

(ⅰ)证明:对于非线性回归方程c2x,令zlny,可以得到繁殖个数的对数z关于

“...yˆc1e

天数x具有线.性.关系(即zˆˆxˆ,ˆ,ˆ为常数)”;

(ⅱ)根据(ⅰ)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数).

ˆ

附:对于一组数据u1,v1,u2,v2,,un,vn,其回归直线方程vˆuˆ的斜率和截距的最

n

uiuviv

ˆi1ˆ

小二乘估计分别为n,ˆvu.

2

uiu

i1

变式15.(2024·重庆沙坪坝·高三重庆八中校考阶段练习)在正常生产条件下,根据经验,

可以认为化肥的有效利用率近似服从正态分布N(0.54,0.022),而化肥施肥量因农作物的种

类不同每亩也存在差异.

(1)假设生产条件正常,记X表示化肥的有效利用率,求P(X0.56);

(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这

些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为

x(单位:公斤),粮食亩产量为y(单位:百公斤)

参考数据:

1010101010101010

22

xiyixiyixitizitiziti

i1i1i1i1i1i1i1i1

65091.552.51478.630.5151546.5

tilnxi,zilnyi(i1,2,,10).

(i)根据散点图判断,yabx与ycxd,哪一个适宜作为该农作物亩产量y关于每亩化

肥施用量x的回归方程(给出判断即可,不必说明理由);

(ii)根据(i)的判断结果及表中数据,建立y关于x的回归方程;并预测每亩化肥施用量

为27公斤时,粮食亩产量y的值.(e2.7)

ˆ

附:①对于一组数据(ui,vi)(i1,2,3,,n),其回归直线vˆuˆ的斜率和截距的最

n

uivinuv

ˆi1ˆ

小二乘估计分别为n,ˆvˆu;

22

uinu

i1

②若随机变量XN(,2),则P(X)0.6827,

P(2X2)0.9545.

变式16.(2024·重庆·高三校联考开学考试)某公司为了解年研发资金投入量x(单位:亿元)

对年销售额y(单位:亿元)的影响.对公司近12年的年研发资金投入量xi和年销售额yi的

2$ˆxtˆ

数据,进行了对比分析,建立了两个模型:①yˆˆx,②ye,其中α,β,λ,t均

2

为常数,e为自然对数的底数,并得到一些统计量的值.令uixi,vilnyi,i1,2,3,,12,

经计算得如下数据:

1212

22

xyxixyiyuv

i1i1

20667724604.20

1221212212

uiuuiuyiyvivxixviv

i1i1i1i1

312502153.0814

(1)请从相关系数的角度,分析哪一个模型拟合程度更好?

(2)(ⅰ)根据分析及表中数据,建立y关于x的回归方程;

(ⅱ)若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元?

n

xixyiy

附①相关系数ri1,回归直$ˆ中公式分别为

:nnyaˆbx

22

xixyiy

i1i1

nn

xixyiyxiyinxy

ˆi1i1,ˆ

bnnaˆybx;

222

xixxinx

i1i1

②参考数据:308477,909.4868,e4.499890.

变式17.(2024·江苏镇江·江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数y与

温度x有关,现将收集到的温度xi和产卵数yii1,2,,10的10组观测数据作了初步处理,

得到如图的散点图及一些统计量表.

1010101010

2

xitiyizixix

i1i1i1i1i1

36054.5136044384

10101010

2

tittityiyxixzizxixyiy

i1i1i1i1

3588326430

110

表中tixi,zilnyi,zzi

10i1

c2x

(1)根据散点图判断,yabx,ynmx与yc1e哪一个适宜作为y与x之间的回归方

程模型并求出y关于x回归方程;(给出判断即可,不必说明理由)

(2)某兴趣小组抽取两批鱼卵,已知第一批中共有6个鱼卵,其中“死卵”有2个;第二批中共

有8个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求

取出“死卵”个数的分布列及数学期望.

附:对于一组数据u1,v1,u2,v2,un,vn,其回归直线vu的斜率和截距的最小二

n

uiuviv

i1

乘估计分别为n,vu.

2

uiu

i1

变式18.(2024·广西南宁·南宁三中校考一模)数据显示中国车载音乐已步入快速发展期,

随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018-2022年中国车载

音乐市场规模(单位:十亿元),其中年份2018—2022对应的代码分别为1-5.

年份代码x12345

车载音乐市场规模y2.83.97.312.017.0

(1)由上表数据知,可用指数函数模型yabx拟合y与x的关系,请建立y关于x的回归方

程;

(2)根据上述数据求得y关于x的回归方程后,预测2024年的中国车载音乐市场规模.

参考数据:

5

0.5240.4727

vxiviee1.6

i1

1.9433.821.71.626.84

15

其中vilnyi,vvi.

5i1

参考公式:对于一组数据,,L,其回归直线ˆˆˆ的斜率和截距

u1,v1u2,v2un,vnvu

n

uivinuv

的最小二乘法估计公式分别为i1,ˆˆ.

nvu

22

uinu

i1

变式19.(2024·安徽合肥·合肥市第八中学校考模拟预测)当前移动网络已融入社会生活的

方方面面,深刻改变了人们的沟通、交流乃至整个生活方式.4G网络虽然解决了人与人随时

随地通信的问题,但随着移动互联网快速发展,其已难以满足未来移动数据流量暴涨的需求,

而5G作为一种新型移动通信网络,不但可以解决人与人的通信问题,而且还可以为用户提

供增强现实、虚拟现实、超高清(3D)视频等更加身临其境的极致业务体验,更重要的是还

可以解决人与物、物与物的通信问题,从而满足移动医疗、车联网、智能家居、工业控制、环境

监测等物联网应用需求,为更好的满足消费者对5G网络的需求,中国电信在某地区推出了

六款不同价位的流量套餐,每款套餐的月资费x(单位:元)与购买人数y(单位:万人)

的数据如下表:

套餐ABCDEF

月资费x(元)384858687888

购买人数y(万人)16.818.820.722.424.025.5

对数据作初步的处理,相关统计量的值如下表:

6666

2

viiviivi

i1i1i1i1

75.324.618.3101.4

其中vilnxi,ilnyi,且绘图发现,散点vi,i1i6集中在一条直线附近.

(1)根据所给数据,求出y关于x的回归方程;

x368568

(2)已知流量套餐受关注度通过指标Tx来测定,当Tx,时相应的流量

y7e5e

套餐受大众的欢迎程度更高,被指定为“主打套餐”.现有一家四口从这六款套餐中,购买不

同的四款各自使用.记四人中使用“主打套督”的人数为X,求随机变量X的分布列和期望.

附:对于一组数据v1,1,v2,2,,vn,n,其回归方程bva的斜率和截距的最小二

n

vivi

ˆi1ˆ

乘估计值分别为bn,abv.

2

viv

i1

【解题方法总结】

换元法变成一元线性回归模型

题型四:列联表与独立性检验

例10.(2024·广东佛山·华南师大附中南海实验高中校考模拟预测)四川省将从2022年秋季

入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,

即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作

出如下两个等高条形图,根据条形图信息,下列结论正确的是()

A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数

B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数

C.样本中选择物理学科的人数较多

D.样本中男生人数少于女生人数

例11.(2024·全国·高三专题练习)在新高考改革中,浙江省新高考实行的是7选3的33模

式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信

息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单

位:人)

选物理不选物理总计

男生340110450

女生140210350

总计480320800

表一

选生物不选生物总计

男生150300450

女生150200350

总计300500800

表二

试根据小概率值0.005的独立性检验,分析物理和生物选课与性别是否有关()

()2

附2nadbc,2

:nabcd.Px

(ab)(cd)(ac)(bd)

0.150.100.050.0250.010.0050.001

xa2.0722.7063.8415.0246.6357.87910.828

A.选物理与性别有关,选生物与性别有关

B.选物理与性别无关,选生物与性别有关

C.选物理与性别有关,选生物与性别无关

D.选物理与性别无关,选生物与性别无关

例12.(2024·全国·高三专题练习)通过随机询问相同数量的不同性别大学生在购买食物时

11

是否看营养说明,得知有的男大学生“不看”,有的女大学生“不看”,若有99%的把握认

63

为性别与是否看营养说明之间有关,则调查的总人数可能为()

A.150B.170C.240D.175

变式20.(2024·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜

欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为5mmN*人,男

43

生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设

55

为H0:喜欢短视频和性别相互独立.若依据0.05的独立性检验认为喜欢短视频和性别不

独立,则m的最小值为()

2

nadbc

附:2,附表:

abcdacbd

0.050.01

x3.8416.635

A.7B.8C.9D.10

变式21.(2024·全国·高三专题练习)在一次联考后,某校对甲、乙两个文科班的数学考试

成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到

如下2×2列联表:

优秀非优秀合计

甲班人数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论