成对数据的统计分析(五大题型)(讲义)-2024年高考数学复习(新教材新高考)(解析版)_第1页
成对数据的统计分析(五大题型)(讲义)-2024年高考数学复习(新教材新高考)(解析版)_第2页
成对数据的统计分析(五大题型)(讲义)-2024年高考数学复习(新教材新高考)(解析版)_第3页
成对数据的统计分析(五大题型)(讲义)-2024年高考数学复习(新教材新高考)(解析版)_第4页
成对数据的统计分析(五大题型)(讲义)-2024年高考数学复习(新教材新高考)(解析版)_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第02讲成对数据的统计分析

目录

I-变量间的相关关系

-线性回归

-非线性回归

1-独立性检验

题型一:变量间的相关关系

题型二:一元线性回归模型

题型三:非线性回归

题型四:列联表与独立性检验

题型五:误差分析

第1页共46页

考点要求考题统计考情分析

(1)了解样本相关系数的统计含义.从近五年的全国卷的考查情况来看,本节是

(2)理解一元线性回归模型和2x2列联高考的热点,主要以解答题形式出现,经常

表,会运用这些方法解决简单的实际问2023年上海卷第14题,4分与概率综合出题,一般难度为中等.也可能

题.2023年天津卷第7题,5分以选择题、填空题形式出现,难度不大.主

(3)会利用统计软件进行数据分析.2023年甲卷(文)第19题,12分要以应用题的方式出现,多与经济、生活实

2022年/卷第20题,12分际相联系,需要在复杂的题目描述中找出数

量关系,建立数学模型,并且运用数学模型

解决实际问题.

变置之间的相关关系

成对数据的统计分析

列联表

独立性检验

等高条形图

H夯基•必备基础知识梳理

知识点一、变量间的相关关系

1、变量之间的相关关系

当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于

相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收

集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,

而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.

2、散点图

第2页共46页

将样本中的n个数据点(4力)(i=1,2,…,〃)描在平面直角坐标系中,所得图形叫做散点图.根据散点图

中点的分布可以直观地判断两个变量之间的关系.

(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将

它称为正相关,如图(1)所示;

(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将

它称为负相关,如图(2)所示.

3、相关系数

若相应于变量工的取值%•,变量y的观测值为则变量1与y的相关系数

-x)(%-y)-nxy

r=----------=।2:,通常用r来衡量X与y之间的线性关系的强弱,

22

住(%-x)2次(%7)2区xi-nx/Jyt-ny

Vz=li=lVi=lVi=l

r的范围为-iWrWl.

(1)当r>0时,表示两个变量正相关;当r<0时,表示两个变量负相关.

(2)卜|越接近1,表示两个变量的线性相关性越强;卜|越接近°,表示两个变量间几乎不存在线性相

关关系.当团=1时,所有数据点都在一条直线上.

(3)通常当旧>0.75时,认为两个变量具有很强的线性相关关系.

知识点二、线性回归

1、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.

对于一组具有线性相关关系的数据(xi,yi),(及,竺),…,(/,为),其回归方程y=bx+a的求法为

Z(X,.-尤)(%-y)E\yi-nxy

b=-^—^----------二号---------

士(七―才fl:—信

Z=1Z=1

a-y-bx

—1n_in—_

其中,x=~y'xj,y=—Vy;,(x,y)称为样本点的中心.

ni=in,=1

2、残差分析

对于预报变量y,通过观测得到的数据称为观测值%,通过回归方程得到的y称为预测值,观测值减

第3页共46页

去预测值等于残差,2称为相应于点(4外)的残差,即有自=%-%.残差是随机误差的估计结果,通过

对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残

差分析.

(1)残差图

通过残差分析,残差点(专的比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样

的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.

(2)通过残差平方和。=f(y-502分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;

1=1

反之,不合适.

(3)相关指数

iA

用相关指数来刻画回归的效果,其计算公式是:R2=l-^--------.

i=l

改越接近于1,说明残差的平方和越小,也表示回归的效果越好.

知识点三、非线性回归

解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线

性回归方程化归转化为我们熟悉的线性回归方程.

求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原

后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.

1、建立非线性回归模型的基本步骤:

(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;

(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);

(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二

次函数、指数函数、对数函数、募函数模型等);

(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;

(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;

(6)消去新元,得到非线性回归方程;

(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.

知识点四、独立性检验

1、分类变量和列联表

(1)分类变量:

变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表:

①定义:列出的两个分类变量的频数表称为列联表.

第4页共46页

②2x2列联表.

一般地,假设有两个分类变量X和匕它们的取值分别为{玉,Z}和{%,为},其样本频数列联表(称

为2x2列联表)为

为总计

不aba+b

x2Cdc+d

总计Q+Cb+dn=a+b+c+d

从2x2列表中,依据二与工的值可直观得出结论:两个变量是否有关系.

a+bc+d

2、等高条形图

(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列

联表数据的频率特征.

(2)观察等高条形图发现,与上相差很大,就判断两个分类变量之间有关系.

a+bc+d

3、独立性检验

2

计算随机变量Z=------"(ad-bcf-------利用2的取值推断分类变量x和y是否独立的方法称为

(a+b)(c+d)(a+c)S+d)

/独立性检验.

a0.100.050.0100.0050.001

Xa2.7063.8416.6357.87910.828

【解题方法总结】

常见的非线性回归模型

(1)指数函数型y=c优(°>0且awl,c>0)

两边取自然对数,lny=ln(ca*),即Iny=Inc+xlna,

令],’,原方程变为y'=lnc+x'lna,然后按线性回归模型求出Ina,Inc.

[x=%

(2)对数函数型y=Z?lnx+a

令R,原方程变为y'=6x'+a,然后按线性回归模型求出a.

[x=Inx

(3)嘉函数型y=

两边取常用对数,lgy=lg(dx"),即Igy=〃lgx+lga,

第5页共46页

令11Tgy,原方程变为y'=nx'+lga,然后按线性回归模型求出“,Iga.

[x=Igx

(4)二次函数型)=笈2+。

令=1,原方程变为y'=6元'+4,然后按线性回归模型求出6,a.

\x=x

h

(5)反比例函数型y=a+2型

x

y,=y

令,i,原方程变为)/=云,+々,然后按线性回归模型求出人,

X=—

f提升•必考题型归纳

题型一:变量间的相关关系

例L(2023・河北•高三校联考期末)下列四幅残差分析图中,与一元线性回归模型拟合精度最高的是

)

八残差八残差

400.40

200**.*20

A.B.

0-

7002.4-6-810121424.6810-1214观测

-200

/-时间-20••二时间

-400--40

「残差

T残差

10004

5002

C.D.

0-0

2.4.6310L214观测24.68101214

-500•\.房间-2,,•时间

-1000-4

【答案】D

【解析】用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较

合适,

带状区域的宽度越窄,说明模型的拟合精度越高,显然D选项的拟合精度最高.

故选:D.

例2.(2023・天津蓟州•高三校考开学考试)对两个变量x,y进行线性相关检验,得线性相关系数

4=0.8995,对两个变量M,v进行线性相关检验,得线性相关系数4=-09568,则下列判断正确的是

()

A.变量x与〉正相关,变量〃与v负相关,变量x与〉的线性相关性较强

B.变量X与y负相关,变量M与V正相关,变量X与y的线性相关性较强

第6页共46页

C.变量x与y正相关,变量〃与V负相关,变量M与V的线性相关性较强

D.变量X与y负相关,变量M与V正相关,变量a与V的线性相关性较强

【答案】C

【解析】因为线性相关系数4=0.8995>0,所以x,y正相关,

因为线性相关系数4=-。9568<0,所以a,v负相关,

又因为用〈同,所以变量a,v的线性相关性比x,>的线性相关性强,

故A、B、D错误,C正确.

故选:C.

例3.(2023•宁夏吴忠•高三盐池高级中学校考阶段练习)在如图所示的散点图中,若去掉点P,则下列说

法正确的是()

・.P

-------------------------------------------------------►

OX

A.样本相关系数「变大

B.变量x与变量y的相关程度变弱

C,变量X与变量y呈正相关

D.变量x与变量y的相关程度变强

【答案】D

【解析】由散点图知,自变量x与因变量>呈负相关,即厂<o,故c错误;

去掉点尸后,卜|进一步接近1,所以「变小,故A错误;

去掉点尸后,y与X的线性相关加强,即相关程度变强,故B错误,D正确.

故选:D.

变式1.(2023•四川成都•高三统考阶段练习)已知建筑地基沉降预测对于保证施工安全,实现信息化监控

有着重要意义.某工程师建立了四个函数模型来模拟建筑地基沉降随时间的变化趋势,并用相关指数、误

差平方和、均方根值三个指标来衡量拟合效果.相关指数越接近1表明模型的拟合效果越好,误差平方和

越小表明误差越小,均方根值越小越好.依此判断下面指标对应的模型拟合效果最好的是()

A.

相关指数误差平方和均方根值

0.9498.4910.499

B.

第7页共46页

相关指数误差平方和均方根值

0.9334.1790.436

c.

相关指数误差平方和均方根值

0.9971.7010.141

D.

相关指数误差平方和均方根值

0.9972.8990.326

【答案】C

【解析】相关指数越接近于1,拟合效果越好,比较相关指数知,可选c,D,

误差平方和及均方根值都越小,拟合效果越好,观察误差平方和和均方根值,知C的拟合效果最好.

故选:C.

变式2.(2023・高三课时练习)甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关性做试验,并用

回归分析方法分别求得相关系数r与残差平方和m如下表:

甲乙丙T

r0.820.780.690.85

m106115124103

则能体现人2两变量有更强的线性相关性的是()

A.甲B.乙C.丙D.丁

【答案】D

【解析】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越强,

在四个选项中只有丁的相关系数最大,

残差平方和越小,相关性越强,只有丁的残差平方和最小,

综上可知丁的试验结果体现A、B两变量有更强的线性相关性,

故选:D.

变式3.(2023•河北石家庄・统考三模)观察下列四幅残差图,满足一元线性回归模型中对随机误差的假定

的是()

第8页共46页

“残差产

100-3-

50

A.oB.一3•糊惘.磔燃:徽麒辎

-50-3-,,

-100■401002003004005006007008009001000*

020406080100观测时间观测时间

。残差

1500•p左200

1000\150

100

500-50

C.0-D.0

-500--50

-100

-1000--150

-200

020406080100观测时间0102030405060708090100观测时间

【答案】B

【解析】根据一元线性回归模型中对随机误差e的假定,残差应是均值为0、方差为人的随机变量的观测

值.

对于A选项,残差与观测时间有线性关系,故A错;

对于B选项,残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内;故B正确;

对于C选项,残差与观测时间有非线性关系,故C错;

对于D选项,残差的方差不是一个常数,随着观测时间变大而变大,故D错.

故选:B.

变式4.(2023•全国•高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别

计算出相关系数小则线性相关程度最高的是()

甲乙丙T

r0.870.910.580.83

A.甲B.乙C.丙D.T

【答案】B

【解析】因为相关系数上|越大,线性相关程度越强,

所以线性相关程度最高的是乙.

故选:B

变式5.(2023・全国•高三专题练习)给出下列有关线性回归分析的四个命题:

①线性回归直线未必过样本数据点的中心(下,7);

②回归直线就是散点图中经过样本数据点最多的那条直线;

③当相关系数厂>0时,两个变量正相关;

第9页共46页

④如果两个变量的相关性越强,则相关系数「就越接近于1.

其中真命题的个数为()

A.1B.2C.3D.4

【答案】A

【解析】对于①,线性回归直线一定过样本数据点的中心叵,歹),故①错误;

对于②,回归直线在散点图中可能不经过任何一个样本数据点,故②错误;

对于③,当相关系数r>0时,两个变量正相关,故③正确;

对于④,如果两个变量的相关性越强,则相关性系数厂就越接近于1或-1,故④错误.

故真命题的个数为1,

故选:A.

【解题方法总结】

判定两个变量相关性的方法

U)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变

量负相关.

(2)样本相关系数:当厂>0时,正相关;当K0时,负相关;卜|越接近于1,相关性越强.

(3)经验回归方程:当各>0时,正相关;当5<0时,负相关.

题型二:一元线性回归模型

例4.(2023・天津蓟州•高三校考开学考试)为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到

如下实验数据:

天数x(天)3456

繁殖个数y(千个)2.5344.5

由最小二乘法得y与x的线性回归方程为y=Q7x+a,则当%=7时,繁殖个数丁的预测值为()

A.4.9B.5.25C.5.95D.6.15

【答案】B

—1—1

【解析】由题中数据可得:x=W(3+4+5+6)=4.5,y=工(2.5+3+4+4.5)=3.5,

因为回归直线必过样本中心,

所以。=工-0.7%=3.5-0.7x4,5=0,35;

所以y=0.7x+0.35,

所以当x=7时,>=0.7x7+0.35=5.25,

故选:B

例5.(2023・湖南长沙•高三长郡中学校联考阶段练习)某社区为了丰富退休人员的业余文化生活,自2018

第10页共46页

年以来,始终坚持开展“悦读小屋读书活动”.下表是对2018年以来近5年该社区退休人员的年人均借阅量

的数据统计:

年份20182019202020212022

年份代码X12345

年人均借阅量y(册)%%162228

(参考数据:=9。)通过分析散点图的特征后,年人均借阅量V关于年份代码x的回归分析模型为

Z=1

y=5x+〃z,则2023年的年人均借阅量约为()

A.31B.32C.33D.34

【答案】C

5

【解析】因为5J+2+:+4+5=3,_石"90]。,所以18=5x3+/〃,即〃7=3.

5y=——=——=18

所以回归方程为y=5元+3,当兀=6时,y=5x6+3=33.

故选:C.

例6.(2023•辽宁・辽宁实验中学校考模拟预测)已知x,y的对应值如下表所示:

X02468

y1m+12m+l3m+311

若y与x线性相关,且回归直线方程为y=L6%+0.6,则机=()

A.2B.3C.4D.5

【答案】B

■分TILL.—0+2+4+6+8—1+"z+1+2机+1+3机+3+11

[解析]X=-------------------=4,y=--------------------------------------=1.2m+3.4

又回归直线方程为y=L6x+0.6,

所以1.27"+3.4=1.6X4+0.6,解得加=3.

故选:B.

变式6.(2023•广西南宁•南宁二中校联考模拟预测)某单位在当地定点帮扶某村种植一种草莓,并把这种

原本露天种植的草莓搬到了大棚里,获得了很好的经济效益.根据资料显示,产出的草莓的箱数x(单

位:箱)与成本y(单位:千元)的关系如下:

X102030406080

yX%%%>6

(1)根据散点图可以认为尤与y之间存在线性相关关系,请用最小二乘法求出线性回归方程y=bx+a(4,

第11页共46页

5用分数表示)

(2)某农户种植的草莓主要以300元/箱的价格给当地大型商超供货,多余的草莓全部以200元/箱的价格销

售给当地小商贩.据统计,往年1月份当地大型商超草莓的需求量为50箱、100箱、150箱、200箱的概

率分别为二,J,;,根据回归方程以及往年商超草莓的需求情况进行预测,求今年1月份农户草莓

105z5

的种植量为200箱时所获得的利润情况.(最后结果精确到个位)

66£(%-可(其-刃

附:y)=790,E%=54,在线性回归直线方程9=&+&中上―-----------

i=l

d=y-bx.

10+20+30+40+60+80-54

【解析】(1)因为元==40,y=—=Q9,

6o

所以士(七—元『二900+4°°+10°+°+400+160°=3400,

i=l

由题意可知£山一x)(y,.-y)=790,

i=l

£(%-亍)(%-9)

790_79

所以3=―-----------------

f(%-元)23400~340

i=l

795

又因为,=9-------x40=——

34017

所以回归方程为£=急791-5

79“八5785/十一、

(2)由回归方程知,若农户草莓的种植量为200箱,则成本为9=备乂200-----=-----(千兀).

1717

设农户草莓的种植量为200箱时的收入为y元,200箱草莓供给大型商超和小商贩分别光箱和y,显然

x+y=200,

由题意y=300x+200y,因此羽,以及丫的可能取值如下表:

X50100150200

y150100500

Y=300x+200y45000500005500060000

所以丫的分布列为:

Y45000500005500060000

第12页共46页

1111

P————

10525

所以矶卜)=乂]

45000+50000x-+55000x-+60000x-=54000,

525

7X5

所以预测所获利润约为54000-石-'100°。7824元.

变式7.(2023•江西•高三统考开学考试)某新能源汽车销售部对今年1月至7月的销售量进行统计与分

析,因不慎丢失一些数据,现整理出如下统计表与一些分析数据:

月份1月2月3月4月5月6月7月

月份代号X1234567

销售量y(单位:万辆)15.6mnS37.739.644.5

其中9=312.

(1)若加,n,$成递增的等差数列,求从7个月的销售量中任取1个,月销售量不高于27万辆的概率;

⑵若=670.48,x与y的样本相关系数厂=。99,求y关于x的线性回归方程9=几+。,并预测

1=1

今年8月份的销售量工精确到0.1).

附:相关系数,线性回归方程?=取+3中斜率和截距的最小二乘估计公式分别

为一:a=y-bx.

白尤厂X)2

/=1

参考数据:6a2.65,V670.48®25.89.

15.6+根+〃+s+37.7+39.6+44.5...

【解析】(1)因为歹=31.2.所以--------------------------------------------=31.2,

7

所以〃7+a+s=81,

又加,n,s成递增的等差数列,所以加+s=2〃旦根<〃<s,

所以"=27,且m<27<s,

所以月销售量不高于27万辆的有15.6,加,〃共3个,又基本事件总数为7,

故所求概率为:3

一17

(2)由表中数据可知,x=-^xt=4,28

/i=l

第13页共46页

所以gb4.88r=4.88x0.99。4.8,

由元=4,V=31.2,得&=9一成元=31.2-4.8x4=12.0,

故》关于x的线性回归方程为£=4.8元+12.0.

当x=8时,£=4.8x8+12=50.4,

所以预测今年8月份的销售量大约为50.4万辆.

变式8.(2023・四川成都•高三石室中学校考开学考试)己知某绿豆新品种发芽的适宜温度在6℃~22c之

间,一农学实验室研究人员为研究温度x(℃)与绿豆新品种发芽数y(颗)之间的关系,每组选取了成

熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:

35■

V___1___X___I____I____I____I____I____I

JIIIIIIII

o'—::­!――i—!—!~!―>

789101112131415x

_7__7_

其中y=24,X(W-x)(y-y)=70,^(x-y)2=176.

i=li=l

(1)运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?

⑵求出y关于x的线性回归方程与=鼠+机并预测在19。。的温度下,种子的发芽的颗数.

«__n__

X(%-X)(%-y)Z(%-x)(%-y)

参考公式:相关系数r=下「_”U,回归直线方程¥=鼠+)其中b=上,——=——

JS(七一元)5(%一y)2£(七-

Vz=lz=li=l

6=亍-版.参考数据:V77»8.77.

【解析】(1)根据题意,=1(8+9+10+11+12+13+14)=11.

^(x,.-x)2=(8-11)2+(9-11)2+(10-11)2+(11-11)2+(12-11)2+(13-11)2+(14-11)2=28,

Z=1

工(%-可力(%一刃2

=128x176=8"B70.16.

1=11=1

第14页共46页

7

£(%-可(%-刃70

08

因而相关系数r=「7=布/""

忙(一)》(—吊-

Vi=lZ=1

由于卜上0.998很接近1,.•.可以用线性回归方程模型拟合y与x的关系.

7

2(七一下肌-刃

5

⑵6=『----------=-

讣T2

Z=1

57

3=24----x11=—,

22

57

.♦•y关于x的回归方程为9=

57

若X=19,则夕=彳翅9-彳=44颗.

...在19℃的温度下,预测种子的发芽颗数为44.

变式9.(2023・安徽亳州•蒙城第一中学校联考模拟预测)为调查某地区植被覆盖面积x(单位:公顷)和

野生动物数量y的关系,某研究小组将该地区等面积花分为400个区块,从中随机抽取40个区块,得到样

本数据(4%)。=12,40),部分数据如下:

X2.73.63.23.9

y50.663.752.154.3

40404040

经计算得:+>,=160,£%=2400,E(x,-可一=160,-元)(y-y)=1280.

1=1Z=1Z=1Z=1

(1)利用最小二乘估计建立y关于x的线性回归方程;

(2)该小组又利用这组数据建立了无关于y的线性回归方程,并把这两条拟合直线画在同一坐标系xOy下,

横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量〉一致.设前者与后者的斜率分别为k2,

比较左,我的大小关系,并证明.

^x^i-nx-y

附:y关于x的回归方程y=a+bx中,斜率和截距的最小二乘估计公式分别为:b=^----—

£x:一〃x-

1=1

信5]岛2打

【解析】⑴片果=4,-2400071280o

y=-77T=6。,^=---=8,Q=60—32=28,

40160

第15页共46页

故回归方程为y=8x+28;

(2)x关于y的线性回归方程为x=的+"y,4=乂工----------

又卜⑷,卜,

h>Q,故即k14k2,

下证:k#k小

若匕=心,则|厂|=1,即y=8%+281=1,2,,40)恒成立,

代入表格中的一组数据得:50.6^8x2.7+28,矛盾,

故匕<£.

综上,y关于龙的回归方程为y=8x+28.

【解题方法总结】

求经验回归方程的步骤

I-----------------------------------------------------------1

(步骤一甘甘算出得了,的,>必或士(x,-x)(y,-y),1

12(%-初2的值

VL-----------------------------------;

(步骤二H利用公式计算系数工务]

0二二二二二二二二二___

(步骤三H写出经验回归方程$=5x+AJ

题型三:非线性回归

例7.(2023・湖南•校联考模拟预测)若需要刻画预报变量w和解释变量x的相关关系,且从已知数据中知

道预报变量卬随着解释变量x的增大而减小,并且随着解释变量x的增大,预报变量w大致趋于一个确定

的值,为拟合卬和x之间的关系,应使用以下回归方程中的(b>0,e为自然对数的底数)()

A.w-bx+aB.w=-blnx+aC.w=-b^[x+aD.w-be~x+a

【答案】D

【解析】对于A:因为y=x在定义域内单调递增且方>0,所以W随着X的增大而增大,不合题意,故A

错误;

对于B:因为y=lnx在定义域内单调递增且6>0,所以w随着x的增大而减小,当解释变量x-+8,

第16页共46页

W-—co,不合题意,故B错误;

对于C:因为y=«在定义域内单调递增且6>0,所以W随着X的增大而减小,当解释变量Xf+8,

wf-co,不合题意,故C错误;

对于D:因为y=er=d『在定义域内单调递减且6>0,所以w随着x的增大而减小,当解释变量

e

x->+8,w->a,故D错误;

故选:D.

例8.(2023•全国•高三专题练习)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续

增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y与年份代码尤的关系可以用模

型>=。声/(其中e为自然对数的底数)拟合,设z=lny,得到数据统计表如下:

年份2018年2019年2020年2021年2022年

年份代码尤12345

云计算市场规模y/千万元7.4112036.666.7

z=Iny22.433.64

由上表可得经验回归方程z=Q52x+a,则2025年该科技公司云计算市场规模y的估计值为()

A.e508B.e5-6C.e612D.e65

【答案】B

【解析】因为x=3,z=3,

所以a=1-0.521=3-3x0.52=1.44,

即经验回归方程z=0.52x+1.44,

当x=8时,z=0.52x8+1.44=5.6,

所以y=ez=e&6,

即2025年该科技公司云计算市场规模y的估计值为e56,

故选:B

例9.(多选题)(2023・福建厦门•厦门一中校考三模)在对具有相关关系的两个变量进行回归分析时,若两

个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,并引入中间变量将其转化为线性关

系,再利用最小二乘法进行线性回归分析.下列选项为四个同学根据自己所得数据的散点图建立的非线性模

型,且散点图的样本点均位于第一象限,则其中可以根据上述方法进行回归分析的模型有()

2x+G

A.y=cxx"+c2xB.y=t+c

C.y=q+ln(x+C2)D.^qex+C2

【答案】ABC

第17页共46页

2

[解析】对于选项A:y=c1x+c2x=>—=cxx+c2,令〃=上则〃=q%+%;

XX

对于选项B:

%+qrG一Q1%+g1a

y二=1+£LZSy-l=———-n-----------二------x+——

x+c2x+c2X+。2y-]01_C?C]_G%—Q

4-M=^-=>«=——X+—

y—1。]—c*2G—Q

-C1

对于选项C:y=c1+ln(x+c2)^>y-q=ln(x+c2)^>^=x+c2

Cl

即e,=e-(x+c2)令〃贝|〃=于<x+Cz)=1•x+Q,/;

x+C2

对于选项D:y=cxenIny=Inq+X+G令〃=lny贝Ij〃=x+lnq+。2

此时斜率为1,与最小二乘法不符.

故选:ABC

变式10.(2023・全国•高三专题练习)已知变量的关系可以用模型y=Ze侬拟合,设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论