第二课时非线性回归模型及其应用(高中数学课件教案学案习题人教A版选择性必修第三册)_第1页
第二课时非线性回归模型及其应用(高中数学课件教案学案习题人教A版选择性必修第三册)_第2页
第二课时非线性回归模型及其应用(高中数学课件教案学案习题人教A版选择性必修第三册)_第3页
第二课时非线性回归模型及其应用(高中数学课件教案学案习题人教A版选择性必修第三册)_第4页
第二课时非线性回归模型及其应用(高中数学课件教案学案习题人教A版选择性必修第三册)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二课时非线性回归模型及其应用

课标要求素养要求

1.进一步掌握一元线性回归模型参数的

统计意义,会用相关统计软件.

通过学习回归模型的应用,提升数学运

2.了解非线性回归模型.

算及数据分析素养.

3.会通过分析残差和利用相判断回归模

型的拟合效果.

课前预习知识探究

新知探究

A情境引入

在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要运用散点图

选择适当的函数模型来拟合观测数据,然后通过适当的变量代换,把非线性问题

转化为线性问题,从而确定未知参数,建立相应的线性回归方程.

问题具有相关关系的两个变量的线性回归方程为£=源+之预测值金与真实值y

一样吗?预测值£与真实值y之间误差大了好还是小了好?

提示不一定;越小越好.

上知识梳理

1.残差的概念

对于响应变量匕通过观测得到的数据称为观测值,通过经验回归方程得到的金称

为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差

的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据

等,这方面工作称为残差分析.

2.刻画回归效果的方式

⑴残差图法

作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,

这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状

区域越窄,则说明拟合效果越好.

(2)残差平方和法

残差平方和E。,一工)2,残差平方和越小,模型拟合效果越好,残差平方和越大,

/=1

模型拟合效果越差.

(3)利用R2刻画回归效果

决定系数收是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量

客户预报变量的能力.

“A

£(y,-yD2

------------------,R2越大,即拟合效果越好,心越小,模型拟合效果越差.

ECy-y)2

/=1

拓展深化

[微判断]

1.残差平方和越接近0,线性回归模型的拟合效果越好.(J)

2.在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上.(X)

提示在画两个变量的散点图时,响应变量在y轴上,解释变量在x轴上.

3.R2越小,线性回归模型的拟合效果越好.(X)

提示整越大,线性回归模型的拟合效果越好.

[微训练]

1.在残差分析中,残差图的纵坐标为.

答案残差

2.甲、乙、丙、丁四位同学在建立变量无,y的回归模型时,分别选择了4种不

同模型,计算可得它们的决定系数R2分别如下表:

甲乙丙T

R20.980.780.500.85

哪位同学建立的回归模型拟合效果最好?

解R2越大,表示回归模型的拟合效果越好,故甲同学建立的回归模型拟合效

果最好.

[微思考]

在使用经验回归方程进行预测时,需要注意哪些问题?

提示(1)经验回归方程只适用于所研究的样本的总体;(2)所建立的经验回归方

程一般都有时效性;(3)解释变量的取值不能离样本数据的范围太远.一般解释

变量的取值在样本数据范围内,经验回归方程的预报效果好,超出这个范围越远,

预报的效果越差;(4)不能期望经验回归方程得到的预报值就是响应变量的精确

值.

1果'爱’.句]题型剖析■■■■■■■■I

题型一线性回归分析

【例1】已知某种商品的价格武单位:元/件)与需求量y(单位:件)之间的关系

有如下一组数据:

X1416182022

y1210753

求y对x的回归直线方程,并说明回归模型拟合效果的好坏.

1

解x=g(14+16+18+20+22)=18,

一1

y=g(12+10+7+5+3)=74,

142+162+182+202+222=1660,

5

^•^=14X12+16X10+18X7+20X5+22X3=620,

5--

Xxjy-5y

所以金二二-------x--620-5X18X7.4

1.15,

0-1660-5X182

E%?—5X2

i=l

A

0=7.4+1.15X18=28.1,

所以所求回归直线方程是£=—l[5x+28.1.

列出残差表:

A

y-yi00.3-0.4-0.10.2

y-y4.62.6-0.4-2.4-4.4

5A

所以吉伊一p)2=0.3,

5一

£S—y)2=53.2,

5A、

.£(yf)2

o1=1

R2=1--------------"0.994,

□-

.£(9—y)-

1=1

所以回归模型的拟合效果较好.

规律方法(1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线

性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数

R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分

析.

(2)刻画回归效果的三种方法

①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合

适.

②残差平方和法:残差平方和£(y—*)2越小,模型的拟合效果越好.

nA

.X(yf)2

1=1

③决定系数法:/?2=1----------------越接近1,表明回归的效果越好.

n-

(y-y)

i=l

【训练1]某地区2011年到2017年农村居民家庭人均纯收入y(单位:千元)

的数据如下表:

年份2011201220132014201520162017

年份代号t1234567

人均纯收入2.93.33.64.44.85.25.9

(1)求y关于/的线性回归方程;

(2)利用(1)中的回归方程,分析2011年到2017年该地区农村居民家庭人均纯收

入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.

附:回归直线的斜率和截距的最小二乘估计公式分别为

£(/,—7)(y一5)

h=~~;-----------,£-y-bt.

二(乙一7)2

r-1

解(1)由所给数据计算得

-1

r=yX(1+2+3+4+5+6+7)=4,

一1

y=yX(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,

7一

g(/,—r)2=9+4+1+0+1+4+9=28,

7——

占(6-0(^―y)=(-3)X(-1.4)+(-2)X(-1)+(-l)X(-0.7)+0X0.1+

1X0.5+2X0.9+3X1.6=14,

1--

Ai=l

=$05

A-A-

a=y—br=4.3—0.5X4=2.3,

所以所求回归方程为£=0.5f+2.3.

(2)由(1)知金=0.5>0,故2011年到2017年该地区农村居民家庭人均纯收入逐年

增加,平均每年增加0.5千元.将2020年的年份代号,=10代入(1)中的回归方

程,得£=0.5X10+2.3=7.3.故预测该地区2020年农村居民家庭人均纯收入为

7.3千元.

题型二残差分析与相关指数的应用

【例2】假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5

组数据如下:

X15.025.830.036.644.4

y39.442.942.943.149.2

⑴以X为解释变量,y为预报变量,作出散点图;

(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;

⑶计算各组残差,并计算残差平方和;

(4)求小,并说明(2)中求出的回归模型的拟合程度.

解(1)散点图如下.

)有效穗数

50

48

46

44

42-

40•

38

253545A

基本苗数

(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相

关关系,因此可以用线性回归方程刻画它们之间的关系.

设回归方程为£=即+£,又x=30.36,y=43.5,

5

部?=5101.56,

xy=1320.66,尤2=921.7296,

5

苫为了=6746.76.

5

,X/(PL5/y

八1—]'八一八一

则/?=------------n0.29,a=y-b户34.70.

S%?—5JC2

i=l

故所求的回归直线方程为£=0.29X+34.70.

当x=56.7时,y=0.29X56.7+34.70=51.143.

故估计成熟期有效穗为51.143.

,AAA,入八八、,,八AAA

(3)由可以算得分别为ei=0.35,£2=0.718,«=—0.5,e4

A,5八r

=-2.214,e5=1.624,残差平方和:1X=1,后=8.43.

5Q43

⑷g(y,-y)2=50.18,故R2^I一百卡心0.832.所以(2)中求出的回归模型的效

1=1DU.10

果较好.

规律方法(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判

断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差

e2,…,2来判断模型拟合的效果.

(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合

度越高,回归方程预报精确度越高.

【训练2】为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质

量的6个物体进行测量,数据如下表:

X51015202530

y7.258.128.959.9010.911.8

(1)作出散点图并求回归直线方程;

⑵求出K并说明回归模型拟合的程度;

(3)进行残差分析.

解(1)散点图如图所示.

弹簧长度/cm

14

12

10

8

6

4

2

0质量

5101520253()3"/g

样本点分布在一条直线附近,y与x具有线性相关关系.

-1

由表中数据,得》=4义(5+10+15+20+25+30)

=17.5,

1

(7.25+8.12+8.95+9.90+10.9+11.8)^9.487,

66

加?=2275,女孙=10762

计算得金心0.183,々心6.285.

故所求回归直线方程为£=6.285+0.183x.

(2)列表如下:

A

y-yi0.050.005-0.08-0.0450.040.025

y-y-2.237-1.367-0.5370.4131.4132.313

6A6-

可得£Cv,—y;)2^0.01318,J(y—y)2^14.6783.

所以"IA:A21O81MQo9991,回归模型的拟合效果较好

(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这

个数据的时候是否有人为的错误,如果有的话,需要纠正错误,重新建立回归模

型;由表中数据可以看出残差点比较均匀地落在宽度不超过0.15的狭窄的水平

带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度

与所挂物体的质量成线性关系.

题型三非线性回归分析

【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单

位:千元)对年销售量y(单位:0和年利润z(单位:千元)的影响.对近8年的年

宣传费力和年销售量y4=l,2,8)数据作了初步处理,得到下面的散点图

及一些统计量的值.

年销售量/t

620

600♦♦♦

580

560

540

520

500

1___________________________________________

48()

(11

343638404244464850525456年宣传费/千元

8-8-88

E,(X,—x)2g(Wi-W)2

Xyw石(xi-x)-(yi—y)石(Wi-w)-(yt—y)

46.65636.8289.81.61469108.8

表中Wi=y[xi,w=^YyWi.

(1)根据散点图判断,y=a+bx与y=c十八6哪一个适宜作为年销售量y关于年宣

传费x的回归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

(3)已知这种产品的年利润z与x,>-的关系为z=0.2y-x.

根据(2)的结果回答下列问题:

①年宣传费x=49时,年销售量及年利润的预报值是多少?

②年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(“1,01),(M2,02),…,(Un,Vn),其回归直线0=々+夕”的斜

率和截距的最小二乘估计分别为

n__

X(ui-u)(vi-。)

Ai=1A-A-

B-,u=v-/in.

E(u-u)2

i=1

解(1)由散点图可以判断,y=c+砧适宜作为年销售量y关于年宣传费x的回

归方程类型.

(2)令讪=5,先建立y关于讪的线性回归方程.

8--

X(W/­W)(V/-V)

,i=1__________________108.8

由于1=8h二—=TT=68,

E(W/-w)2

i=1

A-A一

c=y—标=563—68X6.8=100.6,

所以y关于w的线性回归方程为£=100.6+68〃,

因此y关于x的回归方程为y=100.6+68m.

(3)①由(2)知,当x=49时,

年销售量y的预报值£=100.6+68相=576.6(。,

年利润z的预报值2=576.6X0.2—49=66.32(千元).

②根据(2)的结果知,年利润z的预报值

1=0.2(100.6+68也)—x=-x+13.6^+20.12.

所以当也=孚=6.8,

即x=46.24时,2取得最大值.

故年宣传费为46.24千元时,年利润的预报值最大.

规律方法求非线性回归方程的步骤

(1)确定变量,作出散点图.

(2)根据散点图,选择恰当的拟合函数.

(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线

性回归方程.

(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.

⑸根据相应的变换,写出非线性回归方程.

【训练3]下表为收集到的一组数据:

X21232527293235

y711212466115325

⑴作出x与y的散点图,并猜测x与y之间的关系;

(2)建立x与y的关系,预报回归模型并计算残差;

(3)利用所得模型,预报x=40时y的值.

解(1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据

已有知识可以发现样本点分布在某一条指数函数曲线y=aec2x的周围,其中ci,

C2为待定的参数.

y

35()

300・

250

200

15()

10(),

50.・•

()J,__1_~1~~1_~■~~*

20222426283032343638v

(2)对y=cie0两边取对数,得lny=lnci+czx,令z=lny,则有变换后的样本点

应分布在直线z=bx+a(a=lnci,8=C2)的周围,这样就可以利用线性回归模型

来建立y与龙之间的非线性回归方程了,数据可以转化为

X21232527293235

z1.9462.3983.0453.1784.1904.7455.784

求得回归直线方程为2=0.272元一3.849,

.•.?,y一-ea0.272x-3.849.

残差

yt711212466115325

A

V6.44311.10119.12532.95056.770128.381290.325

A

ei0.557-0.1011.875-8.9509.23-13.38134.675

(3)当尤=40时,Q=ea272X40-3.849七1131.

■m素养达燧・W逐步落实

一、素养落地

1.通过本节课的学习,进一步提升数学运算及数据分析素养.

2.当根据给定的样本数据得到的散点图并不是分布在一条直线附近时,就不能

直接求其回归直线方程了,这时可根据得到的散点图,选择一种拟合得最好的函

数,常见的函数有幕函数、指数函数、对数函数等,然后进行变量置换,将问题

转化为线性回归分析问题.

二、素养训练

1.下列两个变量之间的关系不是函数关系的是()

A.角度和它的余弦值

B.正方形的边长和面积

C.正〃边形的边数和内角度数和

D.人的年龄和身高

解析函数关系就是变量之间的一种确定性关系.A,B,C三项中的两个变量

之间都是函数关系,可以写出相应的函数表达式,分别为式e)=cos&g(a)=/,

%(〃)=(〃一2)兀.D选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍

可以有不同的身高,故选D.

答案D

2.(多选题)关于残差图的描述正确的是()

A.残差图的横坐标可以是样本编号

B.残差图的横坐标也可以是解释变量或预报变量

C.残差点分布的带状区域的宽度越窄相关指数越小

D.残差点分布的带状区域的宽度越窄残差平方和越小

解析残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方

和越小,此时,R2的值越大,故描述错误的是C.

答案ABD

3.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统

A.51个B.50个

C.54个D.48个

解析由题意知x=17.5,y=39,代入回归直线方程得2=126.5,126.5—14.5X5

=54,故选C.

答案C

4.在研究硝酸钠的溶解度时,观察它在不同温度⑴的水中溶解度(y)的结果如下

表:

温度X010205070

溶解度y66.776.085.0112.3128.0

由此得到回归直线的斜率是.

-1

解析x=5(0+10+20+50+70)=30,

一1

y=5(66.7+76.0+85.0+112.3+128.0)=93.6,

5--

£(即一工)(y-y)

由公式金=匕--------------可得分Q0.8809.

□-

E(X/—%)2

i=l

答案0.8809

5.在一次抽样调查中测得样本的5个样本点,数值如下表:

X0.250.5124

y1612521

试建立y与X之间的回归方程.

解由数值表可作散点图如图,

根据散点图可知y与x近似地呈反比例函数关系,

设£=[,令f=:,贝日=灯,原数据变为:

t4210.50.25

y1612521

由置换后的数值表作散点图如下:

由散点图可以看出y与f呈近似的线性相关关系,列表如下:

Itiy砂id

14166416

2212244

31551

40.5210.25

50.2510.250.0625

£7.753694.2521.3125

所以,=1.55,y=7.2.

5——

Y.tiyi-5y

A1=1t

所以b=------------------^4.1344,

b二

X5产

i=l

A-A-

a=y—bt^Q.S.

所以£=4.1344/+0.8.

所以y与x之间的回归方程是

A4.1344,八。

y=+0.8.

,x

课后作业巩固提高

基础达标

一、选择题

1.已知某地财政收入X与支出y满足回归方程£=源+。+4(单位:亿元)(i=l,

2,-),其中金=0.8,a=2,同<0.5,如果今年该地区财政收入10亿元,年支出

预计不会超过()

A.10亿元B.9亿元

C.10.5亿元D.9.5亿元

解析J=0.8X10+2+e,=10+ez,

V|e,|<0.5,9.5V的0.5.

答案C

2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,

则下列模型拟合精度最高的是()

残到

<),8------------------------------------0.8-----------------•-----------------

0.6-----------------1-----------------().6匕---------:------------

04H--------------------s—O.4b-^---------------------•---------

0.2|-二...,;------().2|•:------

什J市疝右加景)常力而编与南疝市)而自)«)%加编自

-O:4.-。:4・

------------------5---------------------------0.6-----------------------------------

----------------------------------------------O.B|--------------•--------------------

AB

残差f残差t

1.2-----------------------------------0.8-----------------•----------------

0.9-----------------•-----------------0.6------------------------------------

什仆r--------------5-------------0.4k-----------------------«---------

0.3卜.--0.2|-----------------------------------

_();1;)加:而市)亲)&)市)加编“什J|'()£()亦,()斗)&)力加编房

-。7>一・•丁^'-。:4・•日已

-09-------------1---------------------0.6-----------------------------------

-1.2|-----------------------------------().«|---------------------•-------------

CD

解析用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域

中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.

答案A

3.在回归分析中,心的值越大,说明残差平方和()

A.越大B.越小

C.可能大也可能小D.以上均错

解析因为N=1—三------:—,所以当R2越大时,£(6一制2越小,即

.SCyt-y)21-1

1=1

残差平方和越小.

答案B

4.若一函数模型为丫=5m2a+2sina+l,为将y转化为Z的回归直线方程,则需

作变换,等于()

A.sin2aB.(sina+1)2

2

C.Qina+习D.以上都不对

解析因为y是关于,的回归直线方程,实际上即y是关于,的一次函数,又因

为y=(sina+l)2,若令f=(sina+1-,则可得y与,的函数关系式为y=f,此时

变量y与变量才是线性相关关系.

答案B

5.甲、乙、丙、丁4位同学各自对A,8两变量进行回归分析,分别得到散点

nA

图与残差平方和E(v—y,)2如下表:

i=l

甲乙丙T

IBB.IB伊

**•

散点图*♦♦•*••

0AOAOA0A

残差平方和115106124103

哪位同学的试验结果体现拟合A,8两变量关系的模型拟合精度高()

A.甲B.乙

C.丙D.T

解析根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差

、n-〜

平方和越小(对于已经获取的样本数据,R2的表达式中£(y,-y)2为确定的数,

i=l

则残差平方和越小,收越大),由回归分析建立的线性回归模型的拟合效果越好,

由试验结果知丁要好些.

答案D

二、填空题

6.某种产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下

表:

X24568

y3040605070

已知y关于x的线性回归方程为£=6.5x+17.5,则当广告支出费用为5万元时,

残差为万元.

解析当x=5时,?=6.5X5+17.5=50,表格中对应y=60,于是残差为60一

50=10(万元).

答案10

7.某商场为了了解某品牌羽绒服的月销售量(单位:件)与月平均气温x(单位:℃)

之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:

月平均气温力℃171382

月销售量w件24334055

由表中数据算出线性回归方程£=源"中的金心一2.气象部门预测下个月的平均

气温约为6℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为

—[7+]q+x+2

解析由表格中数据可得x=-----------=10,

AA-A-

又•.》七一2,:.a=y-bx^38+2X10=58,

A,,A

.•.y=-2x+58.当x=6时,>>=-2X6+58=46.

答案46

8.在研究气温和热茶销售杯数的关系时,若求得决定系数R2Po.85,则表明气

温解释了的热茶销售杯数变化,而随机误差贡献了剩余的

,所以气温对热茶销售杯数的效应比随机误差的效应大得多.

解析由决定系数R2的意义可知,心q0.85表明气温解释了85%,而随机误差

贡献了剩余的15%.

答案85%15%

三'解答题

9.从某居民区随机抽取10个家庭,获得第i个家庭的月收入双单位:千元)与

101010

月储蓄双单位:千元)的数据资料,算得£x,=80,£y,=20,Ex»=184,

i=li=1i=1

10.

Sx?=720.

i=\

⑴求家庭的月储蓄y关于月收入x的线性回归方程£=源十2

⑵若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.

1101

解(1)由题意知”=10,x=­£x=7nX80=8,

ni=110(

1101

产"当6=15X20=2,

10

Xiy-nxy

所以金二匕3-------184-10X8X224

720-10X82=80=0,3,

i=1

AA

a=y一以=2—0.3X8=—0.4,

故所求线性回归方程为£=0.3x—0.4.

(2)将x=7代入回归方程,可以预测家庭的月储蓄约为£=0.3X7—0.4=1.7(千

元).

10.为了研究甲型H1N1中的某种细菌随时间x变化的繁殖个数),收集数据如

下:

天数X123456

繁殖个数y612254995190

求y对x的回归方程.

解作出散点图如图(1)所示.

由散点图看出样本点分布在一条指数型曲线y=ce"r的周围,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论