高中数学《一元线性回归模型及其应用》教案、导学案与同步练习_第1页
高中数学《一元线性回归模型及其应用》教案、导学案与同步练习_第2页
高中数学《一元线性回归模型及其应用》教案、导学案与同步练习_第3页
高中数学《一元线性回归模型及其应用》教案、导学案与同步练习_第4页
高中数学《一元线性回归模型及其应用》教案、导学案与同步练习_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《8.2一元线性回归模型及其应用》教案

【教材分析】

本节课选自《2019人教A版高中数学选择性必修第三册》,第七章《随机变量及其分布

列》,本节课主本节课主要学习一元线性回归模型及其应用.

本章主要学习统计方面知识,在之前学生已经对统计相关的知识做了大概的了解,本节学

生要继续探讨的是变量之间的相关关系,变量之间有两类关系;函数关系和相关关系,它

们的联系与区别;并了解线性相关及相关系数,为了解线性回归的基本思想和方法以及求

回归直线的方程和相关性检验做准备。

【教学目标与核心素养】

课程目标学科素养

A.能通过具体实例说明一元线性回归模型修改的依1.数学抽象:一元线性回归模型

据与方法.2.逻辑推理:最小二乘法与回归方程

b.通过对具体问题的进一步分析,能将某些非线性回3.数学运算:求决定系数

归问题转化为线性回归问题并加以解决,提高数学运4.数学建模:模型化思想

算能力.

c.能通过实例说明决定系数R的意义和作用,提高数

2

据分析能力。

【重点与难点】

重点:决定系数R的意义和作用

2

难点:某些非线性回归问题转化为线性回归问题

【教学过程】

教学过程教学设计

一、问题导学

通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相

关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,

以及线性相关程度的强弱等.

如果能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立通过具体的问题

适当的统计模型刻画两个随机变量的相关关系,那么我们就可以利用这情境,引发学生

个模型研究两个变量之间的随机关系,并通过模型进行预测.思考积极参与互

二、探究新知动,说出自己见

探究1:生活经验告诉我们,儿子的身高与父亲的身高相关.一般来说,父解。从而引入一

亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的元线性回归模型

关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据的概念,发展学

如表所示.生逻辑推理、数

学运算、数学抽

编号1234567891011121314

象和数学建模的

父亲身1717171618171817161618171618核心素养。

高/cm40392202862340

儿子身1717171718171717171617171618

高/cm66005684088252

可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿

子身高和父亲身高线性相关.利用统计软件,求得样本相关系数为

0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高

探究2.根据表中的数据,儿子身高和父亲身高这两个变量之间的关系

可以用函数模型刻画吗?

编号1234567891011121314

父亲身1717171618171817161618171618

高/cm40392202862340

儿子身1717171718171717171617171618

高/cm66005684088252

表中的数据,存在父亲身高相同而儿子身高不同的情况.例如,第6个

和第8个观测父亲的身高均为172cm,而对应的儿子的身高为176cm和

174cm;同样在第3,4个观测中,儿子的身高都是170cm,而父亲的身

高分别为173cm,169cm.可见儿子的身高不是父亲身高的函数同样父亲

的身高也不是儿子身高的函数,所以不能用函数模型来刻画.

探究3:从成对样本数据的散点图和样本相关系数可以发现,散点大致

分布在一条直线附近表明儿子身高和父亲身高有较强的线性关系.我们

可以这样理解,由于有其他因素的存在,使儿子身高和父亲身高有关系

但不是函数关系.那么影响儿子身高的其他因素是什么?

影响儿子身高的因素除父亲的身外,还有母亲的身高、生活的环境、饮

食习惯、营养水平、体育锻炼等随机的因素,儿子身高是父亲身高的函

数的原因是存在这些随机的因素.

探究3:由探究3我们知道,正是因为存在这些随机的因素,使得儿子

的身高呈现出随机性各种随机因素都是独立的,有些因素又无法量化.

你能否考虑到这些随机因素的作用,用类似于函数的表达式,表示儿子

身高与父亲身高的关系吗?

如果用x表示父亲身高,Y表示儿子的身高,用e表示各种其他随机因

素影响之和,称e为随机误差,由于儿子身高与父亲身高线性相关,所

以Y=bx+a.

一元线性回归模型

用X表示父亲身高,Y表示儿子身高,e表示随机误差,假定随机误差e的

均值为o,方差为与父亲身高无关的定值。:则它们之间的关系可以表

-^,(Y=bx+a+e\

K郑“、c»、2h(1)

(E(e)=0,D(e)=o)

我们称(1)式为Y关于x的一元线性回归模型(simplelinear

regressionmodel).

其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型

的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机

误差,模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是

却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随

机的,如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.

问题1.你能结合父亲与儿子身高的实例,说明回归模型①的意义?

Y=bx+a+e,

E(e)=0,D(e)=(r2.

可以解释为父亲身高为4的所有男大学生身高组成一个子总体,该子总

体的均值为bx.+a,即该子总体的均值与父亲的身高是线性函数关系.

而对于父亲身高为尤的某一名男大学生,他的身高y并不一定为通过问题分析,

Ii

让学生理解运用

bx.+a,它仅是该子总体的一个谓阳值,这个观测值与均值有一个误差

最小二乘法求线

项e=y—(,bx+a).

iiI

性回归方程。发

问题2.你能结合具体实例解释产生模型①中随机误差项的原因吗?

展学生逻辑推

产生随机误差e的原因有:

理,直观想象、

(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生

数学抽象和数学

活环境、饮食习惯和锻炼时间等.

运算的核心素

(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差.

养。

(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什

么,可以利用一元线性回归模型来近似这种关系,这种近似关系也是产

生随机误差e的原因.

与雷2I不同,ISMUS的剜*出的,只处m

对样枷做府参数a和b刻画了变量Y与变量X的线性

关系,因此通过样本数据估计这两个参数,相当于寻找一条适当的直

线,使表示成对样本数据的这些散点在整体上与这条直线最接近.

问题3:为了研磔两个变量之间的相关关系,我们建立了一元线性回归

模型达式[E(e).O,0(e)蓍孵.的是变量丫与变量x之间的线性

相关关,

系,其中参数a和b未知,我们能否通过样本数据估计参数a和b?

问题4.我们怎样寻找一条“最好”的直线,使得表示成对样本数据的这

些散点在整体上与这条直线最“接近”?

目标:从成对样本数据出发,用数学的方法刻画“从整体上看,各散点

与直线最接近”

方法:利用点到直线y=bx+a的“距离”来刻画散点与该直线的接近程

度,然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程

度.我们设满足一元线性回归模型的两个变量的n对样本数据为

(xy),(x,y),…,(x,y),由y=bx+a+e(i=l,2,­••,n),得|y-

1,122nniiii

(bx+a)|=|e|.显然|e越小,表示点(x,y)与点(x,bx+a)的“距离”

iiiiiii

越小,即样本数据点离直线y=bx+a的疆宜窜宾越小。特别地,当e=0

i

时,表示点(x,y)在这条直线上.

w懊

rM^

170

165

16S170175180185

父亲身高/cm

如+a)|

因此,可以用日来刻画各样本观测数据与直线y=bx+a的

整体接近程度。

在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点到直

线的竖直距离的平方之和

Q(a,b)=Z(»-3七+a)>

Z=1

来刻画“整体接近程度”

a

n

/

170

165

165170175180185

父亲身高/cm

_,1

ZlV-(如+。)1

i=\

2

Q(a,b)=£{yi-{bxi+a))

一残差平方和:('='

求a,b的值,使Q(a,b)最小

在上式中,x,y(i=l,2,3,n)是已知的成对样本数据,所以Q由a和b

所决定,即它是a和b的函数,因为Q还可以表示为£之1,,即它是随机误

差的平方和,这个和当然越小越好,所以我们取使Q达到最小的a和b的

值,作为截距和斜率的估计值。下面利用成对样本数据求使Q取最小值

Q(a,b)=力(M-(如+。))2

/=|

(M-如-a)2

r-l

“____

2

=^yi-bxi-(y-bx)+(y-bx)-a)

/=!

2

=f(①一y)一Kxi-x)+(y-bx)-a)

r-l

=f[(%_y)_b(N_x)f+2七[(y_y)一仇A;-x)]x[()--bx)-a]+n[(y-bx)-a]2

/=1i=l

ZKy-.V)-bC%-x)]x[(y-hx)_〃]=(>,_bx--y)~h[xi-x)]

r=li=l

__n_n_______

=(y——a)(Z(—y)—(x,-x))=(y-bx-a)[(ny-ny)-b(nx-?zx)]=0

MIgi

2(a,Z?)=J[(X-x)]2+n[(y-bx)-a]2

J=1

当Q(a,勿取最小时,取最小值0,即。二丁-〃不

此时,Q(a,b)=£[(其—y)一员七-x)f=b2t(七一幻2一2力£(七-%)(%-y)+£(R-y)2

i=lr=li=li=l

上式是关于b的二次函数,因此要使Q取得最小值,当且仅当b的取值

£(Xj-X)2

通过具体的问题

"nn

,ECXj-xHj-j)Hx.y-nxy情境中的分析,

b=-...............=------------------,

222

'£(x;-x)£x.-nx深化对残差的理

a=y—bx.解。发展学生逻

辑推理,直观想

A1人

y=bx+a

象、数学抽象和

我们将+6称为Y关于x的经验回归方程,也称经验回归函数数学运算的核心

或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方素养。

法叫最小二乘法.

注意:

1、经验回归必过叵,文).

2、a都是估计值.

3、石与r符号相同.

问题5:利用下表的数据,依据用最小二乘估计一元线性回归模型参数

的公式,求出儿子身高Y关于父亲身高x的经验回归方程。

通过信息技术,计算求得

y=O.839JC-F28.957

编号1234567891011121314

父亲身1717171618171817161618171618

高/cm40392202862340

儿子身1717171718171717171617171618

高/cm66005684088252

问题6:当x=176时,y~177,如果一位父亲身高为176cm,他儿子

长大后身高一定能长到177cm吗?为什么?

儿子的身高不一定会是177cm,这是因为还有其他影响儿子身高的因

素,回归模型中的随机误差清楚地表达了这种影响,父亲的身高不能完

全决定儿子的身高,不过,我们可以作出推测,当父亲的身高为176cm

时,儿子身高一般在177cm左右.

如果把父亲身高为176cm的所有儿子身高作为一个子总体,那么177cm

是这个子总体均值的估计值.一般地,

因为E(Y)=bx+a,夕是bx+a的估计值,所以夕是E(Y)的估计值.

我们称y为响应变量Y的观测值,通过经验回归方程得到的因为预测

iI

值.为了研究回归模型的有效性,定义残差为片yR,残差是随机误差

的估计值,通过对残差的分析可判断回归模型刻画数据的效果,以及判

断原始数据中是否存在可疑数据等,这方面的工作称为朝辘分析.

例如,对于右表中的第6个观测,父亲身高为172cm,其儿子身高的观测值

为y==176(cm),预测值为96=0.839X172+28.957=173.265(cm),残差为

176-173.265=2.735(cm).类似地,可以得到其他的残差,如右表所示.

编号父亲身离/cm儿子身牖观测值/cm儿子身高预测值/cm残度/cm

1174176174.9431.057

2170176171.5874.413

3173170174.104-4.101

4169170J70.748-0.748

5182185181.6553.345

6172176173.2652.735

7180178179.977-1.977

8172174173.2650.735

9168170169.9090.091

10166168168.231-0.231

11182178181.655—3.655

12173172174.104-2.104

问题7:儿子身高与父亲身高的关系,运用残差分析所得的一元线性回

归模型的有效性吗?

残接国,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数

据,或体重估计值等,这样作出的图形称为残差图.

观察表可以看一到,残差有正有负,残差的绝对值最大是4.413.观察残差的

散点图可以发现,残差比较均匀地分布在横轴的两边,说明残差比较符合

2

一元线性回归模型的假定,是均值为0、方差为。的随机变量的观测

值.可见,通过观察残差图可以直观判新模型是否满足一元线性回归模型

的假设.

一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分

析,借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更

符合实际的预测与决策。

(1)(2)

(3)(4)

问题8:观察以下四幅残差图,你认为哪一个残差满足一元线性回归模

型中对随机误差的假定?

根据一元线性回归模型中对随机误差的假定,残差应是均值为0、方差

为M的随机变量的观测值.

图(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;

图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非

线性函数部分;

图(3)说明残差的方差不是一个常数,随观测时间变大而变大;

国(4)的质的比妣物峥申在物柳NMMft的相*状区域内.所

以,只有图(4)满足一元线性回归模型对随机误差的假设。

二、典例解析

例L经验表明,对于同一树种,一般树的胸径(树的主干在地面以上L3m

处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人

员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了

某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经

验回归方程.

编号123456

胸径

18.120.122.224.426.028.3

/cm

树高/m18.819.221.021.022.122.1

编号789101112

胸径

29.632.433.735.738.340.2

/cm

树高/m22.422.623.024.323.924.7

解:以胸径为横坐标,树高为纵坐标作散点图如下:

树高/m

26

24

22

is--/=0.2493d+14.84

16・一•・・A—------------------------------------------►

15202530354045胸径/cm

散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性

相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之

间的关系.

用d表示胸径,h表示树高,根据据最小二乘法,计算可得经验回归方程为

0.2493d+14.84

编号胸径/cm树高观测值/m树高预测值/m残差/m

118.118.819.4-0.6

220.119.219.9-0.7

322.221.020.40.6

424.421.020.90.1

526.022.121.30.8

通过典型例题的

628.322.121.90.2

分析解决,提升

729.622.422.20.2学生对回归方程

的理解和运用。

832.422.622.9-0.3

发展学生逻辑推

933.723.023.2-0.2理,直观想象、

数学抽象和数学

1035.724.323.70.6

运算的核心素

1138.323.924.4-0.5养。

1240.224.724.9-0.2

根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到

0.1)以及相应的残差,如下表所示.

以胸径为横坐标,残差为纵坐标,作残差图,得到下图.

1.0

0.5

0.0

15202530,354645胸径/cm

-0.5

-1.0

观察残差表和残差图,可以看到残差的绝对值最大是0.8,所有残差分

布在以横轴为对称轴、宽度小于2的带状区域内.可见经验回归方程较

好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测

树高.

皿胞回归I国的若木步%

(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量.

(2)画出解释变量与响应变量的散点图,观察它们之间的关系(如是否

存在线性关系等).

(3)由经验确定回归方程的类型.

(4)按一定规则(如最小二乘法)估计经验回归方程中的参数.

(5)得出结果后需进行线性回归分析.

①残差平方和越小,模型的拟合效果越好.

②决定系数♦取值越大,说明模型的拟合效果越好.

需要注意的是:若题中给出了检验回归方程是否理想的条件,则根据题

意进行分析检验即可.

例2.人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给

出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数

据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年

份的经验回归方程。

编号12345678

年份1891912192119301936195619601968

6

记录11.10.610.410.310.210.110.09.95

/s80000000

解:以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作

散点图,得到下图,散点看上去大致分布在一条直线附近,似乎可用一

元线性回归模型建立经验回归方程.

用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元

线性回归模型来刻画世界纪录和世界纪录产生年份之间的关系.根据

y,=-0.02033743?+49.76913031

将经验回归直线叠加到散点图,得到下图:

仔细观察:从图中可以看到,经验回归方程较好地刻画了散点的变化趋

势,请再仔细观察图形,你能看出其中存在的问题吗?

篥f世界纪录所对应的散点薄廨仝验回归直线,并且旗后廊时阿殿更

的戢盛郁森焦蕤属色直线般上寿,中卿腐卿段岫散盛就嫡魅网羯直线

的下方.

这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验

回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相

关的特征.

思考:你能对模型进行修改,以使其更好地反映散点的分布特征吗?

仔细观察,可以发现散点更趋向于落在中间下凸且递减的某条曲线附

近.回顾已有的函数知识,可以发现函数y=-lnx的图象具有类似的形状

特征

注意到100m短跑的第一个世界纪录产生于1896年,因此可以认为散点

是集中在曲线y=f(t)=c+cln(t-1895)的周围,其中c、c为未知参

I212

数,且c<0.

2

用上述函数刻画数据变化的趋势,这是一个非线性经验回归函数,其中

CC是待定参数,现在问题转化为如何利用成对数据估计参数C和C;令

1.2I2

x=ln(t-1895),则Y=cx+c对数据进行变化可得下表:

21

编号12345678

年份/t18961912192119301936195619601968

X0.002.833.263.563.714.114.174.29

记录11.810.610.410.310.210.110.09.95

Y/s0000000

y2=-0.4264398x+l1.8012653

得到散点图,由表中的数据得到经验回归方程为:

%=-0.4264398x4-11.8012653

卫卤表明,经验回归方程对于成对数据具有非常好的拟合精度.将

x=ln(t-1895)代入:将经验回归直线叠加到散点图,得到下图:

y2=-0.4264398%+11.8012653

y2=-0.4264398In(,一1895)+11.8012653

对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,

得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?

国=-O-4264398X+11.8012653

%=-0.4264398ln(r-1895)+11.8012653②

我们发现,散点图中各散点都非常靠近②的图象,表明非线性经验回

归方程②

对于原始数据的拟合效果远远好于经验回归方程①.

(1).直接观察法.在同一坐标系中画出成对数据散点图、非线性经验回

归方程②的图象(蓝色)以及经验回归方程①的图象(红色).

8282

Qi=Z(e)=0.669,Q2=Z@)«0.004

i=\i=l

人①

y2=-0.4264398%+11.8012653

%=-0.4264398ln(?-1895)+11.8012653

(2).残差分析:残差平方和越小,模型拟合效果越好.

Q明显小于Q,说明非线性回归方程的拟合效果要优于线性回归方程.

21

2

(3).利用决定系数R刻画回归效果.

,残差平方和

一总偏差平方和。

i=l

2

R越大,表示残差平方和越小,即模型的拟合效果越好

R.越小,表示残差平方和越大,即模型拟合效果越差.

①和②的R分别为0.7325和0.9983说明非线性回归方程的拟合效果要

优于线性回归方程。

(4)用新的观测数据来检验模型的拟合效果,事实上,我们还有1968年之

后的男子短跑100m世界纪录数据,如表所示

编号910JI12131415

1983198819911991199419961999

y9.939.929.909.869.859.849.79

编号161718192021

t200220052007200820082009

Y9.789.779.749.729.699.58

在散点图中,绘制表中的散点(绿色),再添加经验回归方程①所对应的经

验回归直线(红色),以及经验回归方程②所对应的经验回归曲线(蓝色),

得到右图.显然绿色散点分布在蓝色经验回归曲线的附近,远离红色经验

回归直线,表明经验回归方程②对于新数据的预报效果远远好于①.

思考:在上述问题情境中,男子短跑100m世界纪录和纪录创建年份之间

呈现出对数关系,能借助于样本相关系数刻画这种关系的强弱吗?

在使用经验回归方程进行预测时,需要注意下列问题:

(1)经验回归方程只适用于所研究的样本的总体,例如,根据我国父亲身

高与儿子身高的数据建立的经验回归方程,不能用来描述美国父亲身高

与儿子身高之间的关系,同样,根据生长在南方多雨地区的树高与胸径的

数据建立的经验回归方程,不能用来描述北方干早地区的树高与胸径之

间的关系。

(2)经验回归方程一般都有时效性,例如,根据20世纪80年代的父亲身

高与儿子身高的数据建立的经验回归方程,不能用来描述现在的父亲身

高与儿子身高之间的关系。

(3)解释变量的取值不能离样本数据的范围太远,一般解释变量的取值在

样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越

远,预报的效果越差,

(4)不能期望经验回归方程得到的预报值就是响应变量的精确值,事实

上,它是响应变量的可能取值的平均值。

建立非线性经验回归模型的基本步骤:

1.确定研究对象,明确哪个是解释变量,哪个是响应变量;

2.由经验确定非线性经验回归方程的模型;

3.通过财L将料I性经验回归模型归搬

4.按照公式计算经验回归方程中的参数,得到经验回归方程;

5.消去新元,得到非线性经验回归方程;

6.得出结果后分析残差图是否有异常.

跟踪训练1.一只药用昆虫的产卵数y与一定范围内的温度x有关,现收

集了6组观测数据列于表中:

;agx/℃212324272932

产卵数y/个61120275777

经计算得:

6__6_6_

Z(%-x)(y-y)=557,Za-x)2=84,^(y,.-y)2=3930,

/=!/=!/=!

线性回归残差的平方和:

62

W(%-为)=236,64,e80605«3167.

1=1

其中七,X分别为观测数据中的温度和产卵数,1=1,2,3,4,5,6.

(1)若用线性回归模型拟合,求y关于x的回归方程f=左:+6

(精确到0.1);

(2)若用非线性回归模型拟合,求得y关于x回归方程为

2

y=0.06ea2303x,且相关指数R=0.9522.

2

①试与(1)中的线性回归模型相比较,用R说明哪种模型的拟合效果更

好?

②用拟合效果好的模型预测温度为35c时该种药用昆虫的产卵数.(结果

取整数).

n

—y.)2

附:相关系数/=],=;1.

E(y,-y)2

i=\

解:(1)由题意得,n=6,x==26,y==33,

66

W(/一元)(%-为=557,2(Xi-元I?=84,

i=li=l

.Z(x,-;)(一)

b=---------------=—«6.6,a«33-6.6x26=-138.6.

£(“384

r=l

所以y关于x的经验回归方程为夕=6.6%-138.6.

66

(2)对于线性回归模型,28-衿2=3930,W(%-无)2=236.64

i=li=l

相关系数改=1-却'')=1-空空”0.9398.

i(y.-?)23930

1=1

VO.9398<0.9522

ann(—°・2303r

•••非线性回归模型的回归方程y=006e1,比线性回归方程

拟合效果更好

②?=0.06e°-231,3,1==0.06ea231)3x35=0.06Xe80605:=»3167X0.06F90

(个)

预测温度为35℃时该种药用昆虫的产卵数为190个.

三、达标检测

1.在两个变量y与x的回归模型中,分别选择了四个不同的模型,且

通过练习巩固本

它们的R?的值的大小关系为R版型3〈R氤”〈隘型1〈R嬴2,则拟合效果最好的是

节所学知识,通

()

过学生解决问

A,模型1B,模型2C.模型3D.模型4

题,发展学生的

B解析:在片表达式中,片越大,表示拟合效果越好.所以拟合效果

最好的是模型2.故选B.数学运算、逻辑

2.下列数据符合函数模型()推理、直观想

X12345678910象、数学建模的

22.6933.383.63.844.084.24.3

y核心素养。

,1x

A.y=2+-xB.y=2e

o

1

C.y=exD.y=2+lnx

D解析:分别将x的值代入解析式判断知满足y=2+lnx.

3.已知经验回归方程y=2x—1,则该方程在样本(3,4)处的残差为

-1解析:因为当x=3时,y=2X3—1=5,所以方程在样本(3,4)处

的残差是4—5=-1.

4.已知x与y之间的数据如下:

X23456

y2.23.85.56.57.0

(1)求y关于x的经验回归方程;

(2)完成下面的残差表并判断(1)中经验回归方程的回归效果是否良好

(若逢0.9,则认为回归效果良好).

X23456

yi—yi

z(Xi—x)(力一y)Zx,y:一nxy

八i=I1=1--

附:b=-----------------=-------------,a=y—bx,

X(Xi-X)2x2

Z(y.-yO2

i=l

R2=l-----------

E(y「y)'

i=l

解:(1)由已知图表可知x=4,y=5,Zx:=90,

i=l

;*112.3-5X4X5*-*-

y^xiYi—112.3,则mlb—90_5义4?—卜21a—丫bx—0.08,

故y=L23x+0.08.

(2)因为ei=yi-y1,所以e1=—0.34,e2=0.03,e3=0.5,6i==0.27,

e5=-0.46,则残差表为

X23456

yi—yi-0.340.030.50.27-0.46

5

因为Z(yi-7)2=(2.2—5)2+(3.8—5)2+(5.5—5尸+(6.5—5)』(7

i=i

\2八\2ll」20.651

-5)2=15.78,X(外一力)=0.651.所以R-=l-y^七0.96>0.9,

i=i

所以该经验回归方程的回归效果良好.

三、小结

1.比较两个模型拟合效果的方法:(1)残差法,残差越大,拟合效果越

通过总结,让学

差;残差越小,拟合效果越小.(2)产法,R,越接近1,拟合效果越好,

生进一步巩固本

R2越接近0,拟合效果越差.

节所学内容,提

2.对于线性回归模型与非线性回归模型,当数据的散点图分布在直线

高概括能力。

带状区域内,则选用线性回归模型刻画;当数据的散点分布在曲线带状

区域内,要先对数据进行适当变换,再利用线性回归模型进行拟合.

【教学反思】

课后通过对教学过程的反思与研究,才能不断完善教学设计中的不足,才能提升教材分析

的能力和课堂教学实效.

1.多元展示,多方评价.在教学过程中我借问题牵引,保证了课堂教学的顺利实施;而在

整个过程中,我对学生所作练习、疑问及时解析评价;学生之间、小组之间的互相评价补

充,使学生共享成果分享喜悦,坚定了学好数学的信念,实现了预期目标.

2.创造性的使用教材.有别于教材,我在教学中,让学生考察了分别考察了两类题型之后

再引导学生进行归纳,这样更贴近学生的认知水平,学生课后反馈,效果较为理想.

《8.2一元线性回归模型及其应用》导学案

【学习目标】

1.能通过具体实例说明一元线性回归模型修改的依据与方法.

2.通过对具体问题的进一步分析,能将某些非线性回归问题转化为线性回归问题并加以解

决,提高数学运算能力.

3.能通过实例说明决定系数R的意义和作用,提高数据分析能力。

2

【重点与难点】

重点:决定系数R的意义和作用

2

难点:某些非线性回归问题转化为线性回归问题

【知识梳理】

一元线性回归模型

用X表示父亲身高,Y表示儿子身高,e表示随机误差,假定随机误差e的均值为0,方差为与

父亲身高无关的定值。:则它们之间的关系可以表示为a[:2),(i)

我们称(1)式为Y关于x的一元线性回归模型(simplelinearregressionmodel).

其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为

截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,模型中的Y也是随机变量,其值

虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,

后一部分是随机的,如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.

2.经验回归方程

nn

三(苍一如(y一歹)_£Xjyn三歹

£(x.-x)2£x.2-nx2y=bx+a

1=11=1

d=y-bx.

我们将y=+&称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,

其图形称为经验回归直线,这种求经验回归方程的方法叫最小二乘法.

注意:

1、经验回归必过医,9).;2、3,6忑都是估计值.;3、6与r符号相同.

3.残差分析.

我们称y为响应变量Y的观测值,通过经验回归方程得到的夕为预测值.为了研究回归模型

i1

的有效性,定义残差为TyjZ,残差是随机误差的估计值,通过对残差的分析可判断回归

模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面的工作称为聂慧

分析.

4.决定系数V刻画回归效果.

-残差平方和

一总偏差平方和。

1=1

R越大,表示残差平方和越小,即模型的拟合效果越好

R越小,表示残差平方和越大,即模型拟合效果越差.

【学习过程】

一、问题探究

通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断

两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.

如果能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型刻

画两个随机变量的相关关系,那么我们就可以利用这个模型研究两个变量之间的随机关

系,并通过模型进行预测.

探究1:生活经验告诉我们,儿子的身高与父亲的身高相关.一般来说,父亲的身高较高时,

儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身

高及其父亲的身高,得到的数据如表所示.,

编号1234567891011121314

父亲身高

174170173169182172180172168166182173164180

/cm

儿子身高

176176170170185176178174170168178172165182

/cm

可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高

线性相关.利用统计软件,求得样本相关系数为r比0.886,表明儿子身高和父亲身高正线

性相关,且相关程度较高

160165170175180185父亲身病/cm

探究2.根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻

画吗?

编号1234567891011121314

父亲身高

174170173169182172180172168166182173164180

/cm

儿子身高

176176170170185176178174170168178172165182

/cm

探究3:从成对样本数据的散点图和样本相关系数可以发现,散点大致分布在一条直线附

近表明儿子身高和父亲身高有较强的线性关系.我们可以这样理解,由于有其他因素的存

在,使儿子身高和父亲身高有关系但不是函数关系.那么影响儿子身高的其他因素是什么?

探究4:由探究3我们知道,正是因为存在这些随机的因素,使得儿子的身高呈现出随机

性各种随机因素都是独立的,有些因素又无法量化.你能否考虑到这些随机因素的作用,用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论