人教版数学高二A版选修2-3教案3.1回归分析的基本思想及其初步应用第二课时_第1页
人教版数学高二A版选修2-3教案3.1回归分析的基本思想及其初步应用第二课时_第2页
人教版数学高二A版选修2-3教案3.1回归分析的基本思想及其初步应用第二课时_第3页
人教版数学高二A版选修2-3教案3.1回归分析的基本思想及其初步应用第二课时_第4页
人教版数学高二A版选修2-3教案3.1回归分析的基本思想及其初步应用第二课时_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高中数学打印版第课教学目标知识与技能从相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤.过程与方法在发现直接求回归直线方程存在缺陷的基础上学生去发现解决问题的新思—进行回归分析,进而介绍残差分析的方法和利用R献率.

来表示解释变量对于预报变量变化的贡情感、态度与价值观通过本节课的学习数与实生活的联系学态度评价两个变量的相关性,掌握处理问题的方法成谨治学态度和锲而不舍的求学精神养生运用所学知识解决实际问题的能力教学中适地利用学生的合作与交流学生在学习的同时体与他人合作的重要性.重点难点教学重点从残差分析相关指数角度探讨回归模型的拟合效果及建立回归模型的基本步骤;教学难点:了解评价回归效果的两个统计量:相关指数、残差和残差平方和.教过引入新课(幻灯片)编号身高/

体重/

54646143上表是上一节课我们从某大学选取名大学生其身高和体重数据组成的数据表一节课中我们通过数据建立了回归直线方程,并根据方程预测了身高为72的大学生的体重.当时们提到根据回归直线方程求得的体重数据仅是一个估计值,其与真实值之间存在着误差,为了综合分析身高和体重的关系,我们引入了线性回归模型y=bx+来表示两变量之间的关系,其中随机变量,又称随机误差.线性回归模型y=bx+ae增加了随机误差项e,因变量y的由自变量x和机误差同确定.假设随机误差对体重没有影响也就是说体仅身高的影响那么散点图中所有的点将完全落在回归直线上.但是,在图中,数据点并没有完全落在回归直线上.这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线推”开了,自变量x能解释部分的化.同学们考虑一下,随机变量e的均值是多少?差又是多少?活动设计:学生思考回答问题.学情预测:学生回答E(e),D(e)σ教师提问:能否通过D(e)来刻画线性回归模型的合程度?学情预测随误差的方差越小通回归直线预报真实值y的度高随误差是引起预报值与真实值y之的误差原因之一,其大小取决于随机误差的方差.设计意图说研究随机误差的要性通过研究随机误差以分析预报值的可信度.提出问题:既然可以用随机变量的方差来衡量随机误差的大小,即通过方差2

来刻画预报变量体重)的变化在多大程度上与随机误差有关,那么如何获得方差σ学生活动:学生独立思考,小组合作交流讨论.

呢?活动结果:可以采用抽样统计的思想,通过随机变量e的本来估计σ精心校对版本

的大小.

^^^^^^^12nn^^iiii^^^^^^^12nn^^iiiiiiin^iii^^设计目的:复习抽样统计思想,以便通过随机变量e的本来估计总体.探究新知提出问题既然表了解释变量以外其他各种影响预报值的因素带来的误差么如何获得e的样本来计算σ

呢?学生活动:分组合作讨论交流.学情预测:由函数模y=bx+a和归模型y=bx++可=yy,样根据图表中女大学生的身高求出预报值,再与真实值作差,即可求得e的一个估计值.教师由在计算回归直线方程利用公式求得和为斜率和截距的估计值它们与真实值间存在误差,因y是计值,所e=y-y也一个估计值.由上可知,对于样本(x,),(x,y),,(x,)而言,它们的随机误差为e=y-bx-,i,,称其估计值=y-

i

为相应于点x)的差.将所有残差的平方加起来,即i

2这个和称作残差平方和.i类比样本方差估计总体方差的思想,可以用^σ

^12(y-y)-n-ii

2

作为2

的估计量,通常σ

越小,预报精度越高.这样当们求得回归直线方程以通过残差来判断模型拟合程度的效果判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.设计目的:通过问题诱思,引入残差概念.理解新知提出问题对照女大学生的身高体重的原始数据合求出的回归直线方程求出相应的残差数据.学生活动:独立完成.活动结果:编号身高(体重kg)残差e

提出问题根据表格中的数据样本编号为横坐标差值为纵坐标出点图这样的散点图称作残差.学生活动:分组合作,共同完成.活动结果:残差图精心校对版本

^^^n^iiiiiii高中数学打印版^^^n^iiiiiii提出问题观察上面的残差图认哪几个样本点在采集时可能存在人为的错误?为什么?学生活动:分组讨论.活动结果第一个和第六个样本在采集过程中可能存在错误为他的样本点基本都集中在一个区域内只有这两样本点的残差比较大对其他样本点来说分得较为分散.提出问题:如何从残差图来判断模型的拟合程度?学生活动:独立思考也可相互讨论.活动结果:因

越小,预报精度越高,即模型的拟合程度越高,2小的值越集中故残差点比较均匀落在水平的带状区域内明选用的模型比较合适且带状区域的宽度越窄,说明拟合精度越高,回归直线的预报精度越高.教师:在统计学上,人们经常用相关指数(y-2

来刻画回归的效果,其计算公式是:R

=1-

1n(y21提出问题:分析上面计算相关指数R

的公式,如何根据R2

来判断模型的拟合效果?学生活动:独立思考也可相互讨论,教师加以适当的引导提示.n活动结果:因为对于确定的样本数据而言,(y-y)21意味着残差平方和越小,也就是说模型的拟合效果越好.

是一个定值,故R2

取值越大,提出问题:在线性回归模型中R

表示解释变量对于预报变量变化的贡献率

越接近1,表示回归的效果越好,即解释变量和预报量的线性相关性越强,试计算关于女大学生身高与体重问题中的相关指数R

学生活动:学生独立计算获得数据.活动结果:2≈0.64.根据R≈0.64就得出“女大学生的身高解释了64%体重变”,或者说“大学生的体重差异有64%由身高引起的就难理解为什么预报体重和真实值之间有差距了.设计目的结合图象让生直观感受残差图在刻画回归模型拟合效果方面的应用会残差分析和相关指数的意义.提出问题根据前面得到的回归程否预测一名美国女大学生的体重?建立回归模型后能否一劳永逸,在若干年后还可以使用,或者适用于多年以前的女大学生体重预测?精心校对版本

^^^12n^高中数学^^^12n^学生活动:讨论交流总结发言.活动结果:在使用回归方程进行预报时要注意:(1)回归方程只适用于我们所研究样本的总体;(2)我们建立的回归方程一般都有间性;(3)样本取值的范围会影响回归方的适用范围;(4)不能期望回归方程得到的预报就是预报变量的精确值.提出问题:结合我们刚学习的概念,现在能否将建立回归模型的步骤补充完整?学生活动:讨论交流,合作完成.活动结果:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报量的散点图,观察它们之间的关如是否存在线性关系等).(3)由经验确定回归方程的类如我们观察到数据呈线性关系,则选用线性回归方.(4)按一定规则如最小二乘)估计回归方程中的参数.(5)得出结果后分析残差图是否有(如个别数据对应残差过大,残差呈现不随机的规律性,等).若存在异常,则检查数据是否有误,或模型是否合适等.设计意图设问题,让学生讨分析出用回归方程进行预报需注意的问题,并让学生完善建立回归模型的步骤.在这个过程中师宜做太多引导,要放手给学生,让学生讨论,充分参与进来.运用新知例1个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了0次试验,测得的数据如下:编号零件数x/个

加工时间y/

68758189102115122(1)建立零件数为解释变量,加工间为预报变量的回归模型,并计算残差;(2)你认为这个模型能较好地刻画件数和加工时间的关系吗?分:先根据散点图粗略判断变量是否具线性相关性断是否可以用线性回归模型来拟合数据,然后通过残ee来判断模型拟合的效果,判断原始数据是否存在可疑数据.解:(1)根据表中数据作出散点图下:散点图由散点图可知变量之间具有线性相关关系,可以通过求线性回归方程来拟合数据.根据公式可求得加工时间对零件数的线性回归方程y=0.668x+精心校对版本

^^^^^^ii5^5iii高中数学打印版^^^^^^ii5^5iii残差数据如下表:编号

10残差e

-0.65

-0.37

-0.05

(2)画出残差图残差图由图可知残点分布较均匀即用上述回归模型拟合数据效果很好但需注意由差图也可以看出4个本和第样本点残差较大要认在采集这两个样本点的过程中是否有人为的错误.点评由点图判断两个变量的性相关关系差较大利残差图可以较好地评价模型的拟合程度,并能发现样本点中的可疑数据.【变练演编】例一段时间内,某种商品的价格元)和需求量y()之间的一组数据为:价格元需求量y/

161820504341求出y对x的归方程,并说明拟合效果的好坏.思分:根据散点图判断两个变量是否线性相关若相关,求出回归直线方程后通过相关指数的大小来评价拟合效果的好坏.解:作出散点图:从作出的散点图可以看出这些点在一条直线附近用线性回归模型来拟合数据由数据可得=,y=,由计算公式=,=y-bx=故yx的归方程y=2.35x+,列表yy

i

1.2

-0.14.6

--

0.3-4.4

-8.4所以(y-)2=8.3,(y-2229.2.i

i1精心校对版本

5^iiiii高中数学打印版5^iiiii(y-2相关指数R2

=1-

1

≈0.946.5(y-y)

1因为很近1所以该模型的拟合效果很好.变式:若要分析是否在上述样本的采集过程中存在可疑数据,应如何分析?活动设计:学生分组讨论,回顾课本解答问题.活动成果:可以画出残差图来进行分析.变式:既然利用残差图和相关指数都能够评价回归模型的拟合效果,能否总结一下两种方法各自的特点?活动成果利用残差图可以直观示拟合的效果且可以发现样本数据中的可疑数据而关指数是把对拟合效果的评价转换为数值大小的判断于化处理并能在数量上表现解释变量对于预报变量变化的贡献率.设计意图:进一步熟悉判断拟合效果的方法以及各自的特点.【达标检测】.分析下列残差图,所选用的回归模型效果最好的()ABC

D.下列说法正确的()①回归直线方程适用于一切样本和总体回直线方程一般都有时间性样本的取值范围会影响回归直线方程的适用范围据回归直线方程得到的预测值是预测变量的精确值.A①③④B.③C.①②D.④.在研究气温和热茶销售杯数的关系时,若求得相关指数2,气温解释了85%热茶销售杯数变化或说热销售杯数差异有是由气温引起的.答案:1.D2.B3.0.85.精心校对版本

n^iii^^5^ii11i221高中数学打印版n^iii^^5^ii11i221课堂小结学生回顾本节课学习的内容尝总结然后不充分的地方由学生相互补充后老师的引导下,用精炼的语言进行概括:.判断变量是否线性相关的方法以及各自的特点;.在运用回归模型时需注意的事项;.建立回归模型的基本步骤.设计意图学自己小结是一个多维整合的过程一个高层次的自我认识过程.补充练习【基础练习】.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选的模型比较合适.②用相关指数来画回归的效果,2值接近于,说明模型的拟效果越好③较两个模型的拟效果以比较残差平方和的大小残差平方和越小的模型,拟合效果越好.正确的是()A①②B.②③.①③D①②③.甲、乙、丙、丁四位同学各自对AB两量做回归分析,分别得到散点图与残差平方和(y-y)

如下表

1甲

丁散点图残差平方和

哪位同学的实验结果体现拟合AB两量关系的模型拟精度高(A甲B乙.D丁.关于x与y有下数据:xy

为了对xy两个变量进行统计分析有下两种线性模型y=+17.5乙:y=+试较哪一个模型拟合效果更好.答案或提示2.D(yy)2.析:设甲模型相关指数为R2则R2=-

i=1-5(y)2

=0.845设乙i模型的相关指数为R

,则可求得R

=,因为R2>R

,所以甲模型的拟合效果更好.【拓展练习】假设某种农作物本苗数与有效穗之存在相关关系测得5数据如下:精心校对版本

^^^^^^^^^^^^123455^iii5^i^^^^^^^^^^^^123455^iii5^iiix36.644.4y43.149.2(1)以x为释变量y为报变量,作出散点图;(2)求y与x之的回归方程,对于基本苗数56.7预有效穗数.(3)计算各组残差;(4)求2并说明随机误差对有效穗数的影响占百分之几?解:(1)散点图如图:由可以看出,样本点呈条状分布,有比较好的线性相关关系,因此可用线性回归方程来建立两个变量之间的关系.设线性回归方程y=bx+a,数据可以求得:≈0.291a=y-x=34.67.故所求的线性回归方程为y=+当x=时,=0.291×56.7+=51.1697.估计有效穗数为51.169(3)各组数据的残差分别≈0.37e,≈-,≈-2.22e≈1.61.(4)残差平方和:(y-y)

5=,又(y-y)250.18,∴

=1-

i1(y-)i8.425=1≈0.832.5(y2

ii即解释变量(农作物基本苗数对有效穗数的影响约占了83.2%所以随机误差对有效穗数的影响约占1=16.8%.设说本课时从上一节课的案例出发,通过分析随机误差产生的原因,引入随机变量、残差、残差平方和指的有关概念关数和残差分析等角度探讨回归模型拟合的效果,并通过案例说明利用所建立的回归模型进行预报时需要注意的问题结建立回归模型的基本步骤.在教学过程中以问题为引导思考的动机重学生合作意识的培养过案例的分析,培养学生对数据的处理能力,让学生初步了解回归分析思想在实际生活中的运用.精心校对版本

iin^ii^^^n^iin^n^iiiin^^iiiiiii=)+(y-y)+2n^^iiiiiin^iin^ii^^^n^iin^n^iiiin^^iiiiiii=)+(y-y)+2n^^iiiiiin^^n^^^iiiiiiin^[^^]iiii=b(x-x)(y-y)b(x)i备资有关总偏差平方和、回归平方和、残差平方和以及相关指数等概念的说明n.总偏差平方和SST(y)2刻画了预报变量y的化剧烈程度.

1.回归平方和:SSR=(y-y2i1

,公式中所有预测值的平均值也等于,故^1^^^^^^=x+a=x+=x+y-bx=y,iii

1因此回归平方和又可以写成从而回归平方和刻画了估计量ya+x的化程度由估计量由解释变量所决定以归方和刻画了预报变量的变化中由解释变量通过线性回归模型引起的那一部分的变化程度..残差平方和:SSE=(y-y2

,刻画了残差变量变化的程度.i.偏差平方和分解:即指公式(y-y2(y-y2-y2,i

i

i称为平方和分解公式,用文字表示为:总偏差平方和=回归平方和+残差平方和.公式证明如下:假设观测数据为(,),i,…,n,则(y-)2=(y-y+y-ynn^22iii

1(y-)(y-y).

i1

1

1

1而-y)(y-)=(b-bx--bx)

1i

1=(x-x--x--)

1^[]iii

1

精心校对版本

^ii

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论