回归分析导学案_第1页
回归分析导学案_第2页
回归分析导学案_第3页
回归分析导学案_第4页
回归分析导学案_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.1 回归分析的基本思想及其初步应用(一) 学习目标:(1)通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.(2)了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法:相关指数和残差分析.(3)了解评价回归效果的两个统计量:总偏差平方和、残差平方和.学习重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法:相关指数和残差分析.学习难点:解释随机误差和残差的含义.学习过程:一、课前准备(一)、复习必修3的“变量间的相关关系”内容,注意以下内容:1相关关系:自变量取值一定时,因变量的取值带有一定 随机性 的两个变量之间的关系叫做相关关系;2函数关系

2、中两个变量的关系是 确定的 ,相关关系中的两个变量的关系是 不确定的 .3两个变量的线性相关:(1)散点图:将样本中个数据点描在坐标系中得到的图形.(2)正相关与负相关:正相关:散点图中的点散布在从 左下角 到 右上角 的区域;负相关:散点图中的点散布在从 左上角 到 右下角 的区域.4. 回归直线的方程:(1)如果散点图中的分布从整体上看大致在 一条直线 附近,就称这两个变量之间具有 线性相关 关系,这条直线叫做回归直线.(2)回归方程: 回归直线 对应的方程叫做回归直线的方程.(3)回归方程的推导过程:假设已经得到两个具有线性相关关系的变量的一组数据,.设所求回归方程为,其中、是待定参数.

3、由最小二乘法得,.其中回归方程的 斜率 ,是 截距 . (二)研究相关关系和回归分析的意义:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.二、新课导学:1.几个需要了解的概念: (1)总偏差平方和、残差平方和、回归平方和:总偏差平方和:所有单个样本值与样本均值差的平方和,即;残差平方和:回归值与样本值差的平方和,即;回归平方和:相应回归值与样本均值差的平方

4、和,即.(2)要注意的问题:注意、的区别;预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即;当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2. 典型例题: 【例1】 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm16565157170175165155170体重/kg485750 54 64614359求根据一名女大学生的身高

5、预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. 【解析】求回归方程并预报体重: 提问:身高为172cm的女大学生的体重一定是60.316kg吗?答:不一定,但一般可以认为她的体重在60.316kg左右. 解释线性回归模型与一次函数的不同.答:事实上,观察上述散点图,我们可以发现女大学生的体重和身高之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同.

6、 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型,其中残差变量中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式. 【例2 】关于与有如下数据:245683040605070为了对、两个变量进行统计分析,现有以下两种线性模型:,试比较哪一个模型拟合的效果更好.【分析】既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得

7、出结论.【解析】,因为84.5%82%,所以甲选用的模型拟合效果较好.三、总结提升:(1)求线性回归方程的步骤、线性回归模型与一次函数的不同.(2)分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.四、反馈练习1.对具有相关关系的两个变量统计分析的一种常用的方法是( )A回归分析 B.相关系数分析 C.残差分析D.相关指数分析2. 在画两个变量的散点图时,下面哪个叙述是正确的 ( )A预报变量在轴上,解释变量在轴上 B解释变量在轴上,预报变量在轴上C可选择两个变量中任一个变量在轴上 D可选择两个变量中任一个变量在轴上3. 一位母亲记录了儿子39岁的身高,由此

8、建立的身高与年龄的回归模型为用这个模型预测这个孩子10岁时的身高,则正确的叙述是 ( ) A.身高一定是145.83cm B.身高在145.83cm以上C.身高在145.83cm以下 D.身高在145.83cm左右4.两个变量相关性越强,相关系数 ( )A越接近于0 B.越接近于1 C.越接近于1 D.绝对值越接近15.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为( )A0 B.1 C.1 D.1或16. 两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数如下 ,其中拟合效果最好的模型是 ( )A.模型1的相关指数为0.98 B.模型2的相关指数为0.80 C

9、.模型3的相关指数为0.50 D.模型4的相关指数为0.257. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数8.相关指数 五 课后作业:1.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断正确的是 ( ) A.生产率为1000元时,工资为50元 B.生产率提高1000元时,工资提高150元C.生产率提高1000元时,工资提高90元 D.生产率为1000元时,工资为90元2假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456y2238556570若由资料可知对呈线性相关关系.试求:(1)线性回归方程;(2)估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论