1.1.2回归分析的基本思想及其初步应用(二)_第1页
1.1.2回归分析的基本思想及其初步应用(二)_第2页
1.1.2回归分析的基本思想及其初步应用(二)_第3页
1.1.2回归分析的基本思想及其初步应用(二)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第02课时1.1.2回归分析的基本思想及其初步应用(二)学习目标1通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.2了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.学习过程一、学前准备1由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响. 2为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、新课导学探究新知(预习教材P4P6,找出疑惑之处)问题1:假设身高和随机误差的不同不会对体重产生任何影响,会怎样?问题2:假设随机误差对体重没有影响,即体重仅受身高的影响,又会怎样?问题3:如何刻画预报变量(体重)的变化?这个变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?问题4:偏差平方和、残差平方和、回归平方和如何理解和计算答:总偏差平方和:所有单个样本值与样本均值差的平方和,即.残差平方和:回归值与样本值差的平方和,即.回归平方和:相应回归值与样本均值差的平方和,即.问题5:相关指数如何理解?答:相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.问题6:在回归分析中,分析残差能够帮助我们解决哪些问题?答:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适. 应用示例例1关于与有如下数据:245683040605070为了对、两个变量进行统计分析,现有以下两种线性模型:,试比较哪一个模型拟合的效果更好.解:分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.列表如下:1234524568304060507030.543.55056.569.531455259730.2512.2510042.250.2512564819 , , ,84.5%82%,所以甲选用的模型拟合效果较好.例2. 以下是收集到的房屋的销售价格与房屋的大小的有关数据,编号12345房屋大小(m2)80105110115135价格(万元)18.42221.624.829.2残差利用计算机可求得其线性回归方程为:(1)试说明模型的拟合效果 ,(2)算出各样本点的残差,(3)作出残差图,并进行分析。 解:(1)因为相关指数,比较接近1,所以该模型拟合效果好。(2)列表如下:123458010511011513518.42221.624.829.217.5122.4223.4024.3828.300.89-0.42-1.80.420.9(3)残差图如下:根据图像我们观察到第3个样本点残差较大,可能在采集中存在有误,应该进一步检查数据是否有误。反馈练习11993年到2002年中国的国内生产总值(GDP)的数据(单位:亿元)如下:年份GDP199334634.4199446759.4199558478.1199667884.6199774462.6199878345.2199982067.5200089468.1200197314.82002104790.6(1)作GDP和年份的散点图,根据该图猜想他们之间的关系应是什么?(2)建立年份为解释变量,GDP为预报变量的回归模型,并计算残差. (3)根据你得到的模型,预报2003年的GDP,看看你的预报与实际GDP(117251.9亿元)的误差是多少.(3)你认为这个模型能较好地刻画GDP和年份的关系吗?说说你的理由.解:(1)散点图如下:(2)列表如下:123451993199419951996199734634.446759.458478.167884.674462.66902635993238244116663810135497662148701812397204939760363980025398401639880096789101998199920002001200278345.282067.589468.197314.8104790.6156533710164052933178936200194726914.820979078139920043996001400000040040014008004 , , 于是线性回归方程为:残差表如下:年份19931994199519961997残差-6422.269-1489.2383037.4935252.0244638.055年份19981999200020012002残差1328.685-2140.984-1932.353-1277.622-993.791(3)当为2003时,根据国家统计局2004年的数据,2003年实际GDP为117251.9,所以预报与实际相差-4275.540(4)上面建立的回归方程的说明年份能够解释约97%的GDP值的变化,因此所建立的模型能够很好地刻画GDP和年份的关系。三、总结提升本节小结1本节学习了哪些内容?答:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.2分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.学习评价一、自我评价 你完成本节导学案的情况为( )A很好 B较好 C 一般 D较差二、当堂检测1. 两个变量 y与x的回归模型中,分别选择了 4 个不同模型,它们的相关指数 如下 ,其中拟合效果最好的模型是( ).A. 模型 1 的相关指数为 0.98 B. 模型 2 的相关指数为 0.80C. 模型 3 的相关指数为 0.50D. 模型 4 的相关指数为 0.252.若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_50_ 回归平方和为_50_课后作业1.为了了解某地母亲身高x与女儿身高y的相关关系,现随机测得10对母女身高如下:母亲身高x(cm)159160160163159154159158159157女儿身高y(cm)158159160161161155162157162156(1)对变量y与x进行相关性的检验;(2)如果y与x具有相关关系,求回归直线方程;(3)计算各组残差,并计算残差平方和;(4)试说明母亲身高对女儿身高的影响占百分之几。解:(1)散点图如下:(2)123451591601601631591581591601611612512225440256002624325599252812560025600265692528167891015415915815915715516215716215623870257582480625758244922371625281249642528124649 , , (3)残差表如下:12345678910159160160163159154159158159157158159160161161155162157162156159 160 160 162 159 155 159 158 159 158 -1.26 -1.04 -0.04 -1.38 1.74 -0.35 2.74 -1.48

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论