回归分析的基本思想及初步应用(导学案)_第1页
回归分析的基本思想及初步应用(导学案)_第2页
回归分析的基本思想及初步应用(导学案)_第3页
回归分析的基本思想及初步应用(导学案)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、§1.1 回归分析的基本思想及其初步应用(导学案)编写人:谢文审核人:付双全班级姓名学习目标:1.了解回归分析的基本思想方法及其简单应用.2.会解释解释变量和预报变量的关系.3. 了解相关系数 r ,了解随机误差 , 会简单应用残差分析概念复习:复习1:对于一组具有线性相关关系的数据( x1 , y1),( x2 , y2 ),( x3, y3 ),L ,( xn , yn ).其回归直线方程的截距和斜率的最小二乘法估计公式分别为:( x, y) 称为样本点的中心。$_.$_.ba例 1、从某大学中随机选取8 名女大学生,其身高和体重的数据如图所示:编号12345科#网 Z#X#X#

2、K678身高 /cm165165157170175165155170体重 /kg4857505464614359(1) 画出以身高为自变量 x ,体重为因变量 y 的散点图(2) 求根据女大学生的身高预报体重的回归方程(3) 求预报一名身高为 172cm 的女大学生的体重课堂练习:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x (kg)92108115123130138145y (t)11.511.011.8

3、12.212.512.813.0若 x 与 y 之间线性相关,求蔬菜年平均产量y 与使用氮肥量x 之间的回归直线方程,并估计x=150kg 每单位面积蔬菜的年平均产量 .15215(已知 x 101, y 10.11,xi161,xi yi 16076.8 )i 1i1新知概念:思考:例 1 中,身高 172cm 女大学生,体重一定是60.316kg 吗?如果不是,其原因是什么?$0.849x 85.712$0.849 是斜率的估计值,说明身高x 每增加 1 个单位,体1 y对于 b重就,表明体重与身高具有的线性相关关系。2 如何描述线性相关关系的强弱?n( xix)( yiy)ri 1nnx

4、) 2y)2(xi( yii 1i1(1) r >0 表明两个变量正相关; ( 2) r <0 表明两个变量负相关;(3) r 的绝对值越接近1,表明相关性越强,r 的绝对值越接近0,表明相关性越弱。(4)当 r 的绝对值大于0.75 认为两个变量具有很强的相关性关系。3 身高172cm 的女大学生显然不一定体重是60.316kg,但一般可以认为她的体重接近于60.316kg.本点与回归直线的相互位置说明了这一点。所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表示ybxae$a 的误差, e 为随机变量, e 称为随机误差。e 是 y 与

5、y bx E ( e )=0 , De =2e 越小,预报真实值 y 的精度越高。>0.D随机误差是引起预报值$y 之间的误差之一。y 与真实值$ $a , b 的真实值之间存在误差,这种误差也引起$y 之 a, b 为截距和斜率的估计值,与y 与真实值间的误差之一。4 思考e 的原因是什么?产生随机误差项5 探究在线性回归模型中,$y 的误差,它是一个不可观测的量,那么应该怎e 是用 y 预报真实值样研究随机误差?如何衡量预报的精度? D (e)2eiyiyiyi$来衡量随机误差的大小。yi eiyibxia6 思考当样本容量为1 或 2 时,残差平方和是多少?用这样的样本建立的线性回

6、归方程的预报误差为0吗?7 残差分析n 2( yi2yi )判断原始数据中是否存在可疑数据;残差图相关指数R1i 1ny) 2( yii 1 R2 越大,残差平方和越小,拟合效果越好;R2 越接近 1,表明回归的效果越好。8 建立回归模型的基本步骤:确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量。画出确定好的解释变量和预报变量得散点图,观察它们之间的关系;由经验确定回归方程的类型;按一定规则估计回归方程中的参数;得出结果后分析残差图是否异常。练: 两个变量 y 与 x 的回归模型中,分别选择了4 个不同模型,它们的相关指数R2 如下,其中拟合效果最好的模型是()A模型 1的R20.9

7、8B 模型2的R20.80C模型 3的R20.50D模型 4的 R20.25例 随着我国经济的快速发展,城乡居民的审核水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查10 个家庭,得数据如下:家庭编号12345678910x 收入 (千元 )0.81.11.31.51.51.82.02.22.42.8y 支出千元0.71.01.21.01.31.51.31.72.02.5(1) 判断家庭平均收入与月平均生活支出是否相关?(2) 若二者线性相关,求回归直线方程。当堂练习1 山东鲁洁棉业公式的可按人员在7 块并排形状大小相同的试验田上对某棉花新品种进行施化肥量 x

8、对产量 y 影响的试验,得到如下表所示的一组数据(单位:kg)施化肥量 x15202530354045产量 y330345365405445450455( 1) 画出散点图;( 2) 判断是否具有相关关系2. 在对两个变量 x 、 y 进行线性回归分析时有下列步骤:对所求出的回归方程作出解释; 收集数据 ( xi , yi), i1,2,L,n ; 求线性回归方程; 求相关系数;根据所搜集的数据绘制散点图。如果根据可靠性要求能够作出变量x 、 y 具有线性相关结论,则在下列操作顺序中正确的是()ABCD3 三点( 3,10),(7, 20) ,(11,24)的线性回归方程为()$1.75x$1.75x$1.75x5.75A y 1.75x5.75 B y5.75 C y5.75 D y4.废品率 x0y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论