版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、选修1-2回归分析的基本思想及其初步应用课件问题问题1 1:正方形的面积正方形的面积y y与正方形的边长与正方形的边长x x之间之间 的的函数关系函数关系是是y = xy = x2 2确定性关系确定性关系问题问题2 2:某水田水稻产量某水田水稻产量y y与施肥量与施肥量x x之间是否之间是否 -有一个确定性的关系?有一个确定性的关系?例如:例如:在在 7 7 块并排、形状大小相同的试验田块并排、形状大小相同的试验田上上 进行施肥量对水稻产量影响的试验,得到进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:如下所示的一组数据:施化肥量施化肥量x x 15 20 25 30 35 40 45
2、 15 20 25 30 35 40 45水稻产量水稻产量y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455复习、变量之间的两种关系复习、变量之间的两种关系导自学思考:自学思考:1.相关关系的概念?你能举例说明吗?2.如何分析两个变量之间的相关关系?思、议自变量取值一定时,因变量的取值带有一定随自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做机性的两个变量之间的关系叫做相关关系相关关系。1 1、定义:、定义: 1 1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量
3、进行对具有相关关系的两个变量进行统计分析的方法叫统计分析的方法叫回归分析回归分析。2 2):):思、议、展2 2、现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。探索:水稻产量探索:水稻产量y y与施肥量与施肥量x x之间大致有何之间大致有何规律?规律?思、议、展10 20 30 40 5010 20 30 40 50500500450450400400350350300300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2 2:在这些点附近可画直线不止一条,:在这些点附近可画直线不止一条, 哪条直线最能代表哪条直线最能代表x x与与y
4、 y之间的关系呢?之间的关系呢?x xy y施化肥量施化肥量水稻产量水稻产量施化肥量施化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40 45水稻产量水稻产量y y 330 345 365 405 445 450 455 330 345 365 405 445 450 455散点图散点图10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻产量水稻产量n n2 2i ii ii i= =1 1Q Q( (a a, ,b b) )= =( (y y - -b bx x - -a a) ) 取取最最小小值值时时, ,a a, ,
5、b b的的值值. .推推导导过过程程请请阅阅读读P P9 92 2iiii(x ,y )(x ,y )i ii i(x ,y )(x ,y )|i ii i| |y y - -y y思、议、展最小二乘法:最小二乘法: y = bx+a(x,y)(x,y)称为样本点的中心称为样本点的中心。n n( (x x- - x x) )( (y y- - y y) )i ii ii i= =1 1b b = =n n2 2( (x x- - x x) )i ii i= =1 1a a = = y y - - b bx x. .n nn n1 11 1其其 中中 x x = =x x , ,y y = =y
6、 y . .i ii in nn ni i= =1 1i i= =1 1n niiiii=1i=1n n2 22 2i ii=1i=1x y -nxyx y -nxy=,=,x-nxx-nx思、议、展3 3、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性线性回归分析回归分析。2 2、回归直线方程:、回归直线方程:n nn ni ii ii ii ii i= =1 1i i= =1 1n nn n2 22 22 2i ii ii i= =1 1i i= =1 1( (x x - -x x) )( (y y - -y y) )x x- -n nx xy yb b = = =, ,(
7、 (x x - -x x) )x x - -n nx xa a = = y y- -b bx xy y2.2.相应的直线叫做相应的直线叫做回归直线回归直线。1 1、所求直线方程、所求直线方程 叫做叫做回归直回归直 -线方程线方程;其中;其中 y = bx+ay = bx+a思、议、展相关系数相关系数 1.1.计算公式计算公式 2 2相关系数的性质相关系数的性质 (1)|r|1(1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,相关程度越大;,相关程度越大;|r|r|越接越接近于近于0 0,相关程度越小,相关程度越小 问题:达到怎样程度,问题:达到怎样程度,x x、y y线性相关呢?
8、它线性相关呢?它们的相关程度怎样呢?们的相关程度怎样呢?n ni ii ii i= =1 1n nn n2 22 2i ii ii i= =1 1i i= =1 1( (x x - - x x) )( (y y - - y y) )r r = =( (x x - - x x) )( (y y - - y y) )思、议、展负相关负相关正相关正相关n n(x -x)(y -y)(x -x)(y -y)iiiii=1i=1r=r=nnnn2222(x -x) (y -y)(x -x) (y -y)iiiii=1i=1i=1i=1相关系数相关系数正相关;负相关通常,正相关;负相关通常, r r-1,
9、-0.75-0.75-负相关很强负相关很强; ; r0.75,1正相关很强正相关很强; r-0.75,-0.3-负相关一般负相关一般; ; r0.3, 0.75正相关一般正相关一般; r r-0.25, 0.25-0.25-相关性较弱相关性较弱; ; 思、议、展10 20 30 40 5010 20 30 40 50500500450450400400350350300300 xy施化肥量施化肥量水稻产量水稻产量施化肥量施化肥量x x 15 20 25 30 35 40 45 15 20 25 30 35 40 45水稻产量水稻产量y y 330 345 365 405 445 450 455
10、 330 345 365 405 445 450 455解解: 1.画出散点图画出散点图2.求出求出b b = = 4 4. .7 75 5, , a a = = 2 25 56 6. .7 79 93.写出回归方程写出回归方程 y y = = 4 4. .7 75 5x x+ +2 25 56 6. .7 79 94.计算相关系数计算相关系数r = 0.9718r = 0.9718例题例题1 1 从某大学中随机选出从某大学中随机选出8 8名女大学生,其身名女大学生,其身高和体重数据如下表:高和体重数据如下表:编号编号1 12 23 34 45 56 67 78 8身高身高1651651651
11、65157157170170175175165165155155170170体重体重48485757505054546464616143435959求根据一名女大学生的身高预报她的体重的求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为回归方程,并预报一名身高为172172的女的女大学生的体重。大学生的体重。思、议、 y = 0.849x-85.172y = 0.849x-85.172分析:由于问题中分析:由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量身高172cm女大学生体重身高172cm女大学生体重y
12、 = 0.849172-85.712 = 60.316(kg)y = 0.849172-85.712 = 60.316(kg)3.通过探究栏目引入通过探究栏目引入“线性回归模型线性回归模型”。此处可以引。此处可以引导学生们体会函数模型与回归模型之间的差别。导学生们体会函数模型与回归模型之间的差别。(2 2)从散点图还可以看到,样本点散布在某一条)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次直线的附近,而不是一条直线上,所以不能用一次函数来描述它们之间的关系。这时我函数来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:们用下面的线性回
13、归模型来描述身高和体重的关系:+ +其中和为模型的其中和为模型的未知参数未知参数,e e是是y y与与 之间的误差之间的误差, ,通常通常称为称为随机误差随机误差。 y2 2它它的的均均值值E E( (e e) )= = 0 0, ,方方差差D D( (e e) )= = 0 0(1 1)由图形观察可以看出,样本点呈条状分)由图形观察可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。此可以用线性回归方程刻画它们之间的关系。 y y线性回归模型线性回归模型 + +2 2E E( (e e) )= = 0
14、 0, , D D( (e e) )= = y+ +其中和为模型的其中和为模型的未知参数未知参数,e e是是y与与 之间的误差之间的误差,通常通常称为称为随机误差随机误差。为了衡量预报的精度为了衡量预报的精度, ,需要估计的需要估计的2 2值值? ?(1, 2,. )iiiiiiybxa inyyybxaiiiii随 机 误 差 e其 估 计 值 为 : ee 称 为 相 应 点 (x ,y )的 残 差22111(,)(2)22(,)niieQ a bnnnQ a b类 比 样 本 方 差 估 计 总 体 方 差 的 思 想称 为 残 差 平 方 和21( ,)()niiiQyx (1 1)
15、根据散点图来粗略判断它们是否线性相关。)根据散点图来粗略判断它们是否线性相关。(2 2)是否可以用线性回归模型来拟合数据)是否可以用线性回归模型来拟合数据(3 3)通过残差)通过残差 来判断模型拟合的效来判断模型拟合的效 果这种分析工作称为果这种分析工作称为残差分析残差分析1, 2, 3, .ne e ee 使学生了解残差图的制作及作用。使学生了解残差图的制作及作用。P98P98坐标纵轴为残差变量,横轴可以有不同的选择;坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,若模型选择的正确,残差图中的点应该分布在以残差图中的点应该分布在以横轴为心的带形区域;横轴为心的带形区域;对于远离横
16、轴的点,要特别注意对于远离横轴的点,要特别注意。 错误数据 模型问题身高与体重残差图异常点 y y+ +其中和为模型的其中和为模型的未知参数未知参数,e e是是y y与与 之间的误差之间的误差, ,通常通常称为称为随机误差随机误差。2 2E E( (e e) )= = 0 0, , D D( (e e) )= =+ +n nn ni ii ii ii ii i= =1 1i i= =1 1n nn n2 22 22 2i ii ii i= =1 1i i= =1 1( (x x - -x x) )( (y y - -y y) )x x- -n nx xy yb b = = =, ,( (x x
17、 - -x x) )x x - -n nx xa a = = y y- -b bx xy y所求直线方程所求直线方程 叫做叫做回归直线方程回归直线方程;其中其中 y = bx+ay = bx+a线性回归模型线性回归模型思、议、展预报精度预报精度1.相关指数相关指数R22.残差残差e n nn n2 22 2i ii ii i2 2i i= =1 1i i= =1 1n nn n2 22 2i ii ii i= =1 1i i= =1 1( (y y - -y y ) )( (y y - -y y) )R R = =1 1- -= =( (y y - -y y) )( (y y - -y y)
18、)在含有一个解释在含有一个解释变量的线性变量的线性 模型模型中中R2=r2(相关关系相关关系)判断判断x xi i确定差异确定差异百分数百分数随机误差随机误差 , ,它的估计值为它的估计值为 . .e = y-ye = y-ye = y-ye = y-y 对于样本点对于样本点 它们随机误它们随机误差的估计值差的估计值 称相应残差称相应残差.1 11 12 22 2n nn n( (x x , ,y y ) ), , ( (x x , ,y y ) ), , , ( (x x , ,y y ) )i ii iiiiiiie = y -y = y -bx -ae = y -y = y -bx -a
19、 n n2 22 2i ii ii i= =1 11 11 1 = =( (y y - -b bx x - -a a) ) = =Q Q( (a a, ,b b) )( (n n 2 2) )n n- -2 2n n- -2 2方差方差1)1)衡量预报精度衡量预报精度2)2)确定样本的异常点确定样本的异常点. .思、议、展1)1)确定解释变量和预报变量确定解释变量和预报变量; ; 2)2)画出散点图画出散点图; ; 3)3)确定回归方程类型确定回归方程类型; ; 4)4)求出回归方程求出回归方程; ; 5)5)利用相关指数或残差进行分析利用相关指数或残差进行分析. .建立回归模型的基本步骤建立
20、回归模型的基本步骤问题:问题:一只红铃虫的产卵数一只红铃虫的产卵数y与温度与温度x有关有关,现收现收集了集了7组观测数据组观测数据,试建立试建立y与与x之间的回归方程之间的回归方程 解解:1):1)作散点图作散点图; ;从散点图中可以看出产卵数和温度之间的关系并不能从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。在一条指数曲线或二次曲线的附近。思、议、检解解: : 令令 则则z=bx+a,(a=lncz=bx+a,(a=lnc1 1,b=c,b=c2 2),),列出变换后数
21、据表并列出变换后数据表并画画 出出x x与与z z 的散点图的散点图 z =lnyz =lnyx和z之间的关系可以用线性回归模型来拟合z = ax+b+ez = ax+b+e2 2c xc x1 1用用y = c e模y = c e模型型; ;1)x x2121232325252727292932323535z z1.9461.946 2.3982.398 3.0453.045 3.1783.1784.194.194.7454.745 5.7845.784思、议、检2) 2) 用用 y=cy=c3 3x x2 2+c+c4 4 模型模型, ,令令 , ,则则y=cy=c3 3t+ct+c4 4
22、 , ,列出列出变换后数据表并画出变换后数据表并画出t t与与y y 的散点图的散点图 2 2t t = = x x散点并不集中在一条直线的附近,因此用线散点并不集中在一条直线的附近,因此用线性回归模型拟合他们的效果不是最好的。性回归模型拟合他们的效果不是最好的。t t44144152952962562572972984184110241024 12251225y y7 71111212124246666115115325325思、议、检( (1 1) )0 0. .2 27 72 2x x- -3 3. .8 84 43 3( (2 2) )2 2y y= = e e, ,y y= = 0 0. .3 36 67 7x x - -2 20 02 2. .5 54 4( (1 1) )( (1 1) )0 0. .2 27 72 2x x- -3 3. .8 84 43 3i ii ii i( (2 2) )( (2 2) )2 2i ii ii ie e= = y y - -y y= = y y - -e e, , ( (i i = =1 1, ,2 2. . . .7 7) )e e= = y y - -y y= = y y - -0 0. .3 36
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 丰子恺杨柳课件
- 孟子成语 课件
- 第二单元(复习)-二年级语文上册单元复习(统编版)
- 西京学院《融媒体新闻编辑》2023-2024学年第一学期期末试卷
- 西京学院《剧本创作》2021-2022学年第一学期期末试卷
- 西京学院《工程定额原理》2021-2022学年第一学期期末试卷
- 西华师范大学《语文学科教学论》2023-2024学年第一学期期末试卷
- 《画世界名画》少儿美术教育绘画课件创意教程教案
- 西华师范大学《数学物理方法》2021-2022学年第一学期期末试卷
- 西华师范大学《软件及应用》2022-2023学年期末试卷
- 国家安全教育国土安全
- HGT 4095-2023 化工用在线气相色谱仪 (正式版)
- 名校课堂七年级上数学人教版电子版
- 液气胸的护理查房
- 工商管理职业规划
- 售前解决方案部门管理规章制度
- 创新智能家居行业的创业计划书2
- 《劳动》五年级下册教学课件 8 皮影的制作
- 船用柴油机行业报告
- 消防安全知识竞赛幼儿园
- 《成功八步》课件
评论
0/150
提交评论