变量间的相关关系_第1页
变量间的相关关系_第2页
变量间的相关关系_第3页
变量间的相关关系_第4页
变量间的相关关系_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

变量间的相关关系1、相关关系的理解我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。生活中的任何两个变量之间是不是只有确定关系呢?如:学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。这就是我们这节课要共同探讨的内容 变量间的相关关系。例1、根据样本数据作出散点图,直观感知变量之间的相关关系。在研究相关关系前,先回忆一下函数的表示方法有哪些一一列表,画图象,求解析式。下面我们就用这些方法来研究相关关系。看这样一组数据:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,根据样本数据,人体的脂肪含量与年龄之间有怎样的关系?年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6结论:随着年龄增长,脂肪含量在增加。用x轴表示年龄,y轴表示脂肪。一组样本数据就对应着一个点。

2、散点图这个图跟我们所学过的函数图象有区别,它叫作散点图。3、判断正、负相关、线性相关:请观察这4幅图,看有什么特点?4图637 8 9 11-0. 0 0. 0. 0. 0. 1 1.图4图1呈上升趋势,图2呈下降趋势。这就像函数中的增函数和减函数。即一个变量从小到大,另一个变量也从小到大,或从大到小。对于图1中的两个变量的相关关系,我们称它为正相关。图2中的两个变量的相关关系,称为负相关。后面两个图很乱,前面两个图中点的分布呈条状。从数学的角度来解释:即图1、2中的点的分布从整体上看大致在一条直线附近。我们称图1、2中的两个变量具有线性相关关系。这条直线叫做回归直线。图3、4中的两个变量是非线性相关关系1、找回归直线下面我们再来看一下年龄与脂肪的散点图,从整体上看,它们是线性相关的。如果可以求出回归直线的方程,我们就可以清楚地了解年龄与体内脂肪含量的相关性。这条直线可以作为两个变量具有线性相关关系的代表。能否画出这条直线?多种方法展示总结:所有的点离这条直线最近的方案最好。从整体上看,各点与此直线的距离和最小。利用最小二乘法推导回归系数公式假设我们已经得到两个具有线性相关关系的变量的一组数据:(x,y)(x,y) (x,y)。当自变量%取x(i=1,2, ,n)时,可以得到11 2 2 nn iy=bxi+。(i=1,2,……,n),它与实际收集到的y,之间的偏差是yi-yi=y"(bx^+a)(i=1,2,……,n),这样用n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。总的偏差为E(y「y「,偏差有正有负,i=1易抵消,所以采用绝对值Ey.-yj,由于带绝对值计算不方便所以换成平方,i=1

n, 、2Q=£(y-y)=(y-bx-a)+(y-bx-a)2+(y-bx-a)2+・・・+(y-bx-a)2现在的问题就归ii1 1 2 2 3 3 nni=1结为:当a,b取什么值时Q最小。将上式展开、再合并,就可以得到可以求出将上式展开、再合并,就可以得到可以求出Q取最小值时2+£(2+£(x-X)2ii=1£(x-x)(y-y)iib—4=1 £(x-x)2ii=1£(x-x)(y-y)iiLi=1 £(x-x)2ii=1£(y-y)2

ii=14(x-x)(y4(x-x)(y-y)Jxy-nxyi i ii\o"CurrentDocument"b=4= =-i=1 -1£(x-x)2 £x2-nx2(其中x=n£x\o"CurrentDocument"i i i=1_i=L i=1a=y-bxy=1£y,)i=1推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫“最小二乘法”。3、求出回归直线方程,并分析它的意义利用最小二乘法就可以求出回归系数,进一步求出回归方程。下面我们具体操作一下。我们先明确几个符号的含义:x表示年龄,x是23,x是27,直到i 1 2工14工14是61。i从1到14, y,表示脂肪y是17.8。xy表示年龄与2 ii脂肪的成绩,x.2表示年龄的平方年龄脂肪239.52717.83921.24125.94527.54926.35028.25329.65430.25631.45730.85833.56035.26134.6Xi48.071 27.264286218.5529480.6729826.815211061.916811237.520251288.72401141025001568.828091630.829161758.431361755.6324919433364211236002110.6372119403.234181TOC\o"1-5"\h\zA1®表示自变量年龄的平均数,亍二1£y表示因变量脂肪的平均数,=1 i=1£X:表示自变量的平方和,£气七表示自变量与因变量乘积的和。要求出a,b,i=1 i=1必须先求出这些量。数学实验2:求出下列各式的值(n=14)y-1£y=

nii=1£xy=ii-y-1£y=

nii=1£xy=ii-i=1a=y-bx=x xni=1£一一£x-

xii=1^xy-nxy£x-

xii=1iib=4=1 £x2-nx2ii=1y=bx+a通过计算,求出了a—-0.448,b=0.5765 y=0.5765x-0.448求出回归直线方程有什么用呢?表格中选取年龄x的一个值代入上述回归直线的方程,看看得出的数据与真实数值之间的关系。y—0.5765x50-0.448—29.272估计值是29.272,与实际值28.2有偏差,为什么会出现这样的结果?回归直线是估计出的,把a带入肯定有误差。试预测某人37岁时,他体内的脂肪含量。并说明结果的含义。代入计算y—0.5765x37-0.448—20.882我们不能说他的体内脂肪含量的百分比一定是20.882%?只能说他体内的脂肪含量在20.90%,附近的可能性比较大。*4、利用相关系数判断线性相关程度非线性相关,直线不能很好地反映图中两个变量之间的关系。显然求回归直线的方程是没有意义的。有些变量线性相关,有些非线性相关,怎样衡量变量的线性相关程度呢?£危-孙V-3这时我们引入一个量:相关系数 , ,r= t £(气M)2£(厂亍)2*i=1 j=1注意它的符号:当r>0时,x,y正相关,当r<0时,x,y负相关,统计学认为:对于r,若re[-1,-0.75],那么负相关很强,若re[0.75,1],那么正相关很强,若rc(-0.75,-0.30]或了e【0.30,0.75),那么相关性一般,若re[-0.25,0.25],那么相关性较弱,5、线性回归方程具体如何应用线性回归方程为v=bx+a的求法:1(1) 先求变量x的平均值,既x=(x+x+x+——+x)TOC\o"1-5"\h\zn123 n(2) 求变量v的平均值,既V=L(y+V+V+•••+V)\o"CurrentDocument"n1 2 3 n(3) 求变量x的系数人,有两个方法£(x-x)(v-V)-人 i i .法1b=r (题目给出不用记忆)£(x-x)2ii=1

」(「无)(十顼)+(气-无)(。-V)+...+3广:)(上顼)](需理解并会代入数(X-X)2+(x-X)2+...+(x-X)21 2 n据)£(X-X)(V-V)-人 i i .法2b=十、 (题目给出不用记忆)£(X-X)2ii=1[xV+XV+...XV]-nX•V= 一二 土一二」,(这个公式需要自己记忆,稍微简单些)IX2+X2+...+X2-nX212 n(4)求常数a,既a=v-bx最后写出写出回归方程V=bx+a。可以改写为:v=bx-a(V与v不做区分)总结:函数关系与相关关系的区别?函数关系是一种确定性关系,£(函数关系是一种确定性关系,£(X-X)(y-y)ii回归公式b= £(X-X)2i

i=1回归分析的步骤?而相关关系是一种非确定性关系.£ —^xV-nxyii4=1 £"x2-nx2ii=1,一a=y-bx人

人 T .人y=bx+a回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据T作散点图T求回归直线方程T利用方程进行预报.4.回归直线的性质V=bx+ay=bx+a⑴回归直线' 过样本点的中心&V)其中解释变量乂的平均数为:X=1亏预报变量¥的平均数为:y=1£V=1 i=1一、⑵回归直线的斜率的估计值b的意义:

...・•.・一 ■、一・... .. 人■、一一解释变量X每增加一个单位,预报变量y就增加b个单位.例:已知x,j之间的一组数据:X0123j1357求j与x的回归方程:解:(1)先求变量x的平均值,既X=4(0+1+2+3)=1.51(2)求变量j的平均值,既j=4(1+3+5+7)=4K一无)(jiK一无)(jiTOC\o"1-5"\h\z—顼)+(*2—X)(J2—刃+电—X)(J3—J)+(X^ZX)(J4—Jr(X—X)2+(X—X)2+(X—X)2+(X—X)2L1 2 3 4 」(0—1.5)(1—4)+(1—1.5)(3—4)+(2—1.5)(5—4)+(3—1.5)(7—4)5 f= =; =—[(0—1.5)2+(1—1.5)2+

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论