教育与心理统计线性回归_第1页
教育与心理统计线性回归_第2页
教育与心理统计线性回归_第3页
教育与心理统计线性回归_第4页
教育与心理统计线性回归_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、导入导入1、知识导入:相关关系、知识导入:相关关系因果关系因果关系 自变量与因变量自变量与因变量2、实例导入:、实例导入:(1)安徽省某中学为预测学生的高考作)安徽省某中学为预测学生的高考作文成绩,这个问题如何解决?文成绩,这个问题如何解决?(2)请问什么会影响亲子关系?怎样才)请问什么会影响亲子关系?怎样才能知道你所认为的这些因素到底是哪个能知道你所认为的这些因素到底是哪个因素在影响亲子关系呢?因素在影响亲子关系呢? 在许多领域,包括心理学与教育的在许多领域,包括心理学与教育的实际研究中,常常会遇到彼此有关系的实际研究中,常常会遇到彼此有关系的两列或多列变量。回归分析是探讨变量两列或多列变量

2、。回归分析是探讨变量间数量关系的一种常用统计方法。它通间数量关系的一种常用统计方法。它通过建立变量间的数学模型对变量进行预过建立变量间的数学模型对变量进行预测和控制。测和控制。第一节第一节 线性回归模型的建立方法线性回归模型的建立方法 通过大量的观测数据,可以发现变通过大量的观测数据,可以发现变量之间存在的统计规律性,并用一定的量之间存在的统计规律性,并用一定的数学模型表示出来,这种用一定模型来数学模型表示出来,这种用一定模型来表示变量相关关系的方法就称为回归分表示变量相关关系的方法就称为回归分析。一次函数是变量之间存在的各种各析。一次函数是变量之间存在的各种各样的关系模型中最简单的形式。对于

3、这样的关系模型中最简单的形式。对于这种线性关系的回归分析叫做线性回归。种线性关系的回归分析叫做线性回归。只有一个自变量的线性回归称作单线性只有一个自变量的线性回归称作单线性回归。回归。一、回归分析与相关分析的关系一、回归分析与相关分析的关系 回归分析和相关分析均为研究及度回归分析和相关分析均为研究及度量两个或两个以上变量之间关系的方法。量两个或两个以上变量之间关系的方法。回归分析是以数学方式表示变量间关系,回归分析是以数学方式表示变量间关系,相关分析则是检验或度量这些关系的密相关分析则是检验或度量这些关系的密切程度。如通过相关分析显示出变量间切程度。如通过相关分析显示出变量间的关系非常密切,则

4、通过所求得的回归的关系非常密切,则通过所求得的回归模型可获得相当准确的推算值。模型可获得相当准确的推算值。二、回归模型与回归系数二、回归模型与回归系数 用来表达变量间规律的数学模型就用来表达变量间规律的数学模型就称为回归模型。由于相关变量之间的规称为回归模型。由于相关变量之间的规律性有线性与非线性相关之分,所以,律性有线性与非线性相关之分,所以,回归模型分为线性和非线性回归模型,回归模型分为线性和非线性回归模型,即直线和曲线模型两种。按回归分析涉即直线和曲线模型两种。按回归分析涉及相关变量的数目,回归模型又可分为及相关变量的数目,回归模型又可分为简单回归和多重回归模型。简单回归和多重回归模型。

5、 在初等数学中,一次函数的标准形在初等数学中,一次函数的标准形式可写成式可写成YabX,表明每取一个,表明每取一个X值,值,就有一个惟一确定的值与之对应,做出就有一个惟一确定的值与之对应,做出图来是一条直线。但是在心理与教育等图来是一条直线。但是在心理与教育等许多领域的实际研究中,两个变量的关许多领域的实际研究中,两个变量的关系可能只呈直线趋势而不完全是直线系可能只呈直线趋势而不完全是直线。nX与与Y的关系实际不是直线,但是这些散的关系实际不是直线,但是这些散点的分布有着明显的直线趋势。如果每点的分布有着明显的直线趋势。如果每取一个取一个X值后,求出与之对应的值后,求出与之对应的Y的样本的样本

6、条件均数条件均数 ,则,则X与与 的对应关系可以用的对应关系可以用一直线表示,设这条直线的数学形式为一直线表示,设这条直线的数学形式为 =abX。这个方程叫回归方程,它代。这个方程叫回归方程,它代表表X与与Y的线性关系。式中的线性关系。式中X为自变量,为自变量,通常是研究者事先选定的数值;通常是研究者事先选定的数值; 叫做叫做对应于对应于X的的Y变量的估计值。常数变量的估计值。常数a表示表示该直线在该直线在Y 轴的截距;常数轴的截距;常数b表示该直线表示该直线的斜率,实际上也是的斜率,实际上也是 的变化率。在回的变化率。在回归分析中,归分析中,b叫做回归系数,确切说,在叫做回归系数,确切说,在

7、回归方程式中回归方程式中b应该叫做应该叫做Y对对X的回归系的回归系数。一般数。一般Y对对X的回归系数以的回归系数以bY.X表示。表示。YYYYYn三、回归模型建立方法三、回归模型建立方法n 建立回归模型实际上就是根据已知两变量建立回归模型实际上就是根据已知两变量的数据求回归方程。如果两个变量之间存在着的数据求回归方程。如果两个变量之间存在着线性关系,则两个变量间的关系就可以拟合直线性关系,则两个变量间的关系就可以拟合直线模型。回归模型的建立模型步骤一般包括:线模型。回归模型的建立模型步骤一般包括:根据数据资料作散点图,直观地判断两变量根据数据资料作散点图,直观地判断两变量之间是否大致成一种直线

8、关系。设直线方程之间是否大致成一种直线关系。设直线方程式为式为 =abX。如果估计值与实际值。如果估计值与实际值Y之间的之间的误差比其它估计值与实际值误差比其它估计值与实际值Y之间的误差小,之间的误差小,则这个表达式就是最优拟合直线模型,即表示则这个表达式就是最优拟合直线模型,即表示X与与Y之间线性关系的最佳模型。选定某种之间线性关系的最佳模型。选定某种方法,如平均数法、最小二乘法等,使用实际方法,如平均数法、最小二乘法等,使用实际数据资料,计算表达式中的数据资料,计算表达式中的a和和b。将。将a,b值代入表达式,得到回归方程。值代入表达式,得到回归方程。Yn(一)平均数方法(一)平均数方法n

9、如果只想从一组(如果只想从一组(X,Y)值中粗略地看)值中粗略地看看看X与与Y的简单线性关系,有时可以用平的简单线性关系,有时可以用平均数法建立回归方程来描述这种关系。均数法建立回归方程来描述这种关系。n例例10-1 n(二)最小二乘法(二)最小二乘法n如果想得到比较精确的回归方程,则常如果想得到比较精确的回归方程,则常用最小二乘法。所谓最小二乘法,就是用最小二乘法。所谓最小二乘法,就是如果散点图中每一点沿如果散点图中每一点沿Y轴方向到直线的轴方向到直线的距离的平方和最小,则在所有直线中这距离的平方和最小,则在所有直线中这条直线的代表性就是最好的,它的表达条直线的代表性就是最好的,它的表达式就

10、是所要求的回归方程。式就是所要求的回归方程。a b ;b n例102YX2()()()XXYYXX四、回归系数与相关系数的关系四、回归系数与相关系数的关系相关系数基本公式:相关系数基本公式:bY .X= ;bX.Y=r. ;相关系数是两个回归系数的几何平均(r )。22()XYXYYXXr N ssr N sssrN ssX X XYssY XX Ybb五、线性回归的基本假设五、线性回归的基本假设1线性关系假设线性关系假设 回归分析必须建立在变量之回归分析必须建立在变量之间具有线性关系的假设成立上。间具有线性关系的假设成立上。2正态性假设正态性假设 正态性的假设系指回归分析中正态性的假设系指回

11、归分析中的的Y服从正态分析。服从正态分析。3独立性假设独立性假设 独立性假设有两个意思。一个独立性假设有两个意思。一个是指与某一个是指与某一个X值对应的一组值对应的一组Y值和与另一个值和与另一个X值对应的一组值对应的一组Y值之间没有关系,彼此独立。值之间没有关系,彼此独立。另一个是指误差项目独立,不同的另一个是指误差项目独立,不同的X所产生的所产生的误差之间应相互独立,无自相关,而误差项也误差之间应相互独立,无自相关,而误差项也需与自变量需与自变量X相互独立。相互独立。4误差等分散性假设误差等分散性假设第二节第二节 回归模型的检验与估计回归模型的检验与估计 考虑这个模型是否有效?是否真正考虑这

12、个模型是否有效?是否真正反映了两个变量之间的线性关系?要对反映了两个变量之间的线性关系?要对它进行检验和评价。它进行检验和评价。 一、回归模型的有效性检验一、回归模型的有效性检验 回归模型的有效性检验是指对求得回归模型的有效性检验是指对求得的回归方程进行显著性检验,看是否真的回归方程进行显著性检验,看是否真实地反应了变量之间的线性关系。实地反应了变量之间的线性关系。(1)回归方程的显著性检验)回归方程的显著性检验 散点图中任意一点到散点图中任意一点到 的距离均可以的距离均可以分为两部分:一部分是该点到回归直线分为两部分:一部分是该点到回归直线的距离,另一部分是该点的估计值的距离,另一部分是该点

13、的估计值 到到 的距离。的距离。YYYnSST=SSR+SSE,即总平方和回归平方和误差平方和。nSST= = ;nSSR= = ;nSSE=SSTSSR;ndfT=N1;dfE=N2; dfR=dfT dfE=1;nMSR= ;MSE= ;F=n例1032()YY22()YYN2()YY2b22()XXNRRSSdfEES Sd fREMSMSn(2)回归系数的显著性检验)回归系数的显著性检验n 对于回归系数对于回归系数b进行显著性检验后,进行显著性检验后,如果如果b是显著的,同样也表明所建回归方是显著的,同样也表明所建回归方程是显著的,或说程是显著的,或说X与与Y之间存在显著的之间存在显著

14、的线性关系。线性关系。n注:回归方程方差分析表注:回归方程方差分析表n二、测定系数二、测定系数n 在回归方程的方差分析中曾指出,回归平方在回归方程的方差分析中曾指出,回归平方和对总平方和的贡献越大,说明回归方程越显和对总平方和的贡献越大,说明回归方程越显著,因而回归平方和在总平方和中所占的比例著,因而回归平方和在总平方和中所占的比例是评价回归效果的一个指标。这个比例越大回是评价回归效果的一个指标。这个比例越大回归效果越好,若这个比例达到归效果越好,若这个比例达到1,则表明此时,则表明此时Y的变异完全由的变异完全由X的变异来解释,没有误差。的变异来解释,没有误差。若比率为若比率为0,则说明,则说

15、明Y的变异与的变异与X无关,回归方无关,回归方程无效。程无效。nr2 = 就是说相关系数的平方等于回归平方和在总平方和中所占比例。如果r20.64,表明变量Y的变异中有64是由变量X的变异引起的,或说有64可以由X的变异解释。所以r2叫做测定系数。回归平方和至多等于总平方和,一般都小于总平方和。22()()YYYYRTS SS Sn第三节第三节 回归方程的应用回归方程的应用n 回归分析的目的,就是在测定自变量回归分析的目的,就是在测定自变量X与因变量与因变量Y的关系为显著相关后,借助的关系为显著相关后,借助于拟合的较优回归模型来预测在自变量于拟合的较优回归模型来预测在自变量X为一定值时因变量为一定值时因变量Y的发展变化。运用建的发展变化。运用建立的回归模型进行估计或预测,是它主立的回归模型进行估计或预测,是它主要的应用。要的应用。n 用样本回归方程进行预测或估计:回归用样本回归方程进行预测或估计:回归预测有点预测和区间预测两种。点预测预测有点预测和区间预测两种。点预测就是将确定的自变量就是将确定的自变量Xi值直接代入回归值直接代入回归模型,得到相应模型,得到相应Yi值。区间预测是以一值。区间预测是以一定的概率为保证,预测当自变量定的概率为保证,预测当自变量X取一定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论