第九章相关与回归课件_第1页
第九章相关与回归课件_第2页
第九章相关与回归课件_第3页
第九章相关与回归课件_第4页
第九章相关与回归课件_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章线性回归.

已知高考成绩与大一成绩相关,并能用高考成绩预测大一成绩.现有11人的高考数学成绩与大学高数成绩,请根据以下数据预测高考成绩为110分的学生,高数成绩95%的可能会为多少?1234567891011X130951041209811013012010012595Y9586829074869688769270?.主要内容第一节:线性回归模型的建立方法第二节:回归模型的检验与估计第三节:回归方程的应用.线性回归模型的建立方法.一、回归分析的概念是根据一个已知变量来预测另一个变量平均值的统计方法。是在相关分析的基础上,将变量之间的具体变动关系模型化,求出关系方程式的方法..回归分析的种类一元回归(简单回归)多元回归(复回归)线性回归非线性回归一元线性回归SimpleLinearregression按自变量的个数⒈按回归曲线的形态⒉.二、相关分析与回归分析联系:理论和方法一致,确定变量之间是否存在关系是两者的共同起点。大小方向一致:无相关就无回归,相关程度越高,回归越好;相关系数和回归系数方向一致,可以互相推算。相关分析是回归分析的基础和前提。回归分析是相关分析的深入和继续..区别方向不同:回归有自变量和因变量的区分,相关无因变量和自变量的区分。大小变化不同:相关分析只能计算出变量间的相关系数,改变x和y的地位不影响相关系数的数值;回归分析则不同,可以根据研究目的不同分别建立两个不同的回归方程。.变量要求不同:相关分析中x、y均为随机变量,回归分析中y为随机变量,x可以是随机变量也可以不是随机变量,一般假定为非随机变量。作用不同:相关分析测定相关程度和方向,回归分析进行预测和控制。.三、回归模型、回归方程与回归系数回归模型:用来近似地表达变量间平均变化关系的数学模型。回归方程:描述两变量函数关系的方程

.一元线性回归方程的几何意义截距斜率截距a表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单位,因变量y平均变动b个单位。.回归系数y对x的回归系数x对y的回归系数.一元线性回归方程的可能形态b为正b为负b为0.四、回归模型建立方法根据已知两变量的数据求回归方程,如果两变量之间存在直线关系,则两变量可以拟合直线模型。.回归模型的建立步骤

将a与b值代入方程式,得到回归方程。根据资料作散点图,直观判断有无线性关系设直线方程式为计算a与b值.计算a与b值的方法

平均数法、最小二乘法、极大似然估计法。但平均数法只用于粗略估计两变量之间的简单线性关系,而极大似然估计要求正态分布,而最小二乘法对分布没有要求。.

最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小来求得a值和b值的方法用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。它的原理是使用误差平方和最小。.xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^最小二乘法

(图示).基本数学要求:.整理后,有:.原始数据.【例1】下表中10对数据是为确定其心理量与物理量之间的关系而作的实验结果。假设两者呈线性关系,试以这10对数据建立该心理量与物理量的回归方程。被试12345678910心理(Y)1233456789物理(X)0215426257解:设.

回归方程为:答:所求的回归方程为.回归与相关的关系?.课堂练习请根据例一的数据,用相关法建立回归方程.五、线性回归的基本假设

线性关系假设:图示法。正态性假设:与某一X值对应的一组Y值构成变量Y的一个子总体,所有子总体都服从正态分布,各子总体方差均相等。经由回归方程所分离的误差项e也呈正态分布,其平均数为0。.一元线性回归模型的假定.独立性假设。某一X值对应的一组Y值和另一个X值对应的一组Y值之间没有关系,彼此独立。其二是误差项独立,即不同的X所产生的误差之间应相互独立,误差项也与自变量X相互独立。误差等分散性假设。特定X水平的误差,除了应呈随机化的常态分布,其变异量也应相等,称为误差等分散性。.第二节:线性回归模型的

检验与估计.一、回归模型的有效性检验二、回归系数的有效性检验.

回归模型的有效性检验就是对求得的回归方程进行显著性检验,看是否真实地反映了变量间线性关系。回归方程的总体检验判定通常使用方差分析的思想与方法。.回归方程的总体检验误差平方和回归平方和总平方和.平方和与自由度的分解.回归方程方差分析表变异来源自由度平方和均方F回归1残差N-2总计N-1.【2】对例1数据所建立的回归方程进行检验

..变异来源自由度平方和均方F回归131.75531.7556.63*残差838.3454.793总计970.1表2方差分析表答:所建立的回归方程显著,或者说X与Y变量之间有显著的线性关系。.二、回归系数的有效性检验

的抽样分布.(二)回归系数的标准误.【例3】对例一建立的回归方程的回归系数进行显著性检验。解:答:回归系数0.81是显著的,因而回归方程显著。.三、测定系数测定系数是指回归平方和在总平方和中所占比例,也就是Y变量能用另一个变量来解释的部分。.测定系数意义回归平方和占总离差平方和的比例反映回归直线的拟合程度取值范围在[0,1]之间,说明回归方程拟合得越好;,说明回归方程拟合得越差判定系数等于相关系数的平方,即.(二)测定系数与相关系数的区别判定系数无方向性,相关系数则有方向,其方向与样本回归系数b相同;判定系数说明变量值的总离差平方和中可以用回归方程解释的比例,相关系数只说明两变量间关联程度及方向;相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。.第三节:回归方程的应用一、预测的意义预测是将已知变量值作为自变量代入相应的回归方程而推算出另一个变量的估计值及置信区间统计方法。.点估计将X值代入回归方程,直接计算得到的值作为Y变量的点预测值。.【例4】:下表是20名工作人员的智商和某一次技术考试成绩,根据这个结果求出考试成绩对智商的回归方程。如果有一个为工作人员的智商为120,请估计若他参加考试,将会得多少分?可能在什么区间?(数据见书379).,,设.代入回归方程,则将答:如果智商为120的技术人员参加此次考试,将得80.5分。.区间估计.1)预测的标准误≈1.2)预测的置信区间.【例5】请计算例4的置信区间答:如果智商为120的技术人员参加此次考试,得分有95%的可能在92.1424~68.8576之间。.三、回归分析过程

绘制散点图、判断有无线性关系建立回归方程回归方程显著性检验、测定系数计算回归分析标准误预测.四、回归分析要注意的问题是一种分析因果关系的方法,但不是用回归的方法计算的就是因果关系。要分析一个事物的因果关系只能借助实验设计。一种回归模型只有在当初抽取样本的同一范围内应用才有效,如果范围变了,则应当另建回归模型。若变量之间不存在相关关系,不要刻意去寻求两变量间的某种关系,这样毫无意义。.课堂练习从某班随机抽取10名学生,测量其智力水平与数学成就测验的成绩,现有一名学生智商分数为120的学生没有参加成就测验,请根据智商预测其成就测验的分数可能为多少?被试12345678910智商X951041209811013012010012595成绩Y75829074

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论