统计学第10讲相关与回归分析白含检验_第1页
统计学第10讲相关与回归分析白含检验_第2页
统计学第10讲相关与回归分析白含检验_第3页
统计学第10讲相关与回归分析白含检验_第4页
统计学第10讲相关与回归分析白含检验_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章相关与回归分析8.1相关与回归的基本概念8.2简单线性相关与回归分析8.3多元线性相关与回归分析(选讲)8.4非线性相关与回归分析统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第1页!学习目标1.变量间的相关关系与相关系数的计算2.总体回归函数与样本回归函数3.线性回归的基本假定4.简单线性回归参数的估计与检验5.常用的可以转换为线性回归的非线性函数6.非线性相关指数统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第2页!学习重点相关系数的计算相关分析与回归分析的联系与区别总体回归函数与样本回归函数线性回归的基本假定简单线性回归参数的估计与检验非线性相关指数统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第3页!学习难点总体回归函数与样本回归函数的联系与区别线性回归的基本假定简单线性回归参数的估计与检验常用的可以转换为线性回归的非线性函数统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第4页!10.1相关与回归的基本概念一、变量间的相互关系二、相关关系的类型三、相关分析与回归分析统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第5页!二、相关关系特点(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;当变量x取某个值的时候,变量y的取值可能有几个;(3)各观测点(x,y)分布在某条线的周围。xy统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第6页!三、相关关系的类型统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第7页!(1)线性相关。(2)非线性相关。2.按相关的形式划分统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第8页!(1)单相关(又称一元相关)。指两个变量之间的相互关系(2)复相关(又称多元相关)。指三个变量及以上变量之间的相互关系

例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。(3)偏相关。在某一变量与多个变量相关时,当假定其他变量不变,其中两个变量的相关关系。例如,在假定人们的收入水平、偏好等不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。4.按相关关系涉及的变量多少划分统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第9页!定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。四、相关关系的判断统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第10页!

例:为了研究分析某种产品完成量与其单位产品成本之间的关系,调查30个同类公司得到的原始数据如表。 整理后有统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第11页!销售收入与广告费相关图

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第12页!回归的现代意义一个因变量对若干解释变量依存关系的研究回归的目的(实质):

由固定的自变量去估计因变量的平均值样本总体自变量固定值估计因变量平均值统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第13页!相关分析与回归分析的关系联系:(1)共同的研究对象:都是对变量间相关关系的分析;(2)相关分析是回归分析的基础和前提。只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义;(3)相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析区别:(1)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是,相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要的方法(2)相关分析可以不必确定变量中哪个是自变量,哪个是因变量,而回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。(3)相关分析所涉及的变量可以都是随机变量。一般地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第14页!10.2简单线性相关与回归分析一、简单线性相关系数及检验二、总体回归函数与样本回归函数三、回归系数的估计四、简单线性回归模型的检验

五、简单线性回归模型预测统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第15页!●

样本相关系数样本相关系数通常用表示特点:样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,是对总体相关系数的估计,它是个随机变量。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第16页!(三)相关系数的计算统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第17页!结论:工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量x的变化能够解释工业总产值y变化的95.2﹪。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第18页!(五)相关系数的检验

1.为什么要检验?

样本相关系数是随抽样而变动的随机变量,相关系数的统计显著性还有待检验。2.检验的依据:

如果X和Y都服从正态分布,在总体相关系数的假设下,可采用t检验来确定变量之间相关关系的显著性。与样本相关系数r有关的t统计量服从自由度为n-2的t分布:

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第19页!【例】检验工业总产值与能源消耗量之间的线性相关性是否显著资料当成立时,则统计量统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第20页!(一)总体回归函数(PRF)

概念:将总体因变量Y的条件均值表现为自变量X的某种函数,这个函数称为总体回归函数(简记为PRF)。表现形式:(1)总体回归直线统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第21页!

(3)简单线性回归的基本假定假定1:误差项u是一个期望值为0的随即变量,即假定2:对于所有的X值,误差项ui的方差为常数

假定3:自变量是给定的变量,与随机误差项线性无关假定4:无自相关假定。随机误差项u的逐次值互不相关假定5:正态性假定。

随机误差项ui是无法直接观测,为进行回归分析,需对其概率分布进行假设。满足这些假设的模型称为标准的一元线性回归模型。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第22页!样本回归方程统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第23页!样本回归函数与总体回归函数的关系

(2)相互区别

●总体回归函数虽然未知,但它是确定的;样本回归线随抽样波动而变化,可以有许多条。●样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。●总体回归函数的参数虽未知,但是确定的常数;样本回归函数的参数可估计,但是随抽样而变化的随机变量。●总体回归函数中的是不可直接观测的;而样本回归函数中的是只要估计出样本回归的参数就可以计算的数值。

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第24页!最小二乘法(图示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)ei=yi-yi^统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第25页!

解方程组可得求解的标准方程如下:统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第26页!即线性回归方程为:计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第27页!(三)总体方差的无偏估计总体随机误差项的方差可以反映理论模型误差的大小,是检验模型时必须利用的一个重要参数。可以证明的无偏估计为:

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第28页!(一)拟合优度的度量回归直线对数据的拟合优度:样本观测值聚集在样本回归线周围的紧密程度。样本回归直线是对样本数据的一种拟合,不同估计方法可拟合出不同的回归线。如果各观测值数据的散点都聚集回归直线周围,那么这条直线对数据拟合效果就好,否则,拟合效果就差。通常用判定系数度量回归模型的拟合优度统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第29页!离差平方和的分解

(三个平方和的关系)两端平方后求和有:从图上看有:SST=SSR+SSE总变差平方和(SST){回归平方和(SSR){残差平方和(SSE){统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第30页!2.判定系数(可决系数R2)的特点(1)回归平方和占总离差平方和的比例:(2)反映回归直线的拟合程度(3)取值范围在[0,1]之间(4)R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差(5)判定系数等于相关系数的平方,即R2=(r)2统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第31页!思想:

是未知的,而且不一定能获得大样本,这时可用的无偏估计代替去估计参数的标准误差

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第32页!

回归系数显著性t检验的方法(1)提出假设一般假设:常用假设:(2)计算统计量(3)给定显著性水平α,确定临界值

(4)检验结果判断

若则拒绝原假设,而接受备择假设若则接受原假设,拒绝备择假设统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第33页!回归系数显著性的P值检验

——检验方法回归系数显著性的P值检验方法:

将所取显著性水平与P值对比

▲所取的显著性水平(例如取0.05)若比P值更大,就可在显著性水平下拒绝

▲所取的若小于P值,就应在显著性水平下接受

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第34页!(2)区间预测的个别值置信度为1-α的预测区间:统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第35页!8.3非线性相关与回归分析一、非线性回归的函数形式与估计方法二、非线性相关指数统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第36页!

非线性回归的函数形式(续)指数函数如可转换为线性函数双曲函数多项式函数共同特点:

虽然对于变量而言都是非线性的,但对于参数而言却是线性的可以转换为线性回归去估计其参数。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第37页!本章小结1.各种变量相互之间的依存关系:2.变量间的相关关系的程度用相关系数去度量3.回归分析的目的是要用样本回归函数去估计总体回归函数。4.线性回归的各项基本假定5.简单线性回归和最小二乘估计6.用可决系数去度量回归的拟合优度

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第38页!

第八章重要公式1.总体相关系数2.样本相关系数3.总体回归函数(PRF)4.样本回归函数(SRF)统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第39页!

第八章重要公式(续2)8.修正可决系数

9.t检验统计量10.F检验统计量11.置信度为的预测区间统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第40页!授课学时6学时统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第41页!

一、变量间的相互关系

◆确定性的函数关系Y=f(X)◆不确定性的统计关系—相关关系

相关关系是指变量之间存在一定的相依关系,但又不是确定的和严格依存的。Y=f(X,u)(u为随机变量)如广告费用(X)与销售收入(Y)之间的关系,居民的可支配收入(X)与居民的消费支出(Y)之间的关系◆没有关系

变量间关系的图形描述:坐标图(散点图)

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第42页!相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品的消费量(y)与物价(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系相关关系举例统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第43页!(1)不完全相关。介于完全相关与不相关之间(2)完全相关(函数关系)一个变量的变化完全由另一个变量的变化所确定(3)不相关两个变量的变化相互之间完全没有关系1.按相关的程度划分统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第44页!3.按相关的方向划分(1)正相关例如收入与消费的关系。(2)负相关例如物价与消费的关系。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第45页!相关关系的图示不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第46页!研究现象之间的依存关系的一种表格。首先要通过实际调查取得一系列成对数据作为相关分析的原始资料。然后将某一变量按其数值的大小顺序排列,再将与其相关的另一变量的对应值平行排列,即可得到简单的相关表。(一)相关表统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第47页!(二)相关图又称散点图,是以直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量相对应的成对数据用坐标点的形式描绘出来,用于反映两个变量之间相关关系的图形。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第48页!五、相关分析与回归分析回归的古典意义:

高尔顿遗传学的回归概念

父母身高与子女身高的关系:

无论高个子或低个子的子女都有向人的平均身高回归的趋势统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第49页!回归分析:是指对具有相关关系的变量,依据其关系性质,选择一个合适的数学模型(回归方程),用来近似地表示变量间数量平均变化关系的一种统计方法。回归分析按分析变量的多少可分为一元回归分析和多元回归分析;按分析变量间的表现形式可分为现性回归分析和非线性回归分析;统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第50页!六、回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第51页!一、简单线性相关系数及检验

(一)相关系数的定义

单相关分析是对两个变量之间的线性相关程度进行分析。线性相关程度可用●总体相关系数

特点:对于特定的总体来说,总体相关系数是客观存在的特定数值,表现为一个常数。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第52页!(二)相关系数的特点:

相关系数的取值在-1与1之间。当r=0时,表明X与Y没有线性相关关系,但可能存在其他类型关系。当时,表明X与Y存在一定的线性相关关系:

若表明X与Y为正相关若表明X与Y为负相关。当时,表明X与Y完全线性相关:若r=1,称X与Y完全正相关;若r=-1,称X与Y完全负相关。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第53页!序号能源消耗量(十万吨)x工业总产值(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计916625550862617537887【例】计算工业总产值与能源消耗量之间的相关系数统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第54页!(四)使用相关系数的注意事项:▲X和Y都是相互对称的随机变量,所以▲相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。▲相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于哪条直线。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第55页!3.相关系数的检验方法给定显著性水平,查自由度为n-2的临界值若,表明相关系数r在统计上是显著的,应否定而接受的假设;反之,若,应接受的假设。

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第56页!二、一元线性回归模型

若干基本概念●

Y的条件分布:Y在X取某固定值条件下的分布。●对于X的每一个取值,都有Y的条件期望与之对应,在坐标图上Y的条件期望的点随X而变化的轨迹所形成的直线或曲线,称为回归线。●如果把Y的条件期望表示为X的某种函数:,这个函数称为回归函数。●如果其函数形式是只有一个自变量的线性函数,如称为简单线性回归函数。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第57页!(2)总体一元线性回归模型统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第58页!(二)样本回归函数(SRF)概念:

●总体回归函数实际上是未知的,需要用样本的信息对其进行估计,根据样本数据拟合的直线,称为样本回归直线。其相应的函数称为样本回归函数(简记为SRF)。表现形式:线性样本回归函数可表示为

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第59页!(四)样本回归函数与总体回归函数的关系

(1)相互联系

●样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。●和是对总体回归函数参数的估计。●是对总体条件期望的估计●残差e在概念上类似总体回归函数中的随机误差u。回归分析的目的:用样本回归函数去估计总体回归函数。

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第60页!三、回归系数的最小二乘估计基本思想:回归分析主要任务是建立能够反映真实总体回归函数的样本回归函数。在用样本资料确定样本回归方程时,希望估计值偏离实际观测值的残差越小越好。可以取残差平方和作为衡量与偏离程度的标准—最小二乘准则

统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第61页!(一)回归系数的估计的最小二乘法公式

将Q对求偏导数,并令其等于零,可得:

加以整理后有:

设统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第62页!【例】建立工业总产值对能源消耗量的线性回归方程资料【分析】因为工业总产值与能源消耗量之间存在高度正相关关系(),所以可以拟合工业总产值对能源消耗量的线性回归方程。解:设线性回归方程为统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第63页!

(二)最小二乘估计的概率分布性质

和都是服从正态分布的随机变量,其期望为概率分布为统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第64页!

四、一元线性回归模型的检验

回归模型的参数(系数)估计出来后,必须对其进行检验。对回归系数的假设检验,是在对总体回归系数某种原假设成立的条件下,确定适当的统计量,在一定的显著水平下对原假设进行统计检验。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第65页!离差平方和的分解(图示)xyy{}}离差分解图1.判定系数的定义判定系数的定义是建立在对因变量总离差平方和分解的基础上统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第66页!离差平方和的分解

(三个平方和的意义)总的离差平方和(SST)反映因变量的n个观察值与其均值的总离差回归平方和(SSR)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和。残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第67页!

(二)回归系数显著性的t检验对回归模型的统计检验,除了对模型拟合程度的检验外,还包括各回归系数的显著性检验和对回归方程的总显著检验。在一元线性回归中,由于只有一个自变量,对各回归系数的显著性检验与对回归方程的总显著性检验实际是等价的,故这里只讨论对回归系数的显著性检验。检验目的是评价两个变量之间是否有关系,即变量X是否对变量Y有影响。统计学第10讲相关与回归分析白含检验共77页,您现在浏览的是第68页!

回归系数显著性的t检验(续)用估计的参数标准误差对估计的参数作标准化变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论