统计学课件相关与回归分析课件_第1页
统计学课件相关与回归分析课件_第2页
统计学课件相关与回归分析课件_第3页
统计学课件相关与回归分析课件_第4页
统计学课件相关与回归分析课件_第5页
已阅读5页,还剩179页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2022/12/221第八章相关与回归分析第一节相关与回归分析的基本概念

第三节

一元线性回归分析

第四节

多元线性回归分析

【学习目标】通过对本章的学习,重点掌握回归分析的估计和检验方法;掌握相关分析的种类及三种相关系数的计算方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算及其检验;多元线性回归分析。第五节

非线性回归分析

第二节

相关分析

第1页/共92页2022/12/201第八章相关与回归分析第一节相关与2022/12/222第一节相关与回归分析的基本概念

(一)函数关系

一、相关关系与函数关系

第八章相关与回归分析

函数关系是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。第2页/共92页2022/12/202第一节相关与回归分析的基本概念2022/12/223第一节相关与回归分析的基本概念

(二)统计关系

一、相关关系与函数关系

第八章相关与回归分析统计关系不同于函数关系,当重复观测时,观测点不是完全落在统计关系曲线上,而是围绕统计关系曲线散布。统计关系可以表示为确定部分和随机性部分二者之和,这是回归分析的基础。相关关系因果关系第3页/共92页2022/12/203第一节相关与回归分析的基本概念2022/12/224案例分析相关关系与因果关系一家研究机构有一项惊人的发现:统计数据显示,脚长的儿童拼写能力比脚短的儿童强。原来他们调查的是一群年龄不同的儿童,脚长的儿童比脚短的儿童年龄大!赶快回去量一下儿子的脚长我要把脚拉长一点!第4页/共92页2022/12/204案例分析相关关系与因果关系一家研究机构2022/12/225⒈按涉及变量的多少分为相关关系的种类⒉按照表现形式不同分为⒊按照变化方向不同分为直线相关曲线相关负相关正相关二、相关分析的种类复相关单相关偏相关第八章相关与回归分析第5页/共92页2022/12/205⒈按涉及变量的多少分为相关关系的种类⒉2022/12/2264.按相关的程度分为相关关系的种类5.按变量之间因果关系的方向分为完全相关不完全相关不相关双向因果相关单向因果相关虚假相关第八章相关与回归分析第6页/共92页2022/12/2064.按相关的程度分为相关关系的种类52022/12/227第一节相关与回归分析的基本概念

第八章相关与回归分析三、相关分析与回归分析

回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的依赖关系。

相关分析是测度两个变量之间的线性关联度的,并用一些指数(相关系数)表示相关程度。

第7页/共92页2022/12/207第一节相关与回归分析的基本概念第八2022/12/228第一节相关与回归分析的基本概念

第八章相关与回归分析三、相关分析与回归分析

相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。区别:第8页/共92页2022/12/208第一节相关与回归分析的基本概念第八2022/12/229第一节相关与回归分析的基本概念

第八章相关与回归分析三、相关分析与回归分析联系:

相关分析是回归分析的基础和前提。回归分析是相关分析的深入和继续。第9页/共92页2022/12/209第一节相关与回归分析的基本概念第八2022/12/2210第一节相关与回归分析的基本概念

第八章相关与回归分析四、相关表与相关图(一)简单相关表

将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。第10页/共92页2022/12/2010第一节相关与回归分析的基本概念第2022/12/2211第一节相关与回归分析的基本概念

第八章相关与回归分析

企业编号月产量(千吨)X生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用第11页/共92页2022/12/2011第一节相关与回归分析的基本概念第2022/12/2212第一节相关与回归分析的基本概念

第八章相关与回归分析四、相关表与相关图

(二)分组相关表

单变量分组表双变量分组表三变量分组表。第12页/共92页2022/12/2012第一节相关与回归分析的基本概念第2022/12/2213第一节相关与回归分析的基本概念

第八章相关与回归分析

1.单变量分组表

表某纺织厂工人看管织机台数和时劳动生产率相关表第13页/共92页2022/12/2013第一节相关与回归分析的基本概念第2022/12/2214第一节相关与回归分析的基本概念

第八章相关与回归分析

2.双变量分组表

表居住时间与对百货商场的熟悉程度的双变量分组表第14页/共92页2022/12/2014第一节相关与回归分析的基本概念第2022/12/2215第一节相关与回归分析的基本概念

第八章相关与回归分析

3.三变量分组表

假定对于某项私家车购买意向的调查,最初以教育水平和私家车拥有情况进行分析,对1000人调查的结果用二维列联表表示如:第15页/共92页2022/12/2015第一节相关与回归分析的基本概念第2022/12/2216第一节相关与回归分析的基本概念

第八章相关与回归分析

3.三变量分组表

表教育程度和私家车拥有状况的双变量分析第16页/共92页2022/12/2016第一节相关与回归分析的基本概念第2022/12/2217第八章相关与回归分析

从上表中可以看出,文化程度越高的人拥有私家车的比例越高,这和实际情况不太相符,于是我们引入收入变量,作三变量的交叉列表分析:教育程度、收入与私家车拥有状况的三变量分析

私家车拥有状况收入水平低收入高收入教育程度教育程度本科及以上本科以下本科及以上本科以下有没有20%(20)80%(80)20%(140)80%(560)40%(60)60%(90)40%(20)60%(30)列合计100%100%100%100%被调查者人数10070015050第17页/共92页2022/12/2017第八章相关与回归分析2022/12/2218正相关负相关曲线相关不相关xyxyxyxy第八章相关与回归分析(三)相关图第18页/共92页2022/12/2018正相关负相关曲线相关不相2022/12/2219第八章相关与回归分析

第二节相关分析一、简单相关系数及其检验(一)简单相关系数的定义

简单相关系数简称相关系数,是测量两个变量之间线性相关的方向和程度的指标。总体相关系数的表达式为:式中:

为变量X与变量Y的协方差

为变量Y的方差为变量X的方差第19页/共92页2022/12/2019第八章相关与回归分析2022/12/2220第八章相关与回归分析

第五节相关分析一、简单相关系数及其检验

(一)简单相关系数的定义

样本相关系数是总体相关系数的估计值。

简单相关系数通常采用下面的计算公式:第20页/共92页2022/12/2020第八章相关与回归分析2022/12/2221相关系数r的取值范围:-1≤r≤1r>0为正相关,r<0为负相关;|r|=0表示不存在线性关系;|r|=1表示完全线性相关;0<|r|<1表示存在不同程度线性相关:

|r|

<

0.4为低度线性相关;

0.4≤|r|<0.7为显著性线性相关;

0.7≤|r|<1.0为高度显著性线性相关。第八章相关与回归分析第21页/共92页2022/12/2021相关系数r的取值范围:-1≤r≤1r2022/12/2222第八章相关与回归分析

第五节相关分析一、简单相关系数及其检验

(二)简单相关系数的检验样本相关系数的检验有两种方法:直接检验法,检验法。

第22页/共92页2022/12/2022第八章相关与回归分析2022/12/2223相关系数的显著性检验(t检验法)⒈提出假设:目的检验总体两变量间线性相关性是否显著步骤⒉构造检验统计量:第八章相关与回归分析第23页/共92页2022/12/2023相关系数的显著性检验(t检验法)⒈提2022/12/2224相关系数的显著性检验(t检验法)⒊根据给定的显著性水平,确定临界值;⒌计算检验统计量并做出决策。⒋确定原假设的拒绝规则:若,则接受H0,表示总体两变量间线性相关性不显著;若,则拒绝H0,表示总体两变量间线性相关性显著步骤第八章相关与回归分析第24页/共92页2022/12/2024相关系数的显著性检验(t检验法)⒊2022/12/2225第八章相关与回归分析【例】检验生产量与生产费用之间的线性相关性是否显著。当成立时,则统计量第25页/共92页2022/12/2025第八章相关与回归分析【例】检验生产2022/12/2226第八章相关与回归分析

第五节相关分析二、复相关系数

复相关系数是测量一个变量与其它多个变量之间线性相关程度的指标。

为了测定一个变量y与其它多个变量之间的相关系数,可以考虑构造一个关于的线性组合,通过计算该线性组合与之间的简单相关系数作为变量与之间的复相关系数。具体计算过程如下:第一步,用y对作回归,得第26页/共92页2022/12/2026第八章相关与回归分析2022/12/2227第八章相关与回归分析

第五节相关分析

第二步,计算y和的简单相关系数,此简单相关系数即为y与

之间的复相关系数。复相关系数的计算公式为:第27页/共92页2022/12/2027第八章相关与回归分析2022/12/2228第八章相关与回归分析

第五节相关分析二、复相关系数

复相关系数与简单相关系数的区别是简单相关系数的取值范围是[-1,1],而复相关系数的取值范围是[0,1]。这是因为,在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以上,其符号有正有负,不能按正负来区别,所以复相关系数也就只取正值。第28页/共92页2022/12/2028第八章相关与回归分析2022/12/2229第八章相关与回归分析

当两个变量同时受其它变量影响时,有必要研究当控制其它变量不变时,该两个变量之间的相关关系。这种相关关系被称为偏相关关系。

第五节相关分析三、偏相关系数

计算偏相关系数的原因在于任何两个变量这间的相关关系都可能受其余变量的影响。要考察两个变量之间的纯相关关系,必须排除其余变量的影响,或者说必须使其余变量保持不变。第29页/共92页2022/12/2029第八章相关与回归分析2022/12/2230第八章相关与回归分析

第五节相关分析三、偏相关系数

偏相关系数的计算是以回归分析为基础的。以三个变量的情形为例,此种情况下,的偏相关系数有三个,分别记作

为与之间的相关系数;

保持不变时,

、和之间的相关系数;

与为保持不变时,之间的相关系数;为与保持不变时,之间的相关系数;第30页/共92页2022/12/2030第八章相关与回归分析2022/12/2231第八章相关与回归分析

第五节相关分析

计算残差此时中不再含有对的影响。第二步,求对的回归估计式计算残差此时中不再含有对的影响。第一步,求对的回归估计式第31页/共92页2022/12/2031第八章相关与回归分析2022/12/2232第八章相关与回归分析

第五节相关分析

第三步,计算和的简单相关系数由于和中都不再包含的影响,因此和的简单相关系数就是保持不变时,与之间的相关系数。所以偏相关系数第32页/共92页2022/12/2032第八章相关与回归分析2022/12/2233第八章相关与回归分析

第五节相关分析三、偏相关系数

可以证明,第33页/共92页2022/12/2033第八章相关与回归分析2022/12/2234第八章相关与回归分析

第五节相关分析三、偏相关系数

类似的

当变量个数多于3个时,求偏相关系数的原则不变,即应先排除其余变量对所考察两个变量的影响,然后求这两个变量之间的简单相关系数。只是变量越多,数学处理以及偏相关系数的表达式就越复杂。第34页/共92页2022/12/2034第八章相关与回归分析2022/12/2235第二节一元线性回归分析第八章相关与回归分析一、一元线性回归分析随机误差项的基本假定

在回归分析中,最简单最基本的单方程模型为一元线性回归模型。一元线性回归分析的总体回归模型为:

为常数项或截距项,为斜率系数,是随机误差项,又称随机干扰项。第35页/共92页2022/12/2035第二节一元线性回归分析第八章相2022/12/2236第二节一元线性回归分析第八章相关与回归分析一、一元线性回归分析随机误差项的基本假定

第二,模型的设定误差。

在线性回归模型中加入随机误差项是基于以下原因:

第一,模型不可能包含所有的解释变量。

第三,测量误差的影响。第四,其他随机因素的影响。第36页/共92页2022/12/2036第二节一元线性回归分析第八章相2022/12/2237第二节一元线性回归分析第八章相关与回归分析一、一元线性回归分析随机误差项的基本假定

线性回归模型由两部分构成,确定性部分和随机性部分,为确定性部分,称为对于给定值的期望值,可以写为:

上式被称为总体线性回归方程。第37页/共92页2022/12/2037第二节一元线性回归分析第八章相2022/12/2238第二节一元线性回归分析第八章相关与回归分析一、一元线性回归分析随机误差项的基本假定

满足以下假定的线性回归模型称为古典(或经典)线性回归模型

假定1:回归模型是正确设定的假定2:解释变量是非随机的假定3:随机误差项的均值为零假定4:随机误差项的方差为一个不变的常数(等方差假定)假定5:随机误差项的观测值互不相关(非序列相关假定)假定6:解释变量与随机误差项不相关假定7:随机误差项服从正态分布假定8:没有一个解释变量是其他任何解释变量的完全线性组合(无多重共线性假定,只适用于多元线性回归模型)第38页/共92页2022/12/2038第二节一元线性回归分析第八章相2022/12/2239第二节一元线性回归分析第八章相关与回归分析二、一元线性回归模型的估计

最小二乘法的意义在于使为了得到这些估计值而最为广泛使用的方法就是普通最小二乘法

为样本回归方程。达到最小来确定、

一般用、分别表分别表示参数的估计称为回归残差第39页/共92页2022/12/2039第二节一元线性回归分析第八章相2022/12/2240残差(Residual):第40页/共92页2022/12/2040残差(Residual):第40页/2022/12/2241第二节一元线性回归分析第八章相关与回归分析二、一元线性回归模型的估计

根据微积分的极值定理,对求相应于、的偏导数,并令其等于0,即可求得:

第41页/共92页2022/12/2041第二节一元线性回归分析第八章相2022/12/2242b与r的关系:r>0r<0r=0b>0b<0 b=0第八章相关与回归分析第42页/共92页2022/12/2042b与r的关系:r>02022/12/2243第二节一元线性回归分析第八章相关与回归分析二、一元线性回归模型的估计

样本回归直线具有下述性质:第一、它通过y和x的样本平均数和确定的那一点;第二、的平均值和的平均值相等;第三、残差的平均值是零;第四、残差和不相关;第五、残差与x不相关。第43页/共92页2022/12/2043第二节一元线性回归分析第八章相2022/12/2244【分析】因为工业总产值与能源消耗量之间存在高度正相关关系(),所以可以拟合工业总产值对能源消耗量的线性回归方程。【例】建立工业总产值对能源消耗量的线性回归方程。解:设线性回归方程为第八章相关与回归分析第44页/共92页2022/12/2044【分析】因为工业总产值与能源消耗量之2022/12/2245序号能源消耗量(十万吨)x工业总产值(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计916625550862617537887第45页/共92页2022/12/2045序号能源消耗量(十万吨)x工业总产值2022/12/2246第八章相关与回归分析即线性回归方程为:计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。第46页/共92页2022/12/2046第八章相关与回归分析即线性回归方程2022/12/2247第二节一元线性回归分析第八章相关与回归分析二、一元线性回归模型的估计

在回归分析中,不要试着对常数项进行解释,原因有两点:

首先,随机误差项部分地是由于忽略了许多边缘自变量而生成的,这些变量的平均效应被置于常数项中。

其次,常数项是当所有自变量与误差项为0时,因变量的值,但是自变量与随机误差项的值几乎从不等于0,因为用作经济分析的变量通常是正的。第47页/共92页2022/12/2047第二节一元线性回归分析第八章相2022/12/2248第二节一元线性回归分析第八章相关与回归分析二、一元线性回归模型的估计

2.大样本性质

无偏性(二)一元线性回归模型最小二乘估计量的性质1.小样本性质线性

有效性

渐近无偏性一致性第48页/共92页2022/12/2048第二节一元线性回归分析第八章相2022/12/2249第二节一元线性回归分析第八章相关与回归分析三、一元线性回归模型的拟合程度分析

(一)一元线性回归模型的判定系数第49页/共92页2022/12/2049第二节一元线性回归分析第八章相2022/12/2250第八章相关与回归分析剩余离差平方和回归离差平方和总离差平方和第50页/共92页2022/12/2050第八章相关与回归分析剩余离差平方和2022/12/2251第二节一元线性回归分析第八章相关与回归分析三、一元线性回归模型的拟合程度分析

可以证明,对上式两边分别平方加总后等式仍然成立,即:(一)一元线性回归模型的判定系数

可简写为:TSS=ESS+RSS第51页/共92页2022/12/2051第二节一元线性回归分析第八章相2022/12/2252第二节一元线性回归分析第八章相关与回归分析三、一元线性回归模型的拟合程度分析

判定系数测度了回归直线对观测数据的拟合程度,记为(一)一元线性回归模型的判定系数

第52页/共92页2022/12/2052第二节一元线性回归分析第八章相2022/12/2253判定系数与相关系数的关系第八章相关与回归分析第53页/共92页2022/12/2053判定系数与相关系数的关系第八章相关2022/12/2254判定系数与相关系数的区别:判定系数无方向性,相关系数则有方向,其方向与样本回归系数b相同;判定系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向;第八章相关与回归分析第54页/共92页2022/12/2054判定系数与相关系数的区别:判定系数无2022/12/2255第二节一元线性回归分析第八章相关与回归分析三、一元线性回归模型的拟合程度分析

估计标准误差是指实际值与估计值的平均离差。其定义公式如下:

(二)一元线性回归模型的估计标准误估计标准差越小,则变量间相关程度越高,回归线对Y的解释程度越高。第55页/共92页2022/12/2055第二节一元线性回归分析第八章相2022/12/2256第二节一元线性回归分析第八章相关与回归分析四、一元线性回归模型的显著性检验

根据正态分布下最小二乘估计量的性质,可求出的抽样分布为:

(一)回归系数的显著性检验

回归系数的显著性检验就是要检验自变量对因变量的影响程度是否显著的问题。若总体回归系数,则总体回归线就是一条水平线,说明两个变量之间没有线性关系,即自变量的变化对因变量没有影响。第56页/共92页2022/12/2056第二节一元线性回归分析第八章相2022/12/2257第二节一元线性回归分析第八章相关与回归分析四、一元线性回归模型的显著性检验

(1)建立原假设假设样本从一个没有线性关系的总体中选出,即

(一)回归系数的显著性检验(2)计算检验统计量t值其中,.第57页/共92页2022/12/2057第二节一元线性回归分析第八章相2022/12/2258第二节一元线性回归分析第八章相关与回归分析四、一元线性回归模型的显著性检验

(4)得出检验结果

(一)回归系数的显著性检验

(3)确定显著性水平α(一般取α=0.05),并根据自由度查分布表,找出相应的临界值,表明自变量x对因变量y的影响是显著的。

,拒绝若,表明自变量x对因变量y的影响是显著的。,拒绝若第58页/共92页2022/12/2058第二节一元线性回归分析第八章相2022/12/2259第二节一元线性回归分析第八章相关与回归分析四、一元线性回归模型的显著性检验

(二)回归方程总体显著性的F检验

F检验的基本步骤为:(1)建立原假设备择假设由于备择假设和原假设是对立的,所以备择假设为:至少有一个不为0。

(2)计算F统计量

第59页/共92页2022/12/2059第二节一元线性回归分析第八章相2022/12/2260第二节一元线性回归分析第八章相关与回归分析四、一元线性回归模型的显著性检验

在原假设成立的条件下,F统计量服从第一个自由度为,第二个自由度为的F分布。

在一元回归下,F统计量简化为:第60页/共92页2022/12/2060第二节一元线性回归分析第八章相2022/12/2261第二节一元线性回归分析第八章相关与回归分析四、一元线性回归模型的显著性检验

(3)确定显著性水平a(一般取a=0.05),并根据两个自由度查F分布表,得到相应的临界值。

,则接受原假设,说明回归方程在整体上不显著。

(4)得出检验结果若,则拒绝,说明回归方程在整体上是显著的;若

第61页/共92页2022/12/2061第二节一元线性回归分析第八章相2022/12/2262第八章相关与回归分析

多元线性回归模型的一般表示式为:与多元线性回归模型相对应的总体回归方程为:样本回归模型为:

第三节多元线性回归分析一、多元线性回归模型(一)多元线性回归模型的矩阵表示样本回归方程为:第62页/共92页2022/12/2062第八章相关与回归分析2022/12/2263第八章相关与回归分析

第三节多元线性回归分析假设为了得到未知参数的估计值,我们对被解释变量和解释变量进行了n次观测,代入多元线性回归模型,可得n个随机模型:一、多元线性回归模型(一)多元线性回归模型的矩阵表示第63页/共92页2022/12/2063第八章相关与回归分析2022/12/2264第八章相关与回归分析

为了使多元线性回归分析和计算更方便、更简洁,可以用矩阵形式表示:

第三节多元线性回归分析一、多元线性回归模型(一)多元线性回归模型的矩阵表示第64页/共92页2022/12/2064第八章相关与回归分析2022/12/2265第八章相关与回归分析

第三节多元线性回归分析定义依照矩阵运算法则,上式可表示为:类似的,定义第65页/共92页2022/12/2065第八章相关与回归分析2022/12/2266第八章相关与回归分析

我们把基本假定用矩阵的形式表示出来:

第三节多元线性回归分析一、多元线性回归模型(二)多元线性回归模型的基本假定1.零均值假定可以表示为:第66页/共92页2022/12/2066第八章相关与回归分析2022/12/2267第八章相关与回归分析

第三节多元线性回归分析2.同方差和无序列相关可以表示为:

第67页/共92页2022/12/2067第八章相关与回归分析2022/12/2268第八章相关与回归分析4.解释变量与随机误差项不相关假定可表示为:

第三节多元线性回归分析

3.

随机误差项服从正态分布可以表示为:

解释变量之间不存在多重共线性可表示为:

如果上成立,至少有k+1阶子式不为零,表明解释变量之间也就是要求系数行列式不存在线性相关关系。等价于第68页/共92页2022/12/2068第八章相关与回归分析4.解释变量与2022/12/2269第八章相关与回归分析

由样本回归模型和样本回归方程,可得残差向量为:

第三节多元线性回归分析

二、多元线性回归模型的估计

(一)参数的普通最小二乘估计

对上式两边分别对求一阶导数,并令一阶偏导数为零,得

由假定,可以得到参数估计量为:

第69页/共92页2022/12/2069第八章相关与回归分析2022/12/2270第八章相关与回归分析

第三节多元线性回归分析

二、多元线性回归模型的估计

(一)参数的普通最小二乘估计

对上式两边分别对求一阶导数,并令一阶偏导数为零,得

由假定,可以得到参数估计量为:

第70页/共92页2022/12/2070第八章相关与回归分析2022/12/2271第八章相关与回归分析

第三节多元线性回归分析二、多元线性回归模型的估计(二)参数普通最小二乘估计量的性质和分布在多元线性回归条件下,参数的最小二乘估计仍然具有线性、无偏性和最小方差性。由于

,可以看出具有线性特性,稍加变换,它还是的线性组合。由此可见是无偏的。第71页/共92页2022/12/2071第八章相关与回归分析2022/12/2272第八章相关与回归分析

在无偏性的基础上,我们可以得到的方差-协方差矩阵:

第三节多元线性回归分析二、多元线性回归模型的估计(二)参数普通最小二乘估计量的性质和分布第72页/共92页2022/12/2072第八章相关与回归分析2022/12/2273第八章相关与回归分析

第三节多元线性回归分析二、多元线性回归模型的估计(二)参数普通最小二乘估计量的性质和分布由于的线性组合,而假定是服从正态分布的,所以也是服从正态分布的,即由于是不可观测的,所以其方差没有办法计算出来,

因此的方差-协方差矩阵的估计值为:是只能进行估计。可以证明:第73页/共92页2022/12/2073第八章相关与回归分析2022/12/2274第八章相关与回归分析

在多元线性回归模型中,总平方和仍可分解为回归平方和和残差平方和

.

第三节多元线性回归分析

三、多元线性回归模型的检验(一)拟合优度检验三个平方和的矩阵表示分别为:第74页/共92页2022/12/2074第八章相关与回归分析2022/12/2275第八章相关与回归分析

多元线性回归判定系数仍表示为回归平方和与总平方和之比,即

第三节多元线性回归分析

三、多元线性回归模型的检验(一)拟合优度检验调整的判定系数

定义为:第75页/共92页2022/12/2075第八章相关与回归分析2022/12/2276第八章相关与回归分析

在一元线性回归中,总体回归方程的显著性检验和斜率参数的显著性检验是等价的,这可以从两类检验的原假设上得到说明。但在多元线性回归中,由于存在多个解释变量,参数的显著性检验不再等价于总体回归方程的显著性检验。

第三节多元线性回归分析

三、多元线性回归模型的检验(二)总体回归方程的显著性检验第76页/共92页2022/12/2076第八章相关与回归分析2022/12/2277第八章相关与回归分析

第一步,计算检验统计量

第三节多元线性回归分析

三、多元线性回归模型的检验(三)参数的显著性检验

具体作法是:将进行标准化,标准化后的变量服从标准正态分布:第77页/共92页2022/12/2077第八章相关与回归分析2022/12/2278第八章相关与回归分析

,则拒绝原假设,认为解释变量

第三节多元线性回归分析

三、多元线性回归模型的检验(三)参数的显著性检验第二步,确定显著性水平,查表确定临界值

对应变量的影响是显著的。在原假设成立的情况下,该统计量服从个自由度的分布。由于未知,可用其估计量代替,由此可得到统计量:第78页/共92页2022/12/2078第八章相关与回归分析2022/12/2279第八章相关与回归分析

第四节非线性回归分析一、非线性回归模型的定义

非线性回归分析模型的本质,取决于可否通过某种数量变换或数学变换化成线性回归模型,并从而可进行OLS估计。

非线性回归模型可以表示为:其中是期望函数,是第t个自变量向量

第79页/共92页2022/12/2079第八章相关与回归分析2022/12/2280第八章相关与回归分析

4.S型曲线模型

第四节非线性回归分析二、可线性化的非线性回归模型的估计

1.双曲线模型2.二次多项式模型3.半对数和双对数模型5.其它非线性模型第80页/共92页2022/12/2080第八章相关与回归分析2022/12/2281第八章相关与回归分析

对于不可线性化的非线性回归模型,可采用非线性最小二乘法或非线性极大似然法进行估计。

第四节非线性回归分析三、不可线性化的非线性回归模型的估计

如果只包含一个未知参数,则可写成下面的形式对于相对应的残差平方和为使上式达到最小的即为非线性最小二乘估计量,第81页/共92页2022/12/2081第八章相关与回归分析2022/12/2282第八章相关与回归分析

第四节非线性回归分析三、不可线性化的非线性回归模型的估计

应该满足以下条件:即根据极值理论,第82页/共92页2022/12/2082第八章相关与回归分析2022/12/2283第八章相关与回归分析

高斯-牛顿法的计算步骤如下:

第四节非线性回归分析取一阶近似值第一步:将在某个初值处进行泰勒级数展开,第二步:令将第二步代入第一步得第83页/共92页2022/12/2083第八章相关与回归分析2022/12/2284第八章相关与回归分析

第四节非线性回归分析三、不可线性化的非线性回归模型的估计

第三步:对上面模型进行最小二乘估计,得到的第一步估计值(第一次迭代值)第四步:用

代替第一步中的直到收收敛为止。

,重复一至四步,第84页/共92页2022/12/2084第八章相关与回归分析2022/12/2285第八章相关与回归分析

本章小结

本章介绍了相关与回归分析的各种理论和方法,并对大多数问题给出了实例。相关分析与回归分析的概念是这一章的基础,相关分析与回归分析既有区别又有联系,相关表和相关图是了解相关关系的重要工具。一元线性回归分析是回归分析的核心,回归分析都是在经典假设的基础上进行的,在经典回归下,最小二乘估计量具有线性、无偏性和有效性。在这些性质的基础上,可以得到最小二乘估计量的分布,由此可以对参数进行区间估计和假设检验。另外需要对回归方程的拟合程度进行检验。预测是一元线性回归的基本目的之一。第85页/共92页2022/12/2085第八章相关与回归分析2022/12/2286第八章相关与回归分析

本章小结

多元线性回归的基本原理和一元线性回归是类似的,主要区别在于解释变量的多少。为了运算的方便,多元线性回归采用矩阵方法进行表示。非线性回归的概念存在一定误区,本章阐明了非线性回归分析的概念,并对可线性化的非线性回归模型和不可线性化的回归模型分别展开了讨论。相关分析包括简单相关系数的计算、复相关系数的计算和偏相关系数的计算。由于复相关系数和偏相关系数的计算方法依赖于回归分析,所以相关分析放在了最后一节。由于多元线性回归、非线性回归、复相关系数、偏相关系数的计算比较烦琐,且大部分统计软件均可完成操作,故本章的例题主要针对于一元线性回归分析和简单相关系数。第86页/共92页2022/12/2086第八章相关与回归分析2022/12/2287第八章相关与回归分析

思考与练习

1.简述相关关系的种类。

2.什么是相关分析?什么是回归分析?二者有什么区别与联系?

3.简述相关表的种类。

4.说明经典线性回归模型的基本假定。

5.多元线性回归模型系数向量的普通最小二乘估计有哪些性质?

6.多元线性回归模型检验的内容都有哪些?第87页/共92页2022/12/2087第八章相关与回归分析2022/12/2288第八章相关与回归分析

思考与练习

年份1999200020012002200320042005产量(万件)34444958677685利润(万元)25283436404246表8-101999-2005年产量与利润表7.已知某厂1999~2005年产量和利润的数据如表8-10:第88页/共92页2022/12/2088第八章相关与回归分析2022/12/2289第八章相关与回归分析

要求:

(1)画出利润随产量变化的散点图;

(2)建立利润对产量的一元线性回归方程;

(3)对斜率的经济意义加以解释;

(4)对建立的回归方程进行检验。

8.设某种商品销售量Y、价格X和广告费用Z有下述关系:思考与练习

第89页/共92页2022/12/2089第八章相关与回归分析2022/12/2290第八章相关与回归分析

;思考与练习

月份销售量(公斤)价格(元/公斤)广告费用(元)123456789101112557090100901058011012511513013010090807070707065606055505.506.307.207.006.307.355.607.157.506.907.156.50表8-11商品销售量、价格与广告费用数据第90页/共92页2022/12/2090第八章相关与回归分析2022/12/2291第八章相关与回归分析

思考与练习

要求:(1)估计样本回归方程(2)对回归方程进行显著性检验(3)计算复相关系数(4)计算X和Z的偏相关系数(5)假如某月商品价格为80(元/公斤),广告费用为7(元),预测该商品的销售量,并建立95%的预测区间。第91页/共92页2022/12/2091第八章相关与回归分析2022/12/22课件92谢谢您的观看!第92页/共92页2022/12/20课件92谢谢您的观看!第92页/共92页2022/12/2293第八章相关与回归分析第一节相关与回归分析的基本概念

第三节

一元线性回归分析

第四节

多元线性回归分析

【学习目标】通过对本章的学习,重点掌握回归分析的估计和检验方法;掌握相关分析的种类及三种相关系数的计算方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算及其检验;多元线性回归分析。第五节

非线性回归分析

第二节

相关分析

第1页/共92页2022/12/201第八章相关与回归分析第一节相关与2022/12/2294第一节相关与回归分析的基本概念

(一)函数关系

一、相关关系与函数关系

第八章相关与回归分析

函数关系是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。第2页/共92页2022/12/202第一节相关与回归分析的基本概念2022/12/2295第一节相关与回归分析的基本概念

(二)统计关系

一、相关关系与函数关系

第八章相关与回归分析统计关系不同于函数关系,当重复观测时,观测点不是完全落在统计关系曲线上,而是围绕统计关系曲线散布。统计关系可以表示为确定部分和随机性部分二者之和,这是回归分析的基础。相关关系因果关系第3页/共92页2022/12/203第一节相关与回归分析的基本概念2022/12/2296案例分析相关关系与因果关系一家研究机构有一项惊人的发现:统计数据显示,脚长的儿童拼写能力比脚短的儿童强。原来他们调查的是一群年龄不同的儿童,脚长的儿童比脚短的儿童年龄大!赶快回去量一下儿子的脚长我要把脚拉长一点!第4页/共92页2022/12/204案例分析相关关系与因果关系一家研究机构2022/12/2297⒈按涉及变量的多少分为相关关系的种类⒉按照表现形式不同分为⒊按照变化方向不同分为直线相关曲线相关负相关正相关二、相关分析的种类复相关单相关偏相关第八章相关与回归分析第5页/共92页2022/12/205⒈按涉及变量的多少分为相关关系的种类⒉2022/12/22984.按相关的程度分为相关关系的种类5.按变量之间因果关系的方向分为完全相关不完全相关不相关双向因果相关单向因果相关虚假相关第八章相关与回归分析第6页/共92页2022/12/2064.按相关的程度分为相关关系的种类52022/12/2299第一节相关与回归分析的基本概念

第八章相关与回归分析三、相关分析与回归分析

回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的依赖关系。

相关分析是测度两个变量之间的线性关联度的,并用一些指数(相关系数)表示相关程度。

第7页/共92页2022/12/207第一节相关与回归分析的基本概念第八2022/12/22100第一节相关与回归分析的基本概念

第八章相关与回归分析三、相关分析与回归分析

相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。区别:第8页/共92页2022/12/208第一节相关与回归分析的基本概念第八2022/12/22101第一节相关与回归分析的基本概念

第八章相关与回归分析三、相关分析与回归分析联系:

相关分析是回归分析的基础和前提。回归分析是相关分析的深入和继续。第9页/共92页2022/12/209第一节相关与回归分析的基本概念第八2022/12/22102第一节相关与回归分析的基本概念

第八章相关与回归分析四、相关表与相关图(一)简单相关表

将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。第10页/共92页2022/12/2010第一节相关与回归分析的基本概念第2022/12/22103第一节相关与回归分析的基本概念

第八章相关与回归分析

企业编号月产量(千吨)X生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用第11页/共92页2022/12/2011第一节相关与回归分析的基本概念第2022/12/22104第一节相关与回归分析的基本概念

第八章相关与回归分析四、相关表与相关图

(二)分组相关表

单变量分组表双变量分组表三变量分组表。第12页/共92页2022/12/2012第一节相关与回归分析的基本概念第2022/12/22105第一节相关与回归分析的基本概念

第八章相关与回归分析

1.单变量分组表

表某纺织厂工人看管织机台数和时劳动生产率相关表第13页/共92页2022/12/2013第一节相关与回归分析的基本概念第2022/12/22106第一节相关与回归分析的基本概念

第八章相关与回归分析

2.双变量分组表

表居住时间与对百货商场的熟悉程度的双变量分组表第14页/共92页2022/12/2014第一节相关与回归分析的基本概念第2022/12/22107第一节相关与回归分析的基本概念

第八章相关与回归分析

3.三变量分组表

假定对于某项私家车购买意向的调查,最初以教育水平和私家车拥有情况进行分析,对1000人调查的结果用二维列联表表示如:第15页/共92页2022/12/2015第一节相关与回归分析的基本概念第2022/12/22108第一节相关与回归分析的基本概念

第八章相关与回归分析

3.三变量分组表

表教育程度和私家车拥有状况的双变量分析第16页/共92页2022/12/2016第一节相关与回归分析的基本概念第2022/12/22109第八章相关与回归分析

从上表中可以看出,文化程度越高的人拥有私家车的比例越高,这和实际情况不太相符,于是我们引入收入变量,作三变量的交叉列表分析:教育程度、收入与私家车拥有状况的三变量分析

私家车拥有状况收入水平低收入高收入教育程度教育程度本科及以上本科以下本科及以上本科以下有没有20%(20)80%(80)20%(140)80%(560)40%(60)60%(90)40%(20)60%(30)列合计100%100%100%100%被调查者人数10070015050第17页/共92页2022/12/2017第八章相关与回归分析2022/12/22110正相关负相关曲线相关不相关xyxyxyxy第八章相关与回归分析(三)相关图第18页/共92页2022/12/2018正相关负相关曲线相关不相2022/12/22111第八章相关与回归分析

第二节相关分析一、简单相关系数及其检验(一)简单相关系数的定义

简单相关系数简称相关系数,是测量两个变量之间线性相关的方向和程度的指标。总体相关系数的表达式为:式中:

为变量X与变量Y的协方差

为变量Y的方差为变量X的方差第19页/共92页2022/12/2019第八章相关与回归分析2022/12/22112第八章相关与回归分析

第五节相关分析一、简单相关系数及其检验

(一)简单相关系数的定义

样本相关系数是总体相关系数的估计值。

简单相关系数通常采用下面的计算公式:第20页/共92页2022/12/2020第八章相关与回归分析2022/12/22113相关系数r的取值范围:-1≤r≤1r>0为正相关,r<0为负相关;|r|=0表示不存在线性关系;|r|=1表示完全线性相关;0<|r|<1表示存在不同程度线性相关:

|r|

<

0.4为低度线性相关;

0.4≤|r|<0.7为显著性线性相关;

0.7≤|r|<1.0为高度显著性线性相关。第八章相关与回归分析第21页/共92页2022/12/2021相关系数r的取值范围:-1≤r≤1r2022/12/22114第八章相关与回归分析

第五节相关分析一、简单相关系数及其检验

(二)简单相关系数的检验样本相关系数的检验有两种方法:直接检验法,检验法。

第22页/共92页2022/12/2022第八章相关与回归分析2022/12/22115相关系数的显著性检验(t检验法)⒈提出假设:目的检验总体两变量间线性相关性是否显著步骤⒉构造检验统计量:第八章相关与回归分析第23页/共92页2022/12/2023相关系数的显著性检验(t检验法)⒈提2022/12/22116相关系数的显著性检验(t检验法)⒊根据给定的显著性水平,确定临界值;⒌计算检验统计量并做出决策。⒋确定原假设的拒绝规则:若,则接受H0,表示总体两变量间线性相关性不显著;若,则拒绝H0,表示总体两变量间线性相关性显著步骤第八章相关与回归分析第24页/共92页2022/12/2024相关系数的显著性检验(t检验法)⒊2022/12/22117第八章相关与回归分析【例】检验生产量与生产费用之间的线性相关性是否显著。当成立时,则统计量第25页/共92页2022/12/2025第八章相关与回归分析【例】检验生产2022/12/22118第八章相关与回归分析

第五节相关分析二、复相关系数

复相关系数是测量一个变量与其它多个变量之间线性相关程度的指标。

为了测定一个变量y与其它多个变量之间的相关系数,可以考虑构造一个关于的线性组合,通过计算该线性组合与之间的简单相关系数作为变量与之间的复相关系数。具体计算过程如下:第一步,用y对作回归,得第26页/共92页2022/12/2026第八章相关与回归分析2022/12/22119第八章相关与回归分析

第五节相关分析

第二步,计算y和的简单相关系数,此简单相关系数即为y与

之间的复相关系数。复相关系数的计算公式为:第27页/共92页2022/12/2027第八章相关与回归分析2022/12/22120第八章相关与回归分析

第五节相关分析二、复相关系数

复相关系数与简单相关系数的区别是简单相关系数的取值范围是[-1,1],而复相关系数的取值范围是[0,1]。这是因为,在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以上,其符号有正有负,不能按正负来区别,所以复相关系数也就

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论