第 相关数列分析_第1页
第 相关数列分析_第2页
第 相关数列分析_第3页
第 相关数列分析_第4页
第 相关数列分析_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学1第相关数列分析13.1.3简单相关系数当变量y与变量x之间具有线性相关时,可用简单相关系数测定它们之间的密切程度。计算公式为:第1页/共27页简单相关系数r的取值范围为:-1≤r≤1.相关程度的划分标准:

r<1时,则x与y之间为负相关;r=-1完全负相关;

r>1时,则x与y之间为正相关;r=1完全正相关;|r|<0.3,无相关;

0.3≤|r|<0.5,低度相关;

0.5≤|r|<0.8,中度相关;

0.8≤|r|

<1,高度相关。相关程度的显著性检验变量y与变量x之间是否具有显著的线性相关,亦可根据给定的显著水平a(通常a=0.05)和自由度n-2,查R分布表得到临界值Ra,若|r|>Ra,则相关系数具有显著性;否则,不具有显著性。【例13.1】

【例13.2】测定简单相关系数应注意:(1)x与y两个变量是对等的关系;(2)两个变量只能算出一个相关系数;(3)要求两个变量都是随机的。第2页/共27页13.1.4斯皮尔曼等级相关系数斯皮尔曼等级相关系数是把两个变量排序变为等级排序,然后计算相关系数。等级相关又称顺位相关。计算等级相关系数首先应将数量水准或顺序水准的具体表现按等级次序(1,2,…)排列,然后用下列公式计算等级相关系数:其中n为等级的项数;d=x等级-y等级的差值。【例13.3】11.1.5肯达尔一致性系数肯达尔一致性系数通常用来测定多个顺序等级变量之间的一致性程度。计算时,要求先列出样本中各个个体的不同顺序等级测评排序,并算出等级之和∑Ti及平方和∑,然后计算肯达尔一致性系数,即其中:k为等级变量的个数,n为样本容量。【例13.4】等级相关系数和一致性系数亦可作显著性检验

第3页/共27页13.2一元线性回归一元线性回归是用数学模型描述具有简单相关的因变量与自变量的数量关系,利用样本数据求解模型参数,并对模型进行统计检验,然后利用模型进行预测和控制。13.2.1一元线性回归模型如果两个变量之间存在线性相关关系,并且自变量的变化会引起因变量按线性关系变化,则两个变量间关系可用一元线性回归模型描述:式中:a、b为回归系数,a为回归直线的截距,b为回归直线的斜率,e是误差项。一元线性回归模型具有以下特点:(1)两个变量y、x之间必须存在着真实的线性相关关系;(2)两个变量y、x之间不是对等的关系,分别为因变量和自变量。(3)因变量y是随机变量,自变量x是非随机变量,是给定的数值。(4)系数b有正负之分,b为正值x与y正相关;b为负值x与负相关。第4页/共27页13.2.2一元线性回归模型的参数估计通常采用最小二乘法估计模型参数,求解a、b参数的标准方程组为:第5页/共27页13.2.3回归模型的评价与检验1.拟合程度的测定。回归直线对样本数据的拟合程度用可决系数r2表示:可决系数r2的取值区间为[0,1],可决系数r2是线性相关系数r的平方.r的正负号与回归系数b的正负号相同.2.估计标准误差.说明变量y的实际值与估计值的误差程度:

第6页/共27页3.回归系数b的显著性检验。回归系数b是一个估计值,若y与x之间不存在线性关系,则回归系数b不具有显著性,所建立的回归方程是不能利用的。回归系数b的显著性检验采用t检验。其统计量为:根据给定的显著水平a(通常a=0.05)和自由度n-2,查t分布表得到临界值ta/2,若|tb|>ta/2,则回归系数b具有显著性,若|tb|<ta/2

,则回归系数b不具有显著性。4.回归方程的显著性检验。检验整个回归方程是否具有显著性,判断y与x之间是否存在真实的线性相关,亦即对相关系数r进行F检验。首先计算回归方程的F统计量:根据显著水平a(通常a=0.01或0.05)及自由度(k=1,n—2)查F分布表得到临界值F,若F>Fa,回归方程具有显著性;F<Fa,回归效果不显著。

第7页/共27页(5)误差序列自相关检验根据动态数据建立一元线性回归模型时,则误差项e也是一个时间序列,若误差序列之间存在密切的相关关系,则建立的回归模型就不能表述自变量与因变量之间的真实变动关系。DW检验就是检验误差序列是否存在严重的自相关。首先计算误差序列统计量DW:误差自相关检验不能通过时,应对模型进行改建或重建.【例13.5】第8页/共27页13.2.4一元线性回归模型的应用

1。因素分析。可作平均边际b、平均弹性系数和贡献率分析2。当一元线性回归模型中的x、y是一种收支关系时,并且是根据横截面数据建立的回归模型,则可用来测定收支相等的临界点。令y=a+bx

中的x=y,则3.利用回归模型进行预测。将自变量的预测值x0代人回归模型可求得因变量的预测值。亦可用利余标准差sy和一定的置信概率进行区间预测。4.利用回归模型进行控制。所谓控制,是指预测的反问题,就是说,如果我们要求y在确定范围内取值,那么应该把自变量x控制在什么数值上或取值范围内。第9页/共27页

13.3多元线性回归13.3.1多元线性回归模型其中,b0为常数项,b1,b2…bK为回归系数,又称偏回归系数二元线性回归模型为建立多元线性回归模型应注意自变量的选择,其准则是:

(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;

(2)自变量与因变量之间的线性相关必须是真实的;

(3)自变量之间应具有一定的互斥性,即Rxx<Rxy。

(4)自变量应具有完整的统计数据,其预测值容易确定

第10页/共27页13.3.2多元线性回归模型的参数估计用最小二乘法求解参数。如二元线性回归求参数的标准方程组为:如果多元线性回归分析依据的是分组数据,则应采用加权最小二乘法估计。为了判别各个自变量对因变量影响程度的大小,亦可去掉多元线性回归模型中的常数项b0,再用最小二乘法求解参数。第11页/共27页13.3.3多元线性回归模型的检验与评价1.拟合程度的测定。用多重可决系数R2评价,计算公式为:多重可决系数R2的平方根称为复相关系数,它能说明多元线性回归中的因变量与所有自变量的相关程度的高低。在多元线性回归中,亦可计算偏相关系数来说明当其他变量不变时,任意两个变量之间的相关程度的高低,反映变量之间的真实联系。计算公式见教材.2.估计标准误差估计标准误差是因变量y的实际值与回归方程求出的估计值之间的标准误差,估计标准误差越小,回归方程拟合程度越强。

第12页/共27页3.回归方程显著性检验。采用F检验,F统计量为:根据显著水平a,自由度(k,n-k-1)查F分布表,得临界值Fa,若F>Fa,则回归方程的回归效果显著;F<Fa,则回归方程的回归效果不显著.4.回归系数的显著性检验。采用t检验。

先计算统计量ti,然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值ta或ta/2,t>ta或ta/2,则回归系数具有显著性,反之,回归系数不具有显著性。统计量t的计算公式为:其中Cij是多元线性回归方程中求解回归系数矩阵的逆矩阵的主对角线上的第j个元素。

第13页/共27页5.多重共线性判别。在多元线性回归方程中,若自变量之间有很强的线性关系,超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。在多元回归中多重共线性是难避免的,只要不太严重就行了。判别方法主要有:通常认为0<k<10,自变量之间不存在多重共线性;自变量之间存在较强的多重共线性;自变量之间存在严重的多重共线性。降低多重共线性可转换自变量的取值,如变绝对数为相对数或平均数,或更换其他的自变量,或增大数据样本量,或剔除不重要的自变量。第14页/共27页6.D.W检验。误差序列若存在严重的的自相关则建立的回归模型就不能表述自变量与因变量之间的真实变动关系。D.W检验先计算检验统计量d:

(0≤d≤4)然后根据显著水平a,自变量个数k和样本数据个数n,查D.W分布表,得到下限值dL和上限值du,判别原则与一元线性回归模型所述相同.

若DW检验误差序列存在自相关,则应检查是否遗漏了关键变量未引入模型中,检查因变量或自变量是否存在滞后性影响,检查回归模型的函数形式是否正确,从而找出问题加以解决。或者对因变量和自变量进行一阶差分或求环比增长率,用增量数据或环比增长率数据建立多元回归模型.7.经济意义检验经济意义检验是检验模型的回归系数的正负号是否合理,能否得到合理的经济解释。经济意义检验通不过,建立的回归模型就无应用意义。第15页/共27页13.3.4多元线性回归模型的应用1.因素分析。可利用回归系数、平均弹性系数、贡献率揭示各个自变量的变动对因变量的影响程度和主次因素。2.预测。利用多元回归模型可求因变量的点预测值或预测区间。3.控制。通过给定的因变量的目标值来控制自变量的取值。

【例13.6】

第16页/共27页13.3.5多元线性回归自变量的筛选1.向前回归法:自变量不断进入回归模型的过程。2.向后回归法:自变量不断剔除回归模型的过程。3.逐步回归法:是向前回归法和向后回归法的综合,最后所得的回归方程为最优回归方程。逐步回归法、向前回归法和向后回归法参数估计和统计检验计算量大,可利用统计分析软件进行估计和检验。【例13.7】根据表13-5的数据,构建的城镇居民人均可支配收入UI和农民人均纯收入RI为因变量的回归模型分别为比较城乡居民人均收入形成的回归模型可发现,农民人均纯收入形成的机理和影响因素与是不同的。第17页/共27页13.3.6含定性自变量的回归模型在实际问题研究中,有时会遇到一些非数量型变量,如性别、职业、文化程度、正常年份与非正常年份等品质变量。建立回归模型时,经常需要考虑某些定性变量对因变量的影响。1.定性变量数量化处理处理的方法是引入虚拟变量(0-1型变量),即定性变量只取两类(k=2)时,某一属性出现时取值定为1,不出现时虚拟变量取值为0。虚拟变量又称0-1型变量或哑变量.2.含定性自变量的回归模型估计:最小二乘法

(1)联合回归模型估计:只有1个模型.【例13.8】虚拟变量取值为1和取值为0的两个回归方程有相同的斜率和相同的误差项方差,则可采用联合回归模型参数估计,并作模型检验。

(2)分段回归模型估计:分建2个模型【例13.9】虚拟变量取值为1和取值为0的两个回归方程有不相同的斜率和不同的误差项方差,可采用分段回归模型估计参数,并作模型检验。第18页/共27页13.4非线性回归模型在实际问题研究中,变量之间的关系不一定都是线性关系,而是表现为某种曲线关系。这种非线性关系称为曲线相关,据此配合的曲线模型称为曲线回归模型或非线性回归模型。许多非线性回归模型经过适当变换,可转化为线性回归模型的形式,采用最小二乘法求其回归曲线。1.常见的非线性回归模型有:第19页/共27页2.非线性回归模型的评价非线性回归模型一般不能进行有关的统计检验,因为许多统计检验都是建立在线性统计模型基础之上的。但是为了评价非线性回归模型的拟合程度及其估计误差的大小,可计算下列评价指标:第20页/共27页13.4.3柯布—道格拉斯生产函数其中:y代表产出增长率,a代表科技进步率,K代表资本投入量,α

代表资本产出弹性系数,L代表劳动投入量,β代表劳动产出弹性系数。若用y,l,k分别表示总产出、劳动力和资本的增长率或平均增长率,a表示技术进步增长率,则总量生产函数可转化为索洛提出的具有规模报酬不变特性的增长方程,即当参数和确定之后,则技术进步率增长率为:科技进步、劳动增长和资本增长对产出增长的贡献率的关系式为估计α和β参数法有经验估计法、比值估计法、增长率估计法、回归估计法等。【例13.10】

第21页/共27页13.4.4逻辑斯蒂线性回归1.逻辑斯蒂线性回归模型简介logistic线性回归模型通常用于分析和描述在特定条件下事件发生的概率与事件不发生的概率及其比值,研究有关因素对因变量y的影响。因变量y为0-1型变量,取0和1两个值;自变量x可以是数量型变量,也可以是0-1型变量。设研究对象y仅取0和1两个值,事件发生的条件概率为p=P(Y=1),有i个因素x1,x2,……,xi

影响y的取值。则有下列logistic回归模型:

第22页/共27页将等式两边取对数则有下列logistic线性回归模型应用logistic线性回归模型应注意以下几点:(1)pi值可取样本频率,即样本中分组观察单位数ni中具有”是”(y=1)的单位数mi所占的比率pi=mi/ni,但要求pi≠0或1,亦即mi≠0,mi≠ni。当mi≠0,mi≠ni时,可用下列修正公式计算样本频率:(2)分组数据应采用加权最小二乘法估计参数,以避免异方差性,其权数为wi=nipi(1-pi)。第23页/共27页2.一元线性logistic回归模型当因变量y为0-1型变量,只有一个主要影响因素{自变量x}时,可用一元线性logistic回

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论