高级计量经济学-第四章-第六章_第1页
高级计量经济学-第四章-第六章_第2页
高级计量经济学-第四章-第六章_第3页
高级计量经济学-第四章-第六章_第4页
高级计量经济学-第四章-第六章_第5页
已阅读5页,还剩256页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高级计量经济学第四章异方差性引子:更为接近真实的结论是什么?

根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下:

(291.5778)(0.644284)t=(-1.931062)(8.340265)

式中Y表示卫生医疗机构数(个),X表示人口数量(万人)。

,模型显示的结果和问题:●人口数量对应参数的标准误差较小●

t统计量远大于临界值●可决系数和修正的可决系数结果较好●

F检验结果明显显著

表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。

有什么充分的理由说明这一回归结果不可靠呢?

更为接近真实的结论又是什么呢?

第一节异方差性的实质与产生的原因一、异方差性的实质(一)同方差性的含义

同方差性:对所有的i(i=1,2,…,n)有

(4.1)

因为方差是度量被解释变量Y的观测值围绕回归线(4.2)的分散程度,因此同方差性指的是所有观测值的分散程度相同。

(二)异方差性的含义

设模型为如果对于模型中随机误差项有:

(4.3)

则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则

(4.4)

图形表示:

(一)模型中省略了某些重要的解释变量

假设正确的计量模型是:假如略去,而采用(4.5)当被略去的与有呈同方向或反方向变化的趋势时,随的有规律变化会体现在(4.5)式的中。

(二)模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。

二、产生异方差的原因(三)测量误差的变化样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。(四)截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。。

第二节异方差的后果一、对参数估计统计特性的影响(一)参数估计的无偏性仍然成立参数估计的无偏性仅依赖于基本假定中的零均值假定(即)。所以异方差的存在对无偏性的成立没有影响。(二)参数估计的方差不再是最小的同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。

二、对参数显著性检验的影响

由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的t统计量值不能正确确定,所以,如果仍用t统计量值进行参数的显著性检验将失去意义。

三、对预测的影响

尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y的预测也将不是有效的。

第三节异方差的检验

一、图形法(一)相关图形分析方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量Y与随机误差项u有相同的方差,所以利用分析Y与X的相关图形,可以初略地看到Y的离散程度与X之间是否有相关关系。如果随着x的增加,Y的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。

用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图,其中用表示农村家庭消费支出,表示家庭纯收入。图形举例:

(二)残差图形分析

设一元线性回归模型为:(4.10)运用OLS法估计,得样本回归模型为:(4.11)

由式(4.10)和式(4.11)得残差

(4.12)

绘制出对的散点图:◆如果不随而变化,则表明不存在异方差,◆如果随而变化,则表明存在异方差。

二、Goldfeld-Quanadt检验

●作用:检验递增性(或递减性)异方差。

●基本思想:将样本分为两部分,然后分别对两个样本进行回归,并计算两个子样的残差平方和所构成的比,以此为统计量来判断是否存在异方差。(一)检验的前提条件

1、要求检验使用的为大样本容量。

2、除了同方差假定不成立外,其它假定均满足。

(二)检验的具体做法

1、排序将解释变量的取值按从小到大排序。2、数据分组将排列在中间的约1/4的观察值删除掉,记为c,再将剩余的分为两个部分,每部分观察值的个数为(n-c)/2。3、提出假设。即:

分别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方为和。为前一部分样本回归产生的残差平方和,为后一部分样本回归产生的残差平方和。它们的自由度均为[(n-c)/2]-k,k为参数的个数。在原假设成立的条件下,因和自由度均为[(n-c)/2]-k,分布,可导出:(4.13)

4、构造F统计量5、判断给定显著性水平,查F分布表得临界值计算统计量F*,如果F*>

则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差。(三)检验的特点

●要求大样本

●异方差的表现既可为递增型,也可为递减型●检验结果与选择数据删除的个数c的大小有关●只能判断异方差是否存在,在多个解释变量的情况下,对哪一个变量引起异方差的判断存在局限。三、White检验(一)基本思想:不需要关于异方差的任何先验信息,只需要在大样本的情况下,将OLS估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。

(二)检验的特点

要求变量的取值为大样本

●不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。(三)检验的基本步骤:

以一个二元线性回归模型为例,设模型为:并且,设异方差与的一般关系为

其中为随机误差项。1、求回归估计式并计算用OLS估计式(4.14),计算残差并求残差的平方。2、求辅助函数用残差平方作为异方差的估计,并建立的辅助回归,即3、计算

利用求回归估计式(4.15)得到辅助回归函数的可决系数,n为样本容量。4、提出假设

中至少有一个不为零,5、检验

在零假设成立下,有渐进服从自由度为5的分布。给定显著性水平,查分布表得临界值,如果>

,则拒绝原假设,表明模型中随机误差存在异方差。(一)ARCH过程

设ARCH过程为p为ARCH过程的阶数,并且为随机误差。

(二)检验的基本思想

在时间序列数据中,可认为存在的异方差性为ARCH过程,并通过检验这一过程是否成立去判断时间序列是否存在异方差。

四、ARCH检验1、提出原假设:

中至少有一个不为零2、参数估计并计算对原模型作OLS估计,求出残差,并计算残差平方序列,以分别作为对的估计。3、求辅助回归(4.17)

(三)ARCH检验的基本步骤4、检验计算辅助回归的可决系数,并且在成立时,基于大样本,渐进服从给定显著性水平查分布表得临界值,如果,则拒绝原假设,表明模型中得随机误差存在异方差。

(四)检验的特点

●变量的取值为大样本,并且是时间序列●只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。

五、Glejser检验(一)检验的基本思想由OLS法得到残差,取得绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。(二)检验的特点不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。(三)检验的步骤1、建立模型并求根据样本数据建立回归模型,并求残差序列2、寻找与的最佳函数形式用残差绝对值对进行回归,用各种函数形式去试,寻找最佳的函数形式。3、判断根据选择的函数形式作对的回归,用作为的替代变量,对所选函数形式回归。用回归所得到的、t、F等信息判断,若表明参数显著不为零,即认为存在异方差性。◆模型变换法◆加权最小二乘法◆模型的对数变换第四节异方差的修正一、模型变换法以一元线性回归模型为例:(4.17)经检验存在异方差,且,其中是常数,是的某种函数。变换模型时,用去除(4.17)式的两端,得:

记(4.18)则有:

(4.19)式的随机误差项的方差为(4.20)

经变换的(4.19)式的随机误差项已是同方差。

▲常见的设定形式及对应的情况

形式二、加权最小二乘法以一元线性回归模型为例:(4.17)经检验存在异方差且,其中是常数,是的某种函数。(一)基本思路

区别对待不同的。对较小的给予较大的权数,对较大的给予较小的权数,从而使更好地反映对残差平方和的影响。(二)具体做法

1、选取权数并求出加权的残差平方和通常取权数

,当越小时,越大。当越大时,越小。将权数与残差平方相乘以后再求和,得到加权的残差平方和:2、求使满足的

根据最小二乘原理,若使得加权残差平方和最小,则:

其中:

三、模型的对数变换

在经济意义成立的情况下,如果对模型:作对数变换,其变量和分别用和代替,即:对数变换后的模型通常可以降低异方差性的影响:◆运用对数变换能使测定变量值的尺度缩小。◆经过对数变换后的线性模型,其残差表示相对误差往往比绝对误差有较小的差异。注意:对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。第五章序列相关引子

T检验和F检验一定就可靠吗?研究居民储蓄存款Y与居民收入X的关系:用普通最小二乘法估计其参数,结果为(1.8690)(0.0055)t=(14.9343)(64.2069)F=4122.531检验结果:回归系数的标准误差非常小,t统计量较大,说明居民收入X对居民储蓄存款Y的影响非常显著。同时可决系数也非常高,F统计量=4122.531,也表明模型异常的显著。但此估计结果可能是虚假的,t统计量和F统计量都被虚假地夸大,因此所得结果是不可信的。为什么?第一节序列相关的定义一、序列相关的概念

序列相关(serialcorrelation),

又称自相关(autocorrelation),是指总体回归模型的随机误差项之间存在相关关系。即不同观测点上的误差项彼此相关。

序列相关系数ρ的定义与普通相关系的公式形式相同,ρ的取值范围为-1≤ρ

≤1。式(5.1)中ut-1是ut滞后一期的随机误差项,因此,将式(5.1)计算的序列相关系数ρ称为一阶序列相关系数。一阶序列相关系数

式(5.1)二、序列相关产生的原因序列相关产生的原因1、经济系统的惯性2、经济活动的滞后效应

3、数据处理造成的相关4、蛛网现象

5、模型设定偏误

如GDP、价格、就业等经济指标都会随经济系统的周期而波动。例如,在经济高涨时期,较高的经济增长率会持续一段时间,而在经济衰退期,较高的失业率也会持续一段时间,这种现象就会表现为经济指标的序列相关现象。

序列相关现象大多出现在时间序列数据中,而经济系统的经济行为都具有时间上的惯性。原因1-经济系统的惯性

滞后效应是指某一指标对另一指标的影响不仅限于当期而是延续若干期。由此带来变量的序列相关。

例如,居民当期可支配收入的增加,不会使居民的消费水平在当期就达到应有水平,而是要经过若干期才能达到。因为人的消费观念的改变客观上存在自适应期。原因2-

经济活动的滞后效应

因为某些原因对数据进行了修整和内插处理,在这样的数据序列中就会有序列相关。

例如,将月度数据调整为季度数据,由于采用了加合处理,修匀了月度数据的波动,使季度数据具有平滑性,这种平滑性产生序列相关。对缺失的历史资料,采用特定统计方法进行内插处理,使得数据前后期相关,产生了序列相关。原因3-数据处理造成的相关

许多农产品的供给呈现为蛛网现象,供给对价格的反应要滞后一段时间,因为供给需要经过一定的时间才能实现。如果时期t的价格Pt低于上一期的价格Pt-1,农民就会减少时期t+1的生产量。如此则形成蛛网现象,此时的供给模型为:

蛛网现象是微观经济学中的一个概念。它表示某种商品的供给量受前一期价格影响而表现出来的某种规律性,即呈蛛网状收敛或发散于供需的均衡点。原因4-蛛网现象供给t=β1+β2价格t-1+ut(5.2)原因5-模型设定偏误而建立模型时,模型设定为:例如,应该用两个解释变量解释Y,即:则X3t对Yt的影响在式(5.4)中便归入随机误差项ut中,由于X3t在不同观测点上是相关的,这就造成了ut在不同观测点是相关的,呈现出系统模式,此时ut是序列相关的。(5.3)(5.4)

如果模型中省略了某些重要的解释变量或者模型函数形式不正确,都会产生系统误差,这种误差存在于随机误差项中,从而带来了序列相关。由于该现象是由于设定失误造成的序列相关,因此,也称其为虚假序列相关。

模型形式设定偏误也会导致序列相关现象。如将U形成本曲线设定为线性成本曲线,则必定会导致序列相关。由设定偏误产生的序列相关是一种虚假序列相关,可通过改变模型设定予以消除。

序列相关关系主要存在于时间序列数据中,但是在横截面数据中,也可能会出现序列相关,通常称其为空间序列相关(Spatialautocorrelation)。三、序列相关的表现形式

序列相关的性质可以用序列相关系数ρ的符号判断序列相关的方向,即ρ<0为负相关,ρ>0为正相关。当|ρ|接近1时,表示相关的程度很高。但序列相关是u1,u2,…,un序列自身的相关,因n个随机误差项的关联形式不同而具有不同的序列相关形式。序列相关大多出现在时间序列数据中。

对于样本观测期为n的时间序列数据,可得到总体回归模型(PRF)的随机误差项为u1,u2,…,un,如果序列相关形式为ut=ρut-1+vt

-1<ρ<1

其中ρ

为序列相关系数,vt为经典误差项,即E(vt)=0,Var(vt)=σ2,Cov(vt,vt+s)=0,s≠0。则式(5.5)称为一阶自回归模式,记为AR(1)。因为模型(5.5)中ut-1是ut滞后一期的值,因此称为一阶。式(5.5)中的ρ也称为一阶序列相关系数。(5.5)

如果式(5.5)中的随机误差项vt不是经典误差项,即vt中包含有ut的成份,如包含有ut-2则需将ut-2显含在回归模型中,其为ut

=

ρ1ut-1+ρ2ut-2

+vt′(5.6)其中,ρ1为一阶序列相关系数,ρ2为二阶序列相关系数,vt′是经典误差项。式(5.6)称为二阶自回归模式,记为AR(2)。一般地,如果u1,u2,…,ut之间的关系为(5.7)其中,vt为经典误差项。则称式(5.7)为m阶自回归模式,记为AR(m)。在经济计量分析中,通常采用一阶自回归形式,即假定自回归形式为一阶自回归AR(1)。

第二节序列相关的后果序列相关的后果对参数估计的影响

对模型检验的影响对模型预测的影响一、对参数估计的影响

在有序列相关的条件下,仍然使用普通最小二乘法将低估估计量的方差。

将低估真实的。对于一元线性回归模型:(5.8)(5.9)其中,

为现期随机误差,

为前期随机误差。

是经典误差项,满足零均值,同方差

,无序列相关的假定。假定随机误差项u存在一阶序列相关:(5.10)将随机误差项

的各期滞后值:逐次代入式(5.9)可得:式(5.10)表明随机误差项

可表示为独立同分布的随机误差序列,,,…

的加权和,权数分别为1,,,…,当0<ρ<1时,这些权数是随时间推移而呈几何衰减的;而当-1<ρ

<0时,这些权数是随时间推移而交错振荡衰减的。(5.11)(5.12)式(5.11)、式(5.12)表明,在

为一阶自回归的相关形式时,随机误差

依然是零均值、同方差的误差项。由式(5.10)可推得:(5.13)由于现期的随机误差项

并不影响回归模型中随机误差项

的以前各期值

(k>0),所以与

不相关,即有。因此,由式(5.9)可得随机误差项

与其以前各期

的协方差分别为:(5.14)

(5.15)

(5.16)

这些协方差分别称为随机误差项

的一阶自协方差、二阶自协方差和k

阶自协方差。对于一元线性回归模型(5.8),当u为经典误差项时,普通最小二乘估计量的方差为:以此类推,可得

:当式(5.8)的随机误差项u有序列相关时, 依然是无偏的,即,这一点在普通最小二乘法无偏性证明中可以看到。因为,无偏性证明并不需要u

满足无序列相关的假定。那么,最小二乘估计量是否是有效的,即在所有线性无偏估计量中方差最小呢?下面我们将以说明。式(5.8)中的最小二乘估计量为(5.17)

因此:(5.18)

当存在序列相关时,普通最小二乘估计量不再是最佳线性无估计量,即它在线性无偏估计量中不是方差最小的。在实际经济系统中,通常存在正的序列相关,即ρ>0,同时X序列自身也呈正相关,因此式(5.18)右边括号内的值通常大于0。因此,在有序列相关的条件下,仍然使用普通最小二乘法将低估估计量的方差。将低估真实的

。二、对模型检验的影响

对模型检验的影响考虑序列相关时的检验忽视序列相关时的检验(一)考虑序列相关时的检验

由于并不是所有线性无偏估计量中最小的,使用t检验判断回归系数的显著性时就可能得到错误的结论。

t检验的统计量为

由于的错误夸大,得到的t

统计量就可能小于临界值,从而得到参数β

不显著的结论。而这一结论可能是不正确的。(二)忽视序列相关时的检验

如果我们忽视序列相关问题依然假设经典假定成立,使用,将会导致错误结果。

当ρ

>0,即有正相关时,对所有的j都有ρ

>0。另外回归模型中的解释变量在不同时期通常是正相关的,对于xt和xt+j来说是大于0的。

因此,由式(5.18)可以看出,普通最小二乘法的方差通常会低估的真实方差。当ρ

较大和Xt有较强的正序列相关时,普通最小二乘估计量的方差会有很大偏差,我们会夸大估计量的估计精度,即得到较小的标准误。

因为的标准误是的标准差的估计值,在有序列相关时,普通最小二乘估计的标准误就不可靠了。一个被低估了的标准误意味着一个较大的t统计量。因此,当ρ>0时,通常t统计量都很大。这种有偏的t统计量是不能用来判断回归系数的显著性的。

综上所述,在序列相关情形下,无论考虑序列相关,还是忽视序列相关,通常的回归系统显著性的t检验都将是无效的。类似地,由于序列相关的存在,参数的最小二乘估计量是无效的,使得F检验和

检验也是不可靠的。三、对模型预测的影响模型预测的精度决定于抽样误差和总体误差项的方差

。抽样误差来自于对的估计,在序列相关情形下,

的方差的最小二乘估计变得不可靠,由此必定加大抽样误差。同时,在序列相关情形下,对

的估计 也会不可靠。由此可看出,影响预测精度的两大因素都会因序列相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低预测的精度。一、图示检验法

图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项et,et作为ut随机项的真实估计值,再描绘et

的散点图,根据散点图来判断et的相关性。残差et的散点图通常有两种绘制方式。第三节序列相关的检验etet-1图5.1et与et-1的关系

绘制et-1

,et

的散点图。用(et-1

,et

)(t=1,2,…n)作为散布点绘图,如果大部分点落在第Ⅰ、Ⅲ象限,表明随机误差项ut存在着正序列相关,如图5.1所示。

如果大部分点落在第Ⅱ、Ⅳ象限,那么随机误差项ut存在着负序列相关,如图5.2所示。

et-1et图5.2et与et-1的关系tet图5.3et的分布按照时间顺序绘制回归残差项et的图形。如果et

(t=1,2,…,n)随着t的变化逐次有规律地变化,呈现锯齿形或循环形状的变化,就可断言

et存在相关,表明存在着序列相关;如果et随着t的变化逐次变化并不断地改变符号,那么随机误差项ut存在负序列相关;如图5.3所示。

图5.4et的分布tet如果et随着t的变化逐次变化并不频繁地改变符号,而是几个正的et后面跟着几个负的,则表明随机误差项存ut

在正序列相关,如图5.4所示。

二、DW检验法

DW检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951年提出的一种适用于小样本的检验方法。DW检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题。这种检验方法是建立经济计量模型中最常用的方法,一般的计算机软件都可以计算出DW值。(5.20)(5.21)(5.22)随机误差项的一阶自回归形式为:为了检验序列的相关性,构造的原假设是:

为了检验上述假设,构造DW统计量首先要求出回归估计式的残差et定义DW统计量为:DW值的取值范围

在认为:

则:(5.23)(5.24)由于4(2,4)2(0,2)0-1(-1,0)0(0,1)1DW表5.1因此,。所以,DW值与的对应关系如表5.1所示。

由上述讨论可知DW的取值范围为:0≤DW≤4

根据样本容量n和解释变量的数目k′(不包括常数项)查DW分布表,得临界值dL和dU

,然后依下列准则考察计算得到的DW值,以决定模型的序列相关状态。误差项u1,u2,…,un间存在负相关4-dL≤DW≤4不能判定是否有序列相关4-dU≤DW<4-dL误差项u1,u2,…,un间无序列相关dU<DW<4-dU不能判定是否有序列相关dL<DW≤dU误差项u1,u2,…,un间存在正相关

0≤DW≤dL表5.2DW检验决策规则f(DW)不能确定正序列相关无序列相关不能确定负序列相关DW44-dL4-

dU2dUdL图5.5DW检验示意图

表5.2可以用坐标图更加直观地表示出来:

需要注意的是,DW检验尽管有着广泛的应用,但也有明显的缺点和局限性。

①DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法;

②DW统计量的上、下界表要求n≥15,这是因为样本如果再小,利用残差就很难对序列相关的存在性做出比较正确的诊断;③DW检验不适应随机误差项具有高阶序列相关的检验;④只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量。

第四节序列相关的修正

对于虚假序列相关,由于是模型设定偏误造成的,只能通过改变模型的设定去消除。对于设定正确的模型,如随机误差项有序列相关,则为真实的序列相关。对于真实的序列相关可采用如下方法予以消除。广义差分法Cochrane-Orcutt迭代法

其它方法:一阶差分法德宾两步法

广义差分法

对于序列相关的结构已知的情形可采用广义差分法解决。

由于随机误差项ut是不可观测的,通常我们假定ut为一阶自回归形式,即ut

=ρut-1+vt(5.25)其中,|ρ|<1,vt为经典误差项。

当序列相关系数为已知时,使用广义差分法,序列相关问题就可彻底解决。我们以一元线性回归模型为例说明广义差分法的应用。

对于一元线性回归模型

(5.26)将模型(5.26)滞后一期可得(5.27)用ρ

乘式(5.27)两边,得

(5.28)用式(5.26)减去式(5.28)可得(5.29)模型,随机误差项无序列相关。式(5.29)中,ut-ρut-1=vt

是经典误差项。因此,模型(5.29)已经是经典线性回归令

则式(5.29)可表示为:(5.30)

对模型(5.30)使用普通最小二乘估计就会得到参数估计的最佳线性无偏估计量。

式(5.29)称为广义差分方程,因为被解释变量与解释变量均为现期值减去前期值的一部分,由此而得名。

在进行广义差分时,解释变量X与被解释变量Y均以差分形式出现,因而样本容量由n减少为n-1,即丢失了第一个观测值。如果样本容量较大,减少一个观测值对估计结果影响不大。但是,如果样本容量较小,则对估计精度产生较大的影响。此时,可采用普莱斯-温斯滕(Prais-Winsten)变换,将第一个观测值变换为补充到差分序列中,再使用普通最小二乘法估计参数。

第六章多重共线性第一节多重共线性的定义一、多重共线性的含义

在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括完全的多重共线性,还包括不完全的多重共线性。

如果存在不全为0的数

,使得则称解释变量之间存在着完全的多重共线性。当Rank(X)<k时,表明在数据矩阵X中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。对于解释变量

不完全的多重共线性

实际中,常见的情形是解释变量之间存在不完全的多重共线性。对于解释变量,存在不全为0的数,使得

为随机变量。这表明解释变量只是一种近似的线性关系。其中,回归模型中解释变量的关系

可能表现为三种情形:(1)

,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数j都可以通过Y对Xj的一元回归来估计。

,解释变量间完全共线性。此时模型参数将无法确定。

,解释变量间存在一定程度的线性关系。实际中常遇到的情形。(2)(3)

二、产生多重共线性的原因

多重共线性产生的经济原因主要有几种情形:

1、经济变量之间具有共同变化趋势。

2、模型中包含滞后变量。

3、利用截面数据建立模型也可能出现多重共线性。

4、样本数据自身的原因。第二节多重共线性产生的后果一、完全多重共线性产生的后果1、参数的估计值不确定当解释变量完全线性相关时——OLS估计式不确定▲从偏回归系数意义看:在和完全共线性时,无法保持不变,去单独考虑对Y的影响(和的影响不可区分)▲从OLS估计式看:可以证明此时2、参数估计值的方差无限大OLS估计式的方差成为无穷大二、不完全多重共线性下产生的后果

如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量经济分析可能会产生一系列的影响。

1、参数估计值的方差增大当增大时也增大

2、对参数区间估计时,置信区间趋于变大

3、假设检验容易作出错误的判断

4、可能造成可决系数较高,但对各个参数单独的t检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。第三节多重共线性的检验一、简单相关系数检验法含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。注意事项:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。二、方差扩大(膨胀)因子法

含义:统计上可以证明,解释变量的参数估计值的方差可表示为

其中的是变量(VarianceInflationFactor),即的方差扩大因子其中是多个解释变量辅助回归的可决系数

经验规则

方差膨胀因子越大,表明解释变量之间的多重共线性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。经验表明,方差膨胀因子≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。三、直观判断法(1)当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。

(2)从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。

(3)有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。

(4)解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。四、逐步回归检测法

逐步回归的基本思想将变量逐个的引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。第四节多重共线性的补救措施一、修正多重共线性的经验方法1、剔除变量法把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。可能引起模型的设定误差。2、增大样本容量如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的数据可以改进模型参数的估计。3、变换模型形式一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可以有效地降低出现共线性的可能性,此时可直接估计差分方程。差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。4、利用非样本先验信息通过经济理论分析能够得到某些参数之间的线性关系,可以将这种线性关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。5、横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。包含假设:参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。6、变量变换变量变换的主要方法:(1)计算相对指标(2)将名义数据转换为实际数据(3)将小类指标合并成大类指标变量数据的变换只是有时可得到较好的结果,但谁也无法保证一定可以得到很好的结果。二、逐步回归法

(1)用被解释变量对每一个所考虑的解释变量做简单回归。

(2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。

若新变量的引入改进了R2和F检验,且回归参数的t检验在统计上也是显著的,则在模型中保留该变量。若新变量的引入未能改进R2和F检验,且对其他回归参数估计值的t检验也未带来什么影响,则认为该变量应该舍弃。若新变量的引入未能改进R2和F检验,且显著地影响了其他回归参数估计值的数值或符号,同时本身的回归参数也通不过t检验,说明出现了严重的多重共线性,应剔除该变量。THANKS结束了!安全阀基本知识如果压力容器(设备/管线等)压力超过设计压力…1.尽可能避免超压现象堵塞(BLOCKED)火灾(FIRE)热泄放(THERMALRELIEF)如何避免事故的发生?2.使用安全泄压设施爆破片安全阀如何避免事故的发生?01安全阀的作用就是过压保护!一切有过压可能的设施都需要安全阀的保护!这里的压力可以在200KG以上,也可以在1KG以下!设定压力(setpressure)安全阀起跳压力背压(backpressure)安全阀出口压力超压(overpressure)表示安全阀开启后至全开期间入口积聚的压力.几个压力概念弹簧式先导式重力板式先导+重力板典型应用电站锅炉典型应用长输管线典型应用罐区安全阀的主要类型02不同类型安全阀的优缺点结构简单,可靠性高适用范围广价格经济对介质不过分挑剔弹簧式安全阀的优点预漏--由于阀座密封力随介质压力的升高而降低,所以会有预漏现象--在未达到安全阀设定点前,就有少量介质泄出.100%SEATINGFORCE75502505075100%SETPRESSURE弹簧式安全阀的缺点过大的入口压力降会造成阀门的频跳,缩短阀门使用寿命.ChatterDiscGuideDiscHolderNozzle弹簧式安全阀的缺点弹簧式安全阀的缺点=10090807060500102030405010%OVERPRESSURE%BUILT-UPBACKPRESSURE%RATEDCAPACITY普通产品平衡背压能力差.在普通产品基础上加装波纹管,使其平衡背压的能力有所增强.能够使阀芯内件与高温/腐蚀性介质相隔离.平衡波纹管弹簧式安全阀的优点优异的阀座密封性能,阀座密封力随介质操作压力的升高而升高,可使系统在较高运行压力下高效能地工作.ResilientSeatP1P1P2先导式安全阀的优点平衡背压能力优秀有突开型/调节型两种动作特性可远传取压先导式安全阀的优点对介质比较挑剃,不适用于较脏/较粘稠的介质,此类介质会堵塞引压管及导阀内腔.成本较高.先导式安全阀的缺点重力板式产品的优点目前低压储罐呼吸阀/紧急泄放阀的主力产品.结构简单.价格经济.重力板式产品的缺点不可现场调节设定值.阀座密封性差,并有较严重的预漏.受背压影响大.需要很高的超压以达到全开.不适用于深冷/粘稠工况.几个常用规范ASMEsectionI-动力锅炉(FiredVessel)ASMEsectionVIII-非受火容器(UnfiredVessel)API2000-低压安全阀设计(LowpressurePRV)API520-火灾工况计算与选型(FireSizing)API526-阀门尺寸(ValveDimension)API527-阀座密封(SeatTightness)介质状态(气/液/气液双相).气态介质的分子量&Cp/Cv值.液态介质的比重/黏度.安全阀泄放量要求.设定压力.背压.泄放温度安全阀不以连接尺寸作为选型报价依据!如何提供高质量的询价?弹簧安全阀的结构弹簧安全阀起跳曲线弹簧安全阀结构弹簧安全阀结构导压管活塞密封活塞导向不平衡移动副(活塞)导管导阀弹性阀座P1P1P2先导式安全阀结构先导式安全阀的工作原理频跳安全阀的频跳是一种阀门高频反复开启关闭的现象。安全阀频跳时,一般来说密封面只打开其全启高度的几分只一或十几分之一,然后迅速回座并再次起跳。频跳时,阀瓣和喷嘴的密封面不断高频撞击会造成密封面的严重损伤。如果频跳现象进一步加剧还有可能造成阀体内部其他部分甚至系统的损伤。安全阀工作不正常的因素频跳后果1、导向平面由于反复高频磨擦造成表面划伤或局部材料疲劳实效。2、密封面由于高频碰撞造成损伤。3、由于高频振颤造成弹簧实效。4、由频跳所带来的阀门及管道振颤可能会破坏焊接材料和系统上其他设备。5、由于安全阀在频跳时无法达到需要的排放量,系统压力有可能继续升压并超过最大允许工作压力。安全阀工作不正常的因素A、系统压力在通过阀门与系统之间的连接管时压力下降超过3%。当阀门处于关闭状态时,阀门入口处的压力是相对稳定的。阀门入口压力与系统压力相同。当系统压力达到安全阀的起跳压力时,阀门迅速打开并开始泄压。但是由于阀门与系统之间的连接管设计不当,造成连接管内局部压力下降过快超过3%,是阀门入口处压力迅速下降到回座压力而导致阀门关闭。因此安全阀开启后没有达到完全排放,系统压力仍然很高,所以阀门会再次起跳并重复上述过程,既发生频跳。导致频跳的原因导致接管压降高于3%的原因1、阀门与系统间的连接管内径小于阀门入口管内径。2、存在严重的涡流现象。3、连接管过长而且没有作相应的补偿(使用内径较大的管道)。4、连接管过于复杂(拐弯过多甚至在该管上开口用作它途。在一般情况下安全阀入口处不允许安装其他阀门。)导致频跳的原因B、阀门的调节环位置设置不当。安全阀拥有喷嘴环和导向环。这两个环的位置直接影响安全阀的起跳和回座过程。如果喷嘴环的位置过低或导向环的位置过高,则阀门起跳后介质的作用力无法在阀瓣座和调节环所构成的空间内产生足够的托举力使阀门保持排放状态,从而导致阀门迅速回座。但是系统压力仍然保持较高水平,因此回座后阀门会很快再次起跳。导致频跳的原因C、安全阀的额定排量远远大于所需排量。

由于所选的安全阀的喉径面积远远大于所需,安全阀排放时过大的排量导致压力容器内局部压力下降过快,而系统本身的超压状态没有得到缓解,使安全阀不得不再次起跳频跳的原因阀门拒跳:当系统压力达到安全阀的起跳压力时,阀门不起跳的现象。安全阀工作不正常的因素1、阀门整定压力过高。2、阀门内落入大量杂质从而使阀办座和导套间卡死或摩擦力过大。3、弹簧之间夹入杂物使弹簧无法被正常压缩。4、阀门安装不当,使阀门垂直度超过极限范围(正负两度)从而使阀杆组件在起跳过程中受阻。5、排气管道没有被可靠支撑或由于管道受热膨胀移位从而对阀体产生扭转力,导致阀体内机构发生偏心而卡死。安全阀拒跳的原因阀门不回座或回座比过大:安全阀正常起跳后长时间无法回座,阀门保持排放状态的现象。安全阀工作不正常的因素1、阀门上下调整环的位置设置不当。2、排气管道设计不当造成排气不畅,由于排气管道过小、拐弯过多或被堵塞,使排放的蒸汽无法迅速排出而在排气管和阀体内积累,这时背压会作用在阀门内部机构上并产生抑制阀门关闭的趋势。3、阀门内落入大量杂质从而使阀瓣座和导套之间卡死后摩擦力过大。安全阀不回座或回座比过大的因素:4、弹簧之间夹入杂物从而使弹簧被正常压缩后无法恢复。5、由于对阀门排放时的排放反力计算不足,从而在排放时阀体受力扭曲损坏内部零件导致卡死。6、阀杆螺母(位于阀杆顶端)的定位销脱落。在阀门排放时由于振动使该螺母下滑使阀杆组件回落受阻。安全阀不回座或回座比过大的因素:7、由于弹簧压紧螺栓的锁紧螺母松脱,在阀门排放时由于振动时弹簧压紧螺栓松动上滑导致阀门的设定起跳值不断减小。

8、阀门安装不当,使阀门垂直度超过极限范围(正负两度)从而使阀杆组件在回落过程中受阻。

9、阀门的密封面中有杂质,造成阀门无法正常关闭。

10、锁紧螺母没有锁紧,由于管道震动下环向上运动,上平面高于密封面,阀门回座时无法密封安全阀不回座或回座比过大的因素:谢谢观看癌基因与抑癌基因oncogene&tumorsuppressorgene24135基因突变概述.癌基因和抗癌基因的概念.癌基因的分类.癌基因产物的作用.癌基因激活的机理主要内容疾病:

——是人体某一层面或各层面形态和功能(包括其物质基础——代谢)的异常,归根结底是某些特定蛋白质结构或功能的变异,而这些蛋白质又是细胞核中相应基因借助细胞受体和细胞中信号转导分子接收信号后作出应答(表达)的产物。TranscriptionTranslationReplicationDNARNAProtein中心法规Whatisgene?基因:

—是遗传信息的载体

—是一段特定的DNA序列(片段)

—是编码RNA或蛋白质的一段DNA片段

—是由编码序列和调控序列组成的一段DNA片段基因主宰生物体的命运:微效基因的变异——生物体对生存环境的敏感度变化关键关键基因的变异——生物体疾病——死亡所以才有:“人类所有疾病均可视为基因病”之说注:如果外伤如烧伤、骨折等也算疾病的话,外伤应该无法归入基因病的行列。Genopathy问:两个不相干的人,如果他们患得同一疾病,致病基因是否相同?再问:同卵双生的孪生兄弟,他们患病的机会是否一样,命运是否相同?┯┯┯┯

ATGC

TACG

┷┷┷┷┯┯┯┯┯

ATAGC

TATCG

┷┷┷┷┷┯┯┯┯

ATGC

TACG

┷┷┷┷┯┯┯

AGC

TCG

┷┷┷┯┯┯┯

ACGC

TGCG

┷┷┷┷┯┯┯┯

ATGC

TACG

┷┷┷┷增添缺失替换DNA分子(复制)中发生碱基对的______、______

,而引起的

的改变。替换增添缺失基因结构基因变异的概念:英语句子中的一个字母的改变,可能导致句子的意思发生怎样的变化?可能导致句子的意思不变、变化不大或完全改变THECATSATONTHEMATTHECATSITONTHEMATTHEHATSATONTHEMATTHECATONTHEMAT同理:替换、增添、缺失碱基对,可能会使性状不变、变化不大或完全改变。基因的结构改变,一定会引起性状的改变??原句:1.基因多态性与致病突变基因变异与疾病的关系2.单基因病、多基因病3.疾病易感基因

基因多态性polymorphism是指DNA序列在群体中的变异性(差异性)在人群中的发生概率>1%(SNP&CNP)<1%的变异概率叫做突变基因多态性特定的基因多态性与疾病相关时,可用致病突变加以描述SNP:散在单个碱基的不同,单个碱基的缺失、插入和置换。

CNP:DNA片段拷贝数变异,包括缺失、插入和重复等。同义突变、错义突变、无义突变、移码突变

致病突变生殖细胞基因突变将突变的遗传信息传给下一代(代代相传),即遗传性疾病。体细胞基因突变局部形成突变细胞群(肿瘤)。受精卵分裂基因突变的原因物理因素化学因素生物因素基因突变的原因(诱发因素)紫外线、辐射等碱基类似物5BU/叠氮胸苷等病毒和某些细菌等自发突变DNA复制过程中碱基配对出现误差。UV使相邻的胸腺嘧啶产生胸腺嘧啶二聚体,DNA复制时二聚体对应链空缺,碱基随机添补发生突变。胸腺嘧啶二聚体胸腺嘧啶胸腺嘧啶紫外线诱变物理诱变(physicalinduction)

5溴尿嘧啶(5BU)与T类似,多为酮式构型。间期细胞用酮式5BU处理,5BU能插入DNA取代T与A配对;插入DNA后异构成烯醇式5BU与G配对。两次DNA复制后,使A/T转换成G/C,发生碱基转换,产生基因突变。化学诱变(chemicalinduction)碱基类似物(baseanalogues)诱变AT5-BUA5-BUAAT5-BU5-BU(烯醇式)

(酮式)GGC1.生物变异的根本来源,为生物进化提供了最初的原始材料,能使生物的性状出现差别,以适应不同的外界环境,是生物进化的重要因素之一。2.致病突变是导致人类遗传病的病变基础。基因突变的意义概述:肿瘤细胞恶性增殖特性(一)肿瘤细胞失去了生长调节的反馈抑制正常细胞受损,一旦恢复原状,细胞就会停止增殖,但是肿瘤细胞不受这一反馈机制抑制。(二)肿瘤细胞失去了细胞分裂的接触抑制。正常细胞体外培养,相邻细胞相接触,长在一起,细胞就会停止增殖,而肿瘤细胞生长满培养皿后,细胞可以重叠起生长。(三)肿瘤细胞表现出比正常细胞更低的营养要求。(四)肿瘤细胞生长有一种自分泌作用,自己分泌生长需要的生长因子和调控信号,促进自身的恶性增殖。Whatisoncogene?癌基因——是基因组内正常存在的基因,其编码产物通常作为正调控信号,促进细胞的增殖和生长。癌基因的突变或表达异常是细胞恶性转化(癌变)的重要原因。——凡是能编码生长因子、生长因子受体、细胞内信号转导分子以及与生长有关的转录调节因子等的基因。如何发现癌基因的呢?11910年,洛克菲勒研究院一个年轻的研究员Rous发现,鸡肉瘤细胞裂解物在通过除菌滤器以后,注射到正常鸡体内,可以引起肉瘤,首次提出鸡肉瘤可能是由病毒引起的。0.2m孔径细菌过不去但病毒可以通过从病毒癌基因到细胞原癌基因的研究历程:Roussarcomavirus,RSVthefirstcancer-causingretrovirus1958年,Stewart和Eddy分离出一种病毒,注射到小鼠体内可以引起肝脏、肾脏、乳腺、胸腺、肾上腺等多种组织器官的肿瘤,因而把这种病毒称为多瘤病毒。50年代末、60年代初,癌病毒研究成了一个极具想像力的研究领域,主流科学家开始进入癌病毒研究领域polyomavirus这期间,Temin发现RSV有不同亚型,且引起细胞恶变程度不同,推测RNA病毒将其遗传信息传递给了正常细胞的DNA。这与Crick提出的中心法则是相违背的让事实屈从于理论还是坚持基于实验的结果?VSTemin发现逆转录酶,1975年获诺贝尔奖TeminCrickTemin的实验设计:实验设计简单而巧妙:将合成DNA所需的“原料”,即A、T、C、G四种脱氧核苷酸,与破坏了外壳的RSV一起在体外40℃的条件下温育一段时间结果在试管里获得了一种新合成的大分子,它不能被RNA酶破坏,但却可以被DNA酶所分解,证明这种新合成的大分子是DNA用RNA酶预先破坏RSV的RNA,再重复上述的试验,则不能获得这种大分子,说明这个DNA大分子是以RSV的RNA为模板合成的1969年,一个日本学者里子水谷来到Temin的实验室,这是一个非常擅长实验的年轻科学家。按Temin的设想,他们开始寻找RSV中存在“逆转录酶”的证据DNA

RNA

ProteinTranscriptionTranslationReplicationReplicationRe-Transcription修正中心法规据说,1975年Temin因发现逆转录酶而获诺贝尔奖时,Bishop懊恼不已,因为早在1969年他就认为Temin的RNADNA的“前病毒理论”有可能是正确的,并且也进行了一些实验,但不久由于资深同事的规劝而放弃了这方面的努力。但Bishop马上意识到:逆转录酶的发现为逆转录病毒致癌的研究提供了一条新途径。一个RSV,三个诺贝尔奖!!!1989年,UCSF的Bishop和Varmus根据逆转录病毒的复制机制发现了细胞癌基因,并获诺贝尔奖。Cellularoncogene启示:Perutz说:“科学创造如同艺术创造一样,都不可能通过精心组织而产生”Bishop说:“许多人引以为豪的是一天工作16小时,工作安排要以分秒计……可是工作狂是思考的大敌,而思考则是科学发现的关键”Perutzsharedthe1962NobelPrizeforChemistrywithJohnKendrew,fortheirstudiesofthestructuresofhemoglobinandglobularproteins科学的本质和艺术一样,都需要直觉和想像力请给自己一些思考的时间吧!癌基因的分类目前对癌基因尚无统一分类的方法,一般有下面3种分类方法:一、按结构特点分(6)类(一)src癌基因家族(二)ras癌基因家族(三)sis癌基因家族(四)myc癌基因家族(五)myb癌基因家族(六)其它:如fos,erb-A等。三、按细胞增殖调控蛋白特性分成(4)类(一)生长因子(二)受体类(三)细胞内信号转换器(四)细胞核因子二、按产物功能分(8)类(一)生长因子类(二)酪氨酸蛋白激酶(三)膜相关G蛋白(四)受体,无蛋白激酶活性(五)胞质丝氨酸-苏氨酸蛋白激酶(六)胞质调控因子(七)核反式调控因子(八)其它:db1、bcl-2癌基因产物参与信号转导

胞外信号作用于膜表面受体→胞内信使物质的生成便意味着胞外信号跨膜传递的完成。胞内信使至少有:cAMP(环磷酸腺苷)IP3(三磷酸肌醇)PG(前列腺素)cGMP(环磷酸鸟苷)DG(二酰基甘油)Ca2+(钙离子)CAM(钙调素)主要机制是通过蛋白激酶活化引起底物蛋白一连串磷酸化的生物信号反应过程,跨膜机制涉及到:(一)质膜上cAMP信使系统(二)质膜上肌醇脂质系统这两个系统都是由受体鸟苷酸调节蛋白(GTP-regulatoryprotein,G蛋白)和效应酶(腺苷酸环化酶磷脂酶等)组成,有相似的信号转导过程:即受体活化后引起GTP与不同G蛋白结合活化和抑制效应酶从而影响胞内信使产生而发生不同的调控效应。(三)受体操纵的离子通道系统(四)受体酪氨酸蛋白激酶的转导

(一)获得性基因病

(acquiredg

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论