版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 古扎拉蒂计量经济学4人大版读书笔记第一章 回归分析的性质“回归”一词是费朗西斯·高尔顿在研究子女身高与父母身高的关系时提出来的,他发现,给定父母的身高,子女的身高会趋向于或“回归”到总人口的平均身高。换言之,父母异常高或异常矮,其儿子的身高都会趋向于或回归到所有男子的平均身高。统计关系与确定性关系的区别:先看了解什么叫确定性关系,某个应变量确定的依赖于自变量,数学中和经典物理学中的各种定律都是确定性的关系,比如宇宙间两个粒子的引力离,k是比例常数,给定两个粒子质量和他们间的距离,那么他们之间的引力随机可以确定,而且是唯一的。而统计关系是不确定性的,应变量和自变量间是统计依赖关系,给
2、定解释变量的某个取值,不能预测因变量的确定取值,因为这时因变量的取值有着概率分布围,所以我们说它是一个随机变量,如农作物的收成对气温、降雨量、光照条件的依赖关系是统计性质的,这个性质的意义在于影响农作物的因素(变量)还有很多很多,无法一一辨认出来,无论考虑的多少个解释变量,都无法完全解释农作物收成这个因变量,所以它在的或随机的变异是存在的。回归和因果:统计关系式本身不能意味着任何因果关系,回归分析研究一个变量对另一些变量的依赖关系但他们绝不是因果关系。对于因果关系的理念,必须来自与统计学之外的经验或者理论,比如说用经济学的理论来说明价格对需求变动的影响。回归与相关的区别:回归区分哪个是解释变量
3、,哪个是被解释变量(因变量),相关不区分两者,也就是说前者变量间是不对称的,后者变量间是对称的。另一方面,相关分析中的所有变量被看作都是随机的,而回归分析则基于以下假定:因变量是随机的,而解释变量是固定的或者非随机的。给定每个x,都有很多相应的y值(即y有一个分布围),但不可能知道每一个y的值,所以我们用回归线来预测y的均值第2章 回归分析的一些基本概念1、 条件均值(条件期望值):为什么叫“条件”?因为他们取决于(条件)变量x的给定值,E(Y|Xi)读成给定X下Y的期望值,与E(Y)的区别:E(Y)是总体的Y的均值2、 随机或统计总体回归函数(statistical PRF):E(Y|Xi)
4、=B1+B2Xi;非随机的或确定的总体回归函数(non-stochastic PRF):Yi=B1+B2Xi+i,i的方差记为2。3、 样本回归函数(SRF):Yi=b1+b2Xi;随机样本回归函数:Yi=b1+b2Xi+ei,各小写字母都是总体回归函数中对应大写字母的估计量。ei的方差记为,是真正的但未知的2的OLS估计量。开方的正数(公式中的符号帽改为e,其他不变)被称为回归估计的标准误差(标准误),即Y对估计的回归线的离差的标准差,用于衡量所估计的回归线的拟合优度(goodness of fit)。4、 标准误和标准差的区别(个人理解):标准误衡量的是一个估计量的精度问题,标准误越大,估
5、计量对真实值的估计就越不精准;标准差则是一组数据的离散程度的度量,标准差越大,该组数据越离散。第3章 双变量模型:估计问题1、 最小二乘法(点估计):A、样本回归函数中使用;B、使得ei2=f(b1,b2),要使minei2,分别对b1,b2的偏导等于零的时候可以使得ei2最小,得出正规方程1 (可以这样记忆:就是SRFi加和)、2(可以这样记忆就是SRFi*Xi再加和);C、通过简单代数运算求得,2、 经典线性回归模型(CLRM):最小二乘法的基本假定(都是针对PRF而不是SPF的)假定1:回归模型对参数而言是线性的。Yi=B1+B2Xi+i假定2:在重复抽样中X值是固定的,即X是非随机的。
6、每一个固定的Xi值都会有一个Y总体(即给定一个Xi值会有若干个Y值对应),而且每次抽样(重复抽样)的时候Xi都是同一个值,来看Y是怎么如何取值的,这意味着我们的分析是条件回归分析,即以回归元X的给定值作为条件的。假定3:干扰项i的均值为零。E(i|Xi)=0。给定X,对应的Y值都是围绕其均值分布的,最终Y与其均值的离差会互相抵消,所以i的均值为零。这意味着凡是模型未包含的且归属于i的因素对Y的平均影响为零。假定4:同方差性或者的i方差相等。这意味着给定X值的Y总体有一样的分布或一样的方差同方差假定5:各干扰项之间无自相关。给定两个X值,Xi和Xj(i不等于j),i和j的相关性为零。设想i和j正
7、相关,那么Yi不仅依赖于Xi而且依赖于j,因为j在一定程度上决定了i。假定6:Xi和i的协方差为零。干扰项和解释变量X是不相关的,即可以区分Y受到的只是X的影响,而不会收到随机干扰项中未纳入模型的因素的影响。假定7:观测次数n必须大于待估计的参数个数。假定8:X值要有变异性。给定一个样本,X值不可以全是一样的。假定9:正确的设定了回归模型。即在经验分析中,模型没有设定偏差。假定10:没有完全的多重共线性。即解释变量之间没有完全的线性关系。3、 在统计学中一个估计量的精密度(或者可靠性)可以用它的标准误(se)来度量。4、 最小二乘估计量的性质:高斯-马尔可夫定理、最优线性无偏估计(BLUE)。
8、5、 (样本)判定系数r2:“拟合优度”的一个度量。r2测度了在Y的总变异中由回归模型解释的部分所占的百分比。而r2的开平方根r则是样本的相关系数。在对时间序列数据的回归常能得到很高的r2值,而横截面数据的回归中得到r2的值较低是因为样本单位的分散性所致。第4章 经典正态线性回归模型1、 i的正态性假定:i(0,2)2、 正态性假定下估计的性质:b1(B1,b12),b2(B2,b22)第5章 双变量回归:区间估计与假设检验1、 B1、B2、2三个统计量的区间估计(运用OLS计算得出的b1、b2、是点估计值):构造t变量、B1的置信区间、B2的置信区间、构造2变量、2的置信区间、2、 假设检验
9、:(1) 置信区间法:一个决策规则(2) 显著性检验法:两个决策规则3、 显著性检验的决策语言:4、 2倍t经验法则:双侧、单侧5、 两类错误的相对代价:6、 精确的显著性水平p值:|t|(t=)值越大,估计的b2值越远离假设的B2值,则说明数据(样本)越不支持虚拟假设(H0:B2=0),真实的B2不等于零就越显著,查t表可知同样自由度下,|t|越大,p值越小。在回归结果中,p值与|t|成反向变动,t统计量的p值(即t等于多少时,对应的p值是多少)是精确的显著性水平(),p值越小B2不等于零就越显著。7、 P值判断:对于双边检验,当P值小于(给定的置信水平)时即可判断通过t检验;对于单边检验,
10、当P/2值小于(给定的置信水平)时,即可判断通过t检验。8、 回归分析与方差分析:第10章 多重共线性1、 完全共线性和近似共线性:完全的多重线性关系即X间有准确的线性函数关系,如下面情形:。不完全的多重共线性(近似共线性)即X间不是准确的线性函数关系,而是高度相关关系,如。完全共线性的情形用ols估计各参数是不可能的,近似共线性的情形中,不管相关度有多高,只要不等于1,用ols估计各参数都是可能的。2、 注意:多重共线性仅对X变量之间的线性关系而言的,若解释变量之间有非线性关系,比如变量X1和X12是非线性的函数关系,严格的讲并不违反无多重共线性假定。但这种情况,X1和X12是的相关系数将会
11、接近1,那么他们的系数将很难准确(即以较小的标准误差估计)。另外,由于多重共线性是对假定的非随机的解释变量之间的关系而言的,所以它是一种样本现象,而非总体特征;多重共线性是一个程度问题而不是有无问题,有意义的程度不在于有无之间而在于它的不同的程度。3、 多重共线性的实际后果:4、 多重共线性的做题步骤:A、 根据ols结果初步判断:观察因变量对所有自变量回归模型的结果,看各系数的经济意义是否与预期一致以与是否存在高R2和F值而部分系数小t值的情况,如果存在,则初步认为解释变量间存在多重共线性。B、 找出是哪些变量间存在多重共线性:对各x进行相关系数分析,若存在两变量间相关系数0.8的情况,则可
12、认为此两变量高度相关。C、 单独回归、辅助回归和逐步回归求最优模型:Y对各自变量分别回归(单独回归),对Ri2值进行排序,选Ri2值最大的自变量作为初始回归模型逐步引入各个X自变量进行逐步回归,每引入一个X自变量都要观察其回归结果的t值,对t值不显著的予以剔除(剔除该X自变量)。最后仅以留下来的自变量为回归元做最优的回归模型。5、 利用差分法消除多重共线性:由于多重共线性会引起各种实际后果(如3所说),在现实工作中,如果选取的必须变量(特别是时间序列变量)存在着多重共线性,为了提高模型的精确度,可以用差分法消除变量间的多重共线性。可以用增量或增长率来作为变量,如Y对Xi进行回归,从而消除多重共
13、线性。A、 一次差分形式(增量):B、 比率变换:C、 A和B的缺陷:第11章 异方差:误差的方差不是常数会怎么样?1、 异方差的缘由:2、 异方差情形用ols估计后果:b2已经不是BLUE,不是“有效的”或“最优的”,但仍是线性的和无偏的。不是“最优的”意味着b2在线性无偏估计量一类中不是最小方差。3、 异方差的诊断:方法多种多样,下面仅介绍三种方法,着重掌握C。A、 问题的性质:往往根据所考虑的性质就能判断是否存在异方差性,例如,在储蓄对收入的回归模型中,残差的方差随着收入的增加而增加;又如,在打字出错率对训练时间的回归中,残差的方差随训练时间的增多而变小(这是由于边错边改学习模型决定的)
14、。B、 图解法:在做题时首选的方法,a、可想利用ols的 回归结果将对Y帽做散点图,看是否呈现出一定的关系样式,并确定是单调递增、单调递减还是复杂型;b、也可以做和解释变量之一做散点图,当双变量模型时结果是和a一样的,当多变量模型时,可以根据A判断异方差是那个变量引起的,做和该变量的散点图确定是单调递增、单调递减还是复杂型。C、 A和B都是非正式的方法,正式的方法常用怀特检验:4、 异方差的修正:加权最小二乘法在实际操作中人们通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法5、第12章 自相关:误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024居间合同范本
- 2024年专业俱乐部租赁场地合同样本版B版
- 2024年农产品供应链优化解决方案合同
- 2024模板木枋购销合同模板
- 二零二四年股权投资合同标的详细描述2篇
- 2024企业管理资料范本建筑工人劳动合同(样本)
- 2024布线产品买卖合同
- 2024买卖合同法律性质
- 2024天猫店铺代运营合同协议书范本 标准版
- 2024个人商业房产买卖正式协议样本版B版
- 护理管理质量检查标准
- 慢阻肺高危人群早期筛查与综合干预实施方案
- 盾构始发、管片拼装安全操作规程
- 卫生检查记录表
- 土地开发整理规划设计之农田防护和水土保持工程
- 《南极条约》
- 化工精馏知识考试题库及答案
- 建设工程施工合同 GF—2017—0201
- 第13章国民收入的决定:IS-LM模型
- 幼儿园大班小小播报员ppt课件
- 《建筑施工组织与管理课程设计》
评论
0/150
提交评论