线性回归基本假设_第1页
线性回归基本假设_第2页
线性回归基本假设_第3页
线性回归基本假设_第4页
线性回归基本假设_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 线性回归基本假设西方经济学 张若然 20112115281.什么是回归? 例1:子女的身高和父亲身高的关系 160 165 170 175175170165160父亲的身高子女的身高设定父亲身高是已知的,研究父亲身高对子女平均身高之间的影响关系解释变量(已知)被解释变量(因变量)回归分析均值回归线 回归分析是研究一个因变量或多个解释变量的依赖关系,其用意是在于通过后者(在重复抽样中)的已知或者设定值,去估计和(或)预测前者的(总体)均值。2 相关关系与因果关系 “贫困妇女患子宫颈癌的可能性要高出富裕家庭妇女的3倍。”这是英国科学家对177名宫颈癌患者进行20个月的研究后得出的结论。研究表明,

2、妇女的生活越是贫困,患宫颈癌的几率越大,肿瘤的生长速度就越猛越快。英国研究人员霍尔教授指出,缺乏蔬菜和水果的饮食结构,再加上吸烟可能是宫颈癌快速生长的一个非常重要的因素。 很多科学家认为宫颈癌的发病原因跟人的营养结构有很大的关系 在90年代的时候经过科学家的不断努力宫颈癌成为目前唯一一个病因明确的妇科恶性肿瘤,与高危型人乳头瘤病毒(human papillomaviruses, HPV)的持续感染是宫颈癌的主要病因。相关关系因果关系2.模型的基本假设(概述)经典假设经典假设221. 2. ()0 () (,)03.(,)04. (0,)5.iiiiijiijXEVarCovijCov XNX

3、解释变量是确定性变量,不是随机变量,而且在重复抽样中取固定值随机干扰项 零均值、同方差、不序列相关性()随机干扰项与解释变量之间不相关,即随机干扰项服从零均值、同方差、零协方差的正态分布,即随着样本容量的无限增加,解释变量 的样6.本方差趋于 一个有限的常数回归模型是正确设定的暗含的暗含的假定假定保证估计参数的无偏性无偏性保证估计参数的有效性有效性即应用抽样样本所得到的参数估计值和整体样本的参数值相一致2模型的基本假设(解释变量) 1 解释变量是确定性变量,不是随机变量.2解释变量之间互不相关.3做相关分析,剔除高度相关的解释变量 我们分析父母的学历对子女的学历之间的影响的时候,作为解释变量的

4、父母学历是确定的,而其他的解释变量依然会有很多,例如家庭收入等,但是父母的IQ不应该作为解释变量出现,因为IQ和父母学历是高度相关的。那么我们可以得出关于解释变量的三个基本假设、2.模型的基本假设(零均值假定) 例2 居民收入和居民消费之间的关系100150200250300350400450500居(Y)80135150200270320365425480民75120140190265310340400450消65 100100240 250325380410470费70110180220290240390440490共计29046557085010751195147516751890E(Y

5、|X)72.5116.25142.5212.5268.75298.75368.75418.75472.5居民收入XE(Y|X)的含义:例如当居民的收入(X)为100的条件下居民的消费(Y)的平均值为多少 100 150 200 250 300 350 400 450 50030050045040035055025020015010050E(Y|X)的连线ui=Yi-E(Y|Xi) 给定收入水平X的居民的支出聚集在收入为X的平均支出的周围,也就是围绕着条件均值而分布。因此我们可以将Yi围绕着它的条件均值的差为Yi=E(Y|Xi)+uiYi=E(Y|Xi)+ui=1+2Xi+ui这表示对X的每个观

6、测值来说, u可以取不同的值,有些大于零,有些小于零,考虑u的所有可能取值,他们的总体平均值等于零.即E(Ui)=0Y1=80=1+2(100)+u1Y2=75=1+2(100)+u2Y3=65=1+2(100)+u3Y4=70=1+2(100)+u42.模型的基本假设(同方差假定) i=1,2, 2 ()iVar 这表明在各次观测中u具有相同的方差,也就是各次观测所受的随机影响的程度相同. 两个铁球同时着地是人教版小学语文四年级的一篇课文,文章中意大利科学家伽利略在比萨斜塔做的一项实验,验证了重量不同的铁球落地所需要的时间是相同的。如果伽利略做实验时是将两个大小相同的实心铁球和空心铁球同时从

7、高塔上抛下,研究铁球落地时间和铁球重量之间的关系,那么风作为随机影响误差对于每次的影响是相同的。例5:前一段时间社会广泛关注高管薪资问题,8大上市银行高管收入相继曝光,最高年薪近千万元,人民日报刊登时应用了“高管、员工两重天”的标题。我们知道影响收入的因素可能有学历、年龄、性别、职位等等。而在同一家公司中不同职位的就职者可能有不同的收入水平,职位较高的人可能就会有较高的收入,而职位则收入相对较低。他们偏离平均工资的程度是不同的,这同样也成为异方差。 与同方差假定相对应的就是异方差假定2模型的基本假设(无序列相关假定) Cov(ui , uj)=0 ij i,j= 1,2, 例如:2013年5月

8、1日希腊进行了大规模的罢工行动那么希腊第二季度的产出一定会收到一定程度的影响,但是我们不能就推断出这一生产的中断会持续到第三季度,也就是说即使本季度的产出下降,我们也没有理由预期下一季度产出依然会下降。再比例如说如果我预期我下个月工资会上升,我这个月很有可能就会某种程度上增加我的支出,但是我的预期不会影响另一个家庭的支出 与序列无关相对应的是序列相关Cov(ui , uj)0 example1:研究收入和消费之间关系时如果某人在1月份在银行进行了贷款,那么一定会影响到他未来一段时间的消费。 example2:农作物供给和价格之间的关系中,今年年初的作物种植还受去年价格的影响。 example3:在研究就业率和毕业生人数的关系时,今年的就业率还受去年经济情况的影响。模型的基本假设(解释变量与误差项不相关假定) Cov(Xi, ui)=0 i=1,2, 这一假定表明随机项u与自变量x不相关.ux

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论