第1章回归分析的性质_第1页
第1章回归分析的性质_第2页
第1章回归分析的性质_第3页
第1章回归分析的性质_第4页
第1章回归分析的性质_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章回归分析的性质21.1回归的历史渊源

F.高尔顿关于身高的研究人的身高有一个趋势:父母高,儿女也高;父母矮,儿女也矮。但是,给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。1.2回归的现代释义 回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的变量的依赖关系,其意义在于通过后者(在重复抽样中)已知或设定值,去估计或预测前者的(总体)均值。3例子高尔顿的普遍回归定理年龄和身高的关系回归线4经济学例子

确定性关系确定性的函数关系,如牛顿的万有引力定律:计量经济学处理的不是一种函数关系或确定性依赖关系,而是一种统计关系(statisticaldependence,notfunctionalordeterministicrelationship)。1.3统计关系与确定性关系统计关系处理的是随机变量(random或stochasticvariables)——有着概率分布的变量。例如:作物收成与气温、降雨、光照及施肥的依赖关系就是一种统计性质的关系。它和确定性的函数关系不同。

对变量间统计关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的。在相关分析中对两个变量的处理方法是对称的:不区别因变量和解释变量。两个变量都是随机的。相关系数(correlationcoefficient)正相关(positivecorrelation)负相关(negativecorrelation)不相关(non-correlation)相关分析1.4回归与相关回归分析回归分析是研究一个因变量对另一个或几个解释变量的依赖关系,并通过后者的已知或设定值去估计或预测前者的总体均值;回归分析中需要区别自变量和因变量;因变量是随机变量,自变量可以是随机变量,也可以是非随机的确定变量。经济学中的例子:个人消费支出对税后或可支配实际个人收入的依赖关系微观经济学市场结构理论中讲到的垄断厂商是自己产品的价格(或产出)的制定者,他肯定想知道产品需求Q对价格P的实际反应。通过估计产品需求的价格弹性有助于厂商确定最有利可图的价格。

公司的销售部主任一定想知道,公司产品的市场需求与广告费用之间的关系。可以求出相对于广告支出的需求弹性,这有助于制定“最优”的广告费用预算。农业经济学家要研究作物的产量对气温、降雨量、阳光量(日照长度或强度)和施肥量的依赖关系。有助于分析影响产量的因素的贡献和预测收成1.5回归与因果关系虽然回归分析研究一个变量对另一个(一些)变量的依赖关系,但它并不一定意味着因果关系。

Kendall和Stuart认为:“一个统计关系式,不管多么强也不管多么富有启发性,却永远不能确定因果方面的联系:对因果关系的理念,必须来自统计学以外,最终来自这种或那种理论。”从逻辑上说,统计关系式本身不可能意味着任何因果关系。要谈因果律,必须诉诸先验的或理论上的思考。因变量(dependentvariable)自变量(independentvariable)被解释变量(explainedvariable)解释变量(explanatoryvariable)预测子(predictand)预测元(predictor)回归子(regressand)回归元(regressor)内生(endogenous)变量外生(exogenous)变量结果变(outcome)量协变量(Covariate)被控(controlled)变量控制(control)变量1.6术语与符号双变量回归分析一个变量对仅仅一个解释变量多元回归分析一个变量对多个解释变量字母Y表示因变量X(X1,X2,…Xk)表示解释变量Xk第k个解释变量Xki或Xkt指第k个解释变量的第i(t)个观测值N(T)总体中的观测总个数n(t)样本中的观测总个数时间序列数据:对某一个变量在不同时间取值的一组观测结果。如:每日数据(如股票价格)每周数据(美联储提供的Ms)每月数据(失业率、消费者价格指数)每季数据(如GNP)每年数据(统计年鉴)每5年的数据(如美国的制造业普查资料)每10年的数据(如人口普查资料)时间序列数据涉及到平稳性(stationarity)问题:均值和方差有没有随时间的系统的变化,如果没有才是平稳的(stationary)1.7经济分析中的数据

横截面数据:对一个或多个变量在同一时间点上收集的数据:如1990年美国50个州的蚕产量和蚕价格。

如2013年中国分省(市)的GDP、消费支出等。横截面数据可能存在异质性(heterogeneity)问题。混合数据:兼有时间序列和横截面数据面析、纵列或微观面板数据:混合数据的一种特殊类型,指对相同的横截面单位在时间轴上进行跟踪调查的数据。平衡面板与非平衡面板数据的来源实验数据和非实验数据在社会科学中,获得的数据是非实验性质的。数据的准确性原因:非实验性质、测量误差、无应答、抽样方法、高度加总、保密。研究结果并不能比数据更好。虽然有大量的数据可供研究,但数据的质量并不那么好变量测量尺度比率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论