版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学
Econometrics
如何做实证研究项目提要一、问题的提出二、文献回顾三、数据的收集四、计量经济分析五、实证论文的写作一、问题的提出1、提出问题的重要性爱因斯坦认为:提出问题比解决问题更重要。一、问题的提出2、寻找感兴趣的问题提出一个原则上需要用数据来回答的非常明确问题是非常重要的。实际上,如果没有明确的分析目标,那么研究将无从下手。在选题时,研究人员必须明确,对经济学或其他社会科学的哪个领域感兴趣。举例来说,在学完《劳动经济学》课之后,可能发现一些能进行实证检验的理论,或具有某些政策含义的关系。劳动经济学家不断地发现能够解释工资差异的新变量,其中包括高中阶段的教学质量等。一、问题的提出2、寻找感兴趣的问题-续比如,研究教育问题的经济学家感兴趣的问题是:支出如何影响学生成绩就读某类学校是否会提高学生成绩以及哪些因素影响私立学校的选址。宏观经济学家对各种总量时间序列之间的关系兴趣十足。例如,国内生产总值的增长与固定资产投资,或机器设备的增长之间的关系,或税收对利率的影响。一、问题的提出3、估计怎样模型估计通常描述性模型当然有其原因。举例来说,财产税评估员利用模型(享乐定价模型)估计家庭最近尚未出售住房的价值。这就涉及一个将房屋价格与其特征(大小、卧室间数、卫生间数等)相联系的回归模型。作为学期论文,这不足以令人兴奋,因为我们不太可能从中得到新颖结论,而这一分析也没有什么明显的政策含义。可是如果增加邻里犯罪率作为解释变量,我们就能确定犯罪率对房屋价格的影响有多重要,这将有助于估计犯罪的成本。一、问题的提出3、估计怎样的模型-续估计有些关系,要利用描述性宏观经济数据。例如,一个总量储蓄函数能用来估计总量边际储蓄倾向和储蓄对资产回报(如利率)的响应。如果使用曾发生过政治动乱的国家的时间序列数据,并判断储蓄率在政局不稳时期是否有下降趋势,这样的分析便会更有意思。一、问题的提出4、当确定研究领域后,要用各种方法查找这个主题论文(1)《经济文献杂志》(JournalofEconomicLiterature,JEL)有一整套细致分类体系,其中每篇论文都有一组标识码,从而将其归于经济学的某一子领域之中。JEL还包含在其他各类期刊中发表的文章列表,根据主题进行分类,甚至包含某些论文的摘要。(2)互联网服务使得搜寻各种主题的已发表论文更为方便。(3)EconLit使得使用者能根据作者名、主题、题目中的关键词等方式对几乎所有经济学期刊进行全面检索。(4)网络搜索引擎“谷歌学术”(GoogleScholar)对于追踪各类专题研究或某位作者的研究特别有帮助。尤其对于那些尚未在学术期刊上发表或有待发表的作品而言,这个搜索引擎更加有用。二、文献回顾1、所有论文,无论长短应包含对相关文献的综述几乎没有人会试图进行尚无前期成果的实证项目。如果研究者通过期刊或在线搜索服务(onlinesearchservices)寻找题目,那么所做的正是文献检索。如果研究者自行选题(例如研究吸毒对学习成绩的影响),那么可能就要更辛苦一些。但在线搜索服务使这一工作容易得多,例如可通过关键词、题目中出现的单词或者作者等进行搜索。然后就可以通过论文摘要,了解它们与自己的研究有多大关系。二、文献回顾2、如何将文献综述包含在论文中如何将文献综述包含在论文中,这会因人而异。有些人喜欢独辟专节,称为“文献综述”;另一些人则喜欢将文献综述作为序言的一个部分。尽管详尽的文献综述可能值得独立成节,但这仍取决于个人喜好。如果学期论文是课程的重点(比如在高级专题研讨或高级计量经济学课程中),那么文献综述就要尽可能地相当详尽。第一学期计量经济学课程之末的学期论文往往较短,而文献综述也要简洁一些。三、数据的收集1、确定适当的数据集为学期论文收集数据可能富有教育意义,这时首先必须确定用以回答所提问题的数据类型。数据集有多种形式,比如最常见的类型是横截面、时间序列、混合截面和面板数据集。确定收集何种数据通常取决于分析的性质。为了回答个人或家庭层面的问题,通常只需要找到单个横截面数据;它们往往通过调查取得。在处理有关公司、城市、州县等横截面数据时,也会出现同样问题。在大多数情况下,能否利用单个横截面数据进行其他条件不变的分析,这一点并不明显。三、数据的收集1、确定适当的数据集-续数据存在多种形式。一些数据集,特别是历史数据,通常仅以印刷资料的形式出现。如果数据集不大,亲自把来源于印刷资料的数据输入电脑也简便易行。有时,有些已发表论文中附带小数据集,特别是时间序列应用研究。这些资料都可用于实证研究(经验研究),也许还可以补充一些近年数据。注意:同一横截面单位两个或多个不同时期的数据,让我们能够控制那些不随时间而改变的非观测效应,这些效应通常使得单个横截面上的回归失效。1、确定适当的数据集-续许多数据集都有电子版可用,各种政府机构也都在其网站上提供数据。有时候,私人公司也收集数据集并使之更便于使用,但要收取一定的费用。网上有越来越多的数据集可以利用。网络是网上数据库(onlinedatabases)的资源宝库。三、数据的收集2、输入并储存数据当确定好数据类型,并找到数据来源之后,就必须把数据转变为可用格式。如果数据在磁盘里,它已经具备一定的形式,而且是有望被广泛使用的一种形式。用磁盘形式获取数据最灵活的方法是将其作为标准的文本(ASCII)文件。所有统计与计量经济软件包都容许这种原始数据存储方式。通常只要该文本文件结构适当,很容易就能把文本文件直接读入计量经济软件。本书所用的数据文件便提供了横截面、时间序列、混合截面和面板数据通常存储方式的例子。通常,数据应该具备表格形式,每次观测占一行;而数据集的每一列则代表不同的变量。三、数据的收集2、输入并储存数据-续(1)不同类型数据的输入要求①对时间序列数据集来说,只有一种合理方式进行数据的输入与存储:即以时间为序,最早的时期列为第一次观测,最近的时期列为最后一次观测。最好能把标志着年份或(如有必要)季度或月份的变量包括进来。这将使得今后能估计各种模型,包括考虑到不同时期的季节性和构突变的模型。②对混合横截面数据来说,通常最好方法是把最早一年的横截面放在第一个观测区里,接着是第二年的横截面,等等。这种安排并不关键,但为每次观测赋予标志着年份的变量则非常重要。③对面板数据来说,最好将每个横截面观测的所有年份按照时间顺序排列。有了这样的顺序,就可利用第13和14章的所有面板数据方法。对于面板数据,让每个横截面单位都具备一个独特的标识符和一个年度变量非常重要。三、数据的收集2、输入并储存数据-续(2)输入数据的方法①利用标准文本编辑器创建一个文本文件,这就是本书中某些原始数据集最初创建的方法。通常要求每一行开始一次新的观测,每行的变量有相同的顺序,而且数值与数值之间至少需要由一个空格分开。通常字符串都被放置在双引号或单引号之间。②利用电子制表软件来输入数据。比如,Excel。a.因为每个变量的每次观测都是一个单元,所以不太可能有两个数字连在一起。b.电子制表软件允许对数据进行操作,例如进行归类和计算均值等。③直接把数据输入所用的计量经济学软件。三、数据的收集3、检查、清理并总结数据(1)对缺损值的标识最好的办法是把所有代表缺损值的数字符号改为其他不会与实数数据混淆的符号,例如句号。(2)了解数据集中变量的性质变量性质包括:二值变量、序数变量、变量的测量单位、基期或当期等。三、数据的收集3、检查、清理并总结数据-续(3)检查数据集中的错误①在分析中找出所有变量的最小值、最大值、均值和标准差。②若使用月度或季度数据,就必须知道哪些变量经过季节性调整。③差分时必须确定数据是按时间顺序排列的,即从最早时期到最晚时期。为确保数据正确排列,运用一个时期标识变量会有所帮助。④处理面板数据更具挑战性。在构建差分数据时,应该小心不要产生虚构观测。四、计量经济分析1、一般性指导原则在确定主题之后,必须搜集合适的数据集。假定这已经完成,接着必须确定适当的计量经济方法。
如果强调利用横截面或时间序列数据对多元线性回归模型进行普通最小二乘估计,那么还必须确定,是否需要OLS的某种变型,例如加权最小二乘或对时间序列回归中的序列相关加以修正。
为了说明OLS的合理性,必须说明所建立的模型满足OLS的关键假定:第一个问题,误差项是否与解释变量不相关;其次其他潜在的内生因素(即测量误差和联立性)不是严重问题。
1、一般性指导原则-续在设定模型时,必须确定采取何种函数形式。某些变量是否应该以对数形式出现?某些变量是否应该以水平值和平方值形式出现,以便刻画递减效应?定性因素应该怎样出现?常见错误是,在回归模型中不正确地包含以数值给出但又不具备定量信息的解释变量。对横截面分析来说,一个不是最主要但仍重要的问题是,是否存在异方差性。最简单的办法是计算异方差稳健的统计量。如果模型有潜在的设定错误,比方说遗漏变量,而且使用OLS,那么应该尝试进行某种误设分析,确定估计量的偏误方向。1、一般性指导原则-续工具变量的方法能够用来解决各种形式的内生问题,包括遗漏变量、变量误差和联立性。但是首先必须确保工具变量可以奏效,满足两个基本条件。经验社会科学方面的优秀论文应包含敏感度分析。宽泛地讲,这意味着必须首先估计一个初始模型,然后用一些看似合理的方法修改它。理想的情况是重要的结论不致改变。如果某些观测值与样本群体非常不同,那么如果把这些观测值从估计中排除出去,结果发生很大改变,那么就不得不改变函数形式以容许这些观测,或者证明它们属于完全不同的模型。1、一般性指导原则-续如用面板数据会额外导致一些计量经济问题。无须借助工具变量,至少有4种方法来利用这两个时期的面板数据。在标准OLS分析中,混合这两个时期。虽然相对于单个横截面来说,这样做或许可以扩大样本量,但它并没有控制不随时间而变化的非观测因素。另外,由于非观测效应,这种方程中的误差几乎总是序列相关的。只要在给定所有时期解释变量值的情况下,非观测效应具有零均值,随机效应估计法就可以修正序列相关问题,并给出渐近有效的估计量。假设收集两个时期的数据,那么就可以在标准OLS分析中混合这两个时期。相对于单个横截面来说,这样做或许可以扩大样本容量,但它并没有控制不随时间而变化的非观测因素。1、一般性指导原则-续另一种可能性是在第二年的方程中增加滞后因变量。把它作为至少可以缓解遗漏变量问题的一种方法而提出,因为在任何情况下,我们都要保持因变量的最初结果固定不变。这通常会导致与取数据差分相似的结果。当拥有更多年的面板数据时,除了上述办法,还有一个新的选择,即可利用固定效应变换来消除非观测因素的影响。同时使用几种合理的计量经济方法并比较其结果,这样做是一个好主意。这通常能帮助确定哪一个假定可能是错误的。2、数据挖掘(datamining)
所有的应用研究人员在找到“最佳”模型之前,都会搜索各种不同的模型。还有一种探索性方法,数据挖掘(datamining,又译为资料探勘、数据采矿),它是数据库知识发现(Knowledge-DiscoveryinDatabases,简称KDD)中的一个步骤。数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘的实践破坏了计量经济学分析中所做的假定。
2、数据挖掘-续OLS和其他估计量的无偏性结论,以及为假设检验而推导的t分布和F分布,都假定观察到一个服从总体模型的样本,并对该模型只估计一次。估计初始模型的变化形式违背了这一假定,因为在模型设定搜索时利用了相同的数据集。实际上,通过利用这些数据来重新设定模型,便利用了检验的结果。从不同模型设定中得到的估计值和检验就不是彼此独立的。某些设定搜索已经被编制为标准软件包中的程序。设定搜索的程序为逐步回归:逐步回归的一般思路是,要么从一个大模型开始,然后保留P值低于某个显著水平的变量,或者是从一个简单模型开始,然后加入P值显著的变量。有时候也用F检验来检验一组变量。2、数据挖掘-续不幸的是,最终的模型通常取决于变量被丢弃或添加的顺序。逐步回归是严重的数据挖掘形式,而且在最终模型中也难于解释t和F统计量。原则上,有可能把数据挖掘的影响包含在统计推断中;但实践中却非常困难且极其罕见,特别是在复杂的经验工作中更是如此。如果一个变量仅在所估计模型的一小部分统计显著,那么这个变量极有可能在总体中没有影响。五、实证论文的写作(1)引言引言部分,要陈述研究的基本目标,并解释其重要性。一般包括文献综述,表明有哪些工作已经完成,以及前期研究可以怎样改进。提出一些简单统计量或者图表,以揭示一个看似矛盾的关系是介绍论文主题的有用方法。五、实证论文的写作(2)概念(或理论)框架在这一节,主要描述你回答所提问题的主要方法。它可以是规范的经济理论,但在许多情况下,它只是对回答问题时出现的概念性问题进行直观讨论。(3)计量经济模型和估计方法最好专辟一节介绍论文将要估计和给出的方程。对一个模型和一个估计方法的区别,应该在这一节中指出。一个模型代表了一个总体关系(广义的定义还包括时间序列方程)。在设定模型之后,讨论估计方法便自然而然。在多数情形中都使用OLS。估计模型的方法与模型本身要明显区别开来。从潜在的经济模型得到一个可估计的计量经济模型,其中用到的任何假定都要进行清楚的讨论。无论是否给出理论模型,都要对函数形式做出假定。无论是否给出理论模型,都要对函数形式做出假定。(4)数据应该用一节仔细描述经验分析中所使用的数据。如果数据不是标准的,或尚未被其他研究人员广泛使用,这就尤其重要。原则上,应该介绍足够的信息,以便读者可以获得数据并重新进行分析。特别是,所有可用的公共数据来源都应包括在参考文献中,而且小的数据集也可以列在附录中。如果使用自己通过调查而收集到的数据,在附录中也应给出一份调查问卷。在讨论数据来源的时候,要明确每个变量的单位。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南文理学院《古典舞基训(二)》2021-2022学年第一学期期末试卷
- 湖南农业大学《服务端应用基础》2021-2022学年第一学期期末试卷
- 集装箱火灾扑救初战展开程序
- 工业园区道路延伸工程可行性研究报告
- 宏观经济学第五版课后习题答案12-23章(高鸿业版)
- 2024至2030年中国52.5R型水泥行业投资前景及策略咨询研究报告
- 2024至2030年中国饰花行业投资前景及策略咨询研究报告
- 2024至2030年中国镀镍单声道行业投资前景及策略咨询研究报告
- 2024至2030年中国超滑泥鳅导丝行业投资前景及策略咨询研究报告
- 2024至2030年中国油漆吹干剂行业投资前景及策略咨询研究报告
- DB34∕T 2290-2022 水利工程质量检测规程
- 电子政务概论-形考任务5(在线测试权重20%)-国开-参考资料
- 工业自动化设备维护与升级手册
- 大数据安全与隐私保护考核试卷
- 8《网络新世界》(第一课时)教学设计-2024-2025学年道德与法治四年级上册统编版
- 辽宁省水资源管理集团有限责任公司招聘笔试真题2022
- 浙江省嘉兴市2023-2024学年八年级上学期期末检测语文试卷
- GB/T 44239-2024增材制造用铝合金粉
- 中国企业投资缅甸光伏发电市场机会分析及战略规划报告2024-2030年
- 入团积极分子培养考察表
- 高中体育与健康教师资格考试学科知识与教学能力2024年下半年测试试题及解答
评论
0/150
提交评论