stata与计量经济学,高级培训教程-statai-0introduction_第1页
stata与计量经济学,高级培训教程-statai-0introduction_第2页
stata与计量经济学,高级培训教程-statai-0introduction_第3页
stata与计量经济学,高级培训教程-statai-0introduction_第4页
stata与计量经济学,高级培训教程-statai-0introduction_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

引言规范性的研究包括两个

的要素:理论模型和经验分析(统计分析、计量分析)。的问题:研究者经常地希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的

是不存在的,不存在哪个能解决所有的问题。计量经济学发展迅速,新的方法层出不穷,而

公司将这些新方法嵌入到

中是存在滞后的。《STATA应用高级培训2》引言解决方案:不同的各有

,各有所短。学习、掌握多种

。但是不同的握一种在数据格式、操作方法、语法结构有很大区别,因此熟练掌需要花费较长的时间。

希望能够有一个相对较为综合的

=>Stata在统计、计量分析方面都非常出色。是否已有相应的程序供

直接运行=>Stata具有丰富的网络资源掌握

的编程方法,自己编写程序=>Stata具有简练、强大、快捷的编程和运算功能。Stata以其操作简单、运行快速而精确,全面的数据管理功能,精致的

作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、物理、化学等多个学科领域得到广泛使用(ht

/whystata/field.html)。《STATA应用高级培训3》STATA简介:发展历史Stata是一个用于数据管理和分析的统计

,由Stata公司(St

orp)研制开发。从1985开始,先后开发了1.1,1.2,…,等多个版本。目前Stata的

版本为2009年7月份推出的Stata

11.0。《STATA应用高级培训4》STATA简介:发展历史

Stata11包括四种版本:Small(小型版)、IC(标准版)、SE(特别版)和MP(多处理器版)。其中属MP版本最为强大。MP版与SE版的功能完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏输入about

查看所安装的Stata所属的版本。

不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244字节,最大矩阵阶数为11000(即1100011000)。Stata默认值为:最大变量个数为5000,最大矩阵阶数为400,最大内存为50兆(在Stata10中为的内存或者

的变量,可以在命令栏输入如10m)。如果用户需要下命令进行扩展。.

set

maxvar

#

(.set

maxvar

5000.

set

maxsize

#

(.set

maxsize

1000<最大变量个数5000个。>)<最大矩阵阶数10001000。>)<分配内存50兆。>).

set

memory

#m (.set

memory

50m《STATA应用高级培训5》STATA简介:界面结构《STATA应用高级培训6》STATA简介:界面风格设置风格设置:Edit->Preference

(右键->Preference)字体设置:(右键->Font)《STATA应用高级培训

》大学数量经济STATA简介:主要特点与功能统计分析与计量分析的结合单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计作图多元统计:MANOVA、主成分、因子分析、典型相关、聚类、判别分析、对应分析、

标度线性回归、非线性回归、工具变量回归、广义线性回归、分位数回归(稳健回归)、系统方程模型(SUR、联立方程)、离散选择模型(二项选择、排序选择、多项选择、条件Logit、嵌套Logit模型、二元选择模型等)、计数模型(泊松回归、负二项回归)、截断与归并模型、曼选择模型、逐步回归(stepwise)等。时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、Johansen协整检验、VAR、VEC、滚动回归等。面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方程(GEE)、随机边界模型等)。数据分析生存分析模拟、自举法(bootstrap)、刀切法(jackknife)Capability《STATA应用高级培训8》STATA简介:主要特点与功能丰富的网络资源。ht

http://w

Mata是Stata的矩阵运算语言,实现各种运算兼容性。在Stata中可以直接运行其它程序;其他语言编写的程序可以作为插件(Plugin)直接嵌入到Stata中。Add

New

FeaturesExamplesUtilities严谨、简练、灵活的程序语言。Stata提供了严谨、简练而灵活的程序语句,用户可以编写令和函数,也可以制作自己的

框和窗口菜单。强大的矩阵运算功能:Mata《STATA应用高级培训9》STATA简介:主要特点与功能Stata与EViews的比较(1)

Regresson

methodOLSGLSNLS2SLSGMM(N)SUR3SLSMLEviewsyesyesyesyesyesyesyesyesStatayesyesyesyesyesyesyesyesleStepwiseGLMHeckmanEviewsyes(6)yes(6)Statayesyesyesyes《STATA应用高级培训10》STATA简介:主要特点与功能(2)

Statistical

MethodANOVAParame-tric

testNonpara-metrc

testtycontrolRandomSamplingSurveySurvivalEViewsyesyesyesyesyes(U)Statayesyesyesyesyes(U,M)yesyesMANOVAPCAFactorDiscrimi-nantClusterCorres-pondenceMDSCanonicalEViewsyesyes(6)Statayesyesyesyesyesyesyesyes《STATA应用高级培训11》STATA简介:主要特点与功能(3)

Limited

DependentBinaryMutino-minalOrderedNestedlogitCondi-tional

logitCountmodelZero-inflatedcountZero-truncatedcountEViewsyesyesyesyesStatayesyesyesyesyesyesyesyesCensoredTruncatedEViewsyesyesStatayesyes《STATA应用高级培训12》STATA简介:主要特点与功能(4)

Time

seriesSeasonaladjust-mentSmooth-ingARIMAUnit

roottestCointe-grationVECMARCHFilterEviewsyesyesyesyesyesyesyesyesStatayesyesyesyesyesyesYes(11)M-GARCHStateSpaceEviewsyesyesStataYes(11)Yes(11)《STATA应用高级培训13》STATA简介:主要特点与功能(5)

Panel

dataLinearLinear

withARIVLSDPDBinaryCountMultilevelmixedeffectGEEEviewsyesyesyesyesStatayesyesyesyesyesyesyesyesGLSRandomCoefficientStochasticFrontierTobitUnit

roottestCointe-grationleEviewsyesyesStatayesyesyesyesnetnet《STATA应用高级培训14》语法结构基本格式:[by

varlist:]

command

[varlist]

[=exp]

[if

exp]

[in

range]

[weight]

[usingfilename]

[,

options]其中,符号[]表示可选项。command为Stata

令函数,varlist为变量,

[if

exp]、[in

range]用于设定变量或观测值,[weight]用于设定观测值的权重,[using

filename]表示使用的数据文件,options表示命令的选项,不同命令的选项也不同。[by

varlist:]表示对varlist(分类变量)中的每

一类分别执行命令(command)。比如,线性回归模型

令regress的格式为:.

regress

depvar

[indepvars]

[if]

[in]

[weight]

[,

options]用户可以输入如下命令:.

regress

depr

dcpi

drgdp

if

depr<20《STATA应用高级培训15》语法结构(varlist)已存在的变量varlist表示若干变量。对于数据中存在的变量,允许的表达形式包括*、?和。其中,*表示任意字符,?表示一个字符,表示两个变量之间的所有变量(根据数据中变量的存放位置)。比如,数据文件

有20个变量,依次为var1、var2、…

、var20,则var*

表示所有变量var1-var20,var?表示变量var1、var2、…

、var9,var1-var6表示变量var1、var2、…

、var6。新变量生成新变量时,变量名称不能简化。如果变量具有相同的前缀并且都以数字结尾,可以用-表示。比如,生成新变量V1、V2、V3、V4input

v1

v2

v3

v4

或者

.

input

v1-v4。《STATA应用高级培训16》语法结构(varlist)上述运算符不区分大小写,可以重复,也可以进行各种组合。比如,L3.x也可以等价地表述为LLL.x、LL2.x、L2L.x。#可以为单个数,也可以为数列(numlist),表示对同一变量的多次运算。比如,L(1/3).GDP表示L.GDP、L2.GDP、L3.GDP。x可以为单个变量,也可以为多个变量,表示对不同变量的同一运算。比如L2.(GDP

CS)表示L2.GDP、L2.CS。L(1/3).(GDP

CS)表示L.GDP、L2.GDP、L3.GDP、L.CS、L2.CS、L3.CS。运算符含义例子备注L#.xx的#阶滞后。L3.x=xt-3一阶滞后可写为L.xF#.xx的#阶超前。F3.x=xt+3一阶超前可写为F.xD#.xx的#次差分。D2.x=(xt-xt-1)-(xt-1-xt-2)一次差分可写为D.xS#.xx的#阶季节差分S12.x=(xt-xt-12)一阶季节差分可写为S.x《STATA应用高级培训17》语法结构(range)注:-#表示倒数第#个数。表达式含义例子#第#个观测值。第10个观测值:in

10#1/#2第#1到第#2的观测值。前10个观测值:in

1/10

或in

f/10#/l第#个观测值到最后一个观测值(last)。后10个观测值:in-10/-1

或in-10/lf/#第1个观测值(

)到第#个观测值。从第21至第50个观测值:in

21/50《STATA应用高级培训18》语法结构(weight)命令格式:weighttype=exp其中,weighttype表示权数的类型,包括频率权数(fweight或frequency)、抽样权数(pweight)、解析权数(aweight)和重要性权数(iweight)。

频率权数即每个观测值的重复次数。抽样权数表示在抽样设计中观测

值被抽取到的概率的倒数。解析权数与观测值的方差呈反比,比如第j

个观测值的权数为w_j,则其方差为sigma2/w_j。重要性权数即表示观测值的重要性,这种权数没有正式的统计定义。《STATA应用高级培训19》语法结构(numlist)表达式含义例子注释#1

#2

#3

...数#1、#2、...。2

0.5

1.8

2.92

0.5

1.8

2.9#1/#2从#1到#2,每步增加数为1。2/52,3,4,5#1(#d)#2从#1到#2,每步增加数为#d。9(-2)19,7,5,3,1#1[#d]#2等价于#1(#d)#2。9[-2]19,7,5,3,1#1

#t

to

#2从#1到#2,每步增加数为#t-#1。1

4

to

131,4,7,10,13#1

#t:#2等价于#1#t

to

#2。1

4:131,4,7,10,13《STATA应用高级培训20》语法结构:命令前缀(by)by是很多命令的前缀。[byvarlist:]表示对varlist(分类变量)中的每一类分别执行命令。事实上,Stata的很多命令带有不同的前缀。比如,by,statsby,rolling,bootstrap,jackknife,permute,simulate,

svy,stepwise,xi,capture,noisily,quietly,

version等。《STATA应用高级培训21》语法结构:命令前缀(xi)命令格式:.

xi

[,

prefix(string)

noomit]

terms.

xi

[,

prefix(string)

noomit]

:

command

varlistterms其中,prefix设定生成的虚拟变量的前缀,Stata默认为_I。Stata默认值为对m个类别仅生成m-1个虚拟变量,将最小值作为基础类别(如果是字符变量,则按照字母排序)。noomit表示生成所有类别对应的虚拟变量。利用如下方法更改基础类别。.char

varname[omit]“prevalent”<将频数最高的作为基础类别。>.char

varname[omit]{#|

string}<将取值#的类别或字符为string的类别作为基础类别。>.char

varname[omit]

<返回默认值。>《STATA应用高级培训22》语法结构:命令前缀(xi)数值分类变量:.

use

coal,

clear.

xi:

reg

coal

trend

i.quar.

char

quar[omit]

3.

xi:

reg

coal

trend

i.quar.

xi,

noomit:

reg

coal

trend

i.quar.

xi,

noomit:

reg

coal

trend

i.quar,

nocons字符分类变量:.

xi:

reg

coal

trend

i.quarstr.

char

quarstr[omit]

“2nd”.

xi:

reg

coal

trend

i.quarstr.

xi,

noomit:

reg

coal

trend

i.quarstr.

xi,

noomit:

reg

coal

trend

i.quarstr,

nocons《STATA应用高级培训

》大学数量经济语法结构:命令前缀(xi)terms的形式如下。i.varname

<对分类变量建立虚拟变量。>i.varnam1*i.varnam2<对两个分类变量分别建立虚拟变量及其交叉项:模型中包括所有主效应和交叉效应。>i.varnam1*varname3<对分类变量建立虚拟变量、建立连续变量:模型中包括所有主效应和交叉效应。>i.varnam1|

varname3<对分类变量建立虚拟变量、建立连续变量:模型中包括varname3的主效应和交叉效应,但不包括varnam1的主效应。>其中,varname、varnam1、varnam2为分类变量(数值变量或字符变量均可),varnam3为连续数值变量。《STATA应用高级培训24》语法结构:命令前缀(xi)比如,线性回归模型

令regress的格式为:.

regress

depvar

[indepvars]

[if]

[in]

[weight]

[,

options]用户可以输入如下命令:.

use

depr,

clear.

regress

depr

dcpi

drgdp.

regress

depr

dcpi

drgdp

if

depr<20.

by

category:

regress

depr

dcpi

drgdp

if

depr<20.

xi:

regress

depr

dcpi

drgdp

i.category

if

depr<20.

use

grunfeld,

clear.

by

company:

invest

kstock

mvalue.

xi:

invest

kstock

mvalue

pany《STATA应用高级培训25》语法结构:命令前缀(simulate)模拟是指随机生成满足条件的随机数,进行估计得到需要的估计量,并反复若干次以得到统计量的分布。命令格式为:.

simulate

[exp_list]

,

reps(#)

[saving(filename

[,

replace])

seed(#)]

:

command例:虚假回归。随机生成两个随机

序列(100个样本),进行回归,计算估计量和t统计量;如此反复10000次。(文件:rdwalk)利用均匀分布或正态分布随机数

生成随机

过程。通过如下命令进行模拟。12.

simulate

beta=(r(b1))

se=(r(se1)),

reps(200)

:

rdwalk,diff(

1

1)3观察其分布,并与标准正态分布相比较。.

gen

t=beta/se.

histogram

t.

twoway

histogram

t ||

function

y=normalden(x,0,1),range(-3

3)《STATA应用高级培训26》语法结构:命令前缀(bootstrap)自举法即通过有放回地重复抽样计算所需要的统计量,并反复若干次以得到统计量的标准差或其它精度测度指标。.

bootstr

xp_list

[,

options

eform_option]

:command例:计算下列样本的自举均值、50分位数、标准差、四分位数间距与极差:自举次数100次。(数据文件:boot1)3.12、0.15、1.57、19.67、5.60、9.16。.

bootstrap

mean=(r(mean))

median=(r(p50))sd=(r(sd))

iqr=(r(p75)-r(p25)),

reps(100)

:

summsamp,

detaillny=beta0+beta1*lnk+beta2*lnl+u中,lnk、lnl参数的自举估计量、标准差、99%的置信度。自举次数100次。.

bootstrap

(eq:

beta1=_b[lnk]

beta2=_b[lnl]

),nodots

reps(100):

regress

lny

lnk

lnl,

level(99)《STATA应用高级培训27》语法结构:命令前缀(jackknife)刀切法是20世纪40年代末50年代初发展起来的。它是指每一次删除样本中的一个观测值,利用剩余的观测值进行估计,进而得到所需要的统计量的分布。刀切法经常用于评估单个观测值对估计量的影响、计算统计量的标准差。.

jackknife

exp_list

[,

options

eform_option]

:command例:

回归如下方程,

Lny

=

0

+

1*lnk

+

2*lnl

+

u计算lnk、lnl参数的刀切估计量、标准差、99%的置信度。.

jackknife

(eq:

beta1=_b[lnk]

beta2=_b[lnl]

),e(r(N1))

keep:

regress

lny

lnk

lnl,

level(99)《STATA应用高级培训28》语法结构(post-estimation)Chapter

5,

P39常见命令1234模型的检验:estat参数的约束检验:test,

testnl,

hausman,lrtest模型

:predict,

predictnl,

adjust边际影响或弹性:mfx常见其

令567保存模型:est

store激活模型:est

restore观察估计结果:est

replay《STATA应用高级培训29》语法结构(post-estimation)模型的检验、

、分析都通过标准的估计后的分析工具中进行设定(不同的估计命令对应着不同的选项)(Statistics->Post-estimation)。每次估计的结果可以保存在内存中或磁盘上,便于随时调用(调用时需要首先将其激活,即是令其处于活动状态(active))。在各种模型的估计、检验、

中,Stata提供了一些更加方便

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论