stata使用手册_第1页
stata使用手册_第2页
stata使用手册_第3页
stata使用手册_第4页
stata使用手册_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1STATA基本入门、八、刖言STATA是一个十分好用而且简单的统计软件包,透过轻松的数据输入方 式,而且简单的指令,即可执行一般在计量经济学上常用的计量模型。除了计 量模型外,STATA的软件包中也可执行统计学中的估计和检定,甚至是多变量 分析中的各项分析工具。因此,STATA可以说是一个相当强而有力的统计软件一、安装STATA所须的内存容量不大, 只有4.03MB。 此外, 安装也相当简单,只 要在SETUP上点两下,安装完成后再分别输入”Sn”、”Code和”Key”即可 开始使用。但是安装过程中有一点必须注意的是,如下图所示,有”In tercooled和”Smal两个选项。一般而言,

2、为了方便日后要设定较大的内存容 量来处理大笔的资料,通常选择以”Intercooled进行安装。二、窗口介绍2安装完成后,点选桌面上STATA的图标,窗口画面如下图所示。为了使画面美观,我们可以将画面拉到自己喜欢的地方,如下图所示。为了保存这个窗 口画面,我们必须点选工具列上的”Prefs下的”SaveWindowing Preferences” 如此一来,以后开启STATA时都会以此窗口画面呈现。3接下来,我们依序介绍四个窗口的功用:左上一Review:此一窗口用于记录在开启STATA后所执行过的所有指令。因 此,若欲使用重复的指令时,只要在该指令上点选两下即可执 行相同的指令;若欲使用类似

3、的指令时,在该指令上点一下, 该指令即会出现在窗口 ”StataCommand上,再进行修改即可 此外,STATA还可以将执行过的指令储存下来,存在一个do-file内,下次即可再执行相同的指令。左下一Variables:此一窗口用于呈现某笔数据中的所有变量。换言之,当数据 中的变量都有其名称时,变量名称将会出现在此一窗口中。只要数据有读进STATA中,变量名称就会出现。它的优点 是(1)确认数据输入无误;(2)只要在某变量上点选两下, 该 变量即会出现在窗口 ”StataCommand上。右上一Stata Results:此一窗口用于呈现并记录指令执行后的结果。右下一Stata Comma

4、nd:此一窗口用于输入所欲执行的指令。Note:以上四个窗口都可以从”Fonts去更改字体大小。三、输入数据(Entering data)在本小节中,我们将介绍如何把数据读进STATA。但是在正式介绍之前, 我们必须先对几个一般性的指令(gen eral comma nd)有所了解,说明如下:保留於此指令的執行結果看這裡在此輸入指令JQ1 到1JjrJi? T ft费IH X:二、3MnvnnFMDJJ2資料中的變數在這裡山11 brftabulate和tabstat等指令得到数据 的叙述统计与基本特性。表示如下:summarize:列出资料的叙述统计。Example:summarize wr

5、ite, detailsum write if read=60(sum是summarize的简写)sum write ifprgtype=academic(接在if之后的句子中 的”要放两个)sum write in 1/40(只列出第1笔到第40笔资料)tabulate:列出变数的次数表。Example:tabulate prgtypetabulate prgtype racetabulate prgtype, summarize(read)tabulate prgtype race, summarize(write)tabstat:列出变量的叙述统计。Example:tabstat rea

6、d write math, by(prgtype) stat(n mean sd)tabstat write, stat(n mean sd p25 p50 p75) by(prgtype)接下来,我们介绍一些用来划图的指令:茎叶图:stem writestem write, lines(2)直方图:graph write, bin(10)graph write, hist normal bin( 10)箱形图:graph write, boxsort prgtype(要先有这个指令才能执行下一个指令)graph write, box by(prgtype)此外,利用correlate或是pw

7、corr可以得到相关矩阵;亦可利用graph划出散布图。correlate write read scieneepwcorr write read scienee, obsgraph write read, twowaygraph write read, two jitter(2)(wo是twoway的簡稱,jitter是用來區分 重疊的觀察點)graph write read, two jitter(2) boxgraph read science write, matrix half8现在我们可以将log文件结束了,指令输入如下:log close若欲检视log档中的结果,可以输入指令:t

8、ype result4-1og或是到所储存的目录下点选。最后,将数据探索的相关指令整理成下表。countShow the number of observationsdescribeDescribe contents of data in memory or on disklistList values of variablescodebookDetailed contents of a datasetlogCreate a log filesummarizeDescriptive statisticstabulateOne- & two-way frequency tablestab

9、statTable of descriptive statisticsstemStem-and-leaf plotgraphHigh resolution graphssortSort observations in a datasethistHistogram of a categorical variablecorrelateCorrelatio nspwcorrtype五、修饰资料(Modifying data)在本小节中,我们亦利用sample4-1的数据进行说明。首先,读进数据 读完数据后,可以为此数据取个名称,指令如下:label data High School and Beyo

10、nd, 200 cases现在我们可以将变量的顺序作一排列。例如:原先的变量顺序为gender、id和race,但是我们想把顺序改成id、gender和race,则可以 下面的指令来执行:order id genderPairwise correlations9在执行codebook时,我们会发现有些变量尚未加上卷标(label),为了 更清楚地表达变量所代表的意义,我们可以执行以下的指令:label variable schtyp The type of school the student attended.现在,我们想要产生一个新变量total,此变量代表read、write和math的

11、总和。指令如下:gen erate total = read + write + math此外,若是我们想加总的分数是read、write和socst,而非read、write和math,此时的指令输入如下:replace total = read + write + socst另一方面,我们还可以将变量total表示成以等级(A、B、C、D and F) 的形式。指令如下:gen erate grade = totalrecode grade 0/80=0 80/110=1 110/140=2 140/170=3 170/300=4 label defineabcdf 0 F 1 D 2 C

12、 3 B 4 Alabel values grade abcdf为了记忆变量的意义为何,我们还可以利用note的方式来记录变量。指令如下:notes race: values of race coded as 5 were recoded to be miss ingnotes(叫出note的指令)另外,介绍一些利用公式来产生变量的指令。egen zread = std(read)summarize zreadlist read zread in 1/10egen rmean = mean(read), by(ses)list read ses rmean in 1/10egen mread

13、= median(read), by(prog)list read prog mread in 1/10最后,我们可以将以上的执行结果储存下来。指令如下:10save sample5-1(存成另一個檔)save sample4-1(取代原來的sample4-1)现在亦将数据修饰的相关指令整理成下表。label dataApply a label to a data setorderOrder the variables in a data setlabel variableApply a label to a variablegen erateCreates a new variablerep

14、laceReplaces one value with another valuerecodeRecode the values of a variableLabel valuesApply value labels to a variablelabel defineDefine a set of a labels for the levels of a categorical variableno tesApply notes to the data fileege nExte nded gen erate - has special fun cti ons that can be used

15、 whencreating a new variablesaveStore the dataset currently in memory on disk in Stata data format六、管理数据(Managing data)在本节中,我们将进一步介绍如何将数据作一些特殊的处理,例如:保留 所欲分析的数据、删除多余的数据或是将两份数据结合等等。假设我们只想针对部分的数据进行处理,而又想保留原始资料时,则有以 下两种方法可进行:1、另存新檔:亦即将所欲分析的部分数据储存在另一个档案中。例如:我们只针对read成绩大于或是等于60分的学生进行分析,则可利用 下面的指令来筛选。keep

16、if read = 60summarizesave sample6-1Note:当只要保留某些变量时,则利用指令keep。例如:keep read write。2、直接处理:亦即在原始数据上进行分析。承上例,指令输入如下:preservedrop if read 60summarizerestoreNote:若要删除某些变量时,则利用指令drop。例如:drop read write。接下来,我们介绍如何将两笔数据结合在一起。数据的结合主要可以分为 两种,水平合并和垂直合并。前者是指变量的增加;后者则是指样本数的增加。 说明如下:1、水平合并use sampleh1append using s

17、ampleh22、垂直合并:use samplev1sort idsave samplev1, replaceuse samplev2, clear sort idsave , replaceuse samplev1merge id using samplev2Note:在垂直合并前要记得先sort。12最后,我们将数据修饰的相关指令整理成下表。keep ifKeep observations if condition is metdrop ifDrop observations if condition is metkeepKeep variables (dropping others)dr

18、opDrop variables (keeping others)append usingAppend a data file to current filesortSort observationsmergeMerge a data file with current file七、资料分析透过前面几节的介绍,应该对于STATA的指令和使用方法有了基本的认 识。现在,我们开始说明如何利用STATA来处现统计上的问题以及计量方面 的模型。1、检定:我们利用下面的例子来示范如何进行统计上的检定工作。sample4-1 : ttest write =60ttest write, by (gender

19、)ttest write, by (gender) unequalsample7-1:ttest before= after 2、回归在执行回归分析时所使用的指令为regresscd e:sampleuse sample7-2regress growth Inrlp84 lnemp oclnemp cr4 lnrd oc另外,当存在heterogeneityofvarianee的问题时,可在后面加上robust;另外,若是不想放入截距项时,可在后面加上noconstant。若欲得到残差值,可输入以下指令:predict e , residual3、二元选择模型在执行二元选择模型时所使用的程序写法与执行回归分析时相同,只是所 使用的指令不同。在logit模型时为logit;在progit模型时为progit。13clearuse sample7-3logit oc rlp emptot rlp2 emptot2 rlpemp InrdIstatlogit oc rlp emptot rlp2 em

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论