stata使用手册资料_第1页
stata使用手册资料_第2页
stata使用手册资料_第3页
stata使用手册资料_第4页
stata使用手册资料_第5页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、STATA基本入门、八、刖言STATA是 一个十分好用而且简单的统计软件包,透过轻松的数据输入方式,而且简单的指令,即可执行一般在计量经济学上常用的计量模型。除了计量模型 外,STATA勺软件包中也可执行统计学中的估计和检定,甚至是多变量分析中的 各项分析工具。因此,STATA可以说是一个相当强而有力的统计软件。一、安装STATA所须的内存容量不大,只有。此外,安装也相当简单,只要在SETUP上点两下,安装完成后再分别输入”Sn”、”Code和”Key”即可开始使用。 但是安装过程中有一点必须注意的是,如下图所示,有”Intercooled” 和”Small”两个选项。一般而言,为了方便日后要

2、设定较大的内存容量来处理 大笔的资料,通常选择以”In tercooled”进行安装。、窗口介绍以此項進行安裝安装完成后,点选桌面上STATA勺图标,窗口画面如下图所示。为了使画面美观,我们可以将画面拉到自己喜欢的地方,如下图所示。为了保存这个窗口 画面,我们必须点选工具列上的”Prefs”下的”Save Windowing Preferences”。如此一来,以后开启STATA寸都会以此窗口画面呈现。(1)确认数据输入无误;(2)只要在某变量上点选两下,该变量即会出现在窗口”Stata Comma nd上。右上一Stata Results:此一窗口用于呈现并记录指令执行后的结果。右下一Sta

3、ta Comma nd:此一窗口用于输入所欲执行的指令。Note:以上四个窗口都可以从”Fo nts”去更改字体大小。三、输入数据(Entering data)在本小节中,我们将介绍如何把数据读进STAT A但是在正式介绍之前,我 们必须先对几个一般性的指令(gen eral comma nd)有所了解,说明如下:cd:即change directory,简言之,告知STATA数据储存的地方。例如当 数据储存在e槽的sample数据夹时,则必须先输入cd e:sample。dir /ls:用来显示目录的内容。set memory #m设定内存的容量。例如:当有一笔庞大的数据要处理时,则可设定1

4、00mb的容量,此时可输入set memory100n。(输入指令memory可以知道内存容量的大小以及使用 情况。)set matsize #:设定所需的变量个数。一般而言,不须对此部分进行设定, 除非所欲处理的资料庞大或是当执行后出现matsize too small的讯息时再进行修改即可。内建为40。set more off / on:若欲执行结果以分页的型式呈现时,则输入set more on; 若欲执行结果同时呈现时,则输入set more off。保留於此接下来,我们依序介绍四个窗口的功用:左上一Review:此一窗口用于记录在开启STATA后所执行过的所有指令。因此, 若欲使用重

5、复的指令时,只要在该指令上点选两下即可执行相 同的指令;若欲使用类似的指令时,在该指令上点一下,该指 令即会出现在窗口”Stata Command上,再进行修改即可。此 夕卜,STATA还可以将执行过的指令储存下来,存在一个do-file内,下次即可再执行相同的指令。下一Variables:此一窗口用于呈现某笔数据中的所有变量。换言之,当数据 中的变量都有其名称时,变量名称将会出现在此一窗口中。只要数据有读进STATA中,变量名称就会出现。它的优点是在此輸入指令執行過的指令都會資料中的變數在這裡指令的執行結果看這裡help:求助键。后面必须接的是指令。说明如何使用该指令,例如:help reg

6、ress。search:求助键。后面可接任何文字。说明在何处可以找到该文字。例如:searchnormal distribution。clear:清除键。用来删除所有数据。接下来,根据数据类型或指令的不同,数据输入的方法可分成以下四种:1、输入EXCELS 据将EXCEL勺数据输入STATA勺方式还可细分成以下两种:将EXCEL勺数据输入STAT/之前,必须先将数据存成csv文件,再利用指令in sheet来读数据。Example:当csv档的第一列有变量名称时:cd e:sample dir memoryset memory 10m in sheet using当csv档的第一列没有变量名称

7、时:in sheet gen der id race ses schtyp prgtype read write mathscie nee socst using直接复制EXCELt 的数据,再到STATA选取”Win dow下的”Data Editor”, 点选后会出现”Stata Editor”工作表,再到”Edit”下选取”Paste”即可 贴上数据。2、输入ASCII的数据型态依ASCII的数据型态区分,将ASCII的数据输入STATA勺方式也有以下两 种:数据型态一:见in file gen der id race ses schtyp str10 prgtype read writ

8、e math scie nee socst usingNote:记住文字的设定方式(str # variable name)。数据型态二:见第二种的数据型态通常须要codebook。如下表所示variable n ameColumn nu mberid1-2|eng3-4path5-6sex7Hero8-9hacro10-11infix id 1-2 eng 3-4 math 5-6 gender 7 micro 8-9 macro 10-11 using3、利用Do-file editor输入数据将数据或是指令写入Do-file editor,再执行即可。例如:将下面 数据复制并贴在Do-f

9、ile editor(选取”Window下的”Do-file editor”)上,再选择”do currnet file”执行即可。cd e:samplein put id female race ses str3 schtype prog read write math scie nee socst147 1 1 3 pub 1 47 62 53 53 61108 0 1 2 pub 2 34 33 41 36 3618 0 3 2 pub 3 50 33 49 44 36153 0 1 2 pub 3 39 31 40 39 5150 0 2 2 pub 2 50 59 42 53 615

10、1 1 2 1 pub 2 42 36 42 31 39102 0 1 1 pub 1 52 41 51 53 5657 1 1 2 pub 1 71 65 72 66 56160 1 1 2 pub 1 55 65 55 50 61136 0 1 2 pub 1 65 59 70 63 51end4、利用STATA勺数据型态输入除了以上三种方法之外,还可以开启之前以STATA储存的资料。useNote:此一指令亦可用在读取网络上的数据(use网址) 最后,将数据输入的相关指令整理成下表。in sheetread ASCII (text) data created by a spreadshe

11、etin fileread un formatted ASCII (text) datainfixread ASCII (text) data in fixed formatin puten ter data from keyboarduseload a Stata-format dataset四、探索资料(Exploring data)为了更详细地呈现出在数据探索时所需使用的 相关指 令,我们利 用sample4-1来说明指令的用法。首先,利用前节所提及的数据输入方法将sample4-1读进STATA在正式分析数据之前,我们可以利用一个log档来储存之后所要执行的指令以及所得到的结果。指令的

12、表示方法如下:log using result4-1, text(log檔的名稱為result4-1)接下来,我们可以先利用下面的指令来检视sample4-1的数据:count:可得样本数。describe:描述数据来源以及数据大小。list:依序列出观察值的各个变量值。codebook:描述资料的详细内容。此外,我们就可以利用summarize、tabulate和tabstat等指令得到数据 的叙述统计与基本特性。表示如下:summarize:列出资料的叙述统计。Example:summarize write, detailsum write if read=60(sum是summarize

13、的简写)sum write ifprgtype=academic(接在if之后的句子中 的”=”要放两个)sum write in 1/40(只列出第1笔到第40笔资料)tabulate:列出变数的次数表。Example:tabulate prgtypetabulate prgtype race tabulate prgtype, summarize(read)tabulate prgtype race, summarize(write)tabstat:列出变量的叙述统计。Example:tabstat read write math, by(prgtype) stat(n mean sd)t

14、abstat write, stat (n mean sd p25 p50 p75) by(prgtype)接下来,我们介绍一些用来划图的指令:茎叶图:stem writestem write, li nes(2)直方图:graph write, bin(10)graph write, hist no rmal bin( 10)箱形图:graph write, boxsort prgtype(要先有这个指令才能执行下一个指令)graph write, box by(prgtype)此外, 利用correlate或是pwcorr可以得到相关矩阵; 亦可利用graph划 出散布图。correlat

15、e write read scie neepwcorr write read scie nee, obsgraph write read, twowaygraph write read, two jitter(2)(two是twoway的簡稱,jitter是用來區分重疊的觀察點)graph write read, two jitter(2) boxgraph read scie nee write, matrix half现在我们可以将log文件结束了,指令输入如下:log close若欲检视log档中的结果,可以输入指令:type或是到所储存的目录下点选。最后,将数据探索的相关指令整理成下表

16、。cou ntShow the nu mber of observati onsdescribeDescribe contents of data in memory or on disklistList values of variablescodebookDetailed contents of a datasetlogCreate a log filesummarizeDescriptive statisticstabulateOne- & two-way freque ncy tablestabstatTable of descriptive statisticsstemSte

17、m-a nd-leaf plotgraphHigh resolutio n graphssortSort observatio ns in a datasethistHistogram of a categorical variablecorrelateCorrelati onspwcorrPairwise correlati onstypeDisplay an ASCII file五、修饰资料(Modifying data)在本小节中,我们亦利用sample4-1的数据进行说明。首先,读进数据 读完数据后,可以为此数据取个名称,指令如下:label data High School a nd

18、 Beyo nd, 200 cases现在我们可以将变量的顺序作一排列。例如:原先的变量顺序为gen der、id和race,但是我们想把顺序改成id、gender和race,则可以下面的指 令来执行:order id gender在执行codebook时,我们会发现有些变量尚未加上卷标(label),为了 更清楚地表达变量所代表的意义,我们可以执行以下的指令:label variable schtyp The type of school the student attended.现在,我们想要产生一个新变量total,此变量代表read、write和math的总和。指令如下:gen era

19、te total = read + write + math此外,若是我们想加总的分数是read、write和socst,而非read、write和math,此时的指令输入如下:replace total = read + write + socst另一方面,我们还可以将变量total表示成以等级(A、B、C、D and F) 的形式。指令如下:gen erate grade = totalrecode grade 0/80=0 80/110=1 110/140=2 140/170=3 170/300=4label define abcdf 0 F 1 D 2 C 3 B 4 Alabel v

20、alues grade abcdf为了记忆变量的意义为何,我们还可以利用note的方式来记录变量。指令如下:no tes race: values of race coded as 5 were recoded to be miss ing notes(叫出note的指令)另外,介绍一些利用公式来产生变量的指令。ege n zread = std(read)summarize zreadlist read zread in 1/10ege n rmea n = mean( read), by(ses)list read ses rmea n in 1/10ege n mread = media

21、 n( read), by(prog)list read prog mread in 1/10最后,我们可以将以上的执行结果储存下来。指令如下:save sample5-1(存成另一個檔)save sample4-1(取代原來的sample4-1)现在亦将数据修饰的相关指令整理成下表。label dataApply a label to a data setorderOrder the variables in a data setlabelApply a label to a variablevariablegen erateCreates a new variablereplaceRepl

22、aces one value with ano ther valuerecodeRecode the values of a variableLabel valuesApply value labels to a variablelabel defi neDefine a set of a labels for the levels of a categorical variableno tesApply no tes to the data fileege nExte nded gen erate - has special functions that can be usee when c

23、reati nga new variablesaveStore the dataset currently in memoryon disk in Stata data format六、管理数据(Managing data)在本节中,我们将进一步介绍如何将数据作一些特殊的处理,例如:保留 所欲分析的数据、删除多余的数据或是将两份数据结合等等。假设我们只想针对部分的数据进行处理,而又想保留原始资料时,则有以F 两种方法可进行:1、 另存新檔: 亦即将所欲分析的部分数据储存在另一个档案中。 例如: 我们只 针对read成绩大于或是等于60分的学生进行分析, 则可利用下 面的指令来筛选。keep i

24、f read = 60 summarizesave sample6-1Note:当只要保留某些变量时,则利用指令keep。例如:keep read write2、直接处理:亦即在原始数据上进行分析。承上例,指令输入如下:preservedrop if read 60summarizerestoreNote:若要删除某些变量时,则利用指令drop。例如:drop read write接下来,我们介绍如何将两笔数据结合在一起。数据的结合主要可以分为 两种,水平合并和垂直合并。前者是指变量的增加;后者则是指样本数的增加。 说明如下:1、水平合并use samplehlappe nd using sa

25、mpleh22、垂直合并:use samplevlsort idsave samplevl, replace use samplev2, clear sort idsave , replaceuse samplevlmerge id using samplev2Note:在垂直合并前要记得先sort。最后,我们将数据修饰的相关指令整理成下表。keep ifKeep observations if condition is metdrop ifDrop observations if condition is metkeepKeep variables (dropp ing others)dro

26、pDrop variables (keep ing others)appe nd usingAppend a data file to current filesortSort observati onsmergeMerge a data file with curre nt file七、资料分析透过前面几节的介绍,应该对于STATA勺指令和使用方法有了基本的认识 现在,我们开始说明如何利用STATA来处现统计上的问题以及计量方面的模型。1、检定:我们利用下面的例子来示范如何进行统计上的检定工作。sample4-1:ttest write =60ttest write, by (ge nder)ttest write, by (ge nder) un equalsample7-1:ttest before= after2、回归在执行回归分析时所使用的指令为regress。cd e:sampleuse sampl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论