Stata学习笔记_第1页
Stata学习笔记_第2页
Stata学习笔记_第3页
Stata学习笔记_第4页
Stata学习笔记_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Stata学习笔记以下命令均采用小写字母Chapter 1 stata 入门1.1打开数据use D:Stata9auto.dta, clear用 use命令打开数据sysuse auto, clearauto 为系统数据sysuse为打开系统数据的命令1.2获取帮助He Ip summarizesummarize 为需要获取帮助对象可以改为其他的需要帮助的对象Findit summarize , net 寻找网 络帮助 summarize为需要获取帮助对象Search summarize , net 寻找网 络帮助 summarize为需要获取帮助对象显示结果Dis play 5+9 1.3

2、描述统计(summarize可简写成sum)Use atuo, clearSummarize price 描述price的观察值个数、 平均值、标准差、最小值、最大值Sum weightsummarize 可简写成 sumSum weight price同时完成上面两步1.4绘图Scatter price weight图命令scatter为绘制散点Line price weight ,sortline 为绘制折线图命令,sort为排序,绘制折线图前需要先排序1.5生成新的数据(gen erate可简写成gen)设置观测值的组数n为观察值得序号ClearGen x=_nGen y=x+100Se

3、t obs 10001.6控制结果输出显示List n1.7设置屏幕滚动Set more off 先设置此项 则显示时,屏幕不停Set more on先设置此项 则显示时,会使显示停止1.8清除内存中原有内容clear1.9设置文件存取路径(cd)Cd d:statad:stata为路径1.10如果想知道当前路径下有哪些文件,可以用dir命令来列示.dir1.11假设你想在D盘的根目录下创建一个新的文件夹 mydata来存放数据文件, 命令为mkdir。mkdir d: mydata1.12错误提示List myvar上述命令试图显示变量myvar,但是结果窗口仅出现如下的显示variable

4、 myvar not foundr(111);红色信息表明,没有找到一个叫 myvar的变量,的确,我们的数据中并没有 这个变量。List巧妇难为无米之炊。红色信息下面还有一个天兰色的r(111),用鼠标点击,即可弹进一个帮助信息框,给出错误的更详尽解释。再比如,我们在求五数概略时,误把sum写成了 sun.sunun recog ni zed comma nd: sunr(199);显示说不认识sun这个命令。附录:常见命令Chapter2命令语句2.1掌握命令语句的格式by varlist: comma nd varlist = exp if exp i n ran ge weight ,

5、 op ti ons 注:表示可有可无的项,显然只有comma nd是 必不可少的,下面结合例子分 项来讲解命令的各个组成部分。2.2 命令 comma ndby varlist: comma nd varlist二 exp| if exp i n ran ge weight , op ti ons.cd d:/stata9.use auto, clear.summarize用,单独使用时,代表所有变量的all。.summarize all果与打开美国汽车数据文件 auto.dta,后面的 clear 表示先清除内存中可 能存在的数据集/*很多命令可单独使 般是对所有变量进行操作,等价于后面加

6、*/注意到该命令输出结个命令完全一样.sum为summarize 的略写/与前一命令等价,sum.susu 是 summarize 的 最简化略写,不能再简化为s.s/简写前提是不引起混淆。执行这个命令将出现错误信息un recog ni zed comma nd: s2.3 变量 varlistby varlist: comma nd varlist二exp if exp i n ran ge weight , op ti ons varlist表示一个变量,或者多个变量,多个变量之间用空格隔开。.cd d:/stata9.use auto, clear.su P/变量和命令均可略写,注意到

7、两个结果完全一样.sum P rice求价格的观察值个数,平均值,方差,最小值和最大值.su tII分数据中有两个变量的开首字母为t(trunk和turn ),所STATA认为t为模糊的省略。m ambiguous abbreviation I 红色为错误信息.sum tr tuII求trunk和turn变量的五数概略统计变量名称除以下字符不能用作变量名外, 任何字母、字母与数字(单独的数字也不允许)组合均可用做变量名:all b byte coef cons double float if in intlong _n _N _pi _pred _rc _se _skip using with

8、基本要求如下:_第一个字元可以是英文字母或,但不能是数字;_最多只能包括32个英文字母、数字或下划线;_由于STATA 保留了很多以“ _ “开头的内部变量,所以最好不要用为第一个字元来 定义变量。2.4分类操作by varlistby varlist: comma nd varlist = exp if exp i n ran ge weight , op ti ons如果需要分别知道国产车和进口车的价格和重量,可以采用分类操作来求得,.cd d:Istata9.use auto, clear.by foreig n: sum p rice weightII分别计算国产车和进口车的价格和重量

9、但如果执行下面两个命令,将出现错误*I/按价格从低到高而是从大到小排序,其/按价格从高到低排序/*先把国产车都排在 前,进口车排在后面, 然后在国产车内再按 价格从大小到排序,在.sort Price重新排序.by foreig n: sum p rice weight*not sorted/*系统提示没有排序,这是因为by varlist在执 行时要求内存中的数据是按照by后面的变量排序的。当我们用 sort price重 新排序后,就打乱了原来按照foreign的排序,所以出现了错误提示。更正的办法是:*/.sort foreig n/按国产车和进口车排序.by foreig n: sum

10、 p rice weight*更简略的方式是把两个命令用一个组合命令来 写。.by foreig n, sort: sum p rice weight 如果不想从小到大排序, 命令为gsort。.gsort - P rice-price.gsort foreign进口车内部,也按从大 到小排序*/2.5赋值及运算二exPby varlist: comma nd varlist =exp| if exp i n ran ge weight , op ti ons 例:生成一个新的价格变量nprice,该变量的取值为原汽车价格变量price的 基础上涨10元.cd d:/stata9.use au

11、to, clear.gen np rice= price+10/生成新变量nprice,其值为price+10.list P rice np rice/*上面的命令generate(nprice,新的价格在原价格的基础上均增加了/比较一下两个变量的取值略写为gen)生成一个新的变量,新变量的变量名为10元。.repl ace np rice=np rice-10/* 命令 replace则直接改变原变量的赋值,nprice 调减后 与 price 变量 取值相等*/.list price nprice/再比较一下两 个变量,相等。2.6条件表达式if expby varlist: comma

12、nd varlist = exp if exp i n ran ge weight , op ti ons例:若只想查看国产车的品牌和价格,则加入筛选条件 if foreign=0 */.cd d:/stata9.use auto, clear.list make p rice if foreig n=0*只查看价格超过1万元的进口车(同时满足两 个条件),则.list make p rice if foreign=1 & price10000*查看价格超过1万元或者进口车(两个条件任 满足一个).list make price if foreig n=1 | price10000*分类型查看

13、价格超过1万元的汽车的品牌和价 格.by foreign, sort: list make price if price100002.7范围筛选in rangeby varlist: comma nd varlist = exp if exp i n ran ge weight , op ti ons 如果要计算较低的前10台车的平均价格,则要 先按价格排序,然后仅对前10个车的价格求平均值.cd d:/stata9.use auto, clear.sort p rice.sum p rice in 1/5而是从1到5的 意思,即1,2,3, 4, 5。如果要计算前10台车中的国产车的平均价格

14、, 则可将范围和条件筛 选联合使用。.sum P rice in 1/10 if foreig n=0注意“ 1/5”中,斜杠不是除口号,2.8 加权weightby varlist: comma nd varlist = exp if exp i n ran ge weight , op ti ons任务:下表是2005年湖北省高考640分及以上成绩一分一段的人数统计,第列score为高考分数,第二列num 为该分数段的人数。现在我们要求640分及以上考生的平均分数。score num650193649648262364716646216452664432643236423864129386

15、40操作:先将上面的表格复制,然后进入STAT A执行如下命令.clear/ 清空 STATA.edit然后把光标定位在表格的第一行第一列,点右键,选择粘贴(Paste),上表数据便被复制到STATA中,退出数据编辑器sum score思考:得到的结果是640分及以上考生的平均分吗?简单地使用sum命令得到的平均成绩显然是不正确的,因为各个分数下的人数 是不一样的,正确的计算需要加权,加权的办法是.sum score weight=num / *加权计算,比较该结果与 sum score的区别,实际上,不用权重选项时,相当于权重相等。*/.sum score w=n/w为weight的略写,n

16、为num 的简写,两命令等价2.9其他可选项Qptionsby varlist: comma nd varlist = exp if exp i n ran ge weight , op ti ons许多命令都有一些可选项例如,我们不仅要计算平均成绩,还想知道成绩的中值,方差,偏度和 峰度等*/.sum score, detail.sum score, d /d为detail的略写,两个命令完全等价注意,结果中显示了 1%,5%等分位数,意思 是把变量从小到大排 序,第1%位置处的取值是多少,第 10%的位置上的取值是多 少。显然,50%位置处 的取值是中位数。此外,加了 detail选项后,

17、还得到最小的 前5个数,最大的5个 数,以及峰度和偏度等。再如,list命令也有一些可选项.cd d:/stata9 .use auto, clear.list price in 1/30, sep (10)II 每 10 个观察值之间加一横线.list price in 10/30, sep(2)/每 2 个观察值之间加一横线.list price, nohead头/不要表Cha pter3数据 3.1打开示例数据和网络数据:use3.1.1示例数据示例数据为STATA帮助文件中所用的数据,其后辍名为.dta,如果在STATA 软件当前路径下,直接用use命令即可打开;如果不在当前路径下,则

18、可以使用 sysuse命令打开。.use auto,clear/打开汽车数据auto.dta.cd d:III改变路径到d:/.use auto, clearfile auto.dta not foundII系统提示无法找到文件,因为auto.dta 不在d:III无论当前路径是什么,该命令均能打开系统自带文件r(601);.sysuseauto,clear3.1.2从网络获取数据上述示例数据可能没有全部下载到你的所用的电脑中,因此简单地使用use和sysuse命令时,可能出现错误,如.use nl swork, clearfile n Iswork.dta not found此时,如果确定该

19、数据为示例数据,可以直接通过网络获取,其命令为:.use http:/www.stata-II 从网站获取数据,或者 webuse只能从 http:/www.stata- 这一路径获取数据,如果不是 该网站的数据,webuse失效,只能把网站地址完全写出来。使用该命令时必须 确.webuse nl swork, clearII与前一命令等价,从STATA官方数据库获取数保网络连接正常.另一个网络数据较多的地方是波士登大学的数据中心,伍德里奇的计量经 济学导论一书中所使用的全部数据都可以通过该数据中心获得。比如.usehtt p://ec- p/data/wooldrid

20、ge/CEOSAL1即打开教材中例2.3中所使用的CEO数据。需要从外部读入,最简单而直接的办法是复制和粘贴。但是有比如,我们有SAS格式或SPSS格式的数据,但没有SAS软件 此时需要用STATA提供的其他命令或者使用transfer数据格式use命令只能打开后辍名为“*.dta ”格式的数据,.dta格式以外的数据,STATA 不能直接读取, 时没有其他软件,和SPSS软件,转 化软件。在讨论其他输入或导入数据的方法之前,我们先来学习一点数据类型 的 知识。3.2数据类型STATA通常把变量划分为三类:分别是数值型,字符型和日期型 3.2.1数值变量:用0、1、29及+、-(正负号)与小数

21、点“(.)”来表示。在输入数据时, 逗号不能被识别,如1,024应该直接写成1024.-5 5.2 5.2e+3 5.2e-2后面两个数据为科学计数法的数据,分别表示5200和0.052.其中的e相当于 10,因此 5.2e+3 的意思是:5.2*10 3=5200数值型变量按其精度区分,又有五种类型,分别是:存贮类型最小最大 0- 领域 字节byte -127100 +/-1 1int -32,76732,740+/-12long -2,147,483,6472,147,483,620+/-14float -1.70141173319*1038 1.70141173319*1036 +/-1

22、0八-36 4double -8.9884656743*10307 8.9884656743*10307 +/-10八-323 8当运算精度要求很高的时候,需要将变量设置成浮点型或双精度型。另注意1和1.0000的精度是不同的,前者在(0.5,1.5)区间内近似,而后者在 (0.99995,1.00005)区间内近似。若多次运算反复取四舍五入,精度较低时将使 计算误差迅速变大,然而,精度高时占用的内存资源较多。下面的命令有助于 理解变量存贮类型变换。.clear.set obs 1/将设定一个观察值obs was 0, now 1/提示信息说,之前系统中没有观察单位,现在有了一个.gen a=

23、1/生成一个新变量a,令a取值为1/*d为describ 命令的略写,describ命令显示数据集的属性信息,注意观察显示结果中,a的 storage type为 float 型,浮点型为默认类型*/Contains dataobs: 1vars: 1size: 8 (99.9% of memory free)storage dis play valuevariable n ame type format label variable label a float %9.0gSorted by:Note: dataset has cha nged since last p re

24、ss/在不损害信息的基础上压缩,使数据占用空间尽可能小a was float, now byte/a由浮点型变为了字节型.rep lace a=101/ 注意a的storage type 现在为byte 型/*注意a的storage type 现在自动升为int型,因为byte最大只能为100*/a was byte now int(1 real cha nge made).rep lace a=100.comp ress/重新变回到byte型.rep lace a=32741/直接变到long 型,因为int型最大只能到32740.gen double b=1/直接生成双精度变量b.reca

25、st double a/将a变成双精度变量b/注意到a和b均为双精度型3.2.2字符串变量字符变量通常是一些身份信息,如姓名,地名。另外,定类变量也可以用字 符变量来表示,如性别分为“男”和“女”。字符串变量由字母或一些特殊的符号组成(如地名籍贯变量,迁出地, 住址,职业等等)。字符串变量也可以由数字来组成,但数字在这里仅代表一 些符号而不再是数字。字符串变量通常以引号“”注标,而且引号一般不被视同 为字符的一部分,注意这里的引号必须是英文输入状态下的引号。字符串最多可以达244个字符。一般用str#来表示字符的多少,如str20 表示将有20个字符。一般三个中文字的姓名需要6个字符。字符型示

26、例Stri ngstri ng ” string ” stri ng/特殊字符串,表示空字符,缺失值。/注意与空字符串的区别,含有一个空格”125.27 ”/ ” 125.27 ”由于有双引号,将被视同为字符而非数值。$2,343.68f love you旺材是条狗”注意前四个字符串均不相同,大小写是不一样的,有无空格及空格的位置不 同,都表示不同的字符串。对于” 125.27”这样的数值型的字符串,可以用real() 函数或者destri ng 命令转化成数值型变量。具体操作见3.3.1。3.2.3日期型变量在STATA中,1960年1月1日被认为是第0天,因此1959年12月31日为 第-

27、1天,2001年1月25日为15000天。对日期型变量的讨论将在后面的时间 序3.2.4缺失值没有意义的计算结果显示为”.”.dis play 2/0STATA默认的缺失值也用“.”来表“.”或者空来表示的,而是用-9996等,或者反之,将“.”替换为-9996,命令另一种情况是,数据中含有缺失值,而 示。在有些数据文件中,缺失值不是用 来表示,如果要将其全部替换为“.” 为:.mven code age,mv(-9996).mvdecode age,mv(-9996)3.3数据类型转化.des任务:将destring1, destring2 和tostring中的数据类型进行相互转化in c

28、ome str5 %9s.sum/因为所有变量为字符型,所以不能进行数值计算.gen nin com=in com+10/因字符不能进行四则运算,不能进行加法运算*type mismatch系统提示类型不匹配,因为in come为字符型,10为数值型.destri ng, rep lace全部转换为数值型,rep lace表示将原来的变量(值)更新.sum/注意到转换为数值型后,可以求五数概略了.gen nin com=i ncome*1.3转换后,可以运算,工资终于涨了30%!.list nincom in come / 工资终于涨了 30%!-将字符型数据转换为数值型数据:去掉字符间的空格

29、*destring2数据集中的data变量为字符型,且年月日间有空格,转移为数据.webuse destri ng2, clear.des /注意到所有的变量均为字符型str .list date /注意到date年月曰之间均有空格 date1. 1999 12 102. 2000 07 083. 1997 03 024. 1999 09 00.destri ng date rep lace/想把date转换成数值型,但失败了,系统提示说*date contains non-nu meric characters; no rep lace /* 由于含有非数值型字符(即空格),因此没有更新,也

30、即转换命令没有执行。*/“ ”)*忽略空格,然后转换,注意这里的”中“/成功转换为long型.destri ng date rep lace ignore(间有一个空格,不是” ” */date: characters sp ace removed; rep laced as long.des/注意至U date 的storage type已变为 long.list date/注意到空格消失了date 1.199912102.200007083.19970302 /*与date变量类似,变量price前面有美元符号,变量percent后有百分号,换为数值型时需要忽略这些非数值型字符。*/.de

31、string price percent, gen(price2 percent2) ignore( $ ,% ”.list/注意到price2前面的$号消失,percent2后面的%号消失date p rice p rice2 p erce nt p erce nt21. 19991210 $2,343.68 2343.68 34% 342. 20000708 $7,233.44 7233.44 86% 86.d注意到price2和percent2均变为数据值型变量 double和byte*3.3.2数值型转化为字符型:tostring .webuse tostri ng, clear /*

32、该数据中年月日的数据类型不一样,不能直接相加生成一个反映日期的新变量*/.des /注意到month为字符型,而年和日为数值型 .list .gen date仁month+ ” /” +day+” /”/将年月日构成一个新的日期变量 type mismatch /由于mon th为字符型,年和日为数值型,不同类型不能相加 r(109);.tostri ng year day, re place/将年和日转化为字符型.des/注意到,现在全部变为字符型.gen date仁month+ ” /” +day+” /” +y/将年月曰构成一个新的日期变量.list生成了一个新的变量date1,其为三个

33、字符串和两个” /符号连接而成 .gen date2=date(date1, ” mdy”* date ()为日期函数,它以 1960 年 1 月 1日为第0天,计算从那天起直到括号中指定的某天datel一共过了多少天。” mdy指定datel的排列顺序,这里是按照月日年的顺序来表示日期。*/.list/新生成的date2表示总天数*小游戏:请算算你活了多少天?示例:一个生于 1975年12月27日的家伙,他活了?.di date( “ 1975/12/27 ” , ” ymc”)3.4数据显示格式:format*/*format只控制数据的显示格式,并不改变内存中数据的大小。.webuse

34、cen susIQclear美国人口普查数据.des/第三列显示了数据的格式dis play formatstorage dis play valuevariable n ame type format label variable label state str14 %14s Stateregi on int %8.0g cenreg Cen sus regi onpop long %11.0g Popu lationmedage float %9.0g Media n age *注意到,stata变量的格式为%14s,表示右对齐,共14个字符,%为固定用法 .list in 1/4 /注意

35、不同的显示格式:均为右对齐 state regi on pop medage1. Alabama South 3893888 29.32. Alaska West 401851 26.13. Arizona West 2718215 29.24. Arka nsas South 2286435 30.6.format state %-14s/该命令使stata的显示格式左对齐,14前面多了个负号.list in 1/4/注意不同的显示格式,state现在左对齐了+state regi on pop medage1. Alabama South 3893888 29.32. Alaska Wes

36、t 401851 26.13. Arizona West 2718215 29.24. Arka nsas South 2286435 30.6.format region %-8.0g/ 因为这个数太大,加逗号将超过11位数,我们可以先把总的位数增加region变量看起来是字符型变量,但实际上为数据型,它也可以左对齐,同样是加一个负号.list in 1/4/注意region现在左对齐了.format pop %11.0gc/*pop的显示格式为%11.0g,后面加上c,则每三位数间用逗号分开,c为comma的意思.*/.list in 1/4/结果加上了逗号,但是第五个观察值没有任何变化.

37、format pop %12.0gc/把pop显示总长度数增加到12位.list in 5现在所有的pop都按逗号分开了state regi on pop medage1. Alabama South 3,893,888 29.32. Alaska West 401,851 26.13. Arizo na West 2,718,215 29.24. Arka nsas South 2,286,435 30.65. California West 2366790229.95. California West 23,667,902 29.9.format medage %8.1f要求所有的meda

38、ge都显示一位小数.list in 1/4state regi on pop medage1. Alabama South 3,893,888 29.32. Alaska West 401,851 26.13. Arizo na West 2,718,215 29.24. Arka nsas South 2,286,435 30.6.gen id=_ n/生成一个新变量id,取值依次为1,2,3.replace id=9842 in 3/将id的第三个变量替换为9842 .list in 1/3state regi on pop medage id1. Alabama South 389388

39、8 29.3 12. Alaska West 401851 26.1 23. Arizona West 2718215 29.2 9842.format id %05.0f对于编号,我们希望前面用零使得位数对齐.list in 1/3注意到通过在前面补零,所有的id都成了 5位数。state regi on pop medage id1. Alabama South 3893888 29.3 000012. Alaska West 401851 26.1 000023. Arizo na West 2718215 29.2 098423.5在STATA 中直接录入数据:input3.5.1菜单

40、式操作任务:按学号录入五个学生的经济学成绩id economy1 402 803 904 705 53操作:(1)点击图标園 在打开的数据表格第一列中录入五个姓名 在第二 列中录入另五个成绩 51 iLi a. JdditQx-区i0已证JTr 11Til - ElZV 鼻 rdI vi223击var1弹出对话框 将变量改名为id在var2弹出对话框将变量改名为name双label中写入学号 退出弹出窗口; 双击在建立数据文件后,如果没有存盘,这个文件即 是一个“临时的”数据文件,它将随着退出STATA系统时而消失。当数据文件被存储在后,它将成为一个“永久丿性”的数据文件,用户可以在以后经常使

41、用它而不必重新建立之。3.5.2命令操作任务:按学号录入五个学生的学号和姓名id n ame econ omy1 John402 Chris803 Jack904 Huang435 Tom70操作:在comma nd窗口中键入(注:前面的点号不必健入,每完成一行按回车 键,黑体为命令,斜体为变量名或文件名):对于字符型变量,需要指明其为字符型 并指明最大的字符长度。?clear清空内存?input id str10 name economyII输入变量名,特别注意姓名前的str10.? iJoh n40II录入第一个学生的学号和成绩? 2Chris80II录入第二个学生的学号和成绩? 3jac

42、k90? 4Hua ng70? 5Tom 53? end/录入数据结束?save economy3.5.3程序操作(1)打开do file editor,键入以下内容:保存数据到当前路径,文件名为econ omyclear/清空内存input id str1O name economy输入变量名,特别注意姓名前的 str1O.1 Joh n40/录入第一个学生的学号和成绩2 Chris803 Jack904 Huang 70 5 Tom 53endsave economy,erpl ace(2)保存程序文件为/录入数据结束保存数据到当前路径,文件名为eco nomymydo(3)点击三丄,执行

43、后得到数学成绩3.6导入其他格式数据:in sheet经常会遇到的情形是:我们有其他格式的数据,需要导入到STATA中进行分析,建议大家此时将其他格式数据复制到分析数据的文件目录下,然后直接 用STATA的导入数据文件命令导入原始数据,用程序模式进行处理,然后导出处理结果。这样做的最大好处是:既不会破坏最原始的数据文件,又使我们的每 步数据处理和分析过程都有迹可循。3.6.1 in sheet 命令在本书所附数据文件中找到“ 3origin.xls ”数据,将其打开并另存为“ 3origin.csv ”,(另存时请注意要选择“保存类型”下拉单,选择 CSV (逗号分 隔)这一项)。然后在STA

44、TA命令窗口中用下述命令导入.in sheet using 3orig in. csv, clear也可以先将“ 3origi n.xis ”数据打开并另存为“ 3orig in .txt ”,然后用下面的命 令导入.in sheet using 3orig in. txt, clear当数据中某个变量的位数特别长或者对导入数据的精度要求很高的时候,需 要在该命令后面加double选项。.in sheet using 3orig in. txt, double clear3.6.2 in file 命令对于“ 3orig in .txt ”或“ 3origi n.csv,”还可用infile命

45、令导入STATA,此时需要先指出变量名。尤其要注意,当变量为字符型时,要先指明。in file id str10 n ame gen der mi nority economy math using origi n.txt , clear或者in file id str10 n ame gen der mi nority economy math using origi n.csv, clear3.6.3 infix 命令还有一种标准化的数据,每个变量的位数是确定的,不足时,前面用 0补齐, 以origin.数据的后面四个变量为例,其数据格式为1140681280520290760243900

46、37096115385028536129565如果遇到这种数据格式,需要对照数据说明导入数据,相应的命令为: infix gen der 1 mi no rity 2 economy 3-4 math 5-6 using orig in. csv, clear 其中的数字为对应的数字位数。3.6.4 outsheet 命令与前述三个命令相反,有时我们需要将 STATA数据导出为其他格式数据, 比如文本格式或后缀为 acs的格式:此时需要使用outsheet命令实现,该命令 的基本格式如下。outsheet using myresult.txtoutsheet using myresult.as

47、c此时建立的文件myresult.txt第一行为变量名,第26行为变量值。变量列间 用Tab键分隔。如果不希望在第一行存储变量名,则可以使用nonames选项。如果文件已经存在,则需要使用rep lace选项,相应的命令分别为。outsheet using myresult.asc, non amesoutsheet using myresult.asc, non ames rep lace3.6.4 使用 transfer 软件Transfer软件专用于转换不同格式的数据文件,使用起来非常方便。只需要 在input File Type栏中选择需要转化的原数据文件类型,然后定位打开需要转 化的

48、原数据文件。再选定输出文件类型,指定输出文件的存放位置和文件名。最 后点击transfer按钮。数据便被转化。该软件可在/bbs上下载试用,不过做正式工作,建议采 用正版软件。宿 S t -tl/TT AQE f*r-Jnj jd更亟补畑汕T Dbsefvatbna | Dpto血Dp伽g 罔Aboul InfctFfc Typs: |AcccwFilsSpccbadan: |二1BroPtK. 1TdUc: 1tJOJpul Fie ijjpt |Si4te/SE VeitiweFileSpecilicdicn |二JBiowse. 1St H1己Ev

49、il1Help113.7标签数据:label要掌握的命令:为了创建一个完整的文件,要掌握下面的命令。以上命令可以通过help comma nd查看到具体的命令格式。*3.7.1变量重命令:ren ame/*采用直接复制粘贴法,将原始数据粘入stata。然后退出数据编辑器,先将该数据保存起来,文件名为3origin.dta。*/save 3orig in, rep lace命令为name。在此之前,可以先用一个describ命令看看数/*新粘入的变量自动命令为var1, var2,.var6,为使变量容易理解和记忆, 要将变量重新命名, 据情况*/use 3orig in, cleardesII

50、查看数据集的整体情况,注意变量名为 var1-var6renpfix var v/将所有var开头的变量名改为以v开头ren ame v1 id将第一个变量重新命令为idren ame v2 n ameren ame v3 gen der ren ame v4 min ority ren ame v5 economy ren ame v6 math des I再次查看数据集的整体情况,注意变量名已改变 *3.7.2 标签文件:label data/*为避免时间太长,忘记变量的含义,我们可以用label命令来标记。该命令可以用来标记数据文件,如将文件取名为“2007年秋5632班学习成绩单” *

51、/ label data “2007年秋5632班学习成绩单”*在文件处理过程中加注说明,命令为 notes note: 2007年9月6日由任我行创建该数据*下一次打开数据,要查看创建和数据处理的说明时,直接键入n ote*3.7.3 标签变量:label var*也可以用label命令来标记变量,如将id标记为“学号”label var id “学号”label varname姓名”label vargender性别1=男2二女”label varmi nority 民族”*3.7.4 标签变量值:label define 和 label values*还可以标记变量的取值。注意要按以下两

52、步来操作:label define genderib 1 男0 女list/注意此时gender变量显示的值为0或1label values gen der gen derlb/该命令仅仅是显示的变化,实质不变list注意此时gender变量显示的值为男或女label define minoritylb 1汉族2 少数民族 label values min ority mi no ritylblist*3.7.5标签增加与修改:add和modify/*定义完汉族和少数民族后发现还有些学生的民族是不知道的(原始值为3)则*/label define minoritylb 3不知道”*然而结果窗口却显示出如下错误信息,label min oritylb already defi ned*因为minoritylb已经存在并被定义,我们需要加上选项,add label define minoritylb 3 不知道 ” ,add listlabel define mi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论