stata 第一章 基本操作_第1页
stata 第一章 基本操作_第2页
stata 第一章 基本操作_第3页
stata 第一章 基本操作_第4页
stata 第一章 基本操作_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、宋顺林中央财经大学 会计学院内容提纲n1.1导入数据n1.2编辑数据n1.3描述数据n1.4结果和程序管理n1.5多表数据管理1.1 导入数据打开Stata软件STATA由四个窗口构成Review (列出历史命令)Variables (变量列表)Results (报告结果)Command (输入命令)你可以通过下列菜单调整窗口设置Edit/preferencesWindow/command, variables display 命令在命令窗口输入:display 1display song 试试以下两者的区别:display 1+1 display 1+1Help 命令菜单窗口help/pdf

2、 document (Stata基本参考手册)help/content (Stata所有命令 介绍)help/stata command (搜索查询Stata命令)命令窗口help + stata 命令,例如:help displayhelp help 另外,你也可以利用search命令寻求帮助,例如:search displaysearch help Insheet:导入数据通常数据来源于数据库下载,而不是手工录入导入格式Stata不能直接支持很多格式(Excel files, SAS files)可以先保存为csv格式后再导入stata准备工作:将Excel文件另存为csv格式,然后导入

3、csv文件。菜单窗口File/import/ASCII data created by spreadsheet /browse file name 命令窗口insheet using D:Teach课件STATAdatacorgov.csv ,clear在知道文件路径的情况下,往往使用insheet命令更为方便对insheet了解更多, pls help insheetdrop _all and clear首先导入数据insheet using D:Teach课件STATAdatacorgov.csv ,clear然后试试以下两个的差别:insheet using D:Teach课件STATA

4、datacorgov.csv insheet using D:Teach课件STATAdatacorgov.csv ,clear为什么要加clear,原因是:你必须先清除(clear)原来的数据,才能导入新的数据你也可以先用drop _all 删除原有数据,然后导入新的数据检查数据describe ,list,browse,edit 导入数据之后,你可以检查一下数据是否导入成功,有好几种方式可以帮到你:在命令窗口输入describe 或 d ,将显示样本、变量数、数据大小及变量的详细信息。输入入list, 显示所有样本数据,试试以下命令:list in 1 list in 2/10输入brow

5、se 或br, 在数据窗口浏览所有数据输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改数据试试browse,list,edit三个命令,看看三者的区别注意:上述命令也可以通过菜单的方式实现。保存数据菜单窗口File/save File/save as(另存为)命令窗口save D:Teach课件STATAdatacorgov.dta save D:Teach课件STATAdatacorgov.dta ,replace replace的作用是,如果文件已存在,则替换注意stata格式文件的后缀为.dta练习1.1导入表名为earning的Excel格式数据检查数据保存数据为stata数

6、据格式1.2编辑数据打开stata数据use D:Teach课件STATAdatacorgov.dta,cleardrop命令,删除变量或观察值drop if year=2010,删除所有2010年的变量drop year,删除year这个变量drop _all,删除所有变量注意:stata值的等号全为双等号,单等号是赋值命令,在以后的操作中,注意=号和=号的区别。 打开stata数据use D:Teach课件STATAdatacorgov.dta,clearkeep命令是drop命令的反向命令keep year topone,删除其它变量,只保留year和topone这两个变量keep if

7、 year=2010,删除其它年度变量,只保留2010年的变量rename,编辑变量名称rename topone top1label ,为变量名贴标签,以更容易理解label var top1 第一大股东持股比例clear,清空所有数据练习1.打开stata数据删除private变量变量只保留stkcd year两个变量删除2008年的数据只保留2010年的数据将year变量改名为y将y的标签设置为年度1.3描述数据count,看看有多少样本count count if year=2008summary or sum,描述样本的统计量sum topone ,描述topone变量最基本统计量,

8、均值、方差、最小值、最大值sum topone, d,描述topone变量更为详细的统计量,包括偏度、峰度、分位数。tabulate或tab,描述离散变量的基本统计量tab private,描述private变量为0和1的百分比 练习1.3用stata打开corgov文件看看一共有多少家样本看看2010年一共有多少家样本看看roa变量均值、方差、最小值、最大值是多少看看roa变量的5,75的分位数是多少,偏度是多少看看2010年private等于的比例是多少1.4结果和程序管理log命令,你可以用log存储命令和结果use D:Teach课件STATAdatacorgov.dta,clear打

9、开log文件:capture log using “D:Teach课件STATAdataoutput.log”,replacesum toponesum topone,dtab private查看log文件:view “D:Teach课件STATAdataoutput.log”关闭log文件:log close查查capture有什么功能,help capture注意:log命令的功能同样可以通过菜单方式实现用doedit和do命令管理程序步骤用doedit打开程序管理窗口编辑程序,保存程序,运行程序例子use D:Teach课件STATAdatacorgov.dta,clear打开程序:do

10、edit输入一系列命令:sum toponesum topone,dtab private保存程序运行程序:do D:Teach课件STATAdatado.do思考doedit和do的用处?练习1.4建立一个log文件执行一些操作用log文件存储你的操作结果建立一个程序文件(do file)执行一些操作用do命令运行你的程序文件1.3 多组数据处理整理数据过程中,我们经常会遇到两种情况我们希望在2000年的数据表后面加上2001年相同变量的样本数据-加行我们希望在原始数据基础上增加对样本公司的其他特征的变量-添列Business School of SYSU, 2010191.3 多组数据处理

11、多组数据处理NameyearSizeA2000B2000nameYearsizeA2000B2000nameyearsizeA2000B2000A2001B2001nameyearsizeA2000B2000nameyearindustryA2000B2000nameyearsizeindustryA2000B2000Master dataUsing data1.5多表数据管理append 命令:数据表之间纵向合并,追加数据insheet using D:Teach课件STATAdatacorgov99-00.csv ,clearsave D:Teach课件STATAdatacorgov99-

12、00.dta ,replaceinsheet using D:Teach课件STATAdatacorgov01-10.csv ,clearappend using D:Teach课件STATAdatacorgov99-00.dta save D:Teach课件STATAdatacorgov99-10.dta,replacebrmerge命令 数据表之间横向合并,追加新的变量insheet using D:Teach课件STATAdatacorgov.csv,clearsort stkcd yearsave D:Teach课件STATAdatacorgov.dta,replaceinsheet

13、using D:Teach课件STATAdataearning.csv,clearsort stkcd yearmerge stkcd year using D:Teach课件STATAdatacorgov.dta tab _merge(数值为1表示表一有,表二没有;2表示表二有表一没有;3表示都有)browsesave D:Teach课件STATAdatacorfin.dta,replacebrhelp _merge注意append命令和merge命令区别思考merge和append命令相对于excel直接copy的优势使用merge命令时,经常容易出错,merge完后,一定要检验数据是否正确,可以用browse,也可以tab _merge。常见错误包括:忘记sort一下数据,合并不成功忘记添加关键词,导致合并的数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论