stata-一-基本操作课件_第1页
stata-一-基本操作课件_第2页
stata-一-基本操作课件_第3页
stata-一-基本操作课件_第4页
stata-一-基本操作课件_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章Stata基本操作宋顺林中央财经大学会计学院1.第一章Stata基本操作宋顺林1.内容提纲1.1导入数据1.2编辑数据1.3描述数据1.4结果和程序管理1.5多表数据管理2.内容提纲1.1导入数据2.1.1导入数据打开Stata软件STATA由四个窗口构成Review(列出历史命令)Variables(变量列表)Results(报告结果)Command(输入命令)你可以通过下列菜单调整窗口设置Edit/preferencesWindow/command,variables……3.1.1导入数据打开Stata软件3.

display命令在命令窗口输入:display1display"song"试试以下两者的区别:display"1+1"display1+14.

display命令在命令窗口输入:4.Help命令菜单窗口help/pdfdocument(Stata基本参考手册)help/content(Stata所有命令介绍)help/statacommand(搜索查询Stata命令)命令窗口help+stata命令,例如:helpdisplayhelphelp另外,你也可以利用search命令寻求帮助,例如:searchdisplaysearchhelp5.Help命令菜单窗口5.Insheet:导入数据通常数据来源于数据库下载,而不是手工录入导入格式Stata不能直接支持很多格式(Excelfiles,SASfiles)可以先保存为csv格式后再导入stata准备工作:将Excel文件另存为csv格式,然后导入csv文件。菜单窗口File/import/ASCIIdatacreatedbyspreadsheet/browsefilename命令窗口insheetusing"D:\Teach课件\STATA\data\corgov.csv",clear在知道文件路径的情况下,往往使用insheet命令更为方便对insheet了解更多,plshelpinsheet6.Insheet:导入数据通常数据来源于数据库下载,而不是手工drop_allandclear首先导入数据insheetusing"D:\Teach课件\STATA\data\corgov.csv",clear然后试试以下两个的差别:insheetusing"D:\Teach课件\STATA\data\corgov.csv"insheetusing"D:\Teach课件\STATA\data\corgov.csv",clear为什么要加clear,原因是:你必须先清除(clear)原来的数据,才能导入新的数据你也可以先用drop_all删除原有数据,然后导入新的数据7.drop_allandclear首先导入数据7.检查数据

describe,list,browse,edit导入数据之后,你可以检查一下数据是否导入成功,有好几种方式可以帮到你:在命令窗口输入describe或d,将显示样本、变量数、数据大小及变量的详细信息。输入入list,

显示所有样本数据,试试以下命令:listin1listin2/10输入browse或br,

在数据窗口浏览所有数据输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改数据试试browse,list,edit三个命令,看看三者的区别注意:上述命令也可以通过菜单的方式实现。8.检查数据

describe,list,browse,edi保存数据菜单窗口File/saveFile/saveas(另存为)命令窗口save"D:\Teach课件\STATA\data\corgov.dta"save"D:\Teach课件\STATA\data\corgov.dta",replacereplace的作用是,如果文件已存在,则替换注意stata格式文件的后缀为.dta

9.保存数据菜单窗口9.练习1.1导入表名为earning的Excel格式数据检查数据保存数据为stata数据格式10.练习1.1导入表名为earning的Excel格式数据10.1.2编辑数据打开stata数据use"D:\Teach课件\STATA\data\corgov.dta",cleardrop命令,删除变量或观察值dropifyear==2010,删除所有2010年的变量dropyear,删除year这个变量drop_all,删除所有变量注意:stata值的等号全为双等号,单等号是赋值命令,在以后的操作中,注意=号和==号的区别。

11.1.2编辑数据打开stata数据11.打开stata数据use"D:\Teach课件\STATA\data\corgov.dta",clearkeep命令是drop命令的反向命令keepyeartopone,删除其它变量,只保留year和topone这两个变量keepifyear==2010,删除其它年度变量,只保留2010年的变量rename,编辑变量名称renametoponetop1label,为变量名贴标签,以更容易理解labelvartop1"第一大股东持股比例"clear,清空所有数据12.打开stata数据12.练习1.2打开stata数据删除private变量只保留stkcdyear两个变量删除2008年的数据只保留2010年的数据将year变量改名为y将y的标签设置为年度13.练习1.2打开stata数据13.

1.3描述数据count,看看有多少样本countcountifyear==2008summaryorsum,描述样本的统计量sumtopone,描述topone变量最基本统计量,均值、方差、最小值、最大值sumtopone,d,描述topone变量更为详细的统计量,包括偏度、峰度、分位数。tabulate或tab,描述离散变量的基本统计量tabprivate,描述private变量为0和1的百分比

14.

1.3描述数据count,看看有多少样本14.练习1.3用stata打开corgov文件看看一共有多少家样本看看2010年一共有多少家样本看看roa变量均值、方差、最小值、最大值是多少看看roa变量的5%,75%的分位数是多少,偏度是多少看看2010年private等于1的比例是多少15.练习1.3用stata打开corgov文件15.1.4结果和程序管理log命令,你可以用log存储命令和结果use"D:\Teach课件\STATA\data\corgov.dta",clear打开log文件:capturelogusing“D:\Teach课件\STATA\data\output.log”,replacesumtoponesumtopone,dtabprivate查看log文件:view“D:\Teach课件\STATA\data\output.log”关闭log文件:logclose查查capture有什么功能,helpcapture注意:log命令的功能同样可以通过菜单方式实现16.1.4结果和程序管理log命令,你可以用log存储命令和结果用doedit和do命令管理程序步骤用doedit打开程序管理窗口编辑程序,保存程序,运行程序例子use"D:\Teach课件\STATA\data\corgov.dta",clear打开程序:doedit输入一系列命令:sumtoponesumtopone,dtabprivate保存程序运行程序:do"D:\Teach课件\STATA\data\do.do"思考doedit和do的用处?17.用doedit和do命令管理程序步骤17.练习1.4建立一个log文件执行一些操作用log文件存储你的操作结果建立一个程序文件(dofile)执行一些操作用do命令运行你的程序文件18.练习1.4建立一个log文件18.1.3多组数据处理整理数据过程中,我们经常会遇到两种情况我们希望在2000年的数据表后面加上2001年相同变量的样本数据----加行我们希望在原始数据基础上增加对样本公司的其他特征的变量----添列1.3多组数据处理NameyearSizeA2000B2000nameYearsizeA2000B2000nameyearsizeA2000B2000A2001B2001nameyearsizeA2000B2000nameyearindustryA2000B2000nameyearsizeindustryA2000B2000MasterdataUsingdata19.1.3多组数据处理整理数据过程中,我们经常会遇到两种情况11.5多表数据管理append命令:数据表之间纵向合并,追加数据insheetusing"D:\Teach课件\STATA\data\corgov99-00.csv",clearsave"D:\Teach课件\STATA\data\corgov99-00.dta",replaceinsheetusing"D:\Teach课件\STATA\data\corgov01-10.csv",clearappendusing"D:\Teach课件\STATA\data\corgov99-00.dta"save"D:\Teach课件\STATA\data\corgov99-10.dta",replacebr20.1.5多表数据管理append命令:数据表之间纵向合并,追merge命令

数据表之间横向合并,追加新的变量insheetusing"D:\Teach课件\STATA\data\corgov.csv",clearsortstkcdyearsave"D:\Teach课件\STATA\data\corgov.dta",replaceinsheetusing"D:\Teach课件\STATA\data\earning.csv",clearsortstkcdyearmergestkcdyearusing"D:\Teach课件\STATA\data\corgov.dta"tab

_merge(数值为1表示表一有,表二没有;2表示表二有表一没有;3表示都有)browsesave"D:\Teach课件\STATA\data\corfin.dta,replacebrhelp_merge21.merge命令数据表之间横向合并,追加新的变量21.注意append命令和merge命令区别思考merge和append命令相对于excel直接copy的优势使用merge命令时,经常容易出错,merge完后,一定要检验数据是否正确,可以用browse,也可以tab_merge。常见错误包括:忘记sort一下数据,合并不成功忘记添加关键词,导致合并的数据错误stata的merge功能非常强,可以1:1,1:m,m:m详情请helpmerge22.注意append命令和merge命令区别22.练习1.5合并corgov99-00和corgov01-10两张表合并corgov和earning两张表思考合并追加命令有何用处?23.练习1.5合并corgov99-00和corgov01-10课后练习复习练习1.1-练习1.5的内容!看一看stata的菜单里有些什么选项?想一想stata的窗口各有些什么功能?浏览一下stata的帮助里那些内容?浏览一下stata的手册里有那些内容?24.课后练习复习练习1.1-练习1.5的内容!24.第一章Stata基本操作宋顺林中央财经大学会计学院25.第一章Stata基本操作宋顺林1.内容提纲1.1导入数据1.2编辑数据1.3描述数据1.4结果和程序管理1.5多表数据管理26.内容提纲1.1导入数据2.1.1导入数据打开Stata软件STATA由四个窗口构成Review(列出历史命令)Variables(变量列表)Results(报告结果)Command(输入命令)你可以通过下列菜单调整窗口设置Edit/preferencesWindow/command,variables……27.1.1导入数据打开Stata软件3.

display命令在命令窗口输入:display1display"song"试试以下两者的区别:display"1+1"display1+128.

display命令在命令窗口输入:4.Help命令菜单窗口help/pdfdocument(Stata基本参考手册)help/content(Stata所有命令介绍)help/statacommand(搜索查询Stata命令)命令窗口help+stata命令,例如:helpdisplayhelphelp另外,你也可以利用search命令寻求帮助,例如:searchdisplaysearchhelp29.Help命令菜单窗口5.Insheet:导入数据通常数据来源于数据库下载,而不是手工录入导入格式Stata不能直接支持很多格式(Excelfiles,SASfiles)可以先保存为csv格式后再导入stata准备工作:将Excel文件另存为csv格式,然后导入csv文件。菜单窗口File/import/ASCIIdatacreatedbyspreadsheet/browsefilename命令窗口insheetusing"D:\Teach课件\STATA\data\corgov.csv",clear在知道文件路径的情况下,往往使用insheet命令更为方便对insheet了解更多,plshelpinsheet30.Insheet:导入数据通常数据来源于数据库下载,而不是手工drop_allandclear首先导入数据insheetusing"D:\Teach课件\STATA\data\corgov.csv",clear然后试试以下两个的差别:insheetusing"D:\Teach课件\STATA\data\corgov.csv"insheetusing"D:\Teach课件\STATA\data\corgov.csv",clear为什么要加clear,原因是:你必须先清除(clear)原来的数据,才能导入新的数据你也可以先用drop_all删除原有数据,然后导入新的数据31.drop_allandclear首先导入数据7.检查数据

describe,list,browse,edit导入数据之后,你可以检查一下数据是否导入成功,有好几种方式可以帮到你:在命令窗口输入describe或d,将显示样本、变量数、数据大小及变量的详细信息。输入入list,

显示所有样本数据,试试以下命令:listin1listin2/10输入browse或br,

在数据窗口浏览所有数据输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改数据试试browse,list,edit三个命令,看看三者的区别注意:上述命令也可以通过菜单的方式实现。32.检查数据

describe,list,browse,edi保存数据菜单窗口File/saveFile/saveas(另存为)命令窗口save"D:\Teach课件\STATA\data\corgov.dta"save"D:\Teach课件\STATA\data\corgov.dta",replacereplace的作用是,如果文件已存在,则替换注意stata格式文件的后缀为.dta

33.保存数据菜单窗口9.练习1.1导入表名为earning的Excel格式数据检查数据保存数据为stata数据格式34.练习1.1导入表名为earning的Excel格式数据10.1.2编辑数据打开stata数据use"D:\Teach课件\STATA\data\corgov.dta",cleardrop命令,删除变量或观察值dropifyear==2010,删除所有2010年的变量dropyear,删除year这个变量drop_all,删除所有变量注意:stata值的等号全为双等号,单等号是赋值命令,在以后的操作中,注意=号和==号的区别。

35.1.2编辑数据打开stata数据11.打开stata数据use"D:\Teach课件\STATA\data\corgov.dta",clearkeep命令是drop命令的反向命令keepyeartopone,删除其它变量,只保留year和topone这两个变量keepifyear==2010,删除其它年度变量,只保留2010年的变量rename,编辑变量名称renametoponetop1label,为变量名贴标签,以更容易理解labelvartop1"第一大股东持股比例"clear,清空所有数据36.打开stata数据12.练习1.2打开stata数据删除private变量只保留stkcdyear两个变量删除2008年的数据只保留2010年的数据将year变量改名为y将y的标签设置为年度37.练习1.2打开stata数据13.

1.3描述数据count,看看有多少样本countcountifyear==2008summaryorsum,描述样本的统计量sumtopone,描述topone变量最基本统计量,均值、方差、最小值、最大值sumtopone,d,描述topone变量更为详细的统计量,包括偏度、峰度、分位数。tabulate或tab,描述离散变量的基本统计量tabprivate,描述private变量为0和1的百分比

38.

1.3描述数据count,看看有多少样本14.练习1.3用stata打开corgov文件看看一共有多少家样本看看2010年一共有多少家样本看看roa变量均值、方差、最小值、最大值是多少看看roa变量的5%,75%的分位数是多少,偏度是多少看看2010年private等于1的比例是多少39.练习1.3用stata打开corgov文件15.1.4结果和程序管理log命令,你可以用log存储命令和结果use"D:\Teach课件\STATA\data\corgov.dta",clear打开log文件:capturelogusing“D:\Teach课件\STATA\data\output.log”,replacesumtoponesumtopone,dtabprivate查看log文件:view“D:\Teach课件\STATA\data\output.log”关闭log文件:logclose查查capture有什么功能,helpcapture注意:log命令的功能同样可以通过菜单方式实现40.1.4结果和程序管理log命令,你可以用log存储命令和结果用doedit和do命令管理程序步骤用doedit打开程序管理窗口编辑程序,保存程序,运行程序例子use"D:\Teach课件\STATA\data\corgov.dta",clear打开程序:doedit输入一系列命令:sumtoponesumtopone,dtabprivate保存程序运行程序:do"D:\Teach课件\STATA\data\do.do"思考doedit和do的用处?41.用doedit和do命令管理程序步骤17.练习1.4建立一个log文件执行一些操作用log文件存储你的操作结果建立一个程序文件(dofile)执行一些操作用do命令运行你的程序文件42.练习1.4建立一个log文件18.1.3多组数据处理整理数据过程中,我们经常会遇到两种情况我们希望在2000年的数据表后面加上2001年相同变量的样本数据----加行我们希望在原始数据基础上增加对样本公司的其他特征的变量----添列1.3多组数据处理NameyearSizeA2000B2000nameYearsizeA2000B2000nameyearsizeA2000B2000A2001B2001nameyearsizeA2000B2000nameyearindustryA2000B2000nameyearsizeindustryA2000B2000MasterdataUsingdata43.1.3多组数据处理整理数据过程中,我们经常会遇到两种情况11.5多表数据管理append命令:数据表之间纵向合并,追加数据insheetusing"D:\Teach课件\STATA\data\corgov99-00.csv",clearsave"D:\Teach课件\STATA\data\corgov99-00.dta",replaceinsheetusing"D:\Teach课件\STATA\data\corgov01-10.csv",cleara

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论