




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Stata入门2
——数据篇04二月2023《计量经济学软件应用》课程讲义1一、数据录入直接录入打开dta数据文件导入其它格式的数据文件其它方式04二月2023《计量经济学软件应用》课程讲义21直接录入(1)直接在stata中录入(适用于小样本少变量数据):打开程序,调用数据编辑窗口,直接录入数据,如excel中操作。调用数据窗口方式:(a)在command窗口中输入edit命令;(b)点工具栏上的(2)在excel中录入后,直接复制到stata数据编辑窗口中。(3)键盘直接输入:在command窗口,用input命令。划线部分输入.drop_all.inputxyxy1.122.343.564.785.9106.end
04二月2023《计量经济学软件应用》课程讲义32.数据文件的读取(1)Stata数据文件,后缀.dta直接双击菜单操作:在工具栏上直接点击或File>Open:04二月2023《计量经济学软件应用》课程讲义4use命令语法格式:usefilename[,clearnolabel],读取整个数据文件use[varlist][if][in]usingfilename[,clearnolabel],从数据文件中仅读取几个变量范例:use"C:\ProgramFiles(x86)\Stata12\auto.dta",clearuse"C:\ProgramFiles(x86)\Stata12\auto.dta",clearnolabelusemakepriceusing"C:\ProgramFiles(x86)\Stata12\auto.dta",clear
(2)其它格式的数据文件Excel数据:*.xls,*xlsx。这是stata12新增的功能。用spreadsheet建立的ASCII(txt)数据:*.raw,*.txt,*.csv,用insheet命令。固定列宽的ASCII(txt)数据:*.dct,用infix命令以dictionary格式建的ASCII(txt)数据:*.dct,*.raw,用infile命令。无格式的ASCII(txt)数据:*.txt,*.raw,用infile命令。SASXPORT数据:*.xpt,用fdause命令。ODBC数据源:包括access数据源,*.mdb,dBase数据源,*.dbfxml数据:*.xml菜单操作:file>import04二月2023《计量经济学软件应用》课程讲义73.其它方式(1)用StatTransfer软件转换可以用statTranser9软件将各种格式的数据转换成dta格式数据前提是你安装了这个软件(2)安装外挂命令程序包,如usespss.ado程序包就是一个用于读取spss生成的格式数据的程序包。在searchall中敲入搜索关键词:找到可能你需要的程序包,而后安装即可。这个方法安装的外挂命令,不会在菜单中出现,需要你记住命令名。04二月2023《计量经济学软件应用》课程讲义8二、数据的保存或导出1保存用save/saveas
2导出从file菜单中export选项下选择你想保存的格式;用outfile,outsheet,fdasave,xmlsave命令04二月2023《计量经济学软件应用》课程讲义9三、数据操作变量名、标签等属性变量属性显示和修改变量的数据类型和长度变量生成和变量值修改缺失值的处理变量的剔除和保留数据的排序字符变量和数值变量的相互转换04二月2023《计量经济学软件应用》课程讲义101.变量属性,如名称、标签、值标签变量名:由英文字符、数字、中文字符组成。字母大小写表示的含义不同!!!标签:对变量含义的解释值标签:用于对分类变量值的含义进行解释如foreign有domestic和foreign,在数据量化上,可用0代表domestic,1代表foreign。04二月2023《计量经济学软件应用》课程讲义112.变量属性的显示菜单操作:DataDescribeDatainMemoryDescribe命令,语法格式:describe[var1var2…]用于,可显示1个,或多个。如describeforeign04二月2023《计量经济学软件应用》课程讲义123.变量属性的修改变量名更改:rename命令,常用语法格式:renameold_varnew_var,如renameincomeinc.变量标签(label)的定义:label命令,语法:labelvarvarname“##”,如labelvarforeign“cartype”。除用于定义变量的标签外,其还可用于定义数据的标签,如labeldata“autoinAmerican”分类(或指示)变量的值标签定义:亦label命令,要完成分类变量值的标签定义有两步,如把变量foreign取值为0,定义为domestic,取值为1,定义为foreign,并用origin表示该变量值标签定义结果:labeldefineorigin0“domestic”1“foreign”labelvaluesforeignorigin04二月2023《计量经济学软件应用》课程讲义134.变量的数据类型和长度整数数值型:(1)byte,(2)int,(3)long。小数数值型:(1)float,(2)double。数值型数据一般定义为float型,除非你有特别定义。字符串型:string04二月2023《计量经济学软件应用》课程讲义14数值型数据字符型数据数值变量和字符变量的转换encode命令:将字符变量转换为数值变量。格式:encodevarname[if][in],generate(newvar)[label(name)noextend]菜单:Data>Createorchangedata>Othervariable-transformationcommands>Convertvariablesfromstringtonumeric范例:encodemake,generate(make2)decode命令:将数值变量转换为字符变量格式:decodevarname[if][in],generate(newvar)[maxlength(#)]菜单:Data>Createorchangedata>Othervariable-transformationcommands>Convertvariablesfromnumerictostring范例:deocdeprice,genrate(price2)包括数值数据的字符转换destring命令:将字符变量转换为数值变量语法:destring[varlist],[generate(newvarlist)|replace][options]options:ignore(“chars”)
删除字符变量中的非数值字符,force将非数值字符转换为缺失值tostring命令:将字符变量转换为数值变量语法:tostringvarlist,[generate(newvarlist)|replace]5.新变量生成generate/egen命令:gen命令格式:generate[type]newvar=exp[if][in]范例:genid=.egen命令格式:它是gen的更高级应用,egen[type]newvar=fcn(arguments)[if][in][,options]范例:egenmmpg=mean(mpg)04二月2023《计量经济学软件应用》课程讲义18菜单操作:Data>Createorchangedata>CreatenewvariableData>Createorchangedata>Createnewvariable(extended)6.变量值的修改replace命令格式:replaceoldvar=exp[if][in][,nopromote]范例:如replaceid=17.缺失值的处理在现有的调查中,经常用88,99,888,999,….等来表示不知道或不清楚。在stata中如何一般用”.”来表示该变量的观测缺失值。将变量缺失值转化为数值,用mvencode命令格式:mvencodevarlist[if][in],mv(#|mvc=#[\mvc=#...][\else=#])[override]
范例:mvencoderep78ifforeign==0,mv(998)将变量的某些数值转化为缺失值,用mvdecode命令格式:mvdecodevarlist[if][in],mv(numlist|numlist=mvc[\numlist=mvc...])范例:mvdecoderep78,mv(998=.\999=.a)04二月2023《计量经济学软件应用》课程讲义21菜单操作:Data>Createorchangedata>Othervariable-transformationcommands>Changemissingvaluestonumeric或Changenumericvaluestomissing8.变量(观测值)的剔除,保留,显示drop/keep命令:格式:(1)变量:drop/keepvarlist;(2)观测值:drop/keepifexp范例:droppop*,dropifmedage>32菜单操作:(1)变量:Data>VariablesManager;(2)观测值:Data>Createorchangedata>KeepordropobservationsClear命令list命令:格式:listvarlist[if][in][,options]9.数据的排序Sort命令语法:升序sortvarlist[in][,stable]。选项stable指如果两个观测值相同,则保持其顺序不变。降序gsort[-]varname[[-]varname…][,generate(newvar)mfirst]。选项mfirst表示将缺失值放在前面。菜单操作:
(1)只完成升序:Data>Sort>Ascendingsort(2)升、降序皆可:Data>Sort>Ascendinganddescendingsort范例:04二月2023《计量经济学软件应用》课程讲义25四、分类数据的处理变量:连续变量、分类变量将连续变量转化为指示变量如generatepriceg=(price>=6000)将连续变量转化为分类变量语法:generatenewvar=recode(varname,num1,num2,num3,….,numk)将分类变量转化为指示变量语法:xii.varname五、数据集的合并和附加1.数据集的合并:merge命令语法:(1)按指定的关键变量进行1对1匹配合并(One-to-onemergeonspecifiedkeyvariables)merge1:1varlistusingfilename[,options](2)按指定的关键变量进行多对一匹配合并(Many-to-onemergeonspecifiedkeyvariables)(外部数据文件的关键变量值唯一值)me
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西部开发的冷思考
- 资金制度培训
- 智慧商圈标准商铺租赁及转让合同
- 场监督管理局文件:XX企业安全生产标准化评审协议
- 餐饮店员工劳动合同(包含社会保险)
- 草原畜牧业承包经营责任书
- 高科技产业项目参股合作合同范本
- 出租车营运承包与网约车平台合作合同
- 餐饮酒店场地租赁及餐饮服务合同
- 叉车故障诊断与快速修复服务协议
- T-CECA 20007-2021 城市水系统综合规划技术规程
- JJG 475-2008电子式万能试验机
- 弱电系统运维服务方案
- 《济南市城镇燃气领域重大隐患判定指导手册》
- 中联重科质检部绩效考核指标
- 2024年郑州市高三二模(高中毕业年级第二次质量预测)文科综合试卷(含答案)
- 期中词性转换专练 2023-2024学年牛津上海版(试用本)八年级英语下册
- 北京市海淀区2023-2024学年九年级上学期期末练习英语试题
- FMECA方法及工程应用案例
- Premiere影视剪辑习题及答案
- 10kV配电室施工方案及技术措施
评论
0/150
提交评论