STATA统计软件操作.ppt_第1页
STATA统计软件操作.ppt_第2页
STATA统计软件操作.ppt_第3页
STATA统计软件操作.ppt_第4页
STATA统计软件操作.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、使用Stata统计软件、Stata启动Stata数据读取数据库说明变量创建和数据处理的合并数据转换单变量说明2变量说明、说明数据统计图形制作参数估计:验证间隔估计方差分析相关分析线性回归分析、STATA启动、5茄子主要功能:数据管理、统计分析、图形制作、矩阵计算和计算机编程接口:cool菜单基本功能:档案、剪辑、首选项(Prefs、用户界面设置菜单)、数据、数据的基本处理、说明、排序、更改变量、创建新变量、合并数据、拆分数据等,以及图表,读取Stata数据,日志档案。创建档案:log using在“档案路径和名称”后附加append,将基于原始文件添加新内容,然后附加replace,替换原始日

2、志文件。暂停:logoff重新启动:log on;关闭:日志关闭。数据存储:增加存储空间(set mem 40m)释放存储空间(相当于clear、drop all)。读取Stata数据,读取数据:以下后缀格式的数据:DTA/.txt/.raw/.您可以直接读取xls。从文件中读取部分变量:use a b c using“档案路径和名称”;读取文件的一些示例。use“档案路径和名称”in X/Y(X,Y表示案例序列号);从文件中读取特定功能的示例。use“档案路径和名称”if条件语句;数据库说明和数据的基本情况说明:describe、d describe和simple:仅显示变量名。Descri

3、be,short:报告变量的整体情况。Describe,detail:输出所有变量的所有信息。Describe a b c:描述某些变量的情况。变量代码本:codebook。Codebook变量名:描述变量特性。Stata数据类型和特性以及数据类型对应的是数据库中变量的存储类型:字符:存储为str,省略表示字符数量级数字类型。保存格式为byte、int、long、float和double。默认格式为float,仅保留前三个茄子整数,占用最大空间的顺序是double、float、long、int和byte压缩变量compress Compress压缩所有变量的命令。Compress yr*是压缩

4、公共前缀的变量。Compress a-c是对从a到c的所有变量的压缩。数据库说明和说明变量值的基本命令参数:inspect。显示数据:browse直接定位到“浏览数据”窗口。List建议指定变量。否则,将输出数据中所有变量的分布。排序数据:sort。例如:城市和农村儿童的性别bysort urban: inspect girl或sort urban与by urban: inspect girl进行比较。创建和处理变量。注意:不要用新变量替换旧变量。充分理解原始变量的分布和每个数值的含义。跟随重而不漏的东西。比较原始变量和新变量的值,检查是否有错误。检查原始变量的缺失值。使用Genreplace

5、命令创建新变量。Genreplace if结合使用构成组变量recode v,gen(nv) recode v v v的值nv的值*=其他值(*表示所有其他未列出的值)。Gen(新变量名称)recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=。根据、gen (edu)、变量创建和At(0,7,13,16,20)变量b的分类创建平均值变量。egen a_mean=mean(a),by (b)将生成变量b和c的行平均值变量(avg)忽略缺少值:egen avgrmean(b c)将生成标准数值。egen zweight=std(weight)

6、计算每年观测的采样数,以确定每年的调查中有多少相同的采样(或同一实体)牙齿。gennut数据合并(垂直),垂直合并:角色:添加示例命令:append菜单:data-combine datasets-append datasets;节目:append using“档案路径和名称”;Append using“档案路径和名称”,keep变量名称。数据合并(水平),水平合并:添加变量(merge)。菜单:data-combine datasets-merge two datasets或data-combine datasets-merge multiple datasets节目:先查看使用情况数据:u

7、se 档案最后合并数据:merge键变量名称using“档案路径和名称”,keep(变量)。数据合并(系统变量),系统变量信息:_merge,1观测仅用于主数据,使用数据中没有匹配的样例。2观测仅在使用数据中进行,主数据中没有匹配的样例。3观测来自主数据和使用数据。使用Update选项时,4观测值来自主数据和使用数据,主数据的丢失值得更新,5观测值来自主数据和使用数据,两个数据的数值不匹配。转换数据(reshape);数据结构:wide format long format菜单:创建或更改数据variables-other框图。根据变量x的分类生成变量y的方块折线图:graphbox y,ov

8、er(x);根据变量x的分类,生成变量y1和y2的框线图graphbox y1 y2,over (x)。根据变量x的分类生成变量y的水平框折线图:graph hbox y,over(x);矩阵。创建X1、x2和x3的矩阵。仅显示一半。graph matrix x1 x2 x3,half合并图形x1和x2。graph combine x1 x2,间隔估计,单个整体平均值的间隔估计:查找多个变量的置信区间,变量数Eg:by sort urban : ci x1 x2 x3 if age 14 . mean x1 x2 x3,输出平均值,标准错误和95%置信区间。根据变量E分类,求出三个茄子变量A、

9、B、C的区间估计值。mean a b c、over(e)、间隔估计、单个整体比率的间隔估计计算A的二分变量的百分比、标准误差和95%置信区间(proportion a)。根据b分类计算名为A的二分变量的间隔估计值。proportion a,over(b)。区间估计、个别整体比率的区间估计按城市和农村分类,估计体重高度的比率的区间估计:Ratio (Weight/Height),Over (Urban)注意:stata基本输出需要95%的置信区间,99为例Eg:城乡儿童体重差异检查:TESTWeight,by(urban),假设检查,样本均值比较T检查:TESTA1=A2。多个总体平均差异的检查

10、,即方差分析:one way x (y表示收购,x表示类收购)例如,one way weight sibs if age 13,tab scheffe。(选项卡输出组说明统计结果,scheffe使用scheffe方法提供多个重构之间的比较结果),方差分析,双(多个)元素方差分析:ANOVA y a b(将a,b作为元素)ANOVA y a b a*b(添加a,bAnova y a b c,category(a b)表示a,b是分类变量,暗示其他变量c是连续变量。相关分析,输出corr a b C. A,b,c的相关系数矩阵。Pw corr a b C .通过删除缺少的值计算相关结果。P corr a b C .输出部分相关分析结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论