STATA最常用命令大全.doc_第1页
STATA最常用命令大全.doc_第2页
STATA最常用命令大全.doc_第3页
STATA最常用命令大全.doc_第4页
STATA最常用命令大全.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

statasave命令FileSave As例1.表1.为某一降压药临床试验数据,试从键盘输入Stata,并保存为Stata格式文件。STATA数据库的维护排序SORT 变量名1 变量名2 变量更名rename 原变量名 新变量名STATA数据库的维护删除变量或记录drop x1 x2/* 删除变量x1和x2drop x1-x5/* 删除数据库中介于x1和x5间的所有变量(包括x1和x5)drop if x0/* 删去x10/*产生新变量y,其值为所有x0的对数值log(x),当x0/* 保留x0的所有记录,其余记录删除STATA数据库的维护替换已存在的变量值replace变量表达式replacebolck=6 if block=0/*将block0的数全部替换为6。replacez=. if z0/*将所有小于0的z值用缺失值代替。replace age = 25 in 17 /*将第17条记录中的变量age替换为25。for var x* : replace X=0 if X=./*将所有第一个字母为x的变量替换为0,如果该变量的值为缺失值纵向连接数据库Ex3-3.dta:x0x11.355024502.200024003.300018004.395032005.38003250use E:教学上机ex3-2.dta, clearlx0x1g1.2450145022.2100240023.2300380024.159042002append using E:教学上机ex3-3.dtalx0x1g1.2450145022.2100240023.2300380024.1590420025.35502450.6.20002400.7.30001800.8.39503200.9.38003250.横向联接数据库Ex3-5.dta:bhy0y1x01.13579.222.34547.483.45234.664.66628.09命令. drop _all. use E:教学MPH上机ex3-5.dta. sort bh. save E:教学MPH上机ex3-5.dta,replacefile E:教学MPH上机ex3-5.dta saved. use E:教学MPH上机ex3-4.dta. sort bh. merge bh using E:教学MPH上机ex3-5.dta结果bhx0x1y0y1_merge1.112243579.232.21526.13.316494547.434.418575234.635.52068.16.69.66282列数据接龙Stack 变量名,into(新变量名)|group(#) clear wide示例统计描述及区间估计定量资料的一般描述均数、标准差、百分位数、中位数summarize变量名, detail 统计描述及区间估计百分位数centile变量名, centile(# # .) cci normal meansd level(#) 统计描述及区间估计定性资料的一般描述按照分类变量给出频数和构成比tabulate 变量名例2.有三组(group)患者,男女(sex)若干人,sex=1表示男性,sex=0表示女性。测得其血红蛋白浓度(x1,%)和红细胞计数(x2,万/mm3),资料存入c:mydataex2.dta。试对其进行描述。见ex5-2. use c:mydataex2. tab group. tab sex. tab group, sum(x1). tab group, sum(x2)统计描述及区间估计可信区间的估计ci变量, level(#) binomial poisson exposure(观察数变量) by(分组变量) total cii观察数 均数 标准差 , level(#) level(#)/* 指定可信度,缺失时为95(%)by(分组变量)/* 指定按分组变量分别估计均数的可信区间total/* 指定除按分组变量估计可信区间外,还对整个数据估计,仅用于指定了by(分组变量)时. use c:mydataex2. sort group/* 在用by(分组变量)前,必须对分组变量排序. ci x1 x2, by(group)STATA的作图作图命令GRAPHgraph变量名 , 图形类型 通用选择项 特殊选择项图形类型histogram /* 直方图,为缺省值。oneway /* 一维散点图twoway /* 二维散点图、线图matrix /* 二维散点图阵bar /* 条图、百分条图pie /* 圆(饼)图box /* 箱式图star /* 星形图STATA的作图作图命令GRAPH常用选项bin(#)/* 将数据分几组,缺省为5。freq/* 指定纵轴用频数表示,否则为频率。normal /* 给直方图加上相应正态曲线。xlab/ylab/(#,#) /*指定坐标轴的界点。b2/l2(“字符串”) /*指定坐标轴的副标题。STATA的作图如何利用STATA绘制频数分布图?例130名14岁女孩身高资料。gra x,bin(10) freq normal xlab(124,128,132,136,140,144,148,152,156,160,164) ylab(5,10,15,20,25,30,35,40)数值变量资料的描述均数、几何均数、中位数、百分位数极差、四分位数间距、方差、标准差变异系数对称分布均数标准差偏态分布中位数四分位数间距数值变量资料的描述means变量名summarize变量名, detail centile 变量名, centile(#) 其他选项detail/*详细描述,缺失时为简单描述centile(#)/*指定需要计算的百分位数某市1997年12岁男童120人的身高(cm)资料如下sumxsum x,dsum x if x140sum x if x140,dcentile xcentile x,centile(25,50,75)例有五份血清的抗体效价为1:10, 1:20, 1:40, 1:80, 1:160,描述其抗体滴度的平均水平。meansxSTATA的作图作图命令graph简写gragra变量名 , 图形类型 通用选择项 特殊选择项图形类型histogram /* 直方图oneway /* 一维散点图twoway /* 二维散点图、线图matrix /* 二维散点图阵bar/* 条图、百分条图pie/* 圆(饼)图box/* 箱式图star/* 星形图直方图数值变量资料的统计分析样本均数与总体均数比较的t检验配对设计 t检验成组设计t 检验方差齐性检验样本均数与总体均数比较的t检验ttest变量名= #valttesti#obs#mean#sd#val例问题:统计量与参数不同的两种可能其一:抽样误差(偶然的、随机的、较小的)其二:本质上的差别(必然的、大于随机误差)例样本:某医生随机抽查10名某病患者的血红蛋白,求得其均数为12.59 (g/dl),标准差为1.632619 (g/dl) 。问题:该病患者的平均Hb含量是否与正常人的平均Hb含量相同 (正常人的平均Hb含量为14.02 (g/dl)。STATA 命令ttest变量名= #valttestx=14.02STATA 结果ttest x=14.02One-sample t test-Variable |ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-x |1012.59.51627941.63261911.4220913.75791-Degrees of freedom: 9Ho: mean(x) = 14.02Ha: mean 14.02t =-2.7698t =-2.7698t =-2.7698P |t| =0.0218P t =0.9891STATA 命令ttesti#obs#mean#sd#valttesti1012.591.63261914.02配对设计t检验ttest变量1=变量2STATA 命令ttestx1=x2STATA 结果ttest x1=x2Paired t test-Variable |ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-x1 |1012.59.51627941.63261911.4220913.75791x2 |1013.27.34158131.08017512.4972914.04271-+-diff |10 -.6799999.52042721.645735-1.857288.4972881-Ho: mean(x1 - x2) = mean(diff) = 0Ha: mean(diff) 0t =-1.3066t =-1.3066t =-1.3066P |t| = 0.2237P t = 0.8881成组设计 t 检验ttest变量1=变量2, unpairedunequalttest 变量,by(分组变量)unequalttesti#obs1 #mean1 #sd1#obs2 #mean2 #sd2,unequalunpaired表示非配对的,如不选就作配对检验unequal表示假设两组方差不齐,如不选表示假设两组方差达到齐性例(成组设计)分别测得14例老年人煤饼病人及11例正常人的尿中17 酮类固醇排出量(mg/dl)如下,试比较两组的均数有无差别STATA 命令ttest x1=x2, unpairedttest x, by(g)STATA 结果ttest x1=x2,unpTwo-sample t test with equal variances-Variable |ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-x1 |144.377857.38751.4498923.5407145.215x2 |115.528182.52324311.7354014.3623246.69404-+-combined |254.884.33064531.6532274.2015825.566418-+-diff |-1.150325.636752-2.467547.1668972-Degrees of freedom: 23Ho: mean(x1) - mean(x2) = diff = 0Ha: diff 0t =-1.8066t =-1.8066t =-1.8066P |t| =0.0839P t =0.9580两组资料间的方差齐性检验sdtest 变量名1 = 变量名2sdtest 变量,by(分组变量)sdtesti#obs1 #mean1 #sd1 #obs2#mean2 #sd2单因素方差分析及方差齐性检验oneway 因变量分组变量,选择项noanova/* 不打印方差分析表missing/* 将缺省值作为单独的一组tabulate/* 打印各组的基本统计量表简写:tscheffe/* Scheffe法简写:schBonferroni/* Bonferroni法简写:bonsidak/* Sidak法简写:si各组均数两两比较onewayxgroup,noanova schComparison of var3 by group(Scheffe)Row Mean-|Col Mean |12-+-2 |-.425|0.426|3 |-.91-.485|0.0240.330STATA软件及其应用-III秩和检验和相关与回归分析秩变换配对资料的秩和检验;两组资料的秩和检验;多组资料的秩和检验;直线相关分析;等级相关分析;直线回归分析;秩变换genrank新变量= 原变量egen新变量=rank(原变量)配对资料的秩和检验signrank变量1 = 变量2if 变量1!=变量2两组资料的秩和检验ranksum观察值变量,by(分组变量)两组资料的秩和检验两组资料的秩和检验例3用复方猪胆胶囊治疗老年性慢性支气管

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论