医学统计学实习课:STATA软件的应用(1)_第1页
医学统计学实习课:STATA软件的应用(1)_第2页
医学统计学实习课:STATA软件的应用(1)_第3页
医学统计学实习课:STATA软件的应用(1)_第4页
医学统计学实习课:STATA软件的应用(1)_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 医学统计学实习课STATA软件的应用(1)Stata 简介 由美国计算机资源中心(Computer Resource Center)研制;现在为Stata公司的产品;/目前最高版本13.0;操作灵活、简单、易学易用,同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点 。Stata 用户界面结果窗口变量名窗口命令回顾窗口命令窗口菜单及工具栏Stata 语法格式命令是由关键词 参数 选项等构成的字符串 *所有命令、函数、变量名等都区分大小写 特殊选项 关键词 命令参数 ,命令选项 1.关键词:指明执行什么命令,一条命令中必须出现。如排序,sort 2.命令参数: 指明对哪

2、个变量进行操作。Stata 变量STATA的变量名:由英文字母,数字,下划线组成大小写有区别 Aa关键字或系统变量不得用作变量名。系统变量 _N(样本量) _n(内部编号) _pi(圆周率)Stata 数据输入与储存数据输入直接从键盘输入;使用数据编辑窗口输入;打开已有数据文件和拷贝;粘贴方式交互数据 。1. 直接从键盘输入命令:input 变量名列表数据输入以“end”结束不可重复输入变量.input x x 1. 1 2. 2 3. 3 4. 4 5. 5 6. end . input x y x y 1. 1 2 2. 3 4 3. 5 6 4. 4 . 5. . 8 6. 8 7 7.

3、 end. input x y x y 1. 1 2 . 6. 8 7 7. end. input x zx already definedr(110);2. 使用数据编辑窗口输入进入数据编辑窗口直接输入“edit”在工具条上点击双击每一列的标题可以更改变量名每一行代表一条记录每一列代表一个变量3. 打开已有数据文件4. 与表格式文件交互粘贴与Excel,Word的表格等直接通过复制粘贴的方式交互数据。 在数据量不大时,这种方式操作极为方便。Stata 数据输入与储存数据存储save命令 save “文件路径” , replace 文件后缀是“.dta”save c:mydatadata1 ,

4、replaceFile Save As菜单方式命令方式Stata 数据打开数据打开use命令 use “文件路径”文件后缀是“.dta”use c:data1File openStata 最基本操作list (缩写:l)变量列表,列出内存中数据的内容display 表达式 (缩写:di) 直接输出表达式的计算结果计算di 2+3di sqrt(25) Stata 运算Stata的加、减、乘、除及乘方运算符依次是+、*、/ 和 。Stata的关系运算符有:=(等于)、(大于)、=(大于等于)、(小于)、0 【产生新变量y,其值为所有x0的对数值log(x),当x=0时,用缺失值代替】Attent

5、ion!Stata 变量赋值egen 新变量=fcn(参数),选择项 fcn是功能项: seq(), fill(), rsum(), rmean(), rmin(), rmax(), rfirst(), rlast()例:set obs 12 /*产生一个空数据库,记录数为12 egen a=seq() /*产生1_n的自然数 egen b=seq(),from(1) to(3) block(3) /*重复3次 egen c=fill(2 5) /*产生等差数列 egen d=rsum(a b c)/*多个变量对应观察值的计算数据库的维护 数据库的排序 删除变量或记录 保留变量或记录 替换变量

6、值 变量更名 展开和压缩数据 数据结构转换数据库的排序例:ex1.dtasort 变量清单gsort +/-变量清单 sort x 对变量x中数值从小到大进行排列 gsort x 对变量x中数值从小到大进行排列 gsort -x 对变量x中数值从大到小进行排列 Stata 数据库的删除操作删除变量或记录drop x1 x2 /* 删除变量x1和x2drop x1-x5 /* 删除介于x1和x5的所有变量(包括x1和x5)drop if x0 /* 删去x0 /* 保留x0的所有记录,其余记录删除Stata 数据库的替换替换已存在的变量值replace 变量表达式replace bolck=6

7、if block=0 /* 将block0的数全部替换为6。replace z=. if z0 /* 将所有小于0的z值用缺失值代替。replace age = 25 in 17/* 将第17条记录中的变量age替换为25。Stata 数据库的更名变量更名 rename 原变量名 新变量名 rename var1 x 【把var1 更名为 x 】展开和压缩数据expand f /*展开数据*/contract a b /*压缩数据*/例: ex2.dtaStata 数据库结构维护行列互换 xpose, clearvarname format(%fmt) 选项: varname /*将原数据库中

8、变量名放在一个名为 _varname的变量中 format(%fmt) /*转换同时,将所有变量转换为规定格式%fmt 例:ex7.dta xpose ,clear format(%9.1f) xpose ,clear varnameStata 数据库结构维护列数据接龙 stack 变量名,into(新变量名)|group(#)clear wide 例:ex6.dta stack a b c ,into(x) stack a b c d e f, group(3)group(#)表示将原数据库中的变量转为几个组练习输入数据包含变量(exercise.dta)将变量更名为x,y将数据按y由大到小

9、排序产生新变量id,使之等于每个观察对象的当前顺序产生新变量z,当y取值小于5时使z=0,当y大于等于5时,使z=1;删除y取值缺失的记录。答案rename var1 x rename var2 ygsort -ygen id=_ngen z=1 replace z=0 if y5drop if y=.原始数据某地100名成年男子红细胞计数(1012个/升 )资料如下:4.095.335.624.635.184.275.073.603.315.324.884.314.125.334.404.793.925.464.815.094.204.133.944.415.264.665.295.235.

10、583.534.544.684.484.404.764.814.574.973.945.484.275.105.785.123.604.014.755.806.015.505.364.184.334.844.744.604.764.584.344.724.813.844.174.853.294.914.454.434.994.494.355.265.045.384.935.414.523.864.994.244.504.924.135.055.145.055.174.555.425.704.676.184.375.404.154.084.714.124.794.89频数图的制作例 ex3.dt

11、a use d:ex3.dta“ histogram x ,bin(10) freq xlab(3.2(0.3)6.2) ylab(0(5)20) norm l1(人数) b1(红细胞)bin(#) 指定直方图中的分组数,缺省值为5freq 指定以频数为纵轴画图,缺省时为以频率为纵轴xlab ylab 指定坐标轴刻度b1()l1() 在图形下方添加标题在图形左侧添加标题normal 在直方图上加上正态分布曲线graph7 x ,bin(10) freq xlab(3.2(0.3)6.2) ylab(0(5)20) norm l1(人数) b1(红细胞) 练习(ex5.dta) 某市1982年1

12、10名7岁男童的身高(cm)试画出频数分布图 数据集(ex5.dta)112.4119.3120.1116.4117.0110.8125.1115.4122.5121.5118.3116.3126.2124.4112.7114.8123.2114.8126.1113.2119.8123.5110.3122.8124.4122.0113.0116.3120.0117.7121.5116.8132.5117.4114.9121.8119.7125.6118.4123.8130.5128.0118.1122.4118.4117.2114.3123.0121.0119.5129.1120.0119.7120.6120.7112.3129.3114.7120.8119.6125.8114.9122.9118.9123.1120.1124.1120.7120.7120.2113.0116.3126.6120.0127.1122.8120.4124.1116.8112.2118.0118.5117.1119.8108.2114.3117.9114.3122.7122.1111.5125.2125.2120.8113.2120.5119.1116.0116.21

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论