版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Stata软件基本操作和数据分析入门第二讲 统计描述入门赵耐青一、调查某市1998年110名19岁男性青年的身高(cm)资料如下,计算均数、标准差、中位数、百分位数和频数表。173.1167.8173.9176.9173.8171.5175.1175.2176.7174.5169.2174.7185.4175.8173.5175.9175.9173.2174.8177.2171.9166.0177.3175.2179.8175.7180.8171.4178.9172.6166.9170.8168.7175.0183.7171.6172.9173.6177.7172.4181.2178.1173
2、.3177.5173.0174.3174.5172.5171.3174.0177.9170.7175.2178.5177.6183.3173.1170.9180.5176.8179.6180.6176.6174.3168.7175.2179.5172.5173.0174.2169.5177.0183.6170.3178.8181.1182.9177.8164.1169.1176.3169.4171.1172.9177.0179.8178.2174.4169.2176.4178.3165.0175.8181.0177.6177.4178.7175.1181.8171.3174.8181.7177
3、.3178.5179.3177.0175.8181.8177.5180.2Stata数据结构x1173.12169.23171.94166.95181.26177.97179.68169.59176.310178.311174.812167.813174.71416615170.816178.117170.718180.61917720169.42116522181.723173.924185.425177.326168.727173.328175.229176.630183.631171.132175.833177.334176.935175.836175.23717538177.53917
4、8.540174.341170.342172.94318144178.545173.846173.547179.848183.74917350177.651168.752178.85317754177.655179.356171.557175.958175.759171.660174.361183.362175.263181.164179.865177.46617767175.168175.969180.870172.971174.572173.173179.574182.975178.276178.777175.878175.279173.280171.481173.682172.58317
5、0.984172.585177.886174.487175.188181.889176.790174.891178.992177.793171.394180.59517396164.197169.298181.899177.5100174.5101177.2102172.6103172.4104174105176.8106174.2107169.1108176.4109171.3110180.2(读者可以把数据直接粘贴到Stata的Edit窗口)在介绍统计分析命令之前,先介绍打开一个保存统计分析结果的文件操作:点击log图标,然后选择路径和输入保存结果的文件名,建议选择扩展名为log的文件,这
6、样以后统计分析结果都将保存在这个文件中并且可以用word打开和编辑。当分析结束时,仍点击该图标,关闭文件。计算样本的均数、标准差、最大值和最小值命令1:su 变量名 (可以多个变量:即:su 变量名1 变量名2 变量名m)命令2:su 变量名,d (可以多个变量:即:su 变量名1 变量名2 变量名m,d)本例命令 su x变量样本量均数标准差最小值最大值 Variable | Obs Mean Std. Dev. Min Max-+- x | 110 175.3655 4.222297 164.1 185.4本例命令. su x,d x- Percentiles Smallest 1% 16
7、5 164.1 5% 168.7 16510% 169.45 166 Obs 11025% 172.9 166.9 Sum of Wgt. 11050% 175.2 Mean 175.3655 Largest Std. Dev. 4.22229775% 178.1 183.390% 180.9 183.6 Variance 17.8277995% 181.8 183.7 Skewness -.175694799% 183.7 185.4 Kurtosis 2.895843结果说明Smallest最小值Obs110样本量164.1第1最小值Sum of Wgt.110加权和(即每个记录的权是1)
8、165第2最小值166第3最小值Mean175.3655均数166.9第4最小值Std. Dev.4.222297标准差Largest最大值Variance17.82779方差183.3第4最大值Skewness-.1756947偏度系数183.6第3最大值Kurtosis2.895843峰度系数183.7第2最大值185.4第1最大值 Percentiles 百分位数百分位数PX表示样本中X%的数据小于等PX并且(100X)%的数据大于等于PX。特别:P50就是中位数,表示一半的数据小于等于它,另一半的数据大于等于它。本例:P50=175.2样本量obs=110,因此有55个数据小于等于17
9、5.2,另有55个数据大于等于175.2 1% 165 =P1 5% 168.7 =P510% 169.45 =P1025% 172.9 =P2550% 175.2 =P50 75% 178.1 =P7590% 180.9 =P9095% 181.8 =P9599% 183.7 =P99计算百分位数还可以用专用命令centile。centile 变量名(可以多个变量),centile(要计算的百分位数) 例如计算P2.5,P97.5等centile 变量名,centile(2.5 97.5)本例计算P2.5,P97.5,P50,P25,P75。本例命令. centile x,centile(2
10、.5 25 50 75 97.5) - Binom. Interp. - Variable | Obs Percentile Centile 95% Conf. Interval-+- x | 110 2.5 165.775 164.1 168.7* | 25 172.825 171.3314 173.6267 | 50 175.2 174.5 176.6789 | 75 178.125 177.3 179.4371 | 97.5 183.6225 181.8 185.4* Lower (upper) confidence limit held at minimum (maximum) of
11、sample结果说明PercentileCentile 百分位数 2.5165.775 =P2.5 25172.825 =P25 50175.2 =P50(中位数) 75178.125 =P75 97.5183.6225 =P97.5制作频数表,组距为2,从164开始,gen f=int(x-164)/2)*2+164 其中int( )表示取整数tab f 频数汇总和频率计算频数频率累积频率 f | Freq. Percent Cum.-+- 164 | 2 1.82 1.82 166 | 3 2.73 4.55 168 | 7 6.36 10.91 170 | 11 10.00 20.91
12、172 | 16 14.55 35.45 174 | 23 20.91 56.36 176 | 20 18.18 74.55 178 | 13 11.82 86.36 180 | 10 9.09 95.45 182 | 4 3.64 99.09 184 | 1 0.91 100.00-+-Total | 110 100.00作频数图命令 graph 变量,bin(#) norm 其中#表示频数图的组数;norm表示画一条相应的正态曲线(可以不要)本例命令为graph x,bin(8) norm为了使坐标更清楚地在图上显示,可以输入下列命令graph x,bin(8) xlabel norm y
13、label图形可以从Stata中复制到word中来,操作如下:点击Edit后,再点击Copy Graph然后到Word中粘贴和编辑,便可以得到所需要的图形。点击此处便可关闭图形窗口,返回结果窗口计算几何均数可以用means 变量名(可以多个变量:即:means 变量1 变量m)means x Variable | Type Obs Mean 95% Conf. Interval-+- x | Arithmetic 110 175.3655 174.5676 176.1634 | Geometric 110 175.3149 174.5168 176.1166 | Harmonic 110 17
14、5.2642 174.4657 176.07 -Arithmetic(算术均数) Geometric(几何均数) 调和均数(Harmonic)作Pie图描述构成比:每一类的频数用一个变量表示,命令:graph 各类频数变量名,pie例:下列有2个地区的血型频数分布数据,请用Pie描述:频数地区ABOAB第1地区area=110012024075第2地区area=2807020050Stata数据格式aboabarea110012024075128070200502第1地区血型构成比的Pie图的命令和图graph a b o ab if area=1,pie注意逻辑表达式中if area=1是两
15、个等号。第2地区血型构成比的Pie图的命令和图graph a b o ab if area=2,pie两个地区合并后的血型构成比的Pie图的命令和图正态性检验. sktest 变量名1 变量名2 变量名m在上例中的110名19岁男性青年的身高资料正态性检验如下:sktest x Skewness/Kurtosis tests for Normality - joint - Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Probchi2-+- x | 0.398 0.451 1.31 0.5198无效假设H0:资料服从正态分布备选假设H1:资料不服从正态分布设=0.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 租房退房要求打扫卫生的合同(2篇)
- 咨询服务类合同(2篇)
- 人教A版湖南省名校联考联合体2023-2024学年高一上学期期末考试数学试题
- 初中体育+障碍跑+作业设计
- 2023年国家公务员录用考试《申论》真题(副省卷)及答案解析
- 第4课《一着惊海天-目击我国航母舰载战斗机首架次成功着舰》八年级语文上册精讲同步课堂(统编版)
- 西南林业大学《操作系统原理》2022-2023学年期末试卷
- 西京学院《新媒体交互设计》2022-2023学年第一学期期末试卷
- 获奖过程说明附件8
- 西京学院《工程地质》2021-2022学年第一学期期末试卷
- 电力工程施工售后保障方案
- 2024至2030年中国美式家具行业投资前景及策略咨询研究报告
- 2024年小学心理咨询室管理制度(五篇)
- 第16讲 国家出路的探索与挽救民族危亡的斗争 课件高三统编版(2019)必修中外历史纲要上一轮复习
- 机器学习 课件 第10、11章 人工神经网络、强化学习
- 北京市人民大学附属中学2025届高二生物第一学期期末学业水平测试试题含解析
- 俯卧位心肺复苏
- 书籍小兵张嘎课件
- 氢气中卤化物、甲酸的测定 离子色谱法-编制说明
- 2024秋期国家开放大学专科《机械制图》一平台在线形考(形成性任务四)试题及答案
- 2024年经济师考试-中级经济师考试近5年真题集锦(频考类试题)带答案
评论
0/150
提交评论