版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
STATAformatx110.3f——x110,小数点后取三位formatx110.3gx110,有效数字取三位formatx1%10.3ex110,采用科学formatx110.3fcx110,小数点后取三位,加入千分位分隔符use"C:\sandSettings\xks\桌面\2006.dta",clearmergeusing"C:\sandSettings\xks\桌面\1999.dta"use"C:\sandSettings\xks\桌面\2006.dta",mergeidusing sandSettings\xks\桌面\1999.dta",unique——19992006的数据按照唯一的(unique)id来合并,在合并时对id进行排序(sort)建议采用第法。samplesample50,countbrowsex1x2ifx3>3(按所列变量与条件打开数据查看器editx1x2ifx3>3(按所列变量与条件打开数据编辑器)one-to-onesu——summarize的简写sortv001v002v003save第二步:对exampw2savetempw2第三步:使用tempw1tempw2usemergev001v002v003usingta_mergetabulate_mergeerasetempw1.dtaerasetempw2.dtadrop_mergestatatutorial中的fac19newfactaregiontaregion茎stemx1,line(2)(做x1的茎,每一个十分位的树茎都被拆分成两段来显示,前半段为0~4,后半段5~9)stemx1,round(100)(将x1除以100后再做x1的茎)histogrammpg,discretefrequencynormal(discrete表示变量不连续,frequency表示显示频数,normal加入正太分布曲线,xlabel设定x轴,1histogramprice,fraction(fraction表示y轴显示小数,除了frequency和fraction这两个选择之外,该命令可替换为“percent”百分比,和“density”密度;未加上discrete就表示将price当作连续变量来绘图)histogramprice,percenthistogrammpg,discreteby(foreign,histogrammpg,discretepercentby(foreign,total)graphtwowaylfitpriceweight||scatterpricetwowayscatterprice(priceweight的散点图,并在每个点上标注“make”,即厂商的取值twowayscatterpriceweight||lfitprice(按照变量foreign的分类,分别对不同类样本的price和weight做散点图和回归线图的叠加,两图呈左右twowayscatterpriceweight||lfitprice(按照变量foreign的分类,分别对不同类样本的price和weight做散点图和回归线图的叠加,两图呈上下twowayscatterpriceweight[fweight=dis每个点的大小与discement的取值大小成比例)twowayconnectedy1time,yaxis(1)||y2twowayliney1time,yaxis(1)||y2(与上图基本相同,就是没有点,只显示曲线graphtwowayscattervar1var4||scattervar2var4||scattervar3(做三个点图的叠加graphtwowaylinevar1var4||linevar2var4||linevar3(做三个线图的叠加graphtwowayconnectedvar1var4||connectedvar2var4||connectedvar3graphmatrixabc(画出一个散点图矩阵,显示各变量之间所有可能的两两相互散点图graphmatrixabc用auto数据集:graphmatrixpricempgweightlength,halfby(foreign,totalcol(1)(根据foreignprice等四个变量的散点图矩阵,要求绘出总图,并上下排列】=具)graphboxy,over(x)graphbar(mean)p75等graphbara1a2,over(b)(对应在ba1a2的条形图,a1a2是叠放成一根条形柱。若不写入“stack”a1a2显示为两个并排的条形柱graphdotqnorm(画出一幅分位-正态标绘图rcharta1a2(画出质量控制Ra1a3的取值范围ameans计算变量meanvar1[pweight=(求取分组数据的平均值和标准误,var1为各组的赋值,var2为每组的频数summarizeyx1(可以获得各个变量的百分比数、最大最小值、样本量、平均数、标准差、方差、峰度、偏度stata中summarize所计算出来的峰度skewness和偏度kurtosis有问题,与ECELL和SPSS有较大差异,建议不采用stata的结果。summarizevar1[aweight=var2],(求取分组数据的统计量,var1为各组的赋值,var2为每组的频数tabstatX1,stats(meannqmaxminsdvarwebusebitestbitestidisy.disy.disy.disydisy.step1.codebook、summarize、histogram、graphboxs、graphmatrix、stemcodebookyx1x2graphboxx1(箱图)graphmatrixyx1x2,half(x-y图stemx1(做x1的茎listin20/l(llastone,-202020个到倒数第一个样本step3.用rece命令替换recex1=?ifx1==值keepify<1000dropify>1000sortxgsortgsort-gsort-x,generate(id)orderyx3x1genx1`=exp(logx1)(将logx1数化genabs(x)(x的绝对值gentrunc(x)(x的整数部分genround(x)(x进行四舍五入gensqrt(x)(x的平方根genmod(x,y)(x/y的余数genreldif(x,y)(xy的相对差异,即|x-genx=autocode(x,n,xmin,xmax)(x的值域,即xmax-xminn份)sortxgengx=group(n)(x分为尽量等规模的n个组egensdx1=sd(x1)(得出x1的标准差)egenmaxx1=max(x1)(最大值)egenminx1=min(x1)(最小值)egenmedx1=med(x1)(中数)egenrowmax=max(x1x2x3)(联合最大值)egenrowmin=min(x1x2x3)(联合最小值)egenrowmed=med(x1x2x3)(联合中数)egenrowmode=mode(x1x2x3)(联合众数)egenrowtotal=total(x1x2x3)(联合总数)数据计算器disy命令:disyinvchi2(n,p)(卡方分布的逆运算,若chi2(n,x)=p,那么invchi2(n,p)=x)disyinvchi2tail(n,p)(chi2tail的逆运算)disyFtail(n1,n2,f)(分子、分母自由度分别为n1和n2的反向累计F分布)disyinvFtail(n1,n2,p)(Ftail的逆运算)disyttail(n,t)(自由度为n的反向累计t分布labelvariablex"~~~"(对变量x做标记)labelvaluesxlabel1(赋予变量x一组tabulatetablerep78foreign,c(nmpgmeanmpgsdmpgmedianmpg)centerrow(rep78,foreign均为分类变量,rep78为行变量,foreign为列变量,centerrow表示计算行变量整体的统计量,col表示计算列变量整体的统计量tabulatex1的等级相关系数g 和taub、以及对名义变量适用的V)tabulatex1x2,columnchi2(x1x2的二维交互表,要求显示列百分比和行变量和列变量的独立性检tab2x1-x7,allnofreq(x1x7这七个变量两两地做二维交互表,不显示频数:nofreq)tablex1x2x3,c(ferqmeanx1meanx2meanx3)tabstatX1X2,by(X3)stats(meannqmaxminsdvarcv)tabstatX1X2,by(X3stats(meanrangeqsdvarcvp5p95median),[aw=X4](X4X1、X2的ttestX1=1countifX1==0countifgenX2=1ifcorrx1x2x3(x1、x2、x3的相关系数表swilkx1x2x3(Shapiro-WilkWtestx1、x2、x3进行正太性分析)sktestx1x2x3(x1、x2、x3进行正太性分析,可以求出峰度和偏度)ttestx1=x2(对x1、x2的均值是否相等进行T检验)ttestx1,by(x2)unequal(x2x1进行T检验,假设方差不齐性clusterkmeansyx1x2x3,clusterkmeansyx1x2x3,k(3)measure(L1)"start"用于确定聚类的核,"everykth"表示将通过构造三组样本获得聚类核:构造方法为将样本id为1、1+3、1+3×2、1+3×3……分为一组、将样本id2、2+3、2+3×2、2+3×3……分为第二组,以此类推,sortc1c2(c1c2两个分类变量排序byc1c2:regyx1x2x3(c1、c2的各个水平上分别进行回归bysortc1c2:regyx1x2x3ifc3=1(逗号前面相当于将上面两步骤合一,既排序又回归,逗号后面的“ifc3=1”表示只有在c3=1的情况下才进行回归)stepwisepe(.2regyx1x2x3(forwardselectionP0.2时变量)stepwisepe(.2)forwardregyx1x2x3(使用forward-stepwiseselection)regyx1x2x3predictu,residpredictustd,stdr(获得残差的标准误)predictrstu,rstudent(获得student的t值)predictlerg,leverage(获得杠杆值)regyx1x2x3c1c2值,标准误和置信区间iy预测值,预测标准误和置信区间iadjustx1=ax2=bx3=c,seci(x1=a、x2=b、x3=cy的预测值、标准误和置信区间mvregY1Y2X1X2X3……(多元回归mvregy1y2y3x1x3x3(多元回归分析,y1y2y3为因变量,x1x3x3为自变量)以下命令只有在进行了mvreg之后才能进行test[y1=y2](对y1的回归和对y2的回归系数相等)这个命令,则测试他们的联和统计[eststoreAestreyregyx1x2x3ifc1==1(c1=1yx的回归)regyx1x2x3,robust(回归后显示各个自变量的异方差-稳健性标准误)estatvif(回归之后获得VIF)regyx1x2x3predictu,residgenusq=u^2regusqx1x2x3求F值disyLMdisyR*n(n表示总样本量disyregyx1x2x3predictu,residgenusq=u^2predictygenysq=y^2regusqyysq求F值disyLMdisyR*n(n表示总样本量disyF值和LM值转换为P值令disyFtail(n1,n2,a)(利用F值求p值,n1表示分子除数,n2表示分母除数,a为F值regyx1x2x3aw=x1](x1作为异方差的来源,对方程进行修正)regy/(x1^0.5)1/(x1^0.5)x1/(x1^0.5)x2/(x1^0.5)纠正异方差的常用套路(构造h值regyx1x2x3predictu,residgenusq=u^2reglogusqx1x2x3predictggenregyx1x2x3[aw=1/h]regyx1x2x3eststoreA(将上述回归结果到A中regyx1x2x3[aw=1/h]eststoreBhausmanAreglogyx1x2x3predictgenm的系数为iy的预测值anovayg1g1|g2(g*g1和交互项g1|g2y值是否存在组内差anovayd1d2x1d2*x1,continuous(x1)(x*表示连续的控制变量)webusemanovay1y2y3=genderfracturegender*fracture(按、是否骨折及二者的交互项对y1、y2和进行方差分析=———————————genmycons=1manovatest1test2test3=mycons,noconstantmatc=(1,0,-1\0,1,-1)manovatestmycons,多元回归分析:(mvreg相同foreachvnameiny1y2y3{(yreg`vnamex1x2x3(yxvname的标点符号}mvregy1y2y3=x1x2reg3(y1=x1x2x3)(y2=x1x3x4)(y3=x1x2test[y1]test[y1=y2=y3],testy1=y2])y1=y3]),commonconstant(constant表示包含截距项reg3(y1=y2x1x2)(y2=y1reg3(y1=y2x1x2)(y2=y1x4),olsreg3(y1=x1x2x3)(y2=y1x4),2slseststoretwoslsreg3(y1=x1x2x3)(y2=y1x4),olseststoreolshausmantwoslsols,equations(2:2)(对两次回归中的方程2,即“y2=y1x4”进行hausman检验)hausmantwoslsols,alleqs(对所有方程一起进行检验)regyx1x2x3estatgengenregyx1x2predictu,residregu用Durbin-WatsonStatistics检验序列相关:regyx1x2durbina@(对该回归是否具有序列相关进行检验,H0chi2值求出P值)@durbina,small@(small可以根据F值求出P值,以代替chi2值)@@bgodfrey@(利用Breusch-Godfreytest求出高阶序列相关)@svysetpsuid[pweight=finalwgt],——定义pweight为——stratumidentifer为stratid。可能是测试中被试的编号,1to312、生成malegenmale= ==1)if —— svy,subpop(male):tabulatehighbpsizce,colobspearsonlrnull4、svy:meanx1x2x3——x1、x2、x3求取mean、se5、简单的tabulatetwoway(svyset就可执行tab2yx,colchi2exact——col、cell、row等均可换用,chi2Pearson'schi-squared、exact指的是fisherexacttest、6、svy的其他用法:svy:regy创建一个包含从独立标准正态分布中抽取的2000个观察案例和三个随机Z1、Z2、Z3,并分别定义他们的matrixm=(0,2,3)——定义三个变量的平均值matrixsd=(1,.5,2)定义三个变量的标准差logityx1x2 edatapopulationdatax1x2 edata为目标样本总量,populationdata为观测样本总量, 便是一个概率,相当于logit命令中的y1、基本套路:xtregyx1x2,reeststorerextregyx1x2,feeststorefehausmanrefe如果xtregyx1x2,re——xttest1xttest0的扩展,若这xttest0的结果为显著,则采用随机效应(re)LMTestforrandomeffects,assumingnoserialAdjustedLMtestforrandomeffects,whichworksevenunderserialOnesidedversionoftheLMtestforrandom(假设没有序列相关的情况下对随机效应进行单边检验OnesidedversionoftheadjustedLMtestforrandom(假设有序列相关的情况下对随机效应进行单边检验LMtestforfirst-orderserialcorrelation,assumingnorandom(假设没有随机效应的情况下对一阶序列相关进行检验Adjustedtestforfirst-orderserialcorrelation,whichworksevenunderrandomeffects(假设有随机效应的情况下对一阶序列相关进行检验LMJointtestforrandomeffectsandserial(随机效应和序列相关的联合检验xtserialyx1x2——xtserialxtgls和fesaveFileSaveSTATA数据库的SORT12STATA数据库的dropx1 dropx1-x5 /*删除数据库中介于x1和x5间的所有变量(包括x1和x5)dropifx<0 /*删去x1<0的所有记录dropin dropif /*删去xdropifx==.|y==./*删去x或y之一为缺失值的所有记录dropifx==.&y==./*删去x和y同时为缺失值的所有记录drop_all /*删掉数据库中所有变量和数据STATA的变量赋值generate新变量=generate /*bhgenerategroup=int((_n-1)/5)+1 generateblock=mod(_n,6) /*按当前数据库的顺序,依次产生1,2,3,4,5,0。generatey=log(x)ifx>0 setobsegen egenb=seq(),b(3) egenc=seq(),to(4)/*产生多个序列,每个序列从1到#encode字符变量名,gen(新数值变量名)STATA数据库的keepin keepx1-x5 keepif /*x>0STATA数据库的rece变量=表达式recebolck=6ifblock==0 /*将block=0的数全部替换为6。recez=.ifz<0 /*将所有小于0的z值用缺失值代替。receage=25in forvarx*:receX=0ifX==./*将所有第一个字母为x的变量替换为0,如果该变量的值 use"E:\教学\上机\ex3-2.dta",l 12384669.dropuseE:\教学\MPH上机\ex3-.sort.save"E:\教学\MPH上机\ex3-5.dta",recefileE:\教学\MPH上机\ex3-5.dtasaveduseE:\教学\MPH上机\ex3-.sortmergebhusingE:\教学\MPH上机\ex3-132..133435..169.2 [变量名]detail [变量名]centileccinormalmeansdleveltabulate例2.有三组(group)患者,男女( =1表示, .use.tab..tabgroup,.tabgroup,sum(x2)ci变量level(#)binomialpoissonexposure(观察数变量by(分组变量totalcii观察数均数标准差[,level(#)] /* .use.sort.cix1x2,STATA的作图 [变量名图形类型通用选择项特殊选择项]histogram*oneway/*一维散点图twoway/*二维散点图、线图matrix/*二维散点图阵bar*pie/*圆(饼)图box/*箱式图star/*星形图STATA的作图 /*将数据分几组,5 /*指定纵轴用频数表示,否则为频率。normal/*给直方图加上相应正态曲线。xlab/ylab/[(#,……,#)]/*指定坐标轴的界点。b2/l2[(“字符串”)]/*指定坐标轴的副标题。例130名14岁身高资料grax,bin(10)freqnormalxlab(124,128,132,136,140,144,148,152,156,160,164)对称分 偏态分 means[变量名 [变量名]detailcentile变量名]centile(#)] centile(#) sumxsumxifx<140centilexcentile例 1:10,1:20,1:40,1:80,means作图命令 [变量名图形类型通用选择项特殊选择项]histogram*oneway/*一维散点图twoway/*二维散点图、线图matrix/*二维散点图阵bar/* /*圆(饼) /*star/*配对设计t检验ttest变量名ttesti#obs#mean#sd例例1.632619g/dl)STATAttest变量名=#val STATA结果ttestOne-sampletVariable Std. Std. [95%Conf.+x 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 承包草地合同(2篇)
- 2025年度数据中心农民工用工合同4篇
- 二手房交易法律合同模板2024一
- 2025年度个人贷款合同风险评估与管理规范4篇
- 二零二五年度国际货物保险合同条款及理赔细则3篇
- 2025年度临时临时临时停车场租赁合同2篇
- 2025年度个人股权分割及转让合同3篇
- 个人与个人2024年度汽车租赁合同3篇
- 二零二五年度宁波劳动合同模板:包含员工劳动合同变更条款
- 二零二五年度外汇借款合同风险防范与应对策略
- 2024年资格考试-对外汉语教师资格证笔试参考题库含答案
- 软件研发安全管理制度
- 三位数除以两位数-竖式运算300题
- 寺院消防安全培训课件
- 比摩阻-管径-流量计算公式
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
- 五年级数学应用题100道
- 西方经济学(第二版)完整整套课件(马工程)
- 高三开学收心班会课件
- GB/T 33688-2017选煤磁选设备工艺效果评定方法
- 科技计划项目申报培训
评论
0/150
提交评论