




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
formatx1%10.3f——将x110,小数点后取三位formatx1%10.3gx110,有效数字取三位formatx1%10.3ex110,采用科学formatx1%10.3fc——将x110,小数点后取三位,加入千分位分隔符formatx1%10.3gcx110,有效数字取三位,加入千分位分隔符use"C:\ sandSettings\xks\桌面\2006.dta",clearmergeusing"C:\ sandSettings\xks\桌面\1999.dta"use sandSettings\xks\桌面\2006.dtamergeidusing sandSettings\xks\桌面\1999.dtaunique(unique建议采用第法。sample50%的样本,其余删除sample50,count50个样本,其余删除browsex1x2ifx3>3(按所列变量与条件打开数据查看器editx1x2ifx3>3(按所列变量与条件打开数据编辑器)one-to-one数据源自statatutorial中的exampw1和第一步:将exampw1按v001~v003这三个编码排序,并建立临时数据库tempw1uset:\statatut\exampw1.dta"su——summarize的简写sortv001v002v003save第二步:对exampw2use"t:\statatut\exampw2.dta"sortv001v002v003savetempw2第三步:使用tempw1数据库,将其与tempw2usemergev001v002v003usingta_mergetabulate_mergeerasetempw1.dtaerasetempw2.dtadrop_merge数据源自statatutorial中的fac19和newfacuse"t:\statatut\fac19.dta"taregionappendusing"t:\statatut\newfac"taregion茎stemx1,line(2)(做x1的茎,每一个十分位的树茎都被拆分成两段来显示,前半段为0~45~9)stemx1,width(2)(做x1的茎,每一个十分位的树茎都被拆分成五段来显示,每个小树茎2)stemx1,round(100)(将x1除以100后再做x1的茎)采用autohistogrammpg,discretefrequencynormalx轴,1和5为值,(1)为单位histogramprice,fraction(fractionyfrequencyfraction这两个选择之外,该命令可替换为“percent”百分比,和“density”discrete就表示将price当作连续变量来绘图)histogramprice,percentby(foreign)histogrammpg,discreteby(foreign,histogrammpg,discretepercentby(foreign,total)graphtwowaylfitpriceweight||scatterprice(作出priceweight的回归线图——“lfit”priceweight的散点图相叠加twowayscatterprice(做priceweight的散点图,并在每个点上标注“make”,即厂商的取值twowayscatterpriceweight||lfitprice(foreignpriceweight做散点图和回归线图的叠加,twowayscatterpriceweight||lfitprice(foreignpriceweight做散点图和回归线图的叠加,twowayscatterpriceweight[fweight=dis(画出price和weight的散点图,“msybol(oh表示每个点均为中空的圆圈,[fweight=discement]表示每个点的大小与discement的取值大小成比例)twowayconnectedy1time,yaxis(1)||y2(画出y1和y2这两个变量的时间点线图,并将它们叠加在一个图中,左边“yaxis(1)”y1的度量,右边“yaxis(2)”y2的)twowayliney1time,yaxis(1)||y2graphtwowayscattervar1var4||scattervar2var4||scattervar3graphtwowaylinevar1var4||linevar2var4||linevar3graphtwowayconnectedvar1var4||connectedvar2var4||connectedvar3graphmatrixabcgraphmatrixabc用auto数据集:graphmatrixpricempgweightlength,halfby(foreign,totalcol(1)(foreignprice等四个变量的散点图矩阵,要求绘出总图,并上下排graphboxy,over(x)(对应x的每一个取值构建y的箱型图,并在y0.22处划一条水平线graphbar(mean)对应xy“mean”mediansumsd、p25、p75等graphbara1a2,over(b)(ba1a2的条形图,a1a2graphdot(画点图,沿着水平刻度,在x的每一个取值水平所对应的y的中位数上打点qnormrcharta1a2(画出质量控制Ra1a3的取值范围ameans(计算变量x的算术平均值、几何平均值和简单调和平均值,均显示样本量和置信区间meanvar1[pweight=summarizeyx1statasummarizeskewnesskurtosisECELL有较大差异,建议不采用statasummarizevar1[aweight=var2],tabstatX1,stats(meannqmaxminsdvar(X1的算术平均值、样本量、四分位线、最大最小值、标准差、方差和变异系数)webusebitest(假设每次得到成功案例‘1’0.3quick所显示的二项分布情况下,各种bitestidisy.disy.disy.disydisy.(计算在样本总量为10,成功案例为3的样本总体中,不重抽取4个样本,其中有小于或2个为成功案例的概率)step1.用codebook、summarize、histogram、graphboxs、graphmatrix、stem看检验数据的codebookyx1x2summarizeyx1x2,detailgraphboxx1(箱图graphmatrixyx1x2,half(画出各个变量的两两x-y图stemx1(做x1的茎step2.用tabulate、list细致寻找tabulatecodeifx1==值(作出x1等于值时code的频数分布表,code表示地区、年份listcodeifx1==值(直接列出x1等于值时code的值,当x1的错误过多时,不建议使listin20/l(l表示lastone,-202020个到倒数第step3.用rece命令替换recex1=?ifx1==值keepify<1000dropify>1000sortxgsort(对数据按x进行升序排列gsort-(对数据按x进行降序排列gsort-x,generate(id)(对数据按xid)orderyx3x1(将变量按照y、x3、x1、x2的顺序排列)genx1`=exp(logx1)(将logx1数化genr61_100=1ifrank>=61&rank<=100(rank61100r61_100的取值1,其他为缺失值)00)genabs(x)(取x的绝对值)gentrunc(x)(x的整数部分genround(x)(x进行四舍五入genround(x,y)(y为单位,对x进行四舍五入gensqrt(x)(x的平方根genmod(x,y)(x/y的余数genreldif(x,y)(x与y的相对差异,即|x-genx=autocode(x,n,xmin,xmax)(x的值域,即xmax-xmin,分为等距的n份)genx=cond(x1>x2,x1,x2)(x1>x2成立,则取x1x1>x2不成立,则取x2)sortxgengx=group(n)(x分为尽量等规模的n个组egenzx1=std(x1),m(0s(1)(x101)egensdx1=sd(x1)(x1的标准差)egenmaxx1=max(x1)(最大值)egenminx1=min(x1)(最小值)egenmedx1=med(x1)(中数)egenmodex1=mode(x1)(众数)egenrowsd=sd(x1x2x3)(得出x1、x2和x3联合的标准差egenrowmean=mean(x1x2x3)(得出x1、x2和x3联合的平均值egenrowmax=max(x1x2x3)(联合最大值)egenrowmin=min(x1x2x3)(联合最小值)egenrowmed=med(x1x2x3)(联合中数)egenrowmode=mode(x1x2x3)(联合众数)egenrowtotal=total(x1x2x3)(联合总数)egenxrank=rank(x)(x各个值排序的情况下,获得反映x值大小排序的xrank)数据计算器disy命令:disyx[12](显示x的第十二个观察值disychi2(n,x)(自由度为n的累计卡方分布disychi2tail(n,x)(自由度为n的反向累计卡方分布,chi2tail(n,x)=1-chi2(n,x))disyinvchi2(n,p)(卡方分布的逆运算,若chi2(n,x)=p,那么invchi2(n,p)=x)disyinvchi2tail(n,p)(chi2tail的逆运算)disyF(n1,n2,f)(分子、分母自由度分别为n1和n2的累计F分布disyFtail(n1,n2,f)(分子、分母自由度分别为n1和n2的反向累计F分布)disyinvF(n1,n2,P)(F分布的逆运算,若F(n1,n2,f)=p,那么invF(n1,n2,p)=f)disyinvFtail(n1,n2,p)(Ftail的逆运算)disytden(n,t)(自由度为n的t分布)disyttail(n,t)(自由度为n的反向累计t分布)disyinvttail(n,p)(ttail的逆运算)labeldata~~~"(对现用的数据库做标记,"~~~"就是标记,可自行填写)labelvariablex"~~~"(对变量x做标记)labelvaluesxlabel1(赋予变量x一组labeldefinelabel11"a1"2"a2"(定义的具体内容:当x=1时,标记为a1,当x=2时,标a2)tabulatetab1x1-x7,sort(x1到x7的频数表,并按照频数以降序显示行tablec1,c(nx1meanx1sdx1(c1的不同水平上列出x1的样本量和平均值)autotablerep78foreign,c(nmpgmeanmpgsdmpgmedianmpg)centerrow元格中间,row表示计算行变量整体的统计量,col表示计算列变量整体的统计量)tabulatex1(做x1和x2的二维交互表,要求显示独立性检验chi2、似然比卡方独立性检验lrchi2、对定序变量适用的等级相关系数g 和taub、以及对名义变量适用的V)tabulatex1x2,columnchi2(x1和x2的二维交互表,要求显示列百分比和行变量和列变量的tab2x1-x7,allnofreq(x1到x7这七个变量两两地做二维交互表,不显示频数:nofreq)byx3,sort:tabulatex1x2,nofreqcolchi2(同时进行x3的每一个取值内的x1和x2的二维交互tablex1x2x3,c(ferqmeanx1meanx2meanx3)tabstatX1X2,by(X3)stats(meannqmaxminsdvarcv)tabstatX1X2,by(X3)stats(meanrangeqsdvarcvp5p95median),[aw=X4](X4ttestX1=1countifX1==0countifgenX2=1ifcorrx1x2x3(做x1、x2、x3的相关系数表swilkx1x2x3(用Shapiro-WilkWtest对x1、x2、x3进行正太性分析)sktestx1x2x3(对x1、x2、x3进行正太性分析,可以求出峰度和偏度)ttestx1=x2(对x1、x2的均值是否相等进行T检验)ttestx1,by(x2unequal(按x2的分组方式对x1进行T检验,假设方差不齐性sdtestx1,by(x2)(按x2的分组方式对x1进行方差齐性检验clusterkmeansyx1x2x3,——依据y、x1、x2、x3,将样本分为nclusterkmeansyx1x2x3,k(3)measure(L1)"start"用于确定聚类的核,"everykth"表示将通过构造三组样本获得聚类核:构造方法为将方法,"L1"表示采用欧式距离的绝对值,也直接可采用欧式距离(L2)和欧式距离的平方(L2squaredsortc1c2(对c1和c2两个分类变量排序byc1c2:regyx1x2x3(在c1、c2的各个水平上分别进行回归bysortc1c2:regyx1x2x3ifc3=1(逗号前面相当于将上面两步骤合一,既排序又回归,逗号后面的“ifc3=1”表示只有在c3=1的情况下才进行回归)stepwise,pr(.2):regyx1x2x3(使用Backwardselection,去除P0.2时变量)stepwise,pe(.2):regyx1x2x3(使用forwardselection,去除P0.2时变量)stepwisepr(.2pe(.01):regyx1x2x3(使用backward-stepwiseselection,取P0.01stepwise,pe(.2forward:regyx1x2x3(使用forward-stepwiseselection)regyx1x2x3predictYhat,xbpredictu,residpredictstd,stdp(获得y估计值的标准误predictstdf,stdf(获得y预测值的标准误predictp,pr(1,12)(获得y112之间的概率)predictrstu,rstudent(student的t值)predictlerg,leverage(获得杠杆值)predictckd,cooksd(获得cooksd)regyx1x2x3c1c2adjustx1x2x3,se(使得变量x1、x2和x3等于其均值,求y的预测值和标准误adjustx1x2x3,stdfci(使得变量x1、x2和x3等于其均值,求y的预测值,预测标准误和置adjustx1x2,by(c1seci(控制变量x1、x2,亦即取它们的均值,在分类变量c1的不同水平上求y预测值,标准误和置信区间)adjustx1x2x3,by(c1stdfci(控制变量x1、x2、x3,亦即取它们的均值,在分类变量c1的不同水平上求y预测值,预测标准误和置信区间)adjustx1x2,by(c1c2)seci(控制变量x1、x2,在分类变量c1、c2的不同水平上求y的预测adjustx1x2x3,by(c1c2stdfci(控制变量x1、x2、x3,在分类变量c1、c2的不同水平上求adjustx1=ax2=bx3=c,seci(当x1=a、x2=b、x3=c时,求y的预测值、标准误和置信区间)求y的预测值、标准误和置信区间)adjustx1=ax2=bc1=1,by(c1)seci(当x1=a、x2=b,并假设所有的样本均为c1=1,求在分类变量c1的不同水平上,因为变量x3的均值不同,而导致的y的不同的预测值……)mvregY1Y2X1X2X3……(多元回归mvregy1y2y3x1x3x3(多元回归分析,y1y2y3为因变量,x1x3x3为自变量)mvreg之后才能进行testy1](测试对y1testy1]:x1x2(测试对y1的回归中x1、x2testx1x2x3(测试在所有的回归中,x1、x2、x3testy1=y2](对y1的回归和对y2的回归系数相等test[y1=y2]:x1x2x3,mtest(y1和y2的回归中,分别测试x1、x2、x3的系数是否相等,mtest这个命令,则测试他们的联和统计)testy1=y2=y3](三个回归的系数是否相等,可加mtest以分别测试testy1=y2=y3]:x1x2(测试三个回归中的x1、x2mtest)est命令的用法:regyx1x2x3(不限于reg,也可ivreg、mvreg、reg3)eststoreAestreyestforA:sum(对A回归结果中的各个变量运行sum命令)regyx1x2x3ifc1==1(当分类变量c1=1时,进行y和诸x的回归)regyx1x2x3,robust(回归后显示各个自变量的异方差-稳健性标准误)estatvif(回归之后获得VIF)estathettest,mtest(异方差检验)regyx1x2x3predictu,residgenusq=u^2regusqx1x2x3求F值disyR/(1-R)*n2/n1(n1表示分子除数,n2表示分母除数disyLMdisyR*n(n表示总样本量disywhite法:regyx1x2x3predictu,residgenusq=u^2predictygenysq=y^2regusqyysq求F值disyR/(1-R)*n2/n1(n1表示分子除数,n2表示分母除数disyLMdisyR*n(n表示总样本量disyF值和LM值转换为P值令disyFtail(n1,n2,a)(利用F值求p值,n1表示分子除数,n2表示分母除数,a为F值)异方差的纠正——WLS(weightedleastsquareestimator)regyx1x2x3aw=x1](将x1作为异方差的来源,对方程进行修正)regy/(x1^0.5)1/(x1^0.5)x1/(x1^0.5)x2/(x1^0.5)纠正异方差的常用套路(构造h值regyx1x2x3predictu,residgenusq=u^2genlogusq=log(usq)reglogusqx1x2x3predictggenregyx1x2x3[aw=1/h]异方差hausman检验:regyx1x2x3eststoreA(将上述回归结果到A中regyx1x2x3[aw=1/h]eststoreB当因变量为对数形式时(log(y))yreglogyx1x2x3predictgenregym,noconstantm的系数为iy的预测值anovayg1g1|g2(g*g1和交互项g1|g2这两种分类的y值是否存anovayd1d2d1*d2(d*d1、d2d1*d2的这三种分类的y值是否有组内anovayd1d2x1d2*x1continuous(x1)(x*表示连续的控制变量)webusemanovay1y2y3=genderfracturegender*fracture(按、是否骨折及二者的交互项对y1、y2和y3进行方差分析)manovay1genderfracturegender*fracture(y1为因变量webusenobetweengenmycons=1manovatest1test2test3=mycons,noconstantmatc=(1,0,-1\0,1,-1)manovatestmycons,(foreachvnameiny1y2y3{(确定y变量组reg`vname'x1x2x3(将y变量组中的各个变量与诸x变量进行回归分析,注意vname的标}mvregy1y2y3=x1x2reg3reg3(y1=x1x2x3)(y2=x1x3x4)(y3=x1x2测试y1coefs0test[y1]test[y1=y2=y3],testy1=y2y1=y3commonconstant(constant表示包含截距项reg3(y1=y2x1x2)(y2=y1(2)reg3进行reg3(y1=y2x1x2)(y2=y1x4),ols对两个回归结果进行hausman检验:reg3(y1=x1x2x3)(y2=y1x4),2slseststoretwoslsreg3(y1=x1x2x3)(y2=y1x4),olseststoreols验ols,equations(2:)hausmantwoslsols,alleqs(对所有方程一起进行检验)检验忽略变量(模型的RESETregyx1x2x3estatovtest对变量ygeny_l1=y[_n-geny_l2=y[_n-gengen回归元严格外生时AR(1)序列相关的检验regyx1x2predictu,residgenu_1=u[_n-1]regu回归之后,u_1的序数如果不异于零,则该序列不相关用Durbin-WatsonStatistics检验序列相关:tssetyear@(对时间序列回归中代表时间的变量进行定义)@regyx1x2@durbina,small@(small可以根据F值求出P值,以代替chi2值)@durbina,@(让检验能在robust、neway之后进行)@durbina,smalllag(1/10@(lag110阶的durbina,robustlag(1/10@(robust可进行异方差—稳健性回归,避免未知形式的异方差)@bgodfrey@(利用Breusch-Godfreytest求出高阶序列相关)@数据:survey源数据:dataset文件夹中的1、定义surveysvysetpsuid[pweight=finalwgt],——定义primarysamplingunit为psuid——pweight为——定义stratumidentifer为stratid。可能是测试中被试的编号,1to312malegenmale=(==1)if —— svy,subpop(male):tabulatehighbpsizce,colobspearsonlrnull——subpop规定了以male为数据的范——tabulatehighbpsizce表示绘制行变量为highbp,列变量为sizce的表100%——obs表示列出每个单元格的样本量,se表示列出每个单元格的标准误,ci——pearson表示求取pearson'schi-squired,的卡方检——lr表示求取likelihood——wald表示求取adjustedwa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 雕塑材料创新与环境可持续性-深度研究
- 面向对象数据库优化-深度研究
- 黑白影像在数字交互艺术中的表现手法-深度研究
- 农业大数据挖掘与分析-第2篇-深度研究
- 智能照明控制系统设计-深度研究
- 合同范本边角章
- 名表买卖保养合同范本
- 代打属于合同范例
- 儿童社交技能培养策略-深度研究
- 商业采购合同范本
- 报价单完整版本
- JT-T-794-2019道路运输车辆卫星定位系统车载终端技术要求
- 【课件】勃兰登堡协奏曲Ⅱ+课件高一上学期音乐人音版(2019)必修音乐鉴赏
- G -B- 5009.11-2024 食品安全国家标准 食品中总砷及无机砷的测定(正式版)
- 小学四年级小数单位换算练习题100道
- ISO9001:2015供应商审核检查表英文版
- 2024年湖南生物机电职业技术学院单招职业技能测试题库及答案解析
- 苗木供货服务计划方案
- GB/T 28210-2024热敏纸
- 《谏逐客书》课后练习 统编版高中语文必修下册
- 煤矿机电设备培训课件
评论
0/150
提交评论