版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、聚类分析:cluster kmeans y xl x2 x3, k(3)一一依据y、xl、x2、x3,将样本分为n类,聚类的核为随机选取cluster kmeans y xl x2 x3, k(3) measure(ll) start(everykth)“start“用于确定聚类的核,“everykth”表示将通过构造三组样本获得聚类核:构造方法 为将样本 id 为 1、1+3> 1+3x2、1+3x3分为一组、将样本 id 为 2、2+3、2+3x2、2+3x3分为第二组,以此类推,将这三组的均值作为聚类的核:measure"用于计算相似 性和相异性的方法,”口“表示采用欧式
2、距离的绝对值,也直接可采用欧式距离(l2)和欧式 距离的平方(l2squared)。ps:这个方法所得的结果与spss所得结果相同。sort cl c2 (对cl和c2两个分类变量排序)byclc2: regyxlx2x3 (在cl、c2的各个水平上分别进行冋归)bysort clc2: reg y xl x2 x3讦c3=l(逗号前面相当于将上面两步骤合一,既排序又回归,逗 号后面的“ifc3“”表示只有在c3j的情况下才进行回归)mvreg y1 y2 : xl x2 x3 (多元回归)mvreg yl y2 y3: xl x3 x3 (多元冋归分析,yl y2 y3为因变量,xl x3
3、x3为自变量)以下命令只有在进行了 mvreg之后才能进行test yl(测试对yl的回归系数联合为0)test yl:xl x2 (测试对yl的回归中xl、x2的系数为0)test xl x2 x3 (测试在所有的回归中,xl、x2、x3的系数均为0)test yl=y2(对yl的回归和对y2的回归系数相等)test yl=y2: xl x2 x3, mtest (对yl和y2的回归中,分别测试xl、x2、x3的系数是否相等, 若没有mtest这个命令,则测试他们的联和统计)test yl=y2=y3(三个冋归的系数是否相等,可加mtest以分别测试)test yl=y2=y3: xl x2
4、 (测试三个回归中的xl、x2是否相等,可加mtest)est命令的用法:(1)储存回归结果:reg y xl x2 x3 (不限于 reg,也可储存 ivreg> mvreg> reg3)est store a(2)重现回归结果:est replay a(3)对回归结果进行进一步分析est for a:sum (对a冋归结果中的各个变量运行sum命令)异方差问题:获得稳健性标准误regy xl x2 x3 if cl=l (当分类变量时,进行y和诸x的回归)reg y xl x2 x3,robust (冋归丿舌显示各个自变量的异方差稳健性标准误)estat vif (回归之后获得
5、vif)estat hettest,mtest (界方差检验)异方差检验的套路:(1) breuschpagan 法: reg y xl x2 x3 predict u,resid gen usq二"2 reg usq xl x2 x3求f值display r/(l-r)*n2/nl (nl表示分子除数,n2表示分母除数)display ftail()求lm值display r*n (n表示总样本量)display chi2tail()(2) white 法: reg y xl x2 x3 predict u,resid gen usq二"2 predict y gen y
6、sq二y"2 reg usq y ysq求f值display r/(l-r)*n2/nl (nl表示分子除数,n2表示分母除数)display ftail()求lm值display r*n (n表示总样本量)display chi2tail()(3)必要补充f值和lm值转换为p值的命令:display ftail(nl,n2,a)(利用f值求p值,nl表示分子除数,n2表示分母除数,a为f值) display chi2tail(n3,b)(利用lm值求p值,n3表示自由度的损失量,一般等于nl, b为lm 值)异方差的纠正一-wls (weighted least square es
7、timator)(1)基本思路:reg y xl x2 x3 aw=xl(将xl作为异方差的来源,对方程进行修正) 上式相当于:reg y/(xla0.5) l/(xla0.5) xl/(xla0.5) x2/(xla0.5) x3/(xla0.5),noconstant(2)纠正异方差的常用套路(构造h值) reg y xl x2 x3predict ujesidgen usq二"2gen logusq=log(usq) reg logusq xl x2 x3 predict ggen h=exp(g)reg y xl x2 x3 aw=l/h界方差hausman检验:reg y
8、xl x2 x3est store a (将上述回归结果储存到a中)reg y xl x2 x3 aw=l/hest store bhausman a b当因变量为对数形式时(log(y)如何预测yreg logy xl x2 x3predict kgen m=exp(k)reg y m,noconstantm的系数为iy的预测值二ixexp(k)方差分析:-元方差分析an ova y gl / gl|g2 / (g*表示不同分类变量,计算g2和交互项/ gl | g2 /这两种分类的y值是 否存在组内差异)anova y dl d2 dl*d2 (d*表示虚拟变量,计算dl、d2和dl*d2
9、的这三种分类的y值是否有组 内差异)anova y dl d2 xl d2*xl, continuous(xl) (x* 衣示连续的控制变量)多元方差分析webuse jawmanova yl y2 y3 = gender fracture gender*fracture (按性别、是否骨折及二者的交互项对 yl、 y2和y3进行方差分析)manova yl = gender fracture gender*fracture (相当于一元方差分析,以 yl 为因变量) 进行多元回归的方法:多元回归分析:(与mvreg相同)foreach vname in yl y2 y3 (确定 y 变量组
10、vname)reg 'vname' xl x2 x3 (将y变量组中的各个变量与诸x变量进行回归分析,注意vname的标 点符号)上式等价于:mvreg yl y2 y3 = xl x2 x3reg3命令:(1)简单用法:reg3 (yl = xl x2 x3) (y2 = xl x3 x4) (y3 = xl x2 x5)测试 yl coefs = 0test yl测试不同冋归屮相同变量的系数:test yl=y2=y3, comm ontest (yl=y2) (yl=y3)/ common constant (constant 表示包含截距项)用reg3进行2slsreg
11、3 (yl = y2 xl x2) (y2 = yl x4),2sls(2)用 reg3 进行 olsreg3 (yl = y2 xl x2) (y2 = yl x4),ols对两个回归结果进行hausman检验:reg3 (yl=xl x2 x3)(y2=yl x4),2slsest store twoslsreg3 (yl=xl x2 x3)(y2=yl x4),olsest store ols即 “yl=xlx2x3” 进行 hausman即 “y2二ylx4” 进行 hausman 检hausman twosls ols,equations(l:l)(对两次回归中的方程 1, 检验)h
12、ausman twosls ols,equations(2:2)(对两次回归中的方程 2, 验)hausman twosls ols,alleqs (刈所冇方程一起进行检验) 检验忽略变量(模型的reset): reg y xl x2 x3estat ovtest滞后变量的制収对变量y滞后一期:gen y_ll=y_n-l滞后两期:gen y_l2=y_n-2以此类推。制取样本序号:gen id二_n获得样本总量:gen id=_n时间序列回归:回归元严格外生时ar序列相关的检验 reg y xl x2predict u,residgen u_l=u_reg u u_loconstant回归之
13、后,u_1的序数如果不异于零,则该序列不相关用 durbin-watson statistics 检验序列相关:tssetyear (对时间序列回归中代表时间的变量进行定义)reg y xl x2dwstat (求出时间序列回归的dw值)durbina (对该回归是否具有序列相关进行检验,h0为无序列相关,可根据chi2值求出p 值)durbina,small (small可以根据f值求出p值,以代替chi2值)durbina,force (让检验能在 robust、neway 之后进行)durbina,small lag(l/10) (lag可以求出更高阶滞后的序列相关,如本例中可求出1到1
14、0阶 的序列相关)durbina,robust lag(l/10) (robust可进行异方差一稳健性回归,避免未知形式的异方差) bgodfrey (利用 breusch-godfrey test 求出高阶序列相关)bgodfrey,small lag(l/10)数据调查:survey data源数据:dataset文件夹屮的svydata步骤:1、定义 survey datasvyset psuid pweight=finalwgt, strata(stratid)定义primary sampling unit为psuid。可能是测试的编号,lor2定义 pweight 为 finalwg
15、t定义stratum identifer为stratido可能是测试中被试的编号,lto312、生成malegen male= (sex=l) if jmissing(sex)当sex不缺失且等于1吋,male=sex3、生成行变量为highbp,列变量为sizplace的表格svy, subpop(male): tabulate highbp sizplace, col obs pears on ir null waldsubpop规定了以male为数据调查的范围tabulate highbp sizplace表示绘制行变量为highbp,列变量为sizplace的表格col表示每一列的加总
16、为100%, row表示每一行的加总为100%, cell表示横纵所有单元 格的加总为100%一一obs表示列出每个单元格的样本量,se表示列出每个单元格的标准误,ci表示列出每个 单元格的置信区间pears on 表示寸2取 pears on's chisquired,皮尔逊白勺卡方检足ir 表示求取 likelihood rationull 表示求収 null-based statisticswald 表示求取 adjusted wald, llwald 表示求取 adjusted log-linear wald, noadjust 表示求 取 unadjusted wald st
17、atistics4、svy:mean xl x2 x3对 xl、x2、x3 求取 mean、se 和 ci5简单的tabulate twoway (不用svyset就可执行)tab2 y x,col chi2 exact ircol、celk row 等均可换用,chi2 指的是 pearson's chi-squared> exact 指的是 fisher exact test> ir 扌旨的是 likelihood-ratio chi-squared6、svy的其他用法:svy:reg y x建立人工数据集:创建一个包含从独立标准正态分布屮抽取的2000个观察案例和三个
18、随机zl、z2、z3,并分 别定义他们的平均值和标准差。matrix m=(0/2,3)定义三个变量的平均值matrix sd=(lz.5,2)定义三个变量的标准差drawnorm zl z2 z3,n(2000) means(m) sds(sd)创建样本暈为2000,均值和标准差符合上面定义的数据集补充:除了定义均值和标准差之外,还可定义相关矩阵和协方差矩阵等。logit回归logit y xl x2 x3y必须为二分变量glogit outcomedata populationdata xl x2 x3outcomedata为目标样本总量,populationdata为观测样本总量,out
19、comedata/populationdata的值便是一个概率,相当于logit命令中的y面板数据(panel data)1、基本套路:xtreg y xl x2,reest store rextreg y xl x2,feest store fehausman re fe如果hausman检验的结果为显著,则采用固定效应(fe)模型,不显箸,则选収随机效应(re)模型2、随机效应的检验:xtreg y xl x2,rexttestoxttestlxttestl是xttesto的扩展,若这xttesto的结果为显著,则采用随机效应(re)模型 xttestl的假设是没有随机效应和/或没有序列相关,它的七个结果分别表示:1) lm test for random effects, assuming no serial correlation(假设没有序列相关情况下対随机效应进行lm检验)2) adjusted lm test for random effects, which works even under serial correlati on(假设有序列相关的情况下对随机lm检验)3) one sided version o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年工程促成居间合同集锦
- 2024年工程助理劳务合作协议
- 2024丙丁双方关于虚拟现实技术开发与应用合同
- 2024年严驰郑黛共同发起的公益项目捐赠合同
- 井区安全员年终个人述职汇报-述职报告范文
- 2024年广告效果监测与评估合同
- 2024年度石油天然气管道建设合同
- 2024年度网页美工设计外包合同
- 2024年度图书订阅合同
- 2024年度旅游管理与服务合同
- 装修垃圾清运处置方案
- JC-T 2536-2019水泥-水玻璃灌浆材料
- 品牌授权协议书
- 艺术设计就业职业生涯规划
- 《狙击手》和《新神榜杨戬》电影赏析
- 枪库应急处置预案
- 老年患者术后谵妄的护理干预
- 《凸透镜成像的规律》课件
- 仓库管理中的客户服务和沟通技巧
- 规划选址及用地预审
- 土砂石料厂项目融资计划书
评论
0/150
提交评论