Stata笔记北京科技大学_第1页
Stata笔记北京科技大学_第2页
Stata笔记北京科技大学_第3页
Stata笔记北京科技大学_第4页
Stata笔记北京科技大学_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、改颜色 edit-preference-general prefernce-classic下面命令框 - 右键 -font- 改字号命令 cd d: 改到 d 盘 (change directory)dir 查询 d 盘有什么sysuse auto 系统自带汽车数据,数据变量(字段)显示在右上角labelsbr(owse) 浏览数据(字符型红色,数值型黑色,蓝色- 右键 -value labels-hide all标签隐藏)h(elp) li(st)告诉你命令怎么用,下面有例子表示缺左边双击执行,单击复制到命令框 order price mpg( 单击右边的变量 ) order make-fo

2、reign 改变变量顺序,从 make 到 foreign g(enerate) new=rep78-trunk 输出新变量 (rep78,trunk 是字段,可单击选择, . 省,加减乘除 +-*/)list if new=14 (=为等于, =为赋值,可以点击 more)li(st) if new2=14 & new210000list make if new2000 (竖线表示或者,回车上面那个) !=表示不等于左边命令,右键 savesave data 文件名为 datasysuse auto preserve reserve save auto2 保存时不需加后缀,删除时带后缀 .d

3、ta sort price 从小到大gsort price 都可以,比较随意gsort -trunk price (默认加号,为排序 )order make new ( 将 new 排到第二位 ) aorder ( alphabetic 按字母顺序排序) disp(lay) sin(1) 作为计算器使用 ln 以 e 为底3.13 锐思数据库选择数据 非金融行业负债表 左边 - 财务报表 - 非金融行业 合并标识 -1 合并报表 调整标识 -1 报表类型 -q4 、信息来源 -q4 公司类别 -20- 定期报告 信息来源: q4a 股股票代码截止日期 流动资产合计应收账款总资产 流动负债合计

4、负债合计 所有者权益合计 非金融行业利润表 - 前同 净利润 营业收入excel 输出(默认)选择列表签 +列名 打开 STATAfile-import-xls 菜单引入文件clear 可清除数据 varible name 不识别中文 选中第一个 import first row as varible names 第二个 import all data as strings意思是将数据看作字符型 ( 不选 )br(ouse) 展示数据流动比率 =流动资产 / 流动负债资产负债率 =总负债 / 总资产产权比率 =总负债 / 所有者权益合计mkdir d:hsy1mydata 建立文件夹cd d:

5、hsy1mydata基于文件夹dir 显示文件夹variables)save bs 保存数据,名为 bs 直接运行是双击,显示在框内为单击 g(enerate) currrate=Totcurass/Tutcurlia流动比率 ( 等号后面点右上方显示 (8 missing values generated) 有八个缺失值g lev=Totlia/Totass 负债率 leverageg pright= Totlia/ TotSHE 产权比率 porpertysave bs2 另存数据drop 为删除变量clear 从内存删掉,不会从硬盘删掉 利润表 import save isg incor

6、ate= Netprf/ Incmope利润率 =净利润 / 营业利润save is2 clearuse bs2 打开 bs2g year=year( EndDt) 。year(EndDt)表示从变量 EndDt 里把年份取出,如month()g mon th=mon th( En dDt)save bs3 clear.use is2.g year=year( En dDt).g mon th=mon th( En dDt).save is3-合并merge横向1对1合并,append纵向合并-merge 1:1 A_Stkcd year usi ng bs3注意后面的两个变量名字在原来两个表

7、里是相同的,将bs3合并到现在(is3 )中错误类型 variables A_Stkcd year do not uniquely identifyobservationsin the masterdata而master data 指主数据库,using data从数据库(替换变量名 Stked 改成 A_Stked) rep A_Stked Stked(替换原数据 is3)save is3 , replaceclear清除合并use bs3duplicates report A_Stkcd year报告重复的变量(两个)显示(surplus为多余的)copies | observati on

8、s-ksurplus1 |17017021 |212022 |11010523 |4644duplicates drop A_Stkcd year,force同一公司同一年数据删掉,强制删除save bs4(is,bs都除重就可以合并了)keep if merge=3( 3 为完全匹配,1,2不完全匹配)drop if _merge!=3如果不完全匹配去除.save bsis300 创业板(最小)002 中小板000 主板keep if substr( A_Stkcd,1,3)=300筛选 ,substr() 为取字符串函数,从第一位开始取取 3 位,加引号为字符型summerize Tota

9、ss 看 Totass 的各种指标,标准差,最大最小值su Totass , detail 可以看到上下四分位截尾,去掉两端 1%左右的值缩尾,将 99%以后的数值以 99%的数值替代,去除极端值, 1%一下同理su Totlia,d(etail)su Accrecv-pright 逐个显示变量的信息corr(elation) Totass Totlia 相关性分析 ,0.3 一下不相关, 0.3-0.5 低度相关, 0.5-0.8 中度相关pwcorr Totass Totlia偏相关pwcorr Totass Totlia Totcurrass,sig star(0.05)显著性水平 si

10、gnificance ,小于 0.05的标星号,星号在它上面 导出, file-export3.20reg 因变量(因变量:被解释变量;自变量:解释变量)set linesize 140 加宽显示窗格reg price rep78 headroom trunk weight (std. err.=standard error,T值 ,confidenceinterval 置信区间 )P与T反向关系,标准误=T值adjusted r-square 调整的 r 方(自变量越多 r 方越大)* 表示 PV 10% 5%* 表示 Pv 5% 1%* 表示 Pv 1%DF 自由度, degree of

11、freettest rep78=headroom 。 t 检验做散点图 scatter length price 。命令是 scatterline 变量名 1 变量名 2 折线图hist 变量名 1 变量名 2。做直方图histogram 柱状图hist 变量名 ,freqhist 变量名 ,addl freq 3.27 将 家 庭 记 为 househood , 个 人 记 为 people , 收 入 记 为 income 。 输 入 命 令 :egen income_people=mean(income),by(househood) 就可以了!egen newvar= ma(y), no

12、miss t(7)即建立一个新变量, 等于跨距为 7 的 y 的移动平均数, 用较短、 未对中的平均数取代起点值 和终点值。g y=year( En dDt)提取年份.order Compa ny Code y将公司代码排第一列,年份排第二列help reshapereshape wide Incmope- InventoryTurnoverRatio,i( CompanyCode) j( y)一定在 i 禾口前面有逗号!.g Accrecv2009mea n=( Accrecv2009+ Accrecv2008)/2reshape long .,4.17destri ng 变量名,repla

13、ce使字符型变数值型g y=real(substr( Accper,1,4)从字符型取年份,并变成数值型,从左向右取四位.drop Accper.order Stkcd y按变量1,变量2排序.keep if y=2000|y=2001.g infee=ln( Tcost)对 Tcost 取对数产生 infee 变量.drop Tcostg brandname=1 if substr( Dadtunit,1,4)=普华”(4441 miss ing values gen erated).replace brand=1 if substr( Dadtunit,1,4)=德勤”(51 real c

14、ha nges made).drop Dadt un it.g opinion=0 if Audittyp=标准无保留意见”.replace opinion=1 if opinion=.将缺失值替代为 1(214 real cha nges made) import excel D:StataBS_AD8BD666A41_(1)0417newBS_AD8BD666A41_(1)0417.xls, sheet(BS) firstrow.br.g y=year( _En dDt). drop _EndDt. g inasset=ln( _Totass) 对总资产取对数. g invrec=( _A

15、ccrecv +_Invtr)/ _Totassdrop _Accrecv _Invtr _Totass. order _A_Stkcd y. save bsfile bs.dta saved. clear. import excel D:StataBS_AD8BD666A41_(1)0417newIS_8CBBC6F6EBB_(1)0417.xls, sheet(IS) firstrow. duplicates drop _Stkcd y,force 删除重复的Duplicates in terms of _Stkcd y(42 observations deleted). drop if

16、_n0 & roe wideNumber of obs.Number of variables j variable (2 values) xij variables:5077 -26693 -3y - (dropped)roe - roe2010 roe2011g right=1 if 0.06roe2010 & roe2010=0.07|0.06 roe2011 & roe20110.07(2341 miss ing values gen erated).replace right=0 if right=.(2341 real cha nges made).drop roe2010 roe

17、2011 .save rightUse fee2Duplicates reportDuplicates dropDuplicates list 变量 1 变量 2,forceMerge时候注意变量名相同,要除重合并 fee3 和 bsis 叫 feebsisdrop _merge 去掉_merge才能继续合并merge m:1 _Stkcd usi ng right 一对多得合并 合并后 keep if _merge=3 然后 drop _merge su in fee- right看看有没有缺失变量.drop if in fee=.save rightfeebsis 合并的文件自变量因变量之间su in fee- right if y=2010注意是两个等号,描述性统计pwcorr in fee- right if y=2010自变量之间相关性不要太大,大一点好.pwcorr in fee- right if y=2011, sig star(0.05)| infee brandne opinion right+infee | 1.0000|brandname | 0.5387* 1.0000| 0.0000|opi nion | -0.0979* -0.0311 1.0000| 0.0000 0.1735|right | -0.0507* 0.0011 -0.072

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论