版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计量经济学可见内容第一章(1) 经济模型理论模型:凯恩斯的绝对收入理论实证模型:回归模型建模方法结构方法:理论到模型,先验的简化方法:数据到模型,依赖理论少大数据时代:简化方法将用的多(2)变量类型 p28STATA 中的变量可以划分为三类:分别是数值型,字符型和日期型。变量类型可通过help data type显示。(一)数值型变量:数值型变量按其精度又可分为五种类型:byte、int、long、float、double。(二)字符串变量:字符变量通常是一些需要用文字描述的信息,如:姓名、住址等。(三)日期型变量:在STATA 中,1960 年1 月1 日被认为是第0 天,因此1959 年1
2、2 月31 日为第-1 天(3) 显示数据类型 p30 (指出哪个变量是什么类型)(4)指出指标的含义 p34观测值序号生成新的数据(generate 可简写成gen) Clear Set obs 1000 设置观测值的组数 Gen x=_n _n 为观察值得序号 Gen y=x+100 gen 产生新变量r
3、eplace 改变现有变量Generate 创建一个新的变量。 如:generate y=(y1+y2+y3+y4)/4表示创建一个新的变量y是y1,y2.y3,y4的平均数。又如: generate x1= ln( x2 )表示创建一个变量x1是x2的自然对数。Replace替代一个现有变量。如:replace X1= X1*100表示“将X1变量转换为当前数值的100倍”又如:replace x1 = 0 if x1= y 表示“当x1=y时,将其记为0 ”注意:在STATA中“=”才是逻辑关系运算符。“=” 则表示“让左边的值与右边相等”用于创建新变量。 * gen urbanized=
4、 popurb/ pop. sum urbanizedVariable | Obs Mean Std. Dev. Min Max -+- urbanized | 21 .6667691 .1500842 .3377319 .8903645表示城市化率水平 replace urbanized= 100* urbanized. sum urbanized Variable | Obs Mean Std. Dev. Min Max-+- urbanized | 21 66.67691 15.00843 33.77319 89.03645百分数形式sort(gsort)命令 样本按照某个变量的取值排序
5、。 如:sort x1“表示样本按照x1做升序排列”gsort -x1“表示样本按照x1做降序排列”order命令 该命令用于控制变量与变量之间的顺序。如:order x3 x2 x1“表示将x3变量排在第一列,而x1变量则排在第三位”(5) if exp p37 数学符号的表达式 、if exp 的范围if exp表示命令只针对满足exp(一般是一个逻辑表达式)的观测;in range表示命令只针对处在range指定的范围内的观测,如in 5指执行的范围是第5个观测,in -5指执行的范围是倒数第5个观测,in 5/12指执行的范围是从第5到第12个观测;in range和if exp相当于
6、从一个大样本中挑出符合条件的小样本,其用处体现在两个方面。首先是数据清理阶段,找出那些有明显的错误或有缺失的观测。其次是在数据处理和分析阶段,找出有特别兴趣或意义的观测。 if exp表示命令只针对满足exp(一般是一个逻辑表达式)的观测;if exp极大地体现了Stata的灵活性。逻辑表达式exp一般由以下成分构成: 变量名 数字,字符,表示缺失值的“.” 关系运算符:=(等于),!=,(不等于),>(大于),<(小于),>=(大于或等于),<=(小于或等于) 逻辑运算符:&(与),|(或),(非)以下是一些应用的例子:if age > 65 &
7、 age < 85(age大于65,小于85的观测)if place = “Canada” & pop = . (place为“Canada”并且pop不缺失的观测)if year=1994 | year=1997 (year为1994或1997的观测)if (pop=. & year=.) (排除pop和year都缺失的观测)(6)by varlist p40 命令、结果、含义 by是很多命令的前缀。by varlist:表示对varlist(分类变量)中的每一类分别执行命令。事实上,Stata的很多命令带有不同的前缀。例子:分区域对其他变量进行统计 by region
8、,sort: sum medage marr divr基本格式:by varlist: command varlist =exp if exp in range weight using filename , options 其中,符号 表示可选项。command为Stata的命令函数,varlist为变量,if exp、in range用于设定变量或观测值,weight用于设定观测值的权重,using filename表示使用的数据文件,options表示命令的选项,不同命令的选项也不同。by varlist:表示对varlist(分类变量)中的每一类分别执行命令(command)。 比如,
9、线性回归模型的命令regress的格式为:. regress depvar indepvars if in weight , options 用户可以输入如下命令:. regress depr dcpi drgdp if depr<20(7) 数据类型转换 p47 地区分类(怎么分类、描述)第三章 经济数据的组织和整理(1)四种类型数据 P2横截面:给定时期,不同个体时间序列:给定个体,不同时期,ttset设置日期变量混合横截面时间序列:面板数据横截面数据与标识符变量在同一时间,不同统计单位相同统计指标组成的数据列。次序任意标识符变量:各自独立的ID例如,为了研究某一行业各个企业的产出与
10、投入的关系,我们需要关于同一时间截面上各个企业的产出Q和劳动L、资本投入K的横截面数据。这些数据的统计对象显然是不同的,因为是不同企业的数据。但是关于产出Q和投入L、K的解释、统计口径和计算方法仍然要求相同,即本企业的Q、L、K在统计上要求可比。在分析横截面数据时,应主要注意两个问题:一是异方差问题,由于数据是在某一时期对个体或地域的样本的采集,不同个体或地域本身就存在差异;二是数据的一致性,主要包括变量的样本容量是否一致、样本的取样时期是否一致、数据的统计标准是否一致。时间序列数据在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。如我国国内生产总值从1949到
11、2009的变化就是时间序列数据。时间序列数据是同一对象跨时间的观察值的向量 所以必须按照一定顺序(X1, X2, ., Xt)横截面数据一般是同一时点对不同对象的观察值的集合 顺序的改变应该不影响计量的结果X1, X2, ., Xn时间序列算符声明时间序列:tsset 命令use http:/www.stata- ,cleartsset tlist in 1/20gen Lwpi = L.wpi /*一阶滞后*/gen L2wpi = L2.wpi gen Fwpi = F.wpi /*一阶超前*/gen Fwpi = F2.wpi gen Dwpi = D.wpi /*一阶差分*/gen D
12、2wpi = D2.wpi list in 1/10list in -10/-1混合横截面时间序列数据Pool Data每个变量都有个体和时间下标有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同。例如中国人民银行自1995年起,每季度在全国各地储蓄所调查储户的一些看法,不同的季度构成时间序列,而每个季度调查的样本构成横截面,又因为储户人群都是流动的,所以各个季度调查的样本是不同的,这样获得的数据就是混合横截面数据集collapse的用处是计算某个数据库的一些统计量,再把它存为只含有这些统计量的数据库。用到这个命令的机会不多,我使用它是因为它可以计算中位数和从1到99的百分位
13、数,这些统计量在常规的数据描述命令中没有。如果要计算中位数,其命令的语法如下collapse (median) ((变量名)), by((变量名))面板数据(Panel) 不同个体在不同时间的表现数据平衡面板:每个个体在每个时间都可观测非平衡面板定义面板数据变量 sort panelvar timevar tsset panelvar timevar (encode)iis panelvar tis timevar(2)总体组间、组内 P15 (只考有结果的)列示出样本中主要变量的基本统计量,命令为: xtsum invest mvalue kstock(3) 非平衡数据 p20 (看那里不平
14、衡)采用STATA自带的范例数据,文件名为grunfeld.dta。里面包含了六个变量,其中company和year分别表示样本公司的代码和观察的年份,相当于我们前面提到的截面变量和时间变量;invest表示公司的投资额;mvalue 表示公司的市场价值;kstock 表示公司的资本存量。考总体组间、组内非平衡数据(看哪里不平衡)(补充)(1)什么是假设检验 p2假设检验也叫显著性检验,是统计推断的基本内容之一。在实践中,我们往往会遇到这样的问题:我们根据样本观测得到的一些结论、根据经验积累得到的一些认识,以及由此得到的一些判断是否成立?例如,居民的收入水平是否提高农作物的产量是否增加产品的质
15、量是否上升经济发展的地区差别是否存在现象之间的数量关系是否成立事物的发展是否具有某种规律等(2) 三种形式正态性检验结果T检验结果反映了什么?(4) 是否接受原假设p16 (5)检验工资水平 (结果是?) (6)第一步:正态性检验 p25正态性检验(7) P 值检验 p27第三步:两独立样本检验 ttest 变量名, by(分组变量名) unequalttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 ,unequal unequal 表示假设两组方差不齐,如不选表示假设两组方差达到齐性 ttest x,by(g) ttest x,by(g) ttest 变量
16、名, by(分组变量名) unequalttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 ,unequal unequal 表示假设两组方差不齐,如不选表示假设两组方差达到齐性 结论:t= -1.8066 ,双侧P=0.0839>0.05, 不拒绝H0,差别没有统计学意义,还不能认为病人于正常人的尿中17 酮类固醇排出量不同。(8) 什么是方差分析? P411、方差分析的基本原理是在20世纪20年代由英国统计学家Ronald A.Fisher在进行实验设计时为解释实验数据而首先引入的 2、检验多个总体均值是否相等(通过分析数据的误差,判断各总体均值是否
17、相等)3、研究分类型自变量对数值型因变量的影响 (一个或多个分类型自变量、两个或多个 (k 个) 处理水平或分类、一个数值型因变量)4、有单因子方差分析和双因子方差分析单因子方差分析:涉及一个分类的自变量双因子方差分析:涉及两个分类的自变量1、如果只考虑“超市位置”对销售额是否有显著影响,实际上也就是要判断不同位置超市的销售额均值是否相同 若它们的均值相同,意味着“超市位置”对销售额没有显著影响;若均值不全相同,则意味着“超市位置”对销售额有显著影响 “超市位置”就是分类自变量,“销售额”则是数值因变量。“超市位置”是要检验的对象,称为因子(factor),商业区、居民小区、写字楼是因子的3个
18、取值,称为水平(level)或处理(treatment)。每个因子水平下得到的销售额为样本观测值2、方差分析要解决的问题就是判断超市的位置对销售额是否有显著影响。设商业区、居民小区和写字楼3个位置超市的销售额均值是否相同 误差的大小用均方(mean square)来表示,也称为方差(variance)平方和除以相应的自由度总平方和(SST)的自由度为n-1;组内平方和(SS组内)的自由度为n-k ;组间平方和(SS组间)的自由度为k-1组内平方和除以相应的自由度结果称为组内方差(within-group variance);误差的大小用均方(mean square)来表示,也称为方差(variance)平方和除以相应的自由度总平方和(SST)的自由度为n-1;组内平方和(SS组内)的自由度为n-k ;组间平方和(SS组间)的自由度为k-1组内平方和除以相应的自由度结果称为组内方差(within-group variance);组间平方和除以相应的自由度结果称为组间方差(between-group variance)P41 方差分析的概念(组间、组内、总体)方差分析的基本原理 p45(误差分析)判断原假设是否成立,就是判断组间方差与组内方差是否有显著差异若原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近1若原假设不成立,组间均方会大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中老师年度教学计划
- 2024年初中班主任工作计划书范文
- 临沂大学《展示设计》2021-2022学年第一学期期末试卷
- 2024幼儿园小班9月份工作计划
- 临沂大学《采购管理》2021-2022学年第一学期期末试卷
- 聊城大学《重彩画技法》2021-2022学年第一学期期末试卷
- 聊城大学《软件项目管理》2023-2024学年第一学期期末试卷
- 8中学二年级班主任工作计划
- 客服年终个人工作总结以及下年计划
- 拆除、爆破工程应急预案演练工作计划范文
- 国开机考答案-工程力学(本)(闭卷)
- 降温池施工方案
- 2024医院护士聘用合同
- 找人办事协议
- TD/T 1060-2021 自然资源分等定级通则(正式版)
- GB/T 17241.1-2024铸铁管法兰第1部分:PN 系列
- 2024年江苏省苏锡常镇四市高三二模语文答案讲解课件
- 护理常见操作并发症的预防及处理培训
- 会计信息化习题+答案
- 购物系统毕业设计答辩问题
- 上市公司股权投资协议书(2篇)
评论
0/150
提交评论