多元线性回归模型检验及stata软件应用.ppt_第1页
多元线性回归模型检验及stata软件应用.ppt_第2页
多元线性回归模型检验及stata软件应用.ppt_第3页
多元线性回归模型检验及stata软件应用.ppt_第4页
多元线性回归模型检验及stata软件应用.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 多元线性回归模型检验,拟合优度检验 方程的显著性检验(总参数的F检验) 变量的显著性检验(单参数的t检验) 构造置信区间,3.2 拟合优度检验,可决系数与调整的可决系数,由于,=0,所以有:,有意思的是:,条件:模型必须有截距项,2. 可决系数,3. 调整的可决系数,在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:,其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。,一、方程的显著性检验(F检验),方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上

2、是否显著成立作出推断。,3.3 统计推断,F检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS,如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。 因此,可通过该比值的大小对总体线性关系进行推断。,根据数理统计学中的知识,在原假设H0成立的条件下,统计量,2. 检验统计量,p 值检验法,为了方便起见,将F统计量的值记为F0 计算 pPF F0 称为p 值(pvalue ) 如果p ,则p/2 /2, F0落入不能拒绝域,不能拒绝H0,如果p ,落入拒绝域,应拒绝H0。 准则: 当P 值小于显著性水平时,方程在给定显著性水平下是显著

3、的 当P 值大于显著性水平时,方程在给定显著性水平下是不显著的。,3.关于拟合优度检验与方程显著性检验的关系,二、变量的显著性检验(t检验),2. 检验统计量,(2) t检验统计量,P值检验法(pvalue test),p 值的概念: 为了方便,将 t 统计量的值记为 计算 pPtt 0 称为p 值(pvalue ) 通常的计量经济学软件都可自动计算出p 值,如果p,则p/2 /2, t0落入拒绝域,应拒绝H0,当P 值小于等于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是显著的; 当P 值大于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是不显著

4、的。,4. 两类错误,H0 真 H0 伪 不拒 H0 对 取伪 拒 H0 拒真 对,:拒真。把不应该引入的变量引入模型,导致多列无关变量,造成虽然参数估计值是无偏,但标准差会大。 若不想犯第一类错误,则显著水平需要定得小点。,:取伪。把该引入的变量没有引入模型 遗漏变量 造成参数估计量有偏。,三、参数的置信区间,2. 的置信区间,对称区间,中心是bk,半径是,如何才能缩小置信区间?,增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小; 提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平

5、方和应越小。 提高样本观测值的分散度,一般情况下,样本观测值越分散, 的分母的 的值越大,致使区间缩小。,F值,R2,P值,调整的 R2,T 值,p 值,置信区间,系数,回归平方和,残差平方和,总平方和,标准差,Stata 操作,命令行格式:最常用的方法 use “d:dataauto.dta”, clear /*打开数据库*/ regress y x1 x2 x3 菜单格式: Stata8以后开始有菜单 选择菜单进行操作后,在命令栏里可以看到命令行格式是如何写的。,Stata 操作,读取数据,用use命令调入数据:dta格式数据 use “d:statadataauto.dta”, clea

6、r Excel格式数据的读取 直接拷贝,粘贴到stata中 使用Stat transfer把其它格式的数据转成stata格式的数据 读入ASCII格式数据文件:比较麻烦,常见数据格式,Stata 格式:dta 文本格式:txt Excel格式:xls 其它格式:sas、spss、gauss等,Stata的主要功能,数据管理:data management 统计功能:statistics 作图功能:graphics 矩阵运算:matrix 程序设计:programming,数据管理,作图功能,统计功能,数据管理,数据读取 编辑数据 产生或改变变量:gen, egen, 保存数据库 合并和添加数据

7、:merge, append 数据集的重新组织:reshape,调用数据库程序讲解(E:panel),调用数据库程序讲解(E:zhy-apple),相同的变量上下连接,按关键变量横向连接,产生或改变变量,gen replace egen (对gen的扩展,与一些函数结合使用,如mean, count, min, max 等) 产生虚拟变量 tabulate vid, gen(vdummy) Xi: reg y x1 x2 i.vid 变量的命名: 性别:gender 1=female, 0=male 不好 female 1=female, 0=male,调用数据库程序讲解(E:panel),产

8、生变量,bysort hhid: gen order=_n bysort hhid: gen number=_N _n:是产生排序的数列 _N:产生总数,调用数据库程序讲解(E:panel),给数据或变量加注释,Label data “Investment : cfliu 2006” label variable v1 county “ label define 与 label values 是一起使用的。 而label variable 是单独使用的。 另外,比如 有个变量 gender 的值 为 0和1,1表示male 0 表示female。 你如果用table gender x1 ,会发

9、现是按照 0 1来显示分类的。 你如果用了 .label define gendervalue 0 female 1 male .label values gender gendervalue 在执行table gender x1 ,则是按照female 和 male来分类的。 但 gender 还是原来的变量类型,如原来是数值型,现在还是。 虽然list sex 显示为female male,但仍然可以按照 0或1来操作.,调用数据库程序讲解(E:zhy-apple),数据集的重新组织,reshape collapse,collapse (mean) c, by (t),调用数据库程序讲解(

10、E:panel),The long-long form,The wide-year long-sex form,The wide-wide form,The long-year wide-sex form,Reshape命令详细解释:包括矩阵转置等,Reshape命令,*From long-long form to long-wide form reshape wide inc, i(hid year) j(sex) string *From long-wide form to long-long form reshape long inc, i(hid year) j(sex) string

11、 *From long-long form to wide-long form reshape wide inc, i(hid sex) j(year) *From wide-long form to long-long form reshape long inc, i(hid sex) j(year) *From long-wide form to wide-wide form reshape wide minc finc, i(hid) j(year) *From wide-wide form to long-wide form reshape long minc finc, i(hid)

12、 j(year) *From wide-long form to wide-wide form reshape wide inc90 inc91, i(hid) j(sex) string *From wide-wide form to wide-long form reshape long inc90 inc92, i(hid) j(sex) string :如果变量为字符型,如sex的值为f和m,要把inc变量生成finc和minc,则需要用。,Collapse 命令,产生新的数据集 collapse (统计量) 变量, by (变量) collapse (mean) price, by(

13、foreign) collapse (mean) mprice=price (sum) sprice=price, by(foreign) table foreign,c(mean price sum price) replace,统计功能,描述统计 交叉表格 估计,描述统计,Sum x Histogram,twoway (histogram c, title(消费分析) xlabel(1000(500)6000) bfcolor(gs5) scatter c y twoway(scatter c y) (qfit c y) twoway(scatter c y) (lfit c y),调用数

14、据库程序讲解(E:panel),作图,表格,Table 可以作四维表格 table foreign,c(n price mean price sd price max price min price) row table year region gender,c(mean price sd price max price min price) by(agegroup) row Tabulate tabulate vid,gen(vidumy) tabulate vid gender,table year if (vcode=vcode_n+1| vcode=vcode_n-1) & vcow=

15、0,c(n vcode),do 文件的编写,编写do文件的作用 记录你的操作过程 减少命令的输入 do 文件的编写 Stata 中的do file编辑器 其它的软件:Textpad,其它一些常用命令,clear drop keep sum des list If 条件 bysort 变量 outreg ereturn list,Outreg 生成像杂志那样的表格,Outreg using 文件名, coefastr p bdec(2) 3aster replace Outreg using 文件名, coefastr se 3aster append bdec(2): 留两位数 Coefast

16、r:给系数加星号 P: 系数下面标P值 Se: 系数下面标标准误差 3aster: 加3个星号,1,5,10。,outreg using table1, coefastr p bdec(2) 3aster replace,outreg using table1, se bdec(2) 3aster replace,ereturn,use d:statadataauto.dta, clear reg mpg price foreign ereturn list,产生滞后变量,gen xlagx _n-1 bysort code: gen xlagx _n-1,滞后1 期:,滞后2 期:,gen xlag2x _n-2,bysor

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论