应用回归分析_第1页
应用回归分析_第2页
应用回归分析_第3页
应用回归分析_第4页
应用回归分析_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用回归分析第一页,共二十页,2022年,8月28日统计软件SPSS17.0最新版本StatisticalPackagefortheSocialScience

第二页,共二十页,2022年,8月28日章节目录第1章回归分析概述第2章一元线性回归第3章多元线性回归第4章违背基本假定的情况第5章自变量选择与逐步回归第6章多重共线性的情形及其处理第7章岭回归第8章非线性回归第9章含定性变量的回归模型

第三页,共二十页,2022年,8月28日第1章回归分析概述1.1变量间的统计关系1.2回归方程与回归名称的由来1.3回归分析的主要内容及其一般模型1.4建立实际问题回归模型的过程1.5回归分析应用与发展述评思考与练习第四页,共二十页,2022年,8月28日1.1变量间的统计关系函数关系商品的销售额与销售量之间的关系

y=px圆的面积与半径之间的关系

S=R2

原材料消耗额与产量(x1)

、单位产量消耗(x2)

、原材料价格(x3)之间的关系

y=x1x2x3

第五页,共二十页,2022年,8月28日1.1变量间的统计关系第六页,共二十页,2022年,8月28日1.1变量间的统计关系相关关系的例子子女身高(y)与父亲身高(x)之间的关系收入水平(y)与受教育程度(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系第七页,共二十页,2022年,8月28日1.1变量间的统计关系第八页,共二十页,2022年,8月28日对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的1.1变量间的统计关系第九页,共二十页,2022年,8月28日注意(1)不线性相关并不意味着不相关。

(2)有相关关系并不意味着一定有因果关系。

(3)相关分析对称地对待任何(两个)变量,两个变量都被看作是随机变量。(4)回归分析对变量的处理方法存在不对称性,即区分因变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。1.1变量间的统计关系第十页,共二十页,2022年,8月28日回归分析构成计量经济学的方法论基础,其主要内容包括:(1)根据样本观察值对经济计量模型的参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。1.1变量间的统计关系第十一页,共二十页,2022年,8月28日1.2回归方程与回归名称的由来英国著名统计学家F.Galton(1822-1911年)和他的学生、现代统计学的奠基者之一K.Pearson(1856—1936年)在研究父母身高与其子女身高的遗传问题时,观察了1078对夫妇,他们以成年儿子身高作为纵坐标,夫妇平均身高为横坐标做散点图,结果发现两者的关系近似于一条直线,经计算得到如下方程:1.回归方程

2.回归方程的由来第十二页,共二十页,2022年,8月28日1.3回归分析的主要内容及其一般模型回归分析的主要内容第十三页,共二十页,2022年,8月28日回归分析的一般形式随机误差项主要包括下列因素:(1)在解释变量中被忽略的因素的影(2)变量观测值的观测误差的影响;(3)理论模型设定误差的影响;(3)其他随机因素的影响。1.3回归分析的主要内容及其一般模型第十四页,共二十页,2022年,8月28日1.4建立实际问题回归模型的过程设置指标变量收集整理数据构造理论模型估计模型参数修改

N模型运用Y经济因素分析经济变量控制

经济决策预测实际问题模型检验第十五页,共二十页,2022年,8月28日一、设置指标变量

根据研究目的,利用经济学理论,从定性角度来确定经济问题中各因素之间的因果关系。指标变量不容易确定:

1.认识的局限性;

2.为了模型参数估计的有效性,设置的解释变量应该是不相关的,可是在经济问题中很难找到.3.从经济学角度考虑应该引进非常重要的经济变量,但是在实际中没有这样的数据,或数据很难拿到,可以考虑用相近的变量代替,或由其他几个指标符合成一个新的指标.4.并不是模型中所涉及的解释变量越多越好

(1)可能会引进与问题无关的变量;(2)容易产生共线性—信息重叠

(3)计算量大,误差累计大,估计模型参数精度不高.1.4建立实际问题回归模型的过程第十六页,共二十页,2022年,8月28日1.4建立实际问题回归模型的过程

二.收集整理统计数据

1.数据类型时间序列—按时间顺序排列的数据横截面数据—同一时间截面上的统计数据.

面板数据—是截面数据与时间序列数据综合起来的一种数据类型。例如2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为(单位亿元):

北京市8、9、10、11、12;上海市9、10、11、12、13;天津市5、6、7、8、9;重庆市7、8、9、10、112.注意的问题(1)数据的可比性:按可比价格计算,扣除价格变动因素,确切反映实物量的变化.当年价格(报告期实际价格)用价格指数换算成可比价格.(2)统一计算口径.如GDP(按国土原则计算)GNP(按国民原则计算).两者包含内容一致,但是计算口径不同.(3)样本容量:(4)统计数据整理:折算,差分,对数化,标准化,剔除异常值,插值法补齐缺失数据等.第十七页,共二十页,2022年,8月28日三.理论模型的数学形式

1.绘制散点图(SPSS,S-PLUS)2.依据:经济理论和一些数理经济学结果(计量经济学,数量经济学)如C-D生产函数(柯布道格拉斯生产函数)

数据对数化等.四.模型参数估计

1.最小二乘法,极大似然估计

2.岭回归主成分回归偏最小二乘回归

3.软件:spsssass-pluseviews1.4建立实际问题回归模型的过程第十八页,共二十页,2022年,8月28日五.模型的检验与修改检验:1.回归方程

2.回归系数

3.拟合优度

4.随机误差项序列的相关性异方差修改:从设置变量是否合理开始—是否遗漏变量,变量间的依赖性是否强,样本容量是否少,理论模型是否合适等等.六.回归模型的应用

1.经济变量的因素分析

(1)由回归系数可以发现经济变量的结构关系;(2)用解释变量控制被解释变量.2.经济预测:定性分析与定量分析的有机结合.1.4建立实际问题回归模型的过程第十九页,共二十页,202

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论