应用回归分析课程设计精编版_第1页
应用回归分析课程设计精编版_第2页
应用回归分析课程设计精编版_第3页
应用回归分析课程设计精编版_第4页
应用回归分析课程设计精编版_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、课程设计报告课程: 应用回归分析学号:姓名:班级:12金统教师:周勤江苏师范大学科文学院应用回归分析课程设计指导书一、课程设计的目的1. 加深理解本课程的研究方法、思想精髄,提高解决实际问题的能力,熟 练掌握SPSS常用统计软件的应用。2. 通过学习达到熟练掌握一元线性回归建模过程,熟悉一元线性回归建模 步骤;掌握模型选择,参数估计,模型检验,模型优化和模型预测的方法。3. 掌握诊断序列自相关性(或异方差性)的方法,并能给岀消除自相关性 (或异方差性)的方法。4能够根据历史数据,对未来走势作出预测;可以处理一些简单的经济问 题。二、(丄设计名称:检验1949年-2012年农林牧渔业总产值和农业

2、产值之间的关系。四. 设计要求1 数据来源要真实,必须注明数据的出处。2尽量使用计算机软件分析,说明算法或过程。3 必须利用到应用回归分析的统计知识。4独立完成,不得有相同或相近的课程设计。五、设计过程$1. 思考研究课题,准备搜集数据。2确立课题,利用图书馆、上网等方式方法搜集数据。3.利用机房实验室等学校给予的便利措施开始分析处理数据。4根据试验结果,写出课程设计报告书。5对实验设计报告书进行完善,并最终定稿。五、设计细则1. 利用的统计学软件主要为SPSS,因为其方便快捷,功能也很强大,界面美观02. 对W:rd文档进行编辑的时候,有些特殊的数学符号需要利用Mathtype这 款小软件进

3、行编辑。3. 数据来自较权威机构,增加分析的准确性与可靠性。4力求主题突出,观点鲜明,叙述简洁明了。六、说明1. 数据来源于江苏统计年鉴2013;2. 所选取数据可能不会涉及到所学的各种分析方法,本课程设计最后会对此 情况作出解释。3本课程设计中,取显著性水平为&乞 对于分析中需要用到的数据做加粗 处理课程设计任务书姓名学号班级12金统课程名称应用回归分析课程性质专业课设计时间2014年5月26日2014年6月2日设计名称检验1949年-2012年农林牧渔业总产值和农业产值之间的 关系。设计要求1. 掌握线性回归方程的建立及回归方程的显著性检验的 法;并能解决建模中遇到的问题,最终给出预测。2

4、. 通过实验加深理解应用回归分析在实践中的应用意义。设计思路与设计过程设计思路:为了对线性回归方程的建立及回归方程的显著性检验进行 分析。先对理论部分进行掌握,再搜集数据,然后对数据 进行分析处理。设计过程: 先对相关定理和结论进行整理 搜集数据 用统计软件对数据进行处理 对结果进行分析计划与进度5月26 05月28日:先对相关定理和结论进行整理,并 搜集数据;5月29 0-5月31日:用统计软件对数据进行处理,调整;6月1日一6月2 0:对结果进行分析,定稿。任课教师 意见说明农林牧渔 业总产值农业林业畜牧业渔业农林牧渔 服务业19491952195719621965197019751976

5、1977197819791980198119821983设计名称:检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。日期:2014年6月1日设计内容:单位(彳 198419851986198719881989199019911992199319941995199619971998199920002001200220032004200520062007 20082009201020112012(1)画散点图(2)x与y之间是否大致呈线性关系(3)用最小二乘估计求出回归方程(4)求回归标准误差&(5)给出玄与厶的置信度为95%的区间估计(6)计算x与y的决定系数(7)对回归方程作方差

6、分析(8)作回归系数仇,0|显著性分析(9)做相关系数的显著性检验(10)用线性回归的plots功能绘制标准残差的直方图和正态概率图,检验误差 项的正态性假设。设计目的与要求:1. 加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握 SPSS常用统计软件的应用。2. 通过学习达到熟练掌握一元线性回归建模过程,熟悉一元线性回归建模步骤; 掌握模型选择,参数估计,模型检验,模型优化和模型预测的方法。3. 学握诊断序列相关性(或异方差性)的方法,并能给出消除自相关性(或异 方差性)的方法。设计环境或器材、原理与说明:设计环境器材:统计实验室、SPSS软件、EXCEL软件等原理与说明

7、:1、一元线性回归模型的一般形式设随机变量y与一般变量x的线性回归模型为y=0o+0$ + ?仇称为回归常数,0称为回归系数。g是随机误差,我们常假定E()= 0var=722、F检验对随机变量y是否有明显的影响。为此提出原假设H(): A=o构造F检验统计量如下F_ SSR/ SSE/(n-2)在正态假设下,当原假设H。:人=0成立时,F服从自由度为(l,n-2)的F分布。3、t检验t检验是统计推断的一种方法,因此,检验回归系数是否显著,等价于检 验假设H:/3严 0如果接受原假设0,则x不显著;如果拒绝原假设H。,则x是显著的。在一元线性回归中,回归系数显著性的t检验与回归方程显著性的F检

8、验 是等价的。4、拟合优度拟合优度用于检验回归方程对样本观测值的拟合程度。样本决定系数r2=SSR/SST,样本决定系数疋的取值在0,1区间內,疋越接近1,表明回归拟合的效果越好;疋越接近0,表明回归拟合的效果越差。与F检验相比,疋可以更清楚直观地反映回归拟合的效果,但是并不能作为严格的显著性检验。5、通过画散点图我们可以从中观察出样本变量间是否有线性关系6、用普通最小二乘估计和最大似然估计可以对参数仇,几进行估计7、关于残差图:一般认为,如果一个回归模型满足所给出的基本假定,所有残 差是在0=0附近随机变化,并在变化幅度不大的一条子带内。若e随x的增大而 减小,则为异方差。6、消除异方差:一

9、元加权最小二乘估计法:用自变量的幕函数的倒数形式作为权数对原模型进行加权:VV7 =设计过程(步骤)或程序代码:1. 确定模型(1)散点图:图形一-1日对话框一-散点/点状(2)回归方程:分析-一回归-一线性2. 模型检验:(1)相关系数:分析一-相关一-双变量3. 残差检验:(1)散点图:图形一-旧对话框一-散点/点状4. 模型预测:(1)模型预测:分析一回归一线性一保存一预测一为标准化分析一回归一线性一统计量一保存一预测区间一均值5. 消除异方差:分析一回归一权重估计一因变量,自变量,将自变量输入权重变量,确定。设计结果与分析:一,确定模型:一元线性回归是描述两个变量之间统计关系的最简单的

10、回归模型。拿到一组 数据,在建立回归模型之前,通常先做出其散点图,直观地判断一下它们之间的 数量关系,进而选择合适的理论回归模型。(1)我们以农业产值为横轴,以农林牧渔业总产值为纵轴,做出散点图。图形 如下。农林牧渔弛总产值6000.00-5000.00-4000.00-3000.00-2000.00-1000.00-.00-500.001000.001500.002000.002530.00农业3000.00(2)通过散点图我们看出样本数据点3,x)大致分别落在一条直线附近。这说 明变量x与y之间具有明显的线性关系。进而,我们可以选择一元线性回归模型 来拟合此例。(3)我们以农业产值为自变量

11、兀,以农林牧渔业总产值为因变量开,做线性回 归拟合,得到如下模型:系数模型非标准化系数标准系数tkSig.B的置信区问B标准误差试用版&下限上限1(#*)&.000农业.023.9971.000a.因变量:农林牧渔业总产值由回归系数表,可得一元线性回归方程:),=_107902+ l967x模型汇总b模型RR方调整R方标准估计的 误差更改统计量R方更 改V更改dfldf2Sig. F 更 改1.99Z.994.994.994142.000a. 预测变量:(常量),农业。b. 因变量:农林牧渔业总产值由模型汇总表可得回归标准误差:0- = 116.30261(5)系敷模型非标准化系数标准系数tS

12、ig.B的置信区问B标准误差试用版下限上限1(常量)X.000农业.023.997.000a.因变量:农林枚渔业总产值由回归系数表可得回归系数:九的95%置信区间为, 久的95%置信区间为,(6)由模型汇总表得x与y的决定系数:r = 0.994二,检验模型:人A八当我们得到一个实际问题的经验回归方程后,还不能马上就用它去做分析和预测,因为y=卩斜卩x是否真正描述了变量y与x之间的统计规律 性,还需运用统计方法对回归方程进行检验。(7)Anovab模型平方和df均方1;Sig.(1回归.6101.61() 000 *残差42总计.06443a. 预测变量:(常量).农业。b. 因变量:农林枚渔

13、业总产值由方差分析表可得Ft P值=.oo(r所以回归方程显著(8)系数.模型非标准化系数标准系数tSig-B的置信区问B标准误差试用版1下限上限1(*).000农业.023.997z-Pepu3suz)100.00000-.00000-.100.00000-200.00000-300.00000-.03500.001000.001500.002000.002500.003000.00农业残差图表明y的观测值的方差并不相同,而是随着x的增加而减少后有不规则变 动,即存在异方差。(11)消除异方差。对数似然值b.000.500a. 选择对应專以用于进一步分 析,因为它可以使对数似然函数 最大化。b. 因变量:农林枚渔业总产值, 源变量:农业AN0VA平方和df均方1;Sig.回归1.000残差42 043总计43系数未标准化系数标准化系数tSig.B标准误试用版标准误(常数).000农业.038.990.022.000从上述结果可以看出取值为2 (因为其对应着最大的对数似然函数值,所以权1 1wi = =-数为 才 从输出结果来看,还原后的加权最小二乘法的估计结果为y = 17.616+1.700兀该模型通过了 F检验和T检验,同时也消除了异方差性。结论:1952年-2012年第一产业产出和总产出之间呈线性相关的关系。 设计体会与建议:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论