回归分析课程设计_第1页
回归分析课程设计_第2页
回归分析课程设计_第3页
回归分析课程设计_第4页
回归分析课程设计_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

..;;应用回归分析课程设计指导书一、 课程设计的目的巩固应用回归分析的理论知识,掌握其思想精髓;运用回归分析研究方法,加强解决实际问题的能力;spss二、 设计名称研究货运总量万吨)与工业总产值亿元、农业产值x2(亿元)、居民非商品支出x3(亿元)的关系三、 设计要求spss软件对数据进行处理正确分析数据,尝试选择不同的模型拟合数据课程设计中,遇到问题要翻阅课本去努力解决问题要有耐心,对于模型的显著性和回归系数都要进行检验认真并独立完成四、 设计过程思考课程设计的目的,寻找来源真实的数据上网搜集并整理数据资料根据数据确定研究对象应用统计软件来处理数据信息选择通过各种检验的线性模型写出相应的实验报告,并对结果进行分析五、设计细则搜集数据阶段,数据不能过于繁杂,也不能太少;做课程设计前,认真看书和笔记,及平时的实验报告,掌握丰富的理论;有耐心,不紧不慢;要细心,一丝不苟;清楚明了。分析结果要正确与实际问题背景相符。六、说明书写报告时,有些特殊的数学符号需要利用Mathtype(公式编辑器)款小软件进行编辑;spss输出表格不整齐,需要导出在Excel中,然后在复制到word认真仔细的完成课程设计课程设计任务书姓 名 XXX 学号 00000000 班级 09统计课程名称

应用回归分析

课程性质

统计学设计要求与设计过程计划与进度任课教意 说 明

2011年11月1日——2011年 11月 15日万吨)与工业总产值亿元x2(亿元)x3(亿元)的关系spss软件对数据进行处理正确分析数据,尝试选择不同的模型拟合数课程设计中,遇到问题要翻阅课本去努力解决问题要有耐心,对模型的显著性和回归系数要进行检验思路:显著性过程:思考课程设计的目的,寻找来源真实的数据上网搜集并整理数据资料根据数据确定研究对象应用统计软件来处理数据信息选择通过各种检验的线性模型写出相应的实验报告,并对结果进行分析(1)11月1日-11月3日,思考准备研究课题。(2)11月4日-11月7日,确立课题,搜集数据。(3)118-1113报告书。13-1115成册WordMathtype(公式编辑器)这款小软件进行编辑。有些spss输出表格不整齐,需要要到处在Excelword文档里设计名称:

万吨)x1(亿元、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系日期:

2011年11 月 13日万吨)x1(亿元、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表如下:编货运总量y(万工业总产值x1(亿农业总产值x2(亿居民非商品支出x3(亿号吨)元)元)元)1160.0070.0035.001.002260.0075.0040.002.403210.0065.0040.002.004265.0074.0042.003.005240.0072.0038.001.206220.0068.0045.001.507275.0078.0042.004.008160.0066.0036.002.009275.0070.0044.003.2010250.0065.0042.003.00y,x1,x2,x3的相关系数矩阵;yx1,x2,x3的三元线性回归方程;对所求的得方程做拟合优度检验;对回归方程做显著性检验;对每一个回归系数做显著性检验;再作回归方程的显著性检验和回归系数的显著性检验;95%的置信区间;求标准化方程;设计目的与要求:1)巩固课本上学到的知识,提高处理实际问题的能力;掌握对多元线性回归问题的模型选择;对软件输出的结果要学会分析1)spss(2)认真独立完成设计环境或器材、原理与说明:设计环境和器材:计算机,Minitab软件,课本,笔记设计原理与说明:多元回归分析中,检验回归系数是否为0Ftt原假设:H:0 j统计量:tcjjcjj

0,j1,2,...,p^j^np1 nnp1 ne2ii11npn(y^)2i ii1

为回归标准差当原假设H :0成立时,构造的t统计量服从自由度为n-p-1的t0j j j分布。给定显著性水平,查出双侧检验的临界值t

。当t tj

时拒绝原假设H :0j

0,认为j

2 2是对y的线性效果j是显著的;当t tj 2

时接受原假设H :0j j

0,认为j

显著为零。自变量xj

是对y的线性效果不显著的(3)F检验对线性回归方程显著性的另一种检验是FF直接从回归效果检验方程的显著性。平方和分解式是n(yi

_)2

(^_)2i

(yy)2^i i^i1n(yii1forTotal。

i1 i1_y)2sstL_yy

SSTSumofSquaresni1

(

_y2SSR_i

,R表示Regression回n(yii1

y2SSES^i ^

,E表示Error因此平方和分解式可以简记为SST=SSR+SSEH0 1

... 0p统计量:F SSR/pSSE/(np1)当原假设H0

成立时,构造的F统计量服从自由度为(p,n-p-1)的F分布。给定显著性水平。当F值大于临界值F

(p,np1)时,拒绝原假H,认为回归方程显著。0方差分析表方差来源方差来源回归自由度p平方和 均方FPSSRSSRSSRppP(FF值)P值残差np1SSESSE(np1)SSE(np总和n1SST拟合优度拟合优度用于检验回归方程对样本观测值的拟合优度。在多元线性回归中,R2SSR1SSESST SST 样本决定系数R2的取值在0,1区间内,R2越近1,表明回归拟合的效果越R20,FR2的反应回归拟合的效果,但是并不能作为严格的显著性检验。复相关系数SSRSSTR2称RSSRSSTR2yxx1 2

,...,xp

的样本复相关系数。。在两个变量的简单相关系数中,相y都取正号。多重共线性多元线性回归方程模型中有一个基本假设,就是要求设计矩阵Xrank(X)=p+1,X0P+1c,c,...,c0 1 p

,使得c

cx0 1

cx2i2

...cxpip

0,i1,2,...,n则自变量x,x1 2

,...,xp

之间存在着多重共线性。(方差扩大因子法)X*'X*(r)ijC(cij)(X*'X*)1称其主对角线元素VIFjcjj为自变量xj的方差扩大因子varianceinflationfactor,VIF。当VIFj 10.就说明自变量xj与其他自变量之间有严重的多重共线性,且这种重共线性可能会过度的影响最小二乘估计值。设计过程(步骤)或程序代码:SPSS软件,导出数据分析—相关—双变量相关—变量:y,x1,x2,x3—确定分析—回归—线性回归(因变量:y;自变量:x1,x2,x3)(4)分析—相关—双变量相关—变量:y,x1,x2—确定分析—回归—线性回归(因变量:y;自变量:x1,x2)—确定分析---回归---线性回归(因变量自变量:x1,x2,x3;统计量:选中线性诊断;继续) 确定分析---回归 线性回归(因变量自变量保存:预测值:*.在0.05水平(双侧)上显著相关。未标准化;残差:未标准化;预测区间:均值,置信水平95%;继续确定*.在0.05水平(双侧)上显著相关。设计结果与分析(可以加页):(2)相关性yx1x2x3y Pearson相关性1.556.731*.724*显著性(双侧).095.016.018N10101010x1 Pearson相关性.5561.113.398显著性(双侧).095.756.254N10101010x2 Pearson相关性.731*.1131.547显著性(双侧).016.756.101N10101010x3 Pearson相关性.724*.398.5471显著性(双侧).018.254.101N10101010(3)输入/移去的变量输入/移去的变量模型输入的变量 移去的变量方法1x3,x1,x2aa.已输入所有请求的变量。模型汇总模型汇总模型RR方 调整R方标准估计的误差1.898a.806.70823.44188a.预测变量:(常量),x3,x1,x2。复相关系数R=0.898,决定系数R2=0.806,由决定系数看回归方程高度显著。模型平方和Anovabdf均方FSig.1 回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009x3,x1,x2。因变量:yx3,x1,x2。因变量:y系数a非标准化系数标准系数a.因变量:y模型B标准误差试用版tSig.1 (常量)-348.280176.459-1.974.096x13.7541.933.3851.942.100x27.1012.880.5352.465.049x312.44710.569.2771.178.284回归方程为:y348.2803.754x1

7.101x2

12.447x3x2yx3P=0.284。*.在0.05水平(双侧)上显著相关。因此,这个模型通过了显著性检验但没有通过回归系数的检验,自变量x3对因变量y不显著,所以下一步要剔除不显著的回归系数x3,重新建立回归模型.*.在0.05水平(双侧)上显著相关。(4)相关性yx1x2yPearson相关性1.556.731*显著性(双侧).095.016N101010x1Pearson相关性.5561.113显著性(双侧).095.756N101010x2Pearson相关性.731*.1131显著性(双侧).016.756N101010(5)输入/移去的变量输入/移去的变量模型输入的变量 移去的变量方法1x2,x1aa.已输入所有请求的变量。模型汇总模型汇总模型RR方 调整R方标准估计的误差1.872a.761.69224.08112a.预测变量:(常量),x2,x1。AnovaAnovab模型平方和df均方 FSig.1 回归12893.19926446.600 11.117.007a残差4059.3017579.900总计16952.5009模型B标准误差试用版tSig.1 (常量)-459.624153.058-3.003.020x14.6761.816.4792.575.037x28.9712.468.6763.634.008系数a系数a非标准化系数标准系数a.因变量:yR由方差分析表可以知道,F=11.117,P值=0.007,著,说明x1,x2整体上对y有显著的线性影响。x1,x2yx1P最大。4。标准化回归方程为:y459.6244.676x1

8.971x2x2,x1。因变量:y验,所以次模型是有效的系数a非标准化系数标准系数系数a非标准化系数标准系数共线性统计量模型B标准误差试用版tSig.容差VIF1 (常量)-348.280176.459-1.974.096x13.7541.933.3851.942.100.8251.211x27.1012.880.5352.465.049.6871.455x3x312.44710.569.2771.178.284.5861.708a.因变量:y从上图可知,次模型中,自变量自变量x1,x2,x3的多重共线性的VIF统计量的值都很小,小于10,说明建立的回归模型不存在多重共线性问题。(7)极小值极大值均值标准偏差N预测值175.4748292.5545231.500038.9520610标准预测值-1.4381.567.0001.00010预测值的标准误差10.46620.19114.5263.12710调整的预测值188.3515318.1067240.183549.8391410残差-25.1975933.22549.0000019.1402210标准残差-1.0751.417.000.81610Student化残差-2.1161.754-.1231.18810已删除的残差-97.6152350.88274-8.6834843.4322010Student化已删除的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论