数据分析与统计软件设计课程设计生产总值分析_第1页
数据分析与统计软件设计课程设计生产总值分析_第2页
数据分析与统计软件设计课程设计生产总值分析_第3页
数据分析与统计软件设计课程设计生产总值分析_第4页
数据分析与统计软件设计课程设计生产总值分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析与统计软件设计课程论文论文题目:广西生产总值分析专业班级:统计082姓 名:王世健学 号:200800903082关键字:三大产业 广西gdp 方差分析 回归分析 sas论文 时间序列分析 广西生产总值分析摘要:gdp不仅能够反映一个国家(或地区)的生产规模,而且能够反映这个地区的产业结构,如三大产业在整个地区国民经济中所占的份额。本论文将运用sas技术,采用均值比较、方差分析、回归分析及时间序列分析等方法对第一、二、三产业进行分析,从而更加深刻的理解广西地区第一、二、三产业之间的相互关系和影响以及其对gdp的重大贡献。一、前言国内生产总值(gross domestic product

2、,简称gdp)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个地区的经济表现,更可以反映地区的发展与财富。gdp是最重要的宏观经济统计指标之一,它是人们了解和把握一个国家(或地区)的宏观经济运行状况的有效工具,是制定经济政策的重要依据,也是检验经济政策科学性和有效性的重要手段。因此,从生产者角度来说,分析了解三大产业之间的结构是非常重要的。二、第一、二、三产业分析2.1 均值比较为了了解三大产业之间的差异和结构,对广西近二十年(1991-2009)的三大产业进行均值比较,以对三大产业有初步的了解

3、。用“分析家”计算统计量1. 将表2-1中数据通过excel导入到sas数据集gdp中,4个变量名分别为:y、x1、x2和x3,相应的标签名为广西生产总值、第一产业、第二产业和第三产业。2. 启动“分析家” 选择主菜单“solutions(解决方案)”“analysis(分析)”“analyst(分析家)”,打开“分析家”窗口。选择主菜单“file(文件)”“open by sas name”,打开“select a member”对话框,选择数据集gdp。3. 通过summary statistics菜单计算描述性统计量选择主菜单“统计(s)”“描述性统计(d)”“汇总统计量(s)”,打开“

4、summary statistics”对话框,选择变量列表中的income,单击“analysis”按钮,选定分析变量x1,x2,x3。单击确定。得表如图所示,在三大产业中,第二产业的均值为1106.78,远远高于第一产业的均值686.7484211,第三产业的均值1080.27与第二产业相差不大。如此,可以得出:第二产业第三产业在我国的国民经济中,起着主导地位。随着经济的发展,我国的第三产业,即:除第一、二产业以外的其他各业,位居第二。通过观察我们发现,第二产业的最大值与最小值的差值达到了3240.52,故我们可以预测,随着科技的进步,经济的发展以及人们思想的转变,广西的第二产业的发展拥有无

5、限潜力。2.2 双因素方差分析1.程序:data gdp; do i=1991 to 2009; do g=1 to 3; input y; output; end; end; cards; 1991518.59 195.17 141.02 182.40 1992646.60 233.03 187.48 226.09 1993871.70 250.11 321.10 300.49 19941198.29 333.79 469.81 394.69 19951497.56 453.15 535.86 508.55 19961697.90 534.88 587.37 575.65 19971817.

6、25 582.74 614.07 620.44 19981911.30 586.70 667.29 657.31 19991971.41 567.72 682.34 721.35 20002080.04 557.38 732.76 789.90 20012279.34 576.34 771.18 931.82 20022523.73 601.99 846.89 1074.85 20032821.11 658.78 984.08 1178.25 20043433.50 817.88 1253.70 1361.92 20053984.10 912.50 1510.68 1560.92 200647

7、46.16 1032.47 1878.56 1835.12 20075823.41 1241.35 2425.29 2156.76 20087021.00 1453.75 3037.74 2529.51 20097759.16 1458.49 3381.54 2919.13 title 双因素方差分析; proc anova; class i g; model y= i g; run;2.结果和分析:从图中,我们可以得知:a、模型的显著水平=0.050.0001,非常显著,模型效果好。b、图中的i因素一行,显著水平=0.050.0001,非常显著,所以,有足够充分的理由拒绝原假设h0,说明各年

8、之间有显著的差异。同理,我们分析道,对于g行显著水平=0.050.2373,显著性不好。同时,我们也观察到r-square值为0.984211,说明总体方差有98.4211%是来自组间变异,非常理想。综上所述,每年各产业之间的具有显著的差异。2.3用insight模块作回归分析建立第二产业对广西生产总值的回归方程。1.分析 1) 在insight模块中打开数据集dap。选择菜单“analyze”“fit(y x)”,打开“fit(y x)”对话框; 2) 在“fit(y x)”对话框中,将y设为响应变量,将x2设为自变量; 3) 单击“ok”按钮,得到分析结果。2.显示的结果分为若干张表: 第

9、一张表提供关于拟合模型的一般信息,y = x1表示这个分析是以y为响应变量,x1为自变量的线性模型;第二张表给出回归方程:如图得回归方程为:y=398.761+2.2363x2第三张表是带有回归直线的散点图,给出了回归的图形表示,如图;图的下面是参数回归拟合表。其中判定系数r-square(r2)高达0.9934,说明了回归方程已经高度拟合;第四张表提供拟合的汇总度量:响应变量的均值是变量y的平均值,均方残差平方根是对各观测点在直线周围分散程度的一个度量值,为随机误差的标准差(也是实测值y的标准差)s的无偏估计。第五张方差分析表(图4-16)包含对回归方程的显著检验:看到p值0.0001,拒绝

10、原假设并可作出回归系数不为零的结论,说明所建模型的线性关系是显著的。第六张型检验表提供与方差分析表一样的检验,如图第七张参数估计表给出了回归直线截距和斜率的估计值及其显著性检验等内容。在这个例子里,截距的p值 a = 0.05,表示模型为回归直线。斜率的t检验p值 0.0001,表明自变量广西生产总值对因变量第二产业有显著的线性关系,如图所示。2. 回归诊断 在显示窗的底部有一个残差r_y,这个图可以帮助验证模型的假定。从图中看出,数据点随机地散布在零线附近,表明模型中误差等方差、独立性的假设没有问题。2.4广西gdp时间序列分析由于原始序列非平稳但取对数且一阶差分后平稳,故采用求和自回归移动

11、平均模型(arima),差分后的序列也就是arma模型4.1数据的分析与处理4.1.1 平稳性检验根据广西2010统计年鉴中gdp数据,从用sas软件绘制的时序图中可以看出我国gdp序列含有指数趋势,并具有很强的非平稳性。4.1.2 数据平稳化取对数过后的gdp依旧存在非平稳性, 需要对其进行差分,先进行一阶差分,绘制一阶差分后的时间序列图。从图很难看出一阶差分后的序列是否平稳。首先考察序列的样本自相关图,从直观上检验该序列的平稳性。其次,对该序列进行adf单位根检验。编写命令行如下:data gdp;input s;difx=dif(s);difx4=dif4(dif(s);t=intnx(

12、year,1jan1991d,_n_-1);format date year4.;cards; 1991518.59 195.17 141.02 182.40 1992646.60 233.03 187.48 226.09 1993871.70 250.11 321.10 300.49 19941198.29 333.79 469.81 394.69 19951497.56 453.15 535.86 508.55 19961697.90 534.88 587.37 575.65 19971817.25 582.74 614.07 620.44 19981911.30 586.70 667.2

13、9 657.31 19991971.41 567.72 682.34 721.35 20002080.04 557.38 732.76 789.90 20012279.34 576.34 771.18 931.82 20022523.73 601.99 846.89 1074.85 20032821.11 658.78 984.08 1178.25 20043433.50 817.88 1253.70 1361.92 20053984.10 912.50 1510.68 1560.92 20064746.16 1032.47 1878.56 1835.12 20075823.41 1241.3

14、5 2425.29 2156.76 20087021.00 1453.75 3037.74 2529.51 20097759.16 1458.49 3381.54 2919.13 ;proc gplot;plot s*t difx*t difx4*t;symbol v=star c=blue i=join;run;时序图显示该序列具有线性递增的长期趋势和周期长度为一年的稳定的季节变动。输出的一阶差分序列图如下:观察可见1 阶差分提取了线性递增趋势。1 阶差分序列图呈现典型的季节波动。故在1 阶差分基础上再进行4 步的周期差分,提取季节波动信息。周期差分后序列4xt 时序图如下:时序图显示差分后

15、该序列已无显著趋势或周期,随机波动比较平稳。三总结广西的三大产业包括农业(种植业、林业、牧业、副业和渔业),工业和建筑业,以及除了第一二产业以外的其他部门,通过对其均值的比较,我们发现第二产业,即工业和建筑业在整个广西国民经济中依然占主导地位,原因要归咎于我国的国情,我国自改革开放以后,各个产业有了巨大的改变,但是,第二产业为主导的产业结构,依旧没有动摇。我们进行了方差分析回归分析及时间序列分析,我们得出,三大产业之间有很好的相关性,他们对广西国内生产总值的贡献是无可厚非的,第一产业是第二三产业的基础,而一二产业为第三产业的条件,第三产业发展促进第一二产业的进步,第二三产业对第一产业有带动作用

16、。由前面广西gdp 时间序列模型可知, 广西gdp的增长与上一期gdp增长有关。且gdp时序数据对冲击具有持久的特性,往往具有一个固定的增长趋势,一般不会返回某个特定值。总的说来,国内生产总值反映了一个地区的生产规模,同时也反映了这个地区的产业结构,因此,了解该地区的产业结构现状及其发展变化规律,制定正确的产业发展政策,引导产业结构健康地发展具有重要的意义。附表:广西历年生产总值统计(19912009)年份广西生产总值第一产业第二产业第三产业yx1x2x31991518.59 195.17 141.02 182.40 1992646.60 233.03 187.48 226.09 199387

17、1.70 250.11 321.10 300.49 19941198.29 333.79 469.81 394.69 19951497.56 453.15 535.86 508.55 19961697.90 534.88 587.37 575.65 19971817.25 582.74 614.07 620.44 19981911.30 586.70 667.29 657.31 19991971.41 567.72 682.34 721.35 20002080.04 557.38 732.76 789.90 20012279.34 576.34 771.18 931.82 20022523.73 601.99 846.89 10

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论