SAS论文-统计分析与应用_第1页
SAS论文-统计分析与应用_第2页
SAS论文-统计分析与应用_第3页
SAS论文-统计分析与应用_第4页
SAS论文-统计分析与应用_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE SAS 统计分析与应用 学号:xxxxxxxx班级:xxx姓名: xxx目 录第一章 摘要2第二章:基本介绍3 2.1 研究目的4 2.2 采用方法42.3 理论知识.4第三章 数据预处理及具体模型4 3.1 建立的数据集4 3.2 主要程序. 4 第四章 计算结果及分析4 4.1 使用INSIGHT 模块做主成分分析的步骤7 4.2 主成分的结果分析7第五章 总结分析8第六章 参考文献8第七章 附 录9 摘 要 SAS 系统是世界公认的权威性统计软件之一,是一个大型集成信息分析管理系统。 本次论文是用SAS 系统对2007 各地区农村居民家庭平均每人现金现金支出状况进行分析采用的数

2、据是北京、天津等省农村居民家庭平均每人现金现金支出状(原始数据见附录)。 选出31省的情况作为统计分析数据,其中分析的项目为:期内现金支出、生产费用支出、家庭经营费用支出、农业生产支出、牧业生产支出、购买生产性固定资产支出、税费支出、生活消费现金支出、财产性支出、转移性支出,次用变量X1、X2、X3、X4、X5、X6、X7、X8、X9 、X10。运用SAS 软件,运用主成分分析的方法对数据进行处理: (一)对于所选取的统计数据用MEANS 过程进行简单描述统计分析,得出数据平均值、数据标准差等。 (二)对于所选取的统计数据用INSIGHT 模块做主成分分析计算协方差矩阵的特征值或是计算相关系数

3、矩阵的特征值(Eigenvalue )、简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。系统默认计算相关系数矩阵的特征值和特征向量。(三)由相关系数矩阵的两个最大特征值的特征向量,可以写出第一、第二主成分以及第三主成分的得分。从以上结论分析可以知道影响各地区地区农村居民家庭平均每人现金支出的主要因素,从、可以更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。 关键字: 主成分分析、简单统计量、相关系数矩阵、相关系数矩阵的特征值及特征向量。二、基本介绍 1、研究目的:通过SAS 软件的分析,对各地区农村居民家庭平均每人现金支出的主要影响因素有一个大致的了解;有

4、利于国家的宏观调控,从而可以促进全民经济更好的发展。 2、采用方法: 描述统计量:MEANS 检验:使用INSIGHT 模块主成分分析。 3、理论知识: MEANS 过程(均值过程)用于对数值型变量产生针对单个变量的简单描述性统计.proc means过程统计量参数缺省时输出N(样本数据)、Mean(数据平均值)、Std Dev(数据标准差)、Minimum(最小值)、Maximum(最大值)五种统计值,但means 过程可计算16 种统计量。 主成份分析(Principal Components Analysis)是研究如何将多个变量指标间的问 题化为较少的几个新指标问题。这些新的指标是彼此

5、既互不相关,又能综合反映 原来多个指标的信息,是原来多个指标的线性组合。多指标的主成份分析常被用 来寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。这种处理问题的方法就称为主成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。主分量分析还可用于揭示变量间的共线性。 三、数据预处理及具体模型: 对于数据较少的程序可以用 DATA 步创建永久 SAS数据集 。永久SAS 数据集,由定义逻辑库与定义数据集两个步骤完成。逻辑库定义通过LIBNAME 语句完成,数据集定义应用DATA 实现。 LIBNAME 语句语法格式: LIBNA

6、ME 逻辑库名称 , 子目录路径 ; DATA 语句语法格式: DATA 逻辑库名.数据集名称 ; LIBNAME 语句把磁盘中的子目录与用户定义的逻辑库名连接起来。 用此种方法根据已知的数据就可以建立生成以下的数据集 3.1 建成的数据集为: The SAS System 20:00 Tuesday, December 15, 2009Obs area x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 1北 京5318.9 730.2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2 2天 津3267.8 1242.8 1172.9 20

7、3.3 699.5 69.9 1.2 1896.1 6.0 121.6 3河 北2289.6 779.6 725.0 362.7 226.2 54.6 3.1 1361.7 14.9 130.3 4山 西2080.9 500.0 441.3 254.4 126.3 58.7 0.7 1431.2 4.0 145.1 5内蒙古3338.7 1426.9 1223.5 865.7 316.6 203.3 1.7 1617.3 52.2 240.6 6辽 宁3926.2 1671.2 1546.2 719.9 754.5 125.0 3.8 1803.7 38.7 408.9 7吉 林4517.7

8、2129.9 1836.9 1404.1 393.3 293.1 5.1 1741.0 202.9 438.7 8黑龙江4424.6 2047.0 1812.2 1405.0 368.8 234.8 2.9 1699.1 301.8 373.9 9上 海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6 10江 苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7 11浙 江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7

9、23.7 500.1 12安 徽2390.0 554.9 490.7 297.2 116.7 64.2 6.0 1666.2 3.0 159.9 13福 建3026.0 626.4 566.8 251.0 208.1 59.6 0.7 2168.2 10.8 219.8 14江 西2199.8 680.6 591.7 339.7 160.4 89.0 4.5 1328.0 23.5 163.2 15山 东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3 16河 南2163.8 583.9 523.9 237.1 228.8 6

10、0.0 0.6 1448.6 1.4 129.3 17湖 北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4.6 64.8 18湖 南2418.9 555.8 497.8 196.7 175.2 58.0 3.8 1587.9 2.8 268.5 19广 东2895.2 576.3 547.4 171.3 216.3 29.0 1.7 2155.6 9.5 152.0 20广 西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6 21海 南1902.8 656.1 639.2 324.

11、3 165.4 16.9 0.3 1187.2 2.1 57.1 22重 庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5 1107.3 0.9 213.5 23四 川2514.5 612.8 533.5 178.0 270.7 79.3 6.1 1669.5 7.0 219.1 24贵 州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1.0 171.6 25云 南1837.1 623.0 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9 26西 藏1022.3 203.9 92

12、.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5 27陕 西2261.3 580.1 442.6 240.6 128.4 137.5 3.9 1496.8 4.6 175.9 28甘 肃1622.3 473.2 391.2 298.3 74.4 82.0 0.9 1068.2 4.3 75.7 29青 海1753.8 447.9 348.0 190.1 92.5 99.8 1.7 1196.5 7.4 100.3 30宁 夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8 31新 疆2705.0 14

13、44.4 1109.7 813.2 236.6 334.7 1.0 1126.0 44.4 89.2 3.2、模型的具体程序: data data1; input area $ 1-6 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 ;cards; 1北 京5318.9 730.2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2 2天 津3267.8 1242.8 1172.9 203.3 699.5 69.9 1.2 1896.1 6.0 121.6 3河 北2289.6 779.6 725.0 362.7 226.2 54.6 3.

14、1 1361.7 14.9 130.3 4山 西2080.9 500.0 441.3 254.4 126.3 58.7 0.7 1431.2 4.0 145.1 5内蒙古3338.7 1426.9 1223.5 865.7 316.6 203.3 1.7 1617.3 52.2 240.6 6辽 宁3926.2 1671.2 1546.2 719.9 754.5 125.0 3.8 1803.7 38.7 408.9 7吉 林4517.7 2129.9 1836.9 1404.1 393.3 293.1 5.1 1741.0 202.9 438.7 8黑龙江4424.6 2047.0 1812

15、.2 1405.0 368.8 234.8 2.9 1699.1 301.8 373.9 9上 海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6 10江 苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7 11浙 江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7 23.7 500.1 12安 徽2390.0 554.9 490.7 297.2 116.7 64.2 6.0 1666.2 3.0 159.9 13福 建

16、3026.0 626.4 566.8 251.0 208.1 59.6 0.7 2168.2 10.8 219.8 14江 西2199.8 680.6 591.7 339.7 160.4 89.0 4.5 1328.0 23.5 163.2 15山 东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3 16河 南2163.8 583.9 523.9 237.1 228.8 60.0 0.6 1448.6 1.4 129.3 17湖 北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4

17、.6 64.8 18湖 南2418.9 555.8 497.8 196.7 175.2 58.0 3.8 1587.9 2.8 268.5 19广 东2895.2 576.3 547.4 171.3 216.3 29.0 1.7 2155.6 9.5 152.0 20广 西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6 21海 南1902.8 656.1 639.2 324.3 165.4 16.9 0.3 1187.2 2.1 57.1 22重 庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5

18、1107.3 0.9 213.5 23四 川2514.5 612.8 533.5 178.0 270.7 79.3 6.1 1669.5 7.0 219.1 24贵 州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1.0 171.6 25云 南1837.1 623.0 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9 26西 藏1022.3 203.9 92.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5 27陕 西2261.3 580.1 442.6 240.6 128.4 137.5

19、 3.9 1496.8 4.6 175.9 28甘 肃1622.3 473.2 391.2 298.3 74.4 82.0 0.9 1068.2 4.3 75.7 29青 海1753.8 447.9 348.0 190.1 92.5 99.8 1.7 1196.5 7.4 100.3 30宁 夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8 31新 疆2705.0 1444.4 1109.7 813.2 236.6 334.7 1.0 1126.0 44.4 89.2 run; proc print; run; 四、运行结

20、果及分析 1. 使用INSIGHT 模块做主成分分析的步骤 使用INSIGHT 模块做主成分分析的步骤如下: 1) 在 INSIGHT模 块中打开数据 集L.jjzb;选择菜单 “Analyze”?“Multivariate(Y X)(多元分析)”,打开“Multivariate(Y X)”对话框; 2) 将做主成分分析的变量x 1x10为Y 变量,将变量area 选为Label 变量。3) 单击“Method”按钮,在打开的对话框中可以选择计算协方差矩阵的特征值或是计算相关系数矩阵的特征值。系统默认计算相关系数矩阵的特征值和特征向量,单击“OK”按钮返回。 图1图2图3 单击“Output”

21、按钮,在打开的对话框中包括“Descriptive Statistics”选项、“Bivariate Plots”选项以及各种多元分析的选项。选中“Principal ComponentAnalysis”复选框,单击下面的“Principal Component Options”按钮,打开“Principal Component Options”对 话 框 ,选 中 “Eigenvectors” 复 选 框 , 取“Correlations(Structure)”复选框。2. 主成分的结果分析 输出的数字分析结果有4 个部分:简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征

22、向量。 图4图5图6 五、结果分析 通过用主成分分析的方法对给定的 2007年上半年的各地区农村居民家庭平均每人现金支出数据的分析 ,可以知道影响各地区农村居民家庭平均每人现金支出的主要因素是影响各地区农村居民家庭平均每人现金支出的主要因素是期内现金现金支出、工资性现金支出、财产性现金支出和转移性现金支出;其次是家庭经营现金支出、农业现金支出和牧业现金支出,最后是林业现金支出和渔业现金支出,知道这些主要因素的影响,可以 更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。 六、参考文献 1黄燕,SAS 统计分析及应用.机械工业出版社.2006 2何宁.统计分析系统SAS.武汉大学出版.

23、2005 3薛富.SAS8.2 统计应用教程.北京希望电子出版社2007 七、附录:地区农村居民家庭平均每人现金支出(2009年上半年) 单位:元期 内现 金生产 税费生活财产性转移性地 区支 出费用家庭 购买生支出消费支出支出支出经营农业牧业产性固现金 费用生产生产定资产支出 支出支出支出支出合计2631777.4678.2348.3231.399.23.41633.822.9193.6北 京5318.9730.2606.4124.2232.5123.71.94093.223.5470.2天 津3267.81242.81172.9203.3699.569.91.21896.16121.6河

24、北2289.6779.6725362.71361.714.9130.3山 西2080.9500441.3254.4126.358.70.71431.24145.1内蒙古3338.71426.91223.5865.7316.6203.31.71617.352.2240.6辽 宁3926.21671.21546.2719.9754.51253.81803.738.7408.9吉 林4517.72129.91836.91404.1393.3293.15.11741202.9438.7黑龙江4424.620471812.21405368.8234.82.91699.1301.8373.9上 海5487.1241.3229.937.332.611.40.14616.71.4627.6江 苏3412.9632.1561.8236.1137.570.312.82438.95.5323.7浙 江5437.21320.21192.4159.4724.4127.85.53587.723.7500.1安 徽2390554.9490.7297.2116.764.261666.23159.9福 建3026626.4566.82512168.210.8219.8江 西2199.8680.6591.7339.7160.4894.51328

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论