版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
标准电子科技大学政治与公共管理学院本科教学实验报告(实验)课程名称:数据分析技术系列实验电子科技大学教务处制表文案标准电子科技大学实 验 报 告学生姓名:刘晨飞学号:2013120101027指导教师:高天鹏一、实验室名称: 电子政务可视化实验室二、实验项目名称:因子分析三、实验原理使用SPSS软件的因子分析对数据样本进行分析相关分析的原理:步骤一:将原始数据标准化。因子分析的第一步是主成分分析,将总量较多的因素通过线性组合的方式组合成几个因素,且这些因素之间相互独立。步骤二:建立变量的相关系数矩阵 RAnalyse->DimentionRuduction->Fctor->Extraction->勾选Correlationmatrix可以输出相关系数矩阵,相关系数矩阵计算了变量之间两两的pearson相关系数。步骤三:适用性检验使用Bartlett球形检验或者KMO球形检验来检验样本是否适合进行因子分析。评价标准:KMO 检验用于检验变量间的偏相关系数是否过小,一般情况下,当 KMO 大于0.9时效果最佳,小于 0.5时不适宜做因子分析。Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果结论是不拒绝该假设,则表示各个变量都是各自独立的。步骤四:根据因子贡献率选取因子,特征值和特征向量构建因子载荷矩阵 A。处于简化和抽取核心的思想,一般会按照某种标准选取前几个对观测结果影响较大的因素构建因子载荷矩阵,一般的标准是选取特征根大于 1的因子。并要求累积贡献率达到90%以上。步骤五:对A进行因子旋转文案标准因子旋转的目的是使因子载荷矩阵的结构发生变化,使每个变量仅在一个因子上有较大载荷。是将因子矩阵在一个空间里投影,使单个向量的投影在仅在一个变量的方向有较大的值,这样做可以简化分析。步骤六:计算因子得分:计算因子得分是计算在不同样本水平下观测指标的水平的方式。计算因子得分需要用到因子得分计算函数,这个计算的结果是无量纲的,仅表示各因子在这个水平下观测指标的值,这也是因子分析的目标,将不可观测的目标观测量用一个函数与可以观测的变量联系起来。四、实验目的理解因子分析的含义,以及数学原理,掌握使用 spss进行因子分析的方法,并能对spss因子分析产生的输出结果进行分析。五、实验内容及步骤本次实验包含两个例子:实验步骤:问题描述实验一题目要求:对我国主要城市的市政基础设施情况进行因子分析。实验二题目要求:主要城市日照数sav为例,其中的变量包括城市的名称“city”、各个月份的日照数(1)实验二步骤:执行 analyze->dimentionreduction->factor->rotation如下勾选文案标准(2)执行Analyse->DimentionRuduction,打开分析窗口打开参数设置窗口加入变量(3)点击Descripitives,选择initialsolution(输出原始分析结果)、coefficients(输出相关系数矩阵)、勾选进行KMO和bartlett球形检验,完成之后点击continue回到参数设置窗口文案标准输出选项(4)点击Extraction输出碎石图,完成之后点击 continue回到参数设置窗口勾选输出碎石图(5)勾选输出因子得分,完成之后点击 continue回到参数设置窗口文案标准输出因子得分(6)选择缺失的值用均值代替,完成之后点击 continue回到参数设置窗口均值代替缺失数据(7)点击OK,输出分析结果文案标准六、实验器材(设备、元器件):计算机、打印机、硒鼓、碳粉、纸张七、实验数据及结果分析实验一主要结果及分析:KMOandBartlett'sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..856Bartlett'sTestofSphericityApprox.Chi-Square281.248df15Sig..000KMOandBartlett's球形检验的结果从表里的结果可以看出,KMO的检验值为0.856,一般KMO值大于0.9认为适合做因子分析,这个值为0.856接近0.9,适合做因子分析。CorrelationMatrix城市污水日年末实有道年末实有道城市排水管处理能力路长度(公路面积(万城市桥梁道长度(公(万立方城市路灯里)平方米)(座)里)米)(盏)Correlatio年末实有道路长度(公1.000.983.783.939.896.883n里)年末实有道路面积(万.9831.000.738.940.853.867平方米)城市桥梁(座).783.7381.000.759.873.719城市排水管道长度(公.939.940.7591.000.845.916里)城市污水日处理能力.896.853.873.8451.000.822(万立方米)城市路灯(盏).883.867.719.916.8221.000相关系数矩阵从这个表格中可以看出这六个变量之间有很高的相关度,需要标准化。文案标准CommunalitiesInitialExtraction年末实有道路长度(公里)1.000.954年末实有道路面积(万平方米)1.000.919城市桥梁(座)1.000.742城市排水管道长度(公里)1.000.924城市污水日处理能力(万立方1.000.882米)城市路灯(盏)1.000.859ExtractionMethod:PrincipalComponentAnalysis.变量共同度表这个表,表示提取公共因子之后各个变量的共同度,就是原始信息的保留度,例如第一个变量有95.4%的信息被保留下来了。TotalVarianceExplainedInitialEigenvaluesExtractionSumsofSquaredLoadingsComponentTotal%ofVarianceCumulative%Total%ofVarianceCumulative%15.28088.00188.0015.28088.00188.0012.3906.50394.5043.1622.70797.2114.1041.73898.9505.051.84999.7996.012.201100.000ExtractionMethod:PrincipalComponentAnalysis.主成分表按照之前的设置,保留了一个特征值大于 1的因子,这个因子的贡献率为 88%文案标准特征值和变量的散点图可以看出,除了第一个因子之外其他的因子特征值都很小。ComponentMatrixaComponent1年末实有道路长度(公里).977年末实有道路面积(万平方米).959城市桥梁(座).862城市排水管道长度(公里).961城市污水日处理能力(万立方.939米)城市路灯(盏).927因子负荷矩阵这个可以用来表示因子的线性组合。文案标准ComponentScoreCoefficientMatrixComponent1年末实有道路长度(公里).185年末实有道路面积(万平方米).182城市桥梁(座).163城市排水管道长度(公里).182城市污水日处理能力(万立方米).178城市路灯(盏).176因子得分系数矩阵用主成分分析方法得出的因子得分系数矩阵,可以计算因子得分函数。ComponentScoreCovarianceMatrixComponent 11 1.000因子之间关系的矩阵 .这个只选择出一个因子,这个实际上没有意义实验二结果及分析:一月日照时数二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数十二月日照时数
CommunalitiesInitial Extraction1.000 .9151.000 .9181.000 .8961.000 .9331.000 .8821.000 .7781.000 .6171.000 .8741.000 .7541.000 .8631.000 .8471.000 .854变量共同度表.文案标准TotalVarianceExplainedExtractionSumsofSquaredRotationSumsofSquaredInitialEigenvaluesLoadingsLoadingsCompon%ofCumulativ%ofCumulativ%ofCumulativentTotalVariancee%TotalVariancee%TotalVariancee%16.84557.04157.0416.84557.04157.0414.58138.17338.17321.96216.34773.3881.96216.34773.3882.88624.04762.22031.32411.03484.4211.32411.03484.4212.66422.20184.4214.7256.04590.4665.3943.28393.7496.2502.08595.8337.1711.42397.2568.104.87098.1269.080.67098.79610.065.53999.33511.047.39599.73112.032.269100.000ExtractionMethod:PrincipalComponentAnalysis.主成分表选取了前三个特征解大于 1的值ComponentMatrix
a一月日照时数二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数十二月日照时数
Component123.852-.435-.015.854-.419-.115.869-.275-.257.805-.079-.528.888-.033-.303.764.439-.038.364.644-.265.465.809.066.794.295.192.800.251.400.825-.275.300.562-.164.715因子载荷矩阵显示提取出来的三个因子的线性组合文案标准RotatedComponentMatrix
aComponent一月日照时数二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数十二月日照时数
123.837-.014.463.882.013.375.901.163.241.903.340-.049.834.392.179.405.730.285.128.763-.134-.031.917.178.376.588.516.297.528.704.592.081.700.140.018.913旋转之后的因子载荷矩阵使各因子的载荷不再集中,可以看出,第一个因子主要由前 5个变量决定,中间的因子主要由中间三个因子决定,后面的一个因子主要由后四个因子决定ComponentTransformationMatrixComponent1231.754.437.4912-.432.892-.1313-.495-.113.861因子转换矩阵文案标准八、实验结论因子分析可以有效降低维度,抽取对观测指标影响最大的几个变量的线性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 借款人与出质人之间的合同
- 简易个人分包合同
- 废止采购合同
- 专业分包工程合同样本
- 专业工程勘察招标启示
- 互联网金融交易担保协议
- 土工网带采购合同
- 技术服务合同税率动态
- 技术服务合同的技术改进费用标准
- 招标文件价格询价步骤
- 陕西西安未央区2021-2022学年度第一学期期末质量检测五年级英语试卷(人教PEP版含答案)
- 大疆开 FCC BOOST 教程指南
- C++面向对象程序设计(第二版)课件整套电子教案
- YY/T 0506.3-2005病人、医护人员和器械用手术单、手术衣和洁净服 第3部分:试验方法
- 人力资源四级培训职业道德培训课件
- 医院行风建设及行风示范窗口建设工作计划
- 内部控制制度审计实施细则
- 加油站隐患排查表、整改台账
- 浙江温州文成县周壤镇招考聘用大学生村务助理【共500题附答案解析】模拟检测试卷0
- 私人财富管理与资产配置课件
- 广东汕头高二地理(文科班)期中试卷
评论
0/150
提交评论