现代统计分析方法与应用(人大 何晓群)第14章 对应分析_第1页
现代统计分析方法与应用(人大 何晓群)第14章 对应分析_第2页
现代统计分析方法与应用(人大 何晓群)第14章 对应分析_第3页
现代统计分析方法与应用(人大 何晓群)第14章 对应分析_第4页
现代统计分析方法与应用(人大 何晓群)第14章 对应分析_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/10/31中国人民大学六西格玛质量管理研究中心1第十四章对应分析

目录上页下页返回结束

§14.1对应分析的根本理论§14.2对应分析的步骤及逻辑框图§14.3对应分析的上机实现2023/10/31中国人民大学六西格玛质量管理研究中心2第十四章对应分析

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心3§14.1对应分析的根本理论

目录上页下页返回结束

对应分析利用降维思想,通过分析原始数据结构,旨在以简洁,明了的方式揭示属性变量之间及属性变量各种状态之间的相关关系。对应分析的一大特点就是可以在一张二维图上同时表示出两类属性变量的各种状态,以直观地描述原始数据结构。假定我们下面讨论的都是形如表3-4的规格化的列联表数据。为了论述方便,先对有关概念进行说明。2023/10/31中国人民大学六西格玛质量管理研究中心4§14.1对应分析的根本理论

目录上页下页返回结束

、有关概念2023/10/31中国人民大学六西格玛质量管理研究中心5§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心6§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心7§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心8§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心9§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心10§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心11§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心12§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心13§14.1对应分析的根本理论

目录上页下页返回结束

二、对应分析的根本理论经过以上数据变换,在引入加权距离函数之后,或是对行剖面集的各点进行式(7.8)的变换,对列剖面的各点进行类似变换之后,就可以直接计算属性变量各状态之间的距离,通过距离的大小来反映各状态之间的接近程度,同类型的状态之间距离应当较短,而不同类型的状态之间的距离应当较长,据此可以对各种状态进行分类以简化数据结构。但是,这样做不能对两个属性变量同时进行分析,因此不计算距离,代之求协方差矩阵,进行因子分析,提取主因子,用主因子所定义的坐标轴作为参照系,对两个变量的各状态进行分析。2023/10/31中国人民大学六西格玛质量管理研究中心14§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心15§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心16§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心17§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心18§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心19§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心20§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心21§14.1对应分析的根本理论

目录上页下页返回结束

三、对应分析应用于定量变量的情况2023/10/31中国人民大学六西格玛质量管理研究中心22§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心23§14.1对应分析的根本理论

目录上页下页返回结束

四、需要注意的问题2023/10/31中国人民大学六西格玛质量管理研究中心24§14.1对应分析的根本理论

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心25§14.2对应分析的步骤及逻辑框图

目录上页下页返回结束

一、对应分析的步骤2023/10/31中国人民大学六西格玛质量管理研究中心26§14.2对应分析的步骤及逻辑框图

目录上页下页返回结束

二、对应分析的逻辑框图2023/10/31中国人民大学六西格玛质量管理研究中心27§14.3对应分析的上机实现

目录上页下页返回结束

SPSS软件的CorrespondenceAnalysis模块是专门进行对应分析的模块。下面我们举例说明用CorrespondenceAnalysis模块进行对应分析的方法。例14.1按现行统计报表制度,农民家庭人均纯收入主要由四局部构成,即工资性收入、家庭经营纯收入、财产性收入、转移性收入。表14-1列出了2005年我国31省、市、自治区农民家庭纯收入的数据。试进行对应分析,揭示全国农民人均纯收入的特征以及各省、市、自治区与各收入指标间的关系。2023/10/31中国人民大学六西格玛质量管理研究中心28§14.3对应分析的上机实现

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心29§14.3对应分析的上机实现

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心30§14.3对应分析的上机实现

目录上页下页返回结束

软件SPSS进行实际操作和分析,如下操作步骤:1.翻开SPSS文件,在表格下方有两个选项分别是DataView和VariableView,点击VariableView选项,将各选项改为如下形式。2023/10/31中国人民大学六西格玛质量管理研究中心31§14.3对应分析的上机实现

目录上页下页返回结束

其中Values项需要作如下设置:在弹出的对话框里,对北京至新疆的31省市以及工资等四项收入进行数字附值。2023/10/31中国人民大学六西格玛质量管理研究中心32§14.3对应分析的上机实现

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心33§14.3对应分析的上机实现

目录上页下页返回结束

然后点击DataView进行如下数据的输入2023/10/31中国人民大学六西格玛质量管理研究中心34§14.3对应分析的上机实现

目录上页下页返回结束

2.数据输入完成后,选择Analyze—DataReduction—CorrespondenceAnalysis,然后把“省区〞选入“Row〞,在点击DefineRange来定义范围为1〔Minimumvalue〕到31〔Maximumvalue〕,之后点击Update,再点击Continue。之后同样地,把“收入类别〞选入Column,并定义其范围为1到4。其他选项可以使用默认值,也可根据需要另行选择,最后点击OK来运行。3.输出结果分析。根据SPSS对数据的计算,会得到一系列的表格,其中之一就是下面各维的汇总表,表中给出了行和列记分的关系。ChiSquare是关于检验的统计量的值,得出两组变量确实不独立。Sig的值很小,说明省份与收入类别之间确实有较强的相关性。ProportionofInertia是惯量比列,代表各维度分别解释总惯量的比例及累计百分比,从下表可以看出第一维和第二维的惯量比例占了总比例的96%,因此我们可以选取两维来进行分析。2023/10/31中国人民大学六西格玛质量管理研究中心35§14.3对应分析的上机实现

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心36§14.3对应分析的上机实现

目录上页下页返回结束

在SPSS的输出结果中还给出了绘制最后叠加的散点图所需的两套坐标。首先是关于行变量〔省区〕的点坐标表,例如北京〔-0.909,-0.426〕,天津〔-0.200,0.408〕等2023/10/31中国人民大学六西格玛质量管理研究中心37§14.3对应分析的上机实现

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心38§14.3对应分析的上机实现

目录上页下页返回结束

2023/10/31中国人民大学六西格玛质量管理研究中心39§14.3对应分析的上机实现

目录上页下页返回结束

同样地,列变量〔收入类别〕的点坐标表如下,例如工资〔-0.675,0.180〕,家庭〔0.582,0.029〕等。2023/10/31中国人民大学六西格玛质量管理研究中心40§14.3对应分析的上机实现

目录上页下页返回结束

由以上两张坐标表,可以得出如下的叠加散点图。从图中不难看出:我国经济兴旺省区,像广东、浙江、江苏、天津等,主要以工资性收入为主;而西部大局部省区,像新疆、宁夏、青海、贵州、甘肃、内蒙古、云南等多依靠家庭经营收入;而个别省区,像上海和北京,经济开展迅速,依靠工资性收入的同时,也会有相当局部的转移性收入。西藏近几年各项指标增长速度较快,特别是转移性收入和财产性收入,因此图中显示的西藏所在的位置也在预料之中。从中国目前的经济开展状况来看,大局部农民仍是以工资性收入和家庭经营收入为主要的收入来源。在经济兴旺地区,农民外出打工较多,因此还是以工资性收入为主;而在经济不兴旺地区,大局部农民还是以农业生产为主,因此还是以家庭经营收入为主。随着中国社会经济的不断开展和进步,这种格局也必然会发生一定的变化,转移性收入和财产性收入也会有所表现。2023/10/31中国人民大学六西格玛质

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论