




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()SPSSSPSS系列培训系列培训9-119-11课课统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()概概 述述解决变量间多重共线性(data reduction)有太多的变量,希望能够消减变量,用一个新的、更小的由原始变量集组合成的新变量集作进一步分析新变量集能够更有利于简化和解释问题探讨变量内在联系和结构(structure detection)观测变量之
2、间的存在相互依赖关系由量表所反映出的受访者对卫生服务的真实满意度文彤老师文彤老师2SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()概概 述述本讲课程中涉及的方法其实质均为数据化简、信息浓缩,即将分散在多个变量中的同类信息集中、提纯,从而便于分析、解释和利用目的为浓缩信息目的为探讨内在结构正因如此,这些信息浓缩方法、特别是其中的因子分析方法,往往成为更复杂的多元分析方法的基石SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师3统计软件系列课堂统计软件系列课
3、堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()主成分分析主成分分析只是一种中间手段,其背景是研究中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且可能因多元共线性而无法得出正确结论主成分分析的目的就是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标,便于进一步分析尽可能保留原始变量的信息,且彼此不相关SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师4统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品(www.
4、)自变量3.02.22.0自变量1605040SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师5统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()x1x2Y1Y2x1x2X1与与x2相关相关Y1与与Y2不相关不相关2022年年1月月2日日文彤老师文彤老师6统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()主成分分析主
5、成分分析在主成分分析中,提取出的每个主成分都是原来多个指标的线性组合如有两个原始变量x1和x2,则一共可提取出两个主成分如下:z1=b11x1+b21x2z2=b12x1+b22x2SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师7统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()主成分分析主成分分析原则上如果有n个变量,则最多可以提取出n个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义。多数情况下提取出前23个主成分已包含了90%以上的信息,其他的可以忽略不计。在进行主成分
6、回归时,提取出的主成分能包含主要信息即可,不一定非要有准确的实际含义。SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师8统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()主成分分析主成分分析方法用途主成分评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。主成分回归:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师9统计软件系列课堂统计软件系列课
7、堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()案例:各省经济发展情况综合评价案例:各省经济发展情况综合评价现希望根据全国30个省市自治区经济发展基本情况的八项指标对其进行分析和排序。具体指标有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值,数据文件见factor1.sav。SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师10统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品(www.pinggu
8、.org)因子分析因子分析是一种多变量化简技术。目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性较低。每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。探索性因子分析证实性因子分析文彤老师文彤老师11SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()因子分析因子分析比如在市场调查中收集了食品的五项指标:味道、价格、风味、是否快餐食品、能量。经过因子分析后发现结果如下:x1=0.02z1+0.9
9、9z2+1x2=0.94z1-0.01z2+2x3=0.13z1+0.98z2+3x4=0.84z1+0.42z2+4x5=0.97z1-0.02z2+5SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师12统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()因子分析因子分析第一公因子主要影响价格、是否快餐食品和能量,代表“价廉”第二公因子主要影响味道和风味,代表“味美”代表特殊因子,只对当前变量有影响,表示该变量中独特的,不能被公因子所解释的特征文彤老师文彤老师13SPSS统计分析系列培训统计分
10、析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()用途用途研究设计阶段/问卷效果评估阶段评价问卷的结构效度统计分析阶段解决变量间多重共线性寻找变量间潜在结构内在结构证实文彤老师文彤老师14SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()适用条件适用条件样本量样本量与变量数的比例应在5:1以上总样本量不得少于100,而且原则上越大越好各变量间必须有相关性KMO
11、统计量:0.9最佳,0.7尚可,0.6很差,0.5以下放弃Bartletts球形检验这些条件均是为了保证能够寻找出内在结构文彤老师文彤老师15SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()分析步骤分析步骤判断是否需要进行因子分析,数据是否符合要求进行分析,按一定标准确定提取的因子数目如果进行的是主成分分析,则将主成分存为新变量用于继续分析,步骤到此结束如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,以寻求最佳解释方式如有必要,可计算出因子
12、得分等中间指标供进一步分析使用文彤老师文彤老师16SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()因子分析因子分析公因子数量的确定主成分的累积贡献率:8085%以上特征根:大于1综合判断因子分析时更重要的是因子的可解释性必要时可保留小于1的因子碎石图可以帮助确定因子数量文彤老师文彤老师17SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品(www.pinggu
13、.org)有关概念有关概念因子负荷即表达式中各因子的系数值,用于反映因子和各个变量间的密切程度,其实质是两者间的相关系数公因子方差比(Communalities)指的是提取公因子后,各变量中信息分别被提取出的比例,或者说原变量的信息量(方差)中由公因子决定的比例SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师18统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()有关概念有关概念特征根(Eigenvalue)可以被看成是主成分影响力度的指标,代表引入该因子主成分后可以解释平均多少原始变量的信息。
14、正因如此,一般对特征根大于1的因子才加以注意SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师19统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()分析实例分析实例案例:对各省经济数据的进一步分析奥林匹克资料:olymp88.sav因子旋转因子负荷的排序和禁止输出因子计算公式的生成SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师20统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()SPSS系列培
15、训之系列培训之:对应分析对应分析统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()对应分析对应分析问题的提出分析分类变量间关系时,卡方检验只能给出总体有无关联的结论,但不能进行精细分析,在变量类别极多时于事无补Logistic模型在多分类时过于笨拙解决方案精细建模:对数线性模型直观展示:对应分析SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师22统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()对应分
16、析对应分析特点是多维图示分析技术之一,结果直观、简单与因子分析有关分类资料的典型相关分析用于展示两个/多个分类变量各类间的关系高收入、黑人、男性倾向于反对开战研究较多分类变量间关系时较佳各个变量的类别较多时较佳均为四类以上文彤老师文彤老师23SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()对应分析对应分析实质就是对列联表中的数据信息进行浓缩,然后以易于阅读的图形方式呈现出来以默认的卡方测量方式为例,首先以列联表为分析基础,计算基于H0假设的标化单元格残差SPS
17、S统计分析系列培训统计分析系列培训文彤老师文彤老师理论频数观察频数理论频数标准化残差24统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()对应分析对应分析实质将每行看成是一条记录,基于列变量相关系数阵进行因子分析,计算出列变量各类的负荷值将每列看成是一条记录,基于行变量相关系数阵进行因子分析,计算出行变量各类的负荷值局限性不能进行变量间相关关系的检验仍然只是一种统计描述方法解决方案的所需维度需要研究者决定对极端值敏感对于小样本不推荐使用文彤老师文彤老师25SPSS统计分析系列培训统计分析系列培训统计软
18、件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()对应分析对应分析实际应用(保险业)我们某个险种的用户是谁?另外还有什么特征的人群也倾向于成为我们的用户?什么特征的人群还没有找到满意的险种,或者说现有险种还有哪种人群未能覆盖?我们提供的险种系列是否全面,有无哪些险种过于重叠,是否还有种类空白需要填补?文彤老师文彤老师26SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()202
19、2年年1月月2日日文彤老师文彤老师27统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()金色红色棕色深色黑色头发颜色头发颜色0.00.81.0CountCount眼睛颜色深色棕色蓝色浅色2022年年1月月2日日文彤老师文彤老师28SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师28统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()对应分析图的阅读对应分析图的阅读每个维度可能代表了一种
20、特征实际上就是一个提取出的主成分,但由于分类变量的信息较少,可能找不到合理的解释1考察同一变量的区分度:如果同一变量不同类别在某个方向上靠得较近,则说明这些类别在该维度上区别不大。2考察不同变量的类别联系:一般而言,落在从图形原点(0,0)处出发相同方位上大致相同区域内的不同变量的分类点彼此有联系。散点间距离越近,说明关联倾向越明显;散点离原点越远,也说明关联倾向越明显。SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师29统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()结果的正确解释结果的正
21、确解释错误的解释:金色头发的儿童中蓝色、浅色眼睛者居多 正确的解释:相对于平均水平而言,金色头发的儿童中蓝色、浅色眼睛的比例要高一些,也就是高于其他颜色头发的儿童-1.0-0.50.00.51.01.52.0Dimension 1Dimension 1-1.0-0.50.00.51.0Dimension 2Dimension 2金色红色棕色深色黑色深色棕色蓝色浅色SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师30统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()对应分析中应注意的问题对应分析
22、中应注意的问题分析目的:重在观察行、列变量间的联系数据类型:无序分类较佳,如果均为有序分类,且变量较多时,采用多维偏好分析更合适样本量:对极端值敏感,分析时有必要去除频数过少的单元格对于小样本不推荐使用变量间关联:不能将对应分析作为筛选相关变量的方法,变量纳入前最好先做卡方检验SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师31统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()最优尺度变换最优尺度变换许多时候我们所分析的变量并非连续性变量,如评分、等级等如果要按照连续变量来分析,则存在一个适当
23、量化的问题有时候虽然变量均为连续性,但变量间的关系并非简单的线性,而现有的多元分析方法几乎无一例外的是以线性关联为基础进行分析的多个变量间的复杂联系如何能够简单明了的表现出来?文彤老师文彤老师32SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()最优尺度变换最优尺度变换所谓最优尺度变换的本质,就是根据数据本身的关联,寻找出最佳的原始变量评分方法,将原始变量一律转化为相应的分值,并在转化时将变量间的关联一律变换为线性,这样就解决了以上问题可以同时分析多个分类变量间
24、的关系,并同样用图形方式表示出来在变量种类上更加丰富,已可以处理各种类型的变量,如对无序多分类分析、有序多分类变量和连续性变量同时进行分析的问题文彤老师文彤老师33SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()最优尺度变换最优尺度变换不能自动筛选变量,需要用户根据经验和分析结果进行耐心筛选对样本量要求较大,特别是对少数极端值和罕见类别频数的变化非常敏感由于结果往往以图形方式呈现,不加注意可能会得到完全错误地分析结果所作的最优尺度变换是基于数据本身而来,当增减
25、变量、或者对变量进行变换后重新拟合时,相应的结果可能完全不同文彤老师文彤老师34SPSS统计分析系列培训统计分析系列培训统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()最优尺度变换最优尺度变换Homogeneity (HOMALS)同质性分析,即多重对应分析以图形化方式展示多个分类变量间的关系Categorical Principal Components (CatPCA)其实质为分类变量的主成分分析当一些变量为名义测量外的其它测量(有序分类或连续性变量)时使用也就是MR中常用的多维偏好分析Nonl
26、inear Canonical Correlation (OVERALS)非线性典型相关方法用于分析两个或多个变量集之间的关系允许变量为任何类型SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师35统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()案例案例数据集mcorres.sav提供了某次调查得来的轿车特征与一些用户特征的数据,请分析汽车原产地(norigin)、汽车大小(nsize)、轿车类型(ntype)、是否租房(nhome)、有无双份收入(nincome)、性别(nsex)、婚姻状况
27、(nmarit)之间的联系如何SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师36统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()注意事项注意事项由于算法不同,当分析两个变量时,结果不会等同于简单对应分析,但是基本相同不推荐同时分析过多变量必要时应当对频数较少的类别加以合并或者剔除得到结果后应当和原始表格加以仔细对照,以确保分析结果的正确性SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师37统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品(www.
28、)SPSS系列培训之系列培训之:多维多维尺度分析尺度分析文彤老师文彤老师统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()多维尺度分析简介多维尺度分析简介用于反映多个研究事物间的相似(不相似)程度通过询问消费者对各种品牌(或者概念)的相似程度评分,我们可以评价那些品牌在消费者的心目中比较类似,而这些类似的品牌往往意味着市场定位重叠,即存在竞争关系但是,直接采用原始数据加以考察非常麻烦,数据太多,不容易得出一个综合、全面的结论SPSS统计分析系列培训统计分
29、析系列培训文彤老师文彤老师39统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()多维尺度分析简介多维尺度分析简介同时所需的解释空间维度太高,不容易阅读通过适当的降维方法,将这种相似(不相似)程度在低维度空间中用点与点之间的距离表示出来,并有可能帮助识别那些影响事物间相似性的潜在因素最常见情况是在二维空间中将结果表现出来SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师40统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()分析目的分析目的通过空间定位图,研究者可以得知消费者认为哪些品牌的产品类似于我们的产品?在这些品牌中消费者用于评价相似性的是哪些特征指标(属性)?SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师41统计软件系列课堂统计软件系列课堂 人大经济论坛人大经济论坛培训中心出品(培训中心出品()案例:城市航空距离案例:城市航空距离数据mds1.sav是笔者收集的中国12个城市间航空距离的数据,请就此进行MDS分析。SPSS统计分析系列培训统计分析系列培训文彤老师文彤老师42统计软件系列课堂
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论