![(完整版)多元统计分析思考题答案_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-2/26/52558b96-b394-4686-ad26-4cc86fce1b7a/52558b96-b394-4686-ad26-4cc86fce1b7a1.gif)
![(完整版)多元统计分析思考题答案_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-2/26/52558b96-b394-4686-ad26-4cc86fce1b7a/52558b96-b394-4686-ad26-4cc86fce1b7a2.gif)
![(完整版)多元统计分析思考题答案_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-2/26/52558b96-b394-4686-ad26-4cc86fce1b7a/52558b96-b394-4686-ad26-4cc86fce1b7a3.gif)
![(完整版)多元统计分析思考题答案_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-2/26/52558b96-b394-4686-ad26-4cc86fce1b7a/52558b96-b394-4686-ad26-4cc86fce1b7a4.gif)
![(完整版)多元统计分析思考题答案_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-2/26/52558b96-b394-4686-ad26-4cc86fce1b7a/52558b96-b394-4686-ad26-4cc86fce1b7a5.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元统计分析思考题答案多元统计分析思考题答案如下九道题题目中有错误的或不清楚记得老师课堂上说过考试内容不会超出这九道思考题, 的地方,欢迎大家指出、更改、补充。1、简述信度分析答题提示:要答可靠度概念,可靠度度量,克朗巴哈系数、拆半系数、单项与总体相关系数、稀释相关系数等(至少要答四个系数,至少要给出两个指标的公式) 答:信度(Reliability )即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果 的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:1)、重
2、测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法 需要对同一样本试测两次, 被调查者容易受到各种事件、 活动和他人的影响, 而且间隔时间 长短也有一定限制,因此在实施中有一定困难。2)、复本信度法复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复 本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和 对应题项的提问方向等方面要完全一致,而在实际调查
3、中,很难使调查问卷达到这种要求, 因此采用这种方法者较少。3)、折半信度法折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信 度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数。为了校正差异,两半测验的方差相等时,常运用斯皮尔曼-
4、布朗公式(Spearman-BrownFormula): rxx=2rhh/(1+rhh),其中,rhh:两半测验的相关系数;rxx :估计或修正后的信度。 该公式可以估计增长或缩短一个测验对其信度系数的影响。当两半测验的方差不同时,应采用卢伦公式(Rulon Formula )或弗拉纳根公式(Flanagan Formula)进行修正。4)、“信度系数法Cronbach ”信度系数是目前最常用的信度系数,其公式为: nSi2 n 1 i 1 n 1 Sx2,S,2 _,、, q 2其中,Si为每一项目的方差;SX为测验总分方差。从公式中可以看出,”系数评价的是量表中各题项得分间的一致性,属于
5、内在一致性系数。 这种方法适用于态度、意见式问卷(量表)的信度分析。2、简述多元尺度分析在你工作中的应用答:多元尺度分析(Multi-dimension Analysis)是市场研究的一种有力手段,是市场调查、分析数据的统计方法之一。它可以通过低维空间(通常是二维空间)展示多个研究对象(比如品牌)之间的联系,利用平面距离来反映研究对象之间的相似程度。由于多维尺度分析法通常是基于研究对象之间的相似性(距离)的,只要获得了两个研究对象之间的距离矩阵, 我们就可以通过相应统计软件做出他们的相似性知觉图。在实际应用中,距离矩阵的获得主要有两种方法:一种是采用直接的相似性评价,先对所有评价对象进行两两组
6、合,然后要求被访者对所有的这些组合间进行直接相似性评价,这种方法我们称之为直接评价法;另一种为间接评价法, 由研究人员根据事先经验,找出影响人们评价研究对象相似性的主要属性,然后对每个研究对象, 让被访者对这些属性进行逐一评价,最后将所有属性作为多维空间的坐标,通过距离变换计算对象之间的距离。多维尺度分析的主要思路是利用对被访者对研究对象的分组,来反映被访者对研究对象相似性的感知,这种方法具有一定直观合理性。在工作中,通过多维尺度分析,可以将消费者对商品相似性的判断产生一张能够看出这 些商品间相关性的图形。例如:有十个百货商场,让消费者排列出对这些百货商场两两间相似的感知程度,根据这些数据,用
7、多维尺度分析,可以判断消费者认为哪些商场是相似的,从而可以判断竞争对手。用于反映多个研究事物间相似(不相似)程度,通过适当的降维方法,将这种相似(不 相似)程度在低维度空间中用点与点之间的距离表示出来,并有可能帮助识别那些影响事物间相似性的潜在因素。这种方法在市场研究中应用得非常广泛。3、简述两个变量之间的相关分析答题提示:答什么是相关,对连续型变量用相关系数,对离散型变量用质相关系数 答:相关分析(correlation analysis ),研究随机变量之间的相关关系的一种统计方法。相关关系是一种非确定性的关系。相关性探讨的是两变量间相关情况的的大致趋势。相关分析涉及两个变量:应变量和自变
8、量。应变量 (response variable)是度量研究结果的变量;自变量是解释或影响反应变量的变量。两变量数据相关检验的步骤:一、图示两变量数据以及各个统计数字;二、查看整体状态及数据的离散情况;三、如果有较稳定的关系,就用简单的数学模式描述该关系。对连续型变量常用相关系数刻画两个变量之间的相关性,而对离散型变量则用质相关系数。4、聚类和判别分析的异同答:聚类分析是把研究目标分割成为具有相同属性的小的群体。对变量的聚类称为 R型聚类,而对观测值聚类称为 Q型聚类。它们在数学上是无区别的。聚类的基本想法:根据某种距离,把最近的聚在一起。这里的距离含义很广,如欧氏距离、马氏距离等距离,相似系
9、数也 可看作为距离。判别分析的基本思路是:设有G1、G2、GK个总体,从不同的总体中抽出不同的样本,当然,根据不同的方法,建立的Fisher 判别、Bayes 判别。根据样本一建立判别法则一判别新的样品属于哪一个总体。判别法则也是不同的。常用的判别方法有:距离判别、判别分析和聚类分析都是分类。其主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。可以先聚类以得知类型,再进行判别.5、因子分析和主成分分析的异同答:主成
10、分分析和因子分析是多元统计方法中关系密切的两种方法,应用范围十分广泛, 可以解决经济、教育、科技、社会等领域中的综合评价问题。主成分分析采用降维的思想,将 研究对象的多个相关变量(指标)综合为少数几个不相关的变量,反映原变量提供的主要信息。因子分析是主成分分析的推广和发展,它将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它属于多元分析中处理降维的一种统计方法。但是,在许多论文中用SPSS进行综合分析时,出现这两种方法运用混淆的错误。比如,主成分分析中对变量进行了因子旋转,因子分析的公因子系数错误等问题。本文就此对主成
11、分分析和因子分析的异同进行比较,并在 SPSS DPSa件上如何实现给予说明。一、主成分分析与因子分析的异同点两者的相同点:1、思想一致:都是降维的思想;2、应用范围一致:都要求变量之间具有不完全的相关性;3、数据处理过程一致:数据的无量纲化,求相关系数矩阵的特征值和特征向量,通过累计贡献率确定主成分个数、因子个数; 4、合成方法一致:都没有考虑原 始变量之间的关系,直接用线性关系处理变量与主成分和因子之间的关系。两者的不同点:1、方差损失上:主成分解释了原始变量的全部方差,无方差损失;因子模型中除了有公因子外还有特殊因子,公因子只解释了部分信息,有方差损失;2、唯一性:主成分分析不存在因子旋
12、转,主成分是唯一的;因子分析进行因子旋转,解不唯一;3、8实际意义:主成分没有实际意义;公因子有实际意义;4、应用:主成分侧重信息贡献、影响力综合评价;因子分析侧重成因清晰性的综合评价。1 .因子分析中是把变量表示成各因子的线性组合, 变量的线性组合。2 .主成分分析的重点在于解释个变量的总方差, 协方差。3 .主成分分析中不需要有假设(assumptions),包括:各个共同因子之间不相关,特殊因子( 和特殊因子之间也不相关。而主成分分析中则是把主成分表示成几个而因子分析则把重点放在解释各变量之间的因子分析则需要一些假设。因子分析的假设specific factor )之间也不相关,共同因子
13、4.主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因子。5.在因子分析中,因子个数需要分析者指定( spss根据一定的条件自动设定,只要是特征 值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变
14、量几乎带有原来所有变量的信息)来进入后续的分析, 则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据, 让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a, 了解数据。(screening the data),b, 和 cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。( reduce dimensionality ) d,在多元回归中,
15、主成分分析 可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差, 而是和变量对应的共同度 (变量方差中被各因子所解释的部分。)。6、系统聚类与K-means聚类的基本原理答:系统聚类法基本原理和步骤为:1、先计算n个样本两两间的距离2、构造n个类,每个类只包含一个样本3、合并距离最近的两类为一新类4、计算新类与当前各类的距离5、类的个数是否等于1,如果不等于回到3在做6、画出聚类图7、决定分类个数和类K-means聚类的基本原理:聚类可以走着瞧,不一定事先确定有多少类;但是K-mea
16、ns聚类却要求先说好要分多少 类。看起来有些主观。假定分3类,这个方法还进一步要求你事先确定3个点为“聚类种子”(多数软件会自动选种子);也就是说,把这 3个点作为三类中每一类的基石。然后根据和这三个点的距离 远近,把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来“种子”就没用了),再重新按照距离分类。如此叠代下去,直到达到停止叠代的要求(比如,各类最 后变化不大了,或者叠代次数太多了)。显然,前面的聚类种子的选择并不必太认真,它们 很可能最后还会分到同一类中呢。7、Fisher判别和贝叶斯判别的基本原理答:Fisher判别法是一种先投影的方法。使多维问题简化为一维问题来处理
17、。选择一个适 当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要 求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。进行投影后,再根据距离判别思想由距离的远近得到判别准则,从而进行判别分析。贝叶斯(BAYES判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统 计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后 验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。8、举例说明你在工作中如何应用主成分分析和因子分析(因主成分分析有什么什么缺点
18、,可用因子分析什么什么旋转)答:主成分分析:将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。在分析问题的时候,往往提出很多有关的变量来描述一个事物,在宏观经济研究领域中,表述国家基本经济面貌的时有很多指标,如人口、国土面积、公路里程、GDP财政收入等等。在对人的描述的时候,有身高、体重、学历、年龄、工作等多项可直接测量的指标。众 多的指标中,有很多是相互关联的, 不能清晰的反应数据问题,人们希望能将这些指标进行高度概括,用有限的指标精炼的概括,清晰地反应数据全貌。将原有变量重新组合成几个相互无关的新变量,同时根据实际从中选出较少的变量尽可能多地反映原有变量统计信息,在数学上
19、也叫做降维处理。当我们展开区域竞争力研究的时候,可以利用主成分分析法。首先要根据区域竞争力选择适合的指标体系,以综合竞争力开展的研究的指标体系如:国内生产总值(GDP、第三产业比重、工业占第二产业比重、邮电业务总量、用电量、全社会固定资产投资、外商直接 投资、科学研究等。取得31个省(市、自治区)的数据。对原始指标数据白标准化采集p维随机向量 x = (X1,X2,,Xp)T), 31 个样品 xi = (xi1,xi2,.,xip)T, i=1,2,31 ,由于指标间量纲不同,将数据进行标准化操作。求的相关系数矩阵 R的特征方程及p个特征根,及特征向量。将标准化的指标量转化成主成分,并根据特
20、征根的大小确定主成分贡献率,将前n个主成分累计贡献率超过85%寸各个样本的权系数重新组合,计算各个样本在 n个主成分上的得分,根据得分将不同地区划成不同的组合,这样就可以将原有因指标众多而无法分清的地区间区别, 可以通过有限个主成分将各地区区分出来,将竞争力相近的地区主成分得分基本靠近,几何做图的意义是,在主轴上的各样本点分别集中在各自的主轴附近。进一步分析各个主轴的经济学含义。完成主成分分析。因子分析:它的目的在于研究原始变量的内部关系,通过寻找变量的共同因素来简化和分析变量中存在的复杂关系。它把每个变量分解为两部分因素,一部分是由这些变量内含的共同因素所构成,即所谓公共因素部分,另一部分是
21、每个变量各种独有的因素,即所谓独特因素或单一因素部分。仍然沿用对地区竞争力分析的案例,由于根据主成分分析得到的 n个主成分,将多个指标投影到少量的主成分之上,简化了数据结构,但仍然无法明确主成分的含义,也无法明确指标间的关系。这样利用因子分析, 将各个变量中的公共因子找到,也就是造成地区间竞争力不同的的共性因素,同时找到各地区不同的独特因素。首先对各省数据进行标准化处理。根据正交因子模型:X=p+A*F+e,其中F为X的公共因子, 为X的特殊因子,A为因子 载荷矩阵。根据标准化数据计算协方差阵,并且求的其特征根和标准化特征向量,确定m个方差累积贡献率达到 85%以上的公因子个数。由于公因子解不
22、唯一,为了取得更好对公因 子的经济学解释,对公因子进行方差最大的正交旋转,将各列载荷向。或1两极方向分化,将大大有利于对公因子进行解释。本案例中,得到2个公因子,gdp等指标在第一公因子上的载荷比较高,可以将第一公因子解释为经济层面的硬件因素,而教育投入、科研投入等指标在第二公因子上载荷较高,可以将第二公因子解释为软件因素。最后还可以将公因子反过来表示为不同变量的线性组合,即得到每个样本(每个省)的因子得分,来判断各个省在两个公因子的得分情况,清晰的看到有些省份在两个公因子的得分都很到,有的部分得分高, 有的都很低,体现出东、中、西部的差距,与人们普遍感受是一致的。同时根据地区间差距,找到具体得分差在哪里,对今后该地区提高综合竞争力有很好的指导意义。9、给定典型相关系数运行结果,解读结果。提问内容涉及(记不全了): canonical R系数,P
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 短视频在营销推广中的运用与效果
- 高一数学教师期末工作总结
- 电子商务物流的智能化与自动化发展研究
- 电子商务平台的全球化战略布局与实施
- 电能服务品质在公共设施中的提升方法
- 年房屋出租合同范本
- 共同抚养孩子的离婚协议书
- 房产抵押担保协议书范本
- 体育用品品牌加盟协议书范本
- 研究生教育创新与未来职业发展趋势
- 期末复习(试题)-2024-2025学年三年级上册数学苏教版
- 心水病的中医护理方案
- 体育赛事直播服务投标管理办法
- 小红书种草营销师模拟题及答案(单选+多选+判断)
- 2024年5月26日河南省事业单位联考《公共基础知识》试题
- 高三冲刺毕业家长会课件2024-2025学年
- 工厂安全保安服务管理制度
- 网络安全攻防演练报告
- 新《学前教育法》知识讲座课件
- 【申报书】高职院校高水平专业群建设项目申报书
- 公文写作题库(500道)
评论
0/150
提交评论