第6讲SPSS相关分析_第1页
第6讲SPSS相关分析_第2页
第6讲SPSS相关分析_第3页
第6讲SPSS相关分析_第4页
第6讲SPSS相关分析_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章第六章 SPSS相关分析相关分析本章主要内容:u 概述u 简单相关分析u 偏相关分析u 距离分析整体分析与设计的内容一、背景概述一、背景概述u 相关分析概述相关分析概述任何事物的存在都不是孤立的,而是相互联系、相互制约的。例如,经济学中投资与消费、收入与消费、生产与投入等都存在一定的联系。将客观事物相互间的密切程度用适当的统计指标表示出来,这个过程就是相关分析。其特点为:一个变量的取值不能由另一个变量唯一确定,即当自变量x取某个值的时候,因变量y的值可能会有多个。这种关系不确定的变量显然不能用函数形式予以描述,但也不是杂乱无章的。大量的偶然性中蕴含着必然的内在规律。而相关分析,则正是通过

2、对大量数据的观察和研究,来发现这些可能存在的某种客观规律的。SPSS中的操作菜单:“分析分析相关相关”。二、概念了解二、概念了解1)函数关系和相关关系事物或现象之间总是相互联系的,并且可以通过一定的数量关系反映出来。例如:教育需求量与居民收入水平之间,科研投入与科研产出之间等,都存在一定的依存关系。这些依存关系一般可分为函数关系和相关关系两类。整体分析与设计的内容二、概念了解二、概念了解u 相关分析概述相关分析概述 函数关系,是指事物或现象之间存在严格的依存关系。 其主要特征是它的确定性,即对于一个变量的每一个值,另一个变量都有唯一确定的值与之对应。这些对应关系,通常可用函数式y=f(x)确切

3、的表达出来。 相关关系,是变量间的某种不稳定、不精确的变化关系。 研究的事物或对象之间,存在一定的数量关系,即当一个或几个相互联系的变量取一定数值时,与之对应的另一个变量的值虽然不确定,但会按某种规律在一定的范围内变化。 相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一一对应的。例如,学习成绩与智力因素、各科学习成绩之间的关系、社会环境和人民健康的关系等。 复杂的社会系统中,各事物或现象之间的联系大多体现为相关关系,而不是函数关系,这主要是由于影响一个变量的因素很多,而其中一些因素还没有被人们所完全认识和掌握,或是处于已经认识但对其产生的影响还不能完全控制和测量。另外,有的

4、因素尽管可以控制和测量,但在操作中或多或少都会有误差,所有这些偶然因素的综合作用导致了变量之间的不确定性。整体分析与设计的内容u 相关分析概述相关分析概述二、概念了解二、概念了解2)相关关系的类型根据相关程度的不同:l 完全相关:当一种现象的数量变化完全由另一种现象的数量变化所确定时,这两种现象间的关系为完全相关。例如,在价格保持不变的情况下,某种商品的销售总额与其销售量之间的关系总是成正比-此时,相关关系就成了函数关系,因此,也可以说函数关系是相关关系的一个特例。l 不相关:如果两个现象之间互不影响,其数量变化各自独立,则称其为不相关现象。例如,一般而言学习成绩高低与天气变化是不相关的。l

5、不完全相关:若两种现象间的关系介于完全相关和不相关之间,则称其为不完全相关。通常我们看到的相关现象,都属于这种不完全相关。根据变量值变动方向的趋势:l 正相关:一个变量的数值增加或减少时,另一个变量的数值也随之增加或减少,两个变量变化方向相同。例如,技能水平随着练习次数的增加而提高。l 负相关:指两个变量的变化方向相反,与正相关恰好相反。例如,练习次数与遗忘量之间的关系。整体分析与设计的内容u 相关分析概述相关分析概述二、概念了解二、概念了解2)相关关系的类型根据变量关系的形态:l 直线相关:两个变量之间的增加或减少关系,近似的表现为一条直线,这种相关关系就称为直线相关。在散点图上可呈现为一条

6、直线的倾向。l 曲线相关:两个变量之间的增加或减少关系,是不均等的,不是线性的,而是近似的表现为一条曲线,这种相关关系就是曲线相关。在散点图上,可近似的呈现为弯月形。根据研究变量的多少:l 单相关:只是两个变量之间的相关关系,可成为单相关。l 复相关:一个变量与两个或两个以上的其他变量的相关关系,成为复相关。例如,研究人的营养与人的身高、体重之间的关系,学生的学习成绩与其学习动机、方法、习惯等方面的关系等,都属于复相关。整体分析与设计的内容u 相关分析概述相关分析概述二、概念了解二、概念了解3)相关分析 在数据处理中,一般将描述和分析两个或两个以上变量之间相关的性质及其相关程度的过程,成为相关

7、分析。 其主要目的是力求通过具体的数量描述,呈现研究变量之间的相互关系的密切程度及其变化规律,探求相互关系的研究模式,以利于统计预测和推断,为作出正确决策提供参考依据。相关分析的作用:l 判断变量之间有无联系。确定研究现象之间是否具有依存关系,这是相关分析的起点,也是我们研究各种现象之间相互关系的前提条件。因为,只有确定了依存关系的存在,才有继续研究和探索各种现象之间相互作用、制约以及变化规律的必要和价值。l 确定选择相关关系的表现形式及相关分析方法。确定了变量之间存在依存关系之后,就需要明确体现变量相互关系的具体表现形式了。-此时,需要选择恰当的相关分析方法,才能确保研究的目的实现,收到预期

8、的效果。否则,若把非线性相关误判为线性相关,则会导致错误的结论。l 把握相关关系的方向与密切程度。l 相关分析不但可描述变量间的关系,而且可用来预测。还可以用来评价测量量具的信度、效度及项目的区分度等。整体分析与设计的内容u 相关分析概述相关分析概述二、概念了解二、概念了解4)相关系数相关系数,是在直线条件下,说明两个变量之间相关程度及相关方向的统计分析指标。一般可通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用 表示。 相关系数范围:-11之间,常用小数表示,一般精确到小数点后两位 相关程度:用相关系数的绝对值表示。越接近1,表示相关程度越高;越接近0,说明相关程度越低

9、;等于1,则说明两者完全直线相关;等于0,则说明完全不相关。 几个注意事项l相关系数受变量取值区间大小及样本数目的影响比较大。一般而言,变量取值区间越大,样本数目越多,相关系数受抽样误差影响就越小,计算结果就越可靠;反之,计算结果则有可能是错误的。一般的,计算相关的成对数据的数目不应少于30对。整体分析与设计的内容u 相关分析概述相关分析概述二、概念了解二、概念了解4)相关系数几个注意事项l 来自不同群体且不同质的事物的相关系数不能进行比较。l 对于不同类型的数据,计算相关系数的方法也不相同。整体分析与设计的内容u 简单相关分析简单相关分析一、方法原理一、方法原理简单相关分析是研究两个变量之间

10、关联程度的统计方法,主要是通过计算简单相关系数来反映变量之间关系的强弱。一般有图形和数值两种表示方式。1)相关图 在统计中制作相关图,可以直观地判断事物现象之间大致上呈现何种关系的形式。相关图是相关分析的重要方法,利用直角坐标系第一象限,把第一个变量置于横轴上,第二个变量置于纵轴上,而将两个变量对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形,就是相关图。例如,通过观察散点图能够发现变量间的统计关系以及它们的强弱程度。 在SPSS中提供了四种散点图,分别是简单散点图(Simple)、重叠散点图(Overlay)、矩阵散点图(Matrix)和三维散点图(3-D)。2)相关系数虽然相

11、关图能够展现变量间的数量关系,但这也只是一种直观判断方法。为了更精确的用数据表达,则可以计算变量计算之间的相关系数。对不同类型的变量应当采取不同的相关系数来度量,常用的相关系数主要有以下几种:整体分析与设计的内容u 简单相关分析简单相关分析一、方法原理一、方法原理2)相关系数皮尔松(Pearson)相关系数 该系数常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量之间的线性相关关系。 注意:注意:Pearson系数适用于线性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关性的强弱。其计算公式如下:12211()()()()niiin

12、niiiixxyyrxxyy整体分析与设计的内容u 简单相关分析简单相关分析一、方法原理一、方法原理2)相关系数皮尔松(Pearson)相关系数取值范围 直线相关程度-|r|=0 完全不相关0|r|=0.3 微弱相关0.3|r|=0.5 低度相关0.5|r|=0.8 显著相关0.8|r|1 高度相关|r|=1 完全相关 整体分析与设计的内容u 简单相关分析简单相关分析一、方法原理一、方法原理2)相关系数斯皮尔曼(Spearman)等级相关系数(非参数相关系数) 该系数是用来度量顺序水准变量之间的线性相关关系,它是利用两变量的秩次大小做线性相关分析,适用条件如下:l两个变量的变量值是以等级次序表

13、示的资料l一个变量的变量值是等级数据,另一个变量的变量值是等差或等比数据,且其两总体不要求是正态分布,样本容量不一定大于30. 可以看出,等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求,但计算精度不高。其基本公式如下:2261(1)RDrn n 两个变量每对数据等级之差整体分析与设计的内容u 简单相关分析简单相关分析一、方法原理一、方法原理2)相关系数肯德尔(Kendall)等级相关系数(非参数相关系数)它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。这种指标采用非参数检验方法测度变量间的相关关系。它利用变量的秩计算一致对数目和非一致

14、对数目。如果两变量具有较强的正相关性,则一致对数目U应较大;若两变量相关性弱,则一致对数目U和非一致对数目V应大致相等。其公式如下:2()(1)UVn n整体分析与设计的内容u 简单相关分析简单相关分析二、操作二、操作实践数据:“股票指数间的关系.sav”菜单:“分析相关双变量”选入两个或两个以上变量与前面所讲述的系数一致。其中,对于非等间距测度的连续变量,因为分布不明,可以使用等级相关分析,也可使用Pearson相关分析;对于完全等级的离散变量,必须使用等级相关分析其相关性。当资料不服从双变量正态分布、总体分布类型未知或原始数据是用等级表示时候,宜用Spearman或Kendall相关分析。

15、双尾检验和单尾检验。单尾检验和双尾检验的区别在于他们拒绝H0的标准。单尾检验允许你在差异相对较小时拒绝H0,这个差异被规定了方向。另一方面,双尾检验需要相对较大的差异,这个差异不依赖于方向。 显著水平0.01下,相关系数带两个星号(*);显著水平0.05下,一个星号(*)整体分析与设计的内容u 简单相关分析简单相关分析二、操作二、操作选项对话框:输出反映选中的每一对变量之间的叉积离差矩阵和协方差矩阵。整体分析与设计的内容u 简单相关分析简单相关分析三、输出结果三、输出结果Pearson系数高达0.995,其概率P值则明显小于显著性水平0.01,说明两者高度正相关。相关系数都小于Pearson系

16、数,这是由于秩变换或数据按有序分类处理时损失信息所导致的。整体分析与设计的内容u 简单相关分析简单相关分析四、制图方法四、制图方法选简单散点图。整体分析与设计的内容u 简单相关分析简单相关分析四、制图方法四、制图方法选简单分布整体分析与设计的内容u 偏相关分析偏相关分析一、方法原理一、方法原理 简单相关分析是计算两个变量之间的相互关系,分析两个变量间线性相关的程度。 但是,在现实中事物之间的联系可能存在于多个主体之间,因此,往往因为第三个变量的作用使得相关系数不能真实地反映两个变量间的线性相关程度。例如,身高、体重和肺活量之间的关系。 偏相关分析就是在研究两个变量之间的线性相关关系时,控制可能

17、对其产生影响的变量。 偏相关分析是在相关分析的基础上,考虑了两个因素以外的各种作用,或者说是在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。这种方法的目的就在于消除其他变量关联性的传递效应。 偏相关分析在计算时,可首先分别计算三个因素之间的相关系数,然后通过三个简单相关系数来计算偏相关系数,公式如下:1213 2312(3)22132311rr rrrr整体分析与设计的内容u 偏相关分析偏相关分析二、操作二、操作实践数据:“股票市场和债券市场.sav”菜单:“分析相关偏相关”选入两个或两个以上变量,作为检验变量至少选入一个变量,作为进行偏相关分析时需要控制的变量。如果不选入控

18、制变量,则进行的是简单相关分析。输出显示零阶相关矩阵,即Pearson相关矩阵整体分析与设计的内容u 偏相关分析偏相关分析三、输出结果三、输出结果0.411和0.419.说明这两个市场和股市关联性差异不明显。0.922说明银行和交易所市场的相关系数较高。但是,就相关系数本身而言,未必是两事务间线性关系强弱的真实体现,往往有夸大趋势。因为,这个Pearson系数在计算时,没考虑第三方因素的影响。 这里的三个市场,肯定是相互关联的,两个市场关系的强弱,肯定受第三方的影响制约,市场间的关系强弱可能存在传递效应,用偏相关分析比较恰当。控制银行因素,股市和交易所 的 偏 相 关 系 数 下 降 到0.0

19、70,波动幅度显著。整体分析与设计的内容u 偏相关分析偏相关分析三、输出结果三、输出结果控制交易所因素,股市和银行 的 偏 相 关 系 数 下 降 到0.114,波动幅度显著。控制股票因素,交易所和银行的偏相关系数为0.906,波动影响小,仍然密切相关。受股市影响小。整体分析与设计的内容u 距离分析距离分析一、方法原理一、方法原理 简单相关分析和偏相关分析有一个共同点,那就是对所分析的数据背景有一定程度的了解。 但在实际中,在分析前对数据所代表的专业背景知识尚未充分把握,本身就属于探索性研究,此时就需要先对各个指标或实例的差异性、相似程度进行考察,先对数据有一个初步了解,然后再根据结果考虑如何深入分析。 距离分析是对观测量或变量之间相似或不相似程度的一种测度,是计算一对变量或一对观测量之间的广义距离。根据变量的不同类型,可以有许多距离、相似程度测量指标供用户选择,但

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论