SPSS相关性分析实用教案_第1页
SPSS相关性分析实用教案_第2页
SPSS相关性分析实用教案_第3页
SPSS相关性分析实用教案_第4页
SPSS相关性分析实用教案_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、什么是相关(xinggun)分析 相关分析是分析客观事物之间相关性的数量分析方法。许多事物或现象(xinxing)之间总是相互联系的,并且可以通过一定的数量关系反映出来。 函数关系:两事物之间一对一的关系。 统计关系:两事物之间的多对一和一对多。 第1页/共25页第一页,共26页。 统计关系还可以分为: (1)线性相关:当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。在直角坐标系中,如现象观察值的分布(fnb)大致在一条直线上,则现象之间的相关关系为线性相关或直线相关(Linear correlation)。 (2)非线性相关:如果一个变量发生变动,另外的变量也随之变动,但是,其

2、观察值分布(fnb)近似的在一条曲线上,则变量之间的相关关系为非线性相关或曲线相关(Curvilinear correlation)第2页/共25页第二页,共26页。相关(xinggun)关系的种类 相关关系的种类:是否(sh fu)线性 线性相关 正相关 负相关 曲线相关 相关关系的种类:据变量的度量类型 定类变量和定类变量之间的相关 定序变量和定序变量之间的相关 定距变量和定距变量之间的相关 第3页/共25页第三页,共26页。相关关系(gun x)的种类 相关关系的种类:是否线性 线性相关 正相关 负相关 曲线相关 相关关系的种类:据变量的度量(dling)类型 定类变量和定类变量之间的相

3、关 定序变量和定序变量之间的相关 定距变量和定距变量之间的相关 第4页/共25页第四页,共26页。定类变量(binling) 定序变量(binling) 定距变量(binling) 定类变量 变量的一种,根据定性的原则区分总体各个案类别的变量。定类变量的值只能把研究对象分类,也即只能决定研究对象是同类抑或不同类,具有与的数学性质。例如性别区分为男性和女性两类 定序变量 变量的一种,区别同一类别个案中等级次序的变量。定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有与的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(,)。例如文化程度可以分为大学、高中

4、、初中、小学、文盲。 定距变量 也是变量的一种,区别同一类别个案中等级次序及其距离( jl)的变量。它除了包括定序变量的特性外,还能确切测量同一类别各个案高低、大小次序之间的距离( jl),因而具有加与减的数学特质。但是,定距变量没有一个真正的零点。第5页/共25页第五页,共26页。相关分析(fnx)的作用 判断(pndun)变量之间有无联系 确定相关关系的表现形式及相关分析方法 把握相关关系的方向与密切程度 为进一步采取其他统计方法进行分析提供依据 用来进行预测 第6页/共25页第六页,共26页。相关分析和回归(hugu)分析区别 相关分析:如果仅仅研究变量之间的相互(xingh)关系的密切

5、程度和变化趋势,并用适当的统计指标描述。 回归分析:如果要把变量间相互(xingh)关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值。第7页/共25页第七页,共26页。散点图 通过(tnggu)观察散点图能够直观的发现变量之间的统计关系 以及它们的强弱程度和数据对的可能走向。散点图以横轴表示两个变量中的一个变量,以纵轴表示另一个变量,将两个变量之间相对应的变量值以坐标点的形式逐一标在直角坐标系中,通过(tnggu)点的分布形状、分布模式和疏密程度来形象描述两个变量之间的相关关系。 第8页/共25页第八页,共26页。 矩阵(j zhn)散点图:以矩阵(j zhn)的形式在多个坐标

6、轴上分别显示多对变量间的统计关系。变量在那一行,那一行横坐标就是它。第9页/共25页第九页,共26页。线性相关的度量尺度(chd)数据间的相关性的度量 Pearson相关系数 相关系数的数值范围是介于1与 +1之间: 如果|r| 0,表明两个变量没有线性相关关系。 如果|r| 1 ,则表示两个变量完全直线相关。线性相关的方向通过(tnggu)相关系数的符号来表示,“+”号表示正相关,“”表示负相关。02201()()()()niiinniiiixxyyrxxyy第10页/共25页第十页,共26页。 相关系数为0或接近于0不能说明两个变量之间没有相关性,它只说明没有线性相关性。不能排除具有(jy

7、u)其它非线性关系。 Pearson 相关系数是一种线性关联度量。如果两个变量关系密切,但其关系不是线性的,则 Pearson 相关系数就不是适合度量其相关性的统计量。第11页/共25页第十一页,共26页。等级相关(xinggun)分析 等级相关分析 等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。主要(zhyo)包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。第12页/共25页第十二页,共26页。Spearman等级相关系数定序变量(binling)之间的相关性的度量 斯皮尔曼等级相关系数: 两个变量为定序变量。 一个变量为定序变量,另一个变量为尺度数据,且两总体不是正态分

8、布,样本容量n不一定大于30。 数据的秩:秩rank,是一种数据排序的方式,可以知道某变量值在该列所有值中的名次。秩是对应数值由大到小的,例如有100个数据都不一样的话,最大的数值对应的秩就是100,最小的就是1。有重复(chngf)数据时候,会按同名称排列。第13页/共25页第十三页,共26页。 设D是两个(lin )变量每对数据的等级差,n是样本量。 则Spearman相关系数为:21261(1)niiDrnn2210()nniiiiiDUV第14页/共25页第十四页,共26页。Kendall的tau-b(K) Kendall的 系数是另一种计算定序变量之间或者定序和尺度变量之间相关系数的

9、方法。Spearman的等级(dngj)相关系数可以方便检验两个定序变量是否相关,但是很难具体解释两个变量如何相关及相关程度。Kendall的等级(dngj)相关系数可以同时反映两个变量的相关程度。第15页/共25页第十五页,共26页。 设样本量为n,考察两个变量X和Y之间的相关(xinggun)关系,X和Y的取值记为xi,yi。所有像(xi,yi)对的个数为n(n-1)/2(也就是 )。和分别表示和的秩次,如果对于任意k,有我们称(xk,yk)为同序对;否则,称为逆序对。 总的同序对的个数记为U,逆序对的个数记为V,则Kendall的Tau系数的定义为: 2()( 1 )U Vnn2nC2n

10、C第16页/共25页第十六页,共26页。偏相关分析(fnx) 概念:当有多个变量存在时,为了研究任何(rnh)两个变量之间的关系,而使与这两个变量有联系的其它变量都保持不变。即控制了其它一个或多个变量的影响下,计算两个变量的相关性。 偏相关系数:偏相关系数是用来衡量任何(rnh)两个变量之间的关系的大小。 自由度:在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。第17页/共25页第十七页,共26页。回归(hugu)分析 一元(y yun)线性回归模型: 其中x为自变量

11、;y为因变量; 为截距,即常量; 为回归系数,表明自变量对因变量的影响程度。xy1001第18页/共25页第十八页,共26页。 用最小二乘法求解方程中的两个参数(cnsh),得到21)()(xxyyxxiiixby 0第19页/共25页第十九页,共26页。回归方程统计(tngj)检验 回归(hugu)方程的拟合优度:回归(hugu)直线与各观测点的接近程度称为回归(hugu)方程的拟合优度,也就是样本观测值聚集在回归(hugu)线周围的紧密程度 。 当自变量是分类变量时,需要将原变量转换成虚拟变量,所有虚拟变量都是 “1”和“0”取值的二分变量。(例如性别变量)第20页/共25页第二十页,共2

12、6页。回归方程的统计(tngj)检验 即:总离差平方和(SST)=剩余离差平方和(SST) +回归(hugu)离差平方和(SSR)其中;SSR是由x和y的直线回归(hugu)关系引起的,可以由回归(hugu)直线做出解释;SSE是除了x对y的线性影响之外的随机因素所引起的Y的变动,是回归(hugu)直线所不能解释的。222yyyyyy第21页/共25页第二十一页,共26页。残差分析(fnx) 残差是指由回归方程计算得到的预测值与实际样本值之间的差距,定义为: 对于线性回归分析(fnx)来讲,如果方程能够较好的反映被解释变量的特征和规律性,那么残差序列中应不包含明显的规律性。残差分析(fnx)包

13、括以下内容:残差服从正态分布,其平均值等于0;残差取值与X的取值无关;残差不存在自相关;残差方差相等。 ).(22110ppiiiixxxyyye第22页/共25页第二十二页,共26页。 对于残差均值和方差齐性检验可以利用残差图进行分析。如果残差均值为零,残差图的点应该在纵坐标为0的中心的带状区域中随机散落(snlu)。如果残差的方差随着解释变量值(或被解释变量值)的增加呈有规律的变化趋势,则出现了异方差现象。 DW检验: DW检验用来检验残差的自相关。检验统计量为 DW=2表示无自相关,在0-2之间说明存在正自相关,在2-4之间说明存在负的自相关。一般情况下,DW值在1.5-2.5之间即可说明无自相关现象。)1 (2)(22221nttnttteeeDW第23页/共25页第二十三页,共26页。曲线(qxin)估计 变量之间的关系分为本质线性关系和本质非线性关系。本质线性关系是通过(tnggu)变量变换可以转化为线性相关的。 SPSS曲线估计还可以以时间为解析变量。第24页/共25页第二十四页,共26页。谢谢您的观看(gunkn)!第25页/共25页第二十五页,共26页。NoIm

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论