第8章SPSS的相关分析_第1页
第8章SPSS的相关分析_第2页
第8章SPSS的相关分析_第3页
第8章SPSS的相关分析_第4页
第8章SPSS的相关分析_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第8章 SPSS相关分析 8.1 相关分析 8.2 绘制散点图 8.3 计算相关系数 8.4 偏相关分析学习目标和内容:明确相关关系的含义以及相关分析的主要目标熟练掌握绘制散点图的具体操作理解pearson简单相关系数、 spearman等级相关系数, kendall相关系数,并掌握计算操作,能够读懂分析结果理解偏相关分析的主要目标以及与相关分析的关系,熟练掌握其操作,能够读懂分析结果8.1 相关分析v8.1.1 8.1.1 函数关系与统计关系函数关系与统计关系v 客观事物之间的关系大致可分为两大类关系:客观事物之间的关系大致可分为两大类关系:v(1 1)函数关系)函数关系:当一个或几个变量取

2、一定的当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。们称这种关系为确定性的函数关系。v(2 2)统计)统计(相关)(相关)关系关系:两事物之间的一种:两事物之间的一种非一一对应的关系,即当一个变量非一一对应的关系,即当一个变量x x取一定值取一定值时,另一变量时,另一变量y y无法依确定的函数取唯一确定无法依确定的函数取唯一确定的值。的值。v8.1.2统计统计(相关)(相关)关系分类关系分类v 统计统计(相关)(相关)关系可再进一步分为:关系可再进一步分为:v (1 1)线性相关:)线性相关:当一个变量的值发

3、生变化时,当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。在直角坐另外的一个变量也发生大致相同的变化。在直角坐标系中,若现象观察值的分布大致在一条直线上,标系中,若现象观察值的分布大致在一条直线上,则现象之间的相关关系为线性相关或直线相关则现象之间的相关关系为线性相关或直线相关(Linear correlationLinear correlation)。)。v (2 2)非线性相关:)非线性相关:如果一个变量发生变动,如果一个变量发生变动,另外的变量也随之变动,但是,其观察值分布近似另外的变量也随之变动,但是,其观察值分布近似的在一条曲线上,则变量之间的相关关系为非线性的在一条曲

4、线上,则变量之间的相关关系为非线性相关或曲线相关(相关或曲线相关(Curvilinear correlationCurvilinear correlation) v8.1.3 线性相关分类线性相关分类v 线性相关可以分为:线性相关可以分为:v (1)正线性相关:)正线性相关:两个变量线性的相随变动方两个变量线性的相随变动方向相同。向相同。v (2)负线性相关:)负线性相关:两个变量线性的相随变动两个变量线性的相随变动方向相反。方向相反。v (3)零线性相关(无线性相关)零线性相关(无线性相关)相关系数相关系数(取值及其意义取值及其意义)v8.1.4 相关分析相关分析v 如果仅仅研究变量之间的相

5、互关系的密切程如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。这就是度和变化趋势,并用适当的统计指标描述。这就是相关分析相关分析。v 如果要把变量间相互关系用函数表达出来,如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值,用一个或多个变量的取值来估计另一个变量的取值,这就是这就是回归分析回归分析。v 绘制散点图和计算相关系数是相关分析最常绘制散点图和计算相关系数是相关分析最常用的工具,它们的相互结合能够达到较为理想的分用的工具,它们的相互结合能够达到较为理想的分析效果。析效果。8.2 绘制散点图绘制散点图v8.2.1 散点图的特点散

6、点图的特点v 散点图:散点图:是将数据以点的形式画在直角坐标是将数据以点的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相系上,通过观察散点图能够直观的发现变量间的相关关系及它们的强弱程度和方向。关关系及它们的强弱程度和方向。v 在实际分析中,散点图经常表现出某些特定在实际分析中,散点图经常表现出某些特定的形式。如的形式。如 “橄榄球橄榄球”、“棒状棒状”,。通常,。通常“橄榄橄榄球球”和和“棒状棒状”代表了数据对的主要结构和特征,代表了数据对的主要结构和特征,可以利用曲线将这种主要结构的轮廓描绘出来,使可以利用曲线将这种主要结构的轮廓描绘出来,使数据的主要特征更突出。数据的主要特

7、征更突出。r=1r=0.70.8r=0r=0r=-0.7 -0.8r=-1完全正线性相关正线性相关无线性相关完全负线性相关负线性相关非线性相关-3-2-1012-2-1012(a)xy-2-1012-2-1012(b)xy-2-1012-2-1012(c)xy-3-2-1012302468(d)xy不相关不相关 正线性相关正线性相关 负线性相关负线性相关 相关但非线性相关相关但非线性相关 8.2.2 散点图应用举例v案例:案例:v 利用住房状况问卷调查数据,分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。(数据:住房状况调查.sav)v操作:操作:【图形(Graps)】v 【散点图(S

8、catter)】一、简单散点图一、简单散点图v表示一对变量间统计关系的散点图v将纵轴变量选入【Y 轴】v将横轴变量选入【X轴】v将分组变量选入【设置标记】:用该变量分组,并在一张图上用不同颜色绘制若干个散点图v将标记变量选入【标注个案】:将标记变量的各变量值标记在散点图相应点的旁边。问题:分析“家庭收入”和“计划面积”之间存在怎样的统计关系(住房状况调查)(一)直接绘图v【graphs】【legacy dialogs】【scatter/dot】,选简单散点图【simple scatter】v指定纵轴变量“计划面积” 入【Y Axis】, 横轴变量“家庭收入”入【X Axis】。图示一图示二(图

9、中可以辨认两变量有某种统计关系):(二)交互法绘制散点图v在【graphs】中选交互建图【chart builder】,然后在【gallery】中选【scatter/dot】,v拖动简单的散点图sample scatter图标到绘图区域,再拖动相关变量到X、Y轴区域。(三)图形进一步编辑合并数据点,简化图形u在散点图上双击鼠标,选【options】下的【bin element】进行数据点合并,大圆圈代表周围的数据点密集(四)图形进一步编辑添加辅助回归线u双击图形后,选择【elements】下的【fit line at total】,这里选择线性回归linear。其它quadratic为二项式回

10、归,cubic为三项式回归图示三(大圆圈周围表示数据较密集)图示四(添加线性回归辅助线)二、重叠散点图二、重叠散点图overlay scatter(略)(略)表示多对变量间统计关系的散点图三、矩阵散点图三、矩阵散点图matrix 矩阵散点图以方形矩阵的形式分别显示多对变量间的统计关系。关键是弄清各矩阵单元中的横纵坐标变量。问题:显示家庭收入、人均面积、购房价位,三个变量间的矩阵散点图(住房状况调查)【graphs】【legacy dialogs】【scatter/dot】,选矩阵散点图【matrix scatter】指定家庭收入、人均面积、购房价位到【matrix variables】框中图示

11、五(矩阵散点图存在相关联系)四、三维散点图(四、三维散点图(3-D scatter) 以立体图形的形式显示三对变量间的统计关系。问题:显现家庭收入、计划面积、户口状况的三维散点图(住房状况调查)【graphs】【legacy dialogs】【scatter/dot】,选三维散点图【3-D scatter】指定“家庭收入”入【X Axis】,“计划面积”入 【Y Axis】,“户口状况” 入【Z Axis】。图示六(三维散点图)8.3 计算相关系数8.3.1 相关系数的特点相关系数的特点v相关系数以数值的方式精确地反映两个变量相关系数以数值的方式精确地反映两个变量间线性相关的强弱程度。间线性相

12、关的强弱程度。v 利用相关系数进行变量间线性关系的分析通利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:常需要完成以下两个步骤:1.计算计算样本样本相关系数相关系数r;相关系数相关系数r的取值在的取值在-1+1之间之间r0表示两变量存在正的线性相关关系;表示两变量存在正的线性相关关系;r0.8表示两变量有较强的线性关系;表示两变量有较强的线性关系; |r|0.3表示两变量之间的线性关系较弱表示两变量之间的线性关系较弱相关系数相关系数(取值及其意义取值及其意义)2.对样本来自的对样本来自的两总体两总体是否存在显著的线性关系进行是否存在显著的线性关系进行推断。推断。 假设检验假设检验

13、基本步骤基本步骤是:是:(1)提出原假设,即两总体无显著的线性关系。)提出原假设,即两总体无显著的线性关系。(2)选择检验统计量,即不同的相关系数。)选择检验统计量,即不同的相关系数。(3)计算检验统计量的观测值和对应的概率值。)计算检验统计量的观测值和对应的概率值。(4)决策:)决策:p与与a的关系。的关系。 pa,不能拒绝原假设,两总体存在零相关。,不能拒绝原假设,两总体存在零相关。8.3.2 相关系数的种类v 对不同类型的变量应采用不同的相关系数来度对不同类型的变量应采用不同的相关系数来度量,常用的相关系数主要有量,常用的相关系数主要有Pearson简单相关系数、简单相关系数、Spear

14、man等级相关系数和等级相关系数和Kendall 相关系数等。相关系数等。v 1.Pearson简单相关系数(适用于两个变量都简单相关系数(适用于两个变量都是数值型的数据)是数值型的数据)v Pearson简单相关系数的检验统计量为:简单相关系数的检验统计量为:nininiiixyyyxxyxRiiyx11221)()()()2(122ntrnrt 2 Spearman等级相关系数vSpearman等级相关系数用来度量定序变量间的等级相关系数用来度量定序变量间的线性相关关系,线性相关关系,v设计思想与设计思想与Pearson简单相关系数相同,只是数简单相关系数相同,只是数据为非定距的,故计算时

15、并不直接采用原始数据为非定距的,故计算时并不直接采用原始数据据 ,而是利用数据的秩,用两变量的秩,而是利用数据的秩,用两变量的秩 代替代替 代入代入Pearson简单相关系数计算公式简单相关系数计算公式v于是其中的于是其中的 和和 的取值范围被限制在的取值范围被限制在1和和n之间,之间,且可被简化为:且可被简化为:(,)iixy(,)iixy(,)iiU Vixiy222i21161()(1)nniiiiiDrDUVn n ,其中v如果两变量的正相关性较强,它们秩的变化具有如果两变量的正相关性较强,它们秩的变化具有同步性,于是同步性,于是 的值较小,的值较小,r趋向于趋向于1;v如果两变量的正

16、相关性较弱,它们秩的变化不具如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是有同步性,于是 的值较大,的值较大,r趋向于趋向于0;v小样本下,在零假设成立时,小样本下,在零假设成立时, Spearman等级相等级相关系数服从关系数服从Spearman分布;分布;v在大样本下,在大样本下, Spearman等级相关系数的检验统等级相关系数的检验统计量为计量为Z统计量,定义为统计量,定义为vZ统计量近似服从标准正态分布。统计量近似服从标准正态分布。22i11()nniiiiDUV1Zr n22i11()nniiiiDUV 3.Kendall 相关系数v(1)用非参数检验方法度量定序变量间的

17、线性相)用非参数检验方法度量定序变量间的线性相关关系关关系v(2)利用变量秩数据计算一致对数目和非一致对)利用变量秩数据计算一致对数目和非一致对数目。数目。v 当两个变量具有较强的正相关关系,则一致对当两个变量具有较强的正相关关系,则一致对数目较大,非一致对数目较小,数目较大,非一致对数目较小,v 当两个变量具有较强的负相关关系,则一致对当两个变量具有较强的负相关关系,则一致对数目较小,非一致对数目较大,数目较小,非一致对数目较大,v 当两个变量相关性较弱,则一致对数目和非一当两个变量相关性较弱,则一致对数目和非一致对数目大致相等,致对数目大致相等,vKendall 相关系数相关系数v 在小样

18、本下,在小样本下,Kendall相关系数服从相关系数服从Kendall分布;在大样本下,分布;在大样本下, Kendall相关系相关系数的检验统计量为数的检验统计量为Z统计量,定义为:统计量,定义为: v vZ统计量近似服从标准正态分布。统计量近似服从标准正态分布。非一致对数目,一致对数目,VUnnVU)1(2)()52(2) 1(9nnnZ8.3.3 计算相关系数的应用举例v 对于案例8-1,通过绘制散点图得知家庭收入与计划购买的住房面积之间存在一定的正的弱相关关系,为更确定地反映两者之间线性关系的强弱,采用计算相关系数的方法。由于这两个变量为定距变量,故采用Pearson相关系数。v 【分

19、析(Analyze)】v 【相关(correlate)】v 【两变量 (bivariate)】8.4 偏相关分析v8.4.1 偏相关分析和偏相关系数偏相关分析和偏相关系数v (1)简单相关系数研究两变量间线性相关性,若)简单相关系数研究两变量间线性相关性,若还存在其他因素影响,其往往夸大变量间的相关性,还存在其他因素影响,其往往夸大变量间的相关性,不是两变量间线性相关强弱的真实体现。不是两变量间线性相关强弱的真实体现。v 例如,研究商品的需求量、价格和消费者收入之例如,研究商品的需求量、价格和消费者收入之间的线性关系时,需求量和价格的相关关系实际还包间的线性关系时,需求量和价格的相关关系实际还

20、包含了消费者收入对价格和商品需求量的影响。此时,含了消费者收入对价格和商品需求量的影响。此时,单纯利用简单相关系数来评价变量间的相关性是不准单纯利用简单相关系数来评价变量间的相关性是不准确的,需要在剔除其他相关因素影响的条件下计算变确的,需要在剔除其他相关因素影响的条件下计算变量间的相关关系。偏相关的意义就在于此量间的相关关系。偏相关的意义就在于此。v (2)偏相关分析也称净相关分析,它在控制其)偏相关分析也称净相关分析,它在控制其他变量线性影响的条件下分析两变量间的线性关系,他变量线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。所采用的工具是偏相关系数。v (3)控制变量个数为)控制变量个数为1时,偏相关系数称一阶偏时,偏相关系数称一阶偏相关系数;当控制两个变量时,偏相关系数称为二相关系数;当控制两个变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论