




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第8 8章章 SPSSSPSS的相关分析的相关分析8.1 8.1 相关分析相关分析8.1.1 8.1.1 统计关系与函数关系统计关系与函数关系客观事物之间的关系大致可分为两大类关系:客观事物之间的关系大致可分为两大类关系:(1 1)函数关系函数关系:当一个或几个变量取一定的值当一个或几个变量取一定的值时,另一个变量有时,另一个变量有确定值与之相对应确定值与之相对应,我们称这,我们称这种关系为确定性的种关系为确定性的函数关系函数关系。(2 2)统计关系统计关系:两事物之间的一种:两事物之间的一种非一一对应非一一对应的关系,即当一个变量的关系,即当一个变量x x取一定值时,另一变量取一定值时,另
2、一变量y y无法依确定的函数取唯一确定的值。无法依确定的函数取唯一确定的值。8.1.2 8.1.2 线性相关和非线性相关线性相关和非线性相关统计关系可再进一步分为:统计关系可再进一步分为:(1 1)线性相关线性相关:当一个变量的值发生变化时,另:当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。在直角坐外的一个变量也发生大致相同的变化。在直角坐标系中,如现象观察值的分布大致在一条标系中,如现象观察值的分布大致在一条直线直线上。上。(2 2)非线性相关非线性相关:如果一个变量发生变动,另外:如果一个变量发生变动,另外的变量也随之变动,但是,其观察值分布近似的的变量也随之变动,但是,其
3、观察值分布近似的在一条在一条曲线曲线上,则变量之间的相关关系为非线性上,则变量之间的相关关系为非线性相关或曲线相关相关或曲线相关8.1.3 8.1.3 正线性相关与负线性相关正线性相关与负线性相关线性相关可以分为:线性相关可以分为:(1 1)正线性相关正线性相关:两个变量线性的相随变动方向:两个变量线性的相随变动方向相同。相同。(2 2)负线性相关负线性相关:两个变量线性的相随变动方向:两个变量线性的相随变动方向相反。相反。8.1.4 8.1.4 相关分析相关分析相关分析相关分析:如果仅仅研究变量之间的相互关系的密切:如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的程度和变化趋势
4、,并用适当的统计指标描述统计指标描述。回归分析回归分析:如果要把变量间相互关系用:如果要把变量间相互关系用函数表达函数表达出出来,用一个或多个变量的取值来来,用一个或多个变量的取值来估计估计另一个变量的取另一个变量的取值。值。绘制散点图绘制散点图和计算和计算相关系数相关系数是相关分析最常用的工是相关分析最常用的工具,它们的相互结合能够达到具,它们的相互结合能够达到较为理想较为理想的的分析效果分析效果。8.2 8.2 绘制散点图绘制散点图8.2.1 8.2.1 散点图的特点散点图的特点 散点图散点图:是将数据以点的形式画在直角坐标系上,通:是将数据以点的形式画在直角坐标系上,通过观察散点图能够直
5、观的发现变量间的相关关系及它过观察散点图能够直观的发现变量间的相关关系及它们的强弱程度和方向。们的强弱程度和方向。 在实际分析中,在实际分析中,散点图散点图经常表现出某些特定的形式。经常表现出某些特定的形式。如绝大多数的数据类似于如绝大多数的数据类似于“橄榄球橄榄球”的形状,或集中的形状,或集中形成一根形成一根“棒状棒状”,而剩余的少数数据点则零散地分,而剩余的少数数据点则零散地分布在四周。通常布在四周。通常“橄榄球橄榄球”和和“棒状棒状”代表了代表了数据对数据对的主要结构和特征,可以利用的主要结构和特征,可以利用曲线曲线将这种主要结构的将这种主要结构的轮廓描绘出来,是数据的主要特征更突出。轮
6、廓描绘出来,是数据的主要特征更突出。r=1r=0.70.8r=0r=0r=-0.7 -0.8r=-1完全正相关正相关无相关完全负相关负相关无相关8.2.2 8.2.2 散点图应用举例散点图应用举例案例:案例: 利用住房状况问卷调查数据,分析家庭收入与打算利用住房状况问卷调查数据,分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。购买的住房面积之间存在怎样的统计关系。 (数据:住房状况调查数据:住房状况调查.sav.sav)操作:操作:【图形(图形(GrapsGraps)】 【散点图(散点图(ScatterScatter)】简单散点图简单散点图表示一对变量间统计关系的散点图表示一对变量间统
7、计关系的散点图将纵轴变量选入将纵轴变量选入【Y Y 轴轴】,将横轴变量选入将横轴变量选入【X X轴轴】,将分组变量选入将分组变量选入【设置标记设置标记】: :用该变量分组,用该变量分组,并在一张图上用不同颜色绘制若干个散点图。并在一张图上用不同颜色绘制若干个散点图。将标记变量选入将标记变量选入【标注个案标注个案】:将标记变量的:将标记变量的各变量值标记在散点图相应点的旁边。各变量值标记在散点图相应点的旁边。8.3 8.3 计算相关系数计算相关系数8.3.1 8.3.1 相关系数的特点相关系数的特点 利用利用相关系数相关系数进行变量间线性关系的分析通常需要完成以下两个进行变量间线性关系的分析通常
8、需要完成以下两个步骤:步骤: 1.1.计算计算样本样本相关系数相关系数r r: 相关系数相关系数r r的取值在的取值在 -1-1+1+1 之间之间 r0r0表示两变量存在正的线性相关关系;表示两变量存在正的线性相关关系; r0r0.8|r|0.8表示两变量有较强的线性关系;表示两变量有较强的线性关系; |r|0.3|r|0.3表示两变量有较弱的线性关系。表示两变量有较弱的线性关系。 2.2.对样本来自的对样本来自的两总体两总体是否存在显著的线性关系进行推断。是否存在显著的线性关系进行推断。 由于存在由于存在随机抽样和样本数量较少随机抽样和样本数量较少等原因,通常样本相等原因,通常样本相关系数不
9、能直接用来说明样本来自的总体是否具有显著的关系数不能直接用来说明样本来自的总体是否具有显著的线性相关性线性相关性,而需要通过,而需要通过假设检验假设检验的方式对样本来自的总的方式对样本来自的总体是否存在显著的线性相关关系进行统计推断。基本步骤体是否存在显著的线性相关关系进行统计推断。基本步骤是:是: (1 1)提出原假设,即两总体无显著的线性关系。)提出原假设,即两总体无显著的线性关系。 (2 2)选择检验统计量,即不同的相关系数。)选择检验统计量,即不同的相关系数。 (3 3)计算检验统计量的观测值和对应的概率值。)计算检验统计量的观测值和对应的概率值。 (4 4)决策:)决策:p p与与a
10、 a的关系。的关系。8.3.2 8.3.2 相关系数的种类相关系数的种类 对不同类型的变量应采用不同的相关系数来度量,对不同类型的变量应采用不同的相关系数来度量,常用的常用的相关系数相关系数主要有:主要有:PearsonPearson (皮尔逊皮尔逊)简单相关系数)简单相关系数SpearmanSpearman (斯皮尔曼斯皮尔曼)等级相关系数)等级相关系数Kendall Kendall (肯德尔肯德尔)相关系数等。)相关系数等。1.1.PearsonPearson简单相关系数简单相关系数 适用于两个变量都是适用于两个变量都是数值型数值型的数据的数据 PearsonPearson简单相关系数的检
11、验统计量为:简单相关系数的检验统计量为:nininiiixyyyxxyxRiiyx11221)()()()2(122ntrnrt 2 2 SPEARMANSPEARMAN等级相关系数等级相关系数SpearmanSpearman等级相关系数用来度量等级相关系数用来度量定序变量定序变量间的线性相关间的线性相关关系,关系,设计思想与设计思想与PearsonPearson简单相关系数相同,只是数据为非定距简单相关系数相同,只是数据为非定距的,故计算时并不直接采用原始数据的,故计算时并不直接采用原始数据 ,而是利用数据的,而是利用数据的秩,用两变量的秩秩,用两变量的秩 代替代替 代入代入PearsonP
12、earson简单相关简单相关系数计算公式;系数计算公式;于是其中的于是其中的 和和 的取值范围被限制在的取值范围被限制在1 1和和n n之间,且可被之间,且可被简化为:简化为:(,)iix y( ,)iix y(,)iiU Vixiy222i21161()(1)nniiiiiDrDUVn n ,其中如果两变量的正相关性较强,它们秩的变化具有同步性,如果两变量的正相关性较强,它们秩的变化具有同步性,于是于是 的值较小,的值较小,r r趋向于趋向于1 1;如果两变量的正相关性较弱,它们秩的变化不具有同步如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是性,于是 的值较大,的值较大,r r趋向
13、于趋向于0 0;小样本下,在零假设成立时,小样本下,在零假设成立时, SpearmanSpearman等级相关系数等级相关系数服从服从SpearmanSpearman分布;分布;在大样本下,在大样本下, SpearmanSpearman等级相关系数的检验统计量为等级相关系数的检验统计量为Z Z统计量,定义为统计量,定义为Z Z统计量近似服从标准正态分布。统计量近似服从标准正态分布。22i11()nniiiiDUV1Zr n22i11()nniiiiDUV 3.KENDALL 3.KENDALL 相关系数相关系数(1 1)用非参数检验方法度量)用非参数检验方法度量定序变量定序变量间的线性相关关间
14、的线性相关关系系(2 2)利用变量秩数据计算一致对数目和非一致对数目。)利用变量秩数据计算一致对数目和非一致对数目。 当两个变量具有较强的正相关关系,则一致对数目当两个变量具有较强的正相关关系,则一致对数目较大,非一致对数目较小,较大,非一致对数目较小, 当两个变量具有较强的负相关关系,则一致对数目当两个变量具有较强的负相关关系,则一致对数目较小,非一致对数目较大,较小,非一致对数目较大, 当两个变量相关性较弱,则一致对数目和非一致对当两个变量相关性较弱,则一致对数目和非一致对数目大致相等,数目大致相等,KENDALL KENDALL 相关系数相关系数 在小样本下,在小样本下,KendallK
15、endall相关系数服从相关系数服从KendallKendall分分布;在大样本下,布;在大样本下, KendallKendall相关系数的检验统计量相关系数的检验统计量为为Z Z统计量,定义为:统计量,定义为: Z Z统计量近似服从标准正态分布。统计量近似服从标准正态分布。非一致对数目,一致对数目,VUnnVU) 1(2)()52(2) 1(9nnnZ8.3.3 8.3.3 计算相关系数的应用举例计算相关系数的应用举例对于案例对于案例8-18-1,通过绘制散点图得知家庭收入与计,通过绘制散点图得知家庭收入与计划购买的住房面积之间存在一定的正的弱相关关划购买的住房面积之间存在一定的正的弱相关关
16、系,为更确定地反映两者之间线性关系的强弱,系,为更确定地反映两者之间线性关系的强弱,采用计算相关系数的方法。由于这两个变量为定采用计算相关系数的方法。由于这两个变量为定距变量,故采用距变量,故采用PearsonPearson相关系数。相关系数。 【分析(分析(AnalyzeAnalyze)】 【相关(相关(correlatecorrelate)】 【两变量两变量 (bivariatebivariate)】因因p=0.000a(0.0p=0.000a(0.01 1) )故拒绝原假设,即拒绝零相关故拒绝原假设,即拒绝零相关因相关系数为因相关系数为0.3230.323,意味着两者存在弱相关。,意味着
17、两者存在弱相关。8.4 8.4 偏相关分析偏相关分析8.4.1 8.4.1 偏相关分析和偏相关系数偏相关分析和偏相关系数(1 1)简单相关系数简单相关系数研究两变量间线性相关性,若还存在其他研究两变量间线性相关性,若还存在其他因素影响,其往往夸大变量间的相关性,不是两变量间线性因素影响,其往往夸大变量间的相关性,不是两变量间线性相关强弱的真实体现。相关强弱的真实体现。例如,研究商品的需求量、价格和消费者收入之间的线性例如,研究商品的需求量、价格和消费者收入之间的线性关系时,需求量和价格的相关关系实际还包含了消费者收入关系时,需求量和价格的相关关系实际还包含了消费者收入对价格和商品需求量的影响。
18、此时,单纯利用简单相关系数对价格和商品需求量的影响。此时,单纯利用简单相关系数来评价变量间的相关性是不准确的,需要在剔除其他相关因来评价变量间的相关性是不准确的,需要在剔除其他相关因素影响的条件下计算变量间的相关。素影响的条件下计算变量间的相关。8.4.1 8.4.1 偏相关分析和偏相关系数偏相关分析和偏相关系数(3 3)偏相关分析也称净相关分析,它在控制其他)偏相关分析也称净相关分析,它在控制其他变量线性影响的条件下分析两变量间的线性关系,变量线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。所采用的工具是偏相关系数。(4 4)控制变量个数为)控制变量个数为1 1时,偏相关系
19、数称一阶偏相时,偏相关系数称一阶偏相关;当控制变量个数为关;当控制变量个数为2 2时,偏相关系数称为二阶时,偏相关系数称为二阶偏相关;当控制变量的个数为偏相关;当控制变量的个数为0 0时,偏相关系数称时,偏相关系数称为零阶偏相关,也就是简单相关系数。为零阶偏相关,也就是简单相关系数。偏相关系数的分析步骤偏相关系数的分析步骤(1 1)计算样本的偏相关系数)计算样本的偏相关系数 假设有三个变量假设有三个变量y y、x x1 1和和x x2 2,在分析,在分析x x1 1和和y y之间的净相关时,之间的净相关时,需控制需控制x x2 2的线性作用,则的线性作用,则x x1 1和和y y之间的一阶偏相
20、关定义为:之间的一阶偏相关定义为: 偏相关系数的取值范围及大小含义与相关系数相同。偏相关系数的取值范围及大小含义与相关系数相同。12 121,2222121212212(1)(1)yyxxxyyyyyyrr rrrrrrr1其中,、分别表示 和x的相关系数、 和的相关系数、和的相关系数。 (2 2)对样本来自的两总体是否存在显著的净)对样本来自的两总体是否存在显著的净相关进行推断,检验统计量为:相关进行推断,检验统计量为: 其中,其中,r r为偏相关系数,为偏相关系数,n n为样本数,为样本数,q q为阶为阶数。数。t t统计量服从统计量服从n-q-2n-q-2个自由度的个自由度的t t分布。分布。221nqtrr8.4.2 8.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电梯赠予合同7篇
- 小产权转让合同6篇
- 国际贸易之间合作合同
- 公司技术合作合同协议书
- 2025年中山货运资格证模拟考试题库
- 2025年扬州货运从业资格证模拟考试下载安装
- 室内装修合同二5篇
- 的担保借款合同7篇
- 观看湖北消防119宣传月节目心得感悟集合4篇
- 在民主生活会上的点评讲话模板
- 道路设施施工现场安全管理基本要求
- 公寓楼改造装修施工方案
- 烟台大学化学化工学院实验室仪器设备搬迁项目
- 安全生产管理组织架构图
- 2022版10kV架空配电线路无人机自主巡检作业导则
- 近二十年俄罗斯修辞学研究述评
- 委托付款三方协议中英文版
- 约克中央空调冷水机组年度维保方案
- 高中英语-Unit 2 Reading and Thinking A day in the clouds教学课件设计
- 新闻采访与写作课件第十九章融合报道
- 常用小学生词语成语积累归类大全
评论
0/150
提交评论