第五章 相关分析_第1页
第五章 相关分析_第2页
第五章 相关分析_第3页
第五章 相关分析_第4页
第五章 相关分析_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 变量的相关变量的相关 【教学目标】识记相关、散点图、相关系数的类别和含义;理解各类相关系数的意义和适用条件;熟练掌握常用相关系数的计算方法;恰当应用各类相关系数进行相关分析。 【学习重点】相关的基本类型;各种相关系数的适用条件和计算方法;积差相关、等级相关、质量相关、品质相关 。 【难点】肯德尔U系数、品质相关 主要内容主要内容 一、相关的概念一、相关的概念 二、积差相关二、积差相关 三、等级相关三、等级相关 四、质量相关四、质量相关 五、品质相关品质相关 六、相关系数的选用与解释六、相关系数的选用与解释一、相关的概念一、相关的概念 1.1.事物之间的三种关系事物之间的三种关系

2、因果关系因果关系:一种现象是另一现象的因,而另一现象是果。 共变关系共变关系:表面看来有联系的两种事物与第三种现象现象有关,这是两种事物的关系就是共变关系。 相关关系相关关系:两种现象在发展变化的方向方向和大小大小方面存在一定的关系,但不能确定不能确定这两种现象哪是因哪是果;也有理由认为这两者并不同时受第三因素的影响 。下列现象属于什么关系?下列现象属于什么关系? 数学成绩影响物理成绩 种瓜得瓜,种豆得豆 智力和创造性 小孩和小树的生长 河里的漂浮的两块木头 学习压力和学习焦虑 挫折和攻击行为 环境对人的成长的影响 教师的教学方法和学生的学习成绩 2.2.相关的实质相关的实质 变量之间没有严格

3、确定的依存关系变量之间没有严格确定的依存关系,当一个变量(自变量)发生变化时,另一个变量(因变量)也许也许会发生相应的变化,但它们之间没有严格的确定关系,因为事物的变化发展是受很多因素很多因素影响的。 3.3.三种相关关系:三种相关关系: 正相关正相关:变量之间变动的方向相同,同增同减。 负相关负相关:变量之间变动方向相反,一个增加而另一个减小。 零相关零相关:变量之间的变动无规律可循。 4.4.相关的程度相关的程度 完全正相关完全正相关:两个变量变化的速度完全一致,相关系数为1 完全负相关完全负相关:一个变量增加的同时,另一个变量以相同的速度减小,相关系数为1 不完全正相关不完全正相关:相关

4、系数在01之间 不完全负相关不完全负相关:相关系数在10间 5.5.相关次数相关次数 单相关单相关:两个变量之间的相关; 复相关复相关:多个变量之间的相关 表现形态表现形态:线性相关包括直线直线和曲线曲线相关 二、积差相关二、积差相关 1.1.积差相关的概念积差相关的概念 积差相关(product-moment coefficient of product-moment coefficient of corralationcorralation)是英国统计学家皮尔逊是英国统计学家皮尔逊于于2020世世纪初提出的计算方法,简称:纪初提出的计算方法,简称:PearsonPearson 相关相关系数

5、(软件中常用此名称)。积差相关又称系数(软件中常用此名称)。积差相关又称为为积矩相关积矩相关。 离均差乘方之和除以离均差乘方之和除以N N称做称做“矩矩”(moment)(moment),把把X X的离均差和的离均差和Y Y的离均差两者的积总和除以的离均差两者的积总和除以N N,用用“积矩积矩”表示。表示。 2.2.积差相关的适用条件积差相关的适用条件 (1)两个变量都是由测量获得的等距等距或或等等比比数据; (2)两个变量都呈正态正态或或接近接近正态分布; (3)两个变量必须是直线直线关系; (4)数据必须是成对成对数据,数目数目至少至少30对对(简述使用积差相关系数的条件,首都师大简述使用

6、积差相关系数的条件,首都师大2003试题试题)YYyXXxSNSxyryX,式中Nxy也可写成: 22yxxyr协方差(协方差(covariance)covariance):共变方差,反应两列变量变化的一致性程度3.计算公式(1 1)基本公式)基本公式(2 2)运用标准分数计算相关系数的公式)运用标准分数计算相关系数的公式NZZSNSYYXXrYXYX)(3)(3)用原始数据直接计算的简化公式用原始数据直接计算的简化公式: 2222YYNXXNYXXYNr例题P116118 (4 4)计算积差相关系数的差法公式)计算积差相关系数的差法公式YXYXYXYXYXYXSSSSSSSSSSr22222

7、222加差法减差法例题P120 4.4.积差相关系数的合并积差相关系数的合并 即为求几个样本的相关系数的平均相关系数。由于相关系数不是等距数据须将其变成等距数据方可合成。其方法是采用费舍Zr转化法(见P469附表。8)(例题P123) (1)将r转换成Z (2)求各样本的Z分数之和 (3)利用公式求平均Z分数 (4)将平均Z分数转换成r) 3(3iiinZnZ)(三、等级相关三、等级相关 1.1.等级相关的概念等级相关的概念 两列变量所对应的数据是等级顺序的测量数据时,或者两列变量所对应的等距或等比数据的分布非正态时,求两列变量的相关,即为等级相关。 等级相关也属于线性相关,亦为非参数相等级相

8、关也属于线性相关,亦为非参数相关。关。 2.2.斯皮尔曼等级相关(斯皮尔曼等级相关(Spearmans Spearmans correlation coeficientcorrelation coeficient for ranked data for ranked data) 适用条件适用条件: (1)数据是等级顺序等级顺序的测量数据,不是等距或等比数据; (2)非正态分布非正态分布的等比或等距数据。 优点:比积差相关的适用范围广,对数据总体不作要求; 缺点:如果将能作积差相关的数据改作等级相关,其精确度稍差。(1)定义公式(等级差数法)定义公式(等级差数法)16122nnDrRD DRxR

9、xRyRy是是对偶等级之差对偶等级之差(2)原始等级计算公式(等级序数法)原始等级计算公式(等级序数法)11413nnnRRnryxR例题见书P125计算公式计算公式(3)遇到相同等级时的计算公式)遇到相同等级时的计算公式 222222yxDyxrRC上式中:上式中:121121121121222222nnNNynnNNxN N成对数据数目成对数据数目n n为某一变量的为某一变量的相同等级数相同等级数例题见书P127128为矫正数,即减少的差数3.3.肯德尔等级相关肯德尔等级相关(多列等级变量的相关)(多列等级变量的相关) (1 1)肯德尔和谐系数)肯德尔和谐系数 肯德尔和谐系数肯德尔和谐系数

10、( (KendallKendall coefficient of coefficient of concordance), concordance), 是表示多列等级变量相关是表示多列等级变量相关程度的一种方法程度的一种方法 , , 适用于两列以上的等级适用于两列以上的等级变量。肯德尔和谐系数常用符号变量。肯德尔和谐系数常用符号 W W 表示。表示。 适用条件适用条件 K K个评价者对个评价者对 N N 件事物或件事物或 N N 种作品进行等级种作品进行等级评定评定, ,每个评价者都能对每个评价者都能对N N件事物件事物( (或作品或作品) )的好坏、的好坏、优劣、喜好、大小、高低等优劣、喜好

11、、大小、高低等 排出一个等级顺序。排出一个等级顺序。最小的等级序数为最小的等级序数为 1, 1, 最大的为最大的为N, KN, K个评价者便个评价者便可得到可得到K K从从1 1至至N N的等级变量资料。的等级变量资料。 一个评价者先后一个评价者先后K K次评价次评价 N N 件事物或件事物或 N N 件作件作品品, ,也是采用等级评定法也是采用等级评定法, ,这样也可得到这样也可得到 K K 列从列从 1 1 至至 N N 的等级变量资料。这类的等级变量资料。这类 K K 列等级变量资料列等级变量资料综合起来求相关综合起来求相关, ,就用肯德尔就用肯德尔 W W 系数。系数。NRRSSNNK

12、SSWiiRiRi2232121Ri被评价者的K个等级和,SSRi为Ri的离差平方和,K为评价者数目,N为被评价的事物的数目。肯德尔肯德尔W W系数的变系数的变化范围为化范围为0W10W1基本公式例题P131 肯德尔肯德尔W W系数的设计思想系数的设计思想:。故,则不完全一致存在一定的关系,但又个评价者若个评价者完全不一致,若;此时分别为个则致,个评价者的意见完全一如果件事物进行等级评定,个评价者对当100,; 0, 01),(12)4) 1(6)2)(1()(,2) 1(,3 ,2 ,3222WSSKWSSKWnnKnnnnnKRRSSnKRnKKKKRnKnKRiRiiRii出现相同等级时

13、的公式出现相同等级时的公式为相同等级数),(式中:nnnTTKNNKSSWRic12121332例题P132 (2 2)肯德尔)肯德尔U U系数系数 适用条件适用条件 K个评价者对N件事物采用两两配对的方法进行评价,可配成N(N1)/2对,然后进行两两比较,较好的记1分,较差者记0分,最后整理所有评价者的评价结果是否一致。 计算公式(计算公式(例题例题P133134) 如果评价者的态度完全一致,则U1;若对角线上下格子中出现的择优分数相同,则一致性为0;若K为奇数时每格的择优分数为(K1)/2与(K1)/2均匀分布在对角线上下,U1/K;若K为偶数时,U1/K1,U的取值正负并不表示方向的一致

14、性。1) 1() 1()( 82KKNNrKrUijijrij对偶记录表中某一格的择优分数四、质量相关四、质量相关 在研究中,当一列变量按事物的属性属性划分种类,而另一列变量为等比等比或等距等距的测量数据时,求得的相关叫质量相关。 包括点二列相关、二列相关和多系列相关。1.1.点二列相关点二列相关(point-biserial(point-biserial correlation) correlation) 适用条件适用条件一列数据来自于正态分布的总体的等比或等距数据等比或等距数据,另一列变量为二分变量二分变量(dichotomous variable) ,即按事物的某一性质只能分为两类相互独

15、立的变量。pqSXXrxqPpbP P为二分称名变量取某一值的变量比例为二分称名变量取某一值的变量比例 q q为二分称名变量中取另一值的变量比例为二分称名变量中取另一值的变量比例XpXp等距(比)变量中与等距(比)变量中与P P对应那部分变量的平均值对应那部分变量的平均值XqXq等距(比)变量中与等距(比)变量中与q q对应那部分变量的平均值对应那部分变量的平均值SxSx为全部等距或等比变量的标准差为全部等距或等比变量的标准差例题P136 2.二列相关 (biserail correlation,中科院中科院2004试题试题) 适用条件适用条件 两列变量都来自于正态分布的等比或等距等比或等距数

16、据,而其中一列被人为地划分为两个类别的数据 ypqSXXrtqPby y标准正态曲线下标准正态曲线下p p和和q q交界交界点的点的y y轴的高度轴的高度 (例题P138139) 二列相关一般不常用 一般用于对项目(题目)的区分度的确定 当相关系数越接近1时,项目的区分度越高;当相关系数越接近0时,其区分度越低。 3.多列相关(multiserialsmultiserials correlation correlation) 适用资料适用资料 多列相关适合处理两列正态变量资料多列相关适合处理两列正态变量资料, ,其中其中一列为等距或等比的测量数据一列为等距或等比的测量数据, ,另一列被人另一列

17、被人为划分为为划分为多个类别多个类别的名义变量。的名义变量。 多列相关用于一列正态连续变量与另一列多列相关用于一列正态连续变量与另一列正态的正态的称名变量称名变量之间的一致性分析之间的一致性分析, ,在测验在测验中时常用于中时常用于效度检验效度检验。差为整列连续变量的标准的连续变量的平均数为每一名义变量所对应态表得出正态曲线的高度,查正为每一名义变量上限的态表得出正态曲线的高度,查正为每一名义变量下限的的比率为每系列次数与总次数tiHLiiHLtiHLssXyyPPyysXyyr2计算公式例题P141五、品质相关品质相关 品质相关品质相关是指是指R R(行)(行)C(C(列列) )表的两个表的

18、两个分类变量分类变量之之间的关联程度。间的关联程度。 品质相关处理的数据类型一般都是计数数据而非测品质相关处理的数据类型一般都是计数数据而非测量数据。量数据。 品质相关是编制心理测验、项目分析时的常用方法。品质相关是编制心理测验、项目分析时的常用方法。 主要有四分相关、主要有四分相关、相关、列联表相关相关、列联表相关等。等。 1.1.四分相关(四格表)四分相关(四格表) 当两个变量都是连续变量当两个变量都是连续变量,且每一个变量的变化都且每一个变量的变化都被被人为地分为两种类型人为地分为两种类型时时, 求两个变量之间的相求两个变量之间的相关为四分相关。关为四分相关。 计算时将资料整理成计算时将

19、资料整理成22的四格表。四格表是由的四格表。四格表是由两个因素两个因素,各有两项分类计数。各有两项分类计数。计算公式计算公式:例题P143144 2.2.相关相关 适用资料适用资料 当两变量是真正(自然)的二分变量时,当两变量是真正(自然)的二分变量时,求两变量之间的相关为求两变量之间的相关为相关。相关。 例题例题P144P144 当当值小于值小于0.30.3时,相关较弱;当时,相关较弱;当值大于值大于0.60.6时,时,相关较强。完全正相关,数据落入相关较强。完全正相关,数据落入adad两格中,完两格中,完全负相关,数据落入全负相关,数据落入bcbc两格中。应用时一般不指两格中。应用时一般不指出其相关方向。出其相关方向。)()()(dcdbcababcadr 还可以用还可以用关联系数关联系数Q Q和和归结系数归结系数表示其相表示其相关程度关程度。bcadbcadbcadbcadQ(5-18a)(5-18b)例题P145 3.列联表相关(涉及后面的内容故从略)六、相关系数的选用与解释六、相关系数的选用与解释 1.1.如何选择合适的相关系数如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论