第五章相关系数_第1页
第五章相关系数_第2页
第五章相关系数_第3页
第五章相关系数_第4页
第五章相关系数_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.,五名学生四种测验的分数 如何描述A与B、A与C的情况呢?,.,第五章 相关系数,相关、相关系数与散点图 积差相关 等级相关 质与量相关 品质相关 相关系数的选用与解释,.,第一节 相关、相关系数与散点图,一、什么是相关 事物之间的相互关系 (1)因果关系:一种现象是另一种现象的原因,而另一种现象是结果。数学上的函数关系。 (2)共变关系:表面上看来有联系的两种事物都与第三种现象有关。草、小树与季节(时间)。 (3)相关关系:两类现象在发展变化的方向与大小方面存在一定的关系。不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不存在共变关系。 具有相关关系的两种现象之间的关系是比较

2、复杂的,甚至可能包含有暂时的尚未认识的因果关系以及共变关系在内。,.,相关的类别 统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度。从变化的方向来看,相关的情况有以下三种: 正相关:两列变量的变化方向相同。 负相关:两列变量的变化方向相反。 零相关:两列变量的变化方向无一定规律。,.,五名学生四种测验的分数 A与B、A与C、A与D相关吗?若有,有什么样的相关关系?,.,二、相关系数,相关系数是两列变量间相关程度的数字表现形式,或者说是用来表示相关关系强度的指标。作为样本间相互关系程度的统计特征数,常用表示,作为总体参数,一般用表示,并且是指线性相关而言。 相关系数的取值介于-1.00

3、至+1.00之间,常用小数形式表示。它只是一个比率,不代表相关的百分数,更不是相关量的相等单位的度量。,.,如何理解相关系数? 相关系数是两列变量间相关程度的数字表现形式。 (1)相关系数的取值在-1.00和+1.00之间; (2)相关系数的绝对值表示两个变量之间的相关强度,绝对值越接近1表示相关越强,越接近0表示相关越弱; (3)相关系数的正负号表示相关的方向,相关系数为正的表示正相关,相关系数为负的表示负相关; (4)相关系数可以比较大小,但不能进行加减乘除运算。,.,在直角坐标系中,以 X、Y 二列变量中的一列变量(如X 变量)为横坐标,以另一列变量(如Y 变量)为纵坐标,把每对数据Xi

4、、Yi当做同一个平面上的个点(Xi、Yi),一一描绘在XOY坐标系中,产生的图形就称为散点图。 散点图通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出直观而有效的预测和解释。,三、散点图,.,.,不同形状的散点图显示了两个变量间不同程度的相关关系。如果所有散点分布呈椭圆状,则说明二变量之间呈线性关系。在椭圆状散点图中,如果椭圆长轴的倾斜方向左低右高(以轴为基准),则为正相关,左高右低则为负相关;如果散点图呈现圆形,就为零相关或弱相关。,.,一、积差相关的概念与适用资料 积差相关的概念 当两列变量都是正态连续变量,而且两者之间呈线性关系,表示这两列变量之间

5、的相关称为积差相关。,第二节 积差相关(一),.,积差相关的适用资料 (1)要求成对的数据,即若干个体中每个个体都有两种不同的观测值。 (2)计算相关的成对的数据的数目不宜少于30对。 (3)两列变量各自总体的分布都是正态分布,至少两个变量服从的分布是接近正态的单峰分布。 (4)两个相关的变量是连续变量,也即两列数据都是测量数据。 (5)两列变量之间的关系应是直线性的,.,二、积差相关的计算方法 (1)基本公式 运用标准差与离均差的计算公式 ( , ) 运用标准分数计算相关系数的公式 原始观测值计算公式(也可用EXCEL中的CORREL函数),积差相关(二),.,例51 表52是10名学生的身

6、高与体重的测量结果,问身高与体重的关系如何?,.,解:根据已有资料可知,中学生身高与体重的分布都呈正态,且身高、体重都属测量数据并为线性相关,故可用积差相关公式计算相关系数。,答:这10名学生的身高与体重的相关系数为0.7919,.,(2)差法公式 减差法 加差法,.,积差相关的计算方法 (3)相关表法 (求次数分布表中的两列变量r) 式中,积差相关(三),.,四、 相关系数的合并 相关系数的合并需要将其转换成等距的尺度后再求平均,方有意义。求平均的相关系数,一般采用 Z -转换法。具体步骤如下: (1)查附表8,先将各样本的 r 转换成费舍Z 分数; (2)求每一样本的 Z 分数之和; (3

7、)求平均 Z 分数,即 ( ); (4)再查附表8,将 转换成 。 注:介绍EXCEL中的FISHER及FISHERIVN函数,.,例52 下表是来自同一总体的三个样本的相关关系,求平均相关关系。,查费舍Z -转换表,平均相关系数为0.397,.,第三节 等级相关,一、斯皮尔曼等级相关 斯皮尔曼等级相关的概念与适用资料 当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两个变量之间的相关称为等级相关。 它适用于只有两列变量,而且是属于等级变量性质,具有线性关系的资料,主要用于解决称名数据和顺序数据的问题。,.,二、斯皮尔曼等级相关的计

8、算方法 (1)等级差数法(N30) (式中N 为等级个数,D 指二列成对变量的等级差数) (2)等级序数法 (式中RX与RY为两列变量各自排列的等级序数) (3)有相同等级时计算等级相关的方法 式中,.,例53 现有10人的视、听两种感觉通道的反应时,数据见下表,问视、听觉反应时是否具有一致性?,.,分析:这两列变量都是同一组被试者测得的,是成对的数据,因此要用相关的统计方法。但只有10对数据,其次数分布是否正态也无法知道,若用积差相关计算,条件稍欠满足,因此选用等级相关计算则更为合适。,.,例54 下表是10名学生的数学和语文考试成绩,问数学与语文成绩是否相关。,.,分析:一般情况学业成就测

9、试因其考试性质和目的不同,考试成绩分布很难保证每次都为正态,该例中的考试性质不明确,难以确定其成绩是否为正态;另外,成对考试成绩数目较少。因此,虽属等距变量,但在此不能用积差相关计算,应用等级相关计算相关系数。,.,肯德尔W系数的概念与适用资料 当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量,称为肯德尔W系数。它适用于两列以上的等级变量。,二、肯德尔W系数(肯德尔和谐系数),.,肯德尔W系数的计算方法 基本公式 式中 ,Ri 代表评价对象获得的K 个等级之和,N 代表被等级评定的对象的数目,K 代表等级评价者的数目。,.,例56 有10人对

10、红、橙、黄、绿、青、蓝、紫七种颜色按照其喜好程度进行等级评价。其中,最喜欢等级为1,最不喜欢的等级为7。结果见下表。问这10人对颜色的爱好是否具有一致性?背景:染布的颜色、服装的式样,.,答:从W值看,这十个人对颜色的喜爱具有较高的一致性,亦即这十个人所喜爱的颜色比较一致。喜好的顺序可由Ri的大小给出大致情况, Ri大者等级序数大; Ri小者等级序数小。十人对七种颜色由最喜欢到最不喜欢的顺序是:绿、蓝、红、青、黄、紫、橙。踏青、绿山青水、蓝天白云。,., 有相同等级出现时计算公式 (修正公式) 式中 , ,n 为相同等级的数目。,.,例57 五位评分者对七篇作文进行评价,评价等级为15,评价结

11、果见下表,试问评分者之间对标准的掌握是否一致?,.,答:从计算结果可知,五位评分者对七篇作文的评价标准比较一致,或者说评分者信度较高。,.,肯德尔U系数的概念与适用资料 当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量,称为肯德尔U系数。它适用于对K个评价者的一致性进行统计分析。 肯德尔U系数的计算方法 式中N 为被评价事物的数目,即等级数;K 为评价者的数目;rij为对偶比较记录表中i j(或ij)格中的择优分数。,肯德尔U系数(一致性系数),.,例58 下表是根据10个评价者对7种颜色对偶选择分数整理而成。整理的方法为:如果第一个评价者对

12、7种颜色评定的等级分别为绿色1、蓝色2、青色3也就是若用对偶比较,则当绿色与其他颜色比较时,都选择绿,因此在绿色这一行都记为1分,蓝色排第二,其意思是当蓝色与其他6种颜色比较时,除绿色之外,都选择蓝色以此类推。试计算肯德尔U系数,.,解:N=7,K=10,根据表中对角以下的择优分数,,.,本节课所学的主要内容是什么? 什么是相关系数?如何理解? 积差相关使用的条件是什么?如何求? 斯皮尔曼等级相关使用的条件是什么?如何求? 什么是W系数?什么是U系数?分别解决什么问题? 积差相关系数合并的步骤是什么?,.,作业 6、7、11,.,一、点二列相关 (1)点二列相关的概念与适用资料 当两个变量其中

13、一个是正态连续性变量,另一个是真正的二分变量,这时表示这两个变量之间的相关称为点二列相关。 适用资料:两列变量中有一列为等距或等比的测量数据而且其总体分布为正态,另一列变量是二分称名的变量数据。 (2)点二列相关的计算方法,第四节 质与量相关,.,例59 有一是非式选择题,每题选对得2分,共有50题,满分100分。下表是20名学生在该测验中的总成绩及第5题的选答情况。问这道题与测验总分的相关程度如何?,.,答:第5题与测验总分之间的相关系数为0.766,相关较高,即第5题的答对答错与总分有一致性。表明第5题的区分度较高。,.,例510 一个测验满分为20分,想了解该测验结果与文化程度是否有关,

14、文化程度分为文盲(0)、非文盲(1)。下表是部分被试实验结果,试求其相关系数。,.,解:已知N12,被试中文盲人数为5人,非文盲人数为7人,设p为文盲被试的比率;q为非文盲被试的比率; 为文盲被试在该测验中部分的平均成绩; 为非文盲被试在该测验中部分的平均成绩; 为所有被试在该测验中总成绩的标准差。,答:计算文化程度与该测验部分之间的相关系数为0.89,相关较高。从计算结果可见,文盲、非文盲与测验得分存在较高的一致性,即文盲得分少,非文盲得分多。,.,(1)二列相关的概念与适用资料 当两个变量都是正态连续性变量,其中一个变量被人为地划分成二分变量,这时表示这两个变量之间的相关称为二列相关。 (

15、2)二列相关的计算方法,二、二列相关,.,例511 下表是108名学生某个测验总分分组数据和在某道问答题上得分依一定标准将其分为对、错两类后的数据,请问这道问答题的区分度如何?,.,分析:由次数分布表知,这道问答题的原始得分呈正态分布,但问题的分数又区分为二分型数据,故此题应该用二列相关计算区分度。请复习P46页及P140的算法。,解:设某一得分组的人数为ft,某一分组中答对某一题目的人数为fp,答错该题目的人数为fq. 答:这道题的区分度为0.66,.,(1)多系列相关的概念与适用资料 当两个变量都是正态连续性变量,其中一个变量按不同质被人为地分成多种类别(两类以上)的正态名义变量,这时表示

16、这两个变量之间的相关称为多系列相关。 (2)多系列相关的计算方法,三、多列相关,.,例512 表中的数据是140名学生学习能力测验分数与教师对该部分学生的评价等级(A、B、C、D)资料。计算能力测验与教师评价之间的一致性。,.,分析:学生的学习能力可视为正态分布,由于教师评价等级分为四级,因此,这是一个四系列相关问题。解:设某一得分组的人数为f t ,某一分组获得某一评定等级的人数为fi,包括f c ,f d, f b, f a . Xi为某一等级相应的能力测验分数的平均值。表中的y值是查正态分布表中对应的累加比率值得到。,.,答:能力测验与教师评价具有一致性,相关系数为0.717,.,(1)

17、四分相关的概念与适用资料 当两个变量都是正态连续性变量,且两者呈直线关系,但两者都被人为地划分成二分变量,表示这两个变量之间的相关,称为四分相关。 (2)计算方法,第五节 四分相关,.,例513 下表所列 数据是调查377名学生两科测验成绩所得到的结果,假设两科成绩的分布为正态,只是人为地将其按一定标准划分为及格,不及格两类。求其相关系数,.,解:a=124, b=68, c=85, d= 100, a+b+c+d=377,.,(1)相关的概念与适用资料 当两个变量都是真正二分变量,表示这两个变量之间的相关,称为 相关。 相关适用的资料是除四分相关之外的四格表资料。 (2)相关的计算方法 基本

18、公式 其它公式,相关(系数),.,例514 下面是关于吸烟与患癌症之间的一组假设数据。吸烟状况(X)分为吸烟者与非吸烟者,用0,1表示,死亡原因(Y)分为因吸烟致癌死亡与其他原因死亡两种,用0,1表示。试求它们之间的相关。 X:0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 Y:0 1 0 0 1 0 0 0 1 1 0 1 1 1 1 0 1 1 1 0,.,解:将上面的数据整理成四格表 从表中可知a=6, b=4, c=3, d=7 , r0.302,.,有人说吸烟对健康没有影响,其理由是:周总理喝酒不吸烟,活到七十三,毛泽东吸烟不喝酒,活到八十三,邓小平吸

19、烟又喝酒,活到九十三,张学良吃喝嫖赌全都干,活到一百零三。雷锋吃喝嫖赌全不沾,活到二十三,所以吃喝嫖赌不影响身体健康。这人说的对吗?试用统计的观点加以分析。 抽样,样本量少,没有进行统计分析,试问教育或心理现象中有相关的问题吗?若有请举例。,.,(1)列联表相关的概念与适用资料 当两个变量均被分成两个以上类别,或其中一个变量被分成两个以上类别,表示这两个变量之间的相关,称为列联相关。 适用的资料是两列数据均属于正态分布,且至少有一个变量都被分成两种以上类型的等距或等比的测量数据。 ( 2)列联表相关的计算方法 基本公式 其它公式,列联表相关,.,第六节 如何选择合适的相关系数,选择计算相关系数的方法主要取决于要处理的数据的性质类别以及某一相关系数需要满足的假设条件。具体来说,为了选择一个合适的相关系数进行相关分析,要分以下几个步骤考虑: (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论