教育与心理统计五相关关系_第1页
教育与心理统计五相关关系_第2页
教育与心理统计五相关关系_第3页
教育与心理统计五相关关系_第4页
教育与心理统计五相关关系_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育与心理统计五相关关系第一页,共三十八页,编辑于2023年,星期六一、相关、相关关系与散点图1、相关的意义事物之间的相互关系

因果关系(两种事物)共变关系(三种事物)相关关系(两种事物)相关的含义——事物之间存在关系,但又不能直接做因果关系解释时,称事物间的联系为相关。——判断两个因素或变量之间是否有关系,定量地研究这些关系,称为相关分析。相关的类别:正相关:两个变量向相同的方向变化.即一个变量增加,另一个变量也增加.

负相关:两个变量向相反的方向变化.即一个变量增加,另一个变量反而减少.零相关:两列变量之间没有关系,即6一列变量变动时,另一列变量作无规律变动。第二页,共三十八页,编辑于2023年,星期六2、相关系数——两列变量间相关程度的数字表现形式,即用来表示相关系数强度的指标。P(总体)r(样本)不相关,相互独立正相关负相关完全正相关完全负相关越接近1,表示两个变量的相关程度越密切,称高相关。越接近0,表示两个变量的相关程度越疏松,称低相关。第三页,共三十八页,编辑于2023年,星期六3、相关散点图直观地显示了两个事物的成对观测值之间是否存在相关,存在什么样的相关以及相关程度第四页,共三十八页,编辑于2023年,星期六几种相关散点图:线性

(如身高和体重)非线性(如年龄和身高)曲线相关线性正相关R=-1R=1线性负相关零相关第五页,共三十八页,编辑于2023年,星期六二、积差相关英国Pearson1、定义公式若记则第六页,共三十八页,编辑于2023年,星期六2、积差相关适用条件①

要求成对数据②

两列变量各自总体的分布都是正态③

两个相关的变量是连续变量,也即两列数据都是测量数据④

两列变量之间的关系是直线性的,如果是非直线性的双列变量,不能计算线性相关。判断两列变量之间的相关是否为直线式,可作相关散点图进行初步分析,也可查阅已有研究结果论证。第七页,共三十八页,编辑于2023年,星期六3、计算公式第八页,共三十八页,编辑于2023年,星期六4、标准分数的计算公式第九页,共三十八页,编辑于2023年,星期六实例:书P116(例5-1)第十页,共三十八页,编辑于2023年,星期六5、相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。步骤:(1)将各样本的r转换成费舍Z分数,见附表8。(2)求每一样本的Z分数之和(3)求平均Z分数例子:P123(例5-2)第十一页,共三十八页,编辑于2023年,星期六三、等级相关(一)斯皮尔曼等级相关(Spearman’sRankCorrelationCofficient)

斯皮尔曼等级相关是等级相关的一种,适用于只有两列变量,而且是属于等级变量性质具有线性关系的资料

其中:N成对数D=Rx-Ry

对偶等级之差请注意:尽可能不出现相同等级,即不能并列排名,否则误差大1、定义公式:第十二页,共三十八页,编辑于2023年,星期六2、相同等级计算方法(1)将连续变量转化为等级变量求相关——两个变量排序的方式要一致——遇到相同等级时,要求他们的等级平均值例:X10098979793939390

等级123.53.56668第十三页,共三十八页,编辑于2023年,星期六(2)校正公式其中:其中:D:对偶等级差n:各变量相同等级数第十四页,共三十八页,编辑于2023年,星期六例子:P128(例5-5)3、计算条件(1)必须成对数据(2)必须都是等级变量(3)正态条件不明或非正态时,转为等级求r第十五页,共三十八页,编辑于2023年,星期六(二)肯德尔等级相关(KendallRankCorrelationCofficient)1、肯德尔W系数(1)适用资料肯德尔W系数又称为肯德尔和谐系数(theKendallcofficientofconcordance)是表示多列等级变量相关程度的一种方法。这种资料的获得一般采用等级评定的方法,即让K个被试(或称评价者)对N件事物或作品进行等级评定,这样便可得到K列从1到N的等级变量资料;另一种情况是一个评价者先后K次评价N件事物或作品,采用等级评定的方法,这样,同样得到K列从1到N的等级变量资料。对这样的K列等级变量资料求相关,用肯德尔W系数。**用于三个或三个以上变量等级的相关系数,即求几个变量的一致性或和谐性第十六页,共三十八页,编辑于2023年,星期六(2)肯德尔W系数计算公式基本公式:其中:Ri:每一件被评价事物的K个等级之和N:被评价事物的件数即等级数K:评价者的数目或等级变量的列数

R:评价等级和的平均数第十七页,共三十八页,编辑于2023年,星期六校正公式(出现相同等级的计算)例子:P132(例5-7)第十八页,共三十八页,编辑于2023年,星期六2、肯德尔U系数(1)适用资料评价者采用对偶比较的方法,将N件事物两两配对,然后对每一对中两事物进行比较,择优选择,优者记1,非优者记0,最后整理成相对应的评价结果。(2)计算公式其中:N:被评事物的数目,即等级数K:评价者的数目rij:对偶比较记录表格中的择优分数例子:书P133(5-8)第十九页,共三十八页,编辑于2023年,星期六四、质与量相关

定义:需要计算相关的两更变量一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关,包括点二列相关、二列(双列)相关及多系列相关。**质量相关是研究连续变量与二分变量的相关关系。

有一种变量,只有两个取值,称为二分变量(1、0)人为划分为两个取值,称人为二分变量(及格、不及格)若有等级之分,称二分等级变量若无等级之分,称二分称名变量(男、女)第二十页,共三十八页,编辑于2023年,星期六1、点二列相关(1)适用资料

两列变量,一列为来自正态分布的等距或等比测量数据的连续变量,另一列变量是二分称名变量或整体不服从正态的二分等级变量,(2)公式及计算(P136)**该相关系数的正负号无意义,只根据绝对值的大小加以解释。第二十一页,共三十八页,编辑于2023年,星期六2、二列相关

(1)适用资料两列变量,都为连续变量均属于正态分布,一列变量等距或等比,另一列为人为的二分变量。(2)公式及计算单项选择题用点二列,主观题评分用二列。

qpy第二十二页,共三十八页,编辑于2023年,星期六例下表为10名考生一次测验的卷面总分和一道问答题的得分,试求该问答题的区分度(该问答题满分为10分,因此得6分和6分以上则认为该题通过)考生ABCDEFGHIJ卷面总分75577365675663616567问答题得分7674744476第二十三页,共三十八页,编辑于2023年,星期六解:问答题得分被人为划为通过、不通过两类,本题应求双列相关。根据题意可得:第二十四页,共三十八页,编辑于2023年,星期六3、多列相关(1)适用资料:适合处理两列正态变量资料,其中一列为等距或等比变量的测量数据,另一列被人为分为多种类别,称为名义变量。分为三类就叫作三列相关,四类就叫做四类相关。(2)公式及计算见(P140)第二十五页,共三十八页,编辑于2023年,星期六五、品质相关

1、品质相关用于表示R×C(行×列)表的两个变量之间的关联程度。可用于心理测验的编制,进行项目分析2、这种相关因两个变量(因素)只划分为不同的品质类别,故而得名。一般对计数数据,而非测量数据,即使是测量数据,也人为地分为几个类别。3、主要有四分(格)相关、Φ相关、列联表相关等。第二十六页,共三十八页,编辑于2023年,星期六1、四分相关(1)适用资料四分相关适用于计算两个变量都是连续且每个变量都被人为分为两种类型这样的测量数据之间的相关。计算四分相关首先要将资料整理成四格表。四格表是二个因素(变量),每个变量各有两项分类。四格表的二因素都是连续的正态变量,只是人为将其按一定标准划分为两个不同的类别(2)计算公式:P143第二十七页,共三十八页,编辑于2023年,星期六2、Φ系数

(1)适用资料两个相互关联的变量分布都是真正的二分变量,其系数用符号Φ表示。求取Φ系数可以运用列联表来计算,因此Φ系数又叫列联系数。适用资料是除四分相关之外的四格表(计数)资料,是表示两因素两项分类资料相关程度最常用的一种相关系数。第二十八页,共三十八页,编辑于2023年,星期六(2)计算公式完全正相关全体个案落在四格表中的a、d中;完全负相关全体个案落在四格表中的b、c中;零相关表示均匀分配。当Φ值小于0.3时,表示相关较弱,当Φ值大于0.6时,表示相关较强。除常用Φ系数,也用Q系数或γ归结系数。

第二十九页,共三十八页,编辑于2023年,星期六3、列联表相关

(1)列联相关又称均方相依系数、接触系数等,一般用C表示。(2)它是二因素的R×C列联表资料求得,故称为列联相关。当数据属于R×C表的计数资料,欲分析所研究的二因素之间的相关程度,就要应用列联相关第三十页,共三十八页,编辑于2023年,星期六(3)公式:(4)另外当双变量的测量数据整理成次数分布表后,也可用列联相关系数表示两变量的相关程度。此时,当分组数目R≥5,C≥5,而且样本N又较大,计算的列联相关系数C与积差相关系数r很接近。第三十一页,共三十八页,编辑于2023年,星期六六、相关系数的选用与解释如何选择合适的相关系数1、选择计算相关系数的方法主要取决于要处理的数据的性质以及某一相关系数需要满足的假设条件2、总的来说,为了选择一个合适的相关系数进行相关分析,要分下面几个步骤考虑①

考虑每种测量所产生的数据类型②

要对第一种测量数据和第二种测量数据的类型依次做出判断③

确定采用哪一种相关系数。至于两个测量数据哪个为第一,哪个标为第二,没有差别第三十二页,共三十八页,编辑于2023年,星期六相关系数值的解释1、相关系数是一个指标值,它表示两个变量之间的相关程度2、相关系数不是等距的测量值,因此在比较相关程度时,不能用倍数关系说明,只能说绝对值大者比绝对值小者相关更密切一些。3、相关系数值的大小表明了两列测量数据相互间的相关程度,并可以预测。4、当两个变量之间的关系受到其他变量的影响时,两者之间的高强度相关很可能是一种假象:虚假相关或伪相关5、偏相关与半偏相关6、在纯理论研究中,即使是很小的相关,如果在统计上有显著性,也能够说明心理规律,但这并不表明有显著性就就有高相关7、特别注意:证实两个变量之间存在相关关系,并不一定说明一个变量的变化会引起另外一个变量发生变化,即“相关关系不是因果关系”。相关值较大的两类事物之间,不一定存在因果关系第三十三页,共三十八页,编辑于2023年,星期六

相关意义的理解1.相关的意义要看确定系数R22.相关系数0.3以下,为低相关,有理论意义而无实际意义3.相关系数0.4-0.6,为中等相关,既有有理论意义,也有实际意义4.相关系数0.7以上,为高相关,理论意义与实际意义都很大.第三十四页,共三十八页,编辑于2023年,星期六相关分析的发展—聚类分析多组相关指标的简缩聚类分析(clusteranalysis)又称分类分析、群聚分析、集群分析,是将所观测的事物,或观测事物的指标进行分类的一种统计分析方法。样品聚类-Q型聚类:根据样品(事物或被试)之间的“距离”。,指标聚类-R型聚类:用指标之间的相关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论