统计学第6讲第6章-统计学的相关关系_第1页
统计学第6讲第6章-统计学的相关关系_第2页
统计学第6讲第6章-统计学的相关关系_第3页
统计学第6讲第6章-统计学的相关关系_第4页
统计学第6讲第6章-统计学的相关关系_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第6讲第6章—统计学的相关关系3.相关系数的类型:等距或比率量表:Pearson积矩相关系数r.顺序量表:Spearman等级相关系数rs.4.相关系数的选择取决于下列因素⑴用来测量每个变量的量表类型⑵变量的内在分布特性(连续或离散)⑶数据的分布特点5.相关的共同特征统计学第6讲第6章—统计学的相关关系⑴两列测量数据取自相同个体或事件,或者取自一定条件的配对样本⑵相关系数取值在-1~+1之间变化,表示两变量没有相关。⑶正相关(positiverelationship)意味着个体在一个变量上得分高(低),在另外一个变量上得分也高(低)。⑷负相关(negativerelationship)意味着个体在一个变量上得分高(低),在另外一个变量上得分低(高)。⑸高的相关并不意味着变量之间有因果关系。春天来了,鸟儿越多,草儿越绿,对吗?统计学第6讲第6章—统计学的相关关系图6-1两变量之间不同相关程度的散点图统计学第6讲第6章—统计学的相关关系6.2Pearson相关系数r和z分数z分数分布的平均数=0,标准差=1,∑z2=n高的正相关表明每个个体在两各变量上获得近似相等的z分数。高负相关表明每个个体在两变量上获得近似相等的z分数,但符号相反。r的大小和z分数有什么关系?r表示某个体或事件在两个变量分布中的相对位置之间的相似程度。统计学第6讲第6章—统计学的相关关系XY被试原始分数原始分数zxzyzxzyA14-1.5-1.52.25B37-1.0-1.01.00C510-0.5-0.50.25D7130.00.00.00E9160.50.50.25F11191.01.01.00G13221.51.52.25表6-1七名被试在两个测验上的原始分数与Z分数1.完全正相关∑zxzy=7=N∑z2=7=N统计学第6讲第6章—统计学的相关关系XY被试原始分数原始分数zxzyzxzyA17-1.5-1.01.50B34-1.0-1.51.50C510-0.5-0.50.25D7130.00.00.00E9160.50.50.25F11191.01.01.00G13221.51.52.252.高度正相关∑zxzy<N统计学第6讲第6章—统计学的相关关系XY被试原始分数原始分数zxzyZxzyA122-1.51.0-2.25B319-1.01.5-1.00C516-0.50.5-0.25D7130.00.00.00E9100.5-0.5-0.25F1171.0-1.0-1.00G1341.5-1.5-2.253.完全负相关∑zxzy=-r=-=-统计学第6讲第6章—统计学的相关关系6.3利用原始数据计算相关系数r交叉乘积之和=统计学第6讲第6章—统计学的相关关系被试XX2YY2XYA117497B3941612C5251316965D74916256112E9811010090F1112122484242G1316919361247n=7∑X=49∑X2=455∑Y=91∑Y2=1435∑XY=775表6=2利用原始数据计算相关系数r(假设数据)交叉积和=775-49*91/7=775-637=138SSX=455-492/7=112,SSY=1435-912/7=252统计学第6讲第6章—统计学的相关关系X1Y73451371691011221319图6-3利用原始数据绘制的散点图分数与平均数的离差称为矩(moment),两个矩相乘称为积矩,算得的相关系数称为Pearson相关系数。如果你名叫

,为什么不叫Pearson相关系数呢?统计学第6讲第6章—统计学的相关关系6.4注意事项1.两变量缺少线性关系的原因是什么?①两变量本来就不相关;②偶然变异和小样本可能掩盖真正的相关;③变量之间是非线性的关系问:年龄与握力之间呈现线性关系吗?如果散点图呈现椭圆形状,表示二者之间有线性关系,这里表现有弯曲形状,就不能使用皮尔逊相关统计学第6讲第6章—统计学的相关关系描述等距或比率量表变量之间的关系,最重要的呈现线性关系,是否正态分布则不是必须的。2.因果关系两变量高相关并不意味着二者存在因果关系问题1:1到16岁儿童的年龄与身高相关吗?1到10岁之间,年龄与身高高度相关,10-1610到16岁(或5英尺高)呢?可能低度相关3.全矩限制统计学第6讲第6章—统计学的相关关系问题2:当我们期望大学生的IQ分数与SAT测验存在高相关时,如果存在下述情况,是否还相关呢?结论:两个变量的全矩被截断后,相关程度变得很低统计学第6讲第6章—统计学的相关关系4.样本选择问题:某研究人员想要探索抑郁与短时记忆之间的关系,假定选择一组病人给予抑郁测验和记忆测验,并且只选择25%的最高分和25%的对低分的被试作为研究对象,这样会产生什么问题呢?答案:仅仅选择部分病人的极端数据,会导致两个变量的错误结论,其结论不能够代表其总体。5.相关与回归r反映两变量取值的相对位置之间关系的程度。完全相关或高度相关不意味着两变量原始分数的接近程度。理解相关还得理解下一章的回归。统计学第6讲第6章—统计学的相关关系6.重要与显著同学可能会问:“什么样的相关系数才是一个好的相关系数?”。“我怎么知道是否获得一个‘显著’的相关系数呢?”相关系数的大小及其重要性,取决于解释数据的情境。一个的相关系数,对甲不重要,但是对乙可能就很重要。“显著”(significance)是一个重要的统计术语,是另外一个问题,相关系数在统计上要么显著,要么不显著,为了理解重要性和显著性之间的区别,我们需要在后继章节介绍显著性检验。此处只需知道相关系数是一个统计量就行了。统计学第6讲第6章—统计学的相关关系6.5相关系数矩阵问题:一个人的体重在一生中保持不变吗?儿童期青春早期18岁30岁40岁儿童期━0.810.530.21-0.03青春早期━━0.820.500.3118岁━━━0.660.6230岁━━━━0.8440岁━━━━━表6-3女性从儿童到40岁体重相关系数统计学第6讲第6章—统计学的相关关系6.6顺序量表变量与等级相关系数rs例6-1假如你是一名教师,你对“智力与领导力是相关变量”抱有质疑,没有适当的度量测量领导力,但是可以对领导力加以排序,从而组成顺序量表如下。智123456789101112131415领429171081353116121514D-30-63-2-4-1-547061-11D2903694161251649036111∑D必定=0,∑D2=2046.6.1计算无重复等级的rs统计学第6讲第6章—统计学的相关关系6.6.2计算有重复等级的rs例6-2下表是随机抽取的10名同学的期末考试成绩与平均绩点GPA(4,3,2,1)问二者是否相关?同学成绩X平均绩点YX2Y2XY1902.581006.252252852.072254.001703802.564006.252004752.056254.001505701.549002.251056701.049001.00707701.049001.00708600.536000.25309600.536000.253010500.525000.2525∑=71014.05175025.51075当两个变量至少存在一个重复等级时,等级相关可能会虚假的偏高,可利用等级数计算Pearson相关系数统计学第6讲第6章—统计学的相关关系期末考试与平均绩点两个变量的散点图理查德.鲁尼恩《心理统计》第9版英文影印版第188页8.11PuttingItAllTogether统计学第6讲第6章—统计学的相关关系第1步:第2步:第3步:第4步:如果计算等级相关系数rS=0.95,0.95>0.91,产生虚假的高相关统计学第6讲第6章—统计学的相关关系6.7质与量相关(现代心理与教育统计学)一列为等距或比率测量数据,另一列按质分类求直线相关,称为质量相关,包括点二列、二列及多列相关。6.7.1点二列相关1.适用资料若两列相关资料中一列为等比或等距测量数据(总体分布正态)例如考试分数,另一列是二分名义变量并且赋予一系列观察值例如“1”或“0”,“对”、“错”。二者若意义对应,构成点二列。二分变量:真正二分变量(男\女)和人为二分变量(对\错)统计学第6讲第6章—统计学的相关关系2.公式及计算

p,q是二分名义变量两个值各自所占比率,其和为1。St是连续变量的标准差。

、分别是二分名义变量的两个值对应的连续变量的平均数。

点二列相关系数取值在-1~+1之间。统计学第6讲第6章—统计学的相关关系例6-350道是非题,每题2分,满分100,问第五题与测验总分的相关程度如何?学生总分第五题学生总分第五题184对282错376错460错572错674错776错884对988对1090对1178对

1280错

1392对

1494对

1596对

1688对

1790对

1878错

1976错

2074错统计学第6讲第6章—统计学的相关关系解:已知N=20,对错各10人分别为答“对”和答“错”比率.=88.4=74.8.分别是答对和答错第5题学生的总分的平均成绩。St=8.88是总成绩的标准差。说明第5题与总分之间相关比较高,对错与总分有一致性,表明第5题区分度比较高.能真实反映学生掌握知识的情况统计学第6讲第6章—统计学的相关关系例6-4一道测验满分20,想了解该测验与文化程度是否有关,文化程度:文盲为0,非文盲为1,试求相关系数.被试测验总分文化程度被试测验总分文化程度12012191317148059

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论