第三章 相关分析_第1页
第三章 相关分析_第2页
第三章 相关分析_第3页
第三章 相关分析_第4页
第三章 相关分析_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 相关分析相关分析0 一些现象一些现象 数学成绩与语文成绩数学成绩与语文成绩 身高与性别身高与性别 寿命与生长环境寿命与生长环境 课程成绩与教学方法课程成绩与教学方法 课程成绩与教师课程成绩与教师 化肥使用量与产出化肥使用量与产出 孩子学习主动性与家长的学习孩子学习主动性与家长的学习 1 基本概念基本概念n事物或现象之间的三种关系。事物或现象之间的三种关系。 n第一种是因果关系,这种关系说明的是事物之间相互依存,互为因果第一种是因果关系,这种关系说明的是事物之间相互依存,互为因果的关系,是事物之间存在的一种必然关系,即一种引起与被引起的关的关系,是事物之间存在的一种必然关系,即一种

2、引起与被引起的关系,因在前果在后的顺序是不能颠倒的。系,因在前果在后的顺序是不能颠倒的。n第二种是共变关系,例如夏天冷饮的销量和中暑人数的关系。当天气第二种是共变关系,例如夏天冷饮的销量和中暑人数的关系。当天气炎热时,两者都会增加,但通常我们不认为它们之间有什么因果关系。炎热时,两者都会增加,但通常我们不认为它们之间有什么因果关系。但事实上两者皆起因于天气炎热的因素,它们之间并没有直接的关系。但事实上两者皆起因于天气炎热的因素,它们之间并没有直接的关系。n第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的联系,但不是前面

3、两种关系。定的联系,但不是前面两种关系。n另一说相关关系反映现象的共变关系。另一说相关关系反映现象的共变关系。 1.1 相关相关n两类现象在发展变化的方向与大小方面存在一定的联系,但不是因果两类现象在发展变化的方向与大小方面存在一定的联系,但不是因果关系。关系。1.2 相关的类型相关的类型 -正相关正相关(Positive correlation)是指两列变量变动方向相同,一列)是指两列变量变动方向相同,一列变量变量由大到小或由小到大变化时,另一列变量亦由大到小或由小到大由大到小或由小到大变化时,另一列变量亦由大到小或由小到大变化。如身高与体重,身高越长,体重就越重变化。如身高与体重,身高越长

4、,体重就越重 正相关虽然意思明确,其实是个模糊的概念,不可以量化,只是正相关虽然意思明确,其实是个模糊的概念,不可以量化,只是定性说法。如果有明确的关系,例如定性说法。如果有明确的关系,例如 y2x,这叫,这叫y与与x成成正比正比,如果,如果只是大体上,只是大体上,x、y的变化方向一样,例如的变化方向一样,例如x上升,上升,y也上升或者也上升或者x下降,下降,y也下降,那么,这叫也下降,那么,这叫正相关正相关 。n-负相关(负相关(Nagtive correlation)是指两列变量变动方向相反,一列是指两列变量变动方向相反,一列变量变量由大到小或由小到大变化时,另一列变量反而由小到大或由大到

5、由大到小或由小到大变化时,另一列变量反而由小到大或由大到小变化。小变化。 负相关是事物之间相互负相关是事物之间相互“制约制约”,一种事物发展导致另一种事物,一种事物发展导致另一种事物受到限制。受到限制。 特别是特别是“替代品替代品”。比如资源政策、环保政策出台必然导致。比如资源政策、环保政策出台必然导致“一一次性资源次性资源”替代品的出现,象替代品的出现,象“代木代钢代木代钢”发展起来的发展起来的PVC塑钢。再塑钢。再如随着计算练习次数增加或练习时间加长,计算错误就越少等等。如随着计算练习次数增加或练习时间加长,计算错误就越少等等。n零相关是指两列零相关是指两列变量变量之间没有关系,即一列变量

6、变之间没有关系,即一列变量变动时,另一列变量作无规律的变动,又称为无相关动时,另一列变量作无规律的变动,又称为无相关或不相关。或不相关。 如相貌与人的行为等现象之间的关系,都属于零如相貌与人的行为等现象之间的关系,都属于零相关。相关。 1.3 相关的强度相关的强度n 完全相关完全相关是指两列变量的关系是一一对应,完全确立的关系。在是指两列变量的关系是一一对应,完全确立的关系。在坐标轴上描绘两列变量时会形成一条直线。坐标轴上描绘两列变量时会形成一条直线。n强相关强相关又称高度相关,即当一列变量变化时,与之相应的另一列又称高度相关,即当一列变量变化时,与之相应的另一列变量增大(或减少)的可能性非常

7、大。在坐标图上则表现为变量增大(或减少)的可能性非常大。在坐标图上则表现为散点图散点图较较为集中在某条直线的周围。为集中在某条直线的周围。n弱相关弱相关又称低度相关,即当一列变量变化时,与之相对应的另一又称低度相关,即当一列变量变化时,与之相对应的另一列变量增大(或减少)的可能性较小。亦即两列变量之间虽然有一定列变量增大(或减少)的可能性较小。亦即两列变量之间虽然有一定的联系,但联系的紧密程度较低。在坐标涂上表现出散点比较分散地的联系,但联系的紧密程度较低。在坐标涂上表现出散点比较分散地分布在某条直线的周围。分布在某条直线的周围。|r|0.4为低度线性相关;为低度线性相关;0.4|r|0.7为

8、显著性相关;为显著性相关;0.7|r|1为高度线性相关。为高度线性相关。 1.4相关的标示类型相关的标示类型 直线相关直线相关(Linear Correlation)又称线性相关,是指两列又称线性相关,是指两列变量变量中的中的一列变量在增加(或减少)时,而另一列变量随之而增加(或减少),一列变量在增加(或减少)时,而另一列变量随之而增加(或减少),或这一列变量在增加时,而另一列变量则相应地减少。它们之间存在或这一列变量在增加时,而另一列变量则相应地减少。它们之间存在一种一种直线关系直线关系。直线相关可用直线拟合。直线相关可用直线拟合。 曲线相关曲线相关(Curvilinear correlat

9、ion)又称非线性相关,是指两)又称非线性相关,是指两列伴随相变化的列伴随相变化的变量变量,未能形成,未能形成直线关系直线关系。 1.4 散点图散点图2 直线相关系数直线相关系数JP132图图3.1 语文和算术成绩散点图语文和算术成绩散点图(-2.67,-4)(0,0)IV以xy衡量相关程度衡量相关程度n正相关时正相关时xy为正,相关程度越高,值越大。为正,相关程度越高,值越大。 为什么?为什么? 负相关时负相关时xy为负,相关程度越高,绝对值越大。为负,相关程度越高,绝对值越大。 不不相关时相关时xy趋近于趋近于0。 为什么?为什么?不足:以不足:以xy衡量相关程度,但程度衡量相关程度,但程

10、度不变时,不变时, xy随观测次数减加而增减。随观测次数减加而增减。因此,以因此,以(xy)/n协方差衡量相关程度较好。协方差衡量相关程度较好。 但,测量单位改变时,协方差会随之改变。但,测量单位改变时,协方差会随之改变。 进一步,再用协方差除进一步,再用协方差除以变量以变量XY 的标准差之积的标准差之积x y,得到一个指标,得到一个指标,称为直线相关系数。称为直线相关系数。Xyx ypn(1)Xyxyrnss样本直线相关系数:样本直线相关系数:总体直线相关系数:总体直线相关系数:,x X X y Y Y 其中其中2.1 Pearson correlation coefficientn皮尔森相

11、关系数(皮尔森相关系数(Pearson correlation coefficient)也称)也称皮尔森皮尔森积矩相关系数积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。皮尔森相关系是一种线性相关系数。皮尔森相关系数是用来反映两个变量线性相关程度数是用来反映两个变量线性相关程度的统计量。相关系数用的统计量。相关系数用r表示,其中表示,其中n为为样本量样本量,xy、 分别为两个变量分别为两个变量的观测值和均值。的观测值和均值。r描述的是两个变量描述的是两个变量间线性相关强弱的程度。间线性相关强弱的程度。r的绝对值

12、越的绝对值越大表明相关性越强。(大表明相关性越强。( 1890年)年)YX公式公式的其的其他表他表述述( 1890年)年)决定系数决定系数n决定系数决定系数,英文(,英文(coefficient of determination),),有的教材上翻译为,判定系数,也称为拟合优度。在有的教材上翻译为,判定系数,也称为拟合优度。在Y的总平方和中,由的总平方和中,由X引起的平方和所占的比例,或依变引起的平方和所占的比例,或依变量量Y的变异中有多少的变异中有多少百分比百分比,可由控制的自变数可由控制的自变数X来解释来解释 ,记为记为 与相关系数的区别在于除掉与相关系数的区别在于除掉|R|=0和和1情况

13、,由于情况,由于 j(或或ij)的格中的择优分数的格中的择优分数对偶比较法(对偶比较法(Method of paired comparison) 对偶比较法是把所有要比较的刺激配成对,然后一对对偶比较法是把所有要比较的刺激配成对,然后一对一对地呈现,让被试者依据刺激的某一特性进行比较,并一对地呈现,让被试者依据刺激的某一特性进行比较,并做出判断这种特性在两个刺激中的哪一个上表现得更为突做出判断这种特性在两个刺激中的哪一个上表现得更为突出。出。 因为每一刺激都要分别和其他刺激比较,假如以因为每一刺激都要分别和其他刺激比较,假如以n代代表刺激的总数,那么配成对的个数是表刺激的总数,那么配成对的个数

14、是n(n1)/2。然后。然后依它们各自明显于其他刺激的百分比的大小排列成序,即依它们各自明显于其他刺激的百分比的大小排列成序,即可制成一个顺序量表。可制成一个顺序量表。n 为了避免空间和时间误差,则需要再次实验,第一次为了避免空间和时间误差,则需要再次实验,第一次实验中实验中A先于先于B,第二次则第二次则B先于先于A。所以每个单元格都有两。所以每个单元格都有两个结果。个结果。C为两次结果各刺激的和,为两次结果各刺激的和,C为对为对C的调整,的调整,C指指每个刺激在两轮实验中,与其他刺激比较胜出的次数,而每个刺激在两轮实验中,与其他刺激比较胜出的次数,而事实上,每种刺激和它本身也应比教,只不过是

15、不分胜负,事实上,每种刺激和它本身也应比教,只不过是不分胜负,故在每个故在每个C分数上都加分数上都加0.5,因其比较两次,所以要加两个,因其比较两次,所以要加两个0.5,即,即1。n 在有些情况下,实验者认为对偶比较空间和时间效应在有些情况下,实验者认为对偶比较空间和时间效应的干扰并不明显,也可以采用简化的程序,即每对刺激之的干扰并不明显,也可以采用简化的程序,即每对刺激之间仅比较一次。取间仅比较一次。取P=C/(N-1),C=C+5,P=C/N。n对偶比较法对偶比较法在广告应用的测定与评判中的应用在广告应用的测定与评判中的应用n对偶比较法将所有参加比较的广告逐对呈现,评价者按照对偶比较法将所

16、有参加比较的广告逐对呈现,评价者按照某种标准,比较两幅广告的优劣。如果参加比较的广告总某种标准,比较两幅广告的优劣。如果参加比较的广告总数为数为n,测定总共要呈现以,测定总共要呈现以n(n-1)/2 对,为了消除前后对,为了消除前后顺序的误差,比较一般要进行两轮,如果第一轮呈现的次顺序的误差,比较一般要进行两轮,如果第一轮呈现的次序是先序是先A 后后B(或者位置是(或者位置是A左左B右),第两轮呈现则为先右),第两轮呈现则为先B后后A(或(或A右右B左)。每幅广告都要与其他广告比较(左)。每幅广告都要与其他广告比较(n-1)次,二轮共同需比较)次,二轮共同需比较2(n-1)次。)次。假定有假定

17、有10幅广告,分别编号为幅广告,分别编号为A、B、C、D、E、F、G、H、I、J,一名评价人的结果记入下表(何者为,一名评价人的结果记入下表(何者为优,即记何者编号);见下表:优,即记何者编号);见下表: 解:N=5,K=9 Yij2=4*4+4*4+4*4+2*2+2*2+2*2+2*2+3*3+4*4+7*7=138 Yij=4+4+4+2+2+2+2+3+4+7=3428()8*(1389*34)110.0667(1)*(1)5/ 4*9*8ijijYKYUN NK K 对偶比较法需要注意两点:对偶比较法需要注意两点:1、用这种方法得到的顺序量表,还仅仅是针对一个被试的、用这种方法得到的

18、顺序量表,还仅仅是针对一个被试的心理物理量表,尚不能直接推广到更大的人群。心理物理量表,尚不能直接推广到更大的人群。2、这一量表模型要求对偶比较是可传递的(、这一量表模型要求对偶比较是可传递的(transitive),),如果刺激如果刺激A优先于刺激优先于刺激B,而且刺激,而且刺激B优先于刺激优先于刺激C,那么,那么刺激刺激A优先于刺激优先于刺激C。然而,有些情况下这种传递性难以。然而,有些情况下这种传递性难以保证,这时就不能采用对偶比较法。保证,这时就不能采用对偶比较法。2.6 偏相关偏相关n 偏相关分析偏相关分析也称也称净相关分析净相关分析,是指当两个变量同时与,是指当两个变量同时与第三个

19、变量相关时,将第三个变量的影响剔除,只分析另第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间线性相关程度的过程。外两个变量之间线性相关程度的过程。n 所采用的工具是偏相关系数(净相关系数)。控制变量所采用的工具是偏相关系数(净相关系数)。控制变量个数为一时,偏相关系数称为一阶偏相关系数;控制变量个数为一时,偏相关系数称为一阶偏相关系数;控制变量个数为二时,偏相关系数称为二阶相关系数;控制变量个个数为二时,偏相关系数称为二阶相关系数;控制变量个数为零时,偏相关系数称为零阶偏相关系数,也就是数为零时,偏相关系数称为零阶偏相关系数,也就是简单简单相关系数相关系数 n利用样本数据计算偏

20、相关系数,反应了两个变量间净相关利用样本数据计算偏相关系数,反应了两个变量间净相关的强弱程度。在分析变量的强弱程度。在分析变量x1和和x2之间的净相关时,当控之间的净相关时,当控制了变量制了变量x3的线性作用后,的线性作用后,x1和和x2之间的之间的一阶一阶偏相关系偏相关系数数定义为:定义为: 2.7多重相关多重相关n 多重相关系数多重相关系数(multiple correlation coefficient; coefficient of total correlation) 又称又称复相关系数复相关系数,反映,反映一个一个因变量因变量与一组自变量与一组自变量(两个或两个以上两个或两个以上)之间相关程度之间相关程度的的指标指标。n 多重相关系数是包含所有多重相关系数是包含所有变量变量在内的在内的相关系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论