第七章 相关分析课件_第1页
第七章 相关分析课件_第2页
第七章 相关分析课件_第3页
第七章 相关分析课件_第4页
第七章 相关分析课件_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关分析一、基本原理任何事物的变化都与其他事物相互联系和相互影响的,用于描述事物数量特征的变量之间也存在一定的关系。变量之间的关系归纳起来可以分为两种类型:函数关系和统计关系。第七章相关分析函数关系是一一对应的确定性关系,比较容易分析和测度。可是在现实中,变量之间的关系往往并不那么简单。比如,家庭收入和支出、一个人所受的教育程度与其收入、子女身高和父母身高等,它们之间确定存在某种关系,但这些关系无法像函数关系那样,能够用一个确定的函数公式来描述。一个变量x取一定值时,另一个变量y的值可能有几个。这样,一个变量的值不能由另一个变量的值惟一确定,这种关系称为统计关系。第七章相关分析事物之间的统计关系不像函数关系那样直接,但通过对大量数据的观察和研究,就会发现许多变量之间确实存在着某种统计关系,并且有的关系强,有的关系弱,程度各有差异。如何测度事物间统计关系的强弱程度成为人们关注的问题。衡量事物之间或称变量之间线性相关程度的强弱,并用适当的统计指标表示出来,这个过程就是相关分析。为了能够更加准确的描述变量之间的线性相关程度,可以通过计算相关系数进行相关分析。相关系数是衡量变量之间相关程度的一个量值。第七章相关分析二、主要方法在实际中,因为研究的目的不同,变量的类型不同,采用的相关分析方法也不同。SPSS软件的相关模型,有Pearson、Spearman和Kendall

3种子模型。其中Pearson模型用于满足正态分布的定量数据,而对于不满足正态分布的定序、计数数据,则应使用Spearman和Kendall相关模型。不过,Pearson模型是最重要、最基本、最常用的模型。第七章相关分析三、案例案例一、连续变量的相关分析为了研究教育投资与地区经济增长、学生增长之间的关系,某机构调查了26个地区的教育投资与地区经济增长、学生增长的数据,请根据所得到的数据分析其相关关系,并得到相关系数。第七章相关分析案例二、等级变量的相关分析某班10个学生进行了数学和语文测验,分析数学与语文的成绩是否等级相关。第七章相关分析偏相关分析一、偏相关分析的概念

相关分析通过计算两个变量之间的相关系数,分析变量间线性相关的程度。在多元相关分析中,由于受到其他变量的影响,Pearson相关系数只是从表面上反映两个变量相关的性质,往往不能真实地反映变量间的线性相关程度,甚至会给人们造成相关的假象。因此在某些场合中,简单的Pearson相关系数并不是刻划相关关系的本质性统计。所谓偏相关,是指在诸多相关的变量中,剔除其中的一个或若干个变量后,两个变量之间的相关关系,这样的两个变量之间的相关系数叫偏相关系数。偏相关系数才是真正反映两个变量相关关系的统计量。第七章相关分析

偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。

例如在研究身高、体重、肺活量3者的相关关系时,显然肺话量与身高,肺活量与体重均存在一定的正相关关系。但是当我们将体重固定下来,对相同体重的人分析肺活量与身高的关系时,是否仍然具有身高超高,肺活量越大正相关关系呢?恐怕就不一定了。偏相关分析用于计算变量间的偏相关系数,以利于更准确地判断变量之间的相关关系和相关程度。偏相关的概念在教育科学、管理科学、经济科学等社会科学中有着广泛的应用,而且,正确地使用它对正确地得出相应的结论至关重要。第七章相关分析偏相关分析案例

某调查收集了26个城市的教育投资数据、学生增长率和城市经济增长率,试分析其偏相关系数。第七章相关分析距离相关分析为了将变量或观测量(样品)进行分类,通常使用的一种方法是将样品视为m维空间的点,并在该空间定义点与点之间的距离,将距离较近的点归为一类,距离较远的点应视为属于不同的类。多元统计中对距离的定义方法有许多种,而这些定义与变量的数据类型有很大关系,这里仅以间隔测度的变量的距离定义作简要的介绍。第七章相关分析

用d(I,j)表示第i个与第J个样品之间的处离。

一般要求定义的距离必须满足4个条件:①对—切I,jd(I,j)>=0;②对—切I,j,d(i,j)=0

样品i和样品j的各指标值相等;②对一切I,j,d(i,j)=d(j,i);④对一切I,j,k有d(i,j)<=d(i,k)+d(k,j)。各种计算距离的公式,这里从略。第七章相关分析

另一种方法是用相似系数来表示样品之间的亲疏程度。性质越接近的样品,它们之间的相似系数越接近于1(或—1),而彼此无关的样品之间的相似系数则越接近于0,将比较相似的样品归入一类,不怎么相似的则归为不同的类。第七章相关分析相似系数C(I,j)用来表明变量Xi与Xj之间的相似程度。一般规定相似系数应满足如下关系:

(1)C(I,j)=±1

Xi=aXj(a<>0,a为一常数);

(2)|C(I,j)|<=1,对一切i、j成立;

(3)C(I,j)=C(j,i),对一切i、j成立;

(4)|C(I,j)|越接近于1,表示变量Xi与Xj之间的相似程度越高.|C(I,j)|越接近于0,则表示它们之间的关系越疏远。第七章相关分析

距离分析是对观测量之间或变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近的程度;也可用于变量间,以考察预测值对实际值的按拟合程度。它有助于分析复杂的数据集合。距离相关分析根据统计量不同,分为两种:(1)不相似性测量。通过计算样本之间或变量之间的距离来表示;(2)相似性测量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论