相关分析课件_第1页
相关分析课件_第2页
相关分析课件_第3页
相关分析课件_第4页
相关分析课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第14章相关分析本章主要内容:1、相关分析简介;2、简单相关分析;3、偏相关分析;4、Distance过程第14章相关分析本章主要内容:114.1相关分析简介一、相关分析的指标体系1、连续变量的相关指标2、有序变量的相关指标3、名义变量的相关指标4、其他特殊指标14.1相关分析简介一、相关分析的指标体系21、连续变量的相关指标(积差)相关系数(或Pearson相关系数)Spearman相关系数2、有序变量的相关指标有序变量的相关性称为一致性。(1)Gamma统计量(2)Kendall’sTau-b(3)Kendall’sTau-c(4)Somer’sd四个系数都在-1到+1之间取值、其解释与Pearson相关系数相同。值得注意的是对各自对tie(并列值)的不同处理。Gamma不考虑并列值,即在计算时,并列值出现的次数不被计入分母之中。Somers'd将自变量的并列值考虑了进去、但没有考虑因变量的并列值。Kendall'stau-b则将自变量和因变量的并列值同时考虑了进去;而Kendall'stau-c则如同Gamma一样,忽略任何并列值。

1、连续变量的相关指标33、名义变量的相关指标(1)列联系数(2)Phi和Crammer’sV(3)系数(4)UncertainlyCoefficient4、其他特殊指标Eta指标:名义变量和连续变量的相关程度。KappaORRR3、名义变量的相关指标4二、SPSS的相关分析功能(1)Crosstabs中Statistics子对话框(2)Correlate子菜单BivariatePartialDistances二、SPSS的相关分析功能514.2简单相关分析一、方法原理1、基本概念 直线相关 曲线相关 正相关与负相关 完全相关2、系数计算14.2简单相关分析一、方法原理63、积差相关系数的适用条件(1)积差相关系数适用于线性相关的情形。(2)样本中存在的极端值对积差相关系数的计算影响极大,要慎重考虑和处理,必要时可以对其进行剔除,或进行变量变换。(3)积差相关系数要求相应的变量呈双变量正态分布。4、散点图的作用(1)变量间是否存在相关趋势;(2)相关趋势呈现为线性趋势还是曲线趋势;(3)发现明显的异常点,或者强影响点。3、积差相关系数的适用条件7二 案例:

考察总信心指数值和年龄的相关性操作步骤:1、打开数据库后,绘制总信心指数和年龄的散点图;2、单击AnalyzeCorrelateBivariate打开Bivariate对话框。

二 案例:

考察总信心指数值和年龄的相关性操作步骤:82、从左边的变量框中选择需要考察的两个变量进入Variables框内,从CorrelationCoefficients栏内选择相关系数的种类,有Pearson相关系数,Kendall′s一致性系数和Spearman等级相关系数。从检验栏内选择检验方式,有双尾检验和单尾检验两种。3、单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。2、从左边的变量框中选择需要考察的两个变量进入Variab94、单击OK,可以得到相关分析的结果。4、单击OK,可以得到相关分析的结果。10三 秩相关系数秩相关系数又称Spearman等级相关系数。秩相关系数是利用两变量的秩次大小进行线性相关分析。适用范围:对于连续变量,当积差相关系数不适用时,可以使用Spearman等级相关系数来衡量两个变量之间的相关系数。三 秩相关系数秩相关系数又称Spearman等级相关系数。11相关分析课件12四 Kendall相关系数Kendall相关系数适用于有序分类变量。四 Kendall相关系数Kendall相关系数适用于有序13相关分析课件1414.3偏相关分析一、方法原理简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。偏相关分析是指在相关的基础上考虑两个因素以外的各种影响因素,或者说在扣除了其他因素的作用大小以后,重新来考虑这两个因素间的关联程度。计算公式:参见《多元统计分析》。14.3偏相关分析一、方法原理15二 案例:

例:在控制家庭收入对总信心指数影响的前提下,考察总信心指数值和年龄的相关性。总信心指数与年龄存在相关关系,即年龄越老,信心指数越小,年龄越年轻,信心指数越大。同样,总信心指数与家庭收入也存在负相关关系。那么,总信心指数与年龄之间的负相关关系受不受家庭收入的影响?这种影响有多大?这就需要考虑偏相关关系。操作步骤:单击AnalyzeCorrelatePartial打开Partial对话框。二 案例:

例:在控制家庭收入对总信心指数影响的前提下,考16相关分析课件17此处,偏相关系数等于-0.203,与前文的相关系数-0.219是不一样的。此处,偏相关系数等于-0.203,与前文的相关系数-0.211814.4Distance距离一、距离测量与相似性指标在统计学中,距离可以用来表示两个变量的相似程度。另一个常用的相似指标是相关关系。根据变量的不同类型,可以有不同的距离/相似指标。具体内容参见《多元统计分析》中的判别分析和聚类分析。14.4Distance距离一、距离测量与相似性指标191、距离测量指标(1)欧式距离(2)频数表距离或卡方值距离(3)二分类距离2、相似性测量指标(1)计量资料:如,相关系数等(2)二分类变量:如,RussellandRao等。1、距离测量指标20二 案例:基因间距离的计算例:某实验室制作了一张基因芯片,上面一共检测了上万个基因,现在从数据库中提取了7个基因的数据,对其进行距离测量,确定哪些基因的距离比较接近。数据见:distance.sav操作步骤:单击AnalyzeCorrelateDistances打开Distances对话框。二 案例:基因间距离的计算例:某实验室制作了一张基因芯片,21相关分析课件22第14章相关分析本章主要内容:1、相关分析简介;2、简单相关分析;3、偏相关分析;4、Distance过程第14章相关分析本章主要内容:2314.1相关分析简介一、相关分析的指标体系1、连续变量的相关指标2、有序变量的相关指标3、名义变量的相关指标4、其他特殊指标14.1相关分析简介一、相关分析的指标体系241、连续变量的相关指标(积差)相关系数(或Pearson相关系数)Spearman相关系数2、有序变量的相关指标有序变量的相关性称为一致性。(1)Gamma统计量(2)Kendall’sTau-b(3)Kendall’sTau-c(4)Somer’sd四个系数都在-1到+1之间取值、其解释与Pearson相关系数相同。值得注意的是对各自对tie(并列值)的不同处理。Gamma不考虑并列值,即在计算时,并列值出现的次数不被计入分母之中。Somers'd将自变量的并列值考虑了进去、但没有考虑因变量的并列值。Kendall'stau-b则将自变量和因变量的并列值同时考虑了进去;而Kendall'stau-c则如同Gamma一样,忽略任何并列值。

1、连续变量的相关指标253、名义变量的相关指标(1)列联系数(2)Phi和Crammer’sV(3)系数(4)UncertainlyCoefficient4、其他特殊指标Eta指标:名义变量和连续变量的相关程度。KappaORRR3、名义变量的相关指标26二、SPSS的相关分析功能(1)Crosstabs中Statistics子对话框(2)Correlate子菜单BivariatePartialDistances二、SPSS的相关分析功能2714.2简单相关分析一、方法原理1、基本概念 直线相关 曲线相关 正相关与负相关 完全相关2、系数计算14.2简单相关分析一、方法原理283、积差相关系数的适用条件(1)积差相关系数适用于线性相关的情形。(2)样本中存在的极端值对积差相关系数的计算影响极大,要慎重考虑和处理,必要时可以对其进行剔除,或进行变量变换。(3)积差相关系数要求相应的变量呈双变量正态分布。4、散点图的作用(1)变量间是否存在相关趋势;(2)相关趋势呈现为线性趋势还是曲线趋势;(3)发现明显的异常点,或者强影响点。3、积差相关系数的适用条件29二 案例:

考察总信心指数值和年龄的相关性操作步骤:1、打开数据库后,绘制总信心指数和年龄的散点图;2、单击AnalyzeCorrelateBivariate打开Bivariate对话框。

二 案例:

考察总信心指数值和年龄的相关性操作步骤:302、从左边的变量框中选择需要考察的两个变量进入Variables框内,从CorrelationCoefficients栏内选择相关系数的种类,有Pearson相关系数,Kendall′s一致性系数和Spearman等级相关系数。从检验栏内选择检验方式,有双尾检验和单尾检验两种。3、单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。2、从左边的变量框中选择需要考察的两个变量进入Variab314、单击OK,可以得到相关分析的结果。4、单击OK,可以得到相关分析的结果。32三 秩相关系数秩相关系数又称Spearman等级相关系数。秩相关系数是利用两变量的秩次大小进行线性相关分析。适用范围:对于连续变量,当积差相关系数不适用时,可以使用Spearman等级相关系数来衡量两个变量之间的相关系数。三 秩相关系数秩相关系数又称Spearman等级相关系数。33相关分析课件34四 Kendall相关系数Kendall相关系数适用于有序分类变量。四 Kendall相关系数Kendall相关系数适用于有序35相关分析课件3614.3偏相关分析一、方法原理简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。偏相关分析是指在相关的基础上考虑两个因素以外的各种影响因素,或者说在扣除了其他因素的作用大小以后,重新来考虑这两个因素间的关联程度。计算公式:参见《多元统计分析》。14.3偏相关分析一、方法原理37二 案例:

例:在控制家庭收入对总信心指数影响的前提下,考察总信心指数值和年龄的相关性。总信心指数与年龄存在相关关系,即年龄越老,信心指数越小,年龄越年轻,信心指数越大。同样,总信心指数与家庭收入也存在负相关关系。那么,总信心指数与年龄之间的负相关关系受不受家庭收入的影响?这种影响有多大?这就需要考虑偏相关关系。操作步骤:单击AnalyzeCorrelatePartial打开Partial对话框。二 案例:

例:在控制家庭收入对总信心指数影响的前提下,考38相关分析课件39此处,偏相关系数等于-0.203,与前文的相关系数-0.219是不一样的。此处,偏相关系数等于-0.203,与前文的相关系数-0.214014.4Distance距离一、距离测量与相似性指标在统计学中,距离可以用来表示两个变量的相似程度。另一个常用的相似指标是相关关系。根据变量的不同类型,可以有不同的距离/相似指标。具体内容参见《多元统计分析》中的判别分析和聚类分析。14.4Distance距离一、距离测量与相似性指标411、距离测量指标(1)欧式距离(2)频数表距离或卡方值距离(3)二分类距离

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论