




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
散点图与线性相关9.1相关分析9.2偏相关分析9.3第九章SPSS的相关分析.散点图与线性相关9.1相关分析9.2偏相关分析9.3第九章1
任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。.任何事物的变化都与其他事物是相互联系和相互影响的,用2
当一个变量x取一定值时,另一变量y可以按照确定的函数公式取一个确定的值,记为y
=
f(x),则称y是x的函数,也就时说y与x两变量之间存在函数关系。又如,某种商品在其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:销售额=价格×销售量。.当一个变量x取一定值时,另一变量y可以按照确定的函数3
函数关系是一一对应的确定性关系,比较容易分析和测度,可是在现实中,变量之间的关系往往并不那么简单。.函数关系是一一对应的确定性关系,比较容易分析和测度,4在医药研究中我们常常要分析变量间的关系,如新生儿年龄与体重、血药浓度与时间关系等。变量之间的关系一般可分为确定性的和非确定性的两大类。我们称这种既有关联又不存在确定性的关系为相关关系(correlation)。.在医药研究中我们常常要分析变量间的关系,如新生儿年龄与体重、5描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相关分析。可根据研究的目的不同,或变量的类型不同,采用不同的相关分析方法。本章介绍常用的相关分析方法:二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离相关分析。.描述变量之间线性相关程度的强弱,并用适当的统计指标表6..7第一节散点图和线性相关.第一节散点图和线性相关.8..9一、散点图的制作【Graphs(图形)】→【LegacyDialogs(旧对话框)】→【Scatter/Dot(散点图/点状图)】.一、散点图的制作【Graphs(图形)】→.10例9-1某研究者测得84名10岁男孩的身高、坐高、体重、胸围、肩宽、肺活量等6项生长发育指标进行研究,观测数据如表9-3所示。对该研究问题可采用相关分析的方法进行研究,首先绘制下列散点图。(1)绘制身高与体重的简单散点图;(2)绘制身高与坐高、身高与肩宽的重叠散点图;(3)绘制身高、体重与肺活量的散点图矩阵;(4)绘制身高、体重与肺活量的三维(3D)散点图;(5)绘制体重的简单点状图。.例9-1某研究者测得84名10岁男孩的身高、坐高、体重、胸11..12..13..14..15..16..17..18..19..20..21..22..23..24..25第二节线性相关.第二节线性相关.26相关系数的取值范围在−1和+1之间,即−1≤r≤+1。其中:若0<r≤1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同;若−1≤r<0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;一、相关分析的基本原理.相关系数的取值范围在−1和+1之间,即−1≤r≤+127..28..29..30为了判断r对ρ的代表性大小,需要对相关系数进行假设检验。(1)首先假设总体相关性为零,即
H0:两总体无显著的线性相关关系。(2)选择检验统计量。对不同类型的变量应采用不同的相关系数,对应也应采用不同的检验统计量。具体内容见后面讨论。.为了判断r对ρ的代表性大小,需要对相关系数进行假设检31(3)计算相应的p-值。(4)统计判断。如果相伴概率值小于或等于指定的显著性水平,则拒绝H0,认为两总体存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝H0,认为两总体不存在显著的线性相关关系。.(3)计算相应的p-值。.32在使用相关系数时,应该注意下面几个问题:(1)相关分析之前一般要作散点图以观察可能的线性趋势以及数据分布条件,从而选挥恰当的统计量。(2)相关系数受变量取值区间大小及样本数目多少的影响比较大。一般来说,如果变量取值区间小,样本所含数目较少,受抽样误差的影响较大,就有可能对本来无关的两种现象,计算出较大的相关系数,得出错误的结论。因此,一般计算相关的成对数据的数目不应少于30对。.在使用相关系数时,应该注意下面几个问题:.33(3)来自于不同群体且不同质的事物的相关系数不能进行比较。(4)对于不同类型的变量数据,计算相关系数的方法也不相同。.(3)来自于不同群体且不同质的事物的相关系数不能进行比较。.34
在二元变量的相关分析过程中比较常用的几个相关系数是Pearson简单相关系数、Spearman和Kendall'stua-b等级相关系数。.在二元变量的相关分析过程中比较常用的几个相关系数是P35二、常用的不同类型相关系数指标(一)Pearson相关系数Pearson相关系数用来度量两数值型变量间的线性相关性。其定义为.二、常用的不同类型相关系数指标(一)Pearson相关系数.36由此可进一步得知Pearson相关系数还可以表示为.由此可进一步得知Pearson相关系数还可以.37Pearson相关系数的显著性检验的统计量是服从自由度为n-2的t分布的t统计量:SPSS将自动计算Pearson简单相关系数、t检验统计量的值和对应的概率P值。.Pearson相关系数的显著性检验的统计量是.38
Pearson简单相关系数用来衡量定距变量间的线性关系。例如,“年龄”变量、“收入”变量、“成绩”变量等都是典型的定距变量。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系可用Pearson简单相关系数。.Pearson简单相关系数用来衡量定距变量间的线性关39(二)Spearman相关系数Spearman相关系数(又称等级相关系数)用来度量定序(等级)变量间的线性相关关系。它是利用两变量的秩次(rank)大小作线性相关分析。.(二)Spearman相关系数.40该公式还可简化为.该公式还可简化为.41..42Spearman相关系数适用条件为(1)两个变量的变量值是以等级次序(秩次)表示的数据资料;。(2)一个变量的变量值是等级(定序)数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。.Spearman相关系数适用条件为.43在小样本时,在零假设成立时Spearman等级相关系数服从Spearman分布;在大样本下,Spearman等级相关系数的检验统计量为近似服从标准正态分布的Z统计量:.在小样本时,在零假设成立时Spearman等级相关系数服从S44对于定序变量,例如,“最高学历”变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学本科、6—研究生以上。可以使用Spearman相关系数来分析。.对于定序变量,例如,“最高学历”变量的.45显然,Spearman相关系数的应用范围要比Pearson相关系数广泛,即使服从Pearson相关系数的数据也可计算Spearman相关系数,但统计效能比Pearson相关系数要低些。Spearman相关系数的突出优点是对数据的总体分布、样本大小都可以不作要求,缺点是计算精度不高。.显然,Spearman相关系数的应用范围要比Pearson相46(三)Kendall相关系数Kendall相关系数用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情形,这种指标采用非参数检验方法测度变量间的相关关系。P为一致对子数、Q为不一致对子数一致即行变量等级高列变量等级也高。.(三)Kendall相关系数.47在小样本下,Kendall统计量服从Kendall分布。在大样本下采用近似服从标准正态分布的Z检验统计量:.在小样本下,Kendall统计量服从Kendall分布。48三、相关分析的SPSS操作例9-2对例9-1中所考察的84名10岁男孩的身高等6项生长发育指标数据<男孩生长发育指标.sav>,试作相关分析,考察这些变量指标间是否具有显著的线性相关关系。研究问题1(Pearson相关系数).三、相关分析的SPSS操作研究问题1(Pearson相49【Analyze(分析)】→【Correlate(相关)】→【Bivariate(两变量间相关)】
系统会弹出【BivariateCorrelation(两变量间相关)】主对话框,用于设定进行相关分析的变量等。.【Analyze(分析)】→.50..51..52..53..54研究问题(Pearson相关系数)某班级学生数学和化学的期末考试成绩如表6-1所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。.研究问题(Pearson相关系数).55人名数学化学hxh99.0090.00yaju88.0099.00yu65.0070.00shizg89.0078.00hah94.0088.00smith90.0088.00watet79.0075.00jess95.0098.00wish95.0098.00laly80.0099.00john70.0089.00chen89.0098.00david85.0088.00caber50.0060.00marry87.0087.00joke87.0087.00jake86.0088.00herry76.0079.00学生的数学和化学成绩.人名数学化学hxh99.0090.056实现步骤.实现步骤.57..58..59结果和讨论.结果和讨论.60
如果对变量之间的相关程度不需要掌握得那么精确,可以通过绘制变量的相关散点图来直接判断。仍以上例来说明。.如果对变量之间的相关程度不需要掌握得那么精确,可以通61..62研究问题()某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量“作文1”和“作文2”,数据如表6-2所示。问两次评分的等级相关有多大,是否达到显著水平?.研究问题().63学生作文两次的得分情况人名作文1作文2hxh86.0083.00yaju78.0082.00yu62.0070.00shizg75.0073.00hah89.0092.00smith67.0065.00watet96.0093.00jess80.0085.00wish77.0075.00laly59.0065.00john79.0075.00chen68.0070.00david85.0080.00caber87.0075.00marry75.0080.00joke73.0078.00jake95.0090.00herry88.0090.00.学生作文两次的得分情况人名作文1作文64实现步骤.实现步骤.65结果和讨论.结果和讨论.66第三节偏相关分析二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。.第三节偏相关分析二元变量的相关分析在一些情况下无67定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。
偏相关分析也称净相关分析
偏相关分析的工具是计算偏相关系数r12,3。一、统计学上的定义和计算公式.定义:偏相关分析是指当两个变量同时与第三个变量相关时68利用偏相关系数进行变量间净关系分析通常需要完成以下两大步骤:第一,计算样本的偏相关系数。.利用偏相关系数进行变量间净关系分析通.69..70第二,对样本来自的两总体是否存在显著的净相关进行检验推断。净相关显著性检验的基本步骤是:(1)提出零假设H0:两总体的偏相关系数为0,即相关性不显著。(2)选择偏相关分析的t检验统计量:.第二,对样本来自的两总体是否存在显著的.71..72(3)计算检验统计量的观测值和对应的概率P值。(4)统计判断。如果概率P值小于给定的显著性水平,应拒绝零假设,认为两总体的偏相关系数与0有显著差异,相关性显著;反之,如果概率P值大于给定的显著性水平,则不拒绝零假设,可以认为两总体的偏相关系数与0无显著差异,相关性不显著。.(3)计算检验统计量的观测值和对应的概率P值。.73二、偏相关分析的SPSS操作应用研究问题1例9-2对例9-1中研究的84名10岁男孩6项生长发育指标数据,试进行扣除了身高的影响时坐高、肩宽与肺活量之间的偏相关分析。.二、偏相关分析的SPSS操作应用研究问题1.74..75..76..77表9-18偏相关系数CorrelationsControlVariables坐高肩宽肺活量身高坐高Correlation1.000-.022.087Significance(2-tailed)..845.434df08181肩宽Correlation-.0221.000.362Significance(2-tailed).845..001df81081肺活量Correlation.087.3621.000Significance(2-tailed).434.001.df81810.表9-18偏相关系数CorrelationsControl78
研究问题2某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如表6-3所示。现求降雨量对产量的偏相关。.研究问题2.79早稻产量与降雨量和温度之间的关系产量降雨量温度150.0025.006.00230.0033.008.00300.0045.0010.00450.00105.0013.00480.00111.0014.00500.00115.0016.00550.00120.0017.00580.00120.0018.00600.00125.0018.00600.00130.0020.00.早稻产量与降雨量和温度之间的关系产量降雨量温80实现步骤.实现步骤.81..82..83结果和讨论.结果和讨论.84一、统计学上的定义和计算公式距离相关分析(不做考试要求)距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。.一、统计学上的定义和计算公式距离相关分析(不做考试要求)85距离相关分析的结果可以用于其他分析过程。例如,因子分析、聚类分析等,有助于分析复杂的数据集合。.距离相关分析的结果可以用于其他分析过程。例如,因子分86距离相关分析根据统计量不同,分为以下两种。不相似性测量:通过计算样本之间或变量之间的距离来表示。相似性测量:通过计算Pearson相关系数或Cosine相关来表示。.距离相关分析根据统计量不同,分为以下两种。.87距离相关分析根据分析对象不同,分为以下两种。样本间分析:样本和样本之间的距离相关分析。变量间分析:变量和变量之间的距离相关分析。.距离相关分析根据分析对象不同,分为以下两种。.88在不相似性测量的距离分析中,根据不同类型的变量,采用不同的统计量进行计算。(1)对连续变量的样本(x,y)进行距离相关分析时,常用的统计量有以下几种。.在不相似性测量的距离分析中,根据不同类型的变量,采用89..90..91..92..93..94..95..96..97二、SPSS中实现过程距离相关分析分为相似性测量和不相似性测量,也可分为样本间分析和变量间分析。下面分别对这4种情况进行讲解。.二、SPSS中实现过程距离相关分析分为相似性测量和98研究问题1—变量之间的相似性测量分析对6个标准电子元件的电阻(欧姆)进行3次平行测试,测得结果如表6-4所示。问测试结果是否一致。表6-4 3次测量情况123456第一次0.1400.1380.1430.1410.1440.137第二次0.1350.1400.1420.1360.1380.140第三次0.1410.1420.1370.1400.1420.143.研究问题1—变量之间的相似性测量分析表6-4 3次测量99实现步骤图6-12在菜单中选择“Distances”命令.实现步骤图6-12在菜单中选择“Distances100图6-13“Distances”对话框(一).图6-13“Distances”对话框(一).101图6-14“Distance:SimilarityMeasure”对话框(一).图6-14“Distance:SimilarityMe102
图6-15“Distances”对话框(二)
.图6-15“Distances”对话框(二).103图6-16“Distance:DissimilarityMeasures”对话框(一).图6-16“Distance:Dissimilarity104研究问题3—个案之间的相似性测量分析某动物一次产下3个幼仔,分别对3个幼仔的长、体重、四肢总长、头重进行测量,试就这几个测量而言,分析3个幼仔的相似性,数据如表6-5所示。.研究问题3—个案之间的相似性测量分析.105表6-5 3个幼仔情况长体重四肢总长头重第一个5021510011第二个5122011012第三个5222011212.表6-5 3个幼仔情况长体重四肢总长头106图6-17“Distances”对话框(三)实现步骤.图6-17“Distances”对话框(三)实现步107图6-18“Distances:SimilarityMeasures”对话框(二).图6-18“Distances:SimilarityM108研究问题4—个案之间的不相似性测量分析以问题3中的数据为例,求幼仔的不相似程度(距离)。.研究问题4—个案之间的不相似性测量分析.109实现步骤图6-19“Distances”对话框(四).实现步骤图6-19“Distances”对话框(四110图6-20“Distances:DissimilarityMeasures”对话框(二).图6-20“Distances:Dissimilarit1116.5.3结果和讨论
(1)研究问题1的SPSS运行结果如下面两个表格所示。.6.5.3结果和讨论(1)研究问题1的SPSS运112(2)研究问题2的SPSS运行结果如下面两个表格所示。.(2)研究问题2的SPSS运行结果如下面两个表格所示113(3)研究问题3的SPSS运行结果如下面两个表格所示。.(3)研究问题3的SPSS运行结果如下面两个表格所示114(4)研究问题4的SPSS运行结果如下面两个表格所示。.(4)研究问题4的SPSS运行结果如下面两个表格所示115小结相关分析即是用适当的统计指标来衡量事物之间,以及变量之间线性相关程度的强弱。相关分析的方法很多,包括简单相关分析、偏相关分析和距离相关分析。.小结相关分析即是用适当的统计指标来衡量事物之116小结简单相关分析包括定距变量的相关分析和定序变量的相关分析。前者通过计算定距变量间的相关系数来判断两个或两个以上定距变量之间的相关程度。后者则采用非参数检验的方法利用等级相关系数来衡量定序变量之间的相关程度;偏相关分析是指在排除了第三者影响的前提下,衡量两个变量之间的相关程度,当然第三者与这两个变量之间要有一定的联系;距离相关分析是对观测变量之间差异度或相似程度进行的测量。.小结简单相关分析包括定距变量的相关分析和定序变117小结1、简单相关分析可通过“Analysis”/“Correlate”/“Bivariate”子菜单来实现;2、偏相关分析可通过“Analysis”/“Correlate”/“Partial”子菜单来实现;3、距离相关分析通过“Analysis”/“Correlate”/“Distances”子菜单来实现。.小结1、简单相关分析可通过“Analysis”118散点图与线性相关9.1相关分析9.2偏相关分析9.3第九章SPSS的相关分析.散点图与线性相关9.1相关分析9.2偏相关分析9.3第九章119
任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。.任何事物的变化都与其他事物是相互联系和相互影响的,用120
当一个变量x取一定值时,另一变量y可以按照确定的函数公式取一个确定的值,记为y
=
f(x),则称y是x的函数,也就时说y与x两变量之间存在函数关系。又如,某种商品在其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:销售额=价格×销售量。.当一个变量x取一定值时,另一变量y可以按照确定的函数121
函数关系是一一对应的确定性关系,比较容易分析和测度,可是在现实中,变量之间的关系往往并不那么简单。.函数关系是一一对应的确定性关系,比较容易分析和测度,122在医药研究中我们常常要分析变量间的关系,如新生儿年龄与体重、血药浓度与时间关系等。变量之间的关系一般可分为确定性的和非确定性的两大类。我们称这种既有关联又不存在确定性的关系为相关关系(correlation)。.在医药研究中我们常常要分析变量间的关系,如新生儿年龄与体重、123描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相关分析。可根据研究的目的不同,或变量的类型不同,采用不同的相关分析方法。本章介绍常用的相关分析方法:二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离相关分析。.描述变量之间线性相关程度的强弱,并用适当的统计指标表124..125第一节散点图和线性相关.第一节散点图和线性相关.126..127一、散点图的制作【Graphs(图形)】→【LegacyDialogs(旧对话框)】→【Scatter/Dot(散点图/点状图)】.一、散点图的制作【Graphs(图形)】→.128例9-1某研究者测得84名10岁男孩的身高、坐高、体重、胸围、肩宽、肺活量等6项生长发育指标进行研究,观测数据如表9-3所示。对该研究问题可采用相关分析的方法进行研究,首先绘制下列散点图。(1)绘制身高与体重的简单散点图;(2)绘制身高与坐高、身高与肩宽的重叠散点图;(3)绘制身高、体重与肺活量的散点图矩阵;(4)绘制身高、体重与肺活量的三维(3D)散点图;(5)绘制体重的简单点状图。.例9-1某研究者测得84名10岁男孩的身高、坐高、体重、胸129..130..131..132..133..134..135..136..137..138..139..140..141..142..143第二节线性相关.第二节线性相关.144相关系数的取值范围在−1和+1之间,即−1≤r≤+1。其中:若0<r≤1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同;若−1≤r<0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;一、相关分析的基本原理.相关系数的取值范围在−1和+1之间,即−1≤r≤+1145..146..147..148为了判断r对ρ的代表性大小,需要对相关系数进行假设检验。(1)首先假设总体相关性为零,即
H0:两总体无显著的线性相关关系。(2)选择检验统计量。对不同类型的变量应采用不同的相关系数,对应也应采用不同的检验统计量。具体内容见后面讨论。.为了判断r对ρ的代表性大小,需要对相关系数进行假设检149(3)计算相应的p-值。(4)统计判断。如果相伴概率值小于或等于指定的显著性水平,则拒绝H0,认为两总体存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝H0,认为两总体不存在显著的线性相关关系。.(3)计算相应的p-值。.150在使用相关系数时,应该注意下面几个问题:(1)相关分析之前一般要作散点图以观察可能的线性趋势以及数据分布条件,从而选挥恰当的统计量。(2)相关系数受变量取值区间大小及样本数目多少的影响比较大。一般来说,如果变量取值区间小,样本所含数目较少,受抽样误差的影响较大,就有可能对本来无关的两种现象,计算出较大的相关系数,得出错误的结论。因此,一般计算相关的成对数据的数目不应少于30对。.在使用相关系数时,应该注意下面几个问题:.151(3)来自于不同群体且不同质的事物的相关系数不能进行比较。(4)对于不同类型的变量数据,计算相关系数的方法也不相同。.(3)来自于不同群体且不同质的事物的相关系数不能进行比较。.152
在二元变量的相关分析过程中比较常用的几个相关系数是Pearson简单相关系数、Spearman和Kendall'stua-b等级相关系数。.在二元变量的相关分析过程中比较常用的几个相关系数是P153二、常用的不同类型相关系数指标(一)Pearson相关系数Pearson相关系数用来度量两数值型变量间的线性相关性。其定义为.二、常用的不同类型相关系数指标(一)Pearson相关系数.154由此可进一步得知Pearson相关系数还可以表示为.由此可进一步得知Pearson相关系数还可以.155Pearson相关系数的显著性检验的统计量是服从自由度为n-2的t分布的t统计量:SPSS将自动计算Pearson简单相关系数、t检验统计量的值和对应的概率P值。.Pearson相关系数的显著性检验的统计量是.156
Pearson简单相关系数用来衡量定距变量间的线性关系。例如,“年龄”变量、“收入”变量、“成绩”变量等都是典型的定距变量。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系可用Pearson简单相关系数。.Pearson简单相关系数用来衡量定距变量间的线性关157(二)Spearman相关系数Spearman相关系数(又称等级相关系数)用来度量定序(等级)变量间的线性相关关系。它是利用两变量的秩次(rank)大小作线性相关分析。.(二)Spearman相关系数.158该公式还可简化为.该公式还可简化为.159..160Spearman相关系数适用条件为(1)两个变量的变量值是以等级次序(秩次)表示的数据资料;。(2)一个变量的变量值是等级(定序)数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。.Spearman相关系数适用条件为.161在小样本时,在零假设成立时Spearman等级相关系数服从Spearman分布;在大样本下,Spearman等级相关系数的检验统计量为近似服从标准正态分布的Z统计量:.在小样本时,在零假设成立时Spearman等级相关系数服从S162对于定序变量,例如,“最高学历”变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学本科、6—研究生以上。可以使用Spearman相关系数来分析。.对于定序变量,例如,“最高学历”变量的.163显然,Spearman相关系数的应用范围要比Pearson相关系数广泛,即使服从Pearson相关系数的数据也可计算Spearman相关系数,但统计效能比Pearson相关系数要低些。Spearman相关系数的突出优点是对数据的总体分布、样本大小都可以不作要求,缺点是计算精度不高。.显然,Spearman相关系数的应用范围要比Pearson相164(三)Kendall相关系数Kendall相关系数用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情形,这种指标采用非参数检验方法测度变量间的相关关系。P为一致对子数、Q为不一致对子数一致即行变量等级高列变量等级也高。.(三)Kendall相关系数.165在小样本下,Kendall统计量服从Kendall分布。在大样本下采用近似服从标准正态分布的Z检验统计量:.在小样本下,Kendall统计量服从Kendall分布。166三、相关分析的SPSS操作例9-2对例9-1中所考察的84名10岁男孩的身高等6项生长发育指标数据<男孩生长发育指标.sav>,试作相关分析,考察这些变量指标间是否具有显著的线性相关关系。研究问题1(Pearson相关系数).三、相关分析的SPSS操作研究问题1(Pearson相167【Analyze(分析)】→【Correlate(相关)】→【Bivariate(两变量间相关)】
系统会弹出【BivariateCorrelation(两变量间相关)】主对话框,用于设定进行相关分析的变量等。.【Analyze(分析)】→.168..169..170..171..172研究问题(Pearson相关系数)某班级学生数学和化学的期末考试成绩如表6-1所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。.研究问题(Pearson相关系数).173人名数学化学hxh99.0090.00yaju88.0099.00yu65.0070.00shizg89.0078.00hah94.0088.00smith90.0088.00watet79.0075.00jess95.0098.00wish95.0098.00laly80.0099.00john70.0089.00chen89.0098.00david85.0088.00caber50.0060.00marry87.0087.00joke87.0087.00jake86.0088.00herry76.0079.00学生的数学和化学成绩.人名数学化学hxh99.0090.0174实现步骤.实现步骤.175..176..177结果和讨论.结果和讨论.178
如果对变量之间的相关程度不需要掌握得那么精确,可以通过绘制变量的相关散点图来直接判断。仍以上例来说明。.如果对变量之间的相关程度不需要掌握得那么精确,可以通179..180研究问题()某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量“作文1”和“作文2”,数据如表6-2所示。问两次评分的等级相关有多大,是否达到显著水平?.研究问题().181学生作文两次的得分情况人名作文1作文2hxh86.0083.00yaju78.0082.00yu62.0070.00shizg75.0073.00hah89.0092.00smith67.0065.00watet96.0093.00jess80.0085.00wish77.0075.00laly59.0065.00john79.0075.00chen68.0070.00david85.0080.00caber87.0075.00marry75.0080.00joke73.0078.00jake95.0090.00herry88.0090.00.学生作文两次的得分情况人名作文1作文182实现步骤.实现步骤.183结果和讨论.结果和讨论.184第三节偏相关分析二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。.第三节偏相关分析二元变量的相关分析在一些情况下无185定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。
偏相关分析也称净相关分析
偏相关分析的工具是计算偏相关系数r12,3。一、统计学上的定义和计算公式.定义:偏相关分析是指当两个变量同时与第三个变量相关时186利用偏相关系数进行变量间净关系分析通常需要完成以下两大步骤:第一,计算样本的偏相关系数。.利用偏相关系数进行变量间净关系分析通.187..188第二,对样本来自的两总体是否存在显著的净相关进行检验推断。净相关显著性检验的基本步骤是:(1)提出零假设H0:两总体的偏相关系数为0,即相关性不显著。(2)选择偏相关分析的t检验统计量:.第二,对样本来自的两总体是否存在显著的.189..190(3)计算检验统计量的观测值和对应的概率P值。(4)统计判断。如果概率P值小于给定的显著性水平,应拒绝零假设,认为两总体的偏相关系数与0有显著差异,相关性显著;反之,如果概率P值大于给定的显著性水平,则不拒绝零假设,可以认为两总体的偏相关系数与0无显著差异,相关性不显著。.(3)计算检验统计量的观测值和对应的概率P值。.191二、偏相关分析的SPSS操作应用研究问题1例9-2对例9-1中研究的84名10岁男孩6项生长发育指标数据,试进行扣除了身高的影响时坐高、肩宽与肺活量之间的偏相关分析。.二、偏相关分析的SPSS操作应用研究问题1.192..193..194..195表9-18偏相关系数CorrelationsControlVariables坐高肩宽肺活量身高坐高Correlation1.000-.022.087Significance(2-tailed)..845.434df08181肩宽Correlation-.0221.000.362Significance(2-tailed).845..001df81081肺活量Correlation.087.3621.000Significance(2-tailed).434.001.df81810.表9-18偏相关系数CorrelationsControl196
研究问题2某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如表6-3所示。现求降雨量对产量的偏相关。.研究问题2.197早稻产量与降雨量和温度之间的关系产量降雨量温度150.0025.006.00230.0033.008.00300.0045.0010.00450.00105.0013.00480.00111.0014.00500.00115.0016.00550.00120.0017.00580.00120.0018.00600.00125.0018.00600.00130.0020.00.早稻产量与降雨量和温度之间的关系产量降雨量温198实现步骤.实现步骤.199..200..201结果和讨论.结果和讨论.202一、统计学上的定义和计算公式距离相关分析(不做考试要求)距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。.一、统计学上的定义和计算公式距离相关分析(不做考试要求)203距离相关分析的结果可以用于其他分析过程。例如,因子分析、聚类分析等,有助于分析复杂的数据集合。.距离相关分析的结果可以用于其他分析过程。例如,因子分204距离相关分析根据统计量不同,分为以下两种。不相似性测量:通过计算样本之间或变量之间的距离来表示。相似性测量:通过计算Pearson相关系数或Cosine相关来表示。.距离相关分析根据统计量不同,分为以下两种。.205距离相关分析根据分析对象不同,分为以下两种。样本间分析:样本和样本之间的距离相关分析。变量间分析:变量和变量之间的距离相关分析。.距离相关分析根据分析对象不同,分为以下两种。.206在不相似性测量的距离分析中,根据不同类型的变量,采用不同的统计量进行计算。(1)对连续变量的样本(x,y)进行距离相关分析时,常用的统计量有以下几种。.在不相似性测量的距离分析中,根据不同类型的变量,采用207..208..209..210..211..212..213..214..215二、SPSS中实现过程距离相关分析分为相似性测量和不相似性测量,也可分为样本间分析和变量间分析。下面分别对这4种情况进行讲解。.二、SPSS中实现过程距离相关分析分为相似性测量和216研究问题1—变量之间的相似性测量分析对6个标准电子元件的电阻(欧姆)进行3次平行测试,测得结果如表6-4所示。问测试结果是否一致。表6-4 3次测量情况123456第一次0.1400.1380.1430.1410.1440.137第二次0.1350.140
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江西加油罐采购合同范本
- 锡山区餐饮投资合同范本
- 物业空调安装免责协议书
- 灌溉水渠修复协议书范本
- 用工程货款买房合同范本
- 法律欠款回收协议书范本
- 腻子工工程分包合同范本
- 父母卖房给子女合同范本
- 机械厂临时工合同协议书
- 砖窑摊位转让协议书模板
- 2025委托代加工合同范本
- 护理管理计划
- IT主管岗位月度绩效考核表
- 我国非密敏感信息管理体系建设:思考与策略研究
- 社区护理考试题(含参考答案)
- (完整版)医疗安全管理制度
- Citect2018完整培训手册
- GB/T 15231-2023玻璃纤维增强水泥性能试验方法
- 医院关于成立食堂食品安全领导小组的通知
- 《村卫生室管理办法(试行)》课件(PPT 49页)
- 办公室工作手册(共83页)
评论
0/150
提交评论