首先可绘制矩阵散点图课件_第1页
首先可绘制矩阵散点图课件_第2页
首先可绘制矩阵散点图课件_第3页
首先可绘制矩阵散点图课件_第4页
首先可绘制矩阵散点图课件_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验七相关分析

实验七相关分析7.1

相关分析和回归分析概述7.2

相关分析7.3

偏相关分析

SPSS的相关分析SPSS的相关分析7.1相关分析和回归分析概述客观事物之间的关系大致可归纳为两大类:函数关系(确定性关系):指两事物之间的一种一一对应的关系,如商品的销售额和销售量之间的关系。统计关系(非确定性关系):指两事物之间的一种非一一对应的关系,例如家庭收入和支出、子女身高和父母身高之间的关系等。统计关系又分为相关关系和回归关系两种。相关分析和回归分析都是分析客观事物之间统计关系的数量分析方法。7.1相关分析和回归分析概述客观事物之间的关系大致可归纳为相关分析与回归分析的区别相关关系回归关系变量y与变量x处于平等地位变量y处于被解释的特殊地位变量y与x均为随机变量变量y为随机变量,x可为随机变量,也可为非随机变量目的是刻画变量间的相关程度可解释x对Y的影响大小,还可以对y进行预测与控制相关分析与回归分析的区别相关关系回归关系变量y与变量x处于平7.2相关分析7.2.1散点图7.2.2相关系数7.2.3基本操作7.2.4应用举例7.2相关分析7.2.1散点图相关分析通过图形和数值两种方式,有效地揭示事物之间相关关系的强弱程度和形式。7.2.1散点图

它将数据以点的的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及他们的强弱程度和方向。相关分析通过图形和数值两种方式,有效地揭示事散点图的绘制单击图形旧对话框散点/点状,打开窗口散点图的绘制单击图形旧对话框散点/点状,打开窗口简单分布(SimpleScatter),只能在图上显示一对相关变量矩阵分布(MatrixScatter),在矩阵中显示多个相关变量重叠分布(OverlayScatter),在图上显示多对相关变量3-D分布(3-DScatter),显示三个相关变量简单点,堆积散点图简单分布(SimpleScatter),只能在图上显示一对1、简单散点图选中简单分布,单击定义Define按钮,打开窗口相关回归分析(高校科研研究).sav1、简单散点图相关回归分析(高校科研研究).savY轴YAxis:选择Y轴要绘制的变量X轴XAxis:选择X轴要绘制的变量设置标记SetMarkersby:选择分组变量,SPSS根据该变量的值将观测量分成几组,每组采用不同的符号标注标注个案LabelCasesby:观测量标签变量Y轴YAxis:选择Y轴要绘制的变量首先可绘制矩阵散点图课件2、矩阵散点图在矩阵散点图中,将图形分成多个方格,在每个方格中单独绘制某两个变量的数据。在散点图窗口中选择矩阵散点图,单击定义Define,在出现的窗口中,依次选择投入高级职称人数、课题总数、论文数和获奖数进入矩阵变量Matrix框中,选择是否为直辖市进入设置标记SetMarkers框中。2、矩阵散点图相关回归分析(高校科研研究).sav相关回归分析(高校科研研究).sav首先可绘制矩阵散点图课件3、重叠散点图在重叠散点图中,在一个坐标系中绘制多个不同的变量对。在散点图窗口中选择重叠散点图,单击定义Define,在出现的窗口中,选择变量投入人年数--论文数对和投入高级职称的人年数--专著数对进入Y-XPairs框中。3、重叠散点图相关回归分析(高校科研研究).sav相关回归分析(高校科研研究).sav首先可绘制矩阵散点图课件4、三维散点图三维散点图在三维坐标系中绘制三个变量的数据。在散点图窗口中选择三维散点图,单击Define,在出现的窗口中,分别选择论文数、投入人年数和获奖数为Y轴变量、X轴变量、Z轴变量。4、三维散点图相关回归分析(高校科研研究).sav相关回归分析(高校科研研究).sav首先可绘制矩阵散点图课件5、堆积散点图-简单点图选中简单点,单击定义Define按钮,打开窗口相关回归分析(高校科研研究).sav5、堆积散点图-简单点图选中简单点,单击定义Define按钮首先可绘制矩阵散点图课件对于其它图形的SPSS绘制,可阅读参考书,杜强、贾丽艳,《SPSS统计分析从入门到精通》,人民邮电出版社,2011年书中的第19章,统计图形.对于其它图形的SPSS绘制,可阅读参考书,杜强、贾丽艳,《S7.2.2相关系数利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:第一,计算样本相关系数r;相关系数r的取值在-1~+1之间r>0,正的线性相关关系;r<0负的线性相关关系r=1,完全正相关;r=-1,完全负相关;r=0,不相关|r|>0.8,较强的线性关系;|r|<0.3,线性关系较弱第二,对样本来自的两总体是否存在显著的线性关系进行推断。7.2.2相关系数利用相关系数进行变量间双变量关系强度测量的主要指标对不同类型的变量应采用不同的相关系数来度量双变量关系强度测量的主要指标对不同类型的变量应采用不同的相关适用于两分类变量的分析适用于一分类变量一定距变量的分析适用于两顺序变量的分析更多指标-交叉列联表适用于两分类变量的分析适用于一分类变量一定距变量的分析适用于适用于两个变量都是数值型的数据Pearson简单相关系数的检验统计量为:1.Pearson简单相关系数适用于两个变量都是数值型的数据1.Pearson简单相关系用来度量两定序变量间的线性相关关系,计算时并不直接采用原始数据,而是利用数据的秩,用两变量的秩代替代入Pearson简单相关系数计算公式中,于是其中的和的取值范围被限制在1和n之间,且可被简化为:2.Spearman等级相关系数用来度量两定序变量间的线性相关关系,计算时并不直接采用原始数如果两变量的正相关性较强,它们秩的变化具有同步性,于是的值较小,r趋向于1;如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是的值较大,r趋向于0;在小样本下,在零假设成立时,Spearman等级相关系数服从Spearman分布;在大样本下,Spearman等级相关系数的检验统计量为Z统计量,定义为:Z统计量近似服从标准正态分布。如果两变量的正相关性较强,它们秩的变化具有同步性,于是用非参数检验方法来度量两定序变量间的线性相关关系,利用变量秩数据计算一致对数目(U)和非一致对数目(V)。U较大,V较小,较强正相关;U较小,V较大,较强负相关;U和V大致相当,各占样本数的1/2,相关性较弱.3.Kendall相关系数用非参数检验方法来度量两定序变量间的线性相关关系,利用变量.Kendall统计量的数学定义小样本下服从Kendall分布,大样本下采用的检验统计量为.Kendall统计量的数学定义7.2.3基本操作相关分析用于描述两个变量间关系的密切程度,其特点是

变量不分主次,被置于同等的地位。在分析Analyze的下拉菜单相关Correlate命令项中有三个相关分析功能子命令双变量Bivariate、偏相关Partial、距离Distances,分别对应着相关分析、偏相关分析和相似性测度(距离)的三个SPSS过程。7.2.3基本操作相关分析用于描述两个变量间Bivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的偏相关系数。Distances过程用于对各样本点之间或各个变量之间进行相似性分析,一般不单独使用,而作为聚类分析和因子分析等的预分析。Bivariate过程用于进行两个或多个变量间的相关分析,如

Bivariate相关分析步骤1)选择菜单AnalyzeCorrelateBivariate,出现窗口:Bivariate相关分析步骤1)选择菜单Analyze2)把要分析的变量选到变量Variables框。3)在相关系数CorrelationCoefficents框中选择计算哪种相关系数。4)在显著性检验TestofSignificance框中选择输出相关系数检验的双边(Two-Tailed)概率p值或单边(One-Tailed)概率p值。5)选中标记显著性相关Flagsignificancecorrelation选项表示分析结果中除显示p值外,还输出星号标记,以标明变量间的相关性是否显著;不选中则不输出星号标记。2)把要分析的变量选到变量Variables框。6)在选项Option按钮中的统计Statistics选项中,选中Cross-productdeviationsandcovariances表示输出两变量的离差平方和协方差。6)在选项Option按钮中的统计Statistics选项7.2.4应用举例为研究高等院校人文社会科学研究中立项课题数会受哪些因素的影响,收集1999年31个省市自治区部分高校有关社科研究方面的数据,研究立项课题数(当年)与投入的具有高级职称的人年数(当年)、发表的论文数(上年)之间是否具有较强的线性关系。对该问题的研究可以采用相关分析的方法,首先可绘制矩阵散点图;其次可以计算Pearson简单相关系数。相关回归分析(高校科研研究).sav7.2.4应用举例为研究高等院校人文社会科学研究中立项课题输出结果输出结果7.3偏相关分析7.3.1偏相关分析和偏相关系数7.3.2基本操作7.3.3应用举例7.3偏相关分析7.3.1偏相关分析和偏相关系数上节中的相关系数是研究两变量间线性相关性的,若还存在其他因素影响,就相关系数本身来讲,它未必是两变量间线性相关强弱的真实体现,往往有夸大的趋势。例如,在研究商品的需求量和价格、消费者收入之间的线性关系时,需求量和价格之间的相关关系实际还包含了消费者收入对价格和商品需求量的影响。7.3.1偏相关分析和偏相关系数上节中的相关系数是研究两变量间线性相关性的,若还存在其他因素偏相关分析也称净相关分析,它在控制其他变量的线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。偏相关分析也称净相关分析,它在控制其他变量的线性影响的条件下利用偏相关系数进行分析的步骤第一,计算样本的偏相关系数假设有三个变量y、x1和x2,在分析x1和y之间的净相关时,当控制了x2的线性作用后,x1和y之间的一阶偏相关定义为:偏相关系数的取值范围及大小含义与相关系数相同.利用偏相关系数进行分析的步骤第一,计算样本的偏相关系数第二,对样本来自的两总体是否存在显著的净相关进行推断检验统计量为:其中,r为偏相关系数,n为样本数,q为阶数。T统计量服从n-q-2个自由度的t分布。第二,对样本来自的两总体是否存在显著的净相关进行推断7.3.2基本操作1)选择菜单AnalyzeCorrelatePartial相关回归分析(高校科研研究).sav7.3.2基本操作1)选择菜单AnalyzeCorr2)把参与分析的变量选择到Variables框中。3)选择一个或多个控制变量到Controllingfor框中。4)在TestofSignificance框中选择输出偏相关检验的双尾概率p值或单尾概率p值。5)在Option按钮中的Statistics选项中,选中Zero-orderCorrelations表示输出零阶偏相关系数。至此,SPSS将自动进行偏相关分析和统计检验,并将结果显示到输出窗口。2)把参与分析的变量选择到Variables框中。7.3.3应用举例

上节中研究高校立项课题总数影响因素的相关分析中发现,发现立项课题数与论文数之间有较强正线性相关关系,但应看到这种关系中可能掺入了投入高级职称的人年数的影响,因此,为研究立项课题总数和发表论文数之间的净相关系数,可以将投入高级职称的人年数加以控制,进行偏相关分析。相关回归分析(高校科研研究).sav7.3.3应用举例上节中研究高校立项课题总输出结果相关分析输出结果正强相关偏相关分析输出结果负的弱相关输出结果相关分析输出结果偏相关分析输出结果ThankyouThankyou实验七相关分析

实验七相关分析7.1

相关分析和回归分析概述7.2

相关分析7.3

偏相关分析

SPSS的相关分析SPSS的相关分析7.1相关分析和回归分析概述客观事物之间的关系大致可归纳为两大类:函数关系(确定性关系):指两事物之间的一种一一对应的关系,如商品的销售额和销售量之间的关系。统计关系(非确定性关系):指两事物之间的一种非一一对应的关系,例如家庭收入和支出、子女身高和父母身高之间的关系等。统计关系又分为相关关系和回归关系两种。相关分析和回归分析都是分析客观事物之间统计关系的数量分析方法。7.1相关分析和回归分析概述客观事物之间的关系大致可归纳为相关分析与回归分析的区别相关关系回归关系变量y与变量x处于平等地位变量y处于被解释的特殊地位变量y与x均为随机变量变量y为随机变量,x可为随机变量,也可为非随机变量目的是刻画变量间的相关程度可解释x对Y的影响大小,还可以对y进行预测与控制相关分析与回归分析的区别相关关系回归关系变量y与变量x处于平7.2相关分析7.2.1散点图7.2.2相关系数7.2.3基本操作7.2.4应用举例7.2相关分析7.2.1散点图相关分析通过图形和数值两种方式,有效地揭示事物之间相关关系的强弱程度和形式。7.2.1散点图

它将数据以点的的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及他们的强弱程度和方向。相关分析通过图形和数值两种方式,有效地揭示事散点图的绘制单击图形旧对话框散点/点状,打开窗口散点图的绘制单击图形旧对话框散点/点状,打开窗口简单分布(SimpleScatter),只能在图上显示一对相关变量矩阵分布(MatrixScatter),在矩阵中显示多个相关变量重叠分布(OverlayScatter),在图上显示多对相关变量3-D分布(3-DScatter),显示三个相关变量简单点,堆积散点图简单分布(SimpleScatter),只能在图上显示一对1、简单散点图选中简单分布,单击定义Define按钮,打开窗口相关回归分析(高校科研研究).sav1、简单散点图相关回归分析(高校科研研究).savY轴YAxis:选择Y轴要绘制的变量X轴XAxis:选择X轴要绘制的变量设置标记SetMarkersby:选择分组变量,SPSS根据该变量的值将观测量分成几组,每组采用不同的符号标注标注个案LabelCasesby:观测量标签变量Y轴YAxis:选择Y轴要绘制的变量首先可绘制矩阵散点图课件2、矩阵散点图在矩阵散点图中,将图形分成多个方格,在每个方格中单独绘制某两个变量的数据。在散点图窗口中选择矩阵散点图,单击定义Define,在出现的窗口中,依次选择投入高级职称人数、课题总数、论文数和获奖数进入矩阵变量Matrix框中,选择是否为直辖市进入设置标记SetMarkers框中。2、矩阵散点图相关回归分析(高校科研研究).sav相关回归分析(高校科研研究).sav首先可绘制矩阵散点图课件3、重叠散点图在重叠散点图中,在一个坐标系中绘制多个不同的变量对。在散点图窗口中选择重叠散点图,单击定义Define,在出现的窗口中,选择变量投入人年数--论文数对和投入高级职称的人年数--专著数对进入Y-XPairs框中。3、重叠散点图相关回归分析(高校科研研究).sav相关回归分析(高校科研研究).sav首先可绘制矩阵散点图课件4、三维散点图三维散点图在三维坐标系中绘制三个变量的数据。在散点图窗口中选择三维散点图,单击Define,在出现的窗口中,分别选择论文数、投入人年数和获奖数为Y轴变量、X轴变量、Z轴变量。4、三维散点图相关回归分析(高校科研研究).sav相关回归分析(高校科研研究).sav首先可绘制矩阵散点图课件5、堆积散点图-简单点图选中简单点,单击定义Define按钮,打开窗口相关回归分析(高校科研研究).sav5、堆积散点图-简单点图选中简单点,单击定义Define按钮首先可绘制矩阵散点图课件对于其它图形的SPSS绘制,可阅读参考书,杜强、贾丽艳,《SPSS统计分析从入门到精通》,人民邮电出版社,2011年书中的第19章,统计图形.对于其它图形的SPSS绘制,可阅读参考书,杜强、贾丽艳,《S7.2.2相关系数利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:第一,计算样本相关系数r;相关系数r的取值在-1~+1之间r>0,正的线性相关关系;r<0负的线性相关关系r=1,完全正相关;r=-1,完全负相关;r=0,不相关|r|>0.8,较强的线性关系;|r|<0.3,线性关系较弱第二,对样本来自的两总体是否存在显著的线性关系进行推断。7.2.2相关系数利用相关系数进行变量间双变量关系强度测量的主要指标对不同类型的变量应采用不同的相关系数来度量双变量关系强度测量的主要指标对不同类型的变量应采用不同的相关适用于两分类变量的分析适用于一分类变量一定距变量的分析适用于两顺序变量的分析更多指标-交叉列联表适用于两分类变量的分析适用于一分类变量一定距变量的分析适用于适用于两个变量都是数值型的数据Pearson简单相关系数的检验统计量为:1.Pearson简单相关系数适用于两个变量都是数值型的数据1.Pearson简单相关系用来度量两定序变量间的线性相关关系,计算时并不直接采用原始数据,而是利用数据的秩,用两变量的秩代替代入Pearson简单相关系数计算公式中,于是其中的和的取值范围被限制在1和n之间,且可被简化为:2.Spearman等级相关系数用来度量两定序变量间的线性相关关系,计算时并不直接采用原始数如果两变量的正相关性较强,它们秩的变化具有同步性,于是的值较小,r趋向于1;如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是的值较大,r趋向于0;在小样本下,在零假设成立时,Spearman等级相关系数服从Spearman分布;在大样本下,Spearman等级相关系数的检验统计量为Z统计量,定义为:Z统计量近似服从标准正态分布。如果两变量的正相关性较强,它们秩的变化具有同步性,于是用非参数检验方法来度量两定序变量间的线性相关关系,利用变量秩数据计算一致对数目(U)和非一致对数目(V)。U较大,V较小,较强正相关;U较小,V较大,较强负相关;U和V大致相当,各占样本数的1/2,相关性较弱.3.Kendall相关系数用非参数检验方法来度量两定序变量间的线性相关关系,利用变量.Kendall统计量的数学定义小样本下服从Kendall分布,大样本下采用的检验统计量为.Kendall统计量的数学定义7.2.3基本操作相关分析用于描述两个变量间关系的密切程度,其特点是

变量不分主次,被置于同等的地位。在分析Analyze的下拉菜单相关Correlate命令项中有三个相关分析功能子命令双变量Bivariate、偏相关Partial、距离Distances,分别对应着相关分析、偏相关分析和相似性测度(距离)的三个SPSS过程。7.2.3基本操作相关分析用于描述两个变量间Bivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的偏相关系数。Distances过程用于对各样本点之间或各个变量之间进行相似性分析,一般不单独使用,而作为聚类分析和因子分析等的预分析。Bivariate过程用于进行两个或多个变量间的相关分析,如

Bivariate相关分析步骤1)选择菜单AnalyzeCorrelateBivariate,出现窗口:Bivariate相关分析步骤1)选择菜单Analyze2)把要分析的变量选到变量Variables框。3)在相关系数CorrelationCoefficents框中选择计算哪种相关系数。4)在显著性检验TestofSignificance框中选择输出相关系数检验的双边(Two-Tailed)概率p值或单边(One-Tailed)概率p值。5)选中标记显著性相关Flagsignificancecorrelation选项表示分析结果中除显示p值外,还输出星号标记,以标明变量间的相关性是否显著;不选中则不输出星号标记。2)把要分析的变量选到变量Variables框。6)在选项Option按钮中的统计Statistics选项中,选中Cross-productdeviationsandcovariances表示输出两变量的离差平方和协方差。6)在选项Option按钮中的统计Statistics选项7.2.4应用举例为研究高等院校人文社会科学研究中立项课题数会受哪些因素的影响,收集1999年31个省市自治区部分高校有关社科研究方面的数据,研究立项课题数(当年)与投入的具有高级职称的人年数(当年)、发表的论文数(上年)之间是否具有较强的线性关系。对该问题的研究可以采用相关分析的方法,首先可绘制矩阵散点图;其次可以计算Pearson简单相关系数。相关回归分析(高校科研研究).sav7.2.4应用举例为研究高等院校人文社会科学研究中立项课题输出结果输出结果7.3偏相关分析7.3.1偏相关分析和偏相关系数7.3.2基本操作7.3.3应用举例7.3偏相关分析7.3.1偏相关分析和偏相关系数上节中的相关系数是研究两变量间线性相关性的,若还存在其他因素影响,就相关系数本身来讲,它未必是两变量间线性相关强弱的真实体现,往往有夸大的趋势。例如,在研究商品的需求量和价格、消费者收入之间的线性关系时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论