第七章SPSS的相关分析_第1页
第七章SPSS的相关分析_第2页
第七章SPSS的相关分析_第3页
第七章SPSS的相关分析_第4页
第七章SPSS的相关分析_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

相关分析与检验主要内容方差分析回顾相关分析的概念列联分析简单相关分析偏相关分析方差分析回顾概念:方差分析是从因变量的方差入手,研究诸多自变量中哪些变量是对因变量有显著影响的变量,对因变量有显著影响的各个自变量其不同水平以及各水平的交互搭配是如何影响因变量的。方差分析认为因变量的变化受两类因素的影响:第一,自变量不同水平所产生的影响;第二,随机变量所产生的影响。这里的随机变量指那些人为很难控制的因素,主要指试验过程中的抽样误差。单因素方差分析当一个变量为定类变量,另一变量为定距变量时,两变量间是否有关,通常以分组平均数比较的方法来考察。即按照定类变量的不同取值来分组,看每个分组的定距变量的平均数是否有差异。不同组间的平均数差异越小,两个变量间的关系越弱;相反,平均数差异越大,变量间关系越强。单因素方差分析的基本步骤提出原假设:自变量不同水平下因变量各总体的均值无显著差异。选择检验统计量:F统计量。计算检验统计量的观测值和概率P值。给出显著性水平,并作出决策。一、相关关系的概念(一)函数关系:指的是两事物间的一种一一对应的关系,即当变量x取一定值时,另一变量y可以依确定的函数取唯一确定的值。例如:商品的销售额与销售量之间的关系,在单价确定时,给出销售量可以唯一的确定销售额。(二)相关关系:两事物间非一一对应的关系,即当变量x取一定值时,另一变量y无法依确定的函数取唯一确定的值。例如:家庭收入和支出、子女身高和父母身高之间的关系。这些事物之间存在一定的关系,但这些关系不能像函数关系那样用一个数学函数式描述。相关分析内容相关分析是分析客观事物之间关系的数量分析方法,是统计分析方法中最重要的内容之一。主要内容:对变量间的相关关系进行分析,包括简单相关分析和偏相关分析相关分析之一——有关与无关寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即:有关与无关。在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。性别与四级英语考试通过率的相关统计表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。自变量因变量变量关系的统计类型相关分析之二——关系强度变量关系强度的含义:指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析:A)两变量是否相互独立。B)两变量是否有共变趋势。C)一变量的变化多大程度上能由另一变量的变化来解释。变量关系强度测量的主要指标相关分析之三——关系性质直线相关与曲线相关正相关与负相关完全相关、不相关、不完全相关二、列联相关(一)列联分析的基本原理自变量发生变化,因变量取值是否也发生变化。比较边缘百分比和条件百分比的差别。卡方测量用来考察两变量是否独立(无关)。其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变量有关,或称两变量不独立。由此可见,期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就越有相关。因此,卡方的表达式如下:卡方的取值在0~∞之间。卡方值越大,关联性越强。在SPSS中,有PearsonX2和相似比卡方(LikelihoodRatioX2)两种。

的改进标准化系数:为使值有一固定的区间,便于比较,采用了以下几个修正:A、φ系数(Phi):(0~1),适用于2×2表。B、列联系数(ContingencyCoefficient):(0~1),适用任意表。C、CramerV系数:(0~1),适用任意表。D、λ系数(Lambda):(0~1),适用任意表。E、Goodman&Kruskal-tau系数:(0~1),适用任意表。

(二)列联表分析的功能根据收集到的样本数据编制交叉列联表;在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析。列联表的格式(三)列联表分析过程列联表分析步骤:

按AnalyzeDescriptiveStatisticsCrosstabs顺序打开Crosstabs主对话框。Crosstabs对话框TableFormat对话框决定各行的排列顺序:升序降序(四)例1

为了探讨吸烟与慢性支气管炎有无关系,调查了339人,情况如下:吸烟和慢性支气管炎调查表患慢性支气管炎未患慢性支气管炎吸烟43162不吸烟13121录入数据“Crosstab.sav”。变量h为频次;变量x为是否吸烟:1为吸烟,2为不吸烟;变量n为是否患病:1为患病,2为不患病。选择变量h进行加权。按Analyze--DescriptiveStatistics--Crootabs顺序打开Crootabs主对话框。将x变量选入Row框作为行变量,将n变量选入Column框作为列变量。打开Statistics对话框,选中Chi-square\Contingencycoefficient和PhiandCramer’sV复选框,单击Continue返回。单击Cell按钮,打开Celldisplay对话框,选中observed和Expected复选框,单击Continue返回;单击OK。1.操作步骤统计摘要表,列出观测量有效值个数、缺失值个数和总的个数。

2.输出结果及分析

吸烟与患病统计摘要表吸烟与患病列联表卡方检验

对称性检验表例2:利用住房状况问卷调查数据,分析本市户口和外地户口家庭对“未来三年是否打算买房”是否持相同态度。首先,在所调查的2880个样本中有113个样本因缺失值而被剔除,2712户为本市户口,168户为外地户口,分别占样本总量的94.2%和5.8%,可见,本市户口占多数;未来三年不打算买房、打算买房的样本量分别为2161和719,各占总样本的75%和25%,不打算买房的占较大比例。其次,对不同户口进行分析。在本市户口中未来三年不打算买房和打算买房的样本量分别为2052和660,各占总样本的75.7%和24.3%,不打算买房的仍占较大比例,但打算买房的低于总体比例的25%;在外地户口中,未来三年不打算买房和打算买房的样本量分别为109和59,各占总样本的64.9%和35.1%,未来三年不打算买房的仍占较大比例,但打算买房的比例高于总体比例25%。最后,对不同看法进行分析。如果显著性水平设为0.05,则概率值小于0.05,拒绝原假设,认为本市户口和外地户口对未来三年是否打算买房的看法是不一致的。三、相关分析(Correlate)(一)简介相关分析用于描述两个变量间联系的密切程度,其特点是变量不分主次,被置于同等的地位。检验的假设为相关系数为0。可选择是单尾检验还是双尾检验。在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令Bivariate过程、Partial过程、Distances过程,分别对应着相关分析、偏相关分析和相似性测度的三个spss过程。(二)相关分析类型Bivariate(双变量)过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。Partial(偏相关)过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。Distances过程用于对同一变量各观察单位间的数值或各个不同变量间进行相似性或不相似性分析,一般不单独使用,而作为因子分析等的预分析。(三)双变量相关分析在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否则可能的出错误结论。Bivariate相关分析的步骤:输入数据后,依次单击Analyze—Correlate—Bivariate,打开BivariateCorrelations对话框例1:利用住房状况问卷调查数据,分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。解题思路第一步:绘制散点图第二步:计算相关系数散点图类型简单散点图:表示一对变量间统计关系的散点图。重叠散点图:表示多对变量间统计关系的散点图。矩阵散点图:以矩阵形式分别显示多对变量间的统计关系。三维散点图:以立体图的形式展现三对变量间的统计关系。计算相关系数一、相关系数的特点虽然散点图能够直观地展现变量之间的统计关系,但是并不精确。相关系数以数值的方式精确地反映了两个变量间线性相关的强弱程度。线性关系的分析步骤第一,计算样本相关系数r。相关系数r的取值在-1~+1之间,r>0表示两变量存在正的线性相关;r<0表示两变量存在负的线性相关关系;r=0表示两变量存在完全正线性相关;r=﹣1表示两变量存在完全负相关关系;r=0表示两变量不存在线性相关关系;|r|>0.8表示两变量之间有较强的线性相关关系;|r|<0.3表示两变量之间的线性相关关系较弱。第二,对样本来自的两总体是否存在显著的线性关系进行推断。具体步骤与假设检验相同。对于此案例,通过绘制散点图得知家庭收入与计划购买住房面积之间存在一定的正的弱相关关系,为更准确地反映两者之间线性关系的强弱,采用计算相关系数的方法。由于这两个变量均为定距变量,因此采用简单相关系数。由输出结果可知,家庭收入与计划购买的住房面积的简单相关系数为0.323,说明两者之间存在正的弱相关性,其相关系数的检验概率值近似为0。因此,当显著性水平为0.05时应拒绝原假设,认为两总体不是零相关。例2:定序变量的Spearman分析实例

为研究集团迫使个人顺从的效应,一些研究者用量表对12名大学生进行了调查,数据如下。学生ABCDEFGHIJKL权威主义265110983412711地位欲342181110671259权威主义和地位欲评秩1)输入数据,依次单击分析—相关分析—双变量分析,打开双变量分析对话框2)选择power和position变量进入Variables框中。3)在CorrelationCoefficients栏内选择Spearman。4)在TestofSignificance栏选择Two-tailed。5)选择Flagsignificantcorrelation。6)单击Options按钮,选择Meanandstandarddeviations、Cross-productdeviationsandcovariances、Excludecasespairise选项。7)单击OK。分析步骤:

从表中可看出,权威主义和地位欲的相关系数为0.818,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为0.001,否定假设,即权威主义与地位欲是相关的。结果分析:例3:定序变量的Kendall分析实例

仍用前例中的数据(数据文件:权威(Spearman相关).sav)。操作过程相同,只是在第3)步在CorrelationCoefficients栏内选择Kendall’s选项。结果如下:权威主义和地位欲的相关系数为0.667,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为0.003,否定假设,即权威主义与地位欲是相关的。结果类似于Spearman分析。简单相关分析计算两个变量间的相关系数,分析两个变量间线性关系的程度,往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。例如:在研究商品的需求量和价格、消费者收入之间的关系时会发现,需求量和价格之间的相关关系实际还包含了消费者收入对商品需求量的影响,同时,收入对价格也产生了影响,并通过价格变动传递到对商品需求量的影响中。偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。(四)偏相关分析Pearson偏相关系数假设检验的t统计量:其中,r是相应的偏相关系数,n是观测量数,k是控制变量的数目,n-k-2是自由度。当t>t0.0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论