SPSS的相关分析PPT课件_第1页
SPSS的相关分析PPT课件_第2页
SPSS的相关分析PPT课件_第3页
SPSS的相关分析PPT课件_第4页
SPSS的相关分析PPT课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关分析之一相关分析之一有关与无关有关与无关v 寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即: :有关与无关。v 在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。第1页/共54页 1 通通过过考考试试 2 未未通通过过考考试试 1 男男性性 40% 60% 2 女女性性 40% 60% 总总计计 40% 60% 性别与四级英语考试通过率的相关统计表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。自变量的

2、不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。第2页/共54页 每每月月工工资资平平均均数数 N 1 男男性性 752.40 452 2 女女性性 601.97 409 总总计计 680.95 861 统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。自变量因变量第3页/共54页变量关系的统计类型变量关系的统计类型 定定类类 定定序序 定定距距 定定类类 列列联联 cross-tabulate 列列联联 cross-tabulate 方方差差分分析析 (分分组组平平均均数数) compare means 定定序序 列列联联 c

3、ross-tabulate 积积差差相相关关 spearman correlation 积积差差相相关关 spearman correlation 积积矩矩相相关关 pearson correlation 定定距距 积积矩矩相相关关 pearson correlation 回回归归 regression 第4页/共54页相关分析之二相关分析之二关系强度关系强度 变量关系强度的含义:指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析: A)两变量是否相互独立。 B)两变量是否有共变趋势。 C)一变量的变化多大程度上能由另一变量的变化来解释。第5页/共54页变

4、量关系强度测量的主要指标变量关系强度测量的主要指标第6页/共54页相关分析之三相关分析之三关系性质关系性质直线相关与曲线相关正相关与负相关完全相关与完全不相关第7页/共54页一、列联相关一、列联相关(一)列联分析的基本原理自变量发生变化,因变量取值是否也发生变化。比较边缘百分比和条件百分比的差别。第8页/共54页 卡方测量用来考察两变量是否独立(无关)。 其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积jiijPPP.第9页/共54页 在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变量有关,

5、或称两变量不独立。第10页/共54页由此可见,期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就越有相关。因此,卡方的表达式如下:卡方的取值在0之间。卡方值越大,关联性越强。在SPSS中,有Pearson X2和相似比卡方(Likelihood Ratio X2 )两种。 jiijijijEEOX22)(第11页/共54页 的改进标准化系数的改进标准化系数:为使为使 值有一固定的区间,便于比较,采用了以下几个修正:值有一固定的区间,便于比较,采用了以下几个修正:2X2XA、系数(Phi): (01),适用于22表。B、 列联系数(Contingency Coefficient):

6、(01),适用任意表。C、 Cramer V系数:(01),适用任意表。D、系数(Lambda): (01),适用任意表。E、 Goodman & Kruskal-tau系数: (01),适用任意表。第12页/共54页 (二)列联表分析的功能(二)列联表分析的功能v调用列联表分析过程可进行定类与定序资料列联表分析,一个行变量和一个列变量可组成一个二维列联表,如再加一个控制变量则可组成一个三维列联表。而多个行、列、控制变量就可组成一个复杂的多维列联表。v在分析中可对二维和多维列联表资料进行统计描述和x2检验,并计算相应的百分数指标。此外,还可计算四格表确切概率(Fishers Exact

7、 Test),且有单双侧(One-Tail、Two-Tail)、对数拟然比检验( Likelihood Ratio)以及线性关系的Mantel-Haenszel x2检验。第13页/共54页列联表的格式列联表的格式性别 * 文化程度 Crosstabulation7116320219463011.3%25.9%32.1%30.8%100.0%39.2%53.1%51.4%52.4%50.4%5.7%13.0%16.1%15.5%50.4%11014419117662117.7%23.2%30.8%28.3%100.0%60.8%46.9%48.6%47.6%49.6%8.8%11.5%15.3

8、%14.1%49.6%181307393370125114.5%24.5%31.4%29.6%100.0%100.0%100.0%100.0%100.0%100.0%14.5%24.5%31.4%29.6%100.0%Count% within 性别% within 文化程度% of TotalCount% within 性别% within 文化程度% of TotalCount% within 性别% within 文化程度% of Total男女Total高小以下初中高中中专或中技大专以上文化程度Total第14页/共54页(三)列联表分析过程(三)列联表分析过程列联表分析步骤: 按An

9、alyzeDescriptive Statistics Crosstabs 顺序打开 Crosstabs 主对话框。第15页/共54页Crosstabs 对话对话框第16页/共54页Statistics 对话框对话框第17页/共54页Cell Display 对话框对话框第18页/共54页Table Format 对话框决定各行的排列顺序:升序降序第19页/共54页(四)例1 为了探讨吸烟与慢性支气管炎有无关系,调查了339人,情况如下:吸烟和慢性支气管炎调查表患慢性支气管炎患慢性支气管炎 未患慢性支气管炎未患慢性支气管炎吸烟吸烟43162不吸烟不吸烟13121第20页/共54页p录入数据“C

10、rosstab.sav” 。变量h为频次;变量x为是否吸烟:1为吸烟,2为不吸烟;变量n为是否患病:1为患病,2为不患病。p选择变量h进行加权。p按Analyze-Descriptive Statistics-Crootabs 顺序打开 Crootabs 主对话框。将x变量 选入Row框作为行变量,将n变量 选入Column 框作为列变量。p打开Statistics对话框,选中Chi-squareContingency coefficient和Phi and CramersV复选框,单击Continue返回。p单击Cell按钮,打开Cell display对话框,选中observed和Expe

11、cted 复选框,单击Continue返回;单击OK。1.操作步骤第21页/共54页统计摘要表,列出观测量有效值个数、缺失值个数和总的个数。 2.输出结果及分析 C Ca as se e P Pr ro oc ce es ss si in ng g S Su um mm ma ar ry y339100.0%0.0%339100.0%是否吸烟 * 是否患病NPercentNPercentNPercentValidMissingTotalCases吸烟与患病统计摘要表第22页/共54页是是 否否 吸吸 烟烟 * * 是是 否否 患患 病病 C Cr ro os ss st ta ab bu ul

12、 la at ti io on n4316220533.9171.1205.01312113422.1111.9134.05628333956.0283.0339.0CountExpected CountCountExpected CountCountExpected Count吸烟不吸烟是否吸烟Total患病不患病是否患病Total吸烟与患病列联表第23页/共54页C Ch hi i- -S Sq qu ua ar re e T Te es st ts s7.469b1.0066.6741.0107.9251.005.007.0047.4471.006339Pearson Chi-Squar

13、eContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is22.14.b. 卡方检验卡方检验第24页/共54页S

14、 Sy ym mm me et tr ri ic c M Me ea as su ur re es s.148.006.148.006.147.006339PhiCramers VContingency CoefficientNominal byNominalN of Valid CasesValueApprox. Sig.Not assuming the null hypothesis.a. Using the asymptotic standard error assuming the nullhypothesis.b. 对称性检验表对称性检验表第25页/共54页例2:以SPSS自带的数据

15、文件”1991 U. S. General Social Survey.sav”为例分析影响幸福的因素。第26页/共54页第27页/共54页第28页/共54页第29页/共54页第30页/共54页第31页/共54页第32页/共54页卡卡 方方 检检 验验7.129a2.0287.3342.0262.4971.11412561.107b2.5751.0882.580.6561.4182011.713c2.4251.7052.4261.4271.23247Pearson 卡方似然比线性和线性组合有效案例中的 NPearson 卡方似然比线性和线性组合有效案例中的 NPearson 卡方似然比线性和线

16、性组合有效案例中的 N被调查者的种族白种人黑种人其他值df渐进 Sig.(双侧)0 单元格(.0%) 的期望计数少于 5。最小期望计数为 50.58。a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 13.58。b. 1 单元格(16.7%) 的期望计数少于 5。最小期望计数为 3.83。c. 第33页/共54页对对称称度度量量.075.0281256.074.575201.188.42547相依系数按标量标定有效案例中的 N相依系数按标量标定有效案例中的 N相依系数按标量标定有效案例中的 N被调查者的种族白种人黑种人其他值近似值 Sig.不假定零假设。a. 使用渐进标准误差假定

17、零假设。b. 第34页/共54页基基 本本 幸幸 福福 * * 生生 活活 激激 动动 人人 心心 还还 是是 黯黯 淡淡 乏乏 味味 交交 叉叉 制制 表表19598229544.9%19.7%5.0%30.4%2183381256850.2%68.0%30.0%58.5%2161261084.8%12.3%65.0%11.1%43449740971100.0%100.0%100.0%100.0%计数生活激动人心还是黯淡乏味 的 %计数生活激动人心还是黯淡乏味 的 %计数生活激动人心还是黯淡乏味 的 %计数生活激动人心还是黯淡乏味 的 %非常幸福很幸福不太幸福基本幸福合计激动人心平淡无奇黯淡

18、无味生活激动人心还是黯淡乏味合计第35页/共54页卡卡 方方 检检 验验196.023a4.000148.9234.000125.4871.000971Pearson 卡方似然比线性和线性组合有效案例中的 N值df渐进 Sig.(双侧)1 单元格(11.1%) 的期望计数少于 5。最小期望计数为 4.45。a. 第36页/共54页二、二、相关分析相关分析(Correlate)第37页/共54页(一)简介(一)简介 相关分析用于描述两个变量间联系的密切程度,其特点是变量不分主次,被置于同等的地位。检验的假设为相关系数为0。可选择是单尾检验还是双尾检验。 在Analyze的下拉菜单Correlat

19、e命令项中有三个相关分析功能子命令Bivariate过程、Partial过程、 Distances过程,分别对应着相关分析、偏相关分析和相似性测度的三个spss过程。第38页/共54页(二)相关分析类型(二)相关分析类型 Bivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。 Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。 Distances过程用于对同一变量各观察单位间的数值或各个不同变量间进行相似性或不相似性分析,一般不单独使用,而作为因子分析等的

20、预分析。第39页/共54页(三)(三)Bivariate相关分析相关分析 在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否则可能的出错误结论。 Bivariate相关分析的步骤:输入数据后,依次单击AnalyzeCorrelateBivariate,打开Bivariate Correlations对话框第40页/共54页Bivariate Correlations 对话框对话框第41页/共54页Options 对话框对话框对每一个变量输出均值、标准差和无缺省值的观测数。对每一个变量输出交叉距阵和协

21、方差距阵。计算某个统计量时,在这一对变量中排除有缺省值的观测值。对于任何分析,有缺省值的观测值都会被排除。第42页/共54页例例1:1:以以SPSSSPSS自带的数据文件自带的数据文件”1991 U. 1991 U. S. General Social Survey.savS. General Social Survey.sav”为例为例分析自己教育、父亲教育、母亲教育、分析自己教育、父亲教育、母亲教育、配偶教育与自己职业社会声望的关系。配偶教育与自己职业社会声望的关系。第43页/共54页第44页/共54页第45页/共54页第46页/共54页第47页/共54页第48页/共54页例例2 2:定序

22、变量的:定序变量的SpearmanSpearman分析实例分析实例 为研究集团迫使个人顺从的效应,一为研究集团迫使个人顺从的效应,一些研究者用量表对些研究者用量表对1212名大学生进行了调查,名大学生进行了调查,数据如下。数据如下。学生学生A B CDEFGHIJKL权威主义权威主义 265110983412711地位欲地位欲342181110671259权威主义和地位欲评秩第49页/共54页1)输入数据,依次单击AnalyzeCorrelateBivariate,打开Bivariate Correlations对话框2)选择power和position 变量进入 Variables框中。3)

23、在Correlation Coefficients栏内选择Spearman。4)在Test of Significance栏选择Two-tailed。5)选择Flag significant correlation。6)单击Options按钮,选择Mean and standard deviations、Cross-product deviations and covariances、Exclude cases pairise选项。7)单击OK。分析步骤:第50页/共54页 从表中可看出,权威主义和地位欲的相关系数为0.818,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为0.001,否定假设,即权威主义与地位欲是相关的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论