第5章-SPSS基本统计分析_第1页
第5章-SPSS基本统计分析_第2页
第5章-SPSS基本统计分析_第3页
第5章-SPSS基本统计分析_第4页
第5章-SPSS基本统计分析_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

5.1计算基本描述统计量一、基本描述统计量二、计算基本描述统计量的操作步骤三、计算基本描述统计量的其他菜单选项四、分组计算描述统计量一、基本描述统计量描述集中趋势的统计量:算术平均数

调和平均数几何平均数众数中位数2.描述离散趋势的统计量极差平均差标准差(方差)均值标准误

3.描述分布特征的统计量偏度峰度

1.描述集中趋势的统计量(1)均值(mean):a.表示某变量全部变量值集中趋势或平均水平的统计量。b.适用于定距数据。c.特点:利用了全部数据,易受极端值的影响。(2)众数(mode)(在frequency菜单中计算)a.一组数据中出现频数最多的变量值。b.适用于各类数据,主要用于定类数据。c.特点:众数可能不唯一,不受极端值的影响。2.描述离散程度的统计量(1)标准差(standarddeviation--StdDev)(2)方差(variance)(3)极差(range):最大值(minimum)-最小值(minimum)极差很小表明全部数据几乎集中在一起应用于相同样本容量的两组数据离散程度比较3.描述分布特征的统计量(1)偏度(skewness):描述对称程度的统计量偏度为0表示对称;大于0表示正偏差大(右偏),频数最的值比均值小,极值大于均值;小于0表示负偏差大(左偏).3.描述分布特征的统计量(2)峰度(kurtosis):描述某变量全部变量值分布形态陡缓程度的统计量。峰度为0表示与正态分布峭度相同。大于0表示比正态分布陡,尖峰。小于0表示比正态分布缓;平峰。二、计算基本描述统计量

的操作步骤1.打开菜单Analyze->DescriptivesStatistics->Descriptives...,出现窗口;2.选择参与计算的数值型变量到Variables框

三、计算基本描述统计量的其

他菜单选项1.Savestandardizedvaluesasvariables

标准化处理变量值2.Option选项四、分组计算描述统计量1.菜单选项:Data->SplitFile;2.选择拆分变量到GroupsBasedon框中;3.选择输出方式:Comparegroups/Organizeoutputbygroups;4.点选Sortthefilebygroupingvariables/Fileisalreadysorted。四、分组计算描述统计量5.2变量的频数分析一、变量频数的描述方法利用变量的频数分布分析可以便利的对数据按组进行归类整理,形成各观测量的不同水平(分组)的频数分布状况表和图形,以便对数值的数量特征和内部结构状况有一个概括的相识。5.3变量的频数分析1.频数、百分比有效百分比:各频数占总有效样本数之比累计百分比:各百分比逐级累加结果。2.分位数

4分位数(Quartiles)3.统计图形条形图、饼图、直方图二、频数统计的基本步骤

例题现对1991年美国社会调查状况数据进行统计处理,数据文件为SPSS自带1991U.S.GeneralSocietySurvy.sav。分析不同年龄(age)和最高受教化年限(educ)各水平的频数分布状况。操作步骤如下:(1)单击AnalyzeDescriptivestatisticsFrequencies(2)在左侧源变量框中选择一个或多个变量送入Variables(s)中;(3)依据须要选择相应的选择项:①Displayfrequencytables选择此项将显示频数分布表。假如你只想画图可以不选择此项。②Statistics选择此项,打开统计量选择对话框如图所示。在对话框中选择输出统计量。可选择的统计量分四组,每组中的统计量可以并列选择。

PercentileValues栏,百分位数选择项。n

Quartiles,输出四分位数。n

Cutpointsforequalgroups,输出等分点的百分位数(2-100之间)。

Dispersion离差栏:n

Std.Deviation标准差n

Variance方差n

Range全距n

Minmumn

Mmaxmunn

S.E.mean均数的标准误GeneralTendency中心趋势栏nMean均数nMedian中位数nMode众数nSum 算术和

Distribution分布参数栏n

Skewness正态分布的偏度,同时显示偏度的标准误。nKurtosis正态分布的峰度。假如Skewness与Kurtosis的值为0,那么表示观测量数据的分布特别接近正态分布;假如Skewnes的值为正数,表示数据的分布为正偏态分布,假如Kurtosis的数值为正,那么表明数据的分布要比正态分布具有更尖锐的峰型。③Charts统计图形

④Format设置频数表输出格式。●Multiplevariables多变量栏Comparevariables,将全部变量结果在一个图形z中输出Organizeoutputbyvariables,为每一个变量单独输出一个图形。(4)结果分析

视察量数合法值百分位数5.4交叉分组下的频数分析一、交叉分组下的频数分析

1.主要任务:(1)编制交叉列联表

(2)变量间进行相关性分析一、交叉分组下的频数分析1.交叉列联表两个或两个以上的变量交叉分组后形成的列联表。行变量(Row):表1、2中职称列变量(Column):表1、2中文化程度层变量(Layer):表2中性别一、交叉分组下的频数分析二维交叉列联表(表1)一、交叉分组下的频数分析三维交叉列联表(表2)一、交叉分组下的频数分析交叉列联表单元格中的数据项:(1)视察频数(ObservedCounts)(2)期望频数(ExpectedCounts)RT为行频数合计CT为列频数合计(3)行百分比(RowPercentage)(4)列百分比(ColumnPercentage)一、交叉分组下的频数分析(5)总百分比(TotalPercentage)(6)剩余(UnstandardizedResiduals)

观测频数-期望频数(7)标准化剩余(StandardizedResiduals)一、交叉分组下的频数分析2.行、列变量相关性分析卡方统计量检验行列变量之间是否相关。

听从(行数-1)×(列数-1)的卡方分布交叉列联表卡方检验的一些说明:若交叉列联表中行、列变量应均为定类变量,最好是等距变量若交叉列联表中20%以上单元格中的期望频数小于5,则一般不宜接受卡方检验。此时卡方检验统计量往往偏大,易于拒绝原假设。可以接受似然卡方检验等方法进行修正。二、交叉分组下的频数分析的操作步骤1.菜单:Analyze->DescriptiveStatistics->Crosstabs,弹出对话框;2.选择行变量到Row框中,选择列变量到Column框中;3.若有其他变量参与分析,作为层限制变量选到Layer框中;4.选择Displayclusteredbarcharts选项,指定绘制频数分布柱形图;Suppresstables表示部输出列联表;二、交叉分组下的频数分析的操作步骤5.单击Cells指定列联表单元格中的输出内容;6.单击Format指定列联表各单元的输出排列依次;7.单击Statistics指定用哪种方法分析行变量和列变量的关系。5.5多选项分析一、什么是多选项问题二、分析多选项问题的一般方案三、多选项分析处理多选项问题一、什么是多选项问题例:某地高三学生志愿调查中,为分析学生填报志愿的倾向性,设计了以下问题。依据你的志愿,按依次依次选择准备报考的三所高校:(1)北京高校(2)清华高校(3)中国人民高校(4)北京理工高校(5)北京师范高校(6)北京外国语高校一、什么是多选项问题1.多选项问题:一道问题有两个或两个以上答案同时出现的问题。

2.答案为依次水准或名义水准,并且允许选择的答案为多个,有两个或两个以上被同时选中。二、分析多选项问题的一般方案1.多选项问题的分解基本思路:将多选项问题分解成几个子问题,设置几个SPSS变量,分别存放描述这些问题的几个可能被选择的答案。2.分解方法

(1)多选项二分法:MultipleDichotomiesMethod(2)多选项分类法:MutilpleCategoryMethod2.1多选项二分法将多选项问题中供应的每个可能的答案设为一个SPSS变量,每个变量只有0或1两个取值,分别表示选择该答案和不选择该答案。SPSS变量名变量名标签变量值T1报考北京大学0/1T2报考清华大学0/1T3报考中国人民大学0/1T4报考北京理工大学0/1T5报考北京师范大学0/1T6报考北京外国语大学0/12.2多选项分类法

1.估计最多可能同时出现的答案个数;

2.为每个答案设置一个SPSS变量,变量取值为多选问题中的可选答案。SPSS变量名变量名标签变量取值V1志愿一1/2/3/4/5/6V2志愿二1/2/3/4/5/6V3志愿三1/2/3/4/5/6二、分析多选项问题的一般方案3.对多选项问题做一般频数分析的困难与多选项问题的分解方法有较大关系。如对T1至T6作频数分析,只能得到各个学校的考生报考状况;对V1至V3作频数分析,只能得到志愿1至3中各学校的报考状况。三、多选项分析处理多选项问题1.基本实现思路:(1)按多选项二分法或多选项分类法将多选项问题分解成若干问题,并设置若干SPSS变量;(2)接受多选项频数分析或多选项交叉分组下的频数分析。三、多选项分析处理多选项问题2.多选项分析的基本步骤(1)定义多选项分析的多选项变量集(2)进行多选项的频数分析(3)进行多选项的交叉列联表分析定义多选项分析的多选项变量集(1)菜单Analyze->MultipleResponse->DefineSets,弹出对话框。定义多选项分析的多选项变量集(2)从数值型变量中将进入多选项变量集的变量选择到VariablesinSet框中。(3)在VariablesAreCodedAs框中指定变量依据哪种方法分解。(4)Name为多选项变量集命名。(5)单击Add按钮将定义好的多选项变量集加到MultResponseSets。进行多选项的频数分析(1)选择菜单Analyze->MultipleResponse->Frequencies,弹出对话框。(2)从MultResponseSets把待分析的变量集选择到TableFor框中。(3)指定是否处理缺失数据进行多选项的交叉列联表分析(1)选择菜单Analyze->MultipleResponse->Crosstabs,弹出对话框。(2)选择交叉列联表的行变量并定义取值范围。(3)选择交叉列联表的列变量并定义取值范围。(4)选择交叉列联表的分层变量并定义取值范围。(5)单击Option按钮,选择列联表的输出内容和计算方法。5.6基本统计分析的报表制作一、用户统计报表概述二、制作用户基本报表三、制作一般报表一、用户统计报表概述1.用户统计报表的组成职工工资状况报表主标题男职工副标题列标题

注:截止到本年底行标题

数据单元

文化程度本科专科高中初中职称高级工程师工程师技术员无技术职称一、用户统计报表概述2.用户统计报表的种类基本报表(BasicTables)一般报表(GeneralTables)频数报表(TablesofFrequencies)多选项报表(MultipleresponseTables)二、制作用户基本报表1.SPSS基本报表样式(1)Summary:指代汇总变量(2)Down:指代行限制变量(3)Across:指代列限制变量(4)Separate:指代表限制变量二、制作用户基本报表2.基本报表的功能3.基本操作步骤(1)单击菜单选项:Analyze->Customtables->Basictables.(2)指定汇总变量到Summaries框

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论