实验指导一:spss简介(数据与画图)_第1页
实验指导一:spss简介(数据与画图)_第2页
实验指导一:spss简介(数据与画图)_第3页
实验指导一:spss简介(数据与画图)_第4页
实验指导一:spss简介(数据与画图)_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验一一、实验目的:1.掌握SPSS的数据编辑功能利用SPSS的数据编辑器窗口,可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等一般性操作,还可以对数据文件中的数据进行顺序、转置、拆分、聚合、加权等操作,对多个数据文件可以根据变量或个案进行合并。可以根据需要把将要分析的变量集中到一个集合中,打开时指定打开该集合,而不必打开整个数据文件。2.掌握表格的生成和编辑利用SPSS可以生成数十种风格的表格,利用编辑窗口或监视器可以编辑所要生成的表格。在SPSS的高级版本中,统计成果多被归纳为表格或图形的形式。3.掌握图形的生成和编辑利用SPSS可以生成数十种基本图形和交互式图形。其中基本图形包括条形图、线形图、面积图、圆饼图、高低图、帕雷托图、控制图、箱形图、误差条形图、散点图、直方图、ROC曲线图、P-P概率图、Q—Q图、序列图和时间序列图等。交互式图形比基本图形更漂亮,可有不同风格的2D、3D图形。交互式图形包括条形交互作用图、点形交互作用图、线形交互作用图、带形交互作用图、圆形交互作用图、箱形交互作用图、误差条形交互作用图、直方交互作用图和散点交互作用图等。4.会用SPSS的简单统计功能(1)摘要性分析摘要性分析是对原始数据进行描述性分析,是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。SPSS统计软件通过调用摘要性分析,可完成均数、标准差、标准误差等指标的计算,对于计数和一些等级资料,可完成构成比率等指标的计算和检验。SPSS的摘要性分析包括以下几个过程:1)Frequencies(频数)过程调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。2)Descriptives(描述)过程调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存人数据库。3)Explore(探索)过程调用此过程可对变量进行更为深入详尽的描述性统计分析,即探索性统计。它是在一般描述性统计指标的基础上,增加有关数据其他特征文字与图形描述,有助于思考对数据进行分析的方案。二、实验指导(一)SPSS的启动与主窗口1.SPSS的启动SPSS安装完毕后,系统会自动在Windows(窗口)菜单中创建快捷方式。单击Windows的“开始”按钮,在“程序”菜单的SPSSforWindows中找到SPSSl3.0forWindows并单击,即可启动SPSS。2.SPSS数据编辑窗口SPSS主界面有两个,一个是SPSS数据编辑窗口,另一个是SPSS结果输出窗口。SPSS的数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名称栏、内容区、窗口切换标签页和状态栏组成(如图12-1所示)。窗口切换标签区状态区表格内容区变量名称栏编辑栏工具栏窗口切换标签区状态区表格内容区变量名称栏编辑栏工具栏菜单栏标题栏图12-1数据编辑窗口(1)标题栏中显示编辑的数据文件名称。(2)菜单栏中列出了SPSS的命令菜单,每个菜单对应一组相应的功能。其中File(文件)是对SPSS文件的操作;Edit(编辑)是SPSS文件的编辑菜单;View(视图)是用户界面设置菜单;Data(数据)是数据文件的建立和编辑菜单;Transform(转换)是数据基本处理菜单;Analyze(分析)是统计分析菜单,主要统计功能都集中在该菜单中;Graphs(图表)是统计图形菜单;Utilities(工具)是相关应用和设置菜单;Windows(窗口)是SPSS各窗口切换菜单;Help(帮助)是SPSS帮助菜单。(3)工具栏中列出了一些常用的快捷按钮。(4)编辑栏中可以输入数据。(5)变量名称栏中列出了该编辑文件中所含有的变量名称SPSS自动命名变量名称为var0001、var0002等。(6)内容区列出了各个个案在变量中的取值。SPSS中每一行表示一个个案。内容区的最左边是行的标号。该窗口下方有两个标签:DataView(数据视图)和VariableView(变量视图)。这两种视图提供了一种类似于电子表格的方法,用以产生和编辑SPSS数据文件中的变量和数据。DataView(数据视图)显示具体的数据内容,可以输入编辑数据。VariableView(变量视图),可以看到它显示的是数据文件中变量的定义,包括变量的名称、类型、宽度、小数点位数等(如图12-2所示)。此时可以根据需要对数据文件中的变量进行增删或修改。数据视图和变量视图可看作是数据编辑窗口的两个方面。图12-2变量视图3.SPSS结果输出窗口结果输出窗口是另一个十分重要的窗口,它在完成Analyze(分析)菜单中的某个统计分析过程后,就会将分析结果呈现出来(如图12-3所示)。只有当完成一项处理后,才在该窗口显示处理过程和计算结果。图12-3结果输出窗口结果输出窗口包括标题栏、菜单栏、工具栏、索引区、内容区以及状态栏6个部分。结果输出窗口第一次出现时标题名称是Outputl.spo-SPSSViewer,第二次出现时标题名称是Output2.spo-SPSSViewer,依次类推。菜单栏显示了结果输出窗口的主菜单,菜单栏共有File(文件)、Edit(编辑)、View(视图)、Data(数据)、Transform(转换)、Insert(插入)、Format(格式)、Analyze(分析)、Graphs(图表)、Utilities(工具)、Windows(窗口)、Help(帮助)12个选项。与数据编辑窗口相比,结果输出窗口的主菜单增加了Insert(插入)、Format(格式)两个菜单选项。Insert(插入)菜单主要是插入某个输出的辅助选项,如标题、文本等。Format(格式)菜单主要是对输出的内容进行格式化,索引区显示结果输出内容包含哪些部分。内容区显示了具体的统计分析的各个方面的结果。(二)SPSS的数据处理1.SPSS录入数据(1)将数据录入成SPSS的数据文件。SPSS也可以读入其他格式的数据文件。(2)对数据文件进行必要的编辑。(3)利用SPSS的统计功能对编辑好的数据文件进行统计处理。(4)调整SPSS输出的统计结果(包括报表、图形和文本等)。(5)将结果输出、存盘、打印等。例12-1某高校一次运动会上大一到大三年级学生铁饼标枪成绩(如表12-1所示),现将数据文件进行统计处理。表12-1某高校一次运动会上大一到大三年级学生铁饼标枪成绩编号姓名性别年级铁饼(米)标枪(米)1周虎男大一8.3402许建男大一7.4523王红男大一9.5504王费女大一6.3165张华女大一8.6256章华女大一7.1347叶飞男大二7.4508许结男大二9.6399王蓬男大二10.04910果雨女大二5.51911王莉女大二7.52312杨微女大二6.42713孙平男大二113314刘放男大二103015张义男大三8.94016何龙女大三7.22417陈真女大三7.21718霍达女大三6.9202spss操作步骤打开SPSS的数据编辑器。通常我们先要定义变量的属性,然后再输入数据。在数据编辑窗口的左下端,有两个页标签:DateView(数据视图)、VariableView(变量视图)。我们可以通过鼠标单击方便地在两个窗口之间切换。在录入数据之前,应该对数据的统计处理有一个基本的框架:计算哪些变量、做何种统计、生成哪种统计图等。在本例中,只做一般性的描述性统计处理,即求各年级男女选手的成绩平均值、标准差、最大值、最小值等。首先单击VariableView(变量视图)页按钮,进入图中所示的变量属性窗口。可以像输入数据一样定义一些变量的属性,如变量名、变量的长度、变量标签、变量的缺失值等。对于某些变量属性还会弹出对象框,可以进行进一步的定义工作。然后按照表12-1的结构输入数据即可(如图12-4所示)。图12-4某高校一次运动会上大一到大三年级学生铁饼标枪成绩(三)数据描述性统计分析SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法,可以对要分析数据的总体特征有比较准确的把握,从而可以选择其他更为深入的统计分析方法。本节内容主要包括频数分析、描述性分析、探索分析、基本统计报表制作。我们主要讲述了如何在SPSS中进行的频数分析、描述性分析和基本统计报表制作等操作。1频数分析频数分析的基本原理频数分析(Frequencies)过程是描述性统计分析中最常用的方法之一,它不仅可以产生详细的频数分析表,还可以按要求给出平均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差、四分位数、十分位数、百分位数。频数分析中涉及到的有关描述性统计量的理论知识,在本书前几章中已经进行了详细的论述,现只对Kurtosis(峰度)和Skewness(偏度)作以解释。峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同,峰度大于0表示比正态分布高峰更加陡峭,为尖顶峰。峰度小于0表示比正态分布的高峰要平坦,为平顶峰。峰度的计算公式如下:(12-1)偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。具体的计算公式如下:(12-2)这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度X相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边:偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。求Quartiles(四分位数)、Deciles(十分位数)和Percentiles(百分位数)(1)Quartiles(四分位数)基本原理四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差记为Q。四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。(2)Deciles(十分位数)基本原理十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为Dl,D2,……,D9,表示10%的数据落在Dl下,20%的数据落在D2下,……,90%落在D9下。(3)Deciles(百分位数)基本原理百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,……,P99,表示1%的数据落在P1下,2%的数据落在P2下,……,99%落在P99下。SPSS实现过程例12-2某公司20名员工的收入中的“基本工资”变量为例,求“基本工资”的均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差(如表12-2所示)。表12-2某公司20名员工的收入姓名性别基本工资奖金分红A男50001500800B男48001300500C男37001300500D男19801000400E男46901300500G男31501000800H男16801000500I男48001300500J男37601000400K男34781000400L女48001300500M女20801000800N女24401000500O女39801300500P女24881000400R女40421500500S女28801000500T女37401200600(1)单击Analyze(分析)菜单DescriptiveStatistics(描述统计)项中的Frequencies(频数)命令(如图12-5、12-6、12-7所示)。图12-5图12-6图12-7(2)弹出Frequencies(频数)对话框。在对话框左侧的变量列表中选择“基本工资”,点击“→”按钮使之添加到Variable(s)(变量)框中。(3)单击下方的Statistics(统计)按钮,弹出Frequencies(频数):Statistics(统计)对话框。选择要统计的项目,Mean(均值)、Median(中位数)、Mode(众数)、Sum(合计)、Std.deviation(标准差)、Variance(方差)、Range(全距)、Minimum(最小值)、Maximum(最大值)、Std.ErrorofMean(平均标准误差)、Skewness(偏度)、Kurtosis(峰度)。选中对话框下方的Displayfrequencytables(频数分布表)复选框,表示显示频数分布表。选好后单击Continue(继续)按钮返回Frequencies(频数)对话框,单击OK按钮,SPSS即开始计算(如图12-8所示)。图12-8(4)结果解读(如图12-9所示)图12-9从结果中可以看出,此公司20名职工的基本工资Mean(均值)3337.90元、Std.ErrorofMean(平均标准误差)262.42174、Median(中位数)3589.00元、Mode(众数)4800.00元、Std.deviation(标准差)1173.586元、Variance(方差)1377303元、Skewness(偏度)-0.116元、Std.ErrorofSkewness(偏度标准误差)0.512元、Kurtosis(峰度)-1.369元、Std.ErrorofKurtosis(峰度标准误差)0.992元、Range(全距)3460元、Minimum(最小值)1540元、Maximum(最大值)5000元、Sum(合计)66758元。求Quartiles(四分位数)、Deciles(十分位数)和Percentiles(百分位数)现利用SPSS求四分位数、十分位数和百分位数。以某公司20名员工的收入资料为例,求“基本工资”的四分位数、“奖金”的十分位数和“分红”的百分位数。(4)SPSS实现过程1)同求均值的操作步骤(1)。2)同求均值的操作步骤(2)。3)单击下方的Statistics(统计)按钮,弹出Frequencies(频数):Statistics(统计)对话框,选择要统计的项目:①Quartiles复选框:四分位数,输出25%,50%,75%的分位数值;②Cutpointsfornequalgroups复选框:十分位数。将数据按大小顺序排序后,平均分成n等份,输出相应数据。如果选择此项,要求在右侧的编辑框输入一个整数数字。若输入数字n=10,即平均分成10等份;③Percentile(s)复选框:是自定义百分位数。依次键入一系列按大小排列的整数,键入值通过左侧的Add(增加)、Change(更改)、Remove(移除)按钮进行编辑。也可以自定义百分位数,若键入35,可求出在35%状态下的分红值。(5)结果解读1)求“基本工资”的四分位数(如图12-10、12-11所示)图12-10图12-11从结果中可以看出,此公司员工基本工资的第一四分位差Q1=2170.00元,第二四分位差Q2=3589.00元,第三四分位差Q3=4528.00元,Q===1176.5元。2)求“奖金”的十分位数(如图12-12、12-13所示)图12-12图12-13从结果中可以看出,此公司员工奖金的Dl……D5=1000元,D6=1260元,D7、D8=1300元,D9=1480元。3)求“分红”的百分位数(如图12-14、12-15、12-16、12-17所示)图12-14图12-15从结果中可以看出,此公司员工分红的百分位数是P1…P30=400元,P30…P40=430元,P40…P70=500元,P70…P80=580元,P80…P100=800元。若自定义百分位数是35,求出的在P35状态下的分红值为500元。图12-16图12-172描述性分析描述性分析的基本原理描述性统计分析过程就是计算并列出一系列描述性统计量指标。这与前面讲的频数分析过程相同,但它可以将原始数据转换成标准化值,并以变量的形式存入数据库,供进一步分析。将原数据变量X转化成新的标准化值变量Z。我们称为Z分数。Z分数定义:从平均数为,标准差为的总体中抽出一个变量值X,Z分数表示的是此变量大于或小于平均数几个标准差。计算公式:将原始数据直接转换为Z分数时,常会出现负数和带小数点的值,实际使用起来很不方便。因此,可以对Z分数进一步加以线性转换,使之成为正的数值。最典型的一种Z分数线性转换就是T分数。计算公式:SPSS的实现过程现利用SPSS以表12-2“基本工资”变量为例,求它的Z分数。步骤如下:(1)单击Analyze(分析)菜单DescriptiveStatistics(描述统计)项中的Descriptives(描述)命令。(如图12-18所示)图12-18(2)弹出Descriptives(描述)对话框。在对话框左侧的变量列表中选择“基本工资”,单击“→”按钮使之添加Variable(s)(变量)框中,同时选中对话框左下方的Savestandardizedvaluesasvariables(把标准化后的值保存为变量)项。(3)单击右下方的Options(选项)按钮,出现Descriptives(描述):Options(选项)对话框,在此选择Mean(均值)、Std.deviation(标准差)、Variance(方差)、3项统计量。(如图12-19所示)图12-19选好后单击Continue(继续)按钮返回Frequencies(频数)对话框,单击OK按钮,SPSS即开始计算。结果解读在数据编辑窗口中。新变量“Z基本工资”表示“基本工资”Z分数。(如图12-20、12-21所示)图12-20图12-21Z分数转换为T分数由于Z分数有正有负,而且小数点位数较多,因此可以把它通过线性转换为T分数。在SPSS中的转换步骤:(1)在Transform(转换)菜单中选择Compute(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论