第二章SPSS在食品试验数据分析中的应用1_第1页
第二章SPSS在食品试验数据分析中的应用1_第2页
第二章SPSS在食品试验数据分析中的应用1_第3页
第二章SPSS在食品试验数据分析中的应用1_第4页
第二章SPSS在食品试验数据分析中的应用1_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS

在食品试验数据分析中的应用授课教师:耿业业北华大学2016.9第二章

教学任务、教学要求讲授SPSS在食品试验数据分析中的应用。要求学生熟识SPSS软件基本操作、数据录入、外部数据导入、数据保存、数据管理,学会试验数据描述与统计图表的展示,掌握食品试验数据假设检验的基本方法。使学生拥有利用软件刻画和解释现实问题的统计分析逻辑与能力,并提高统计软件的自学能力和数据处理的实践能力。主要参考书:

spss统计分析基础/高级教程张文彤授课方式课堂讲授8学时,上机实践16学时。理论与应用相结合(应用为主)讲授与上机相结合(上机为主)第一节SPSS软件入门1.1SPSS简介1.2SPSS数据的管理1.3SPSS数据的预处理统计软件的种类很多。只要学会使用一种“傻瓜式”软件或编程软件,使用其他类似的软件也不会困难,最多看看帮助和说明即可.学习软件的最好方式是多练多用.用统计软件容易得到漂亮的数据结果,但其中充满了危险的陷阱.计算机无法识别你的统计方面的错误.错误的方法、错误的数据形式都必然输出错误的结果.结果虽然看上去很漂亮,但有时得到的却是大量垃圾.因此,使用统计软件时,要了解相关的统计理论方法,及其使用的前提条件和适用性,根据实际研究问题选用准确的方法.2023/8/191.1SPSS简介SPSS的发展历程SPSS18.0版本的安装与启动3.

SPSS的基本操作环境(重点)4.利用SPSS进行数据分析的步骤SPSS-----StatisticalPackageforSocialScience(社会科学统计软件包)2000年正式改名为StatisticalProductandServiceSolutions(统计产品与服务解决方案)1.1.1

SPSS的发展历程1968,斯坦福大学的3位研究生研发了SPSS1975,芝加哥组建了SPSS总部1984,开发了DOS操作系统下的PC+1.0版本1992,DOS版升级为Windows版本,即最初4.0版1998,收购了ISL公司及Clementine产品线。2009,被IBM收购。2015,目前已开发23.0。SPSS-----四大类产品统计分析

IBMSPSSStatistics预测模型

提供直观的辅助决策信息IBMSPSSModelerIBMSPSSTextMining数据收集为客户的态度和观点提供准确的视图IBMSPSSDataCollection部署

在企业日常运营中,降低分析维护成本,最大限度的提高数据分析为企业带来的价值。

IBMSPSSCollaboration&DeploymentServicesIBMSPSSDecisionManagement

SPSSforWindows的特点1、SPSSforWindows的命令语句、子命令及选择项大部分由“菜单”、“图标按钮”、“对话框”的操作完成,操作简单、使用方便。工具栏提供了方便用户进行各种不同操作的按钮,用户也可根据不同的需要增加或者减少各种操作按钮。同时还具有记忆功能,能够记住用户最近打开的数个文件以及当前执行的统计分析及作图的操作中用户输入的数据。与另一著名统计软件SAS相比,更适用于统计初学者或非统计学专业人员。2、具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。能更快速地读取并分析大量数据。去掉了数据大小的限制,解决了在使用其他分析工具时可能遇到处理大量资料的困难,现在您都可以比以前更轻易地读取并管理您的这些资料。利用独一无二的动态表格(PIVOTTABLE)技术,创造表格、图表与报告模块(reportcube)。为基础统计分析提供了最基本的统计方法,其中包括了概括、计算、交叉表、分类、描述性统计、因子分析、回归与聚类分析,而且在您分析结束后,还可以将数据写回数据库。自带11种类型136个函数,能充分满足各个方面用户的需要。利用互动图形,使分析結果显而易见。还可以将表格转变成图形。3、SPSSforWindows与其它软件有数据转换接口。能够读取13种及输出14种格式的文件;能够把SPSS的图形转换成7种图形文件;结果文件可保存为TXT及HTML格式的文件。结果可直接用Word及WPS编辑,为数据及图形结果直接用于科研报告提供了便利。例如:可直接读取关系数据库生成的DBF文件、ASCII文件以及Excel电子表格文件。同理,SPSS的数据文件也可以方便地转换成其它数据文件4、提供独有的菜单命令向程序文件的转换功能。几乎每一个对话框都有“Paste”(粘贴)按钮。可将菜单操作命令直接转换为程序命令。用户可将命令文件保存或编辑,也可直接执行该程序文件。因此,编写程序文件时也不需记忆大量的命令,为高级用户对数据实现自动分析提供了强有力的帮助。5、详细的在线帮助(Help)信息。根据不同层次的用户提供不同的帮助,在使用过程中用户可以方便地获得相关的帮助信息,也可直接连接到SPSSInternet主页,查询有关该软件的最新信息。安装:

SPSSforWindows安装的基本步骤与其他常用软件是基本相同的。启动:开始

程序IBMSPSSStatistics

pasw是SPSSInc.的注册商标1.1.2SPSS软件的安装和启动工具栏菜单栏标题栏数据编辑区数据显示区:变量名观察序号状态栏

1.1.3SPSS的基本操作环境一、数据编辑窗口(.SAV)窗口主菜单工具栏内容区目录区二、SPSS结果输出窗口(.SPV)1.1.4利用SPSS进行数据分析的步骤建立SPSS数据文件。在该阶段按照研究的要求,利用SPSS提供的功能建立SPSS数据文件。其中包括在数据编辑窗口定义SPSS数据文件的结构,录入和修改SPSS数据等,当然也可以从其它可转换的数据文件中读取数据资料。SPSS数据的加工整理阶段。该阶段主要对数据编辑窗口中的数据进行必要的预处理,如数据分组、排序、分类汇总、数据计算、变量转化、缺失值的补漏、观测值选择等。SPSS数据的分析阶段。该阶段选择正确的分析方法,对数据编辑窗口中的数据进行统计分析、建模和预测。SPSS分析结果的说明和解释。该阶段的任务是读懂SPSS输出窗口中的分析结果,明确其统计含义,并结合应用背景知识作出切合实际的合理解释。在学术研究中,还需要对结果的含义加以衍生。数据和分析结果的保存。

1.2SPSS数据的管理SPSS数据文件的特点定义变量属性(重点)SPSS数据的录入、编辑(自学)SPSS数据的保存读取其他格式的数据文件(自学)SPSS数据文件的合并(自学)1.2.1SPSS数据文件的特点SPSS的数据文件扩展名是.sav;SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息,数据的内容才是那些待分析的具体数据。数据结构数据内容

基于上述特点,建立SPSS数据文件时应完成两项任务:描述SPSS数据的结构(变量视图)录入编辑SPSS数据的内容(数据视图)(1)原始数据的组织方式数据编辑窗口中的一行称为一个个案或记录(Case),所有个案组成SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。SPSS数据文件的结构就是对每个变量及相关特征的描述。SPSS数据的组织方式直接的问卷数据(2)频数数据的组织方式例:频数数据的组织方式中:一行为变量的一个分组(或多个变量交叉分组下的一个分组),所有行囊括了该变量的所有分组情况,一列仍为一个变量,代表某个问题(或某个方面)及频数。分组汇总后的数据频数数据的组织方式—SPSS格式变量名(Name)数据类型(Type)、宽度(Width)、列宽度(Columns)-重点变量名标签(Label)变量值标签(Values)-重点缺失数据(Missing)变量对齐格式(Align)度量标准(Measure)-重点1.2.2定义变量属性

变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:1.以前版本的首字符应以英文字母开头,20版本的可以直接是汉字开头。后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。1)变量名(Variablename)定义时直接录入即可2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。3.SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。2)数据类型(Type)每种类型的变量都有自己的变量宽度、小数位和显示宽度,其中变量宽度是变量允许的最大字符位数,列宽度是数据编辑窗口中显示每列的字符位数。通常这两个宽度是一致的。2)变量宽度(Width)、显示宽度(Columns)3)变量名标签(Variablelabel)变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。变量名标签可用中文,总长度可达120个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签信息。定义时直接录入即可4)变量值标签(Valuelabel)

变量值标签是对变量取值含义的解释说明信息,对于品质型数据(定性数据包括分类和顺序数据)尤为重要,比如1代表男性,2代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。鼠标单击

再单击右边的省略号

弹出值标签定义窗口

逐个添加5)缺失数据(Missingvalues)数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不完全数据或缺失数据。数据中如果存在缺失数据,分析时通常不能直接采用,要进行说明。SPSS用户缺失值定义窗口鼠标单击

再单击右边的省略号

弹出缺失值定义窗口

逐个添加6)变量对齐格式(Align)定义显示对齐方式,对齐方式分为右对齐、左对齐和中间对齐;系统中,数值型变量默认为右对齐,字符型变量默认为左对齐。7)度量标准(Measure)统计学依据数据的度量尺度将数据划分为三大类:名义(Nominal)—分类数据,如民族、宗教信仰、性别、党派;序号(Ordinal)—顺序数据,如职称、职务、对某事物的赞同程度;度量(Scale)—数值型数据,如身高、体重。通常建立SPSS数据文件时应首先定义数据的结构部分,然后再输入数据,但实际应用中,边录入、边分析、边修改数据结构的情况也是常见的。数据的结构定义完成之后,可以在变量视图(VariableView)卡片中浏览,也可以通过菜单选项实用程序(Utilities)

变量(Variable)来实现。SPSS数据文件的建立--练习把Excel格式的居民储蓄调查问卷数据导入到SPSS软件中,再定义各变量的属性,最后对照SPSS格式的文件进行检查。SPSS数据的录入(与Excel类似,自学)SPSS数据的编辑(与Excel类似,自学)

SPSS数据的定位插入和删除一条个案插入和删除一个变量数据的移动、复制和删除1.2.3SPSS数据的录入、编辑(自学)查找1、SPSS文件格式,扩展名为.sav2、Excel格式文件,扩展名为.xls3、dbf格式文件,扩展名为.dbf4、文本格式文件,扩展名为.datSPSS支持的数据格式1.2.4SPSS数据的保存文件File

保存Save,对于新的:提示文件名和类型;对于旧的,覆盖原来的,不再提问;文件File

另存为SaveAs,另存一个数据文件,也有格式(类型)问题;变量Variable按钮允许用户指定保存哪些变量,不保存哪些变量,变量名前画叉的变量将被保存到磁盘中。保存数据的基本操作保存为SPSS格式时将数据保存为Excel文件格式时,将变量名写入表格Writevariablesnamestospreadsheet选项呈可用状态,它的作用是指定是否将SPSS变量名写入Excel工作表的第一行上。直接读入其它格式的数据文件使用文本向导读入文本文件(自学)使用数据库向导读入数据(自学)1.2.5读取其它格式的数据文件1)直接读入其它格式的数据文件SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单文件File

打开Open

数据Data;或直接单击快捷工具栏上的OpenFile按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式。注:读入Excel文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口,但也可以指定仅读取工作表中某个区域内的数据(如A5:B10)。工作表上的一行数据为SPSS中的一个个案。如果Excel工作表文件第一行或指定读取区域内的第一行存储了变量名信息,则应选择读取变量名Readvariablenames项,即以第一行的文字信息作为SPSS的变量名,否则不选。读取EXCEL数据文件2)使用文本向导读入文本文件选择菜单文件File

打开文本数据ReadTextData,系统就会弹出OpenFile对话框,和前面的情况完全一样,只是文件类型自动跳到了Text(*.txt)。也可直接单击快捷工具栏上的OpenFile按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的文本文件格式。类似于从文本格式转为EXCEL格式的操作例:现有一数据文件以纯文本的形式保存,且第一行为变量名,请将其读入SPSS。在文件File

打开文本数据ReadTextData对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下:类似于从文本格式转为EXCEL格式的操作选择菜单文件File

打开数据库OpenDatabase

新建查询NewQuery,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。3)使用数据库向导读入数据纵向合并数据文件横向合并数据文件1.2.6SPSS数据文件合并(自学)1.2总结SPSS数据文件与Excel数据文件有何不同如何定义数据的结构或变量的属性(重点)如何录入、编辑和保存SPSS数据如何读取Excel和文本格式的数据文件如何对SPSS数据文件进行纵向和横向合并2023/8/19SPSS软件入门—1.31.1SPSS简介1.2SPSS数据的管理1.3SPSS数据的预处理为什么要进行数据的预处理在数据文件建立之后,通常还需要对分析的数据进行必要的预加工处理,这是数据分析过程中必不可少的一个关键步骤。数据的预加工处理服务于数据分析和建模,主要包括以下几个问题:

1.数据的排序

2.变量计算

3.数据选取

4.分类汇总

5.数据分组

6.数据拆分

7.数据预处理的其它功能:计数、转置、加权、缺失值处理、数据排秩、定义变量集等1.3SPSS数据的预处理数据排序的目的数据排序的基本操作1.3.1数据的排序数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等;通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距,初步把握和比较数据的离散程度;通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产生重要影响提供帮助。1)数据排序的目的

SPSS数据排序的基本操作步骤:(1)选择菜单数据Data

个案排序SortCases(2)将主排序变量从左边的列表中选到排序依据Sortby框中,并在排序顺序SortOrder框中选择按该变量的升序还是降序排序。(3)如果是多重排序,还要一次指定第二、第三排序变量及相应的排序规则。(4)或者快捷方法:数据视图右键对话框2)数据排序的基本操作在左边的源变量框中选择排序变量进入排序依据框。如果选择2个以上的变量,观测量的排序结果与排序变量在排序依据框中的顺序有关。列于首位的为第一排序变量。在排序顺序

栏内选择排序方式--升序与降序数据加工(职工数据).sav数据排序举例按基本工资升序和职称降序排序的结果员工基本情况.sav变量计算的目的SPSS算术表达式SPSS条件表达式SPSS函数变量计算的应用举例1.3.2变量计算SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。1)变量计算是针对所有个案(或指定的部分个案)的,每个个案都有自己的计算结果。2)变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计算结果的数据类型相一致。在变量计算过程中涉及到几个概念:SPSS算数表达式、SPSS条件表达式和SPSS函数。1)变量计算的目的计算下表中的职工实际收入员工基本情况.sav原有数据中会增加新的一列员工基本情况.sav2)SPSS算术表达式SPSS函数选择出职称大于4且学历不低于1的职工3)SPSS条件表达式SPSS函数是事先编好并存储在SPSS软件中,能够实现某些特定计算任务的一段计算机程序。这些程序都有各自的名字称为函数名。执行这些程序段得到的计算结果称为函数值。SPSS函数大致可以分成八大类:算术函数、统计函数、分布函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数。4)SPSS函数1、利用职工基本情况数据,依据职称级别计算实发工资。假设职称4、6、8的职工的工资分别上调4%,6%,8%。

5)变量计算的应用举例在计算变量:If个案对话框中依次输入条件表达式,并在数学表达式框中输入相应公式,分别计算可得(语法窗口提高效率)结果员工基本情况.sav数据选取的目的数据选取的方式数据选取的应用举例1.3.3数据选取—抽样1)提高数据分析效率:可以依据一定的抽样方法从总体中抽取少量样本,后面的分析只针对样本进行,这样会大大提高分析的效率。2)检验模型的需要:为了验证模型一般可依据一定的抽样方法只选择部分样本参与数据建模,剩余的数据用于模型检验。1)数据选取的两个目的2)数据选取的方式1)选取全部数据(Allcases)2)按指定条件选取(Ifconditionissatisfied)3)随机抽样(Randomsampleofcases):近似抽样和精确抽样4)选取某一区域内的样本(Basedontimeorcaserange)5)通过过滤变量选取样本(Usefiltervariable)利用居民储蓄调查数据,根据不同的分析要求采用不同的数据选取方法抽样:1)如果只希望分析城镇储户的情况,可以通过数据选择功能采用指定条件的抽样方法进行抽样;2)如果只希望对其中的70%的数据进行分析,可通过数据选择功能采用随机抽样中的近似抽样方法进行抽样。3)数据选取的应用举例1)只希望男性职工的情况结果员工基本情况.sav2)只希望对其中的70%数据进行分析结果居民储蓄调查数据.sav1)完成数据选取后,以后的SPSS分析操作仅针对那些被选中的个案直到用户再次改变数据的选取为止。2)采用指定条件选取和随机抽样方法进行数据选取后,SPSS将在数据编辑窗口中自动生成一个名为filter_$的新变量,取值为1或0。1表示本个案被选中,0表示未被选中。该变量是SPSS产生的中间变量,如果删除它则自动取消样本抽样。说明分类汇总是按照某分类变量进行分类汇总计算。例如:某食品厂希望分析假日周内不同职业和不同年龄段的顾客对某商品的“打折促销”反应是否存在较大差异,用以分析不同消费群体的消费心理。最初步的分析可以是分别计算不同职业中不同年龄段顾客的平均消费金额和平均消费金额差异程度(标准差),并对它们进行比较。这个过程也可以通过分类汇总过程完成。1.3.4分类汇总SPSS实现分类汇总涉及两个主要方面:按照哪个变量(如职工基本情况例题中的学历、职业和入职时间段)进行分类对哪个变量(如上例中的基本工资、保险等)进行汇总,并指定对汇总变量计算哪些统计量(如上例中的平均工资、平均保险费和标准差)例1:根据职工情况数据研究不同学历的职工的工资水平是否存在差异?

思路:先按学历对数据进行排序,再利用分类汇总功能计算不同学历职工的平均工资,然后进行比较。选择文化程度为分类变量,基本工资为汇总变量。分类汇总的应用举例1)选择菜单数据Data

分类汇总aggregate,出现如下所示的窗口:结果数据加工(职工数据).sav指定对汇总变量计算哪些统计量数据分组的目的SPSS的单变量值分组SPSS的组距分组1.3.5数据分组数据分组就是根据统计研究的需要,将数据按照某种标准重新划分为不同的组别。数据分组的基础上进行的频数分析更能够概括和体现数据的分布特征。为适用于不同的统计分析需要,SPSS提供了以下几种数据分组方法:单变量值分组组距分组1)数据分组的目的

居民家庭按人口数单项式分组离散型变量如果变量值的变动范围不大,可以将一个变量值作为一组,称单项式分组。如右表:单变量值分组在连续型变量或离散型变量值较多的情况下,可采用组距式分组形式。

组距式分组就是把全部变量值划分为几个区间,每一区间的变量值作为一组。如右表:组距分组SPSS单变量值分组的基本操作步骤:1)选择菜单转换Transform

自动重新编码AutomaticRecode2)将分组变量选择到变量-新名称Variable-NewName框中3)在新名称NewName框后输入存放分组结果的变量名,并单击添加新名称AddNewName按钮4)在重新编码的起点RecodeStartingfrom框中选择单变量值分组按升序还是按降序进行。最低值Lowestvalue表示升序;最高值Highestvalue表示降序。2)SPSS的单变量值分组结果员工基本情况.sav单变量值分组应用举例:利用职工情况数据按职工的基本工资升序进行分组。组距分组中的关键问题有两个:1)分组数目的确定可参考Sturges提出的经验公式n=1+3.322lgN又有a=R/n=R/1+3.322lgN.这里n-组数,N-单位数a-组距,R-全距2)组距的确定组距=(最大值-最小值)/组数3)SPSS的组距式分组组数和组距确定后,便可实施分组操作了,在分组操作时应:指定分组变量定义分组区间(注意遵循“不重不漏”原则)指定存放结果的变量

SPSS对分组结果有两种存放策略,一种是用分组变量值覆盖原变量(IntoSameVariables),另一种是将分组结果存到一个新变量中(IntoDifferentVariables)。相应的操作也略有差异。通常采用第二种策略。1)选择菜单转换Transform

重新编码为相同变量Recod

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论