SPSS入门讲义课件(PPT 98页)_第1页
SPSS入门讲义课件(PPT 98页)_第2页
SPSS入门讲义课件(PPT 98页)_第3页
SPSS入门讲义课件(PPT 98页)_第4页
SPSS入门讲义课件(PPT 98页)_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS 入门讲义第1页,共98页。统计分析软件是数据分析的主要工具完整的数据分析过程包括:数据的收集数据的整理数据的分析统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。第2页,共98页。关于SPSS软件SPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行

2、、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)第3页,共98页。目前,世界上最著名的数据分析软件是SAS和SPSS。SAS由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。而SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发,因而更适合应用于教育科学研究,是国外教育科研人员必备的科研工具。1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的工具。

3、第4页,共98页。SPSS软件的特点集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含多少个案例第5页,共98页。统计功能囊括了教育统计学中所有的项目,包括常规的集中量数和差异量数、 相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。从某种意义上讲,SPSS软件还可以帮助数学功底

4、不够的使用者学习运用现代统计技术。使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程,可能在使用手册的帮助下定量分析数据。第6页,共98页。自从1995年SPSS公司与微软公司合作开发SPSS界面后,SPSS界面变得越来越友好,操作也越来越简单。熟悉微软公司产品的用户学起SPSS操作很容易上手。SPSS for Windows界面完全是菜单式,一般稍有统计基础的人经过三天培训即可用SPSS做简单的数据分析,包括绘制图表、简单回归、相关分析等等,关键在于如何进行结果分析及解释,这一方面需要学习一些数理统计的基本知识,另一方面也要多进行实践,在实践

5、中了解各种统计结果的实际意义第7页,共98页。一、SPSS统计数据的创建与编辑SPSS数据的属性及其定义方法SPSS数据文件的构成应用案例:定义SPSS数据结构SPSS数据的录入SPSS数据的编辑数据文件的操作第8页,共98页。1.SPSS数据的属性及其定义方法一个完整的SPSS数据结构包括: 变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据的显示属性(显示宽度、列宽度、对齐方式)第9页,共98页。1.1变量名首字符必须是字母或汉字,后面可以是除(!、?*)之外的任意字符。变量名的结尾不能是圆点、句点、下划线变量名的长度不能超过64个字符变量名必须唯一,并且不区分大小

6、写SPSS的保留字不能作为变量名(ALL、NE、EQ、GTAND、NOT、WITH)如不指定变量名,则系统默认变量名以VAR开头后面跟5个数字 为了便于记忆和理解,变量名与其所代表的具体含义一致。第10页,共98页。1.2变量的类型(Type)数值型:根据其功能和形式又可细分为(标准型、逗号型、句点型、科学计数型、美元型和自定义货币型)字符型日期型系统默认为标准数值型第11页,共98页。1.2.1数值型变量标准型:是SPSS默认的类型,宽度8、小数点2、小数点用圆点。科学计数类型:适合数值很大或很小的变量,变量显示为指数形式。如:-1.28E+002表示-1.28102逗号型(comma )圆

7、点型(Dot)美元型(Dollar)自定义货币型第12页,共98页。1.2.2日期型变量(Date)用于表示日期和时间的变量类型SPSS提供了多达29种日期型变量的格式.第13页,共98页。1.2.3字符型变量(String)是非数值型变量类型,其值是由字符串组成的.对其定义的对话框只有一个输入项第14页,共98页。1.2.4修改数据变量的默认值对于SPSS变量的参数,系统都会自动给出默认值.也可通过Edit菜单中的Date对话框重新设置点击第15页,共98页。1.3变量标签(Label)变量名标签(variable label) 对变量名含义的进一步补充说明。第16页,共98页。变量值标签(

8、alue Label) 是对数值型变量各个取值的含义给予进一步的解释和说明第17页,共98页。.4变量缺失数据(missing value)系统默认无缺失值:如当前变量测试值、记录完全正确、无遗漏,则可用无缺失值。第18页,共98页。离散缺失值:如性别0、3、4都是非法的,可分 别填入点击第19页,共98页。定义缺失值范围:这种缺失值针对连续的变量值。当指定某一范围的值出现在当前定义的变量中,则被当作缺失值处理。如在性别变量值中输入了3、4、5、6。可以在LOW后面输入3,HIGHT后面输入6。注意这个定义范围内不能有合法值。”0“就是包括不了的离散值第20页,共98页。第21页,共98页。1

9、.5度量尺度定距型变量(scale)可以表示如温度、重量等含义的连续性数值变量,也可以表示年龄、次数等离散型变量.还可以表示时间的日期变量或者货币的货币型变量,但不能是字符型变量.定序型变量(ordinal)其值表示一种顺序的前后,如职称变量可分为高中低三个档次,可用A(1)、B(2)、C(3)表示,定序型变量可以是数值型也可以字符型定类型变量(nominal):该变量不存在变量值之间的大小、顺序的前后等。只表示属于的类别。如性别中“1”表示男,“2”表示女等,可以是数值型也可以字符型第22页,共98页。第23页,共98页。数据录入实例第24页,共98页。2.SPSS数据文件的构成由数据结构和

10、数据内容构成 结构规定了数据文件的基本构成属性 (变量名、变量类型、变量名标签、变量值标签、缺失值定义、度量尺度及数据显示属性如宽度列宽度和对齐方式等) 如一个班考试成绩表包含姓名、考号、各科科目成绩(英语、数学、政治、专业)等六个变量。对每一个变量定义其属性,如“姓名”变量定义为字符型、宽度定义为8个字符,度量尺度为定类型,由于变量含义清楚,无须定义变量标签和变量值标签,缺失值默认为0第25页,共98页。2.1创建SPSS数据文件1.在Variables View 视区定义变量及其变量的属性2.在Date View视区录入数据文件的内容 浏览数据文件变量名的三种方法在Variable Vie

11、w视区中浏览在SPSS菜单中选择Utilities Varibles在SPSS主界面选择File Display Date File information第26页,共98页。第27页,共98页。第28页,共98页。SPSS数据的录入当变量的属性定义完成后就可以开始进行数据的输入切换窗口从Variables View Date View出现了二维的空白表格如Excel(见03 Date1) Enter输入一列相同参数 Tab 输入一行同一案例的数据Shift+Tab光标左移第29页,共98页。SPSS数据的编辑保证录入的数据准确无误,需要对SPSS数据进行修改、删除、插入、复制、定位等操作。第

12、30页,共98页。创建和读取SPSS数据文件直接通过SPSS数据编辑窗口定义变量输入数据(如前所述)通过打开不同格式的数据文件,间接创建SPSS数据文件。 支持*.doc,*.xls,*.txt等第31页,共98页。保存SPSS数据经读取、修改后把SPSS窗口的数据以数据文件的形式保存到外部的储介质中。第32页,共98页。二、SPSS常用统计图条形图线图面积图圆图直方图箱图散点图时间序列图质量控制图正态分布图第33页,共98页。条形图条形图(Bar Charts)用直条的长短来表示非连续性的资料的数量大小。常用的条形图有单式条形图(Simple)、复式条形图(Clustered)堆积式直条图(

13、Stacked)。第34页,共98页。线图线图(Line Charts)是用线条的上下波动的形式,来反映连续性的相对资料的变化趋势。常用的线图有单线图(Simple)、复线图(Multiple)和垂线图(Drop-line)。第35页,共98页。面积图面积图(Area Charts)是用线段下的阴影面积来签掉现象变化的统计图。面积图使用面积来表现连续性的聘书分布资料,面积越大,频数越多,反之亦然。类型:简单面积图(Simple)和堆栈统计图(Stacked)。第36页,共98页。圆图(饼图)圆图(Pie Charts) 是用圆的整体面积代表被研究对象的总体,按各组成部分的比重把圆面积分成若干个

14、扇形,用以表示对象的部分对总体的比例关系的统计图。第37页,共98页。箱图箱图(Boxplots)是一种描述数据分布的统计图,利用它可以从视觉的角度来观察变量值的分布情况。箱图主要表示变量值的中位数、四分之一数、四分之三数等统计量。第38页,共98页。散点图散点图(Scatter plots)又称散布图或相关图,是以点的分布反映变量之间相关情况的统计图形,根据图中各点分步走向和密集程度,大致可以判断变量之间协变关系的类型 。第39页,共98页。时间序列图时间序列是指按时间顺序排列的随机变量的一组实测值。时间序列图是从运动的角度来认识事物的本质。第40页,共98页。质量控制图质量控制图(Cont

15、rol Charts)又称质量管理图,是在分析和判断生产工序是否处于稳定状态时所使用的一种统计图。分类:计量型控制图和计数型控制图。第41页,共98页。三、SPSS的基本操作3.1 数据的输入与整理3.2 条形图的生成3.3 正态分布图的生成案例:用PPI预测CPI第42页,共98页。3.1数据的输入变量属性:变量名、变量类型、变量标签、变量长度变量基本类型:数值型、字符型、日期型 类型:标准数值型(Numeric)、加显逗号的数值型(Comma)、定义带圆点的数值型(Dot)、科学计数型(Scientific notation)、日期型(Date)、货币型(Dollar)、自定义型(Cust

16、om currency)、字符型(String)第43页,共98页。第44页,共98页。第45页,共98页。数据的编辑Define Dates:定义Insert Variable:插入一个变量Insert Cases:插入一个观测量Go to Case:定位Sort Cases:按某变量值对观测量进行排序Transpose:转置Restructure:重组Merge Flies:合并数据文件Split Files:拆分数据文件Select Cases:选择观测量Aggregate:汇总Weight Cases:加权处理Cut:剪切Copy:复制Undo:删除Redo:重复Paste:粘贴Pas

17、te Variables:粘贴变量Clear:清除Find:查找第46页,共98页。数据的整理数据的排序数据的分类汇总数据的计算第47页,共98页。3.2 条形图的生成生产线MONTUEWEDTHUFRISATSUN125624725125424925325023613593653573603593533197205192189180190207第48页,共98页。第一步:选择图形(Graphs),在下拉菜单中选择Bar项。进入Bar Charts对话框。第二步:在对话框选择”复式直条图(Clustered)”Summaries for groups of cases”,点击”定义(Defin

18、e)”按钮,进入对话框。 选择”Other summary function”项,将”产量”,点击对话框中的向右箭头按钮使之进入”Variable”框;选中”生产线”,点击使之进入”Category Axis”框;选中”星期”点击进入”Define Clusters”框。点击”titles”按钮,弹出”Titles”对话框。第49页,共98页。第50页,共98页。第三步:在Title对话框内输入“某公司三天生产线产量统计图”点击”Continue”按钮返回上一级对话框。第四步:点击”OK”即可。第51页,共98页。第52页,共98页。3.3 正态分布图的生成编号工资编号工资编号工资164117

19、521872651278228936513772389468147924905681579259167116822691771178427968721884289597219842997107520863095第53页,共98页。第一步:点击Graphs,选择其中的P-P项,打开P-P Plot对话框。第二步:Variables为检验变量,将被检验的数值型变量”工资”选入本框。 在Transform栏中,有4中转换形式: Natural log transform:自然对数 Standardize values:作标准化值的转换 Difference:差分转换第54页,共98页。Seasona

20、lly difference:季节差分转换在Proportion Estimation Formula(比例估算公式)栏中,共有4种计算预期正态概率值的方法:Bloms 公式为r-(3/8)/n+(1/4);Rankit 公式为r-(1/3)/n+(1/3);Tukeys 公式为r-(1/2)/n;Vand der Waerden 公式为r/(n+1)。以上各式中,n为观察单位数,r为1n的秩次。本例选Bloms方法。第四步:点击OK按钮完成操作。第55页,共98页。案例:用PPI预测CPI年份居民消费价格指数(%)工业品出厂价格指数(%)1991103.4106.21992106.4106.

21、81993114.7124.01994124.1119.51995117.1114.91996108.3102.91997102.899.7199899.295.9199998.697.62000100.4102.82001100.798.7200299.297.82003101.2102.32004103.9106.12005101.8104.92006101.5103.02007104.8103.1第56页,共98页。CPI与PPI的散点图第57页,共98页。CPI与PPI之间的相关性检验第58页,共98页。CPI与PPI之间的线性回归分析回归模型的主要统计量回归模型的方差分析表第59页,

22、共98页。模型参数的估计和检验第60页,共98页。CPI与PPI回归的残差图第61页,共98页。CPI与PPI回归标准化残差的直方图CPI与PPI回归标准化残差的正态概率图第62页,共98页。CPI与PPI回归标准化残差的正态概率分布图第63页,共98页。二、均值的比较与检验T 检验是检验差异显著性的十分重要的统计工具,这种差异显著性的检验是样本均值间的比较。因此T 检验也可以称为一种均值比较分析。它包括单样本T检验、独立样本T 检验、配对样本T 检验。来自正态总体的两个样本进行均值比较常使用T 检验的方法。T 检验要求两个被比较的样体来自正态总体。两个样本方差相等与不等时使用的计算t 值的公

23、式不同。第64页,共98页。1.单样本T检验 检验单个变量的均值是否与给定的常数之间存在差异。样本均数与总体均数之间的差异显著性检验属于单一样本T 检验。第65页,共98页。示例1圆盘制动闸直径:标准为322mm四台机器生产,每台抽出16个。 检验是否与322有差异?第66页,共98页。第67页,共98页。第68页,共98页。先拆分文件第69页,共98页。按机器编号分四组第70页,共98页。然后采用单样本T检验第71页,共98页。点击第72页,共98页。2.点击1.填入检验参照指标第73页,共98页。第74页,共98页。第75页,共98页。许多的科学领域中产生p值的结果0.05被认为是统计学意

24、义的边界线,但是这显著性水平还包含了相当高的犯错可能性结果0.05p0.01被认为是具有统计学意义而0.01p0.001被认为具有高度统计学意义。第76页,共98页。某轮胎厂的质量分析报告中说明,该厂某轮胎的平均寿命在一定的载重负荷与正常行驶条件下会大于25000 公里。平均轮胎寿命的公里数近似服从正态分布。现对该厂该种轮胎抽取一容量为15 个的样本,试验结果得样本均值为27000 公里能否作出结论:该厂产品与申报的质量标准相符数据?见示例轮胎.示例2第77页,共98页。第78页,共98页。点击第79页,共98页。1.输入比较参照值2.点击第80页,共98页。2.两独立样本T检验进行独立样本T

25、 检验,要求被比较的两个样本彼此独立,即没有配对关系。要求样本均来自正态总体,而且均值对于检验是有意义的描述统计量。独立样本T 检验和配对样本的T 检验均使用T test 过程,但是使用的菜单不同对于数据文件结构的要求和所使用的命令语句也有区别。第81页,共98页。示例1某物质在处理前与处理后分别抽样分析其含脂率如下处理前(Xi) 0.19 0.18 0.21 0.30 0.41 0.12 0.27处理后(Yi) 0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12假定处理前后的含脂率都服从正态分布,且方差相同。问处理前后的含脂率的平均值是否有显著变化?( =0.05

26、)。第82页,共98页。第83页,共98页。点击group进入分组变量点击处理前后进入检验变量第84页,共98页。1.点击group,定义分组组1处理前组2处理后2.点击继续第85页,共98页。点击确定第86页,共98页。第87页,共98页。示例2几何均数的比较 选甲型流感病毒血凝抑制抗体滴度(对数) 共24 人,随机分为两组,每组12人,用甲型流感病毒活疫苗进行免疫,一组用气雾法,另一组用鼻腔雾法。免疫后一月采血,分别测定血凝抑制抗体滴度结果如下。问两法的效果有无差异? 气 雾 组(1) 40 20 30 25 10 15 25 30 40 10 15 30 鼻腔雾组(2) 50 40 30

27、 35 60 70 30 20 25 70 35 25第88页,共98页。选择TransformCompute ,激活Compute Variable 新变量赋值主对话框令,lgx=lg10(x),点击OK 按钮,执行数据文件新增变量lgx,第89页,共98页。示例3作T 检验时,应首先检验方差是否相等。以上例子都是经检验后两样本方差相等的。下面举出一个经检验后方差不相等的例子。甲乙两矿坑平均产煤中含矸率( %)指标是服从正态分布的,今分别从两坑所产煤中各抽取7 个样品测得含矸率指标如下 甲坑(x) 5.9 3.8 6.5 18.3 18.2 16.1 7.6 乙坑(y) 7.6 0.4 1.1 3.2 6.5 4.1 4.7 能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论