版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
常用统计分析软件SPSS
13.0forWindows主讲:杨泽峰电话:7979358Email:yzfcn@126.com统计学与统计软件市场经济呼唤统计学统计学是研究客观事物数量特征和数量关系的方法论学科,能够告诉人们如何通过打开几扇窗口去探索一个未知的世界,教会人们怎样用一种新的方式来思考问题,是一门很实用的学科。大至国家的宏观决策,小至企事业单位的微观管理,都离不开统计的应用。现代市场经济对统计信息的需求急剧增加,对统计理论与方法提出了更高的要求。社会发展问题、经济可持续发展问题、国际竞争力问题、金融风险管理问题、保险精算问题、人口与社会保障问题、环境保护问题、科学研究探索问题等等,这些都迫切地等待着我们去深入地研究。统计学的分类统计方法的基本功用提供了整理和描述数据的科学的方法提供由样本推论总体的科学的方法提供通过误差分析以鉴定处理效应的科学的方法提供了分析多个变数间相关密切程度的科学的方法提供进行科学试验设计的科学的方法推荐使用的几本教材以上教材均被超星数字图书馆收藏,校园网用户均可直接下载。SPSS等统计软件的下载地址:/incoming/Science/stat/statnews/das/spss13.rar请迅速下载,将在一周后删除该链接本课程的教学网站网站地址http:///statnews内容教案教学大纲习题留言官方地址http://SPSS入门序言SPSS基础SPSS数据文件的建立与管理SPSS数据的基本加工和处理SPSS输出窗口序言统计分析软件是数据分析的主要工具完整的数据分析过程包括:数据的收集数据的整理数据的分析结果的解释和推论统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。序言统计分析软件的一般特点功能全面,系统地集成了多种成熟的统计分析方法;有完善的数据定义、操作和管理功能;方便地生成各种统计图形和统计表格;使用方式简单,有完备的联机帮助功能;软件开放性好,能方便地和其他软件进行数据交换。序言常用统计软件简介SAS(Ver9.1)--真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。人机对话界面太不友好图形操作界面比较糟糕一切围绕编程设计学习起来较困难(编程)说明书非常难懂价格贵的人直跳序言常用统计软件简介SPSS(Ver15)--统计软件中的贵族操作界面极为友好所有统计软件中最友好的精心设计的图形操作界面美观的结果输出强大的辅助教学功能输出结果与中文WORD尚存在一定兼容问题在国内深受欢迎,特别是市场调研行业在欧洲各研究机构中得到广泛应用序言常用统计软件简介S-Plus(Ver7)S语言(AT&T贝尔实验室)的后续发展极为强大的统计功能和绘图能力应用上以理论研究、统计建模为主需要有较好的数理统计背景对编程能力要求极高序言国外通行的计量经济学软件
Stata(Ver9)软件小巧绘图美观统计分析能力极强数据接口差不提供对话框界面,命令行方式操作序言最易上手的统计软件--NCSS2006界面友好功能齐全数据接口太简单序言国产统计软件的佼佼者-DPS(v7.55)一套通用多功能数据处理、数值计算、统计分析和模型建立软件;较强的统计分析和数学模型模拟分析功能;是目前国内功能最完整的统计软件包。自称:DPS=Excel+SPSS网站地址
序言学习使用统计分析软件的基本方法弄清分析的目的正确收集待处理和分析的数据(目的、影响因素的剔除)。弄清统计概念和统计含义,知道统计方法的适用范围,无需记忆公式。选择一种或几种统计分析方法探索性地分析数据。读懂计算机分析的数据结果,发现规律,得出分析SPSS基础软件名称StatisticalPackageforSocialScienceStatisticalProductandServiceSolutions软件发展60年代:美国斯坦福大学三位研究生研制70年代:SPSS总部成立于芝加哥,推出SPSS中小型机版—SPSSX80年代:微机版(V1-3)SPSS/PC+90年代:Windows版(v5-11)2003年:Windows版(v12)SPSS基础基本窗口数据编辑窗口(dataeditor)功能:对SPSS的数据进行定义、录入、修改、管理等基本操作的窗口包含数据视图工作表(dataview)和变量视图工作表(variableview)两部分。组成:窗口主菜单(Data、Transform、Analyze、Graphs)、工具栏、数据编辑区、状态显示区SPSS运行过程中自动打开;且只能打开一个窗口;运行过程中无法关闭SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据以.sav存于磁盘上SPSS基础基本窗口输出窗口(viewer)功能:SPSS统计分析报表及图形的输出窗口组成:窗口主菜单、工具栏、结果显示区、状态显示区在进行第一次分析时自动打开,也可手工打开;可以手工打开若干个可相互切换的viewer窗口;输出窗口可以关闭;状态栏上的!表示当前输出窗口窗口内容以.spo存于磁盘上SPSS基础SPSS的菜单SPSS基础利用SPSS做数据分析的一般步骤建立SPSS数据文件定义数据文件结构录入修改和编辑待分析的数据分析数据统计分析之前的数据预处理统计分析和建模结果的说明和解释数据和分析结果的保存SPSS数据文件的建立与管理数据文件的特点结构的定义数据的录入和保存数据的编辑与其他软件数据共享
SPSS数据文件的特点SPSS数据文件是一种有结构的数据文件数据文件的每一行代表一个观测量(概率事件)每一列代表一个变量在数据编辑器中可以输入和编辑数据,但是不能输入数学表达式和函数定义数据文件的结构变量名(Variablename)变量名是变量存取的唯一标志变量类型(type)和显示宽度(width)数值型:常用标准数值型(Numeric):默认类型8.2如:12345678、12345.67、-1234.56字符型(String):存储字符数据8位。如:beijing处理时用双引号扩起来日期型(Date):存储日期数据,如:20-AUG-1999注意:显示宽度不影响数据的存储定义数据文件的结构变量名标签(Variablelabel)对变量名进行标记,以便在结果输出时方便阅读。变量值标签(Valuelabel)用于注释变量值,尤其方便分类变量的输入和显示。变量列格式(ColumnFormat)缺失值(MissingValues)变量度量(Measurement)scale:数值型Ordinal:序数型Nominal:名词型数据的编辑打开数据文件数据定位插入和删除个案插入和删除变量数据单元数据的移动和复制与其他软件共享数据打开其他格式的数据文件直接打开在SPSS13已经可以直接读入许多常用格式的数据文件使用数据库查询打开利用通用数据库ODBC接口读取数据文件在9.0及以前版本中非常重要使用文本导入向导读入文本文件和大型机交换文件时常用与其它软件共享直接打开SPSS数据的基本加工和处理数据文件的整理个案排序、个案选取、文件合并、文件转置数据加工计算变量、产生计数变量、分类汇总数据分组手工分组数据文件的其他处理功能指定加权变量、SPSS变量集的定义和使用数据文件的整理个案排序(sort)将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列快速查找异常值、极端值个案选取(selectcases)个案选取方式数据文件的整理文件合并(mergefile)将两个SPSS数据文件合并到一个数据文件中。纵向合并(addcases)、横向合并(addvariables)文件转置(transpose)将数据文件行列互换,即:将个案转为变量,变量转为个案。将数值型变量的数据旋转90°。数据的加工变量计算(compute)产生新变量或对原变量进行必要的转换SPSS算术表达式和逻辑表达式SPSS函数产生计数变量(count)对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量中。SPSS函数SPSS函数是事先编好并存储在SPSS软件中,能够实现某些特定任务的一段计算机程序。根据函数功能和处理的变量类型,SPSS函数大致可以分成八大类:算术函数、统计函数、分位数函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数。算术函数算术函数统计函数数据的加工分类汇总(aggregate)按指定的分类变量的变量值对个案分组;计算每组个案的汇总变量的基本统计量;将计算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。数据的分组目的:了解数据的总体分布状况手工分组(recode)将指定按哪个变量分组,即:指定分组变量;定义分组变量的分组区间(不重、不漏);指定一个存放分组结果的标志变量自动分组(CategorizeVariables)将连续性变量自动按分位数要求分成几类数据文件的其它处理功能加权(weightcases)指定某一变量为加权变量。变量集加快变量选择的速度变量集的定义变量集的使用第二章统计分析基础统计包括:描述性统计、方差分析、t-检验、线性回归、相关分析等专业统计:包括:辨别分析、因子分析、聚类分析、主成分分析等高级统计分析包括:logistic回归分析、多元方差分析、非线性回归、probit回归分析、曲线估计等2.1描述性统计分析频数分布分析(Frequencies)描述性统计分析(Descriptives)探索性分析(Explore)列联表资料分析(Crosstabs)2.1.1频数分布分析目的频数分布分析主要通过频数分布表、条图和直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征。采用的方法计算频率分布表绘制统计图形上述方法适用于定序、定类、定距类型数据步骤【Analyze】【Descriptive
Statistics】【Frequences】2.1.2描述性统计分析目的:描述性统计分析主要用以计算描述集中趋势和离散趋势的各种统计量,并可对变量进行标准化处理。步骤:【Analyze】【DescriptiveStatistics】【Descriptives】2.2常用统计图统计图是用点、线、面等各种几何图形表达统计数据的一种形象的形式,其特点是简明生动,形象具体、通俗易懂且又一目了然。SPSS具有较强的制图功能,可以绘制多种统计图形,这些图形可以由各种统计分析过程产生,也可以直接由菜单“Graphs”图形菜单产生。SPSS软件系统提供了许多产生统计图形的方法。常用的统计图有条形图(barchart)、饼图(piechart)、线图(linearchart)和直方图(histogram)等。2.2.1条形图条形图一般用于归类资料,主要适用于彼此独立的资料互相比较。2.2.1条形图【Graphs】【Bar…】对话框选项说明〖Simple〗--简单条形图〖Clustered〗--分组(类)条形图〖Stacked〗--堆积图(分段条形图)〖Summariesforgroupscases〗--观察值分类描述模式,即对变量中的观察值进行分组后绘图。〖Summariesofseparatevariables〗--变量描述模式,即对每个变量生成一个条形图。〖Valuesofindividualcases〗--观察值描述模式,即对应分类轴变量中的每一观察值生成一个条形图。2.2.1复式条形图2.2.2散点图散点图散点图就是将两个变数的n对观察值分别以坐标点的形式标记于同一直角坐标的平面上。【Graphs】【scatter/dot】改内容将在线性回归中加以介绍2.2.3线图调用“Graphs”菜单中的“Line”过程,可绘制线图。线图是用线条的上下波动形式,反映连续性的相对资料的变化趋势。2.2.3复式线图直方图(柱形图、矩形图)直方图适用于表示连续性资料(计量资料)的次数分布。【Graphs】【Histogram】SPSS系统根据原始数值的最大值和最小值自动对变量分组,画出直方图。如果要修改组数等,可以在图形编辑窗口中改变。直接双击直方图的横轴,开启Properties对话框。2.3均值检验统计假设测验概述单样本的t测验两个独立样本的t测验两个配对样本的t测验2.3.1统计假设测验概述统计推断(statisticalinference),就是根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。统计推断的基本内容:统计假设测验(hypothesistest)参数估计(parametricestimate)统计假设测验是指根据某种实际需要,对未知的或不完全知道的统计总体提出一些假设(这些假设通常构成完全事件系),然后由样本的实际结果,经过一定的计算,作出在概率的意义上应当接受那种假设的测验。假设测验的步骤
提出无效假设:实得差异由误差造成;备择假设:实得差异由总体参数不同造成。确定显著水平。在为正确的假设下,根据统计数的一定分布律,算出实得差异由误差造成的概率。如果这个概率,则在水平上否定,接受;反之亦然。2.3.2单样本的t测验含义:检验某变量的总体均值与指定的检验值之间是否存在显著差异。要求:样本来自的总体服从正态分布。步骤:【Analyze】【Comparemeans】【Onesamplettest】例题2.3.2单样本的t测验简明分析步骤2.3.3两独立样本的t测验(一)含义:根据两独立样本的数据,对两总体均值是否有显著差异进行推断。例如:男生和女生的计算机平均成绩有显著差异吗?城镇和农村的平均存(取)款金额有显著差异吗?(二)要求:两样本必须相互独立,即:抽取其中一批样本对抽取另一批样本没有任何影响。(如:北京周岁儿童与上海儿童的平均身高)两总体服从正态分布2.3.3两独立样本的t测验步骤【Analyze】【CompareMeans】【Independent-samplettest】结论首先,如果F检验的P≤α,认为方差不齐性;其次看Unequal行的t检验概率。如果≤α,则拒绝t检验的H0,认为两总体均值有显著差异;如果>α,则不拒绝t检验的H0。首先,如果F检验的P>α,认为方差齐性;其次看equal行的t检验概率。其余同上例题2.3.3两独立样本的t测验简明分析步骤2.3.4两配对样本的t测验含义:根据配对样本对两总体均值是否有显著差异进行推断。例如:某种减肥茶是否有效。则可以研究在服用减肥茶前后的体重,个体之间必须为一一对应的关系。要求:两样本数据必须两两配对,即:样本个数相同,个案顺序相同.如:减肥茶的效果、不同广告形式对销售额的影响.(控制了个案自身的影响)两总体服从正态分布2.3.4两配对样本的t测验基本思路计算两样本对应的个案的差值di=Y1i-Y2i计算t统计量和对应的相伴概率P(绝对值大于等于的双侧概率)结论:P≤α,则拒绝H0,认为两总体均值有显著差异.P>α,不能拒绝H0.步骤【Analyze】【CompareMeans】【Paired-samplettest】例题2.3.4两配对样本的t测验简明分析步骤例题2.4方差分析目的:方差分析是从数据间的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素。例如:影响某农作物亩产量的因素(品种、施肥量、气候等)影响推销某种商品的推销额(不同的推销策略、价格、包装方式、推销人员的形象等)核心问题从数据差异角度看:观测变量的数据差异=控制因素造成+随机因素造成方差分析正是要分析观测变量的变动是否主要是由控制因素造成还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的。2.4方差分析单因素试验资料方差分析多因素试验资料方差分析二因素无重复试验资料的方差分析二因素有重复试验资料的方差分析二因素随机区组试验资料的方差分析协方差分析2.4.1单因素方差分析目的检验某一个控制因素的改变是否会给观察变量带来显著影响.例如:考察不同肥料对某农作物亩产量是否有显著差异.考察不同学历是否对工资收入产生显著影响.步骤【Analyze】【CompareMeans】【One-wayANOVA】例题2.4.1单因素方差分析简明分析步骤例题方差分析中的多重比较目的如果总体均值存在差异,F检验不能说明哪个水平造成了观察变量的显著差异。多重比较将对每个水平的均值逐对进行比较检验。常用方法LSD法实际上就是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息。Duncan氏新复极差测验法Tukey氏固定极差测验法Dunnett氏最小显著差数测验法实现手段【PostHoc…】按钮2.4.2多因素方差分析控制因素的种类固定效应因素(FixedFactor):指的是试验因素的k个水平是经过特意选择的。随机效应因素(RandomFactor):指试验因素的k个水平是从该因素水平总体中随机抽出的样本。两种因素的区别长江流域有成千上万的水稻地方品种。如果通过筛选,选出若干个来作比较试验,则该因素为固定效应因素。若我们是从这成千上万的品种中随机抽取若干个来研究,希望了解长江流域水稻品种总体的遗传组成或生态特点,则该因素为随机效应因素。2.4.2多因素方差分析基本思路:以两个控制变量的方差分析为例:SS总=SSA+SSB+SSAB+SSeSSAB表示两个控制变量的交互影响,即:两个控制变量各水平之间搭配时对观察变量的影响.步骤【Analyze】【GeneralLinearModel】【Univariate】2.4.2多因素方差分析例题2.4.2多因素方差分析2.4.2多因素方差分析简明分析步骤2.4.2多因素方差分析随机区组试验这种类型的试验应用重复、随机化和局部控制三个原则。局部控制是指将整个试验空间分成若干个各自相对均匀的局部,这个局部叫做区组。区组可以是培养箱的某一层,某一畜舍或试验地的某一段等。然后,在各个区组上试行重复和随机化。2.4.2多因素方差分析2.4.3协方差分析协方差分析是将回归分析和方差分析结合起来的一种统计分析方法,其主要的功用是对试验误差进行统计控制。目的:将无法或很难控制的因素作为协变量,在排除协变量影响的条件下更精确地分析控制变量对观察变量的影响。协方差分析的主要功用测验多个线性回归方程中回归系数bi的差异显著性矫正处理平均数并测验矫正平均数间的差异显著性作出不同变异来源的相关关系分析2.4.3协方差分析2.4.3协方差分析基本思路:协变量是数值型的;与观测变量的线性关系在各水平均成立,且斜率大致相同。SS总=SS协+SSA+SSB+SSAB+SSe步骤【Analyze】【GeneralLinearModel】【Univariate】注意:在弹出的对话框中将协变量选入【Covariate(s)】栏简明分析步骤2.5相关和回归分析相关分析一元回归分析多元回归分析曲线拟合非线性回归分析2.5相关和回归分析相关分析和回归分析的任务研究对象:统计关系相关分析旨在测度变量间线性关系的强弱程度。回归分析侧重考察变量之间的数量变化规律,并通过一定的数学表达式来描述这种关系,进而确定一个或几个变量的变化对另一个变量的影响程度。2.5相关和回归分析目的通过样本数据,研究两变量间线性相关程度的强弱。(例如:职工的年龄和收入之间的关系、工人数和管理人员之间的数量关系)基本方法绘制散点图、计算相关系数绘制散点图的方法【Graphs】【Scatter】实例实例2.5.1相关系数作用:以精确的相关系数(r)体现两个变量间的线性关系程度.r:[-1,+1];r=1:完全正相关;r=-1:完全负相关;r=0:无线性相关。说明:相关系数只是较好地度量了两变量间的线性相关程度,不能描述非线性关系。数据中存在极端值时不好。步骤【Analyze】【Correlate】【Bivariate】2.5.2一元线性回归方程一元回归方程:Y=a+bXa为常数项;b为Y对X回归系数,即:X每变动一个单位所引起的Y的平均变动回归方程的显著性检验(1)目的:检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示.(2)检验方法t检验F检验(一元回归中,F检验与t检验一致,即:F=t2,两种检验可以相互替代)步骤【Analyze】【Regression】【Linear】2.5.3多元线性回归分析多元线性回归方程多元回归方程:Y=β0+β1X1+β2x2+...+βkxkβ1、β2、βk为偏回归系数。β1表示在其他自变量保持不变的情况下,自变量X1变动一个单位所引起的因变量Y的平均变动多元线性回归分析的主要问题回归方程的检验自变量筛选多重共线性问题2.5.3多元线性回归分析自变量筛选法Enter:所选择的自变量将全部进入建立的回归方程中,该项为默认方式。对一元线性回归采用较多。Remove:将进入方程中的自变量同时剔除。Forward:向前筛选法,是自变量不断进入回归方程的过程。Backward:向后筛选法,是自变量不断剔除出回归方程的过程。Stepwise:逐步筛选法,是“向前法”和“向后法”的结合实例2.5.4曲线拟合目的:在一元回归分析或时间序列中,因变量与自变量(时间)之间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年技术转让及授权协议
- 8K文化旅游展示
- 河南省鹤壁市(2024年-2025年小学五年级语文)人教版随堂测试((上下)学期)试卷及答案
- 2024年度工业设备安装喷锚注浆分包合同
- 外研版八年级英语下册期末过关训练课件
- 大数据安全技术研究与应用探索
- 《新编经济应用文写作》课件第6章
- 解读节能减排技术
- 《应用数值分析》课件数值分析5.5线性方程组的数值解法
- 《物联网技术与应用开发》课件第3章
- 康复医院建筑设计标准
- 2024年货季电商消费复盘-Flywheel飞未
- 培训内驱力的课件
- 《智能制造系统》课程标准
- 防火巡查记录表防火检查记录表
- 胸腔积液患者病例讨论
- 科研的思路与方法
- 大学生职业生涯规划成长赛道
- 高二上学期日语阅读四篇自测
- 大学生职业生涯规划成长赛道 (第二稿)
- 蓄电池的分类介绍课件
评论
0/150
提交评论