版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计分析软件SPSS应用方法2.spss软件使用方法SPSS一、SPSS概述二、SPSS数据创建三、SPSS统计分析1、基本统计分析2、方差分析3、相关分析4、聚类分析2.spss软件使用方法1SPSS简介SPSSStatisticalPackagefortheSocialSciences社会科学统计软件包StatisticalProductandServiceSolutions统计产品与服务解决方案68年开发,75年成立SPSS公司,2009年IBM收购,目前到IBMSPSS20.0版本次讲解应用IBMSPSSforWindows19.02.spss软件使用方法一、SPSS概述1、SPSS简介2、SPSS窗口2.spss软件使用方法1SPSS简介SAS和SPSSSAS:为专业统计分析人员设计,功能强大,灵活多样。SPSS:非专业人士,操作简便,好学易懂,简单实用。“易学易用易普及”大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。无需掌握统计分析的各种复杂的数学运算过程,只需掌握各种方法的应用,分析结果的解释。功能强大完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。提供从简单的统计描述到复杂的多因素统计分析方法。能非常方便地与其他软件的数据进行转换图表功能强大,输出结果美观漂亮2.spss软件使用方法
2SPSS窗口标题栏菜单栏工具栏
编辑栏 变量名栏观测序号 窗 口 切 换 标 签2.spss软件使用方法2SPSS窗口变量序号名称可变观测序号变量序号变量属性名称2.spss软件使用方法结果输出窗口
2SPSS窗口导航窗口2.spss软件使用方法二、统计数据创建数据属性及定义、编辑SPSS数据创建案例:SPSS数据创建2.spss软件使用方法1数据属性及定义编辑SPSS数据特点:结构化(数据内容、数据结构)变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据的显示属性(显示宽度、列宽度、对齐方式)2.spss软件使用方法不超过8个字符、4个汉字变量名必须唯一,并且不区分大小写如不指定变量名,则系统默认变量名以VAR开头后面跟5个数字。如VAR00001、VAR0002等
1.1变量名(名称)数据视图变量视图2.spss软件使用方法1.2变量类型变量取值的类型数值型、字符型(不能进行算术运算)、日期型2.spss软件使用方法1.3标签标签是对变量名的进一步解释名称限制字符不超过8个,标签可达120个字符2.spss软件使用方法1.4值值是对变量取值含义的进一步解释2.spss软件使用方法1.5缺失值缺失值两种情况:数据中存在漏填数据数据中存在明显错误或明显不合理的数据(如年龄130)如果直接进行数据分析,SPSS将把缺失数据作为正常数据,造成非常大的误差缺失数据处理步骤:1、指定缺失数据,指明哪些数据属于缺失数据空缺数据,首先填一个特定标记数据(如99999,区别于该变量其他非缺失数据)2、统计分析时对缺失数据进行一定处理选择缺失数据处理方法2.spss软件使用方法2.SPSS数据创建直接录入1、定义数据属性;2、输入数据打开现有数据(sav、excel、SAS、txt)2.spss软件使用方法2.SPSS数据创建直接录入1、定义数据属性;2、输入数据打开现有数据(sav、excel、SAS、txt)2.spss软件使用方法2.SPSS数据创建2.spss软件使用方法3.案例:SPSS数据创建1、定义变量属性2、读取excel数据文件2.spss软件使用方法三、SPSS统计分析SPSS基本统计分析方差分析相关分析线性回归分析聚类分析2.spss软件使用方法1、基本统计分析基本统计分析,描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在描述菜单中,包括:2.spss软件使用方法1.1频数分析频数分析目的:基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。基本任务(1)编制频数分布表频数:即变量值落在某个区间(或某个类别)中的次数百分比:即各频数占总样本数的百分比有效百分比:即各频数占有效样本数的百分比,有效样本数=总样本-缺失样本数累计百分比:即各百分比逐级累加起来的结果。最终取值为100。(2)绘制统计图2.spss软件使用方法1.1频数分析频数分析的基本操作(1)分析—描述统计—频率(2)将频数分析变量选择到变量框中(3)单击表格按钮选择绘制统计图形,选择饼图2.spss软件使用方法1.1频数分析2.spss软件使用方法1.1频数分析输出结果2.spss软件使用方法1.2描述分析描述分析目的:获取数据的均值、标准差、峰度等数据,进一步把握数据的集中趋势、离散程度和分布形状。基本描述统计量刻画集中趋势的统计量刻画离散程度的统计量刻画分布形态的统计量2.spss软件使用方法1.2描述分析刻画集中趋势的统计量集中趋势指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的统计量正是要寻找能够反应数据一般水平的“代表值”或“中心值”。常用统计量:均值、中位数、众数均值:即算术平均数,是反映某变量所有取值的集中趋势或平均水平的指标。如某企业职工的平均月收入。中位数:即一组数据按升序排序后,处于中间位置上的数据值。众数:即一组数据中出现次数最多的数据值。2.spss软件使用方法1.2描述分析刻画离散程度的统计量离散程度是指一组数据远离其“中心值”的程度。
如果数据都紧密地集中在“中心值”的周围,数据的离散程度较小,说明这个“中心值”对数据的代表性好;相反,如果数据仅是比较松散地分布在“中心值”的周围,数据的离散程度较大,则此“中心值”说明数据特征是不具有代表性的。常用统计量:全距、方差、标准差全距:也称极差,是数据的最大值与最小值之间的绝对离差。2.spss软件使用方法1.2描述分析刻画分布形态的描述统计量数据分布形态主要指数据分布是否对称,偏斜程度如何,分布陡峭程度等。常用统计量:偏度、峰度偏度:描述变量取值分布形态对称性的统计量。当分布为对称分布时,正负总偏差相等,偏度值等于0;当分布为不对称分布时,正负总偏差不相等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,称为正偏或右偏;偏度值小于0表示负偏差值大,称为负偏或左偏。偏度绝对值越大,表示数据分布形态的偏斜程度越大。峰度:描述变量取值分布形态陡峭程度的统计量。当数据分布与标准正态分布的陡峭程度相同时,峰度值等于0;峰度大于0表示数据的分布比标准正态分布更陡峭,为尖峰分布;峰度小于0表示数据的分布比标准正态分布平缓,为平峰分布。2.spss软件使用方法1.2描述分析计算基本描述统计量的操作(1)分析—描述统计—描述(2)将分析变量选择到变量框中(3)单击选项按钮指定基本统计量2.spss软件使用方法1.2描述分析2.spss软件使用方法2、方差分析方差分析概述背景案例统计学原理相关统计量SPSS操作SPSS结果解读方差分析案例2.spss软件使用方法2.1方差分析概述2.1.1背景案例影响农作物产量的因素可能有多个,如品种、施肥量、地域特征等。在众多的因素中,有些因素会对产量有明显的影响,有些因素的影响不大。因此,找到中影响因素中起重要的和关键作用的因素是非常重要的。进一步,在掌握了关键因素后,如品种、施肥量等,还需要对不同品种、不同施肥量的产量进行比较,研究究竟哪个品种的产量高,施肥量究竟多少最为合适。在制定广告宣传策略时,不同方案所获得的广告效果可能是不一样的。广告效果可能会受到广告形式、地区规模、播放时间段、播放频率等因素的影响。需要研究在影响广告效果的众多因素中,哪些因素是主要的,哪些是次要的,哪些因素水平是最合理的。对这种类似问题的研究可以通过方差分析来实现。2.spss软件使用方法2.1方差分析概述2.1.2方差分析相关概念观测变量:农作物产量、广告效果因素(控制变量):品种、施肥量、播放时间段等因素水平:因素的不同类别,如甲品种、乙品种就是品种这一变量的两个水平。单因素方差分析、多因素方差分析2.spss软件使用方法2.1方差分析概述2.1.3方差分析统计学原理观测变量取值变化原因:1、控制变量;2、随机变量如果相对于随机变量引起的观测值差异,控制变量引起的观测值差异较大,则说明控制变量对观测变量有显著影响。在统计学中,控制变量和随机变量引起的差异可以分别用一个统计量来表示。单因素方差分析中,分别用SSA、SSE来表示。SSA:组间差异(组间离差平方和),主要是由控制变量的不同水平造成的差异;SSE:组内差异(组内离差平方和),主要是由随机变量引起的差异。SSA+SSE=SSTSST:总差异(总离差平方和)方差分析任务:判定SSA相对于SST(或SSE)的大小。SSA相对较大,则表明控制变量起到了显著影响,若相对较小,则表明控制变量没有显著影响。2.spss软件使用方法2.1方差分析概述2.1.3单因素方差分析统计学原理假设控制变量会对观测值不会产生显著影响,将总离差(SST)分解为组间离差平方和(SSA)和组内离差平方和(SSE)。比较SSA与SST的相对大小。SSA与SST的相对大小要受到样本规模、控制变量水平数的影响,为消除这些因素的影响对SSA、SST要进行一定的处理(分别除以自由度),用统计量F来表示SSA的相对大小F==SSA/自由度组件均方差SSE/自由度总均方差方差分析-从观测变量的部分取值推测观测变量总体取值与随机变量的关系。部分是否能够代表总体情况?由于存在随机抽样和样本数量较少等原因,通过分析样本的出的结论不能直接用于总体。要进行假设检验。
F是随机变量,服从一定的分布,其取值会因为具体的样本的不同而不同。计算研究样本的F值,即F的观测值,并计算该F观测值对应概率p值,如果p值很小(一般是小于0.05),说明F取到该观测值的概率很小,是不可能发生的。则认为假设“控制变量对观测值没有显著影响”是不对的,也就是,控制变量会对观测变量产生显著影响。2.spss软件使用方法2.1方差分析概述2.1.4单因素方差分析基本假设:对总体分布的假设:总体服从正态分布各处理组总体方差相等(方差齐性或方差同质性)正态分布检验:根据大数定律和中心极限定理原理,假设满足。方差齐性检验:对控制变量不同水平下观测变量总体的方差是否相等进行假设检验,在SPSS中可以通过方差同质性检验进行。2.spss软件使用方法2.2SPSS方差分析操作2.2.1方差分析数据形式离差分解时仅仅是对观测水平这一列的数值进行分析,但是也要有存放控制变量的列。正确的数据格式是统计分析的前提。
观测变量控制变量2.spss软件使用方法2.2SPSS方差分析操作2.2.2SPSS操作步骤打开的数据格式分析——比较均值——单因素方差分析选择观测变量(因子)、控制变量(因变量)(只能选择一个因子)选项,选择“方差同质性检验”缺失值处理2.spss软件使用方法2.3SPSS方差分析结果解读
P值(显著性)=0.515,远大 于基准值0.05,说明假设“方 差齐性”正确,即控制变量不 同水平下各组的方差相同。
满足方差分析的前提。
P值(显著性)=0.000,远小于基 准值0.05,说明假设“控制变量对观 测变量没有显著影响,即广告形式 对销售额没有显著影响”正确,即控制变量不同水平下各组的方差相 同。结论:广告形式对销售额有显著影响。2.spss软件使用方法2.3SPSS方差分析结果解读结论:广告形式用报纸获得的销售额最高,宣传品的效果最不好2.spss软件使用方法3相关分析相关分析概述SPSS相关分析操作SPSS相关分析结果解读SPSS相关分析案例2.spss软件使用方法3.1相关分析概述家庭收入和支出、子女身高和父母身高的关系、一个人的身高和体重的关系?客观事物之间关系:函数关系、统计关系函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应统计关系:非一一对应,当一个变量x取一定值时,另一变量y无法依确定的函数取唯一确定的值。相关分析:研究两个变量相互关系的密切程度和变化趋势,并用适当的统计指标描述。2.spss软件使用方法3.1相关分析概述相关分析与方差分析的比较相同点:分析两个变量之间是否有关系不同点:1、相关分析的两个变量都是随机变量(不能人为精确控制取值大小);回归分析的控制变量是非随机变量(其取值可以固定),观测变量是随机变量。2、相关分析的两个变量都可以量化,可以用数值比较同一变量的不同取值的大小;回归分析的观测变量可以比较观测值的大小,但是某些控制变量不能比较数值大小,如农作物品种。3、相关分析可以比较两个变量的变化趋势的异同,方差分析不能。4、相关分析的两个变量一般都有众多的不同取值,回归分析的控制变量只有几种可能的取值,可以根据控制变量的不同水平将观测对象进行分组。2.spss软件使用方法3.1相关分析概述相关分析工具:散点图、数值散点图:将数据以点的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及它们的强弱程度和方向。在实际分析中,散点图经常表现出某些特定的形式。如绝大多数的数据类似于“橄榄球”的形状,或集中形成一根“棒状”,而剩余的少数数据点则零散地分布在四周。通常“橄榄球”和“棒状”代表了数据对的主要结构和特征,可以利用曲线将这种主要结构的轮廓描绘出来,使数据的主要特征更突出。2.spss软件使用方法3.1相关分析概述散点图简单散点图:表示一对变量间统计关系的散点图。矩阵散点图:以矩阵形式在多个坐标轴上分别显示多对变量间的统计关系。2.spss软件使用方法
3.1相关分析概述矩阵散点图:弄清各坐标轴所代表的变量。课题总数论文数专著数横轴:从最底层一条向上依次为论文数、专注数、课题总数。纵轴:从最左侧一条向右依次为课题总数、专注数、论文数。
课题总数 专著数 论文数2.spss软件使用方法3.1相关分析概述相关系数以数值的方式精确的反映了两个变量间线性相关的强弱程度。①相关系数r的取值在-1~+1之间;②r>0表示两变量存在正的线性相关关系;r<0表示两变量存在负的线性相关关系;③r=1表示两变量存在完全正相关;r=-1表示两变量存在完全负相关;r=0表示两变量不存在相关,不代表两变量之间不相关;④|r|>0.8表示两变量有较强的线性关系;|r|<0.3表示两变量之间的线性关系较弱。2.spss软件使用方法3.1相关分析概述相关系数种类1.Pearson简单相关系数(度量两定距型变量的线性相关性)2.Spearman等级相关系数(度量定序变量间的线性相关关系)定序变量:区别等级次序的变量。定序变量能决定次序,例如文化程度可以分为大学、高中、初中、小学、文盲;年龄可以分为老、中、青。但是,定序变量在只具有大于或小于的性质,只能排列出它们的顺序,而不能反映出大于或小于的数量或距离。比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。定距变量:区别等级次序及其距离的变量。它除了包括定序变量的特性外,还能确切测量同一类别各个案高低、大小次序之间的距离,因而具有加与减的数学特质。2.spss软件使用方法3.2SPSS相关分析操作3.2.1散点图1、图形-旧对话框-散点/点状2、选择散点图类型3、制定X、Y轴变量或矩阵变量2.spss软件使用方法3.2SPSS相关分析操作相关系数1、分析-相关-双变量2、选择变量(可选择多个)3、选择相关系数(可复选)2.spss软件使用方法3.3SPSS结果解读样本相关系数假设“总体无线性相关”概率接近0,小于0.01,假设不对,即总体存在显著线性相关2.spss软件使用方法5、聚类分析聚类分析概述SPSS聚类分析操作SPSS聚类分析结果解读SPSS聚类分析案例2.spss软件使用方法5.1聚类分析概述5.1.1背景案例市场营销中的市场细分和客户细分问题。对客户分类,可直接根据年龄、职业、收入、消费金额、喜好等方面进行分类,但存在主观色彩,需要有丰富的行业经验才能得到比较合理的客户细分,否则得到的分组可能无法充分反映和展现客户的特点,同一客户小组中的客户在某些方面的特征并不相似,而不同小组的客户在某些方面却又非常相似。这种客户细分并没有真正起到划分客户群的作用。为解决问题,客观进行分类,应该从数据自身出发,充分利用数据进行客户的客观分组。使诸多特征相似的客户分在同一组内,不相似的客户分在不同的组。这时便可以采用聚类分析的方法。聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。聚类分析的原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。通过分类,有利于我们抓住重点,从总体上去把握事物,找出解决问题的方法。2.spss软件使用方法5.1聚类分析概述5.1.2聚类分析原理要做聚类分析,首先得按照聚类的目的,从对象中提取出能表现这个目的的特征指标;然后根据亲疏程度进行分类。聚类分析是一种数值分类方法(即完全是根据数据关系)。要进行聚类分析就要首先建立一个由某些事物属性构成的指标体系,或者说是一个变量组合。入选的每个指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,它们互相配合可以共同刻画事物的特征。简单地说,聚类分析的结果取决于变量的选择和变量值获取的两个方面。变量选择越准确、测量越可靠,得到的分类结果越是能描述事物各类间的本质区别。2.spss软件使用方法5.1聚类分析概述聚类分析是根据个体间的“亲疏程度”对个体(样本或变量)进行分类。“亲疏程度”
度量方法——两个角度:1、个体间的相似程度,通常用相关系数衡量;2、个体间的差异程度,通常通过某种距离衡量。不同的数据类型,所用距离类型不同。2.spss软件使用方法5.1聚类分析概述5.1.3个体间距离度量方法(度量标准)变量类型不同,距离度量方法不同定距变量(区间变量)、计数变量、二分类变量2.spss软件使用方法
5.1聚类分析概述5.1.3个体间距离度量标准
定距变量(区间变量)身高、体重连续变量可比较大小,可进行算术运算,衡量差值大小度量方法:欧氏距离、平方欧氏距离、夹角余弦等;默认2.spss软件使用方法5.1.3个体间距离度量标准
计数(频数)变量 非连续
如选修课程数,只能取整数度量标准:卡方测量;
Phi方度量默认2.spss软件使用方法
5.1聚类分析概述5.1.3个体间距离度量标准二值变量(二分类)
变量取值有两种可能, 分别表示两种情况
如性别(1,2),婚姻状况(1,2)度量标准:二元欧氏距离平方默认2.spss软件使用方法5.1聚类分析概述5.1.4聚类分析方法:系统聚类(层次聚类)、K-均值聚类。 层次聚类:聚类过程按照一定层次进行。根据聚类对象的不同分为样品聚类(Q聚类)和变量聚类(R聚类)。Q聚类:根据一系列观测变量的测量值对个案进行分类,分类的依据是个案之间的“距离”。R聚类:对研究对象的观察变量进行分类,它使得具有共同特征的变量聚集在一起,以便选择其中具有代表性的变量,实现用较少变量刻画研究对象的目的。2.spss软件使用方法5.1聚类分析概述层次聚类聚类过程首先,每个个体自成一类;然后按照某种方法度量所有个体间的亲疏程度,将其中最“亲密”的个体聚成一小类,形成n-1各类;接下来再次度量剩余个体和小类之间的距离,将最“亲密”的个体或小类聚成一类。重复上述过程,不断将个体和小类聚集成越来越大的类,直到所有个体聚到一起,形成一个大类。随着聚类的进行,类内的“亲密”程度在逐渐降低
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新世纪版选修4化学下册月考试卷含答案
- 2024版居间协议融资居间合同
- 二零二五年度虚拟现实游戏开发合同补充协议
- 2025年青岛版六三制新八年级化学下册阶段测试试卷
- 二零二五年度降水井工程安全管理与培训合同范本3篇
- 2025年沪教版八年级地理下册阶段测试试卷含答案
- 2025年粤人版八年级化学下册阶段测试试卷含答案
- 2025年华东师大版五年级数学上册阶段测试试卷含答案
- 2025年牛津译林版一年级语文上册月考试卷
- 2025年鲁科五四新版七年级地理上册月考试卷
- 期末测试卷-2024-2025学年外研版(一起)英语六年级上册(含答案含听力原文无音频)
- 工厂厂房拆除合同范本
- 上海市浦东新区2023-2024学年一年级上学期期末考试数学试题
- 四位数乘四位数乘法题500道
- 初二(6)班-家长会
- 光伏发电项目并网调试方案
- 高中化学竞赛题--成键理论
- 康复中心组织结构图
- 屋顶光伏设备维保方案
- 装表接电课件
- 机电维修工绩效考核表【精选文档】
评论
0/150
提交评论