管理统计SPSS的基础知识、作用和使用_第1页
管理统计SPSS的基础知识、作用和使用_第2页
管理统计SPSS的基础知识、作用和使用_第3页
管理统计SPSS的基础知识、作用和使用_第4页
管理统计SPSS的基础知识、作用和使用_第5页
已阅读5页,还剩176页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS的基础知识、作用和使用1第一节 使用SPSS的基础知识SPSS是Statistical Package for Social Science(社会科学统计软件包)的缩写。SAS是Statistical Analysis System(统计分析系统)的缩写。经过30多年的发展,SPSS公司已经由单一的统计软件开发商发展成为集统计分析、数据挖掘、商业智能、客户关系管理等多种产品和咨询服务于一体的跨国公司。 SPSS的含义也延伸为Statistics Product and Service Solutions(统计产品和服务解决方案)。2SPSS的统计功能样本数据的描述和预处理假设检验(包括

2、参数检验、非参数检验和其他检验)方差分析(包括一般的方差分析和多元方差分析)相关分析回归分析聚类分析和判别分析因子分析时间序列分析可靠性分析3统计分析报告的文本格式标题调查研究的背景与现实意义调查方案的设计数据分析调查结论及相应的建议附件4 一、SPSS 窗口介绍启动后,显示数据编辑器(Data Editor)窗口5编辑窗口简要介绍主菜单栏:将SPSS常用的数据编辑、加工和分析的功能列出来。用户可以通过单击菜单完成相应操作。工具栏:将一些常用的功能用图形按钮的形式组织在工具栏中,使操作更加快捷和方便。数据编辑栏:显示和管理SPSS数据结构和内容。系统状态栏:显示系统的当前运行状态。6SPSS输

3、出窗口主菜单工具栏分析结果显示区状态显示区7 二、变量类型和定义变量: 定义变量是输入数据的前提。 启动后,显示数据编辑器窗口,弹出一个菜单窗口,点击该窗口下方的变量视图,打开如下窗口。89名称:输入变量名。类型:定义变量类型。分为字符型(String)、日期型(Date)、数值型(Numeric)。标签:进一步说明有关变量的详细含义。数值:对变量值的进一步说明,主要用于对名义级变量和顺序级变量的“值”的说明。缺失:缺失值选择。列:在屏幕上,变量的显示宽度。对齐:显示的对齐方式。测量:选择测度级别,分为刻度级、序次级、名义级。10定义变量类型通常选用数值型:包括正负符号、小数点和小数在内。逗号

4、型:整数部分从个位开始每3位以一个逗号分隔。字符型:由一个字符串组成。11 说明有关变量的含义12 缺失值选择对字符型或数值型,用户缺失值可以是13个特定的离散值。对数值型,用户缺失值可以在一个连续的闭区间内并同时再附加一个区间外的离散值。13 数据的保存与读取(点击:文件 )14三、读入其他格式的数据点击:文件 打开 数据 系统弹出一个窗口:选择文件类型 文件名 打开15 进一步选择需要的数据:16 实例:某班学生的数据:姓名、身高、性别某证劵公司从某城市有关营业所抽样调查得到散户股民买进、卖出和投资的有关数据17练习:某高校10名教师基本情况序号姓名性别校内单位年龄婚否职称籍贯基本工资1王

5、大明男化工学院32已婚讲师四川省13802李大兴男中文学院26未婚助教陕西省1050.53王平女数学学院47已婚副教授辽宁省15804方成男化工学院54已婚教授四川省20105吴明女经济学院46已婚副教授海南省15806张莹女管理学院28未婚助教北京市13807刘静女数学学院34已婚讲师甘肃省13808黄元男管理学院27未婚助教山东省1050.59赵山男管理学院42已婚副教授山西省158010郭庆男中文学院25未婚助教四川省105018第二节 SPSS 简单应用一、给变量值排序: 在读入数据后,从主菜单数据开始,依次点击:数据 对个案排序 系统弹出一个窗口19 从左边框中的变量清单中,选取所要

6、排序的变量送入右边的框中,在窗口的下部,选升序或降序。20 二、给变量值排名次:在读入数据后,从主菜单转换开始,依次点击: 转换 个案排秩 系统弹出一个窗口可直接排名次,也可分组排名次21 选取所要排序的变量,送入右边上面的变量框,可直接排名次,若选取所要分类的变量,送入右边标准框,可分类排名次。22实例:根据某班学生的数据,进行身高排序;根据某地区推销员的销售数据,按不同地区分组排名次。23三、频次、频率分析,中心描述与离散描述:频次分析摸块(Frequency Process)不仅能分析样本数据的频次、频率,还可以统计出样本数据的均值、中位数、众数,极大值、极小值、上下四分点、极差、方差、

7、标准差、均值标准差,以及斜度、峰度等。在读入数据后,依次点击: 分析 描述统计 频率 系统弹出一个窗口24点击该窗口下面的统计量按钮,弹出一个新窗口2526在主窗口,点击图表按钮,弹出一个新窗口上块为图形类型选择块;下块为图的纵轴值选择块;27在主窗口,点击格式按钮,弹出一个新窗口28实例:从某城市抽出来的30个商店中,查出某商品的价格数据(刻度级数据),进行频次分析。抽样调查某单位16人的受教育程度的数据(顺序级数据),进行频次分析。29 四、茎叶图和箱形图: 在读入数据后点击: 分析 描述统计 探索,系统弹出一个窗口30点击主窗口下面的图表按钮,弹出一个新窗口31点击主窗口下面的统计量、选

8、项按钮,弹出下面的窗口可作参数的区间估计32 实例:某单位女职工160人,男职工206人,对相应的年薪作茎叶图与箱形图。在对一项广告的效应进行的 追踪调查中,30名被追踪者中有20名会连同产品一起想起新广告用语。试求在看过该广告的所有人中会想起新广告用语的所占的比重的置信区间。33 五、列联表分析读入数据后: 点击分析 描述性统计 交叉表 系统弹出一个对话窗口。 3435点击单元格按钮,弹出一个新窗口36 实例:用AB两套方案对170余人进行培训,然后对培训后的业绩是否有明显改善做了统计,考察不同培训方案是否与业绩改进相关。37六、分组条形图:点击:图形 条形图38 选择简单条形图、 个案组摘

9、要, 点击定义按钮:39选择复式条形图、个案组摘要,点击定义按钮:40实例:某公司准备开发一楼盘“美丽家园”,主力户型为两室两厅一卫和三室两厅双卫的多层住宅,现对在该片区所开发楼盘的目标客户群作一调查。客户基本情况:客户性别、年龄、家庭人口数、学历以及家庭月收入水平。试分析相关数据,为公司确定开发方案和制定销售策略提供依据。 41 七、变量重新赋值对应于组距式的频数分析表可以通过SPSS的变量重新赋值功能来完成在读入数据后,依次点击: 转换 重新编码 成相同变量 或成不同变量 系统弹出一个窗口42 从左框中选择一变量移如中间框,显示”变量名?”,右边输出变量框被击活,输入新变量名称,单击旧值和

10、新值按钮,,弹出一个新窗口43 在旧值栏中选择一项输入原值,在新值栏中输入新值,单击添加按钮。44 实 例对某班学生的身高数据作统计分组. 思考:操作步骤?45第三节 用SPSS作参数假设检验一、均值过程: 按分组变量计算因变量的描述统计量,如均值、方差、标准差、偏度、峰度等,并将计算结果并列显示,提供用户比较分析各组变量值的差异。 在读入数据后,从主菜单分析开始,依次点击: 分析 比较均值 均值 系统弹出一个窗口。 46 选择分组变量,如果点击下一层按钮,形成层控制变量,在每一层里进一步划分样本。47 根据统计要求选择适当的统计量移入右框。48二、单样本T检验 在读入数据后,从主菜单分析开始

11、,依次点击:分析 比较均值 单样本T检验 系统弹出一个窗口 49 在检验值 格中,填入总体均值假设0值,点击选项按钮,弹出对话框050选择1-的值51 实例:某单位女职工160人,男职工206人,工作性质不同,对相应的平均年薪作比较。已知去年某小学五年级学生400米的平均成绩是100秒,今年该校测得60个五年级学生400米的成绩,检验该校五年级学生400米的平均成绩是否仍为100秒(有无提高或下降)。H0:=100, H1: 10052 三、相互独立的两组样本的T检验 在读入数据后,从主菜单分析开始,依次点击:分析 比较均值 独立样本T检验 系统弹出一个窗口:53 将分组变量放入右下框,激活定

12、义组按钮,点击后弹出对话框54 输入两个组的变量值,如果是连续变量,在选项分割点中,输入一个分界值。55 实例:用两种激励方法,对同样工种A、B两个班组进行激励,测得激励后业绩增长率(%),问:两种激励方法的平均激励效果有无显著差异?某证劵公司从某城市有关营业所抽样调查得到散户股民买进、卖出和投资的有关数据,问:不同文化程度的股民的证劵投资额、证劵市场外的收入和入市年份有无显著差异?56 四、配对样本的T检验 在读入数据后,从主菜单分析开始,依次点击:分析 比较均值 配对样本T检验 系统弹出一个窗口:57 从左框选出两变量,放入右边,两变量以差的形式出现,点击选项按钮,选择1-的值58 实例:

13、用两套问卷测量20个管理人员的素质,两套问卷的满分都是200分,得到两套问卷的测量结果,问:两套问卷所得结果的平均值有无显著差异?59第四节 用SPSS作非参数假设检验一、两组独立样本的总体分布是否相同的检验 读入数据后: 点击:分析 非参数检验 两个独立样本 系统弹出主对话窗口。60 系统默认的方法是序号和检验法。点击定义组、选项按纽,系统弹出如下对话框。61输入分类变量,选择描述性统计量。62二、两组相关样本的总体分布是否相同的检验 读入数据后: 点击:分析 非参数检验 两个相关样本 系统弹出主对话窗口。63可选择Wilcoxon、符号检验。64 实例:用两种激励方法,对同样工种A、B两个

14、班组进行激励,测得激励后业绩增长率(%),问:两种激励方法的效果有无显著差异?用两套问卷测量20个管理人员的素质,两套问卷的满分都是200分,得到两套问卷的测量结果,问:两套问卷所得结果有无显著差异?65 三、一个总体分布的非参数假设检验2检验 读入数据后: 点击:分析 非参数检验 2检验 系统弹出2检验的主对话窗口。66 不同类理想概率相同,选择默认项,若不同,选下面的值,输入不同类的理想概率。67拟合优度k-s检验法 读入数据后: 点击:分析 非参数检验 一个样本K-S 系统弹出主对话窗口。68选择所要检验的分布。69 实例:六个企业生产汽车,(在一次观测 中, 观测到)每小时的产量如下表

15、: 问:这些企业的生产能力,有无显著差异。 实例:在高速公路某观测点观测每分钟内通过 的汽车数,共做了2千余次的观测,讨论其汽车数所服从的分布。企业ABCDEF产量/小时41644556494370 四、B(n,p) 检验问题 B(n,p)参数检验: 在读入数据后,从主菜单分析开始,依次点击: 分析 非参数检验 二项式 系统弹出一个窗口:71在中下部的检验比例的 框中,输入p值。.072 实例:招聘测试问题。某公司人力资源部要招聘若干名某专业领域的工程师。出了10道选择题,每题有个备选答案,其中只有一个是正确的,问:至少应当答对几道题,才能考虑录取?73 拟合优度的B(n,p) 检验问题 先对

16、原始的配对数据做预处理: 在读入数据后,从主菜单转换开始,依次点击: 转换 计算 系统弹出一个窗口:74 以用两套问卷测量20个管理人员的素质,所得结果有无显著差异来说明。 在目标变量中,送入“差A与差B”,点击类型与标签按纽,系统弹出如下对话框。75输入标签:两组样本之差76 把函数符号、原来的变量、四则运算等符号、系数组合起来,输入数字表达式。 点击确定,数据窗口中增加一列新变量。77为消除变量中的零值,再次点击: 转换 计算 在目标变量中,送入“差”,把左框中的差A与差B送入右框,点击如果按纽,系统弹出如下对话框:78选择如果个案满足条件,输入:差a与b0 or 差a与b0 79点击:

17、分析 非参数检验 二项式 送入变量差。 点击分割点 ,输入分界点0,检验是否有80 实例:某企业市场开发部想了解在两个地区的产品推销是否有差异,从甲地区和乙地区分别随机确定了10名和8名推销员作为受试对象,每个推销员半年内完成的推销额如下表所示: 试判断两地区的销售水平是否存在差异?地区 1 2 3 4 5 6 7 8 9 10甲地乙地333 208 387 480 300 520 420 384 250 440460 270 246 378 390 230 338 37181第五节 用SPSS作方差分析1、单因素方差分析 在读入数据后,从主菜单分析开始,依次点击:分析 比较均值 一种方式方差

18、分析 系统弹出一个窗口:82使用系统默认选项,点击OK,可得方差分析表83点击主窗口的选项按钮,弹出一个新窗口,选择方差齐次性检验84点击主窗口的两两比较按钮,弹出一个新窗口:根据Levene检验的结果进行选择85点击主窗口的对比按钮,弹出一个新窗口:输入各组均值的系数,确定所要比较的组均值的组合86实例:设某单位的职工的工作岗位可以分成三类:一线工人、科以上干部、一般干部,试比较这三类职工的当前平均工资有否显著差异?87 2、双因素方差分析 1)无重复双因素方差分析 在读入数据后,从主菜单分析开始,依次点击: 分析 一般线性模型 单变量多因素方差分析 系统弹出一个窗口:88 无重复实验,不要

19、点击OK ,系统默认选项是对主效应,交互效应作全分析,点击右边的模型按钮,弹出对话窗口:89点击定制按钮,激活相应的按钮 选择所要分析的效应,点击建立项框下的小箭头,出现下拉菜单,选择主效应。90 点击选项按钮,弹出一个新窗口:91点击主窗口的两两比较按钮,弹出一个新窗口922)有重复双因素方差分析 在读入数据后,从主菜单分析开始,依次点击: 分析 一般线性模型 单变量多因素方差分析 系统弹出一个窗口:93 有重复实验,点击OK ,系统默认选项是对主效应,交互效应作全分析。94 实例:某公司对某产品设计了4种类型的产品包装,又设计了3种销售方案,在某地区用3种销售方案,对4种包装的该产品试销一

20、个月得业绩数据,分析不同包装、不同销售方案,对销售业绩是否有显著影响?95 实例:3种类型的科技企业(大型、中型、小型),每个类型有足够数量的企业,对某项政策的作用大小(分为个等级)打分,已知这些企业的与该项政策密切相关的指标u,分析该政策(作用的不同等级)对不同类型的企业的指标u的作用有无显著差异?96第六节 SPSS对相关分析的处理 一、用SPSS绘制散点图 读入(或送入)数据后: 点击图形 散点图,系统弹出一 个对话窗口。97选择简单散点图,单击定义按钮,打开对话框9899二、简单相关分析与等级相关分析 读入数据后: 点击分析 相关分析 二元变量 系统弹出主对话窗口。100101统计量中

21、的选项只当在主对话框选择Pearson相关系数时,才被击活。102实例:某公司广告费与销售收入的相关性。某企业组织一次技术操作劳动竞赛,参赛者是不同等级工人中的佼佼者,考虑工人的技术等级和竞赛名次之间的相关性。103三、偏相关分析 读入数据后: 点击分析 相关分析 偏相关系统弹出主对话窗口。104至少选择一个控制变量移入控制变量栏105选择零阶相关系数阵,比较两两相关性106实例:某城市某区散户股民的场外收入与场内投资的相关问题。某研究者收集了南方26个旅游风景区某年的商店投资数据、游客增长率和风景区的经济增长率,试从变量之间的相关关系,寻求与风景区经济增长密切相关的因素。107 四、品质相关

22、:读入数据后: 点击分析 描述统计 交叉表 系统弹出一个对话窗口。 108109选择2检验点击统计量按钮,弹出新对话框:110点击单元格、格式按钮,弹出新对话框:111Chi-square复选项2检验:在二维表中对行变量和列变量进行独立性假设检验;矫正2检验:当n50、自由度为1时使用;似然比2检验:用于对数线性模型的检验;Fisher,精确检验:当n50或一个单元格中的期望频数小于5时使用。112 实例:用A、B两套方案对170余人进行培训,然后对培训的业绩是否有明显变化做了统计,结果如下表,问不同的培训方案是否与业绩改进相关。业绩明显提高业绩无明显变化A9331124B4645013935

23、174113实例:某公司准备开发一楼盘“美丽家园”,现对在该片区所开发楼盘的目标客户群作一调查。客户基本情况:客户年龄、职业、家庭人口数、家庭月收入水平以及购买户型等。试分析相关数据,为公司确定开发方案和制定销售策略提供依据。 114第七节 用SPSS处理回归问题一、用SPSS处理线性回归问题: 读入(或送入)数据后: 点击分析 回归分析 线性 系统弹出一个对话窗口。115116逐步回归:117点击保存按钮,弹出新对话框118举例: 研究我国31个省市自治区的人均食品支出对人均收入的依赖关系。 人均食出=1+ 2人均收入+研究我国31个省市自治区的“人均食品支出”对“人均收入”和“粮食单价”的

24、依赖关系。 人均食出=1+ 2人均收入+ 3粮食单价+119实例: 研究某城市散户股民在“证劵市场的投资总额”是否可以用变量“证劵市场外的收入”、“受教育程度”、“入市年份”和“股民年龄”来说明。本问题并不确切知道回归方程是什么,要依靠SPSS来作探索。120 二、用SPSS处理非线性回归: 读入(或送入)数据后: 点击分析 回归分析 曲线估计 系统弹出一个对话窗口。121122 拟合模型:线性模型 y=b0+b1x二次模型 y=b0+b1x+ b2x2复合模型 y= b0*b1x对数曲线模型 y=b0+b1lnx 三次模型 y=b0+b1x+ b2x2+b3x3乘幂曲线模型 y=b0 xb1

25、 123点击主窗口右下角的保存按钮,弹出新对话框124 实例:在食物价格保持不变的条件下,关于人均食物支出与人均收入之间的曲线,在经济学上习惯称之为恩格尔曲线,假如我们得到如下的资料,试用幂函数形式拟合恩格尔曲线。人均食物支出8 12 15 18 22 23 36人均收入17 27 36 46 57 67 81125 实例:设某种产品生产过程中的半成品的废品率与它含的一种化学成分有关,经验观测到一批数据,用曲线估计两者之间的定量关系。126三、用SPSS处理线性回归的三大基本问题:一、用SPSS处理多重共线性 读入(或送入)数据后: 点击分析 回归分析 线性 系统弹出一个对话窗口。127128

26、 选择共线性诊断,检验是否存在多重共线性,方差膨胀因子VIF10,说明自变量间有严重的多重共线性。129 实例:为研究某国的服装消费,备选的解释变量有:该国的可支配收入、居民的金融资产、服装价格指数、一般价格指数,试建立线性回归方程。130 实例:为研究高等院校人文社会科学研究中立项课题数受哪些因素的影响,收集了1999年31个省市自治区部分高校有关社会科学研究方面的数据,希望利用相关与回归分析方法进行分析。收集了如下的信息:当年的投入人数X2、投入的高级职称的人数X3、投入的科研事业费(百元)X4、立项课题总数X5、出版的专著数X6、公开发表的论文数X7、各类获奖数X8 131二、用SPSS

27、处理异方差问题举例说明:为研究某国的居民储蓄额与该国的居民收入的关系,试建立回归方程。132点击分析 回归分析 线性 133 点击图形按钮,弹出新对话框: 选择ZPRED(标准化预测值)作为X轴,ZRESID(标准化残差)作为y轴,检验是否存在异方差性。134选择未标准化残差135 检验异方差是否存在: 从主菜单转换开始,依次点击: 转换 计算 系统弹出一个窗口:136 在目标变量中,输入残差绝对值,选择绝对值函数(ABS)137 计算等级相关 点击分析 相关分析 二元变量 计算x(居民收入)与残差绝对值的Spearman相关系数。138用加权最小二乘法估计回归方程的系数:点击: 转换 计算

28、,产生新变量: 储蓄/收入、1/收入点击:分析 回归分析 线性按照:储蓄/收入=/收入+方程式回归回归方程:储蓄 139 直接用加权最小二乘法估计回归系数方法一:点击:分析 回归分析 线性把“1/收入”作为权重变量送入WLS权重框140方法二:点击:分析 回归分析 权重估计权重变量:(1/收入)POWER,系统要求输入试算的范围141点击选项按钮,弹出新对话框:142三、用SPSS处理序列相关性问题举例说明:为研究英国19501969的居民储蓄额与该国的居民收入的关系,试建立回归方程。143点击:分析 回归分析 线性点击统计量按钮,弹出新对话框:144选择统计量,检验序列相关性145点击图形按

29、钮,选择ZPRED(标准化预测值)作为X轴,ZRESID(标准化残差)作为y轴,检验是否存在序列相关性。点击保存按钮,选择非标准化残差146 估计序列相关系数:产生两个新变量e(t-1),e(t-2)用e(t)对e(t-1)回归,观察回归系数用e(t)对e(t-1)和e(t-2)回归,观察回归系数比较确定自相关系数的估计值 147 迭代法:令y/t=yt-yt-1y/t=0+ 1xt- (0+ 1xt-1)+ut = 0(1- )+ 1(xt- xt-1) +ut ut 为随机误差令x/t=xt-xt-1y/t=0/+ /1x/t+ ut 其中0/= 0(1- ) /1= 1148用检验模型的

30、误差项是否不相关,如果通过检验,迭代法就此结束。否则,重新估计,再重复上述过程,直到通过检验为止。149 消除序列相关得出估计值点击: 转换 计算 ,产生新变量: 进口*=进口(t)- 进口(t-1) GNP*=GNP(t)- GNP(t-1)对两个新变量进行回归,再比较DW值。150 实例:某公司想用全行业销售额作为自变量来预测公司的销售额,已知19771981年关于公司销售额和行业销售额的分季数据,试建立回归模型。151第八节 用SPSS作因子分析在数据文件打开后,依次单击 分析 数据降维 因子分析 打开因子分析对话框。152153单击描述按钮,系统弹出子对话框:选择KMO检验154单击提取按钮,系统弹出子对话框:选择主成分法,碎石图155单击旋转按钮,系统弹出子对话框:选择:方差最大旋转法选择:显示旋转后的因子解156单击因子得分按钮,系统弹出子对话框:激和“Method”按钮选择:回归方法157实例:对某地区企业的出口创汇、利润、履约率等问题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论