第七章统计方法与spss应用_第1页
第七章统计方法与spss应用_第2页
第七章统计方法与spss应用_第3页
第七章统计方法与spss应用_第4页
第七章统计方法与spss应用_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章:统计分析方法与SPSS应用探讨如何运用统计分析软件探讨如何运用统计分析软件SPSS对你的数据进行描述分析对你的数据进行描述分析.本部分主要内容 Spss简介简介 问卷编码问卷编码 单变量描述性统计单变量描述性统计 假设检验假设检验 双变量统计分析双变量统计分析-相关与回归分析相关与回归分析第一讲 Spss概览-SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical P

2、roduct and Service Solutions,意为,标志着SPSS的战略方向正在做出重大调整。功能强大、实用与美观统一的视窗风格 SPSS最突出的特点就是操作界面极为友好,它使最突出的特点就是操作界面极为友好,它使用用Windows的窗口方式展示各种管理和分析数据的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的只要掌握一定的Windows操作技能,粗通统计分操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服析原理,就可以使用该软件为特定的科研工作服务。务。 非专业统计人员的首选统计软件

3、!非专业统计人员的首选统计软件!界界 面面 概概 览览菜单栏工具栏变量栏数据区数据变量切换变量工作区变量工作区 SPSS for Windows 的界面的界面一一.SPSS 的主窗口的主窗口 v启动启动SPSS后,弹出对话框选项如下:后,弹出对话框选项如下:1.Run the tutorial-浏览操作指导浏览操作指导2.Type in data-显示数据编辑窗口建立新数据文件显示数据编辑窗口建立新数据文件3.Run an existing query-运行一个已存在的文件运行一个已存在的文件4.Creat new query using Database Wizard-使用数据库向导建立使用

4、数据库向导建立一个新的文件一个新的文件5.Open an existing data source-打开一个已存在的数据文件,打开一个已存在的数据文件,可可选择选择“.sav”文件文件6.Open another type of file-打开一个已存在的其它类型的文件7.Dont show this dialog in the future-再运行SPSS系统时不显示该对话框,直接进入数据编辑窗口v数据编辑窗口(数据编辑窗口(SPSS Data EditorSPSS Data Editor)或称数据编)或称数据编辑器的左下角包括辑器的左下角包括“Data View”Data View”和和“

5、Variable Variable View”View”两个视区,分别定义变量的值(即数据)和两个视区,分别定义变量的值(即数据)和变量(名称、类型等)。变量(名称、类型等)。二二.数据编辑窗口的主菜单数据编辑窗口的主菜单Edit:文件编辑:文件编辑。vView:浏览编辑:浏览编辑。vFile:文件操作:文件操作。vData:数据管理:数据管理。vTransform:数据转换:数据转换。vAnalyze:统计分析:统计分析。vGraphs:统计图表:统计图表。vUtilities:实用程序:实用程序。vHelp:帮助:帮助。vWindows:窗口控制:窗口控制。 选择“Variable Vie

6、w”项,定义变量(不要忘了保不要忘了保存)存)q Name:变量名。:变量名。不能超过不能超过8个字符个字符q Type:变量类型。:变量类型。共共8种类型,分别为:种类型,分别为:三、三、 建立数据文件建立数据文件(一)定义变量(一)定义变量数值型变量(数值型变量(Numeric)Numeric为为标准数值型变量:默认总长度为8位,小数是2位。Comma为逗号型变量为逗号型变量:位数同上。整数部分,从右向左,每3位一个逗号。Dot为句号型变量为句号型变量:位数同上。整数部分,从右向左,每3位一个圆点,但对小数位的分割,应用逗号表示。字符串型变量(字符串型变量( String) 变量的长度是任

7、意的。 Scientific notation为科学计数型变量。为科学计数型变量。如原始数据1231.3表示成科学计数型为12.313E2;Dollar为美元型变量。为美元型变量。在Comma型的基础上,增加一个美圆符号。Custom Currency自定义型变量。自定义型变量。机器自动提示选择方法。日期型变量(日期型变量(Date)dd-mm-yy(日-月-年) 如06-05-04mm-dd-yy(月-日-年) 如05-06-04dd-mmmm(英文)-yyyy 如06-May-2004 当你选择当你选择Data类型后,系统会自动显示类型后,系统会自动显示日期类型,供你选择。日期类型,供你选

8、择。q Width:数据或字符串的宽度。:数据或字符串的宽度。默认值为默认值为8个字符。个字符。qDecimal:小数位数。:小数位数。q Label:变量标签。:变量标签。用来说明变量所代表的用来说明变量所代表的意义。意义。qValue:对变量值的进一步说明。:对变量值的进一步说明。如:如:1=男,男,2=女女qMissing:定义缺失值类型。:定义缺失值类型。系统遗漏值:系统遗漏值:数值变项读入了空白值或非数值数据,数值变项读入了空白值或非数值数据,SPSSSPSS的的数据表上显示数据表上显示“.”.”。自定义遗漏值:自定义遗漏值:特殊的数据,自己指定一个值,计算机会作特殊的数据,自己指定

9、一个值,计算机会作为特殊值,计算时跳过。为特殊值,计算时跳过。Columns:定义数据在屏幕上该变量对应列的显示列宽:定义数据在屏幕上该变量对应列的显示列宽。默。默认值为认值为8个字符,范围是个字符,范围是1-255。qAlign:定义数据在单元中的对齐方式。:定义数据在单元中的对齐方式。qMeasure:定义:定义度量变量类型度量变量类型。可有可有Scale、Ordinal和和Nominal。Scale:可以是:可以是数值型、日期型和货币型变量数值型、日期型和货币型变量,但不能是字符,但不能是字符串型变量串型变量 Ordinal:可以是数值型和字符串型变量,一般要求:可以是数值型和字符串型变

10、量,一般要求变量有变量有较明显的次序较明显的次序Nominal:与:与Ordinal一样,只是不要求变量有次序关系,但一样,只是不要求变量有次序关系,但要要有较明显的类别有较明显的类别 定义变量属性,建立数据库文件定义变量属性,建立数据库文件 注意:变量名字母为首,后面可以跟字母和数字,注意:变量名字母为首,后面可以跟字母和数字,不超过不超过8位,不能跟其他字符,关键词不能做变位,不能跟其他字符,关键词不能做变量名量名 最好不用中文作变量名,兼容性不好最好不用中文作变量名,兼容性不好 注意宽度注意宽度 标签标签 数值标签数值标签 缺失值缺失值(二)输入数据(二)输入数据 选择选择“Data V

11、iew”项,输入变量数据项,输入变量数据l l 直接从数据编辑器中输入。直接从数据编辑器中输入。l l 用用“Open File”选择已存在的数据文件读入数据。选择已存在的数据文件读入数据。l l 用用“Open Database”读入数据。读入数据。 用用“Open File”读入数据操作步骤如下读入数据操作步骤如下: 在 S P S S 数 据 编 辑 器 中 按 照“FileOpenData”可打开“Open File”对话框; 在“Open File”对话框中打开“文件类型”下拉列表框,选中所要读入数据的类型,根据路径找到要读入的文件双击文件名即可。常用的是读入常用的是读入Excel数

12、据。数据。例例1 请将下面表格内容在请将下面表格内容在SPSS数据编辑器中输入。数据编辑器中输入。 表1药品名药品名产地产地生产时间生产时间价格价格规格规格滴眼液A中国2003/4/14日2.5元8毫升滴眼液A日本2002/12/2日2.7元8毫升滴眼液A美国2002/8/29日2.85元8毫升滴眼液B美国2003/2/18日3.2元5毫升(三)编辑数据(三)编辑数据1.修改数据修改数据找到所要修改的数据,激活(双击),修改即可。2.插入或删除一行数据插入或删除一行数据插入行:点击所要插入的行号,点击工具栏(或击右键)的“插入行Insert case”的图标(望远镜图标的后面),就在此行增加一

13、空行。删除行:找到所要删除的行,选中,按Delete键。3.插入或删除一列(一个变量)插入或删除一列(一个变量)插入列:点击所要插入的列号,点击工具栏的“插入列Insert case”的图标(望远镜图标的后面第2个),就在此列增加一空列。删除列:找到所要删除的列,选中,按Delete键。例例2.在例在例1的数据文件中完成插入与删除的功能的数据文件中完成插入与删除的功能.(四)保存分析结果(四)保存分析结果保存结果文件保存结果文件 在结果浏览窗口中选择菜单File=Save,在文件名框中键入“文件名”并回车即可.Export:选择输出的内容选择输出的内容Exprot File:填入输出的目标文件

14、名填入输出的目标文件名Export What:选择输出结果的哪些部分选择输出结果的哪些部分File:选择网页格式和纯文本格式选择网页格式和纯文本格式例例5.将例将例1中保存的数据文件导出为文本文件中保存的数据文件导出为文本文件.第二讲第二讲 问卷和编码问卷和编码 对单选:对单选: 顺序编码,顺序编码,1,2,3,4。 对多选:对多选: 01编码,几个选项几个变量编码,几个选项几个变量 有限制数而多选了的,任意处理有限制数而多选了的,任意处理一、问卷调查表的编码一、问卷调查表的编码(一)单选题问卷调查表的编码一)单选题问卷调查表的编码1.题号代号不能重复,变量名称最好以英文字母为开头,字题号代号

15、不能重复,变量名称最好以英文字母为开头,字母大小写均可。如母大小写均可。如A1,A2;B1,B2。2.同一量表的题号最好有相同的识别码。如表同一量表的题号最好有相同的识别码。如表1都用都用a1,a2;表表2都用都用b1,b2。3.名义或类别变量的变量代码最好与其意义内涵有关。如年名义或类别变量的变量代码最好与其意义内涵有关。如年龄为龄为AGE,年级为,年级为YEAR,工作类别为,工作类别为JOB等。等。4.变量代码不要用中文字,如要加注部分变量的中文说明,变量代码不要用中文字,如要加注部分变量的中文说明,可于可于SPSS操作中修改。操作中修改。(二)复选题问卷调查表的编码(二)复选题问卷调查表

16、的编码 问卷调查表问卷调查表您的性别:您的性别:1男生 2女生您的职务:您的职务:1主任 2组长 3教师一一.您认为目前教改阻力来自哪些单位?(可复选)您认为目前教改阻力来自哪些单位?(可复选)1教育行政单位 2学校行政人员 3家长团体4教师本身 5其他团体二二.您认为目前教改对哪些人会有影响?(可复选)您认为目前教改对哪些人会有影响?(可复选)1教师 2行政人员 3学生 4其他NUMsexjobA11 A12 A13 A14 A15 A21 A22 A23 A24001 11101101101002 12001111000 变量编码表变量编码表NUM-编码编码(问卷编号)(问卷编号)Sex-

17、性别性别 job-职务职务 ( 单选)单选)A11-A15代表第一题代表第一题5个选项,选中者输入个选项,选中者输入1,未选中,未选中者输入者输入0注意: 1、排序题:、排序题: 如:您一般在什么情况下送礼(选择最经常送礼如:您一般在什么情况下送礼(选择最经常送礼的的两个两个场合)?场合)? (1)婚嫁 (2)生日 (3)搬迁新居 (4)探亲 (5)探病 (6)生子 (7)中国传统节日 (7) 西方传统节日 (8)其他 第一经常场合第一经常场合_ 第二经常场合第二经常场合_ 对这样的排序题,可以按照要求,设计对这样的排序题,可以按照要求,设计2个变量,个变量,“第一经常场合第一经常场合”和和“

18、第二经常场合第二经常场合” 2、选多了、选多了 单选选了多项,或者限制多选超额单选选了多项,或者限制多选超额 两种处理办法:两种处理办法: 无效处理 随机处理,如:您的经济状况在学校属于的经济状况在学校属于 (1)上层 (2)中上层 (3)中层 (4)中下层 (5)下层 同事选中同事选中1和和2,那么,第一次遇到这种情况,我,那么,第一次遇到这种情况,我就取第一个被选项,第二次遇到则取后一个被选就取第一个被选项,第二次遇到则取后一个被选中项,减少数据的缺失和误差中项,减少数据的缺失和误差 3、没选(缺失值)、没选(缺失值) 用户缺失值(非系统缺失值),用用户缺失值(非系统缺失值),用0或者或者

19、9编码编码 比如:您的年龄是_岁。 没填则为99 您的性别: 男 女 没填则为0 注意与栏位有关注意与栏位有关 4、不适用情况、不适用情况 当碰到被调查者不适用的情况时,被调查者不需要对这些问题进行作答,研究者可以用8,98等来赋值,如果答案有8,可以用0代替。 5、最好有一个问卷编号,便于出错之后的、最好有一个问卷编号,便于出错之后的修正修正 请大家来看一份问卷,并试图进行编码请大家来看一份问卷,并试图进行编码编码二、调查数据录入二、调查数据录入 在spss中直接录入数据窗口输入命令行输入 从foxpro数据库dbf文件中读取*注意降低版本 从excel文档中读取30名被访者的资料:名被访者

20、的资料:(续)(续)30名被访者的资料:名被访者的资料:(续)(续)30名被访者的资料:名被访者的资料: 数据录入之后的校验数据录入之后的校验 先用频数统计命令进行先用频数统计命令进行简单频数分布统计简单频数分布统计 其他方法:其他方法:if命令命令第三讲用第三讲用SPSSSPSS进行基本统计分析进行基本统计分析例如:数据排序例如:数据排序l选择采单DataSort Casesl将主排序变量从左面的列表框中选到Sort by框中,并在Sort by框中选择按该变量的升序还是降序排序Ascending-升序,Descending-降序例:某班级男生的身高数据(单位:厘米)171 182 175

21、177 178 181 185 168 170 175 177180 176 172 165 160 178 186 190 176 163 183受教育程度16.36.36.3212.512.518.8212.512.531.3956.356.387.5212.512.5100.016100.0100.0小学初中高中大学硕士TotalValidFrequencyPercentValid PercentCumulativePercentSPSS输出的频数分布表输出的频数分布表分类数据的众数分类数据的众数(算例)某城市居民关注广告类型的频数分布广告类型人数比例频率(%)商品广告服务广告金融广告房

22、地产广告招生招聘广告其它广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100数据:分类数据0商品广告商品广告顺序数据的众数(顺序数据的众数(算例算例)甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比()非常不满意不满意一般满意非常满意24108934530836311510合计300100数据:顺序数据数据:顺序数据0不满意不满意 SPSS的单变量描述统计命令的单变量描述统计命令 一、一、 Frequencies: 频数分析频数分析AnalyzeDescriptive Statistic

23、sFrequencies示例:美国汽车家庭保有量示例:美国汽车家庭保有量婚姻状况14911.911.911.9102681.881.893.7151.21.294.94.3.395.2544.34.399.56.5.5100.01254100.0100.0未婚已婚离婚后未再婚离婚后再婚丧偶后未再婚丧偶后再婚TotalFrequency PercentValidPercentCumulativePercent变量值频数百分比有效百分比累计百分比二、平均数分析二、平均数分析AnalyzeCompare MeansMeans示例:美国汽车家庭保有量示例:美国汽车家庭保有量 统计假设和检验统计量统计假

24、设和检验统计量 所谓统计假设,就是关于总体分布特征的某种论断。所谓统计假设,就是关于总体分布特征的某种论断。记总体参数为记总体参数为,若要判断,若要判断是否等于某已知数值是否等于某已知数值0,则该参数假设可表示为:则该参数假设可表示为: H0:= 0 , H1: 0 其中,假设H0:= 0就是所要检验的假设,称为原假设或零假设;而假设H1: 0则称为对立假设或备择假设。 要检验某个假设是否正确,需根据样本所提供的要检验某个假设是否正确,需根据样本所提供的信息来进行。信息来进行。假设检验假设检验:先假定总体参数为:先假定总体参数为 ,用一个随机样本的,用一个随机样本的统计量统计量 来检验总体参数

25、为来检验总体参数为的假设是否成立。的假设是否成立。总体总体=38%样本样本 32%xx? ? (或者说)假设检验:是建立在样本信息基础上,假设检验:是建立在样本信息基础上,“接受接受”或或“拒绝拒绝”假设的统计过程。(又称假设的统计过程。(又称“显著性检验显著性检验”) 所有这些听起来非常专业的技术,都是我们每天所有这些听起来非常专业的技术,都是我们每天在做的推理形式,只不过没有用在做的推理形式,只不过没有用“假设假设”或或“参参数数”这些术语罢了。这些术语罢了。 例如:比尔为什么开始系安全带了?例如:比尔为什么开始系安全带了? 直觉假设检验直觉假设检验假设检验的五个基本步骤假设检验的五个基本

26、步骤 1、开始陈述你相信存在于总体的事实,即总体均、开始陈述你相信存在于总体的事实,即总体均值和百分率值和百分率。(如,比尔相信只有。(如,比尔相信只有10%的司机系的司机系安全带。)安全带。) 2、抽取一个随机样本,然后测定样本统计量、抽取一个随机样本,然后测定样本统计量。(比尔发现他的朋友中有(比尔发现他的朋友中有80%的人系安全带。)的人系安全带。) 3将统计量与假设的参数进行比较将统计量与假设的参数进行比较。(比尔注意到。(比尔注意到80%和和10%有很大区别。)有很大区别。) 4、决定样本是否支持最初的假设、决定样本是否支持最初的假设。(观察到。(观察到80%的司机系安全带的事实并不

27、支持只有的司机系安全带的事实并不支持只有10%的人系的人系安全带的假设。)安全带的假设。) 5、如果样本不支持假设,修正假设使得他与样本、如果样本不支持假设,修正假设使得他与样本统计量一致统计量一致。(驾驶员系安全带的事实事件发生。(驾驶员系安全带的事实事件发生率约为率约为80%。)。) Compare Means 过程可计算对已知原始数据资料情况下的单样本T检验(One-Sample T Test)、独立样本T检验(Independent-Samples T Test)和配对样本T检验(Paired-Samples T Test) 独立样本独立样本T检验:即用两个独立样本的原始检验:即用两个

28、独立样本的原始资料对两个总体均值之差进行比较资料对两个总体均值之差进行比较 独立样本独立样本T检验举例:检验举例: 例例1:由以往资料知道,甲、乙两个煤矿蕴藏的煤:由以往资料知道,甲、乙两个煤矿蕴藏的煤含灰量都服从正态分布并且有公共方差。现从两矿含灰量都服从正态分布并且有公共方差。现从两矿各抽几个试样,分析其含灰率得(各抽几个试样,分析其含灰率得(%):): 甲矿甲矿:24.5、21.3、23.5、22.4、27.1、18.6、19.8、20.7、21.2、16.9 乙矿乙矿:15.7、24.9、25.1、23.2、18.8、19.0、19.9、26.1、16.8、17.5、22.4、20.6

29、问两矿所采煤的平均含灰率有无显著差异问两矿所采煤的平均含灰率有无显著差异(=0.05)?)?解:依题意,设解:依题意,设H0:u= u1 , H1: u u1(1)定义变量)定义变量X(含灰量)和分类变量含灰量)和分类变量g(1,甲矿;,甲矿;2,乙矿),乙矿)(2) AnalyzeCompare Means Independent-Samples T Test非参数检验非参数检验(Anayze Nonparametric Tests) 参数检验参数检验(如上例,利用样本统计量去测试总体如上例,利用样本统计量去测试总体参数所做的假设参数所做的假设)通常适用于一些特定的、严格的条件环境之下,其中

30、一个典型的条件就是样本样本资料必须来自于正态分布的总体资料必须来自于正态分布的总体;当必要条件无当必要条件无法满足时,我们可以采用法满足时,我们可以采用非参数统计方法非参数统计方法。 其中的样本一致性检验和独立性检验则是其中的样本一致性检验和独立性检验则是使用使用Descriptive Statistics 中的中的Crosstabs 过过程完成的。(程完成的。(举例:)举例:)例例2:两种产品购买者所喜欢收看的电视节目:两种产品购买者所喜欢收看的电视节目有无差异?有无差异? 某市场研究进行了一次调查,藉以找出两产品的购买某市场研究进行了一次调查,藉以找出两产品的购买者所喜爱收看的电视节目,从

31、而为有关产品公司作广者所喜爱收看的电视节目,从而为有关产品公司作广告提供参考资料。两产品购买者最喜欢收看电视节目告提供参考资料。两产品购买者最喜欢收看电视节目的人数调查结果如下:根据以上资料判断两种产品的的人数调查结果如下:根据以上资料判断两种产品的购买者所喜欢收看的电视节目有无差异(购买者所喜欢收看的电视节目有无差异(=0.05 )?)?电视节目电视节目甲产品甲产品乙产品乙产品总计总计新闻新闻电视剧场电视剧场体育体育实事论坛实事论坛音乐欣赏音乐欣赏娱乐游戏娱乐游戏戏剧园地戏剧园地150120100140100150901101708010013013011026029018024023028

32、0200总计总计8508301680解:解:列联表,需要判断列联表,需要判断A产品和产品和B产品购买者所喜欢收看的产品购买者所喜欢收看的电视节目是否一致,可采用电视节目是否一致,可采用Chi-Square一致性检验方法。一致性检验方法。(1)依题意,设)依题意,设 H0:两种产品购买者所喜欢的电视节目无差两种产品购买者所喜欢的电视节目无差异。异。 H1:两种产品购买者所喜欢的电视节目有显著差异。两种产品购买者所喜欢的电视节目有显著差异。(2)Spss过程过程: Data weight cases,对对f进行加权进行加权:(选择选择weight cases by-将将f放入放入frequency

33、) analyze descriptive statistics crosstabs 将将y键入键入row(s)栏,将栏,将x键入键入column(s)栏栏 选择统计量,选择统计量,chi-square 单击单击cells键,选择键,选择observed何何expected两个统计量两个统计量 ok结果说明:结果说明:C Ca as se e P Pr ro oc ce es ss si in ng g S Su um mm ma ar ry y1680100.0%0.0%1680100.0%电视节目 * 1,甲产品;2,乙产品NPercentNPercentNPercentValidMiss

34、ingTotalCases表表1:数据综述表数据综述表。表明有效数据。表明有效数据N=168040,所占百分比为,所占百分比为100%,没有缺失值。没有缺失值。表表2:列联表。列联表。详细列出了两种产品购买者对详细列出了两种产品购买者对7个电视节目喜欢人数的实个电视节目喜欢人数的实际频数和理论频数,即期望值。际频数和理论频数,即期望值。电电 视视 节节 目目 * * 1 1, 甲甲 产产 品品 ; 2 2, 乙乙 产产 品品 C Cr ro os ss st ta ab bu ul la at ti io on n150110260131.5128.5260.0120170290146.714

35、3.3290.01008018091.188.9180.0140100240121.4118.6240.0100130230116.4113.6230.0150130280141.7138.3280.090110200101.298.8200.08508301680850.0830.01680.0CountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected Coun

36、t1234567电视节目Total121,甲产品;2,乙产品Total表表3:卡方检验。卡方检验。用卡方分布进行一致性或独立性检验时,当用卡方分布进行一致性或独立性检验时,当最小期望频数最小期望频数1,少于,少于1/5格子的期望频数格子的期望频数40时,一时,一般较多使用皮尔逊卡方值。般较多使用皮尔逊卡方值。 由表3可看出,最小期望频数=88.91,少于少于1/5格子的期望格子的期望频数频数40,表中看出皮尔逊卡方值,表中看出皮尔逊卡方值x2 =30.771,自由度自由度df=6,渐进双侧概率,渐进双侧概率p=00.05,故拒绝故拒绝H0,接受,接受H1,即,即两种产品购买者所喜欢收看的电视节

37、目不一致,有显著差异。两种产品购买者所喜欢收看的电视节目不一致,有显著差异。Chi-Square TestsChi-Square Tests30.771a6.00030.8866.0001680Pearson Chi-SquareLikelihood RatioN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Theminimum expected count is 88.93.a. 注意:注意:Chi-square:卡方值。用于行和列变量是:卡方值。用于行和列变量

38、是否独立的卡方检验,如果列联表中某一单元格中否独立的卡方检验,如果列联表中某一单元格中的期望值小于的期望值小于1或者或者20%以上的单元格期望值小于以上的单元格期望值小于5,那么就不能选择此项,那么就不能选择此项。运用剖面变量分析评估细分市场的经营价值运用剖面变量分析评估细分市场的经营价值 所谓剖面分析(所谓剖面分析(profiling analysis)就是选择剖)就是选择剖面变量,对已经划分好的细分市场进行交叉表分面变量,对已经划分好的细分市场进行交叉表分析,以发现细分市场在哪些剖面变量上有差异。析,以发现细分市场在哪些剖面变量上有差异。 常用的剖面变量有下面几类:常用的剖面变量有下面几类

39、: 人口统计变量人口统计变量:包括:包括U&A研究问卷中所有背景资研究问卷中所有背景资料的问题,例如:料的问题,例如: 年龄:年龄:小于小于25岁,岁,25-39岁,岁,40-49岁,岁,50岁以上岁以上 性别:性别:男,女男,女 收入:收入:高,中,低高,中,低 家庭人数:家庭人数:1人、人、2人、人、3人、人、4人及以上人及以上 U&A变量:变量:包括研究问卷中所有关于产品使用和购包括研究问卷中所有关于产品使用和购买习惯中的问题,买习惯中的问题,例如:例如: 是否使用产品:是否使用产品:用,不用用,不用 使用的包装规格:使用的包装规格:75ml瓶装、瓶装、125ml瓶装、瓶装、200-30

40、0ml瓶装瓶装 使用的品牌:使用的品牌:A、B、C及其他,或本国品牌、外国、合资品牌及其他,或本国品牌、外国、合资品牌 购买场所:购买场所:超市、糖烟酒商店、杂货店、邻近的士多超市、糖烟酒商店、杂货店、邻近的士多 媒体习惯变量:媒体习惯变量:包括研究问卷中所有关于媒体使用包括研究问卷中所有关于媒体使用习惯中的问题,习惯中的问题,例如:例如: 读报时间读报时间 通常看电视的时间通常看电视的时间 听收音机的频道听收音机的频道 通常收看的电视节目通常收看的电视节目 看杂志的种类看杂志的种类 看电影的类别:本地、外国、港澳台看电影的类别:本地、外国、港澳台案例:案例:沐浴露沐浴露U&A研究中的剖面分析

41、研究中的剖面分析(部分)(部分)剖面变量剖面变量收入类别收入类别高(高(%)中(中(%)低(低(%)(1)使用者)使用者998368(2)现在使用的包装规格)现在使用的包装规格400ml以下以下122038400-599ml424035600mi以上以上464027(5)购买地点)购买地点超市超市817772百货商店百货商店121417士多士多7911(9)年龄)年龄18-2426242525-3444282135-4922282550-6582029 其中其中:第第(1)、(、(9)的列百分比以全部被访者分)的列百分比以全部被访者分别在三个细分市场上的人数为基数;别在三个细分市场上的人数为基

42、数; 第(第(2)项以三个细分市场中过去六个月)项以三个细分市场中过去六个月使用使用过过产品的人数为基数;产品的人数为基数; 第(第(5)项以三个细分市场中过去六个月)项以三个细分市场中过去六个月购买过购买过产品的人数为基数。产品的人数为基数。 从上表可以看出,在高、中、低三个细分从上表可以看出,在高、中、低三个细分市场上许多剖面变量有显著差异。但比较市场上许多剖面变量有显著差异。但比较列百分比时,除了直观看外,通常要进行列百分比时,除了直观看外,通常要进行统计检验统计检验或用或用剖面指数剖面指数来说明。来说明。 那么什么是那么什么是剖面指数剖面指数呢?呢? 在判别细分市场在剖面变量上的差异时

43、,除直观或用统计在判别细分市场在剖面变量上的差异时,除直观或用统计检验外,一个很有用的工具就是所谓的剖面指数。检验外,一个很有用的工具就是所谓的剖面指数。例如:例如:高收入细分市场高收入细分市场某年龄段的剖面指数某年龄段的剖面指数 = 高收入细分市场该年龄段的列百分比高收入细分市场该年龄段的列百分比/总体市场该年龄段的列百分比总体市场该年龄段的列百分比年龄段年龄段样本数样本数收入类别收入类别高高中中低低18-65岁50015015020018-24岁125(25%)393650(25%)(26%)(24%)25-34岁150(30%)644242(21%)(44%)(28%)35-49岁125

44、(25%)334250(25%)(22%)(28%)50-65岁100(20%)123058(29%)(8%)(20%) 高收入细分市场在某年龄段的高收入细分市场在某年龄段的剖面指数,剖面指数,反映了高收入细反映了高收入细分市场在某年龄段的人数比例是高于还是低于总体市场在分市场在某年龄段的人数比例是高于还是低于总体市场在相应年龄段的比例。相应年龄段的比例。 通常的标准是:通常的标准是:指数指数=100%是等于总体市场;是等于总体市场; 指数指数=120%,则认为显著高于总体市场;,则认为显著高于总体市场; 指数指数=80%,则认为显著低于总体市场。,则认为显著低于总体市场。 在本例中,在本例中

45、,18-24岁的剖面指数岁的剖面指数=26/25*100%=104% 25-34岁的剖面指数岁的剖面指数=44/30*100%=147% 35-49岁的剖面指数岁的剖面指数=22/25*100%=88% 50-65岁的剖面指数岁的剖面指数=8/20*100%=40% 因此,对于高收入细分市场,年龄段因此,对于高收入细分市场,年龄段25-34岁的人数比例岁的人数比例显著高于总体水平,而年龄段显著高于总体水平,而年龄段50-65岁的人数比例,则显岁的人数比例,则显著低于总体水平,(其他年龄段的剖面指数可以同样计著低于总体水平,(其他年龄段的剖面指数可以同样计算)。有了这方面的信息,管理部门就可以有

46、针对性地制算)。有了这方面的信息,管理部门就可以有针对性地制定营销组和策略。定营销组和策略。1 定距定距定距尺度定距尺度 (Pearson Cor.)1)相关的含义)相关的含义: 相关相关(Correlation)是用来作两个定距变量关系是用来作两个定距变量关系的统计分析,考察两变量是否存在共同变化的趋的统计分析,考察两变量是否存在共同变化的趋势。如年龄与收入。势。如年龄与收入。 当两变量在同一方向上变化,称为有当两变量在同一方向上变化,称为有正相关正相关;相;相反方向变化,称为反方向变化,称为负相关负相关;无变化即;无变化即无相关无相关。相关系数相关系数即用来表示相关的程度。即用来表示相关的

47、程度。丈夫收入妻子收入600580750600770620810750810650如:2)相关系数的计算公式:)相关系数的计算公式:22)()()( )(yyxxyyxxriiii由此公式可看出:由此公式可看出:1 相关就是共变异数的标准化。相关就是共变异数的标准化。2 相关系数相关系数r的取值范围在的取值范围在(-1,+1)之间。之间。 +1代表完全正相关;代表完全正相关;-1表示完全负相关;表示完全负相关;0 表示无相关。表示无相关。示例:通过此题来演算相关系数示例:通过此题来演算相关系数。2 定序定序定序尺度定序尺度 (Spearman Cor.)积差相关的公式:积差相关的公式:积差相关

48、又称积差相关又称等级相关等级相关,用来考察两个,用来考察两个定序变量间定序变量间的相关关系。的相关关系。它的公式是由积矩相关转变而来,它的公式是由积矩相关转变而来,) 1(6122NNDr其中,D是每一对因变量和自变量的序数的差值;N是总的排序的序数。3. SPSS中的相关统计命令中的相关统计命令Statistics-CorrelateBivariate(双变量相关分析)(双变量相关分析)4 相关统计的输出格式相关统计的输出格式Correlations1.000-.079*.0201254861-.079*1.000.020.861861PearsonCorrelationSig. (2-ta

49、iled)NPearsonCorrelationSig. (2-tailed)NAGE现在每月工资AGE现在每月工资Correlation is significant at the 0.05 level (2-tailed).*. 相关系数人数1 、回归的含义:回归的含义:回归(回归(Regression,或,或Linear Regression)和)和相关同样都用来分析两个定距变量间的关系,但相关同样都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。即要假设一个变量回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影为自变量,一个为因变量,自变量对

50、因变量的影响就用回归表示。如年龄对收入的影响。响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,由于回归构建了变量间因果关系的数学表达,它具它具有统计预测功能。有统计预测功能。2 、回归的统计原理:、回归的统计原理:两个定距变量的回归是用函数两个定距变量的回归是用函数y= f(x)来分析的。我们最常用的是一元回归方程来分析的。我们最常用的是一元回归方程bxay其中其中x为自变量;为自变量;y为因变量;为因变量;a为截距,即常量;为截距,即常量;b为回归系数,表明自变量对因变量的影响程度。为回归系数,表明自变量对因变量的影响程度。360370380390400410420430440012345工龄工资Y=350+20 x在统计学中,这一方程中的系数是靠在统计学中,这一方程中的系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论