第8章调查资料的统计分析_第1页
第8章调查资料的统计分析_第2页
第8章调查资料的统计分析_第3页
第8章调查资料的统计分析_第4页
第8章调查资料的统计分析_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章调查资料的统计分析本章结构推论统计3.多元统计4.常用统计分析软件简介5.描述统计2.概述1.调查结果的展示6.第一节概述市场调查数据的计量尺度定类尺度(nominalscale)按照某种属性把事物进行分类,是判断“属于/不属于”的基准。如性别分为男和女两类,可以用编号1表示男,2表示女。定序尺度(ordinalscale)不仅能将事物分成不同的类别,还可以确定这些类别的优劣或顺序,是判断“A比B…”的基准。如文化程度分为大专及以上、高中、初中和小学及以下四类,可以分别编号为4、3、2、1。定距尺度(intervalscale)不仅能将事物分成不同类别并进行排序,还可以准确地计量它们间的差距。如考试成绩,90分比80分高10分。定比尺度(ratioscale)除具有以上三种尺度的所有特性外,还具有“绝对零点”。例如收入,0表示“没有收入”(称为“绝对零点”),这时不仅可以说1000元比800元多200元,还可以说1000元是500元的2倍。定性数据定量数据数据的四种计量尺度及其适用统计方法的比较

类型尺度基本性质市场调查案例适用的统计方法描述统计方法推论统计方法定性数据定类尺度表明对象或其类别的数字性别,品牌,商店比例,众数检验,二项式检验定序尺度表示对象的相对位置,但不能表示差异大小的数字偏好排序,在市场中的位次,社会层次比例,众数,中位数顺序相关系数,FriedmanANOVA定量数据定距尺度可以比较对象间的差异,但不存在绝对零点态度,意见中位数,全距,均值,标准差相关系数,t检验,ANOVA,回归,因子分析定比尺度存在绝对零点,可以计算对象间的比率年龄、收入、成本、销售量、市场份额全距,均值,标准差,几何均值,调和均值变异系数9.1概述市场调查统计分析方法类型描述统计分析即将数据以表格、图形或数值形式表现出来主要着重于对数量水平或其他特征的描述,但不具有推断性质。推论统计分析即通过样本推断总体。这类方法对数据的收集方法、变量的选择、测度的决定、资料的时间空间范围有严格限制,必须符合严格的假设条件。其结果不仅可用于描述数量关系,还可以推断总体,进行预测,揭示原因以及检验理论等。描述统计分析案例推论统计分析案例采用简单随机抽样方法从甲乙两学校各自抽取100位学生,甲学校样本在体育锻炼上平均每周花费时间为120分,样本标准差为30,乙学校样本在体育锻炼上平均每周花费时间为110分,标准差为10,两个学校的学生在平均每周体育锻炼时间上有没有显著差异?

甲班乙班第二节描述统计分析定量数据描述统计分析2.定性数据描述统计分析

1.数值表示图表、图示数值表示图示表示多变量相关与回归分析3.定性数据定量数据案例数据(表9-2某公司30名职工数据)员工号受教育年数(年)职位年薪(元)工作资历员工号受教育年数(年)职位年薪(元)工作资历114030150116120171002216036600117120252002380177001182016925024120261001191502670025121594001201203090026161472501211804395027150370501221203150028150277501231704020039151387001241504110031016040350125160348003111203390012612030900312120199501271919200031319152125128191110625314161402002291911350003158019800230120262503定性数据职位:0表示一般职员,1表示管理者工作资历:1表示工作年限低于5年;2表示工作年限在6-10年;3表示工作年限大于10年定量数据受教育年数(年)年薪(元)一、定性数据描述统计分析——频数分布表

频数分布表:频数分布是数据的表格汇总,表示在几个互不重叠的组别中每一组项目的频数和百分比。频数百分比累计百分比工作年限低于5年1343.33%43.33%工作年限在6-10年930.00%73.33%工作年限大于10年826.67%100.00%总计30100.00%一、定性数据描述统计分析——图示

饼图:以圆的整体面积代表被研究现象的总体,按各构成部分占总体比重的大小把圆面积分割成若干扇形来表现部分与总体的比例关系。饼图一般只能用于单选问题。饼图不能切成太多的部分,一般不要超过7部分。某城市商品房住户人均居住面积饼图

一、定性数据描述统计分析——图示

线图又称曲线图,即利用线段的升降来说明现象的变动情况,主要用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系。包括简单线图和复合线图。一、定性数据描述统计分析——图示

条形图:是利用相同宽度的条形的长短或高低来表现数据的大小与变动。如果条形图横排,也可称为带形图,纵排也可称为柱形图。表现各种不同数值资料相互对比的结果。条形图可分为简单条形图和复合条形图。一、定性数据描述统计分析——数值表示

众数(mode)表示一组资料或资料中出现次数最多或最常见的数值。在市场调查资料中,众数代表了最典型的个案,或分布的高峰所对应的变量值。例如,在A、B、C、D四个品牌中,最受消费者偏爱的是品牌D,那么品牌D或品牌D所对应的编码(变量值)就是众数。众数简单直观,主要用于描述定类变量的中心;但是众数可能会因为资料中个别值的变化而有较大的变化,因而是很不稳定的。EXCEL中计算众数的函数为:MODE(区域)一、定性数据描述统计分析——数值表示

中位数(median)表示一组资料按照大小的顺序排列时中间位置的那个数值。有50%的个案(按某个变量)的取值在中位数之下,50%在它之上。中位数实际上就是一个50百分位数。例如,在某市的调查中13个商场一周的营业额(X)按从小到大的顺序排列为(万元):

23,35,47,59,88,102,145,198,230,256,278,345,388

中位数主要适用于顺序变量,对极端值不敏感。EXCEL中计算中位数的函数为:MEDIAN(区域)

二、定量数据描述统计分析——直方图

直方图:先把定量数据分组;把研究的变量放在横轴,每组的频数或百分比放在纵轴;每组的频数或百分比用一个长方形绘制,长方形的底是组宽,高是每组相应的频数或百分比。定量数据的数值表示表9-4EXCEL对公司员工年薪的描述分析描述集中趋势描述离散趋势描述对称和偏斜程度年薪平均42750标准误差4927.011中位数35700众数40200标准差26986.35方差7.28E+08峰度4.815795偏度2.169985区域117900最小值17100最大值135000求和1282500观测数30定量数据的数值表示

集中趋势分析:就是确定数据一般水平的代表值或中心值,常用的指标有三种,即平均数、中位数和众数。平均数,也称为均值(mean),等于变量值之和除于个案数。平均数是最典型的也是最常用的统计量,适用于等距的和等比率的变量。平均数也是最“有意义”的统计量,它可以看成是资料的“平衡点”或“中心”位置所在。由于平均数的计算需要用到所有的资料,因此与中位数和众数相比,它所含的讯息量最大。但是平均数对个别极端值的变化会是很敏感的。

定量数据的数值表示——离散趋势分析除了用上述典型的统计量描述分布的中心位置外,还要用一些统计量描述分布围绕中心向两个方向分散(伸展)的程度。

方差和标准差:反映所有观测值对均值的离散关系。方差或标准差越大,均值的代表性越差。EXCEL中方差和标准差的计算函数为:VAR(区域)和STDEV(区域)定量数据的数值表示——离散趋势分析四分位差(interquartilerange)

将一组数据从小到大排列后,用3个四分位数点()将其分为四个相等的部分,第一个四分位数点是第25百分位数点,又叫下四分位数点;第二个四分位数点是第50百分位数点,即中位数;第三个四分位数点是第75百分位数点,又叫上四分位数点。上四分位数点与下四分位数点之间的距离即为四分位差,记为QD。EXCEL中计算四分位数的函数为:QUARTILE(区域,i),i=0,1,2,3,4。定量数据的数值表示——离散趋势分析变异系数(coefficientofvariation)也称为离散系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较。变异系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较数据的离散程度。全距(Range)也称极差,是一组数据中最大与最小值之差

R=Max(xi)–Min(xi)

定量数据的数值表示——偏度(Skewness)与偏度是指数据分布的偏斜方向和程度。偏态系数的计算公式为:EXCEL中计算偏度的函数为SKEW(区域)

α3为0时,表明分布是对称的;若为正值,说明正偏离的差值较大,分布为正偏或右偏;若为负值,说明分布为负偏或左偏。α3的绝对值越大,分布的偏斜程度越大。定量数据的数值表示——峰度(Kurtosis)分析

峰度是指分布集中趋势高峰的形状,若分布的形状比比标准正态分布更瘦更高,称为尖峰分布。相反,若更扁平,称为平峰分布。

峰度系数,其计算公式为:当α4>0时为尖峰分布,α4<0时为平峰分布。

EXCEL中计算峰度系数的函数为KURT(区域)。例题:分析下列分布的峰度和偏度?三、多变量相关与回归分析——定性数据定性变量间的相关分析交叉列联表分析

定量变量间的相关分析散点图(Scatterdiagram)相关系数(Coefficientofcorrelation)回归分析(regression)定性变量间的相关分析——交叉列联表分析交叉列联表分析是同时描述两个或两个以上变量联合分布的统计技术。进行交叉列联分析的变量必须是离散变量,并且只能有有限个取值,否则要进行分组。

两变量的交叉列联分析列联表可以清楚地表示两个类别变量之间的相互关系。

居住时间与对百货商场的熟悉程度的交叉列联分析

单位:频数

熟悉程度居住时间

13年以下13-30年30年以上合计不熟悉453455134熟悉525327132合计978782266居住时间与对百货商场的熟悉程度的交叉列联分析

单位:%

熟悉程度居住时间13年以下13-30年30年以上不熟悉46.439.167.1熟悉53.660.932.9合计100.0100.0100.0列百分比居住时间与对百货商场的熟悉程度的交叉列联分析

单位:%

熟悉程度居住时间

13年以下13-30年30年以上行合计不熟悉33.625.441.0100.0熟悉39.440.120.5100.0行百分比比较上面两个表,你选择哪种百分比?建议:对自变量取百分比自变量为列变量,取列百分比自变量为行变量,取行百分比使用电脑的程度与年龄成反比

不同文化程度的公众在工作中使用电脑的情况

三变量的交叉列联表分析引入第三变量后再进行交叉列联分析,则可能出现以下四种结果:剔除外部环境的影响,使原先两变量间的关系更单纯。否定原先两变量间的关系。尽管原先观察两变量间没有关系,第三变量的引入可能揭示了它们之间的一些联系。没有影响。例1:婚姻状况和衣服支出水平衣服支出水平婚姻状况已婚未婚高31%52%低69%48%合计100%100%个案数700300性别、婚姻状况和衣服支出水平衣服支出水平性别男女婚姻状况婚姻状况已婚未婚已婚未婚高35%40%25%60%低65%60%75%40%合计100%100%100%100%个案数400120300180婚姻状况和衣服支出水平仅分析婚姻状况和衣服支出水平这两个变量时,从数字上看未婚者在衣服支出方面比已婚者更高一些。但引入变量性别以后,发现对于男性来说,已婚者与未婚者在衣服支出方面没有显著差异,但对于女性未婚者与已婚者,在衣服支出方面的差异则很明显

私家车受教育水平本科及以上本科以下有32%21%没有68%79%合计100%100%个案数250750例2:受教育水平对私家车拥有状况的交叉列联分析收入、受教育水平对私家车拥有状况的交叉列联分析

私家车收入低高受教育水平受教育水平本科及以上本科以下本科及以上本科以下有20%20%40%40%没有80%80%60%60%合计100%100%100%100%个案数10070015050例3:年龄和出国旅行欲望的交叉列联分析

是否希望出国旅行年龄45岁以下45岁及以上是50%50%不是50%50%合计100%100%个案数500500性别、年龄和出国旅行的欲望进行交叉列联分析

是否希望出国旅行性别男女年龄年龄45岁以下45岁及以上45岁以下45岁及以上是60%40%35%65%不是40%60%65%35%合计100%100%100%100%个案数300300200200例4:家庭规模对是否经常吃快餐的交叉列联分析

是否经常吃快餐家庭规模小大是65%65%不是35%35%合计100%100%个案数500500

家庭收入和家庭规模对是否经常吃快餐的交叉列联分析

是否经常吃快餐收入低高家庭规模家庭规模小大小大是65%65%65%65%不是35%35%35%35%合计100%100%100%100%个案数500500500500定量变量间的相关分析

吸烟与否与患肺癌与否?收入与消费?纳税人年龄与税款数量?孕妇饮酒量与婴儿体重?农作物采光量与生长?相关分析的一般步骤由数据看变量有关系吗?如果有关系,变量间关系有多强?总体中是否也有此关系?此关系是否因果关系?相关分析

——散点图散点图:以一个变量为横轴,另一个变量为纵轴,每个观测单元根据两个变量的取值为坐标以点的形式出现在图形中。可以直观地看出变量间的关系形态及联系程度。线性相关和非线性相关正相关和负相关劳动生产率与利润总额散点图

云南内蒙相关分析

——相关系数

相关系数描述两数值变量之间线性相关的方向和强度.又称PEARSON相关系数相关系数通常用符号

r表示相关关系的测度

样本相关系数的计算公式或化简为相关关系的测度

r

的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负相关

r=0,不存在线性相关关系-1r<0,为负相关0<r1,为正相关|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切相关系数取值及其意义-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关系数若|r|≥0.8,则认为和高度相关;若0.5≤|r|<0.8,则认为和中度相关;若0.3≤|r|<0.5,则认为和低度相关;若|r|<0.3,则认为和之间的相关程度极弱,可视为不相关。使用相关系数的注意事项r

=0只表示和之间不存在线性相关关系,并不是说和之间不存在任何关系,它们间可能存在非线性关系。r大小可能受极端值的影响,不能准确度量变量间的关系,例如多数观察值存在线性相关,但个别极端值使数据呈非线性相关。r所表现的相关程度同样本数据的时间范围有很大关系,在不同时间段,变量间的相关性可能不同。r用样本数据计算的带有一定随机性,尤其样本量较少时,可能出现虚假相关。因此,实际应用时,必须对它的显著性进行检验。

斯皮尔曼(spearman)相关系数

定序变量等级相关程度

取值范围在-1和+1之间

定量变量间的回归分析回归分析是用来分析一个或一个以上自变量与因变量间的数量关系,以了解当自变量为某一水准或数量时,因变量反应的数量或水准线性回归模型的一般步骤建立理论模型收集数据散点图、相关系数分析模型的参数估计模型检验模型的应用回归分析案例引用表9-2的数据,以年薪为因变量,受教育年限和职位为自变量,拟合二元线性回归模型。

判定系数r2:反应回归直线的拟和程度方差分析(F)检验:回归方程的显著性检验t检验:回归系数的显著性检验案例分析回归系数的含义:在相同的职位上,受教育年限(edu)每增长1年,年薪平均增长3669元;相同受教育年限的条件下,管理者(position=1)的年薪比一般职员(position=0)平均增长27144.47元。判定系数(AdjustedRSquare)=0.605表示受教育年限和职位可以解释年薪的60.5%的信息方差分析检验P-value小于0.05,表明方程通过了显著性检验,受教育年限和职位对年薪有显著的线性影响。受教育年限的t检验P-value小于0.05,表明受教育年限都对年薪有显著的线性影响。职位的t检验P-value小于0.05,表明职位对年薪有显著的线性影响。第三节推论统计根据样本的信息,对总体的分布以及分布的数字特征进行统计推断,即推论统计分析。推论统计的前提要求是,样本是随机抽样而来的,对总体有一定的代表性。

参数估计1.假设检验2.方差分析3.推论统计——参数估计从公司所有员工中利用有放回简单随机抽样方法抽取30个员工,年薪的样本均值=42750元,如何估算该公司所有员工的平均年薪呢?公司所有员工的平均年薪:总体参数,是一个未知的常数;样本员工的平均年薪称为统计量(用于估计的统计量也称为估计量),由于统计量对于不同的样本取值不同,所以估计量是随机变量。42750元是估计量的一个实现值,也称为估计值。点估计点估计量的选择无偏性:如果大量重复抽取样本,这些样本的估计值的均值渐近于总体均值。有效性:如果大量重复抽取样本,这些样本估计值的方差在所有无偏估计量中最小。估计量的方差和标准差用于衡量估计量的误差,所以又称为估计误差和标准误差。如表9-4估计出均值估计量的标准误差=4927.011元。区间估计区间估计:可以提供点估计与总体参数值的接近程度的信息。一定置信度的置信区间的形式一般为:点估计±边际误差置信度一般取值为95%:表示是指大量重复抽样时,产生的大量类似区间中有的包含总体参数值,有的不包含总体参数值;但其中大约有95%的区间会包含总体参数值。边际误差则取决于估计量形式、抽样方法、样本量、总体方差等因素。推论统计——假设检验在总体的分布函数未知或只知其形式不知其参数的情况下,为推断总体的某些性质,先对总体提出假设,然后根据样本资料对假设的正确性进行判断,决定是接受还是拒绝这一假设。参数假设检验和非参数假设检验例如:一颗骰子,100次总点数:368推测:骰子是否被灌过铅?假设检验中的原理先设立假设,利用掌握的反映现实世界的数据来找出假设和现实的矛盾,从而否定这个假设。反证在一次试验中小概率事件就发生小概率:在一次试验中,一个几乎不可能发生的事件发生的概率,应该是接近0的一个数,可能是0.05,0.01,0.005,0.001等等假设检验的过程首先要提出一个原假设(也称为零假设,nullhypothesis,记为H0),比如m=5。同时提出备选假设(alternativehypothesis,记为H1

),比如m>5。根据零假设,我们可以得到检验统计量的分布;然后再看这个统计量的数据实现值(realization)属不属于小概率事件。如果的确是小概率事件,那么我们就有可能拒绝零假设,否则我们说没有足够证据拒绝零假设。对总体参数的一种看法检验统计量在零假设下,等于这个样本的数据实现值或更加极端值的概率称为p-值(p-value)总体假设检验的过程

(提出假设→抽取样本→作出决策)抽取随机样本均值

X=20我认为人口的平均年龄是50岁提出假设拒绝假设!

别无选择.作出决策假设检验的两类错误根据小概率原理的假设检验结论总有可能是错误的。可能H0为真时,我们拒绝了H0,这类“弃真”错误称为第I类错误;也可能H0不真时我们接受了H0,这类“取伪”错误称为第II类错误。在确定检验法则时,我们应尽量使犯这两类错误的概率都较小。但在固定样本量下,要减少犯一类错误的概率,则犯另一类错误的概率往往增大。要使犯这两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,我们一般总是控制犯第I类错误的概率,使它小于等于(显著性水平)。这种只对犯第I类错误的概率加以控制,而不考虑犯第II类错误的检验问题,称为显著性检验问题。假设检验的逻辑步骤第一:写出零假设和备选假设;第二:确定检验统计量;第三:确定显著性水平a;第四:根据数据计算检验统计量的实现值;第五:根据这个实现值计算p-值(p-value);第六:进行判断:如果p-值小于或等于a,就拒绝零假设,这时犯错误的概率最多为a;如果p-值大于a,就不拒绝零假设,因为证据不足。

案例分析某化妆品公司开发了一种新型护肤化妆品,委托某市场调查公司进行市场调查,以检验消费者的偏好情况。根据该公司管理者的判断,除非该产品有20%以上的消费者喜欢,否则不能投入生产。因此为检验喜欢该新产品的消费者比例是否低于20%,对625人进行一次市场调查。推论统计——方差分析是比较若干个总体均值之差的一种常用统计方法。传统的方差分析主要用于分析实验数据,实际上,它们同样适用于调查数据与观察数据。方差分析应用时一般假定所比较的总体都服从正态分布,而且具有相同的方差。不过方差分析具有稳健性,在更宽泛的条件下也还是近似有效的。在方差分析中,当涉及的因素只有一个时,称为单因素方差分析;当涉及的因素为两个或两个以上时,统称为多因素方差分析。单因素方差分析的一般步骤(1)明确因变量与自变量,建立原假设。原假设H0:

(2)数据分别计算总方差、组间方差、组内方差,建立方差分析表

(3)显著性检验,F检验。如果显著性水平低于P值,则拒绝原假设,认为差异显著。(4)分析结果。如果原假设没有被拒绝,说明自变量对因变量没有显著影响;反之,如果原假设被拒绝,说明自变量对因变量有显著影响。换句话说,在自变量的不同水平下,因变量的均值是不同的。案例

为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本,其中零售业抽取7家,旅游业抽取了6家,航空公司抽取5家、家电制造业抽取了5家,然后记录了一年中消费者对总共23家服务企业投诉的次数,结果如表9.7。试分析这四个行业的服务质量是否有显著差异?(=0.05)消费者对四个行业的投诉次数

观察值(j)行业(A)零售业旅游业航空公司家电制造业12345675755464554534762496054565551494855477068636960解:设四个行业被投诉次数的均值分别为,m1、m2

、m3、m4

,则需要检验如下假设

H0:m1=m2=m3

=

m4(四个行业的服务质量无显著差异)H1:m1

,m2

,m3,m4不全相等(有显著差异)Excel输出的结果如下结论:拒绝H0。四个行业的服务质量有显著差异用Excel进行方差分析第1步:选择“工具”下拉菜单第2步:选择【数据分析】选项第3步:在分析工具中选择【单因素方差分析】

,然后选择【确定】第4步:当对话框出现时

在【输入区域】方框内键入数据单元格区域在【】方框内键入0.05(可根据需要确定)

在【输出选项】中选择输出区域第四节多元统计分析聚类分析1.判别分析2.主成分分析3.对应分析5.因子分析4.结合分析6.多元统计分析——聚类分析聚类分析(Clusteranalysis),又称群分析和类分析,它是依据某种准则对个体(样品或变量)进行分类的一种多元统计分析方法。“物以类聚”比如在一项全国范围的市场调查中,需要对我国32个省/市/自治区的经济发展状况进行分析。一般不是逐个省/市/自治区去分析,较好的作法是选取能反映经济发展状况的有代表性的指标,如国民生产总值(GNP)、工农业总产值、第三产业比重、固定资产投资额、人均国民收入、城市和农村平均每人月收入及通货膨胀率等指标,根据这些指标对32个省区进行分类。然后依据分类结果,对经济发展情况进行综合评价,这就易于得出科学的结论。应用市场细分。例如可以根据消费者购买某产品的各种目的把消费者分类,这样每个类别内的消费者在购买目的方面是相似的。了解购买行为。聚类分析可以把购买者分类,这样有助于分别研究各类购买行为。开发新产品。对产品与品牌进行聚类分析,把它们分为不同类别的竞争对手。在同一类别的品牌比其他类的品牌更具有竞争性。公司可以通过比较现有竞争对手,明确新产品的潜在机遇。选择实验性市场。通过把不同城市分类,选择具有可比性的城市检验不同的营销策略的效果。简化数据。原理

(1)首先在要进行聚类的样品或变量之间,定义一种能够反映它们之间亲疏程度的量,常用的方法有两个,即距离和相似系数。距离常用来对样品进行分类,它把样本中的每个样品看成P维空间的一个点,并在空间定义距离,距离较近的点归为一类,距离较远的点归为不同类。相似系数常用来对变量进行分类,性质越相近的变量,相似系数的绝对值越接近于1,反之越接近于0。将相似系数较大的变量归为一类,相似系数较小的变量归为不同类。(2)以这些量为聚类的依据,将一些相似程度较大的个体聚为一类,另一些彼此之间相似程度较大的个体聚合为另一类,……,最终将关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到将所有的个体都聚合完毕,形成一个由小到大的分类系统。(3)直到所有个体都聚合完毕,最后把聚类过程画成一张图表示出来(聚类图或谱系图),以直观表现各个体之间的亲疏关系。步骤(1)确定问题(2)选择距离或相似系数的测度。目前使用最多的是欧氏距离或欧式距离的平方。(3)选择聚类方法。(4)决定类别个数。(5)描述与解释各个类别。

(6)评价聚类的有效性与准确性。案例消费者购物的态度——20位被访者的回答

V1购物很有趣。V2购物不利于您的预算。V3购物总是与上饭店吃饭联系在一起。V4购物时我尽量买得最好。V5我对购物不感兴趣。V6购物时多比较价格可以节省很多钱。clusterNoV1V2V3V4V5V615.7503.6256.0003.1251.7503.87521.6673.0001.8333.5005.5003.33333.5005.8333.3336.0003.5006.000比较各类别的消费者对6个态度变量的评价,第一类消费者对于V1和V3的评价相对较高,而对V5评价较低,因此可以称其为“热情的购物者”。第二类消费者正好与第一类相反,对于V1和V3的评价相对较低,而对V5评价较高,因此可以称其为“冷淡的购物者”。

第三类消费者对于V2、V4和V6的评价相对较高,因此可以称其为“经济型购物者”。

多元统计分析——判别分析

判别分析是判别样本所属类型的一种多元统计方法。例如某品牌的购买者与非购买者之间有什么差别?从人口统计和生活方式看,对某新产品有较高购买可能性的客户与较低购买可能性的客户之间的区别?从人口统计和生活方式看,经常光顾某快餐厅的顾客与经常光顾竞争对手快餐厅的顾客之间有何区别?已经选购不同品牌商品的顾客在使用、感知和态度上有何不同?多元统计分析——判别分析原理:判别分析就是在已知研究对象分为若干类型(组别)并已经取得各种类型的一批已知样品的观测数据基础上,根据某些准则建立起尽可能把属于不同类型的数据区分开来的判别函数,然后用它们来判别未知类型的样品应该属于哪一类。分类:根据判别的组数,分为两组判别分析和多组判别分析;根据判别函数的形式,分为线性判别和非线性判别;根据判别时处理变量的方法不同,分为逐步判别、序贯判别等;根据判别准则的不同,分为距离判别、Fisher判别、Bayes判别等。多元统计分析——主成分分析

主成分分析就是把多个变量重新组合为一组相互无关的几个综合变量,而且从中可取几个较少的综合变量尽可能多地反映原来变量的信息。例如,评价企业的竞争力要涉及很多指标,例如固定资产、流动资金、产值、利润、人员素质、科技水平、管理水平、环境等。利用主成分分析能从中找出少量几个相互独立的综合指标代替原先许多的指标,简化分析。多元统计分析——因子分析

因子分析(Factoranalysis)的目的是使数据简单化,它是将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子,对变量进行分类。在市场调查中的应用:(1)消费者使用习惯和态度研究中,对消费者对产品的态度探查往往需要使用因子分析,探查影响消费者产品态度的基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论