版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
市场调查预测与决策1引导案例某地区的一个调研人员为一家最大的糖果制造商精心准备了长达250页的市场调查报告(包括图表和统计数据)。在经历了大约6个月左右的艰苦调研后,他直接向公司3名最高决策者做了口头汇报。他信心百倍,自以为他的报告中有许多重大发现,包括若干个可开发的新细分市场和若干条产品理念方面的创新。然而,在听了一个小时的充满事实、数据与图表的汇报后,糖果公司的总经理站起来说道:“打住吧,伙伴!我听了一个多小时枯燥无聊的数字,完全给搞糊涂了,我想我并不需要一份比字典还厚得多的报告。明天早晨8点以前务必把一份5页纸的摘要放到我办公桌上。”说完就离开了房间。在此,这个调研人员遇到了将使他受益整个职业生涯的一个教训。2市场调查资料的整理与分析第一节资料整理第二节资料分析第三节市场调查与预测报告的撰写3第一节资料整理市场调查资料整理是对市场调查获得的信息进行初加工,为分析研究准备数据。节主要阐述市场调查资料加工整理的基本知识和基本方法,主要包括审核、分类、编码、汇总、列表、图示等资料整理的技术性知识。4一、资料整理的含义市场调查资料整理是根据市场分析研究的需要,对市场调查获得的大量的原始资料进行审核,分组、汇总、列表,或对二手资料进行再加工的工作过程。其任务在于使市场调查资料综合化、系列化、层次化,为揭示和描述调查现象的特征、问题和原因提供初步加工的信息,为进一步的分析研究准备数据。5二市场调查资料整理的内容
1.数据确认:是指对原始数据或二手资料进行审核,查找问题、采取补救措施、确保数据质量。2.数据处理:是指对问卷或调查表提供的原始数据进行分类和汇总,或者对二手数据进行再分类和调整。3.数据陈示:是指对加工整理后的数据用统计表、统计图、数据库、数据报告等形式表现出来。6
三资料整理的程序
7
(一)原始资料的审核1审核的内容(1)齐备性。检查收回的问卷的份数是否齐全,是否达到了样本量的要求。(2)完整性。检查问卷填答的项目是否完整。并作出处理。大量问项无回答应作废卷处理。个别问项个别无回答,归入“暂未决定”或“其他答案”中。个别问项大量无回答,可作删除此项提问。(3)准确性。检查问卷或调查表中的项目是否存在填答错误。逻辑性错误答案,用电话核实或按“不详值”对待;答非所问的答案,用电话询问或按“不详值”对待;乏兴回答答案,若个别问卷则抛弃,若同一问题有不少问卷乏兴回答可作子样本看待。(4)时效性。检查调查访问时间和数据的时效性。若延迟访问对调查结果无影响,则问卷有效;若延迟访有影响,则废弃此问卷(5)真伪性。检验问卷或调查表的真实性。抽样复检访问员是否到访,若访问员伪造问卷应作废弃处理,并重新派员重访。82审核的作业方式实行一卷或一表从头审到尾,有利于贯彻审核的一致性原则和明确审核员的责任,而分段作业和分段审核,容易产生责任不清的问题。3审核的办法(1)逻辑审核。利用逻辑和经验判断的方法,检查问卷或调查表中的填答项目是否合理,项目之间有无相互矛盾的地方,有无不应有的空白,有没有不合理的填答,有没有泛兴填答、答非所问或部分项目不回答等。(2)计算审核。计算审核主要是对数据进行计算性的检查,如分量相加是否等于小计,小计相加是否等于合计,数据之间该平衡的是否平衡,各项数据在计算方法、计算口径、计量单位、时间属性等方面是否有误等。9判断是否有异常数据
判断异常数据的方法可以凭借审核人员的工作经验与实践用逻辑分析进行,也可以用滤波方法进行。滤波方法是利用正态分布确定数据允许在合理范围,超出该范围的数据视为异常数据。数据合理允许范围可用下列式子表示:10
K值由下表查得,它由n、P1和P2三个参数决定:n为样本单位数;P1为置信度,通常采用0.95和0.99;P2为数据落在区间内的概率。
P10.950.990.990.9990.990.999101520253035404550604.433.883.613.463.353.273.213.163.133.075.654.954.614.414.284.184.104.043.993.925.594.604.163.903.733.613.523.443.383.297.135.885.314.994.774.614.494.404.324.21P2Kn11用滤波法判断数据异常举例
某地区连续30年降雨量资料分别为:(单位:mm)
12431236123012401251126612731252
1301
127412451275126412821310130413231352
184516281350134713281326133313711344
1320138313831360
现要求按95%的可靠度,使99%的数据落在允许的范围内,试找出异常数据。解:n=30,=1330,S=123,P1=0.95,P2=0.99,查表得K=3.35,则正常数据的区间为(917.95-1742.05),可知1845为异常。12对有残缺数据序列进行加工对异常数据的处理,通常要在定性分析的基础上,结合序列数据的具体情况采用不同的方法加工处理。常用的方法有:1.剔除法当非时间序列数据较多,对不合理的异常数据可以剔除掉.2.插补法当时间序列数据较少时,剔除掉不合理的异常数据后可根据序列散点图所显示的数据变化趋势,用相应的方法补齐所缺数据,具体做法如下:13(1)当散点图呈水平变化趋势时,异常数据可用算术平均代替。(2)当散点图呈线性变化趋势时,异常数据可用其前后的算术平均代替。(3)当散点图呈非线性变化趋势时,异常数据可用前后两数据的几何平均代替。3.口径法有些序列数据虽然异常,但经过分析后,这些数据能够反映调查对象的未来发展趋势,如行政区变更(指标计算口径、计算方法、计量单位变更、市场开放与保护等变更引起的近期数据跳跃性波动等)。显然,这种异常数据非但不能被剔除,还必须作为基础数据,并以此数据的口径来调整其他历史数据,形成新的序列数据。14口径调整法举例某地区各年度水泥销售量如下表单位:万元年份1998199920002001200220032004调整前某地销售量某县销售量调整后某地销售量11521136113221331172314012526151130281581922919219830198
从上表可以算出,在调整前某地销售量自2003年后的销售量出现了跳跃性的增加,为异常数据.经过调查了解到,从2003年起,该地区行政划分发生了变化,增加了一个县.故2003、2004年的数据是正常的,应保留。154.残缺数据修补法在调查数据较少,残缺数据不止一个,或有连续若干个异常数据或数据空缺时,不能简单剔除残缺数据,可用均值替代法、回归估计法、随机抽取法、近距离确定法等修补残缺数据。均值替代法是使用变量的平均值替代其中某些异常值或缺失值。这种修补法的优点是能保持变量均值不变,变量的其他统计量(如标准差、相关系数)因此受到的影响也较小。回归插值法回归插值法是根据现有的数据,分析该变量与其他变量之间的联系,建立回归模型,然后根据被调查者对其他变量的回答,估计残缺资料的取值。16
(二)原始资料的分组处理1简单分组处理是指对总体各单位或样本各单位只按一个标志或标准进行分组处理。分组的标志或标准一般可以区分为品质属性、数量属性、时间属性、空间属性四类。例如:某市组织了一次样本量为2000户的居民家庭空调满意度和购买行为的市场调查,设计的问项是36个,其中基本项目9项,主体项目27项。17
1)品质属性分布数列是以被调查者的职业、所属行业、性别、文化程度、职业等品质属性作为分组标志而形成的简单品质数列。如表1表1某市居民家庭空调拥有量品牌分布
2)数量属性分布数列是以被调查者的年龄、收入、消费支出、家庭人口、就业人口等数量属性作为分组标志形成的变量数列。有如下两种形式:(1)单项式变量数列。适应于离散型变量(如家庭人口、就业人口、耐用品拥有量、需求量等)的分组处理,即直接以变量的不同取值作组别而编制的变量数列。如表6-2。18(2)组距式变量数列。适应于连续变量(如年龄、收入、消费支出等)的分组处理,即以变量的不同取值区间作为分组的组别而编制的变量数列,如表319组距式分组是将变量值按照数值大小依次划分为几个区间,每一个区间内的所有变量值归为一个组。组限上限和下限统称为组限。组距各组区间的距离称为组距。例如,上述温饱家庭组的恩格尔系数50%和60%分别是该组的下限和上限,组距为10%。20间断组距分组在组距式分组中,相邻组的组限不重叠的分组称为间断组距分组。例如,儿童按年龄分组分为:不满1岁、1~2岁、3~4岁、5~9岁、10~14岁。
对于离散型变量的取值是不连续的分组,也可采用间断组距分组。例如,对企业数、员工人数、设备台数等用实物单位计量的变量均可用间断组距分组。
连续组距分组
在组距式分组中,相邻组的组限重叠,即上一组的上限为下一组的下限,两组共用同一个组限对两相邻组进行连接,这样的分组称为连续组距分组。21例如,家庭按人均居住面积分组分为:4平方米以下、4~14平方米、14平方米以上。
注意:
连续组距分组采用组限重叠方式,对某一单位取值正好等于组限时,可能同时划归两个组。例如,上述家庭按人均居住面积分组中遇到的恰好人均面积是4或14平方米的家庭,将有两种分组方法,。为了保证在组限确定后分组结果的唯一性,需要遵守所谓“上限不再本组内”的原则。例如,上述人均居住面积恰好为4的家庭应归入4~14平方米的一组,恰好为14的家庭应归入14平方米以上的一组。22等距分组是资料分组中各组的组距都保持相等。其优点很多,它便于进行计算,也便于绘制统计图,进行各组之间的比较和分析。当调查所得到的变量值的变动比较均匀的情况下,均可采用等距分组法进行分组。例如,对员工的工资、工龄分组;对单位营业面积销售额、单位产品成本分组等。在等距分组中,分组的数量(n)即组数与组距(d)的乘积等于最大变量值与最小变量值的差额即全距(R)。用公式表示为:
R=n.d
在R一定时,等距分组只要确定了n或d,以及最小组的下限或最大组的上限,采用连续组距分组便可把分组中各组的组限确定下来。23异距分组
是资料分组中各组的组距不相等或不完全相等,
变量值分布不均匀。例如社会成员的收入分配;变量值相等的量具有不同的意义的场合,又如对婴幼儿按年龄分组;变量值按一定比例增减变化的场合。异距分组的方法没有固定的模式可循,全凭资料整理人员在实践中不断摸索。关键在于研究人员对所研究现象的本质特征和内在联系十分熟悉,才能运用好异距分组揭示研究对象的本质。资料分组的形式
资料分组按照所用的分组标志的多少及组合形式的不同,可以分为简单分组、复合分组和分组体系。
241.简单分组
当研究目的是为了反映总体在某一方面的情况,可采用简单分组。
简单分组中所使用的分组标志只有一个。例如,家庭按人均居住面积分组分为:4平方米以下、4~14平方米、14平方米以上进行分组。2.复合分组
当研究目的是为了反映总体的多个方面的情况,就需要采用复合分组。
复合分组是将两个或两个以上分组标志相结合进行的资料分组,即首先按照一个标志分组,然后在已划分的各组内按照另一个分组标志或几个分组标志再进行细分组。
25例如,对居民家庭首先按照居住地的性质分为城市家庭和农村家庭2组,再把城市家庭和农村家庭分别按照人均居住面积分为4平方米以下、4~14平方米、14平方米以上3组,形成2个粗分组和6个细分组,共8个组。分组结果见下下表所示:
用复合分组时,分组单位一般不超过两个,否则分组的结果将显得的杂乱不清。城市家庭农村家庭
人均居住4平方米以下人均居住4~14平方米人均居住14平方米人均居住4平方米以下人均居住4~14平方米人均居住14平方米以上26分组方法
分组的方法,目的在于从不同角度、不同方面对同一研究对象进行分项说明,使人们对研究对象有一个全面的认识。分组可采用一系列相互联系、相互补充的并列分组标志对研究对象进行分类,如采用罗列式分组,因而各个分组之间不存在交叉层叠,随着分组标志数量增加分组的表现效果会更好。例如,对居民家庭的分组体系可以表示如下:按家庭居住的区域分组按人均居住面积分组按家庭人口数分组城市家庭4平方米以下4~14平方米1人
2人农村家庭
4平方米以下
14平方米以上
3人
3人以上
27组数或组距的确定并无规律可言,须凭经验和研究问题的性质作出正确的判断。美国学者斯特杰斯(HASturges)提出了一个经验公式.,可供我们在进行等距分组时参考:
式中,研究总体(N)的单位数或变量的总个数。该公示要灵活运用,不能生搬硬套。28
3)时间属性分布数列是以调查问卷中的一些时间属性的调查项目(如购买时间、需求时间)作为分组标志,对被调查者的时间选项进行分组而形成的时间数列。如表4
4)空间属性分布数列是以调查问卷中的某些具有空间属性的调查项目(如被调查者的居住区域、购买产品的场所等)作为分组标志而形成的空间数列。如表5。29
2平行分组处理平行分组处理是对总体各单位或样本各单位同时采用两个或两个以上的标志或标准进行平行排列的分组,所编制的分组数列称为平行分组数列。(1)两变量(项目)平行分组数列。它是将两个有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。如表6。30
(2)多变量(多项目)平行分组数列。这是将两个以上有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。常用于产品或服务满意度测评、被调查者态度测量等原始资料的加工开发。如表7。31
3交叉分组处理交叉分组处理是对总体各单位或样本各单位采用两个或两个以上的标志或调查项目进行交叉分组,所编制的数列一般表现为相关分组数列或复合分组数列。(1)基本项目之间的交叉分组处理。它是利用反映被调查者基本情况的基本调查项目之间的关联性进行交叉分组处理。如表632
(2)基本项目与主体项目之间的交叉分组处理。它是利用问卷中的基本项目与主体项目之间的关联性进行交叉分组处理,用以揭示不同性别、不同年龄、不同行业、不同职业、不同文化程度、不同居住区域、不同家庭人口的被调查者对研究的主体项目选项回答的差异性、相关性等深层次问题。如表9两变量交叉列表。33(3)三变量交叉列表。如表10。
34小汽车驾驶者的事故比率35
36
37双变量交差列表分析法按经营年限计算的经营经营业务计算速度38394.开发式问题的分类归纳
“意见分类归纳法”的基本思路和程序。(1)集中所有同一个开放式问题的全部文字性答案,通过阅读、思考和分析,把握被调查者的思想认识。(2)将被调查者的全部文字性答案,按照其思想认识不同归纳为若干类型,并计算各种类型出现的频数;制成全部答案分布表。(3)对全部答案分布表中的答案进行挑选归并,确定可以接受的分组数。一般来说,应在符合调研项目的前提下,保留频数多的答案,然后把频数很少的答案尽可能归并到含义相近的组,应考虑调研的目的和答案类型的多少而确定,一般应控制在10组之内。(4)为确定的分组,选择正式的描述词汇或短语。不同组别的描述词汇或短语应体现质的差别,力求中肯、精炼、概括。(5)根据分类归纳的结果,制成正式的答案分布表。40例如,在一项关于居民空调购买行为的调研中,问卷中,设置了“你对‘静音空调’这个产品概念有何看法?”的开放式问项,被调查者的回答是多种多样的,通过分类归纳得到的答案分布表如表11。41
是把审核、清洁的有效市场调查资料,按照资料分组的方案进行汇总求得各个有关变量的各组数量总和或各组单位数,以及总体变量总和与总体单位数的资料整理过程。资料汇总的方法有手工汇总法和计算机汇总法两种:(一)手工汇总法是借助于算盘或计算器进行调查资料的汇总的一种整理方法。手工汇总的主要方法有划记法、过录法、折叠法和卡片法等。
1.划记法是在汇总表上划上易于计数的符号,如“正”号等进行计数汇总。此法简单易行,主要适用于对定类资料和定序资料的汇总。(三)市场调查资料的汇总42
2.过录法是事先将各单位的实际资料过录到预先准备好的表格上,进行加总计算,然后把计算结果填入正式的汇总表。此汇总法主要适用于对定距和定比资料的汇总。
3.折叠法当需要整理的调查表格不太多时,可将所有调查表中需要汇总的项目和数值折叠在一边,一张张重叠起来,进行汇总计算。
4.卡片法当总体单位多、复合分组多时,先使用卡片法进行手工汇总。43(二)计算机汇总
计算机具有存储量大、运算速度快、准确度高的特点,因此,使用计算机汇总的方法主要有以下几个部分内容组成:
1.编写程序根据资料汇总的设计方案,编写适用于本汇总方案内容要求的计算机处理程序。包括资料审核与修补程序、资料分组程序、汇总程序和图表制作及打印等程序。
2.资料编码是把市场调查问卷或调查表的信息转化成统一设计的计算机可识别的代码,以便对其进行资料整理和分析。数据编码,一般采用数字编码系统。44
3.数据录入是把编码后的市场调查资料和实际数字通过录入设备(键盘、扫描仪、光标阅读器等)记载到计算机的存储设备(硬盘、软磁盘、光盘等),以备计算机随时调用。
4.资料编辑
是计算机的逻辑检查,是按照程序中事先规定的逻辑检查规则对输入计算机的原始资料进行逻辑计算,将误差超过允许范围的资料退回修正。
5.制作图表打印所有录入资料经过逻辑检查之后,由计算机按照事先规定的汇总表和汇总层次进行统计制表或制图,并通过输出设备打印出结果。
45(四)市场调查资料陈示
1统计表
统计表是以纵横交叉的线条所绘制表格来陈示数据的一种形式。用统计表陈示数据资料有两大优点:一是能有条理地、系统地排列数据,使人们阅读时一目了然,印象深刻,二是能合理地、科学地组织数据,便于人们阅读时对照比较。统计表从形式上看,是由总标题、横行标题、纵栏标题、指标数值四个部分构成。从内容上看,由主词或宾词两大部分构成。主词是统计表所要说明的总体的各个构成部分或组别的名称,列在横行标题的位置。宾词是统计表所要说明的统计指标或变量的名称和数值,宾词中的指标名称列在纵栏标题的位置。有时为了编排的合理和使用的方便,主词和宾词的位置可以互换。462统计图
统计图是以圆点的多少、直线长短、曲线起伏、条形长短、柱状高低、圆饼面积、体积大小、实物形象大小或多少、地图分布等图形来陈示调研数据。用统计图陈示调研数据具有“一图抵千字”的表达效果,因为图形能给人以深刻而明确的印象,能揭示现象发展变化的结构、趋势、相互关系和变化规律、便利表达、宣传、讲演、广告和辅助统计分析。但统计图能包含的统计项目较少,且只能显示出调查数据的概数,故统计图常配合统计表、调研报告使用。1.直线图直线图是以直线的长短来表示品质属性数列中各组频数或频率大小的图形。常以横轴代表品质属性的不同组别,纵轴代表各组的频数或频率。47
2.条形图是以若干等宽平行长条或圆柱的长短来表示品质属性数列中各组频数或频率大小的图形。常以横轴代表不同的组别,纵横代表各组的频数或频率;亦可用纵轴代表各组,横轴代表频数或频率。
图6-5消费者对变频空调的看法483.圆面图是以圆形的面积代表总体指标数值,圆形的各扇形面积代表各组指标数值,或将圆形面积分为若干角度不同的扇形,分别代表各组的频率。实际应用时亦可将圆面改为圆饼或圆台,变成圆形立体图。494.环形图环形图是将总体或样本中的每一部分数据用环形中的一段表示。环形图亦可同时绘制多个总体或样本的数据系列。每一个总体或样本的数据系列为一个环。505.直方图直方图是以若干等宽的直方长条的长短来表示各组的频数或频率的大小。常用于表现组距数列的次数分布或频率分布。离散型变量组距的直方图中的长条应间断,连续变量组距数列的直方图中的长条应连接起来。51
6.动态条形图动态条形图是以宽度相等的条形的长短或高低来比较不同时期的统计数据的大小的图形,用以显示现象发展变化的过程和趋势。动态条形排列可以是纵列(垂直条形图),也可以是横列(水平或带状条形图),按图形中涉及的统计指标或变量的多少不同,可分为单式条形图、复式条形图、分段条形图等。527.动态曲线图动态曲线图又称时间数列曲线图或历史曲线图,它是以曲线的升降、起伏来表示数据的动态变化。按涉及指标的多少,有单式曲线图和复式曲线图之分。538.相关散点图相关散点图主要用于显示因变量(y)与自变量(x)之间是否具有相关关系,以及相关关系的形式是直线相关还是曲线相关,是正相关还是负相关。通常以横轴代表自变量(x),纵轴代表因变量(y)。549.统计地图统计地图是以地图为底本,利用点、线条、面积、数据、象形、标志等来表现各区域某种统计指标数据的大小及其在地理上的分布情形,又称空间数列图。根据所利用的图形不同,统计地图可分为数据地图、点地图、面地图、象形地图、线路地图、标志地图等等。图6-13是某市居民购房的区域选择分布地图。5510.茎叶图茎叶图又称枝叶图,是一种将数据与图形结合使用的表现数据的方式。特别适合于描述变量数列的次数分配。由茎和叶两部分构成,茎一般为十位或百位数,叶为个位数,因而图形是由数字组成的茎叶图类似于横置的直方图,同时保留了原始数据的信息。图14是某厂40个客户产品订购量(台)分布茎叶图。5611.帕累托图帕累托图主要用来描述财富分配、库存物资、客户分布、产品销售等分布不均匀的现象。一般是将所研究的现象分为ABC三类,A类的单位数占10-20%,而指标值占70-80%;B类的单位数占20-25%,而指标值占15-20%,C类单位数占60-65%,而指标值5-10%。然后依然累计频率进行制图。图15某厂产品销售客户ABC分类图
57第二节市场调查资料的分析
市场调查资料的分析可分为静态分析和动态分析。静态资料:
是指分析资料的所属时间均属于同一个时间属性,资料的数值变化是由于时间以外的其他因素,主要是调查单位不同而引起的。动态资料:
是指分析资料是同一调查对象不同时间上的指标数量的分析。两种资料的性质不同,分析方法也有所不同,需要分别加以介绍。一、
静态市场调查资料的分析
(一)分配数列与分析
581.分配数列是在对特定时间上的资料进行分组的基础上,对调查总体中的各单位进行归组和计数,从而形成各组之间单位分布状况的数列。分配数列有两部分构成,一是总体按某一标志所分的组,二是单位在各组中出现的次数(频数)。2.分配数列的分析通过分配数列,可以分析研究总体的内部结构,各部分的比例关系以及变量的分布类型等.
(1)分析总体的内部结构需要借助于各组的频数和频率进行分析.频率的计算公式如下:59为了分析的需要,可计算累计频数和累计频率。累计频数(或频率),又分为以下累计(顺累计)和以上累计(倒累计)两种不同的累计。以下累计当从变量值低的组向变量值高的组的方向累计,此时每一组的累计频数或累计频率表示该组上限以下的频数或频率之和;以上累计当从变量值高的组向变量值低的组的方向累计,此时每一组的累计频数或累计频率表示该组下限以上的频数或频率之和。
60市场调查数据资料分组举例1对某市50户居民抽样调查得到的消费品支出资料如下:(单位元)
16601760246022002360316024202920234021602100220021402740240032602500272025402840236020602740230028202340246025302760302020201720162022602280238025202700186028402160202021002500232026402760262025402500
对以上调查资料采用等距分8组,组距200元,编制组距数列、频数、频率、以上累计和一下累计如下表1:
61某市50户居民消费品支出情况分布表1按户消费支出分组(元)频数(户)频率(%)1600-18001800-20002000-22002200-24002400-26002600-28002800-30003000以上4181211833821624221666合计5010062按户消费支出分组(元)累计频数(户)累计频率(%)以下累计以上累计以下累计以上累计1600-18001800-20002000-22002200-24002400-26002600-28002800-30003000以上451325364447505045443725146381026507288941001009088745028126某市50户居民消费品支出情况分布表2
表2数据表明,每户月消费品支出在2000元以下的仅有5户,占总户数的10%;每户月消费品支出在2800元以上的也有6户,占总户数的12%;每户月消费品支出在2600元以下的有36户,占总户数的72%;每户月消费品支出在2600元以上的有14户,占总户数的28%。
63(2)分析总体各部分的比例关系对研究总体的各组成部分的比例关系分析,是通过计算各组间比例指标进行的。两组间比例的计算公式如下:在表1中的数据表明,月消费品支出1600~1800元组的户数是月消费品支出1800~2000元组的户数的4倍;月消费品支出2800~3000元组的户数是月消费品支出2400~2600元组的户数的1/4;等等。
64在例1中:①若月消费品支出1600~1800元组的4户居民的当月购买力为10000元;②月消费品支出2200~2400元组的12户居民的购买力为26000元,50户居民当月的总购买力为130000元;则月消费品支出1600~1800元组的5户居民的购买力占全部调查的50户居民总购买力的7.7%,月消费品支出2200~2400元组的10户居民的购买力占全部调查的50户居民总购买力的20%,月消费品支出1600~1800元组的4户居民的购买力仅为月消费品支出2200~2400元组的12户居民的购买力的38.5%。
65(3)分析变量的分布类型大致有:钟型、U型和J型有以下三类:钟型分布特征:“两头大,中间小”,愈靠近中间的变量值分布的频数愈多,愈靠近两边的变量值分布的频数愈少,其形状犹如一口古钟。U型分布特征:
愈靠近中间变量值分布的频率愈少,愈靠近两边变量值分布的频率愈多,呈“中间小,两头大”的形状。J型分布特征:
随着变量值增加,它所分布的频数渐次增加或渐次减少的分布。对变量分布类型分析还可转化为直方图、折线图的形式进行分析来判断变量的分布类型。66在例1中,通过编制的分配数列,以各组变量作为横坐标,以各组对应的频数或频率作为纵坐标,在直角坐标上表示出各组变量值与对应的频数或频率的直方图。把直方图上的各个矩形的上边线中点相连,形成表示变量值变化与频数或频率变化的对应关系的折线图。见图1和图2。
67从图2知,居民家庭消费品支出额基本呈现出钟型分布。收入在第4组,即2200~2400元组居民家庭最多,表明居民家庭消费品支出有明显地向地4和第5组集中的趋势。离这一个组愈远组的居民家庭愈少。但是,居民家庭支出额最少的两个组的分布情况与理论或经验分布类型不完全相同,有些异常,需要进行进一步分析其中的原因。68(二)变量的分布特征直观的分析变量分布类型,只是对变量的分布形状有一个基本的认识.如果从数量上对变量的分布特征进行精确的分析,需要计算有关变量分布的统计指标,常用的统计指标如下:
1.变量分布的集中趋势分析变量分布的集中趋势分析指标是平均指标,它是用于说明变量系列的一般水平指标,也是变量分布的基本特征值之一.(1)算术平均数(mean)表达式:69在公式中:-总体或样本的均值;xi-第各被调查单位的观察值,为总体或样本的单位总数。适用条件:
这一公式适合于在已知调查总体或样本的各单位观察值的情况下计算总体的均值。当调查总体或样本的各单位的具体观察值未知,但是知道变量的分布数列,这时可以用下列公式计算均值,加权平均值70公式中,m-分配数列中各组的组中值;f-各组的频数,k-数列的组数;-各组的频率。其中,各组频数f的大小对均值的计算结果具有重要影响,称为权数,而各组频率同样影响均值,故称为权重。加入权数或权重的均值成为加权算术平均数;组中值-分配数列中某一组变量值的中间水平的指标,闭口组-在既有上限又有下限的组,即闭口组中,组中值由上限值与下限值之和的一半计算,其计算公式为:71开口组只有上限或只有下限的中,一般假定开口组的组距与其相邻组的组距相等,因而可用下列公式计算组中值:72组中值应用举例2利用表1中的分配数列资料,计算50户被调查居民家庭的平均消费品支出额。解:首先计算由低组到高组的组中值,分别是(单位:元):1700、1900、2100、2300、2500、2700、2900、3100。其中,最大组为开口组,计算组中值为:
然后计算50户居民样本的消费品支出额的均值:73众数(Mode)
是总体资料中出现频数最多的数据表现。例如,在零售市场中,销售量最大的品牌、款式或花色即为众数。又如,研究某种商品的销售价格时,销售量最大的那种价位就是众数。74确定众数的方法:(1)编制单项式变量数列(对定量资料而言)或品质分配数列(对定性资料而言);(2)找出频数或频率最大的组,该组的变量值或标志表现即为众数。使用组距数列计算众数的方法是,首先找出频数或频率最大的组(称为众数组),然后按照下列公式计算:
公式中,L、U、d和f分别是众数组的下限值、上限值、极差和频数,和分别是与众数组下限相邻组的频数和与众数组上限相邻的组的频数。
75众数举例3试利用表1中的分配数列资料,计算50户被调查居民家庭消费品支出额的众数。解:从数列中可以得知消费品支出额为2200~2400元家庭组的频数(率)最大,为众数组。因此,以消费品支出额为2200~2400元家庭组的相应数据计算众数如下:
76
(3)中位数(Median)是指在数据中处于中等水平的数值。中位数确定方法:先在对数据进行大小排列中,中位数处于所有数据的中间位置,比其小者与比其大者的数量各占一半。注意:
由于中位数确定,将资料进行排序,所以只有定序、定距和定比数据能计算或确定中位数,而定类数据不能确定中位数。如果使用未分组的原始数据有n个,则(为奇数)或(为偶数)。77
如果使用分组资料,则首先计算累计频数,确定中位数组(即位次上的变量取值或品质表现所在的组),对单项式变量数列或定序数列的中位数则为中位数组的取值或品质表现;对组距数列,则按照如下公式计算:
公式中,L、U、d和分别是众数组的下限值、上限值、组中值和频数,和分别是中位数组下限的以下累计频率与中位数组上限的以上累计频数。
78中位数举例
利用表1中的分配数列资料,计算50户被调查居民家庭消费品支出额的中位数。解:计算以下累计频率(或以上累计频率,只要其一即可,见表1),并计算中位数的位次为50/2=25。显然,可以断定中位数应在消费品支出为2400~2600元的组内,即2400~2600组为中位数组,中位数计算如下:
79
分位数在研究市场调查资料的分布范围和分布结构等特征,尤其是在分析总体资料的“稳健性”和“抗耐性”的现代探索性数据分析中,计算和分析分位数是一种有效的工具。一般地,在对总体资料按照大小或优劣顺序进行排列的情况下,能够把全部资料等分为k个部分的资料称为分位数。显然,分位数共有k个。中位数是在分配数列中处于中等水平的代表值,能够把总体等分为两个部分,因此又称为二分位数或1/2分位数。除了二分位数以外,最常用的分位数有四分位数、十分位数和百分位数等。80分位数的计算步骤如下:第一步,对调查资料按照升序排列(变量值由小到大);第二步,计算各分位数的位次。对于容量为的数据资料,第p个分位数的位次
第三步,计算各分位数的值。如果i不是整数,则向上取整。用比i大的下一个整数代表第个分位数;如果是整数,则第个分位数是第项和第项数值的算术平均值。四分位数(quartiles)是能够将总体资料按照大小或优劣顺序等分为4个部分的资料。四分位数共有3个,分别记为Q1、Q2和Q3,它们各代表1/4分位数或下四分位数、中位数和3/4分位数或上四分位数。81分位数举例某行业业务经理每月起薪的抽样调查资料的排序如下:(单位:元)2710、2755、2850、2880、2800、2890、2920、2940、2950、3050、3130、3325显然,中位数=对于Q1
其位次为因为Q1
的位次是整数,因此它的值不能直接得出,需由第三项和第四项的平均值求得:82表我国1994-2001年社会商品零售额情况表单位:元年度19941995199619971998199920002001社会商品零售额16264.72062027447.127298.929152.131134.734152.637597.2二、动态市场调查资料分析
(一)时间序列的编制1.时间序列(timeseries)的概念时间序列又称为动态数列,是研究总体不同时间上的某一指标数量,按照所属时间的先后顺序进行排序所形成的序列。例如,按照我国社会商品零售额编制的时间序列如下表所示。时间序列有两个部分组成。一是时间,它反映总体指标数值的时间属性;二是指标数值,它反映总体在特定时间上研究指标的发展水平。
832.时间序列的编制原则时间序列适用于描述研究对象变化的全部过程,研究其发展速度和发展规律的基础,也是进行趋势预测的基本依据。因此,编制科学的时间序列对于市场研究与预测具有重要意义。编制时间序列的基本要求是要保持时间序列的可比性。主要表现在以下方面:(1)时间长短要一致时间序列的时间特征对指标的数值有着决定性的影响。因此,为了保证序列中的各指标能够正确地相互比较,要求时间长短具有一致性。一般地,对时期数列,要求各指标所属的时间短长度应相等;对时点数列,要求相邻两个指标的时间间隔应相等。84(2)研究总体的范围应一致由于事物的变化性,研究总体在较长的时间内其总体范围也可能发生变化。例如,地区行政区划的变更、企业合并或分立等。为了使变化了总体范围的指标仍具有可比性,必须对前后两种总体的范围按照某一基准进行调整,如依据现在的总体范围对历史总体范围的指标数值进行调整。(3)指标的经济内容应相同对同一名称的指标,经济内容也可能不同。例如,对价值指标,有的时期采用不变价格计算,有的时期采用市场价格计算;对果品收购量,有的采用干货量计算,有的采用鲜货量计算等等。如果发现经济内容不同的指标,必须进行一致性调整。(4)指标的计算口径、计量单位和计算方法应统一85(二)时间序列的分析1.动态水平分析对时间数列的动态水平分析,是通过计算动态水平指标进行分析的。动态水平指标主要有平均发展水平、增长量和平均增长量等。(1)平均发展水平平均发展水平是一个较长时期各发展水平时序平均数。由于时间序列不同种类的性质不同,平均发展水平的计算方法也有所不同。如果时间序列由时期指标构成,计算平均发展水平的公式如下:
式中,-平均发展水平,ai表示第i时期的发展水平,为n时间序列中时期的个数。
86利用表4.5中的资料,计算我国1994~2001年间年平均商品零售额。解:如果时间序列由时点指标构成,计算平均发展水平的公式如下:
87年度1994199519961997199819992000200120022003职工总人数788815842841748723718704694683计算平均发展水平举例某省1994年~2003年各年底的职工总人数的资料如表,试计算这十年内各年平均职工总人数。
88解:当时间数列由相对指标或平均指标构成,计算平均发展水平的公式如下:
式中,C-时间序列中的各相对指标或平均指标,a和b-派生出相对指标的分子指标和分母指标,、由a和b构成的与C序列相对应的序列的平均水平,它们的计算方法依据a和b的性质,可采用时期序列平均水平的计算公式或采用时点序列平均水平的计算公式。89(2)增长量和平均增长量
增长量:
是时间序列中两个不同时间下的发展水平的差额。其中,研究中作为考察对象的发展水平称为报告期水平,作为报告期的对比基础的发展水平称为基期水平。用公式表示为:增长量=报告期水平—基期水平在增长量中:(1)若基期水平固定不变,增长量的大小将取决于报告期水平的大小,这样的增长量称为累计增长量;(2)若基期水平变化,而且基期为报告期的前一期,这样的增长量称为逐期增长量。90年距增长量是把基期选定为与报告期属于同一季节的年或前几年的时期。对于明显受季节变动影响的时间序列,计算增长量时,应避免因在不同季节比较引起的歪曲事实的做法。此时,应把基期选定为与报告期属于同一季节的年或前几年的时期。
平均增长量是时间序列中逐期增长量的序时平均数,它表明研究总体在一定时间内平均每期增长(减少)的数量。用公式表示如下:平均增长量=∑逐期增长量/逐期增长量的个数91年度1997199819992000200120022003播种面积12276.7415267.0512695.9013136.9113127.7013359.8013684.4某省1997~2003年农产品播种总面积序列,试根据下表计算各年度农产品播种总面积的逐期增长量、累计增长量和年平均增长量。
表某省1997~2003年农产品播种面积情况表计量单位:千公顷计算增长量举例92解:各年逐期增长量与累计增长量见下表,
年度1997199819992000200120022003播种面积12276.7415267.0512695.9013136.9113127.7013359.8013684.4增长量逐期-290.3192.85477.01-9.21232.1324.6累计-290.31383.16860.17850.961083.061407.661998~2003年间平均年播种面积增长量933.动态速度分析动态速度分析主要是指:发展速度、增长速度、平均发展速度和平均增长速度等的分析。(1)发展速度是时间序列中两个不同时间下的发展水平的比值,表明研究对象在报告期水平已经发展到基期水平的几分之几或若干倍。用公式表示为:
发展速度=报告期水平/基期水平定基发展速度在发展速度中,当基期水平固定不变,发展速度的大小将取决于报告期水平的大小;环比发展速度当基期水平随着报告期水平的变化而变化,而且基期为报告期的前一期。
94年距发展速度把基期选定为与报告期属于同一季节的上年或前几年的时期。注意:
对于明显受季节变动影响的时间序列,计算发展速度时,应避免不同季节发展水平的比较。这时,应选用年距发展速度。(2)增长速度增长速度是报告期增长量与基期水平的比值,表明报告期水平比基期增长(或降低)了几分之几或若干倍。用公式表示为:
增长速度
=报告期增长量/基期水平
95增长速度,与发展速度相对应,也可以分为定基增长速度和环比增长速度以及年距增长速度等具体增长速度。各种增长速度的计算均可以通过发展速度来计算,公式为:
增长速度=发展速度—1
增长速度使用相对数的形式分析事物的增长情况,因而去掉了增长的绝对数量。所以,对增长速度的分析需要结合分析同期的增长量,进行相互补充。为此,可以通过计算和分析增长1%的绝对值达到这一目的。增长1%的绝对值计算公式为:96计算发展速度、增长速度举例我国1995~2000年煤炭消费总量资料如下表所示。试计算九五期间各年我国能源消费总量的发展速度、增长速度和增长1%的绝对值。年度199519961997199819992000煤炭消费总量(吨)
97857.30103794.1698525.5792020.9488480.9286126.3297年度199519961997199819992000煤炭消费总量(吨)
97857.30103794.1698525.5792020.9488480.9286126.32发展速度(%)
环比—106.0794.9293.4096.1597.34定基100106.07100.6894.0490.4288.01增长速度(%)
环比—6.07-5.08-6.60-3.85-2.66定基—6.070.68-5.96-9.38-11.99增长1%的绝对值
978.571037.94985.25920.21884.81861.26根据的计算公式,得我国能源消费总量的发展速度、增长速度和增长1%的绝对值,如下表:98(3)平均发展速度和平均增长速度平均发展速度是一定时期内时间序列的各期环比发展速度的序时平均数,平均发展速度的计算有一下两种方法:①当所关心的重点是时间序列最后一个时间的发展水平,而不在乎其它时间的发展水平的大小,由产量水平构成的时间序列。这样,在计算平均发展速度时采用几何平均法。计算公式为:
公式中,-连乘符号,n-参与运算的环比发展速度的个数。99②当所关心的是时间序列中每个时间上的发展水平及其总和,而不单单是最后一个时间上的发展水平,如由造林面积所构成的时间序列。这样,在计算平均发展速度时采用累计法,或称方程式法。如果用代表平均发展速度,则可以通过解如下高次方程求得:
公式中,n-计算平均发展速度的时期内所用的时间单位数,ai-第时间的发展水平,a0-固定的基期发展水平。
100为了研究和预测2000年以后年度我国煤炭消费总量,计算“九五”期间我国煤炭消费总量的年平均发展速度。解:按照研究的性质可判断采用几何法计算平均发展速度。
平均增长速度的计算方法是在计算出平均发展速度的基础上按照下列公式计算:平均增长速度=平均发展速度—1上例中,“九五”期间我国煤炭消费总量的年平均增长速度=97.48%—100%=-2.52%。计算平均发展速度举例101
二、相关关系分析
是指事物间存在着一定的联系,但这种联系不是一一对应的确定性数量关系。例如,商品的价格与商品的市场需求量存在着一定的数量关系,但是每一价格并不对应有一个特定的该商品的市场需求量。这是因为,影响价格变动的因素除了商品的市场需求量以外,还受到其他许多因素的共同影响。市场活动结果的形成因素是十分复杂的,因而研究相关关系,进行相关分析,在进行市场调查资料分析中具有广泛的应用价值。进行相关关系分析的基本方法是画出散点图、计算相关系数,并对结果进行分析和解释。102(一)散点图(scatterdiagram)是用于描述两个变量之间的相关关系的图形,通过散点图可以直观地看出变量之间的关系、联系程度。例如,一个音像商店调查了在过去三个月内的连续10次利用周末电视广告进行促销的资料如下表:周次12345678910广告播出次数2513415342商店销售额(万元)50574154543863485946103根据上述资料,以广告播次数为横轴,以商店销售额为纵轴,形成的散点图,如图。从图上可看出,商店电视广告播次数的多少与商店销售额存在明显的正线性相关性。即随着广告播次数增多商店的销售额呈线性增大关系。104(二)相关系数(correlationcoefficient)
相关图能定性、直观地反映两个变量的相关方向和程度,但是却无法对相关的程度进行精确测度。为此需要用相关系数进行定量的相关分析。对于两个变量的线性相关关系研究,计算公式如下:
式中,r-相关系数,xi和yi分别表示第i对变量x和变量y的值,和分别表示变量x和变量y两个序列的均值。
r取值范围(-1,+1)。1.当r为正值,表明两变量是直线正相关关系,即两变量变化的数量方向相同;105
2.当r为负值,表明两变量是直线负相关关系,即两变量变化的数量方向相反;
3.r=0,表明两变量是直线不相关,即两变量变化没有规律可循;
4.r=1,表明两变量是直线完全相关,即两变量变化的数量间具有完全确定的函数关系。利用上表中的数据研究广告播出次数与商店销售额之间的皮尔逊积矩相关系数为+0.9305。表明两变量具有高度的正直线相关性。
106等级相关系数(Spearmanrank-correlationcoefficient)当测定两个定序变量的等级相关系数,其计算公式为:
公式中,n-总体划分的等级数,di-第单位两种不同排序结果的等级之差。用等级相关系数判断相关关系的方向和等级的标准与用相关系数的判断标准基本相同。区别主要是等级相关系数总是取得正值。
107某省18个地区市场水平按照人均GDP排序位次与按照17个指标组成的指标体系综合排序的位次见表4-11。试计算这两种排序结果的相关系数。
表4-11人均GDP法与综合法对某省各地区市场水平排位比较表地区ABCDEFGHHJPKLMNOPQR人均GDP113510148114976312151716182综合得分113598674111012314151718162计算相关系数举例108解:首先计算18个地区用两种评价法排序的等级之差的绝对值,由A地区到R地区分别是:0、0、0、1、6、2、3、0、2、3、6、0、2、0、0、2、2和0。代入公式计算如下:计算结果表明,两种评价结果具有高度的相关性。因而,可以简单地利用人均GDP对各地区市场水平进行排序研究。109厦门市小灵通市场调查报告一、厦门市小灵通市场调查概述
对厦门市常住居民的小灵通用户和潜在的小灵通用户进行调查,了解厦门市居民使用的小灵通的目的、使用状况和评价,把握厦门市小灵通市场未来近2~3年的市场潜力;为厦门市电信公司进一步扩大市场份额、进行网络布点和预测投资前景,提供客观、公正、科学的决策依据。本次调查采用电话问卷访问的方式,访问小灵通用户和固定电话用户(住家)。由于小灵通和固定电话都是单项收费,被访问者比较容易接受。案例110(1)对住家的调查,根据2001年厦门黄页按照等距方法进行抽样,抽取4000个样本。(2)由于没有厦门小灵通黄页,只能假设小灵通用户的调查范围。厦门市小灵通都是以8开头的7位号码,目前十几万用户号码集中在88和89号码的开头的号码内,以此为总体(厦门市小灵通扩张速度达每月1万户,难以确定真实的总体大小),从中抽取n=3000个样本。通过调查后得到有效样本分配见如下表:项目小灵通抽样小灵通用户(有效样本)住家抽样住家数量(户)3000208140002866此次调查从设计调查方案问卷,到人员培训、实地访问、数据汇总、统计分析,历时四个月时间。由于是进行电话调查,考虑到被调查者所处的环境可能比较111复杂,因此将问卷设计得尽可能简单和亲善,使之易于操作和消除被访问者的顾虑。在培训中,我们列出了各种可能遇到的情况及对策,并适当延长调查周期,以保证电话访问的质量。二、市场调查报告小灵通是个年轻而富于挑战性的市场,小灵通凭借其通话费用低、单向收费、机身重量轻、发射功率低、绿色环保等优点,在厦门一经面世就迅速发展,使传统移动通讯服务提供商移动和联通受到冲击,但移动、联通拥有大部分市(一)厦门市小灵通市场调查主要结果分析:(一)厦门市小灵通市场调查主要结果分析
1.小灵通需求的决定因素是通话资费便宜
被调查者购买小灵通或将要购买小灵通的原因是:112认为小灵通通话资费便宜最重要,占93.21%;通讯联系方便其次,占50.68%;认为工作和业务需要的占18.21%。其中第二、第三个原因也是GSM手机所具有的功能,因此通话资费便宜是消费者购买小灵通的决定因素。
2.被调查者家中拥有小灵通数量的情况
被调查者家中拥有1部小灵通的占47.90%,拥有2部小灵通的占41.83%。说明厦门的收入水平可使多数家庭有能力拥有一部甚至更多部小灵通,厦门市小灵通的市场潜力巨大。
3.小灵通的价格弹性
假设小灵通月租由18元提高到25元,通话资费由每分钟0.10元提高到0.16元,被调查住家中还会继续选择小灵通的占30.53%;可能会也可能不会的占30.53%;不会的占30.68%。113被调查的小灵通用户中这三个比例分别为23.04%、40.08%、31.20%。假设小灵通的月租费占每月总通话费用的1/2,可能会也可能不会继续选择小灵通的用户中有50%仍选择小灵通;假设消费者的收入和需求不变,则可以得到住家调查对小灵通的价格弹性为0.929;用户调查对小灵通的价格弹性为1.036。
通过简单假设计算两个小灵通的自价格弹性结果都约等于此价格调整对小灵通的总收入影响不大。4.小灵通的交叉价格弹性如果有一天移动和联通的手机月租费和通话费,降低到当前小灵通月租费和通话费的两倍的价格,被调查者会继续选择小灵通的占13.01%;可能会也可能不会的占38.56%;不会的占41.11%。沿用上面假设,则粗略地估计,小灵通相对价格弹性为1.55,这说明114如果移动和联通适当降低价格可以从小灵通用户中夺回部分客户,增加总收入。5.“双轨族”的数量
被调查者购买了小灵通以后,还继续使用过移动或联通的手机占60.08%;没有的占39.02%。以这个比例估计厦门市现有十几万小灵通用户,则双轨族的规模庞大,也可以发现有好几万用户放弃了移动或联通,这说明小灵通实实在在地冲击了传统的移动通讯市场。而这些双轨族基本上是把手机当传呼,有电话来就用小灵通回,因此只会增加小灵通的收入。
6.小灵通目前存在的主要问题
被调查者认为小灵通存在的主要问题是:通常没有信号,占85.40%;常常掉话,占41.58%;通话质量差,占26.06%。信号质量不够理想,是消费者购买小115灵通时最大的顾虑,也是它无法与移动、联通正面交锋的根本原因。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 燃气工程监理工程师招聘合同
- 销售薪酬激励与团队建设
- 电梯设备非招投标采购管理流程
- 水利工程审计招投标规定
- 工程付款3331合同模板
- 集团公司人才流动风险控制
- 新人开店铺租房合同范例
- 旅游摄影合同模板
- 智能机人配送承包合同范本
- 散装酒销售合同模板
- 团播主持人协议
- 《急救药品》课件
- 重症医学科品管圈PDCA案例四例
- 社会医学教学设计案例
- 上海率先实现全面智慧交通系统
- 第12课+明朝的兴亡(教学设计)【中职专用】《中国历史》(高教版2023基础模块)
- 大学英语四级试卷和答案-专四阅读
- 公司廉洁自律管理制度
- 企业节能减排培训
- 通过《西游记》了解中国传统的道德观念
- 2024年中国华能集团招聘笔试参考题库含答案解析
评论
0/150
提交评论