市场调查与预测资料分析及报告撰写_第1页
市场调查与预测资料分析及报告撰写_第2页
市场调查与预测资料分析及报告撰写_第3页
市场调查与预测资料分析及报告撰写_第4页
市场调查与预测资料分析及报告撰写_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1市场调查预测与决策市场调查预测与决策2引导案例引导案例 某地区的一个调研人员为一家最大的糖果制造商精心准备了长达250页的市场调查报告(包括图表和统计数据)。在经历了大约6个月左右的艰苦调研后,他直接向公司3名最高决策者做了口头汇报。他信心百倍,自以为他的报告中有许多重大发现,包括若干个可开发的新细分市场和若干条产品理念方面的创新。 然而,在听了一个小时的充满事实、数据与图表的汇报后,糖果公司的总经理站起来说道:“打住吧,伙伴!我听了一个多小时枯燥无聊的数字,完全给搞糊涂了,我想我并不需要一份比字典还厚得多的报告。明天早晨8点以前务必把一份5页纸的摘要放到我办公桌上。”说完就离开了房间。在此

2、,这个调研人员遇到了将使他受益整个职业生涯的一个教训。3市场调查资料的整理与分析市场调查资料的整理与分析 第一节第一节 资料整理资料整理 第二节第二节 资料分析资料分析 第三节第三节 市场调查与预测报告的撰写市场调查与预测报告的撰写4第一节第一节 资料整理资料整理 市场调查资料整理是对市场调查获得的信息进市场调查资料整理是对市场调查获得的信息进行初加工,为分析研究准备数据。节主要阐述行初加工,为分析研究准备数据。节主要阐述市场调查资料加工整理的基本知识和基本方法市场调查资料加工整理的基本知识和基本方法, ,主要包括审核、分类、编码、汇总、列表、图主要包括审核、分类、编码、汇总、列表、图示等资料

3、整理的技术性知识。示等资料整理的技术性知识。5 一、资料整理的含义一、资料整理的含义 市场调查资料整理是根据市场分析研究的需要,对市场调查获得的大量的原始资料进行审核,分组、汇总、列表,或对二手资料进行再加工的工作过程。其任务在于使市场调查资料综合化、系列化、层次化,为揭示和描述调查现象的特征、问题和原因提供初步加工的信息,为进一步的分析研究准备数据。6 二 市场调查资料整理的内容 1.数据确认:是指对原始数据或二手资料进行审核,查找问题、采取补救措施、确保数据质量。 2数据处理:是指对问卷或调查表提供的原始数据进行分类和汇总,或者对二手数据进行再分类和调整。 3数据陈示:是指对加工整理后的数

4、据用统计表、统计图、数据库、数据报告等形式表现出来。7 三 资料整理的程序 8 (一)(一) 原始资料的审核原始资料的审核 1 审核的内容 (1)齐备性。检查收回的问卷的份数是否齐全,是否达到了样本量的要求。 (2)完整性。检查问卷填答的项目是否完整。并作出处理。 大量问项无回答应作废卷处理。 个别问项个别无回答,归入“暂未决定”或“其他答案”中。 个别问项大量无回答,可作删除此项提问。 (3)准确性。检查问卷或调查表中的项目是否存在填答错误。 逻辑性错误答案,用电话核实或按“不详值”对待; 答非所问的答案,用电话询问或按“不详值”对待; 乏兴回答答案,若个别问卷则抛弃,若同一问题有不少问卷乏

5、兴回答可作子样本看待。 (4)时效性。检查调查访问时间和数据的时效性。 若延迟访问对调查结果无影响,则问卷有效;若延迟访有影响,则废弃此问卷 (5)真伪性。检验问卷或调查表的真实性。抽样复检访问员是否到访,若访问员伪造问卷应作废弃处理,并重新派员重访。9 2 审核的作业方式 实行一卷或一表从头审到尾,有利于贯彻审核的一致性原则和明确审核员的责任,而分段作业和分段审核,容易产生责任不清的问题。 3 审核的办法 (1)逻辑审核。利用逻辑和经验判断的方法,检查问卷或调查表中的填答项目是否合理,项目之间有无相互矛盾的地方,有无不应有的空白,有没有不合理的填答,有没有泛兴填答、答非所问或部分项目不回答等

6、。 (2)计算审核。计算审核主要是对数据进行计算性的检查,如分量相加是否等于小计,小计相加是否等于合计,数据之间该平衡的是否平衡,各项数据在计算方法、计算口径、计量单位、时间属性等方面是否有误等。10 判断异常数据的方法可以凭借审核人员的工作经验与实践用进行,也可以用方法进行。 是利用正态分布确定数据允许在合理范围,超出该范围的数据视为异常数据。 数据合理允许范围可用下列式子表示:.,)()(样本的标准差样本的序列数据均值数据允许的上限和下限下上下上SYYKSYY11 由下表查得,它由n、P 和P 三个参数决定:n为样本单位数;P1为置信度,通常采用0.95和0.99;P2为数据落在区间内 的

7、概率。),(KSYKSY P0.950.990.990.9990.990.999101520253035404550604.433.883.613.463.353.273.213.163.133.075.654.954.614.414.284.184.104.043.993.925.594.604.163.903.733.613.523.443.383.297.135.885.314.994.774.614.494.404.324.21PKn12 某地区连续30年降雨量资料分别为:(单位:mm) 1243 1236 1230 1240 1251 1266 1273 1252 1301 1274

8、 1245 1275 1264 1282 1310 1304 1323 1352 1628 1350 1347 1328 1326 1333 1371 1344 1320 1383 1383 1360 现要求按95%的可靠度,使99%的数据落在允许的范围内,试找出异常数据。n=30, =1330,S=123,P1=0.95,P2=0.99,查表得 K=3.35,Y95.91712335. 3133005.174212335. 31330KSYYKSYY下上则正常数据的区间为(917.95-1742.05),可知1845为异常。13 对异常数据的处理,通常要在定性分析的基础上,结合序列数据的具体

9、情况采用不同的方法加工处理。常用的方法有: 当非时间序列数据较多,对不合理的异常数据可以剔除掉. 当时间序列数据较少时,剔除掉不合理的异常数据后可根据序列散点图所显示的数据变化趋势,用相应的方法补齐所缺数据,具体做法如下:14(1)当散点图趋势时,异常数据可用算术平均代替。(2)当散点图呈趋势时,异常数据可用其前后的算术平均代替。(3)当散点图呈趋势时,异常数据可用前后两数据的几何平均代替。 有些序列数据虽然异常,但经过分析后,这些数据能够反映调查对象的未来发展趋势,如行政区变更(指标计算口径、计算方法、计量单位变更、市场开放与保护等变更引起的近期数据跳跃性波动等)。显然,这种异常数据非但不能

10、被剔除,还必须作为基础数据,并以此数据的口径来调整其他历史数据,形成新的序列数据。15某地区各年度水泥销售量如下表 单位:万元年份1998199920002001200220032004调整前某地销售量某县销售量调整后某地销售量11521136113221331172314012526151130281582919230198 从上表可以算出,在调整前某地销售量自2003年后的销售量出现了跳跃性的增加,为异常数据.经过调查了解到,从2003年起,该地区行政划分发生了变化,增加了一个县.故2003、2004年的数据是正常的,应保留。16 在调查数据较少,残缺数据不止一个,或有连续若干个异常数据或

11、数据空缺时,不能简单剔除残缺数据,可用均值替代法、回归估计法、随机抽取法、近距离确定法等修补残缺数据。 是使用变量的平均值替代其中某些异常值或缺失值。这种修补法的优点是能保持变量均值不变,变量的其他统计量(如标准差、相关系数)因此受到的影响也较小。 回归插值法是根据现有的数据,分析该变量与其他变量之间的联系,建立回归模型,然后根据被调查者对其他变量的回答,估计残缺资料的取值。17 (二) 原始资料的分组处理 1 简单分组处理 是指对总体各单位或样本各单位只按一个标志或标准进行分组处理。分组的标志或标准一般可以区分为品质属性、数量属性、时间属性、空间属性四类。 例如:某市组织了一次样本量为200

12、0户的居民家庭空调满意度和购买行为的市场调查,设计的问项是36个,其中基本项目9项,主体项目27项。18 1) 品质属性分布数列 是以被调查者的职业、所属行业、性别、文化程度、职业等品质属性作为分组标志而形成的简单品质数列。如表1 表1 某市居民家庭空调拥有量品牌分布 2)数量属性分布数列 是以被调查者的年龄、收入、消费支出、家庭人口、就业人口等数量属性作为分组标志形成的变量数列。有如下两种形式: (1)单项式变量数列。适应于离散型变量(如家庭人口、就业人口、耐用品拥有量、需求量等)的分组处理,即直接以变量的不同取值作组别而编制的变量数列。如表6-2。19(2)组距式变量数列。适应于连续变量(

13、如年龄、收入、消费支出等)的分组处理,即以变量的不同取值区间作为分组的组别而编制的变量数列,如表320 是将变量值按照数值大小依次划分为几个区间,每一个区间内的所有变量值归为一个组。 上限和下限统称为组限。 各组区间的距离称为组距。 例如,上述温饱家庭组的恩格尔系数50%和60%分别是该组的下限和上限,组距为10%。 21 在组距式分组中,相邻组的组限不重叠的分组称为间断组距分组。 例如,儿童按年龄分组分为:不满1岁、12岁、34岁、59岁、1014岁。 对于离散型变量的取值是不连续的分组,也可采用间断组距分组。 例如,对企业数、员工人数、设备台数等用实物单位计量的变量均可用间断组距分组。 在

14、组距式分组中,相邻组的组限重叠,即上一组的上限为下一组的下限,两组共用同一个组限对两相邻组进行连接,这样的分组称为连续组距分组。 22 例如,家庭按人均居住面积分组分为:4平方米以下、414平方米、14平方米以上。 连续组距分组采用组限重叠方式,对某一单位取值正好等于组限时,可能同时划归两个组。 例如,上述家庭按人均居住面积分组中遇到的恰好人均面积是4或14平方米的家庭,将有两种分组方法,。为了保证在组限确定后分组结果的唯一性,需要遵守所谓“”的原则。 例如,上述人均居住面积恰好为4的家庭应归入414平方米的一组,恰好为14的家庭应归入14平方米以上的一组。 23 是资料分组中各组的组距都保持

15、相等。其优点很多,它便于进行计算,也便于绘制统计图,进行各组之间的比较和分析。当调查所得到的变量值的变动比较均匀的情况下,均可采用等距分组法进行分组。 例如,对员工的工资、工龄分组;对单位营业面积销售额、单位产品成本分组等。 在等距分组中,分组的数量(n)即组数与组距(d)的乘积等于最大变量值与最小变量值的差额即全距(R)。用公式表示为: R=n.d 在R一定时,等距分组只要确定了n或d,以及最小组的下限或最大组的上限,采用连续组距分组便可把分组中各组的组限确定下来。24是资料分组中各组的 变量值分布不均匀。 例如社会成员的收入分配;变量值相等的量具有不同的意义的场合, 又如对婴幼儿按年龄分组

16、;变量值按一定比例增减变化的场合。 异距分组的方法没有固定的模式可循,全凭资料整理人员在实践中不断摸索。关键在于研究人员对所研究现象的本质特征和内在联系十分熟悉,才能运用好异距分组揭示研究对象的本质。 资料分组按照所用的分组标志的多少及组合形式的不同,可以分为简单分组、复合分组和分组体系。 25 当研究目的,可采用简单分组。 中所使用的分组标志只有一个。 例如,家庭按人均居住面积分组分为:4平方米以下、414平方米、14平方米以上进行分组。 当研究目的就需要采用复合分组。 是将两个或两个以上分组标志相结合进行的资料分组,即首先按照一个标志分组,然后在已划分的各组内按照另一个分组标志或几个分组标

17、志再进行细分组。 26 例如,对居民家庭首先按照居住地的性质分为城市家庭和农村家庭2组,再把城市家庭和农村家庭分别按照人均居住面积分为4平方米以下、414平方米、14平方米以上3组,形成2个粗分组和6个细分组,共8个组。分组结果见下下表所示: 用复合分组时,分组单位一般不超过两个,否则分组的结果将显得的杂乱不清。 人均居住4平方米以下 人均居住414平方米 人均居住14平方米 人均居住4平方米以下 人均居住414平方米 人均居住14平方米以上27 分组的方法,目的在于从不同角度、不同方面对同一研究对象进行分项说明,使人们对研究对象有一个全面的认识。 分组可采用一系列相互联系、相互补充的并列分组

18、标志对研究对象进行分类,如采用罗列式分组,因而各个分组之间不存在交叉层叠,随着分组标志数量增加分组的表现效果会更好。例如,对居民家庭的分组体系可以表示如下: 城市家庭4平方米以下414平方米1人 2人 农村家庭 4平方米以下 14平方米以上 3人 3人以上 28 组数或组距的确定并无规律可言,须凭经验和研究问题的性质作出正确的判断。美国学者斯特杰斯(HASturges)提出了一个经验公式.,可供我们在进行等距分组时参考: 式中,研究总体( N )的单位数或变量的总个数。该公示要灵活运用,不能生搬硬套。NRdlg3 . 3129 3 3)时间属性分布数列)时间属性分布数列 是以调查问卷中的一些时

19、间属性的调查项目(如购买时间、需求时间)作是以调查问卷中的一些时间属性的调查项目(如购买时间、需求时间)作为分组标志,对被调查者的时间选项进行分组而形成的时间数列。如表为分组标志,对被调查者的时间选项进行分组而形成的时间数列。如表4 4 4 4)空间属性分布数列)空间属性分布数列 是以调查问卷中的某些具有空间属性的调查项目(如被调查者的居住区域、是以调查问卷中的某些具有空间属性的调查项目(如被调查者的居住区域、购买产品的场所等)作为分组标志而形成的空间数列。如表购买产品的场所等)作为分组标志而形成的空间数列。如表5 5。30 2 平行分组处理 平行分组处理是对总体各单位或样本各单位同时采用两个

20、或两个以上的标志或标准进行平行排列的分组,所编制的分组数列称为平行分组数列。 (1)两变量(项目)平行分组数列。它是将两个有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。如表6。31 (2)多变量(多项目)平行分组数列。这是将两个以上有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。常用于产品或服务满意度测评、被调查者态度测量等原始资料的加工开发。如表7。32 3 交叉分组处理 交叉分组处理是对总体各单位或样本各单位采用两个或两个以上的标志或调查项目进行交叉分组,所编制的数列一般表现为相关分组数列或复合分组数列。 (1)基本项目之间的交叉分组处理。它是利用

21、反映被调查者基本情况的基本调查项目之间的关联性进行交叉分组处理。如表633 (2)基本项目与主体项目之间的交叉分组处理。它是利用问卷中的基本项目与主体项目之间的关联性进行交叉分组处理,用以揭示不同性别、不同年龄、不同行业、不同职业、不同文化程度、不同居住区域、不同家庭人口的被调查者对研究的主体项目选项回答的差异性、相关性等深层次问题。如表9两变量交叉列表。34 (3)三变量交叉列表。如表10。 35小汽车驾驶者的事故比率驾驶者百分比从未在驾驶时出过事故62%在驾驶时至少出过一次事故38%被调查者总数1403036 男性女性从未在驾驶时出过事故56%68%在驾驶时至少出过一次事故44%32%被调

22、查者总数7080695037大于10 000小于10 000大于10 000小于10 000至少出过一次事故52%25%52%25%被调查总数5010207019155035男性驾驶英里数女性驾驶英里数38双变量交差列表分析法双变量交差列表分析法 按按经营年限计算的经营经营业务计算速度经营年限计算的经营经营业务计算速度业务增长小于6年6年12年12年以上增长慢46.40%39.10%67.10%增长快53.60%60.90%32.90%列总数100%100%100%经营年限39业务增长小于6年6年12年12年以上增长慢33.60%25.40%41.00%增长快39.10%40.10%20.50

23、%经营年限40 4开发式问题的分类归纳 “意见分类归纳法”的基本思路和程序。 (1)集中所有同一个开放式问题的全部文字性答案,通过阅读、思考和分析,把握被调查者的思想认识。 (2)将被调查者的全部文字性答案,按照其思想认识不同归纳为若干类型,并计算各种类型出现的频数;制成全部答案分布表。 (3)对全部答案分布表中的答案进行挑选归并,确定可以接受的分组数。一般来说,应在符合调研项目的前提下,保留频数多的答案,然后把频数很少的答案尽可能归并到含义相近的组,应考虑调研的目的和答案类型的多少而确定,一般应控制在10组之内。 (4)为确定的分组,选择正式的描述词汇或短语。不同组别的描述词汇或短语应体现质

24、的差别,力求中肯、精炼、概括。 (5)根据分类归纳的结果,制成正式的答案分布表。41 例如,在一项关于居民空调购买行为的调研中,问卷 中,设置了“你对静音空调这个产品概念有何看法?”的开放 式问项,被调查者的回答是多种多样的,通过分类归纳得到 的答案分布表如表11。 42 是把审核、清洁的有效市场调查资料,按照资料分组的方案进行汇总求得各个有关变量的各组数量总和或各组单位数,以及总体变量总和与总体单位数的资料整理过程。资料汇总的方法有手工汇总法和计算机汇总法两种: 是借助于算盘或计算器进行调查资料的汇总的一种整理方法。手工汇总的主要方法有划记法、过录法、折叠法和卡片法等。 是在汇总表上划上易于

25、计数的符号,如“正”号等进行计数汇总。此法简单易行,主要适用于对定类资料和定序资料的汇总。43 是事先将各单位的实际资料过录到预先准备好的表格上,进行加总计算,然后把计算结果填入正式的汇总表。此汇总法主要适用于对和资料的汇总。 当需要整理的调查表格不太多时,可将所有调查表中需要汇总的项目和数值折叠在一边,一张张重叠起来,进行汇总计算。 当总体单位多、复合分组多时,先使用卡片法进行手工汇总。44 计算机具有存储量大、运算速度快、准确度高的特点,因此, 使用计算机汇总的方法主要有以下几个部分内容组成: 根据资料汇总的设计方案,编写适用于本汇总方案内容要求的计算机处理程序。包括资料审核与修补程序、资

26、料分组程序、汇总程序和图表制作及打印等程序。 是把市场调查问卷或调查表的信息转化成统一设计的计算机可识别的代码,以便对其进行资料整理和分析。数据编码,一般采用。45 是把编码后的市场调查资料和实际数字通过录入设备(键盘、扫描仪、光标阅读器等)记载到计算机的存储设备(硬盘、软磁盘、光盘等),以备计算机随时调用。 是计算机的逻辑检查,是按照程序中事先规定的逻辑检查规则对输入计算机的原始资料进行逻辑计算,将误差超过允许范围的资料退回修正。 所有录入资料经过逻辑检查之后,由计算机按照事先规定的汇总表和汇总层次进行统计制表或制图,并通过输出设备打印出结果。 46 (四) 市场调查资料陈示 1 1 统计表

27、统计表 统计表是以纵横交叉的线条所绘制表格来陈示数据的一种形式。用统计表陈示数据资料有两大优点:一是能有条理地、系统地排列数据,使人们阅读时一目了然,印象深刻,二是能合理地、科学地组织数据,便于人们阅读时对照比较。 统计表从形式上看,是由总标题、横行标题、纵栏标题、指标数值四个部分构成。 从内容上看,由主词或宾词两大部分构成。主词是统计表所要说明的总体的各个构成部分或组别的名称,列在横行标题的位置。宾词是统计表所要说明的统计指标或变量的名称和数值,宾词中的指标名称列在纵栏标题的位置。有时为了编排的合理和使用的方便,主词和宾词的位置可以互换。472 2 统计图统计图 统计图是以圆点的多少、直线长

28、短、曲线起伏、条形长短、柱状高低、圆饼面积、体积大小、实物形象大小或多少、地图分布等图形来陈示调研数据。 用统计图陈示调研数据具有“一图抵千字”的表达效果,因为图形能给人以深刻而明确的印象,能揭示现象发展变化的结构、趋势、相互关系和变化规律、便利表达、宣传、讲演、广告和辅助统计分析。但统计图能包含的统计项目较少,且只能显示出调查数据的概数,故统计图常配合统计表、调研报告使用。 1直线图 直线图是以直线的长短来表示品质属性数列中各组频数或频率大小的图形。常以横轴代表品质属性的不同组别,纵轴代表各组的频数或频率。48 2条形图 是以若干等宽平行长条或圆柱的长短来表示品质属性数列中各组频数或频率大小

29、的图形。常以横轴代表不同的组别,纵横代表各组的频数或频率; 亦可用纵轴代表各组,横轴代表频数或频率。 图6-5 消费者对变频空调的看法 49 3圆面图 是以圆形的面积代表总体指标数值,圆形的各扇形面积代表各组指标数值,或将圆形面积分为若干角度不同的扇形,分别代表各组的频率。实际应用时亦可将圆面改为圆饼或圆台,变成圆形立体图。50 4环形图 环形图是将总体或样本中的每一部分数据用环形中的一段 表示。环形图亦可同时绘制多个总体或样本的数据系列。每 一个总体或样本的数据系列为一个环。51 5直方图 直方图是以若干等宽的直方长条的长短来表示各组的频数或频率的大小。常用于表现组距数列的次数分布或频率分布

30、。离散型变量组距的直方图中的长条应间断,连续变量组距数列的直方图中的长条应连接起来。52 6动态条形图 动态条形图是以宽度相等的条形的长短或高低来比较不同时期的统计数据的大小的图形,用以显示现象发展变化的过程和趋势。动态条形排列可以是纵列(垂直条形图),也可以是横列(水平或带状条形图),按图形中涉及的统计指标或变量的多少不同,可分为单式条形图、复式条形图、分段条形图等。53 7动态曲线图 动态曲线图又称时间数列曲线图或历史曲线图,它是以曲线的升降、起伏来表示数据的动态变化。按涉及指标的多少,有单式曲线图和复式曲线图之分。54 8相关散点图 相关散点图主要用于显示因变量(y)与自变量(x)之间是

31、否具有相关关系,以及相关关系的形式是直线相关还是曲线相关,是正相关还是负相关。通常以横轴代表自变量(x),纵轴代表因变量(y)。55 9统计地图 统计地图是以地图为底本,利用点、线条、面积、数据、象形、标志等来表现各区域某种统计指标数据的大小及其在地理上的分布情形,又称空间数列图。根据所利用的图形不同,统计地图可分为数据地图、点地图、面地图、象形地图、线路地图、标志地图等等。图6-13是某市居民购房的区域选择分布地图。56 10茎叶图 茎叶图又称枝叶图,是一种将数据与图形结合使用的表现数据的方式。特别适合于描述变量数列的次数分配。由茎和叶两部分构成,茎一般为十位或百位数,叶为个位数,因而图形是

32、由数字组成的茎叶图类似于横置的直方图,同时保留了原始数据的信息。图14是某厂40个客户产品订购量(台)分布茎叶图。57 11帕累托图 帕累托图主要用来描述财富分配、库存物资、客户分布、产品销售等分布不均匀的现象。一般是将所研究的现象分为ABC三类,A类的单位数占10-20%,而指标值占70-80%;B类的单位数占20-25%,而指标值占15-20%,C类单位数占60-65%,而指标值5-10%。然后依然累计频率进行制图。 图15 某厂产品销售客户ABC分类图 58 市场调查资料的分析可分为静态分析和动态分析 。是指分析资料的所属时间均属于同一个时间属性,资料的数值变化是由于时间以外的其他因素,

33、主要是调查单位不同而引起的。是指分析资料是同一调查对象不同时间上的指标数量的分析。两种资料的性质不同,分析方法也有所不同,需要分别加以介绍。 59 是在对特定时间上的资料进行分组的基础上,对调查总体中的各单位进行归组和计数,从而形成各组之间单位分布状况的数列。分配数列有两部分构成,总体按某一标志所分的组,单位在各组中出现的次数(频数)。 通过分配数列,可以分析研究总体的内部结构,各部分的比例关系以及变量的分布类型等. 需要借助于各组的频数和频率进行分析.频率的计算公式如下:频数频数总体单位数频数频率60 为了分析的需要,可计算累计频数和累计频率。(或频率),又分为顺累计 和倒累计 两种不同的累

34、计。 当从变量值低的组向变量值高的组的方向累计,此时每一组的累计频数或累计频率表示该组上限以下的频数或频率之和; 当从变量值高的组向变量值低的组的方向累计,此时每一组的累计频数或累计频率表示该组下限以上的频数或频率之和。 61 对某市50户居民抽样调查得到的消费品支出资料如下:(单位元) 1660 1760 2460 2200 2360 3160 2420 2920 2340 2160 2100 2200 2140 2740 2400 3260 2500 2720 2540 2840 2360 2060 2740 2300 2820 2340 2460 2530 2760 3020 2020

35、1720 1620 2260 2280 2380 2520 2700 1860 2840 2160 2020 2100 2500 2320 2640 2760 2620 2540 2500 对以上调查资料采用等距分8组,组距200元,编制组距数列、频数、频率、以上累计和一下累计如下表1: 62某市50户居民消费品支出情况分布 表1按户消费支出分组(元) 频数(户) 频率(%)1600-18001800-20002000-22002200-24002400-26002600-28002800-30003000以上4181211833821624221666合计5010063按户消费支出分组(元)

36、累计频数(户)累计频率(%)以下累计以上累计以下累计以上累计1600-18001800-20002000-22002200-24002400-26002600-28002800-30003000以上451325364447505045443725146381026507288941001009088745028126某市50户居民消费品支出情况分布表2 表2 数据表明,每户月消费品支出在2000元以下的仅有5户,占总户数的10%;每户月消费品支出在2800元以上的也有6户,占总户数的12%;每户月消费品支出在2600元以下的有36户,占总户数的72%;每户月消费品支出在2600元以上的有14户

37、,占总户数的28%。 64 对研究总体的各组成部分的比例关系分析,是通过计算各组间比例指标进行的。两组间比例的计算公式如下:乙组的频率甲组的频率乙组的频数甲组的频数甲组与乙组的比例 在表1中的数据表明,月消费品支出16001800元组的户数是月消费品支出18002000元组的户数的4倍;月消费品支出28003000元组的户数是月消费品支出24002600元组的户数的1/4;等等。 65在例1中: 若月消费品支出16001800元组的4户居民的当月购买力为10000元; 月消费品支出22002400元组的12户居民的购买力为26000元,50户居民当月的总购买力为130000元; 则月消费品支出

38、16001800元组的5户居民的购买力占全部调查的50户居民总购买力的7.7%,月消费品支出22002400元组的10户居民的购买力占全部调查的50户居民总购买力的20%,月消费品支出16001800元组的4户居民的购买力仅为月消费品支出22002400元组的12户居民的购买力的38.5%。 66 大致有:钟型、U型和J型有以下三类: “两头大,中间小”,愈靠近中间的变量值分布的频数愈多,愈靠近两边的变量值分布的频数愈少,其形状犹如一口古钟。 愈靠近中间变量值分布的频率愈少,愈靠近两边变量值分布的频率愈多,呈“中间小,两头大”的形状。 随着变量值增加,它所分布的频数渐次增加或渐次减少的分布。

39、对变量分布类型分析还可转化为直方图、折线图的形式进行分析来判断变量的分布类型。67 在例1中,通过编制的分配数列,以各组变量作为横坐标,以各组对应的频数或频率作为纵坐标,在直角坐标上表示出各组变量值与对应的频数或频率的直方图。把直方图上的各个矩形的上边线中点相连,形成表示变量值变化与频数或频率变化的对应关系的折线图。见图1和图2。 图 50户居民消费品支出分布图024681012141618 1820 2022 2224 2426 2628 2830 30以上消费品支出(百元)家庭数(户)051015202530频率( %)68图2 50户居民消费品支出分布折线图051015202530123

40、45678消费品支出(百元)家庭数(户)69 直观的分析变量分布类型,只是对变量的分布形状有一个基本的认识.如果从数量上对变量的分布特征进行精确的分析,需要计算有关变量分布的统计指标,常用的统计指标如下: 变量分布的集中趋势分析指标是平均指标,它是用于说明变量系列的一般水平指标,也是变量分布的基本特征值之一.(mean).;:211总体或样本的单位总数个被调查单位的观察值第总体样本的均值其中nixxnxxxnxxinnii70 在公式中: -总体或样本的均值; xi-第各被调查单位的观察值,为总体或样本的单位总数。这一公式适合于在已知调查总体或样本的各单位观察值的情况下计算总体的均值。当调查总

41、体或样本的各单位的具体观察值未知,但是知道变量的分布数列,这时可以用下列公式计算均值,xkkkiiiikkkkkikiiiffmffffmfmfmffmx1121221111712组中的下限值组中的上限值组中值公式中,m-分配数列中各组的组中值; f-各组的频数,k-数列的组数; -各组的频率。 其中,各组频数f的大小对均值的计算结果具有重要影响,称为权数,而各组频率 同样影响均值,故称为权重。加入权数或权重的均值成为加权算术平均数;-分配数列中某一组变量值的中间水平的指标,在既有上限又有下限的组,即闭口组中,组中值由上限值与下限值之和的一半计算,其计算公式为:ff /ff /72倍相邻组组距

42、的上限值某开口组的组中值5 . 0倍相邻组组距的下限值或0.5 只有上限或只有下限的中,一般假定开口组的组距与其相邻组的组距相等,因而可用下列公式计算组中值:73 利用表1中的分配数列资料,计算50户被调查居民家庭的平均消费品支出额。解:首先计算由低组到高组的组中值,分别是(单位:元):1700、1900、2100、2300、2500、2700、2900、3100。其中,最大组为开口组,计算组中值为: 然后计算50户居民样本的消费品支出额的均值:(元)(组中值31002800-3000213000元)(2404503310032900827001125001223008210011900417

43、00 x74(元)或2404%63100%62900%82700%222500%242300%162100%21900%81700 x(Mode) 是总体资料中出现频数最多的数据表现。 例如,在零售市场中,销售量最大的品牌、款式或花色即为众数。又如,研究某种商品的销售价格时,销售量最大的那种价位就是众数。 75:(1)编制单项式变量数列(对定量资料而言)或品质分配数列(对定性资料而言);(2)找出频数或频率最大的组,该组的变量值或标志表现即为众数。 使用组距数列计算众数的方法是,首先找出频数或频率最大的组(称为众数组),然后按照下列公式计算: 公式中,L、U、d和f分别是众数组的下限值、上限值

44、、极差和频数, 和 分别是与众数组相邻组的频数和与众数组相邻的组的频数。 dffffffLMO)()(1111f1f76 试利用表1中的分配数列资料,计算50户被调查居民家庭消费品支出额的众数。从数列中可以得知消费品支出额为22002400元家庭组的频数(率)最大,为众数组。因此,以消费品支出额为22002400元家庭组的相应数据计算众数如下: (元)2240200)812()1112(11122200OM77 (Median) 是指在数据中处于中等水平的数值。 先在对数据进行大小排列中,中位数处于所有数据的中间位置,比其小者与比其大者的数量各占一半。由于中位数确定,将资料进行排序,所以只有、

45、定距和定比数据能计算或确定中位数,而定类数据不能确定中位数。如果使用未分组的原始数据有n个,则(为奇数)或 (为偶数)。21nexM)(21122nnxxMe78 如果使用分组资料,则首先计算累计频数,确定中位数组(即 位次上的变量取值或品质表现所在的组),对单项式变量数列或定序数列的中位数则为中位数组的取值或品质表现;对组距数列,则按照如下公式计算: 2fdfsfUdfsfLMe1122 公式中,L、U、d和分别是众数组的下限值、上限值、组中值和频数, 和 分别是中位数组下限的以下累计频率与中位数组上限的以上累计频数。 1s1s79 利用表1中的分配数列资料,计算50户被调查居民家庭消费品支

46、出额的中位数。计算以下累计频率(或以上累计频率,只要其一即可,见表1),并计算中位数的位次为 50/2 = 25。 显然,可以断定中位数应在消费品支出为24002600元的组内,即24002600组为中位数组,中位数计算如下: 元)(83.24012001224252400eM80 在研究市场调查资料的分布范围和分布结构等特征,尤其是在分析总体资料的“”和“”的现代探索性数据分析中,计算和分析分位数是一种有效的工具。 一般地,在对总体资料按照大小或优劣顺序进行排列的情况下,能够把全部资料等分为k个部分的资料称为分位数。显然,分位数共有k个。中位数是在分配数列中处于中等水平的代表值,能够把总体等

47、分为两个部分,因此又称为二分位数或1/2分位数。除了二分位数以外,最常用的分位数有、和等。k k81对调查资料按照升序排列(变量值由小到大);计算各分位数的位次。对于容量为的数据资料,第p个分位数的位次 计算各分位数的值。如果i不是整数,则向上取整。用比i大的下一个整数代表第个分位数;如果是整数,则第个分位数是第项和第项数值的算术平均值。(quartiles)是能够将总体资料按照大小或优劣顺序等分为4个部分的资料。四分位数共有3个,分别记为Q1、Q2和Q3,它们各代表1/4分位数或下四分位数、中位数和3/4分位数或上四分位数。nkpi82 某行业业务经理每月起薪的抽样调查资料的排序如下:(单位

48、:元)2710、2755、2850、2880、2800、2890、2920、2940、2950、3050、3130、3325显然, 中位数=对于Q1 其位次为 因为Q1 的位次是整数,因此它的值不能直接得出,需由第三项和第四项的平均值求得:)(2905229202890元34124ni)(28652288028501元Q83表 我国1994-2001年社会商品零售额情况表 单位:元年度19941995199619971998199920002001社会商品零售额(time series) 时间序列又称为动态数列,是研究总体不同时间上的某一指标数量,按照所属时间的先后顺序进行排序所形成的序列。例

49、如,按照我国社会商品零售额编制的时间序列如下表所示 。 时间序列有两个部分组成。,它反映总体指标数值的时间属性;,它反映总体在特定时间上研究指标的发展水平。 84 时间序列适用于描述研究对象变化的全部过程,研究其发展速度和发展规律的基础,也是进行趋势预测的基本依据。因此,编制科学的时间序列对于市场研究与预测具有重要意义。编制时间序列的基本要求是要保持时间序列的可比性。主要表现在以下方面: 时间序列的时间特征对指标的数值有着决定性的影响。因此,为了保证序列中的各指标能够正确地相互比较,要求时间长短具有一致性。一般地,对时期数列,要求各指标所属的时间短长度应相等;对时点数列,要求相邻两个指标的时间

50、间隔应相等。85 由于事物的变化性,研究总体在较长的时间内其总体范围也可能发生变化。例如,地区行政区划的变更、企业合并或分立等。为了使变化了总体范围的指标仍具有可比性,必须对前后两种总体的范围按照某一基准进行调整,如依据现在的总体范围对历史总体范围的指标数值进行调整。 对同一名称的指标,经济内容也可能不同。例如,对价值指标,有的时期采用不变价格计算,有的时期采用市场价格计算;对果品收购量,有的采用干货量计算,有的采用鲜货量计算等等。如果发现经济内容不同的指标,必须进行一致性调整。86对时间数列的动态水平分析,是通过计算动态水平指标进行分析的。动态水平指标主要有平均发展水平、增长量和平均增长量等

51、。 平均发展水平是一个较长时期各发展水平时序平均数。由于时间序列不同种类的性质不同,平均发展水平的计算方法也有所不同。如果时间序列由时期指标构成,计算平均发展水平的公式如下: 式中,-平均发展水平,ai表示第i时期的发展水平,为n时间序列中时期的个数。 nanaaaaann 12187利用表4.5中的资料,计算我国19942001年间年平均商品零售额。解:如果时间序列由时点指标构成,计算平均发展水平的公式如下: (亿元)8 .2800482 .375956 .341521 .24774206207 .16264 a121211321 naaaaaann88年度19941995199619971

52、99819992000200120022003职工总人数 某省1994年2003年各年底的职工总人数的资料如表,试计算这十年内各年平均职工总人数。 89当时间数列由相对指标或平均指标构成,计算平均发展水平的公式如下: 式中,C-时间序列中的各相对指标或平均指标,a 和b-派生出相对指标的分子指标和分母指标, 、 由a和b构成的与C序列相对应的序列的平均水平,它们的计算方法依据a和b的性质,可采用的计算公式或采用的计算公式。万人)( 8 .75795 .68201106832169470471874884184281578821abac ba90 是时间序列中两个不同时间下的发展水平的差额。其中

53、,研究中作为考察对象的发展水平称为报告期水平,作为报告期的对比基础的发展水平称为基期水平。用公式表示为: 增长量 = 报告期水平- 基期水平 在增长量中:(1),增长量的大小将取决于报告期水平的大小,这样的增长量称为累计增长量;(2),而且基期为报告期的前一期,这样的增长量称为逐期增长量。91 是把基期选定为与报告期属于同一季节的年或前几年的时期。 对于明显受季节变动影响的时间序列,计算增长量时,应避免因在不同季节比较引起的歪曲事实的做法。此时,应把基期选定为与报告期属于同一季节的年或前几年的时期。 是时间序列中逐期增长量的序时平均数,它表明研究总体在一定时间内平均每期增长(减少)的数量。用公

54、式表示如下: 平均增长量 = 逐期增长量 / 逐期增长量的个数92年度1997199819992000200120022003播种面积12276.7415267.0512695.9013136.9113127.7013359.8013684.4 某省19972003年农产品播种总面积序列,试根据下表计算各年度农产品播种总面积的逐期增长量、累计增长量和年平均增长量。 表 某省19972003年农产品播种面积情况表 计量单位:千公顷93各年逐期增长量与累计增长量见下表, 千公顷)(66.234666.140766 .3241 .23221. 901.47785.9231.290年度19971998

55、19992000200120022003播种面积12276.7415267.0512695.9013136.9113127.7013359.8013684.4增长量逐期-290.3192.85477.01-9.21232.1324.6累计-290.31383.16860.17850.961083.061407.6619982003年间平均年播种面积增长量94动态速度分析主要是指:等的分析。 是时间序列中两个不同时间下的发展水平的比值,表明研究对象在报告期水平已经发展到基期水平的几分之几或若干倍。用公式表示为: 在发展速度中,当基期水平固定不变,发展速度的大小将取决于报告期水平的大小;当基期水平

56、随着报告期水平的变化而变化,而且基期为报告期的前一期。 95 把基期选定为与报告期属于同一季节的上年或前几年的时期。对于明显受季节变动影响的时间序列,计算发展速度时,应避免不同季节发展水平的比较。这时,应选用年距发展速度。 增长速度是报告期增长量与基期水平的比值,表明报告期水平比基期增长(或降低)了几分之几或若干倍。用公式表示为: 增长速度 = 报告期增长量 / 基期水平 96 增长速度,与发展速度相对应,也可以分为和以及等具体增长速度。各种增长速度的计算均可以通过发展速度来计算,公式为: 增长速度使用相对数的形式分析事物的增长情况,因而去掉了增长的绝对数量。所以,对增长速度的分析需要结合分析

57、同期的增长量,进行相互补充。为此,可以通过计算和分析增长1%的绝对值达到这一目的。增长1%的绝对值计算公式为: 100%1上期发展水平逐期增长速度逐期增长量的绝对值增长97 我国19952000年煤炭消费总量资料如下表所示。试计算九五期间各年我国能源消费总量的发展速度、增长速度和增长1%的绝对值。年度199519961997199819992000煤炭消费总量(吨) 97857.30 103794.1698525.5792020.9488480.9286126.3298年度199519961997199819992000煤炭消费总量(吨) 97857.30 103794.16 98525.57

58、92020.9488480.9286126.32发展速度(%) 环比106.0794.9293.4096.1597.34定基100106.07100.6894.0490.4288.01增长速度(%) 环比6.07-5.08-6.60-3.85-2.66定基6.070.68-5.96-9.38-11.99增长1%的绝对值 978.571037.94985.25920.21884.81861.26 根据的计算公式,得我国能源消费总量的发展速度、增长速度和增长1%的绝对值,如下表:99 是一定时期内时间序列的各期环比发展速度的序时平均数,平均发展速度的计算有一下两种方法: 当所关心的重点是时间序列最

59、后一个时间的发展水平,而不在乎其它时间的发展水平的大小,由产量水平构成的时间序列。这样,在计算平均发展速度时采用几何平均法。计算公式为: 公式中, - 连乘符号,n-参与运算的环比发展速度的个数。n环比发展速度)平均发展速度(100当所关心的是时间序列中每个,而不单单是最后一个时间上的发展水平,如由造林面积所构成的时间序列。这样,在计算平均发展速度时采用累计法,或称方程式法。如果用代表平均发展速度,则可以通过解如下高次方程求得: 公式中,n-计算平均发展速度的时期内所用的时间单位数,ai-第时间的发展水平,a0-固定的基期发展水平。 01132/aaniinn 101 为了研究和预测2000年

60、以后年度我国煤炭消费总量,计算“九五”期间我国煤炭消费总量的年平均发展速度。解:按照研究的性质可判断采用几何法计算平均发展速度。 平均增长速度的计算方法是在计算出平均发展速度的基础上按照下列公式计算: 平均增长速度 = 平均发展速度 1上例中,“九五”期间我国煤炭消费总量的年平均增长速度 = 97.48% 100% = -2.52%。%48.97%34.97%15.96%40.93%92.94%07.1065102 是指事物间存在着一定的联系,但这种联系不是一一对应的确定性数量关系。例如,商品的价格与商品的市场需求量存在着一定的数量关系,但是每一价格并不对应有一个特定的该商品的市场需求量。这是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论