版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章调查资料的处理与分析市场调查第一节调查资料的处理一、资料的审核调查资料审核是指对资料的准确性、时效性、全面性和系统性进行审核。任务:对市场调研资料进行的筛选,剔除无价值资料。
1.原始资料的审核
⑴对缺失值的处理
①利用一个样本统计量的值去代替缺失值。
通常使用样本变量的平均值。
②利用从一个统计模型计算出来的值去代替缺失值。
③将有缺失值的个案整个删除。
④将有缺失值的个案保留,仅在相应的分析中作必要的排
除。
姓名123…100身高177169…175⑵对明显错误答案的处理
多数情况以“不详值”对待。
⑶对被调查者缺乏兴趣回答答案的处理
①个别问卷作为废卷处理。
②如果数目较多,且集中于某个或少数几个问题,作特殊编码处理。姓名123…100身高172173274…175找男朋友最先考虑哪个因素?A、有钱B、长得帅C、有共同的兴趣爱好D、性格好
2.二手资料的审核
⑴对文献资料的审核:客观性,真实性和时效性。
⑵对引用统计资料的审核:指标口径和资料分组问题。二、调查资料的整理
编码→分组→汇总
1.编码
编码是将原始资料转化为易被计算机判读的数字规则,即用
不同的数字代表不同的回答或资料。
编码的类型
①事前编码
②事后编码
2.分组
⑴分组及其原则
分组是根据调查目的和所研究现象的本质特征,将现象按照一定的标志分成不同的组别。
分组原则:
①根据调查的目的来选择分组标志
②选择最终能反映事物本质特征的标志
③根据经济发展变化及历史条件选择分组标志
(2)分组标准与方法
标准:
①按品质标志分组
②按数量标志分组
③按时间标志分组
②按空间标志分组1、简单分组处理是指对总体各单位或样本各单位只按一个标志或标准进行分组处理。分组的标志或标准一般可以区分为品质属性、数量属性、时间属性、空间属性四类。例如:某市组织了一次样本量为2000户的居民家庭空调满意度和购买行为的市场调查,设计的问项是36个。
1)品质属性分布数列是以被调查者的职业、所属行业、性别、文化程度、职业等品质属性作为分组标志而形成的简单品质数列。((2)数量属性分布数列是以被调查者的年龄、收入、消费支出、家庭人口、就业人口等数量属性作为分组标志形成的变量数列。有如下两种形式:(1)单项式变量数列。适应于离散型变量的分组处理,即直接以变量的不同取值作组别而编制的变量数列。如表6-2。(2)组距式变量数列。适应于连续变量的分组处理,即以变量的不同取值区间作为分组的组别而编制的变量数列,如表6-3
3)时间属性分布数列是以调查问卷中的一些时间属性的调查项目作为分组标志,对被调查者的时间选项进行分组而形成的时间数列。如表6-4
4)空间属性分布数列是以调查问卷中的某些具有空间属性的调查项目作为分组标志而形成的空间数列。如表6-5。
2、平行分组处理平行分组处理是对总体各单位或样本各单位同时采用两个或两个以上的标志或标准进行平行排列的分组,所编制的分组数列称为平行分组数列。(1)两变量(项目)平行分组数列。它是将两个有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。如表6-6。
(2)多变量(多项目)平行分组数列。这是将两个以上有联系的调查项目按相同选项分组的结果并列在一起而编制的平行分组数列。如表6-7。3、交叉分组处理交叉分组处理是对总体各单位或样本各单位采用两个或两个以上的标志或调查项目进行交叉分组,所编制的数列一般表现为相关分组数列或复合分组数列。(1)基本项目之间的交叉分组处理。它是利用反映被调查者基本情况的基本调查项目之间的关联性进行交叉分组处理。如表6-8
(2)基本项目与主体项目之间的交叉分组处理。它是利用问卷中的基本项目与主体项目之间的关联性进行交叉分组处理,如表6-9两变量交叉列表。(3)三变量交叉列表。如表6-10。
3.汇总
汇总是指按照调查的目的和要求,对分组后的调查资料、数据进行计算汇总和编辑,使之成为能系统、完整、集中、简明地反映调查对象客观情况的材料。
任务:
⑴按分组特征将总体各单位分别归类;
⑵将总体单位的数量标志值分组汇总。
方式:
⑴手工汇总技术
⑵计算机汇总一个资料整理的实例
某部门为了了解老干部和老知识分子的状况,曾对本系统60岁以上的成员做过一次普查。下面,我们摘选该调查表的一部分。1.姓名__________2.年龄__________3.业务专长__________4.家庭居住面积a.20平方米以下()b.20-45平方米()c.45-65平方米()d.65平方米以上()5.您是否退休?a.已退休()b.延期退休()c.暂缓退休()d.该退未退()6.你不愿意退休的理由:(只能填一项)a.身体健康尚能工作()b.担心青黄不接影响工作()c.无所事事空虚苦闷()d.认为退休办理得不合理,等待新精神()表11-1编码手册示例片段格问题号码项目名称内容说明1-51姓名答卷人姓名编号6-72年龄答卷人年龄8-103业务专长专业编码详见附表114家庭居住面积1.20平方米以下
2.2←45平方米
3.45-65平方米
4.65平方米以上125是否退休1.已退休
2.延期退休
3.暂缓退休
4.该退未退136不愿退休的理由1.身体健康尚能工作
2.担心青黄不接影响工作3.无所事事空虚苦闷
4.认为退体办法不合理,等待新精神在表11-1中,可以看出编码子册包含4个主要项目表11-2登录卡研究方案编号________登录卡号________51015202530354045505560657075805101520253035404550556065707580登录________校对________日期________(三)将登录在资料卡片上的资料输入到计算机内
现在处理数据的软件包有dBASEIE、BRIEF等,其中dBASEIE是有汉字说明的。操作者通过按键将登录卡上的数据敲人计算机,同时屏幕显示数据,录入后可以利用计算机来查错、纠错。查错的程序有两种:第一种是检查输入信息的有效性,即对数码进行幅度检查。幅度检查的方法主要是检查资料的子项是否都在规定的幅度范围内。例如,关于性别的调查项目答案只有两个:男、女,如果男=1,女=2;那么这个项目的答案幅度是1-2,不可能有3、4等数码。幅度检查就是要把那些超越幅度的错误找出来。第二种是检索输入信息相互之间的一致性,即对数码进行逻辑检查。逻辑检查主要是检查同一份问卷中,不同问题的答案是否相互矛盾,例如问卷的第4题是询问年龄,年龄的编码是这样的:1-13岁=1;14-25岁=2;26-40岁=3;……第6题是询问婚姻状况:已婚=1,未婚=2。假如第4题的答案是1,那么第6题的答案应是2;如果是1的话,那么,不是第4题就是第6题的答案错了,逻辑检查可以找出答案的逻辑矛盾。(四)向计算机发布指令,通过计算机来整理资料
当资料全部输入磁盘或磁带后,就可输入指令整理资料了。有的计算机站备有SPSS软件包,那么只需调动一个指令,问题就全部解决了。例如:我们想整理表11-1上第四个问题,只需键入:“频数变量=V4”,几秒钟后,屏幕就会显示出:变量值频数百分比累计百分比11500030.O30.021250025.055.031250025.080.041000020.O100.0合计50000100.0
我们将这个结果通过打印机打印出来,再根据编码子册转译一下,就可得出表11-3表11-3某单位职工家庭居住面积情况居住面积人数百分比累计百分比20平方米以下1500030.030.020-45平方米1250025.055.045-65平方米1250025.080.065平方米以上1000020.0100.O合计50000100.0第二节变量序列及其编制
一、变量序列及其种类
1.变量序列的概念
变量序列是按照某种数量特征对总体进行分组,将分组后所形成的变量值按大小顺序排列所得到的序列。
构成要素:
①按分组变量进行分组所形成的各组变量值(x);
②总体单位在各变量组的分布次数(f);
③频率:各组总体单位分布次数占总体单位总数比重(W)。案例:对50名顾客有关“饮料品牌”选择的调查不同品牌饮料的频数分布饮料品牌频数比例百分比(%)
可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100调查对象按月收入分组所得变量序列月收入(元)x分组人数(人)f频率(%)w500以下
500~10001000~15001500~20002000~25002500~30003000以上1221154625382843215514326899.8%12.4%20.5%22.9%17.3%11.5%5.6%合计12424100%
2.变量序列的种类
⑴单值序列:各分组变量都是一个具体的变量值。
适合于变量变异幅度不大、变量值数目有限的情况。
⑵组距序列:各组变量是由两个变量值所限定的一个变动区间,且这个变动区域涵盖了其区间内的所有总体单位数。
组距序列分为等距序列和不等距序列二、组距序列的编制
1.确定变量的类型:
⑴离散型变量:变量个数少、变动幅度不大,可编制单值
序列;变量个数较多,变动幅度较大,应
编制组距序列。
⑵连续型变量:只能编制组距序列。
2.确定组数和组距:
⑴组数是指组距序列中分组的个数。
组数的确定应以明确显示总体分布趋势为原则。
数量标志变异范围越大,组数就应越多,反之就越少。
⑵组距是每组变量的上限与下限之差。三、累积次数与累积频率
1.向上累计(以下累计或称较小制累计)
将各组频数和比率,由变量值低的组向变量值高的组逐组累计。
组距序列中的向上累计,表明各组上限以下总共所包含的总体频数和比率有多少。
2.向下累计(以上累计或称较大制累计)
将各组频数和比率,由变量值高的组向变量值低的组逐组累计。
组距序列中的向下累计,表明各组下限以上总共所包含的总体频数和比率有多少。按家庭年收入分组家庭数(户)比重(%)xfw(甲)⑴⑵10000以下10000~2000020000~3000030000~4000040000~5000050000~6000060000以上10304060302010515203015105合计200100家庭收入基本状况累积表按家庭年收入分组家庭数(户)比重(%)向上累积xfwfw(甲)⑴⑵⑶⑷10000以下10000~2000020000~3000030000~4000040000~5000050000~6000060000以上1030406030201051520301510510408014017019020052040708595100合计200100--家庭收入基本状况累积表按家庭年收入分组家庭数(户)比重(%)向下累积xfwfw(甲)⑴⑵⑸⑹10000以下10000~2000020000~3000030000~4000040000~5000050000~6000060000以上1030406030201051520301510520019016012060301010095806030155合计200100--家庭收入基本状况累积表某地区30户居民人均月收入基本情况表月收入(元)基本情况向上累计向下累计家庭数(户)频率(%)家庭数(户)频率(%)家庭数(户)频率(%)1400~15001500~16001600~17001700313.350.013.4711263023.336.686.6100.03023194100.076.763.413.4合计30100.0———
—第三节交叉列表技术
一、双向交叉列表
双向交叉列表是指将两个或两个以上有一定联系的变量及其变量值按照一定的顺序交叉排列在一张统计表内,使各变量值成为不同变量的结点,从中分析变量之间相关关系的一种数据分析技术。年收入水平和受教育程度相关关系表
收入水平(百元)教育程度6以下6~1010~1515~2020~2525~3030~3535以上合计小学及文盲初中高中大专本科研究生2301356045404516135841459845835162263554519621613818521822116513714761168392139149219123132105329553345741351151786647321238407887166460合计7236193805355727605326614785二、三向交叉列表
三向交叉列表是在双向交叉列表的基础上,加入第三个变量作进一步分析的方法。
编制步骤:
①选中一个变量,将其值稳定在各种变量值中的一个值上,
②将另一个自变量和因变量作双向交叉分组;
③将第一个变量稳定在其下一个变量值上,作另外两个变量的交叉列表,类推,直到第一个变量的所有变量值被一一列举完毕。
某药品主要品牌的人群分布情况表品牌城市上海广州南京北京低收入中收入高收入低收入中收入高收入低收入中收入高收入低收入中收入高收入ABCD2290492360919290091297434098466012334603250603350140411014039614211402175114981158第四节统计图的应用
一、线图(时间序列图)
线图适用于连续型数量资料,用以表示实物或现象在时间上的发展变化
常用的线图有:单式线图和复式线图。
横轴表示时间,纵轴表示与年份相对应的各种指标数值。二、柱形图(条形图)
柱形图是以若干等宽平行长条的长短来表示品质属性序列中各组频数或频率大小的图形。
当市场研究的目的在于对调查总体各组成部分的变量频率进行比较时,采用之。
常用的柱形图有:单式柱形图和复式柱形图。
图中各柱形要有同一基线,尺度必须从“0”开始。
三、圆图(饼图)
圆图是用扇形的面积,来表示总体指标数值,圆形或饼形的各扇形面积代表各组指标数值,或代表各组的频率。
当统计研究的目的是反映一个整体及其内部结构时,饼形图的利用将极为有效。
圆图内不应包括太多的分组,且所有分组的比重之和必须等于100%。四、直方图
主要用于表示连续型定量变量的频数分布或频率分布。
用横轴表示变量,其标度可以从任何合适的数字开始,纵轴一般用来表示频数或频率其标度通常从零开始。
变量之间应具有相同的组距。第五节市场调查资料主要统计指标
一、数据的分布指标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版监控设备销售与维护保养合同3篇
- 二零二五年度果树种植与农业科研合作承包合同2篇
- 二零二五版建筑工地场地勘查与风险评估委托合同3篇
- 二零二五版国际机场ATM设备场地租赁与广告合作合同3篇
- 二零二五版矿业勘探承包作业合同样本2篇
- 二零二五版智能停车场设计与施工合同3篇
- 二零二五版板房租赁合同附带设施设备维修协议3篇
- 二零二五版抵押房屋买卖合同与房屋保险服务合同3篇
- 二零二五版办公场地租赁与人力资源服务合同范本3篇
- 二零二五版鸡蛋养殖基地技术改造合同3篇
- 广东省佛山市2025届高三高中教学质量检测 (一)化学试题(含答案)
- 《国有控股上市公司高管薪酬的管控研究》
- 餐饮业环境保护管理方案
- 人教版【初中数学】知识点总结-全面+九年级上册数学全册教案
- 食品安全分享
- 矿山机械设备安全管理制度
- 计算机等级考试二级WPS Office高级应用与设计试题及答案指导(2025年)
- 造价框架协议合同范例
- 糖尿病肢端坏疽
- 心衰患者的个案护理
- 医护人员礼仪培训
评论
0/150
提交评论