数据资料的整理与分析ppt课件_第1页
数据资料的整理与分析ppt课件_第2页
数据资料的整理与分析ppt课件_第3页
数据资料的整理与分析ppt课件_第4页
数据资料的整理与分析ppt课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 数据资料的整理与分析1;.2 案例导入:案例导入: 中国传媒大学调查研究统计所(SSI)2006年受某商业机构委托,要求建立一套数学模拟以监测互联网用户对网上信息的关注程度。为此,首先需要确定哪些网上行为最能反映网民对网上信息的关注程度。由于国内外几乎很少有相关文献论及这一问题,同时这一问题也存在一定的文化差异,因此SSI运用深度访谈的方法,了解网民使用互联网的行为习惯及心理特征,以确定该数学模型的理论框架。 在完成深度访谈之后,SSI针对每一篇访谈录音稿进行了如下数据整理和分析工作: (1)阅读访谈录音文稿,熟悉文本并回顾访谈情境; (2)将录音稿分成若干板块,首先将网民对各种信息的

2、关注程度分为高、中、低三类,然后将同一类信息有关的文字段落归为同一版块;3 (3)仔细阅读每一版块,提取反映网民行为和心理特征的关键信息并进行编码; (4)讨论并形成初步的编码表; (5)基于新的访谈录音稿更新编码表; (6)基于主要分析结果及最终的编码表进行头脑风暴会,讨论并确定整体分析框架; (7)图示分析结果,并形成分析报告。 通过以上分析,SSI发现网民最网上信息的关注程度与其网上活动的互动程度有紧密的联系,在此基础上SSI设计了网民对网上信息关注程度的理论模型,为后期的定量研究奠定了基础。 那么,面对大量的定性数据,一般应该如何处理呢?4一、数据资料的整理n(一)数据资料整理概述n1

3、.定义n数据资料的整理是根据市场分析研究的需要,对市场调查获得的大量原始资料进行审核、分组、汇总、列表,或对二手资料进行再加工的工作过程。n数据资料的搜集提供原材料,数据资料的整理提供初级产品,数据资料的分析提供最终产品。 5n2.数据资料整理的内容n(1)数据资料的审核n数据资料的审核是对调查表或调查问卷等提供的原始资料进行审核,检查问卷填答是否合格,或者对二手资料的可靠性、准确性、时效性、完备性进行检查。n数据资料的审核目的在于查找问题,采取补救措施,确保数据质量。6n下面情况的问卷一般是不能接受的:下面情况的问卷一般是不能接受的:n所回收的问卷是明显不完整的;n问卷从整体上是回答不完全的

4、;n问卷的几个部分是回答不完全的;n问卷只有开头的部分才是回答完全的;n回答的模式说明访问员(被访者)并没有理解或遵循访问(回答)指南;n答案几乎没什么变化;n问卷是在事先规定的截止日期以后回收的;n问卷是由不符合要求的被访者回答的。7n通常检查人员将原始文件(问卷)分成三部分:通常检查人员将原始文件(问卷)分成三部分: 可以接受的 明显要作废的 对是否可以接受有疑问的。8 处理不满意的答案三种处理办法:处理不满意的答案三种处理办法:n退回实施现场去获取叫好的数据n按缺失值处理;n整个问卷作废。9n 不满意答案的问卷退回实施现场,让访问员再次去接触被访者。n 如果将问卷退回现场的做法无法实现,

5、校订人员可能就要把不满意的答案按缺失值处理。 满足以下条件,将有不满意答案的问卷扔掉作废:n不满意的问卷(被访者)的比例很小(小于10%);n样本量很大;n不满意的问卷(被访者)和满意的问卷(被访者)之间没有明显的差别;n每份不满意的问卷中,不满意答案的比例很大;n关键变量的答案是缺失的。10n(2)数据资料的处理n数据资料的处理是对确认无误的调查表或调查问卷进行加工处理,包括分组、编码、汇总等,或者对二手资料进行再分类和调整。n数据资料的处理是数据资料整理的关键,其任务在于使原始资料和二手资料实现综合化、系列化和层次化,为进一步的分析研究准备有价值的数据。11n(3)数据资料的陈示n数据资料

6、的陈示是对加工整理后的数据用一定的陈述和显示形式表现出来,以方便阅读和使用。n数据资料的陈示形式通常有统计表、统计图、数据库、数据报告等。12n3.数据资料整理的程序 n(1)设计方案n(2)审核订正n(3)分组处理n(4)统计汇总n(5)数据陈示13n(二)数据资料的审核n数据资料审核的内容 n(1)审核分析数据资料的及时性 n(2)审核分析数据资料的完整性n(3)审核分析数据资料的准确性。数据资料的准确与否,关系到决策的成败。数据资料的准确性包括两个方面:一是数据资料来源渠道的可靠性;二是数据资料内容的准确性。n(4)审核分析数据资料间的相互关系n(5)审核分析数据资料的变化规律。市场信息

7、的变化规律有三种类型:一是波动性变化规律;二是趋势性变化规律;三是不规则变化规律。 14(三)数据资料分组案例n某公司派出市场调查人员深入市场进行实地考察,目的是想了解当地工业用户对某类产品的采购方式。市场调查人员走访了几十家公司后,发现各家公司的采购方式与各自公司规模大小、经营产品的类别等密切相关。同时,还发现各自重点选购的商品差别很大。n市场调查人员又根据了解到的情况估计,认为这些公司的采购方式很可能与各家公司本身的特点密切相关。于是又将有关这几十家公司的规模、经营的产品等方面资料再作详细分组。为了能够客观地验证各家公司的规模与它的采购方式二者之间可能存在的某种关系,于是,市场调查人员根据

8、各家公司的营业额把这几十家公司分为下列五组:营业额每年100万以上;营业额每年50100万元;营业额每年2549.9万元;营业额每年1024.9万元;营业额每年10万元。分组之后,市场调查人员只需要在这五类规模大小各异的公司中,根据各类公司特点相互比较即可说明问题,而不必逐家公司去进行相互比较了。15n(三)数据资料的分组n对数据资料进行分组的好处:n(1)可区分社会经济现象的类型。社会现象之间存在着本质差异,这些差异构成了不同的类型,通过分组划分出各种不同类型,对各种类型的数量表现进行分析研究,就可以认识各种类型的本质及其发展变化规律。n(2)可反映事物的内部结构及比例关系。通过分组,可以取

9、得总体内部各部分在总体中所占比重和各部分之间比例关系的资料,而这些资料对于全面认识总体是非常重要的。n(3)研究社会现象之间的依存关系。一切社会现象都不是孤立的,而是相互联系、相互制约的,通过分组就能将现象之间的这种依存关系反映出来。16n1.选择分组标准的依据n(1)根据研究的目的选择分组标准。例如,如果目的在于研究职工素质及对提高劳动生产率的影响,则可以按文化程度、技术等级等标准分组。如果是为了了解居民收入对可能购买的需求量的影响,则可按居民收入等标准分组。n(2)选择反映事物本质的标准。例如,为反映家庭富裕程度,如表1和表2所示。表2更能反映家庭的富裕程度。 17 每户收入(元) 户数(

10、户) 600以下 600900 9001200 1200以上 110 450 395 245 合 计 1200 每户平均每人的收入(元) 户数(户) 200以下 200400 400600 600以上 205 435 435 408 合 计 120018n(3)根据经济发展变化及历史条件选择分组标准。例如对机械化、自动化水平较高的企业一般使用生产能力和固定资产作为分组标准分组;而研究乡镇企业的生产规模时,由于多是劳动密集型企业,一般以职工人数作为企业规模的分组标准。19n2.简单分组与复合分组n简单分组,就是对总体只选择一个标准进行分组。例如,按收入分组,可分为高、中、低三类。简单分组只能从某

11、一侧面反映社会经济情况。n复合分组是选择两个或两个以上的标准进行分组。用复合标准分组有两种形式:一种是按某一标准分组后,再按另一标准把已分组的各组进一步分为更细的组;另一种是用两种标准同时分组,在实际工作中,这种分组形式使用的很多。20n3.分组的方法n(1)按标准的特征分组n根据分组标准的特征不同,可划分为按品质标准分组和按数量标准分组。n按品质标准分组,其品质标准是反映事物属性的标志。按品质标准可以把总体单位划分为若干类型,如人口可按性别、职业等划分。n按数量标准分组,是按照某一标准的不同数量,将总体单位划分若干组。分组标准的数量可以是绝对值,如职工人数、固定资产等;也可以是相对值,如资金

12、利润率等。分组的形式可以是单项式,如按家庭人口数划分居民的家庭;更多的情况是采用组距式,如将营业额分成若干组,划分企业及其它经济指标。选择数量标准分组,重要的是通过数量差异反映出各组不同的性质。21n(2)确定分组界限n分组界限,是指组与组之间相区别的界限。确定分组界限,包括组数、组距、组限、组中值的确定和计算等内容。 22n资料分组中的相关概念n组距n组距 = 上限下限 n组中值n闭口组的组中值=n开口组的组中值=2下限上限 22相邻组的组距下限相邻组的组距上限23n4.编制变量数列。例P166 n (1)将原始资料按大小顺序排好 n(2)确定组距和组数 24n(四)数据资料的汇编n汇编,就

13、是按照分析的目的和要求,对分组后的数据资料进行计算、汇总和编辑,使之成为能反映市场对象客观情况的系统、完整、集中、简明的材料。n1.手工汇总技术n(1)划记法n(2)折叠法n(3)记录法n(4)卡片法n2.计算机汇总技术25n(五)数据资料的陈示P171n数据资料的陈示方式主要有统计表和统计图 26制表方法n1.交叉列表分析技术的含义交叉列表分析技术的含义n交叉列表分析是同时将两个或两个以交叉列表分析是同时将两个或两个以上具有有限类目数和确定值的变量,上具有有限类目数和确定值的变量,按照一定顺序对应排列在一张表中,按照一定顺序对应排列在一张表中,从中分析变量之间的相关关系,得出从中分析变量之间

14、的相关关系,得出科学结论的技术。科学结论的技术。 销售增长商品特点行总计日用品耐用品食品速度慢452450119速度快526323138列总计978773257 AB公司商品销售统计272.交叉列表分析法的种类交叉列表分析法的种类n(1)单变量列表n也就是只有一个变量对收集的数据产生控制。如表所示: 性别合计男女252348营销专业学生人数28(2)双变量交叉列表n双变量交叉列表是最基本的交叉列表分析法。每个单元格中的数字都同时受到两个变量的约束,故反映的信息更多。 营销专业学生人数 宿舍性别103104105106212213214合计男887225女87823总计88728784829n(

15、3)三变量交叉列表n在实际工作中,双变量交叉列技术对于某些信息不能准确分析,这时就需要加入第三个变量,成为三变量交叉列表。 小汽车购买档次收入状况白领或较高收入普通工薪阶层高70%35%低30%65%列总计100%100%被调查者人数300500 小汽车购买者中收入与购买汽车档次的关系 30制图分析n统计图是用各种图形表现统计资料的一种形式。它是以统计资料为依据,借助于几何线、形、事物的形象和地图等形式,显示社会经济现象的数量,其表现在规模、水平、构成、相互关系、发展变化趋势分布状况。n优点是:简明具体、形象生动、通俗易懂,易给人以明确而深刻的印象。31(1)比较图32(2)结构图n结构图用于

16、反映总体中各部分与总体各部分与总体的结构关系。 33(3)动态图n动态图用于描述与时间相关的事物,随时间的变化而变化的状况。主要适用于条形图、立体图和线图。 34(4)依存关系图n依存关系图主要用于描述两项事物之间的依存变化关系。 卡通片体育电视剧歌舞休闲 某班小学生最喜欢的电视节目统计图 35(5)分配数列图n分配数列图用一反映某一事物在不同阶段上的变动趋势。 36(6)面积图n用于描述几种状态之间的对比。 37(7)组织结构图n利用点、线、形等手段,表现某一组织或某一事物内部各层次之间、各部门之间的层次、从属、并列等关系。如图所示: A公司组织机构图 总经理市场部经理财务部经理新产品经理3

17、82.其他如装饰、其他如装饰、图片等注图片等注 图形图形 图尺图尺 图线图线 图目图目 图号图号 图注图注统计图的构成统计图的构成 393.制图规则制图规则(1)图题说明资料内容、地点和时间(2)尺度线与基线垂直(3)尺度的设置应能包括资料中最大的数值(4)以0为起点(5)尺度点之间的距离相等,且表示相同数值(6)尺度点过多时,可间隔写(7)项目较多时最好按大小顺序排列(8)少用附加图标说明,标记应在对应的位置(9)避免过多或过少的标注、斜线、竖线、横线等(10)度量单位的选择要适当(11)作图时最好既使用颜色,又使用文字说明(12)一般应该说明数据的来源40减少小数点的位数 减少数字标注用符号来代替部分文字 使用简单的颜色 以服务内容为中心展开设计 4.制图技巧制图技巧41n二、数据资料的分析 n(一)概述n1. 数据资料分析的含义n 数据资料分析是指根据市场调研的目的,运用多种分析方法对市场调查收集整理的各种资料进行对比研究,得出调查结论,进行对策研究。n 42n2.数据资料分析的内容n(1)背景分析n(2)状态分析n(3)因果分析n(4)对策研究43n3.数据资料分析的方法n(1)定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论