




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目六调查数据处理与描述统计分析【项目目标】了解调查数据处理的程序和方法掌握数据的描述统计分析【技能要求】培养处理调查数据的能力能够运用描述统计分析方法对处理后的调查数据进行分析【提交成果】完成调查数据的处理流程【案例导入】关于互联网用户对网上信息的关注程度的调研中国传媒大学调查研究统计所
中国传媒大学调查研究统计所(SSI)2006年受某商业机构委托,要求建立一套数学模拟以监测互联网用户对网上信息的关注程度。为此,首先需要确定哪些网上行为最能反映网民对网上信息的关注程度。由于国内外几乎很少有相关文献论及这一问题,同时这一问题也存在一定的文化差异,因此SSI运用深度访谈的方法,了解网民使用互联网的行为习惯及心理特征,以确定该数学模型的理论框架。在完成深度访谈之后,SSI针对每一篇访谈录音稿进行了如下数据整理和分析工作:(1)阅读访谈录音文稿,熟悉文本并回顾访谈情境;(2)将录音稿分成若干板块,首先将网民对各种信息的关注程度分为高、中、低三类,然后将同一类信息有关的文字段落归为同一版块;(3)仔细阅读每一版块,提取反映网民行为和心理特征的关键信息并进行编码;(4)讨论并形成初步的编码表;(5)基于新的访谈录音稿更新编码表;(6)基于主要分析结果及最终的编码表进行头脑风暴会,讨论并确定整体分析框架;(7)图示分析结果,并形成分析报告。
通过以上分析,SSI发现网民最网上信息的关注程度与其网上活动的互动程度有紧密的联系,在此基础上SSI设计了网民对网上信息关注程度的理论模型,为后期的定量研究奠定了基础。讨论:
1、面对大量的定性数据,应该如何收集整理呢?任务1数据的确认与编辑
任务描述:数据的确认是为了确保调查问卷是有效问卷,即调查是按要求正确无误进行的。研究人员必须确信调查结果真实反映了目标顾客的回答。数据的编辑是对访问员和应答者的错误进行检查,筛选不合格的调研表。通常数据录入前,问卷至少应经过两次编辑整理。包括一系列问题的查验:第一步筛选不合格的调研表第二步检查问卷第三步检查开放式问题的答案第四步不合格调研表的处理
(一)返还现场,与调查对象取得联系,取得符合要求的数据资料;(二)找出遗漏值,保留有用信息;(三)剔除不合格的调查对象。适用条件:在明显的特征方面差异不大;不合格的回答在一个调研表中所占比例大;缺少对关键变量的回答。任务2数据的编码
任务描述:编码是指对一个问题的不同答案进行分组和确定数字代码的过程。编码可以按照预先编码或事后编码来进行。大多数问卷的大多数问题都是封闭式的,在调查之前就已完成编码过程,即每一组问题的不同答案的数字编码已经确定。事后编码主要是针对开放式问题。第一步明确封闭式单选问题的编码
这类问题,通常调查问卷在设计时就已将答案的代码确定好了。A1您的性别:①男②女A2您现在读:①大一②大二③大三④大四A3您的户口是:①农村②城镇假如有一样本是来自农村的大三女生,他在这三个问题上的答案,用编码表示就是231。相关链接第二步明确封闭式多选问题的编码在大学生的消费现状调查中,有这样一个问题:你上大学的来源是:变量名 变量标签 编码方案A1 助学贷款 1=选中0=没选中A2 勤工俭学 1=选中0=没选中A3 父母给与 1=选中0=没选中A4 自己做兼职 1=选中0=没选中A5 社会赞助 1=选中0=没选中
假如某被调查的大学生选择的是勤工俭学和父母给与,那么他对此题回答,相应的编码是01100
相关链接第三步明确矩阵式问题和表格式问题的编码矩阵式问题你觉得下列现象在你们学校是否严重?(请在每一行适当的格中打√) 很严重比较严重 不太严重不严重不知道迟到◿ ◿ ◿ ◿ ◿早退◿ ◿ ◿ ◿ ◿旷课◿ ◿ ◿ ◿ ◿假如某被调查者的选择答案为迟到很严重,早退不严重,旷课不太严重,则编码为:143相关链接第四步明确排序题的编码您购买商品时在品牌、流行、质量、实用、价格中对它们的关注程度先后顺序是(请填代号重新排列)
第一位第二位第三位第四位第五位
编码:定义五个变量,分别可以代表第一位到第五位,每个变量的Value都做如下定义:“1”品牌,“2”流行,“3”质量,“4”实用,“5”价格
录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。相关链接第五步明确开放题的编码
问卷中的开放式问题,编码工作比较复杂。因为开放式问题所得到的信息不像封闭式问题那样可以简单地数字化,而是需要调查者查阅每份问卷中同—道开放式问题的答案,然后对这些答案根据某些共同的特征先进行简单的合并成若干类,然后再对这些类别进行编码,一般情况下,同一类别分配一个数字编码。为了避免由于分类过粗,而使—些受访者的信息被忽略,就需要在分类的时候尽量将类别分得细一些。开放式问题进行编码编码过程:列出答案→合并答案→设置编码→输入编码。任务3数据的转换与录入
任务描述:数据的录入是指将问卷或调查表或登录卡上的编码数字读到磁盘、磁带中,或通过键盘直接输入到计算机的工作过程。数据录入有两种方法法:机器录入和人工录入。常用的录入软件:Excel、SPSS(StatiscalPackageforSocialSciences)社会科学统计软件包)。
第一步建立数据模板即把调查问卷中的每一个题输入统计软件。首先确定变量属性,如变量名、变量长度、变量标签、变量的缺失值等等;然后输入问卷的每一个变量名、变量标签和答案编码。
第二步建立数据库即将问卷调查所得信息或数据输入统计软件。任务4数据的制表和图形化
任务描述:数据的制表是指将一系列说明现象特性的经加工整理后的调查数据,按一定次序和格式排列形成的专用表格。数据的图形化是为了更好地表现数据特点。其中图形表现,其作用不仅能有效表现数据,更有利于资料的贮存保管,还是积累资料的有效手段。为下一步分析提供基础,为进一步挖掘数据提供便利。第一步数据的制表
统计表由纵横交错的直线围成,从外形看,由总标题、行标题、列标题和具体数值及表外附加组成。
第二步数据的图形化为更好地表现数据特点。需要展示数据。其中图形表就是一种有效方法。常用的统计图有下列几种:1.条形图、直方图。2.饼型图、环形图。3.茎叶图、箱线图。4.线图。5.雷达图。任务5数据的描述统计任务描述:本分项任务将引领你完成数据资料的描述性统计分析工作!可以通过对调查数据的统计和计算分析,得到一定的结果,这个结果就可以用来描述和评价调查现象的数量特征和规模。如2011年1月份,全国进出口总额2950亿美元,同比增长43.9%;其中,出口1507亿美元,同比增长37.7%,环比下降2.2%;进口1443亿美元,同比增长51%,环比增长2.2%;实现贸易顺差64.6亿美元,同比减少77.1亿美元。这就是通过统计分析,得出的一个外贸增长规模。在调查活动中,进行资料分析时,经常会遇到这样的工作。通俗地讲,描述性分析就是为市场调查活动收集到的数据资料拍一张平面照,那么,就看看这些数据资料表面究竟是怎样的、又能说明什么问题。请进入以下任务环节。第一步分析数据的集中趋势数据的集中趋势分析在于揭示被调查者回答的集中程度,通常用最大频数或最大频率对应的类别选项来衡量。数据的集中趋势是指大部分变量值趋向于某一点,将这点作为数据分布的中心,数据分布的中心可以作为整个数据的代表值,也是准确描述总体数量特征的重要内容。什么是描述性统计分析?描述性统计分析属定量分析,是指对调查数据作相应的整理、加工和概括、用来描述总体特征的一种统计分析方法。描述性统计分析是一种非常有效的概括大规模数据特征的方法。既是统计分析的重要组成部分,也是市场调查资料分析中最常用的分析方法。(一)平均数:平均数是数列中全部数据的一般水平,是数据数量规律性的一个基本特征值,反映了一些数据必然性的特点。(二)众数:众数是数据中出现次数最多的变量值,也是测定数据集中趋势的一种方法,它克服了平均数指标会受数据中极端值影响的缺陷。甲组数据:2、2、3、3、4的众数是多少?(2、3)乙组数据:1、2、3、4的众数是多少?(没有)(三)中位数:中位数是将数据按某一顺序(从大到小,或相反)排列后,处在最中间位置的数值。第二步分析数据的离散程度
如果需要用一个数值来概括变量的特征,那么集中趋势的统计就是最合适的。所谓集中趋势,就是一组数据向一个代表值集中的情况。但仅有集中趋势的统计还不能完全准确地描述各个变量,这是因为它没有考虑到变量的离散趋势。所谓离散趋势,是指一组数据之间的离散程度。其最常用的统计量是标准差,它是一组数据中各数值与算术平均数相减之差的平方和的算数平均数的平方根。数据的离散程度通常由全距(也叫极差)、平均差、方差和标准差等来反映。第三步综合指数分析(一)确定总量指标(二)确定平均指标(三)确定相对指标1.结构相对指标2.比较相对指标3.比例相对指标4.强度相对指标项目小结
根据市场调查业务活动顺序,本任务是市场调查操作技术的第6任务。调查问卷回收上来以后,要进行审核编辑、资料分类、数据编码和数据录入等工作。这一过程首先要做的就是确认每份问卷是否都是有效的,这不仅需要对问卷本身进行审核,还需要对一定比例的被访者进行回访。接下来的编辑要确保每个要回答的问题都有答案,每个答案都是按照问卷设计的要求回答的。在这之后进行的就是繁琐的资料数据的分类和编码工作,工作人员必须在事后为每一类的答案设定适当的数字代码。录入数据是一项单调、艰巨的工作,但却是以后数据分析的关键,当今绝大部分录入工作都是通过计算机完成的,而光学扫描已经成为重要的使用方法。同时要重点掌握定量分析方法,学会应用定量分析方法对一些简单的调查资料进行分析研究。调查数据处理与描述统计分析将为预测市场发展趋势奠定重要基础。本任务围绕分析市场调查资料活动必要的程序设计了各环节操作的专门知识、设置了相关链接、阅读与思考等栏目,体现了对一些重要理论知识的重组。本任务进程以任务描述开始,以分项任务小结结束,希望读者在完成分项任务之后,能够及时进行自我的过程性评价。本任务项目目标:完成本任务后,读者应该能够熟练地进行调查数据的处理与描述统计分析。【课后自测】一、单选题1.通常数据录入前,问卷至少应经过()次编辑整理。A.1B.2C.3D.42.()是指对一个问题的不同答案进行分组和确定数字代码的过程。A.确认B.编码C.录入D.转换3.在平面坐标上标注各数据点并连接成折线,表现数量变化规律及特点的统计图是()A.饼形图B.柱形图C.线图D.直方图4.开放式问题的编码,会由于调查者的判断而存在一定的主观性,所以问卷调查中不宜过多设计开放式问题,一股以()个为宜。A.1-2个B.5-6个C.10-15个D.15-20个5.数据的()是指将问卷或调查表或登录卡上的编码数字读到磁盘、磁带中,或通过键盘直接输入到计算机的工作过程。A.确认B.编码C.录入D.制表二、多选题1.调查数据处理的一般步骤是()A.确认和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全科医学正高答辩要点解析
- 2025年中国浙江羊肉干香料市场调查研究报告
- 2025年中国户外高压隔离开关市场调查研究报告
- 2025年中国双耳环铜香炉市场调查研究报告
- 针灸治疗不寐症的临床应用与研究
- 静脉压力治疗应用规范
- 重性精神障碍管理
- 2025至2030年中国高速锣机行业发展研究报告
- 2025至2030年中国马海毛织物行业发展研究报告
- 2025至2030年中国隔爆型防爆投光灯行业发展研究报告
- 中医儿科学研究进展知到课后答案智慧树章节测试答案2025年春浙江中医药大学
- 食品安全防护计划评估表
- 2016中国石油石化企业信息技术交流大会论文公示名单
- 环境因素识别评价培训
- 建设项目职业卫生“三同时”课件
- 未成年人专门矫治教育制度适用研究
- 2024年05月上海中国银联技术类社会招考(529)笔试历年参考题库附带答案详解
- 口腔临床诊疗指南
- 2025年华侨港澳台学生联招考试英语试卷试题(含答案详解)
- 2024建筑消防设施维护保养操作规程
- 2025年益阳市中心医院公开招聘工作人员历年高频重点提升(共500题)附带答案详解
评论
0/150
提交评论