调研资料的处理与数据分析ppt课件_第1页
调研资料的处理与数据分析ppt课件_第2页
调研资料的处理与数据分析ppt课件_第3页
调研资料的处理与数据分析ppt课件_第4页
调研资料的处理与数据分析ppt课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第四章 调研资料的处置和数据分析调研资料的处置和数据分析u数据的预备数据的预备u资料的初步分析资料的初步分析列表列表u资料的统计推断资料的统计推断数数据据预预备备过过程程问卷确认问卷确认数据编辑数据编辑数据编码数据编码数据转录数据转录实地编辑实地编辑办公室编辑办公室编辑4.14.1数据的预备数据的预备问卷检查问卷检查数据编码数据编码数据录入数据录入一、问卷检查一、问卷检查n 确认确认n 对访问员的欺骗行为及调查能否严守程序进展对访问员的欺骗行为及调查能否严守程序进展核实核实 n 复查复查10-20%10-20% 问卷能否有效问卷能否有效1 1、确认此人能否真正接受了调查?、确认此人能否真

2、正接受了调查?2 2、被调查者能否符合条件?、被调查者能否符合条件?3 3、确认调查能否按要求的方式进展的?、确认调查能否按要求的方式进展的?4 4、确认调查能否完好。、确认调查能否完好。 5 5、检查其他方面的问题。、检查其他方面的问题。 讯问调查的几种作弊方式:讯问调查的几种作弊方式: 留纸条留纸条; ;伪造录音伪造录音; ; 找熟人填答问卷;找熟人填答问卷; 只访问前后,中间部分跳问。只访问前后,中间部分跳问。n 实地编辑现场效力企业主管实地编辑现场效力企业主管n 完好性完好性n 清楚性清楚性n n 内容一致性内容一致性n 明确性明确性 n n 单位一致性单位一致性n 填补缺失值填补缺失

3、值 丢弃丢弃 追访追访u非构造性问题非构造性问题u他为什么在众多的快捷、方便的餐馆中选择经常去他为什么在众多的快捷、方便的餐馆中选择经常去肯德基?肯德基?u记录记录1 1:顾客似乎觉得肯德基有更加美味的食物和一:顾客似乎觉得肯德基有更加美味的食物和一流的效力环境。流的效力环境。u记录记录2 2:由于我喜欢它。:由于我喜欢它。u记录记录3 3:由于我喜欢它。:由于我喜欢它。P P我喜欢它并且我经常去那我喜欢它并且我经常去那里,由于那是离我任务的地方最近的餐馆。里,由于那是离我任务的地方最近的餐馆。AEAE没有。没有。u构造性问题构造性问题n 办公室编辑调研公司办公室编辑调研公司n n 不完全回答

4、不完全回答n 错误回答错误回答n 无兴趣回答无兴趣回答n 打乱顺序回答打乱顺序回答大面积无回答大面积无回答个别问题无回答个别问题无回答相当多问卷对同一个群问题无回答相当多问卷对同一个群问题无回答逻辑修正、缺失值逻辑修正、缺失值补救措施补救措施废卷废卷废卷废卷独立子群体独立子群体抄回抄回二、数据编码二、数据编码l 编码设计编码设计l 确定各问卷、问卷中的各问题以及问题的各答确定各问卷、问卷中的各问题以及问题的各答案对应的代码的称号、方式、范围以及与原数据案对应的代码的称号、方式、范围以及与原数据的对应关系。的对应关系。 l 封锁式问题的编码封锁式问题的编码l 单项选择题单项选择题l 多项选择题:

5、变量个数多项选择题:变量个数= =选项个数选项个数l 排序题:变量名排序题:变量名= =选项号,取值选项号,取值= =排序号排序号l 填入式题:填入式题:l 开放式问题的编码开放式问题的编码问卷编码问卷编码 1031102 1031102变量定义变量定义 称号、类型、位数、对应的问题称号、类型、位数、对应的问题取值定义取值定义 取值范围取值范围 对应的含义对应的含义 变量变量序号序号变变量量名名变量变量类型类型变量变量所占所占字节字节取值取值范围范围取值取值对应对应含义含义备备注注对应对应题号题号对应对应问题问题请问您乘坐的舱位是:请问您乘坐的舱位是: 1. 1.头等舱头等舱 2. 2.公务舱

6、公务舱 3. 3.经济舱经济舱变变量量序序号号变变量量名名变变量量类类型型变量变量所占所占字节字节取值取值范围范围取值对应取值对应含义含义备备注注对应对应题号题号对应问对应问题题3 3V V2 2数数值值型型1 11-31-3,9 91-1-头等舱头等舱2-2-公务舱公务舱3-3-经济舱经济舱9-9-无回答无回答2 2请问您请问您乘坐的乘坐的舱位是舱位是4 4、您最关注的时髦资讯是、您最关注的时髦资讯是 可多项选择可多项选择A A、运动健身、运动健身 B B、美容、美容 C C、化装、化装/ /护肤品护肤品 D D、饰品、饰品E E、美发、美发 F F、服装、服装G G、数码电子产品、数码电子

7、产品 H H、美食、美食 I I、旅游、旅游J J、其他、其他_变变量量序序号号变量变量名名变变量量类类型型变量变量所占所占字节字节取值取值范围范围取值对应取值对应含义含义备注备注对对应应题题号号对应问对应问题题5 56 67 78 89 910101111121213131414V4-1V4-1V4-2V4-2V4-3V4-3V4-4V4-4V4-5V4-5V4-6V4-6V4-7V4-7V4-8V4-8V4-9V4-9V4-10V4-10数数值值型型1 11 11 11 11 11 11 11 11 11 10-10-10-10-10-10-10-10-10-10-10-10-10-10-

8、10-10-10-10-10-10-1取值为取值为1 1表明该表明该选项为选项为最关注最关注的时尚的时尚资讯,资讯,为为0 0则不则不是是 全全为为0 0表表示示该该题题无无回回答答 4 4请问请问您您最关注最关注的时尚的时尚资讯是?资讯是?2323、您以为时髦人士应具有的特征是:、您以为时髦人士应具有的特征是:FCA FCA 可可多项选择,假设多项选择请对选项排序多项选择,假设多项选择请对选项排序67-7367-73A A、名牌产品的消费者、名牌产品的消费者 3 B 3 B、周围人效仿的对象、周围人效仿的对象0 0C C、在公众场所经常成为人们关注的焦点、在公众场所经常成为人们关注的焦点2

9、2D D、与众不同的风格和个性、与众不同的风格和个性 0 0 E E、推崇时髦的生活方式、推崇时髦的生活方式0 0F F、熟习各种时髦信息、熟习各种时髦信息1 G1 G、其他、其他_0 _0 变变量量序序号号变量变量名名变变量量类类型型变量变量所占所占字节字节取值取值范围范围取值对应取值对应含义(含义(i il l7 7的的整数)整数) 备注备注对对应应题题号号对应问对应问题题6767686869697070717172727373V23-1V23-1V23-2V23-2V23-3V23-3V23-4V23-4V23-5V23-5V23-6V23-6V23-7V23-7数数值值型型1 11 1

10、1 11 11 11 11 10-70-70-70-70-70-70-70-70-70-70-70-70-70-7取值为取值为i i表明该表明该选项的选项的排名为排名为i i,为为0 0则表则表明对该明对该选项的选项的排名缺排名缺失失 全全为为0 0表表示示该该题题无无回回答答 2323请问您请问您认为时认为时尚人士尚人士应具有应具有的特征的特征是?是? 1616、您每周锻炼身体的次数是、您每周锻炼身体的次数是_次。次。变变量量序序号号变变量量名名变变量量类类型型变量变量所占所占字节字节取取值值范范围围取值对取值对应含义应含义(i i0 09 9的的整数)整数) 备注备注对对应应题题号号对应对

11、应问题问题6060V16V16数数值值型型1 10-90-9,1010取值为取值为i i表明每表明每周锻炼周锻炼的次数的次数为为i i次次取值取值1010表表示该示该题无题无回答回答1616您每您每周锻周锻炼身炼身体的体的次数次数列出答案列出答案合并合并选择正式词汇概略选择正式词汇概略制定编码规那么制定编码规那么编码编码问题:为什么您喜欢喝那个牌子的啤酒?问题:为什么您喜欢喝那个牌子的啤酒?答案:答案:1 1、由于他口味较好、由于他口味较好 2 2、它具有较好的味道、它具有较好的味道 3 3、我喜欢它的口味、我喜欢它的口味 4 4、我不喜欢其他啤酒太重的口味、我不喜欢其他啤酒太重的口味 5 5

12、、它最廉价、它最廉价 6 6、我买任何打折的啤酒,它大部分时间都打折、我买任何打折的啤酒,它大部分时间都打折 7 7、它不像其他牌子的啤酒那样使我的胃不温馨。、它不像其他牌子的啤酒那样使我的胃不温馨。三、数据录入三、数据录入u键盘录入键盘录入u 先定义变量再录入数据先定义变量再录入数据u机器读卡机器读卡u扫描扫描4.24.2资料的初步分析资料的初步分析列表列表u资料的分析与解释资料的分析与解释u单要素表格化分析单要素表格化分析u多要素列表分析多要素列表分析一、资料的分析与解释一、资料的分析与解释分析是以某种有意义的方式或次序把搜集的资料重新分析是以某种有意义的方式或次序把搜集的资料重新展现出来

13、。展现出来。P165 P165 eg: eg:美国家庭的平均收入为美国家庭的平均收入为202000202000元。元。解释是在资料分析的根底上找出信息之间或手中信息解释是在资料分析的根底上找出信息之间或手中信息与其他知信息的联络。与其他知信息的联络。 美国家庭收入与汽车保有量成正向关系。美国家庭收入与汽车保有量成正向关系。 eg: eg:美国家庭平均收入是中国家庭平均收入的美国家庭平均收入是中国家庭平均收入的1.21.2倍。倍。列表:把调查资料按照一定的目的、用表格的方式展列表:把调查资料按照一定的目的、用表格的方式展现出来。其根本方法是计数变量值的出现次数。现出来。其根本方法是计数变量值的出

14、现次数。P148P148二、单要素表格化分析二、单要素表格化分析单向列表:仅计数一个变量的不同数值的出现次数。单向列表:仅计数一个变量的不同数值的出现次数。弄清弄清“无回答景象的程度无回答景象的程度-缺省值缺省值 保管保管 暂时排除暂时排除 替补替补 弄清弄清“编误与编误与“飞点发生于何处飞点发生于何处-箱索图箱索图 在作单向列表时,能够发现一些不正常的数值,经在作单向列表时,能够发现一些不正常的数值,经查对原值并非如此,像这种发生在数据编码和登录过查对原值并非如此,像这种发生在数据编码和登录过程中的误差为程中的误差为“编误。编误。弄清变量的阅历分布弄清变量的阅历分布 图形直方图图形直方图 频

15、数分布表频数分布表计算主要的描画目的计算主要的描画目的 众数众数 中位数中位数 算术平均值算术平均值 求和求和 规范规范差差三、多要素列表分析三、多要素列表分析交叉列表:同时计数两个或多个变量的不同数值交叉列表:同时计数两个或多个变量的不同数值结合出现的次数。结合出现的次数。双向交叉列表双向交叉列表三向交叉列表三向交叉列表变量关系的详析变量关系的详析P164P164 两变量间存在关系:两变量间存在关系: 继续支持继续支持 关系减弱或加强关系减弱或加强 有条件存在关系有条件存在关系 虚伪关系虚伪关系 两变量间不存在关系:两变量间不存在关系: 继续支持继续支持 关系存在关系存在 有条件存在关系有条

16、件存在关系. .家家庭庭人人口口( (2 2) ) ( (B Ba an nd de ed d) ) * * 汽汽车车保保有有量量( (6 6) ) ( (B Ba an nd de ed d) ) C Cr ro os ss st ta ab bu ul la at ti io on n7087 78 889.7%10.3%1 10 00 0. .0 0% %5172 22 222.7%77.3%1 10 00 0. .0 0% %7 75 52 25 51 10 00 07 75 5. .0 0% %2 25 5. .0 0% %1 10 00 0. .0 0% %CountRow %Co

17、untRow %CountRow %= 45+家庭人口(2)(Banded)T To ot ta al l= 12+汽车保有量(6)(Banded)T To ot ta al l收入(百万元)(1) (Banded) * 汽车保有量(6) (Banded) Crosstabulation收入(百万元)(1) (Banded) * 汽车保有量(6) (Banded) Crosstabulation477545487.0%13.0%100.0%100.0%2818464660.9%39.1%100.0%100.0%7575252510010075.0%75.0%25.0%25.0%100.0%10

18、0.0%CountRow %CountRow %CountRow %= 175176+收入(百万元)(1) (Banded)TotalTotal= 12+汽车保有量(6)(Banded)TotalTotal收入(百万元)(1) (Banded) * 汽车保有量(6) (Banded) * 家庭人口(2) (Banded) Crosstabulation收入(百万元)(1) (Banded) * 汽车保有量(6) (Banded) * 家庭人口(2) (Banded) Crosstabulation433464693.5%6.5%100.0%100.0%275323284.4%15.6%100.

19、0%100.0%70708 8787889.7%89.7%10.3%10.3%100.0%100.0%448 850.0%50.0%100.0%100.0%11314147.1%92.9%100.0%100.0%5 51717222222.7%22.7%77.3%77.3%100.0%100.0%CountRow %CountRow %CountRow %CountRow %CountRow %CountRow %= 175176+收入(百万元)(1) (Banded)TotalTotal= 175176+收入(百万元)(1) (Banded)TotalTotal家庭人口(2) (Banded

20、)= 45+= 12+汽车保有量(6)(Banded)TotalTotal家庭人口(2) (Banded) * 汽车保有量(6) (Banded) * 收入(百万元)(1) (Banded) Crosstabulation家庭人口(2) (Banded) * 汽车保有量(6) (Banded) * 收入(百万元)(1) (Banded) Crosstabulation433464693.5%6.5%100.0%100.0%448 850.0%50.0%100.0%100.0%47477 7545487.0%87.0%13.0%13.0%100.0%100.0%275323284.4%15.6%

21、100.0%100.0%11314147.1%92.9%100.0%100.0%28281818464660.9%60.9%39.1%39.1%100.0%100.0%CountRow %CountRow %CountRow %CountRow %CountRow %CountRow %= 45+家庭人口(2)(Banded)TotalTotal= 45+家庭人口(2)(Banded)TotalTotal收入(百万元)(1) (Banded)= 175176+ 临界值临界值 那么回绝原假设那么回绝原假设2210:HH二、卡方检验二、卡方检验 某厂消费一种新型山地车,特推出美观轻便型、某厂消费一

22、种新型山地车,特推出美观轻便型、经济耐用型和速度型三种款型。为了解用户对三经济耐用型和速度型三种款型。为了解用户对三种款型有无显著性偏好,该消费企业在假设干大种款型有无显著性偏好,该消费企业在假设干大城市随机调查了城市随机调查了600600名消费者,结果表示情愿选择名消费者,结果表示情愿选择美观轻便型的美观轻便型的246246人,情愿选择经济耐用型的人,情愿选择经济耐用型的152152人,情愿选择速度型的人,情愿选择速度型的202202人。问能否根据上面的人。问能否根据上面的调查结果判别三种款型中有一种受欢迎程度显著调查结果判别三种款型中有一种受欢迎程度显著地高于其他两种?地高于其他两种?ki

23、iiiEEO122)(:0H:1H1222200200202200200152200200246222122.)()()()(kiiiiEEO三种款型受欢迎的程度一样三种款型受欢迎的程度一样三种款型受欢迎程度存在显著性差别三种款型受欢迎程度存在显著性差别选定显著性程度选定显著性程度 程度存在显著差异。程度存在显著差异。即认为三种款型受欢迎即认为三种款型受欢迎,接受,接受,所以拒绝,所以拒绝由于由于)(分布表得:分布表得:查查自由度自由度102005. 022005. 022)2(597.10)2(12131kdf,005. 0HHk 三、三、Z Z检验检验 沃尔玛超市为了解消费者对其评价的好坏,随机抽取了沃尔玛超市为了解消费者对其评价的好坏,随机抽取了20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论