




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1问卷调查的数据分析方法问卷调查的数据分析方法一、资料收集1有关被调查者社会特征的资料被调查者的身份背景,包括年龄、性别、婚姻、教育程度、职业、收入和社会阶层等等。2有关被调查者购买行为特征的资料表现在购买的产品和品牌、商品的价格,购买的地点选择,购买的数量和支付方式等3有关被调查者心理的资料购买认知、购买动机、购买意向和购买态度等。但是,购买者的心理是很难被准确测量的4有关被调查者购买行为结果的资料年度商品房成交金额、年度二手房成交面积、年度二手房成交金额、销售率、企业的市场占有率二、数据审核数据审核的作用保证信息前后一致,不出现逻辑的、登记的、计算的错误提高工作效率,避免重复劳动有利
2、于提高信息资料的质量数据审核的内容完整性审核完整性审核准确性审核准确性审核一致性审核一致性审核及时性审核及时性审核二、数据审核数据审核的方法经验判断经验判断逻辑检查逻辑检查计算审核计算审核数据审核的注意事项实地审核实地审核(调查员和督导审核):检查数据完整性、正确性、一致性、可信性中心办公室审核中心办公室审核:比实地审核更完全、确切和仔细,要求审核员的目光更加锐利,审核时更加认真、仔细。为保证处理方法的一致性,审核工作最好由同一个人完成。年龄:151岁年龄:12岁婚姻:已婚加总法、对比法、平衡法二、数据审核初步筛选抽样电话回访主要问题处理 首先,各调查组分别在组内对当天所做问卷进行逻辑审核,核
3、选出内容填写完整、符合逻辑的问卷。然后,对各组问卷进行汇总并统计初步有效问卷数量,归档保存。二、数据审核u无效问卷的情况:u回答不完全u没有理解问卷内容答错问题(单项题选多项答案)u回答可疑(如所有题目答案均为2)u缺损的问卷(缺页或无法辨认)u截止日期之后回收的问卷u非调查对象填写的问卷(调查对象是病人,则非病人的答卷无效)u前后矛盾或明显有错误的问卷初步筛选抽样电话回访主要问题处理二、数据审核初步筛选抽样电话回访主要问题处理u敏感性问题:对于被调查者姓名、身份证、联系电话这一敏感性问题,仅对抽样回访的样本作严格要求,其他问卷参考逻辑性问题,只要逻辑性问题有效,就视该问卷有效。u逻辑性问题:
4、逻辑关系不成立,则该份问卷无效。u未填问题:应填不填的空项。u调查完成后,对初步有效问卷进行10的抽样检查,以确保样本质量。u通过被访者留下的个人资料,进行电话回访,确认个人资料及所填问卷内容是否详实。对一些次要内容漏选的问卷进行补查,经询问后内容补充完整的问卷也可归为有效问卷。u如果被调查者所留电话不属实或查无此号,则视为无效,总样本中不再重复抽样核查。最后统计有效问卷数量。u问题的处理措施:u退回重新调查u视为缺失数据(这样的问卷较少时、有令人不满意的回答的变量不是关键变量时)u放弃不用该问卷(这样的问卷较少时、样本量很大、该问卷中令人不满意回答的比例较大、该问卷关键变量回答缺失)三、数据
5、编码数据编码的作用减少数据录入和分析工作量,节省费用和时间,提高效率将定性数据转化为定量将定性数据转化为定量数据数据,把整个问卷的信息转化为规范标准的数据进而可以利用统计软件,采用统计分析方法进行定量分析减少误差编码设计内容1编码设计的内容:问卷的代问卷的代码、变量的定义码、变量的定义问卷代码包括:区代码、街道问卷代码包括:区代码、街道代码、居委会代码、调查员代代码、居委会代码、调查员代码、问卷代码码、问卷代码某问卷代码:10512021北京市,05调查员代号,12居委会代号,02-该调查员在此居委会成功调查的第2份问卷三、数据编码编码设计内容调查问卷通常包括各种问题,数据输入前,必数据输入前
6、,必须给每个问题或变量起须给每个问题或变量起一个变量名称一个变量名称B-B-背景类问题背景类问题Q-Q-主体问题主体问题S-S-筛选问题筛选问题编码设计的分类前设计编码前设计编码针对答案针对答案类别事先已知的问题类别事先已知的问题后设计编码后设计编码针对答案针对答案类别事先未知的问题类别事先未知的问题三、数据编码前设计编码: 单项选择题,只需规定一个变量,取值为选项号 多项选择题,通常将各个可能回答的答案选项都设为0-1变量,被调查者选择了该答案,变量为1,否则为0。 排序题与多选题类似,变量个数即选项个数,分别定义各变量为对应选项所排次序号,取值即为次序号。三、数据编码Q1.你的性别:1、男
7、 2、女(变量的取值1、2、9,9表示缺省值,不能与合理回答重复)Q2.您选择建材购买场所考虑的因素有哪些?1、公司信誉 2、服务 3、价格 4、质量 5、广告宣传 6、其他Q21:0 Q22:1 Q23:1 Q24:1 Q25:0 Q26:0Q3.您选择万科的楼盘考虑的因素是(请按重要程度排序)什么?1、公司信誉 2、楼盘质量 3、地理位置 4、楼盘价格 5、服务水平Q31:4 Q32:1 Q33:3 Q34:2 Q35:5 (某调查者回答:24315;如何编码)三、数据编码后设计编码方法: 随即抽取(分层抽取)部分问卷,尽量使问卷分布分散些。 仔细阅读每个被调查者对该特定问题的回答,每遇到
8、一个新的答案类别就记下来,同时记录其频数 结合调查分析目的,对各答案类别进行整理归纳,突出分析重点,尽量包含所有信息且互不交叉,将不能编码或个数较少、可不予考虑的答案归入其他。 留出位置准备修改,以备后期出现新的类别,可以增加或细化类别四、数据录入(1)录入形式:Excel数据库形式。主要考虑是录入人员较为熟悉,应用较为普遍,后期统计处理时数据格式转换也较为方便。(2)录入标准:首先制作标准的Excel文件,然后写出详细的录入说明,对照问卷向录入人员讲解,保证录入数据准确。四、数据录入数据有效性四、数据录入核查数据录入核查:u有限选择项可以用一般性排序核查方法。例如Q1只能填录1,2,3,如果
9、超出3个答案,肯定是错了。u范围性排序核查对于具体数值,如果有一些正常范围的,也可以通过排序检查出错误。如身高、年龄应在正常的范围内。五、数据整理1、分类数据的整理u分类数据的整理u列出各类别u计算各类别的频数u制作频数分布表u用图形显示数据(条形图、饼图)分类分类频数频数比例比例百分比百分比比率比率AB五、数据整理1、分类数据的整理调查者性别调查者1男1调查者2男1调查者3女2调查者4女2调查者5男1调查者6女2调查者7男1调查者8男1调查者9男1调查者10女201234567男女其他频率频率接收接收直方图直方图频率五、数据整理1、分类数据的整理五、数据整理1、分类数据的整理五、数据整理1、
10、分类数据的整理五、数据整理1、分类数据的整理五、数据整理2、定序数据的整理五、数据整理2、定序数据的整理五、数据整理2、定序数据的整理111569900.00%20.00%40.00%60.00%80.00%100.00%120.00%024681012141612345其他频率频率接收接收直方图直方图频率累积 %五、数据整理3、数值型数据整理前面分类数据、定序数据整理的方法也适用于数值型数据的整理,此外数值型数据还有些特定的整理和图示方法 (1)数据分组 (2)频数分布的编制数值型数据的整理 (1)直方图和折线图 (2)茎叶图数值型数据的图示五、数据整理3、数值型数据整理数据分组:单变量值分
11、组(离散变量)+组距分组(连续变量)分组A A、全距全距R R= =最大值最大值- -最小值最小值B、确定组数:确定组数:(1 1)划分的组数,既不应太多也不应太少;)划分的组数,既不应太多也不应太少;(2 2)组数的确定,要尽量保证组间资料的差异性与组内)组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;(资料的同质性;(3 3)采用的分组办法,要能够充分显示)采用的分组办法,要能够充分显示客观现象本身存在的状态。客观现象本身存在的状态。C、组距组距= =全距全距/ /组数组数(等距分组时)(组距与组数反比)组限=某组的上限值-该组下限值D、确定组限时应注意:确定组限时应注意:(1
12、1)第一组的下限值应比最小的)第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一观察值小一点,最后一组的上限值应比最大的观察值大一点;(点;(2 2)特别需要或不得已的情况除外,最好不要使用)特别需要或不得已的情况除外,最好不要使用开口组;(开口组;(3 3)组限应取得美观些,按数字偏好,组限值)组限应取得美观些,按数字偏好,组限值应能被应能被5 5除尽,且一般要用整数表示除尽,且一般要用整数表示斯特基给出的计算公式:uE、确定各组观察值出现的频数:凡观察值落在某一区间的,就计发生一次,最后统计各组观察值发生的总次数。采用组距分组时,需要遵循“不重不漏”的原则。u为解决
13、“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内五、数据整理3、数值型数据整理数据分组:单变量值分组(离散变量)+组距分组(连续变量)148140127120110104128135129123116109132135129123110108148135128123114108132124120125116118125137107113132140137119119127129119124130118107113122128114最大值148最小值104全距44k=LOG10(50)/LOG10(2)=5
14、.6(取5)组距=44/5 (取10)分组情况100-110110-120120-130130-140140-150五、数据整理3、数值型数据整理数据分组:单变量值分组(离散变量)+组距分组(连续变量)接收频率累积 %109612.00%1191338.00%1291874.00%139992.00%1494100.00%其他0100.00%五、数据整理3、数值型数据整理数据分组:单变量值分组(离散变量)+组距分组(连续变量)12.00%38.00%74.00%92.00%100.00%100.00%0.00%20.00%40.00%60.00%80.00%100.00%120.00%0246
15、8101214161820109119129139149其他频率频率接收接收直方图直方图频率累积 %五、数据整理3、数值型数据整理茎叶图1481401271201101041281351291231161091321351291231101351281231141081321241201251161181251371071131321401191271291191241301181071131221281141041071071081081091101101131131141141161161181181191201201221231231231241241251251271271281281
16、28129129130132132132135135135137137140140148148排序五、数据整理3、数值型数据整理104107107108108109110110113113114114116116118118119119120120122123123123124124125125127127128128128129129130132132132135135135137137140140148148104778891100334466889991200233344557788899 913022255577140088问题:茎叶图与直方图有何联系?接收频率累积 %109612.0
17、0%1191338.00%1291874.00%139992.00%1494100.00%其他0100.00%五、数据整理3、数值型数据整理数据类型数据的整理 数据的显示分类数据 频数、比例、比率、百分比 条形图、圆形图 顺序数据 频数、比例、比率、百分比、累积频数、累积百分比 条形图、圆形图、累积分布图 数值型数据 频数、比例、比率、百分比、累积频数、累积百分比、分组(单变量分组、组距分组) 条形图、圆形图、累积分布图、直方图、折线图 五、数据整理3、数值型数据整理统计分组u统计分组如果原始数据非常琐碎,则通过分组反映出研究对象的各项基本特征。u统计分组可以分为单一分组和复合分组。u单一分组
18、是按一种标志进行分类,如按年龄分、按性别分。u复合分组是按两种或两种以上标志进行分类,如按不同年龄性别分。u另外,对于分组还有一条默认的规则,即“上限不在内”,例如对于30-40岁和40-50岁组,40岁的样本在后一组。 五、数据整理3、数值型数据整理单一分组表1购物场所类型偏好统计表 表2年龄结构比例表购物场所 人数 综合商厦 1175 商业街店铺 350 小市场小店铺 51 总计数 1576 年龄 人数 小于30岁 762 30一40岁 492 40一50岁 167 50岁以上 121 未选 34 总人数 1576 五、数据整理3、数值型数据整理复合分组表3 年龄和购物场所类型交叉分析结果
19、表 50岁 未填 总体 综合商厦 517 396 136 100 26 1 175 67.8% 80.5% 81.4% 82.6% 76.5% 74.6% 商业街店铺 225 81 24 12 8 350 29.5% 16.5% 14.4% 9.9% 23.5% 22.2% 小市场小店铺 20 15 7 9 51 2.7% 3.0% 4.2% 7.5 0.0% 3.2% 五、数据整理3、数值型数据整理交叉分析表的制作调查者 性别 商场 超市街边小店调查者1男1 00调查者2男100调查者3女010调查者4女100调查者5男010调查者6女100调查者7男101调查者8男100调查者9男001调
20、查者10 女100五、数据整理3、数值型数据整理交叉分析表的制作五、数据整理3、数值型数据整理交叉分析表的制作一、静态分析指标1、总量指标总量指标概念和作用总量指标可用来反映一个国家、地区、部门或单位的基本状况按反映时间状况的不同,分为时期指标(时期指标(如人口出生数、商品销售额、产品产量)和时点)和时点指标(指标(年末人口数、月末商品库存数)2、相对指标相对指标概念和作用相对指标可以更清楚地反映社会经济现象之间的相对水平和联系程度。相对指标的表现形式:无名数无名数形式、有名数形式形式、有名数形式1、总量指标一、静态分析指标相对指标种类及计算方法结构相对指标比例相对指标比较相对指标强度相对指标
21、动态相对指标计划完成程度相对指标甲公司职工男职工人数占职工人数的70% 甲公司职工男职工人数是女职工人数的2倍甲地职工平均收入是乙地职工平均收入的1.3倍2、相对指标一、静态分析指标3、平均指标(一)平均指标的概念(一)平均指标的概念(二)平均指标的作用(二)平均指标的作用(三)平均指标的种类(三)平均指标的种类平均指标可以是同一时间的同类社会经济现象的一般水平,称为静态平均数,也可以是不同时间的同类社会经济现象的一般水平,称为动态平均数。平均指标按计算和确定的方法不同,分为算术平均数、调和平均数、几何平均数、众数和中位数一、静态分析指标3、平均指标平均指标算术平均数简单算术平均数加权算术平均
22、数调和平均数(倒数平均数)简单调和平均数加权调和平均数几何平均数众数中位数(1+2+3)/33/(1/1+1/2+1/3)(1*2*3)*(1/3)1 2 3 3 2 2 2 2将数列按大小顺序排列,处于中间位置的标志值就是中位数1 2 3 4 5 8 91 2 3 5 8 9一、静态分析指标4、变异指标 变异指标可以说明平均数代表性的大小平均数代表性的大小 变异指标可以反映研究对象的变量值的均衡性和稳定性变异指标的作用变异指标的作用标准差标准差标准差系数标准差系数0 01 1分布的标准差分布的标准差xxppxXP11 XEVNXXNiiX12一、静态分析指标变异指标变异指标极差极差极差极差=
23、 =最大值最大值- -最小值最小值平均差平均差一组数据与其均值之差的绝对值之和的平一组数据与其均值之差的绝对值之和的平均数均数方差方差一组数据与其均值之差的平方和的平均数一组数据与其均值之差的平方和的平均数标准差标准差标准差是方差的平方根标准差是方差的平方根极差系数极差系数极差与平均值的比值极差与平均值的比值平均差系数平均差系数平均差与平均值的比值平均差与平均值的比值标准差系数标准差系数标准差与平均值的比值,也叫变异系数、标准差与平均值的比值,也叫变异系数、离散系数离散系数绝对度量指标相对度量指标,可以反应相对趋势4、变异指标二、动态分析指标 前面提到的统计量,主要根据同一时期的统计指标进行计
24、算分析,有时也被称为静态分析。而有时需要从事物发展角度进行分析,即考虑时间发展,被称为动态分析累计增长量:报告期发展水平减固定基期发展水平之差逐期增长量:报告期发展水平减前一期发展水平之差定基发展速度:报告期水平与固定基期水平之比环比发展速度:报告期发展水平与前一期发展水平之比平均发展速度:反映现象逐期发展的平均速度定基增长速度:报告期比固定基期的增长量,与固定基期水平之比环比增长速度:报告期比前一期的增长量与前一期水平之比平均增长速度:反映某种现象在一个较长时期中逐期递增的平均速度二、动态分析指标n发展速度:说明事物发展快慢程度的动态相对数n增长速度:表明社会现象增长程度的相对指标n平均增长
25、速度(%)=平均发展速度1(或100%)例:某地固定资产投资1994年为366亿元,1993年为328亿元,u发展速度:3663281.12,用百分数表示为112,用倍数表示则是1.12倍。u增长速度:(366328)3280.12,用百分数表示则为12。三、统计表统计表把统计汇总数据、统计量、统计指标等用一定形式的表格表示出来就是统计表。统计表是比较形象的一种统计分析方式。(1)统计表的一般形式u统计表一般由标题、横行、竖栏、标目、统计数字、说明等构成。u分为简单表、分组表和复合分组表三、统计表u按某一标志进行分组,这样的统计表就叫做简单分组表u复合分组表指的是在第一次分组的基础上再分小组,
26、每复合一次,组的个数都翻一倍统计表设计原则表的内容应简明扼要,主题突出,如果内容太多,可分成多个表。标题要清晰,概括地反映表的内容,与说明的问题一致。分组合理,指标排列合乎逻辑,标明计量单位。整理后的统计数据不能有空白,数据为“0”的不能省略,不能以数据表示的标成“一”,缺项或暂时未定的标为“”。四、统计图绘制统计图的基本要点是:目的明确,主题突出。选择适当的类型。准确形象。饼图反映比例关系圆环图显示各个部分与整体之间的关系,但是它可以包含多个数据系列柱形条形图、圆柱图、圆锥图、棱锥图折线图反映发展趋势11, 22%15, 30%6, 12%9, 18%9, 18%频率频率旭日升冰茶可口可乐汇
27、源果汁露露百事可乐12, 24%4, 8%17, 34%10, 20%7, 14%11, 22%15, 30%6, 12%9, 18%9, 18%1234501020旭日升冰茶可口可乐汇源果汁露露百事可乐系列161318940510152012345频率频率频率五、相关分析v (1)相关系数计算2222)()(YYNXXNYXXYNrn(2)判断相关性 0 r 0.3 基本无相关 0.3 r 0.5 弱相关 0.5 r 0.8 中度相关 0.8 r 1 强相关 r1 函数关系五、相关分析例:某调查得各家庭月收入与月储蓄如下表:(1) 在表中计算出 、 、 、 、 ;(2) 计算相关系数 r=0
28、.970.8 属强相关关系。XYXY2X2Y97. 031923128101949443128961024102929522109629231161022x五、相关分析五、相关分析五、相关分析六、回归分析 如果某种数据的历史值是按时间呈线性相关的,即时间是自变量,数据值是因变量,则可采用回归分析法。1、问题的提出六、回归分析2、建立多元线性回归模型六、回归分析3、多元线性回归模型求解及检验二、数据审核初步筛选抽样电话回访主要问题处理 首先,各调查组分别在组内对当天所做问卷进行逻辑审核,核选出内容填写完整、符合逻辑的问卷。然后,对各组问卷进行汇总并统计初步有效问卷数量,归档保存。二、数据审核初步筛选抽样电话回访主要问题处理u敏感性问题:对于被调查者姓名、身份证、联系电话这一敏感性问题,仅对抽样回访的样本作严格要求,其他问卷参考逻辑性问题,只要逻辑性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酶结构解析-洞察及研究
- 有限理性认知偏差-洞察及研究
- 大规模网络社区发现-洞察及研究
- 口述历史的记忆再现-洞察及研究
- 通信设备企业股权内部转让及研发创新协议
- 创业团队股权激励与退出机制协议
- 2025年心理学基础知识应用测试试卷及答案
- 2025年心理测评与咨询专业试卷及答案
- 2025年农村合作社管理考试试卷及答案
- 2025年教师资格考试复习试题及答案
- 2025年河南高考真题化学试题含答案
- 2025年高考全国二卷数学高考真题解析 含参考答案
- 2025年普通高等学校招生全国统一考试数学试题(全国一卷)(有解析)
- 防火门施工方案及工艺流程
- 护士文职面试题及答案
- 解剖期末试题题库及答案
- 【高分复习笔记】胡裕树《现代汉语》(重订本)笔记和课后习题(含考研真题)详解
- 保姆带小孩合同协议书
- 工程监理资料管理制度
- 2025春季学期国开电大专科《中级财务会计(二)》一平台在线形考(第一至四次形考任务)试题及答案
- 2025年日历表全年(打印版)完整清新每月一张
评论
0/150
提交评论