抽样设计PPT课件.ppt_第1页
抽样设计PPT课件.ppt_第2页
抽样设计PPT课件.ppt_第3页
抽样设计PPT课件.ppt_第4页
抽样设计PPT课件.ppt_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样设计 SAMPLINGDESIGN 1 内容提要 1 抽样的基本步骤2 非概率抽样方法3 概率抽样方法4 样本量的的确定5 回答率问题 2 抽样的基本概念 抽样 Sampling 是根据一定的规则和程序 从研究总体中抽取其中的一部分样本的过程 总体 Populaion 指的是享有一些共同特征 构成某项研究对象的所有个体的集合代表总体某些特征的统计指标叫参数 Parameters 样本 Sample 是从总体中选出来研究的一部分成员样本特征叫统计量 Statistics 3 样本设计过程 1 定义目标总体2 确定抽样框3 确定抽样方法与技术4 确定样本量5 实施抽样过程 4 定义目标总体 目标总体 targetpopulation 某项研究所要推论的所有个体的集合总体单位 element 构成目标总体的每一个单元 抽样总体 samplingpopulation 从中实际抽取样本的所有个体的集合 5 定义目标总体 某空调制造商拟进行一项空调满意度的调查目标总体 在调查前6个月内接受过该公司售后服务的所有国内用户抽样总体 在调查前6个月内接受过该公司售后服务 并留了联系方式的所有国内用户北京现代汽车公司拟进行一项用户满意度的调查 应该如何定义目标总体呢 6 确定抽样框 抽样框架 samplingframe 目标总体的可操作的定义编制抽样框时应当注意的问题 遗漏 遗漏部分样本单位 重复 同一样本单位重复出现 混杂 抽样框架中包括部分非样本总体成员 7 选择抽样方法 非概率抽样便利抽样判断抽样配额抽样滚雪球抽样 抽样方法 概率抽样简单随机抽样系统抽样分层抽样整群抽样 8 非概率抽样方法 非概率抽样方法事先并不确定每个样本单位被抽中的概率 讨论 网上消费者调查的抽样方法 9 非概率抽样方法 便利抽样 选择容易接触的个体作为调查研究对象判断抽样 根据研究者的判断 选择 有代表性 或 典型性 的样本单位配额抽样 将总体分层并确定每层应抽取的样本量 让调查员根据定额抽样滚雪球抽样 先抽取少量符合要求的样本 然后在访谈之后要求这些被访者推荐一些符合条件的其他人 10 三 概率样本设计 概率样本设计 probabilitysampledesign 采取随机的办法 排除研究人员主观因素的干扰 使样本总体中的每一个成员都有一个事先确定好抽中概率 简单随机抽样系统抽样分层抽样整群抽样 11 简单随机抽样 简单随机抽样 simplerandomsampling 是最基本的概率抽样方法 该抽样方法保证每一抽样单位都有相同的非零抽中概率 若总体为N 样本量为n 则每一抽样单位的抽中概率 p n N 12 系统抽样 系统抽样 systematicsampling 是随机抽取第一个样本单位 然后每隔k个单位抽取一个 系统抽样时每个样本单位抽中的概率相同 为1 k 13 分层抽样 分层抽样 stratifiedsampling 时将总体按某些重要特征分为数个层 各层之间既不能有重复也不能有遗漏 然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本 层内个体之间的差异越小 而不同层之间的差异越大时 分层抽样的效果越好 14 整群抽样 整群抽样 clustersampling 是将总体分为不同的群组 然后随机抽取一定数量的群组作为样本 整群抽样可分为 一级整群抽样 在抽中群组中抽取所有个体 二级整群抽样 先抽取一定数量的群 然后再从每个被选中的群中抽取一定比例或数量的样本多级抽样 将总体分为多级群组 逐级抽样 15 确定样本量的经验方法 研究中所使用的样本量 16 不回答问题 非抽样误差由于拒答 度量误差 数据处理误差等因素 常常产生非抽样误差 不回答误差由于回答者与不回答者在人口特征 心理 个性 动机 态度与行为方面的差异而产生的误差 对不回答误差增加回答率对调查结果进行修正 17 问卷调查 18 主要内容 问卷调查的特点与分类人员访问电话访问邮寄问卷调查网上调查其他问卷调查方法 19 问卷调查的特点 问卷调查是通过填写事先设计好的结构化问卷收集数据特点标准化的程序以收集定量数据为主有限的操纵和控制 20 问卷调查的分类 访问人员访谈电话访谈计算机辅助人员访谈自填式问卷邮寄问卷调查置留式问卷调查网上调查 21 人员访问 通过面对面的询问 由调查员记录调查对象对问题的回答 填写问卷来收集数据入户访问拦截访问 22 人员访问 优点回答率高能够现场解释 澄清和核实对访问环境的控制补充观察样本的代表性一般较好缺点 费用高 收集数据的速度慢 23 电话访问 通过电话对抽中的调查对象按设计好的问卷进行提问并记录计算机辅助电话调查的优点 节约时间和费用自动化程度高 不容易出错省时省力缺点 问卷的长度和深度有限 24 邮寄问卷调查 将问卷 填写说明寄给抽中的调查对象 由调查对象自己填写并寄回问卷邮寄问卷调查的优点 成本低问卷是自填的 不会受调查员偏好的影响没有时间压力 可以给被调查者充足的时间思考缺点 回答率低 收集速度慢由于无当场澄清和核实的机会 影响数据质量 25 网上问卷调查 电子邮件调查 在线调查网上问卷调查的优点 成本低 收集数据速度快电子邮件调查的缺点 覆盖面有限 抽样偏差大回答率极低 26 网上问卷调查 在线问卷调查的优点 问卷回收速度快填写便捷可以提供附加的刺激 如照片 动画 视频等问卷填写 编码 录入等一次性自动完成在线问卷调查的缺点 问卷设计比较复杂回答率低覆盖的人群有限问卷的长度和深度有限 27 其他问卷调查方法 置留式问卷调查由调查员将问卷送上门 请调查对象填写后寄回或由调查员再次上门取回 是一种将入户调查与自填式问卷相结合的方法集中式填写将调查对象召集在一起 由调查员将问卷发给每位调查对象并讲解问卷填写要求 然后由调查对象自己独立填写问卷 28 数据准备 29 内容提要 问卷审核与编辑数据编辑编码数据录入数据清理 30 数据准备过程 问卷审核与编辑 选择数据分析方法 数据清理 数据录入 编码 31 问卷的审核 Questionnairechecking 应尽早对问卷进行必要的审查 以便及时发现问卷填写中存在的问题并采取矫正措施 应注意 填写对象是否合格填写是否认真不完整 缺失项 缺页逻辑错误不符合要求的跳跃其他异常现象 32 问卷编辑校订 QuestionnaireEditing 如果发现不正确的回答 可以考虑采取以下的步骤 给出估算值设为缺失值放弃整个问卷返回给调查员 33 数据编辑 数据编辑是指纠正数据文件中发现的错误和矛盾之处 在数据编辑的过程中 我们需要 填写缺失项纠正逻辑错误检查跳跃模式 34 问题1 逻辑矛盾 1 年龄 15 2 婚姻状况 未婚 已婚其它问题2 没回答 1 年龄 2 婚姻状况 未婚 已婚其它解决办法1 大样本 删除整个问卷 2 将缺失数据与矛盾数据看成没回答 但保留其他项目3 小样本 调整答案或用均值 众数代替 例 数据编辑 35 编码 Coding 编码是根据问卷中所含信息及预先设计好的编码规则将每一个观察变量赋予相应的数值的过程 例 文化程度小学及以下1初中2高中3大学4研究生5 36 编码规则 编码的规则如下 相互独立且具有完备性观察变量具有一致性符合常识粗细适宜例 请问您本公司手机的总体评价 很好1较好2一般3例 婚姻状况的编码未婚1已婚2离异3丧偶4其他5 37 对封闭问题的编码 1 你的家庭拥有几辆车 1 编码 用实际数字 9 无回答 2 你家有旅行车吗 有无编码 9无回答 38 对开放式问题的编码 归纳性编码你选购洗发水时考虑的最主要因素有哪些 1 使用效果好 31 2 不损伤头发 19 3 价格合理 16 4 不含有害化学成分 10 5 经常做广告 9 6 购买方便 8 7 有促销活动 3 39 对开放式问题的编码 归纳性编码你选购洗发水时考虑的最主要因素有哪些 8 品牌知名度高 2 9 朋友推荐 1 10 其他 1 40 对开放式问题的编码 归纳性编码编码方案1 使用效果 1 2 健康因素 2 4 3 价格因素 3 7 4 品牌因素 5 8 9 5 渠道因素 6 6 其他 41 对多选题的编码 你使用过哪些品牌的牙膏 1 佳洁士2 高露洁3 中华4 两面针5 黑妹6 田七7 其他 42 对多选题的编码 编码方案为每个备选答案设一个变量 B1 B7每个变量代表所对应品牌的使用状况 有两个可能的取值 1 用过 0 未用过 43 数据输入 如果想提高数据输入速度和减少输入误差 应该 选择正确的数据输入软件培训数据输入人员良好的作业管理及时检查 44 数据清理 DataCleaning 一致性检查根据每个变量的合理取值范围和相互关系 检查数据是否合乎要求 发现超出正常范围 逻辑上不合理或者相互矛盾的数据 45 数据清理 DataCleaning 无效值和缺失值的处理估算整列删除变量删除 46 数据分析 描述性统计分析 47 主要内容 频数分布交叉表变量的集中趋势差异性指标分布形状指标 48 频数分布 有时研究人员需要了解有关单个变量的信息本品牌的使用者中有多少称得上是品牌忠诚者 有多少个顾客对新产品很熟悉 多少比较熟悉 有多少顾客对饭菜的口味满意 多少非常满意 多少不满意 49 频数分布 频数分布 了解对一个变量选择不同取值的调查对象数量变量中不同取值的出现频率以百分比的形式展现 对一个变量的频数分布会产生频数 百分比 累积百分比几个数据 50 频数分布 某移动通信公司用户每月话费支出的频数分布 51 频数分布 作用 有助于明确未回答者的多少 同时也能显示不合格答案的多少 可以检验奇异值和极端值 根据频数分布可以划出各种统计图形 52 频数分布 请问您希望购买的户型是哪种 单选 一室一厅一卫1两室一厅一卫2两室两厅一卫3两室两厅两卫4三室一厅一卫5三室一厅两卫6三室两厅一卫7三室两厅两卫8四室两厅两卫9措层10跃层11其他 请注明 12 53 54 频数分布 55 频数分布 请问您对住宅的内部居住环境有哪些要求呢 多选 住宅标准1住宅类型2隔音3隔热与保温4光照5隔音6朝向7通风8其他 请注明 9 56 频数分布 57 58 柱形图 直方图 主要用于现象间的比较 59 柱形图 直方图 60 曲线图 主要用于现象的动态变化 中国彩电发展趋势 61 饼形图 一般用于表明现象的结构 62 饼形图 香烟消费的口味特征 63 交叉表 列联表 使用行和列的形式对比表示数据本产品中男性消费者的满意比率是多少 女性消费者满意的比率是多少呢 产品的拥有状况与收入 高 中 低 有关吗 交叉表通常是由背景信息与题项作交叉分析获得 64 65 交叉表 列联表 66 交叉表 列联表 三个变量的交叉表 引入三个变量经常能使前两个变量之间的关系变得更清晰能够提炼前两个变量之间的联系能够使前两个变量之间的联系从有到无能够使前两个变量之间的联系从无到有能够表明前两个变量之间的联系无变化 67 交叉表 列联表 提炼原有的关系 婚姻状况对时装购买的影响 68 交叉表 列联表 提炼原有的关系 婚姻状况对时装购买的影响 69 交叉表 列联表 原有的关系是虚假的 教育程度对拥有豪华汽车的影响 70 交叉表 列联表 原有的关系是虚假的 教育程度和收入水平对拥有豪华汽车的影响 71 交叉表 列联表 显示出隐藏的关系 年龄对出国旅行愿望的影响 72 交叉表 列联表 显示出隐藏的关系 年龄和性别对出国旅行愿望的影响 73 算术平均数 中位数 众数 集中趋势 全距 方差 标准差 离散趋势 偏态 分布形态 四分位距 峰度 描述性统计分析 数据分布性质 74 集中趋势指标 算术平均数中位数众数 75 平均数 平均数是将总体中所有个体的数量标志差异抽象化 用以反映现象在一定时间 地点条件下的一般水平或代表性水平 反映总体分布的集中趋势反映总体现象的共性特征是总体分布的重要数量特征值是现象规律性的数量表现 76 平均数概念 总体分布的集中趋势 集中趋势 77 平均数 总体分布的集中趋势 1000发炮弹落点 78 平均数 总体现象的共性特征捷达轿车 1没有奖品 99999集中趋势 没有奖品明天下雨的可能性是 80 明天不下雨的可能性是 20 集中趋势 明天下雨 79 算术平均数 算术平均数是集中趋势指标中最常用的一个统计量 用于评估一个用定距或定比尺度衡量的数据均值 数据都有一定的集中趋势 大部分回答应该分布在均值附近 80 中位数 将总体中的各个个体数值按照大小顺序排列 居于中间位置的数值 便是中位数 如果数据为奇数项 中位数是中间位置的数值如果数据为偶数项 中位数是中间位置两个数值的平均数是一种位置平均数不受总体中极值的影响 81 中位数 数据 10 34 98 911 76 37 7顺序 4 96 37 78 910 311 7位置 123456 2 82 众数 总体中出现次数最多的数值是众数不受总体中极值的影响可以没有众数 也可以有几个众数 83 众数 无众数数据 10 34 98 911 76 37 7一个众数数据 6 34 98 96 34 94 9一个以上众数数据 212828414343 84 平均数不会说谎 但说谎者会用平均数 在调查一家工厂的工资水平时 这家工厂的年薪为2700镑的工厂主回答说 我厂的工资水平是每年934镑 代表该厂工人的工会负责人说 工资水平是每年800镑 而税务检查人员说 工资水平是每年850镑 这三种不同答复分别依据的是哪一种计算方法呢 85 平均数指标 86 差异性指标 全距方差和标准差 87 差异性指标 标志变异指标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论