市场调研(第二版).ppt_第1页
市场调研(第二版).ppt_第2页
市场调研(第二版).ppt_第3页
市场调研(第二版).ppt_第4页
市场调研(第二版).ppt_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市场调研 第二版 2010年1月重庆远卓 第一部分市场调研基础 第二部分数据收集 类型和方法 第三部分数据收集 测量手段与抽样 第四部分数据分析 第五部分与调研用户沟通 市场调研在战略规划和策略制定中的作用 发现营销机会和限制条件产品的潜在市场在哪里 营销产品地区的人口统计和社会统计特征是什么 该地区有哪些竞争对手 竞争程度怎样 制定和执行营销策略产品的包装尺寸多大 促销产品的媒体如何选择 应该采用哪种零售渠道 评估营销计划的有效性目前的促销策略有效吗 产品的再次购买倾向如何 我们和对手的市场占有率 战略营销计划组织资源目标营销战略执行控制 市场调研 确立 影响 战略营销计划产品价格渠道促销 客户 社会 组织 企业决策者 市场调研 影响 告知 营销决策 客户 社会 市场调研定义 定义 市场调研用于系统记录 收集 分析和解释数据的一整套技术和原则 向营销产品 服务或思想的决策者提供帮助 原则 及时性和相关性 仔细和明确的调研目标 不用调研支持已经做出的决定 市场调研和决策的关系 市场调研协助决策 但不能取代决策 引发决策的局势 决策活动 市场调研 内外部环境 最终决策 市场调研流程的各步骤 有必要吗 确认数据需求 数据来源 调研设计和数据收集模式 调研工具或方式 确定样本 收集数据 2手 分析和解释 沟通调研结果 明确调研目的 收集2手资料 2手或原始数据是否足够 市场调研流程的各步骤 调研必要性 调研结果的潜在效用 调研资源执行的可获得性 调研项目的成本收益 管理者对调研的态度 调研目的 识别出众多的具体问题 确定值得进一步调查的事宜 数据来源 二手数据 原始数据 调研设计和数据收集模式 探索性调研 帮助调研者获得初步的洞察 并为以后的调研铺平道路 发现预兆和观点 为以后调研提供方向结论性调研 获得初步的洞察 并获得可行动的具体路线 其中包括描述性调研和因果性调研 描述性调研 描述事物 特别是相关单位构成和特征的描述 因果性调研 实验 确定自变量与因变量之间的因果关系 项目建议书内容 为什么要开展项目 如果成功 会怎样 采取何种方式 询问什么问题 访谈对象是 如何联络被访者 在何时何地收集数据 内外部如何分工 如何统计分析 如何沟通结果 时间费用等 调研工具或形式 数据库 访谈 观察等 问卷内容 确定样本 明确谁来提供数据 概率样本和非概率样本 收集数据 在调研设计和样本选择的时候就应该考虑数据收集方式 分析解读 受到数据类型的影响 沟通结果 高质量报告 何时考虑外部调研机构 可信度 竞争力 成本 能力怎样选择外部调研机构 名望 人员 过去从业经验 价格 市场调研类型 调研方式 关键信息提供者的焦点访谈 二手数据 案例分析 观察法 选择市场调研方式的流程 调研目的 数据清楚吗 按照下列步骤开展探索性调研 关键信息技术提供者焦点人群二手数据案例分析 分析数据 解释数据 有继续开展调研的必要吗 设计结论性调研 需要测试变量间的关系吗 因果调研 分析数据 解释数据 提出建议 描述调研 第一部分市场调研基础 第二部分数据收集 类型和方法 第三部分数据收集 测量手段与抽样 第四部分数据分析 第五部分与调研用户沟通 二手数据的优缺点 数据来源 内部 保修卡 pos 订单等销售记录 外部 政府 贸易协会 出版物数据优缺点 专项调研 系统调研 专项调研 独立 基于情景的调研 基于决策者提出的某个特定问题或一组相关问题发起的系统调研 在定期和整合基础上提供合适的市场信息 原因 决策者对市场发展的动态持续监控的需求不断增长 利用信息技术来获得竞争优势的机会 MKISS 营销信息系统 向营销决策者提供相关 准确信息所进行的收集 整理 分析 评估和传播信息的活动中 对人员 设备 和流程进行整合的持续互动的结构 数据仓库 datawarehouse 是整合公司各个运营系统数据的集中式数据库 最简单的包括信息储存和检索系统 内部数据 供应商 成本 获得订单 运输细节 销售 客服 外部数据 行业趋势 市场份额 新产品 技术变革 客户趋势 经济趋势 社会文化 地理政治 专项市场调研 数据仓 dw 数据收集系统 数据存储和检索关系数据库网络分析流程工具 olap 市场决策支持系统 mdss 数据挖掘 技术系统推测模式 预测模式 专家系统 es 神经网络 人工智能 信息发布系统 决策者 市场信息系统mkis 数据库模式 订单 产品 客户 销售 供应商 时间范畴等 采用地理信息系统开展调研 概念 地理信息系统 gis 是储存 演示 分析地理数据的支撑决策软件 gis是调研中的绝好分析工具 可以整合多种数据来源 建立互动地图 运行强大分析 企业运用gis了解目前的市场和新市场 评估客户基础和竞争形势 识别扩张和合并机会 采用地理信息系统开展调研 达美乐应用 司机在订货中寻找公司和客户的最短距离 管理者观察哪个店是最成功的 以及成功的关键因素 并决定在哪里开新店 画图胜过千言万语 采用gis可以在居住区地图上增添信息并获得该地区更加客观的图像 例如客户位置 人口统计信息 犯罪记录 交通流量 邮政编码 zip 电缆电话分布及其他细节 每个主题层 人口统计 道路 公交 购物中心 工业地区等 连接在一起 每个层都有自己的编码 每个点的明确经纬度坐标 微观营销 可以分析当地人的生活方式和商品购买倾向 反应当地客户的喜好 让营销者调整营销组合 量身定制的4ps 采用地理信息系统开展调研 绘图和瞄准客户爱斯五金案例 gis帮助其对商店重新选址 为商店提供公告和商品陈列的建议 并决定是否开设新的零售机构 操作流程 1 店内调查获取gis数据 家庭地址 录入总部gis软件 并进行地理编码 zip 显示每个顾客的地址 85 的顾客来自3个zip 集中此区域广告 2 外部购买家庭收入数据并添加到地图中 针对高收入家庭的产品制定吸引力的促销计划 2个zip的直邮服务 在以上gis中揭示了客户的居住区域和每区域的收入中指水平 量身打造广告和促销活动 同时降低营销费用和提高销售 采用地理信息系统开展调研 新店选择康妮咖啡案例 正确的产品和客户可以提高利润 位置也是成功的关键 Gis可以帮助确定进那个市场 每个市场设多少商店 每个商店的地址如何确定 操作流程 1 众多的新店地址建议 将地理编码和该地区的市场数据 人口数据和销售数据 录入gis软件 2 回归分析方法衡量这些因素对咖啡销售的影响 建立销售预测模型 销售额 常数 6000 竞争者数量 0 2 该区域销售潜力 3 各位置预测排名 综合决策 除了以上的模型外 与磁场商场的邻近程度 街道便利性 城市功能分区等也是考虑的因素 采用地理信息系统开展调研 广告战略林肯 水星案例 gis可以提高广告效率 可以协助瞄准客户 减少广告整体支出 采用直邮和报纸插页的广告而非电视公告 广告的挑战是如何直接瞄准最可能购买产品的人群 同时避免最不愿意购买的人群 Prizm系统帮助营销者定位最可能购买产品的人群 该系统通过因子分析来区分美国居住区的特征 并根据6大类统计变量 社会阶层 家庭结构 流动性 种族 城市化 房产 的指标得分 将美国每个zip区域都聚类归入62个Prizm集群区域 例如 贵族 艰难挣扎 新家庭 绿色家庭等 操作流程 1 电话或车辆登记调查预测每个Prizm人群对水星车辆的购买意愿 银发族的倾向最高 人群描述 2 将购买者数据转化为Prizm人群 将各个zip区的水星车销售量 成年人口 购买倾向 因为过去的行为是未来行为的最好预测 计算所有zip区中62个Prizm区域的平均购买倾向 约等于电话调查每个Prizm的结果 3 建立购买倾向指数 各个zip区域倾向 所有zip区域平均值 100 大于100较好 4 根据计算的高指数地区开展报纸插页促销设计 同时也可收集对手的销售数据 进入潜在目标市场 5 广告接触目标客户 方式有直邮和插页 成本比较 报纸选择 依据当地发行量 原始数据收集 当二手数据无法获得或不相关的时候 为特定项目收集数据就称为原始数据 询问法 个人访问 电话调研 邮件调查 网络调查 观察法 人工观察 录像机观察法的缺点是不能得出与非观察变量的数据 而询问法可以得出多种数据 观察法的另外缺陷是不得不等待相关事件的发生 因为观察法的时间和费用成本更高 观察法的主要优势是提供更加精确的数据 因为对受被访者更加方便 不需要被访者的直接参与 数据不受歪曲 考虑的因素 多样性 观察数据的准确性 时间和费用 受访者的便利性 19 问卷的格式 完全结构问题 针对每个受访者的逐字逐句的问题 以及固定的回答种类 完全非结构问题 每个受访者的问题不完全相同 也不需要固定的答案类型 伪装问题 向受访者提供的真实目的不明显的间接问题 20 一类 应用最广 适用于样本量大的结论性调研 二类 个人访谈 焦点访谈的探索性调研流行 也称为深度调研 三类 揭示社会敏感话题 堕胎 污染等 采用大量的结构性答案进行真实选择或排序 四类 激励调研中应用 回答 为什么 以及人们的愿望 情感 及意向 心理学中的投射技术 问卷的管理方式 个人访问 入户 购物中心拦截等电话 邮件 互联网 影响要素 多样性 样本量 问题类型及数量 奖励措施 时间 成本 准确性 受访者便利性等 21 准确性样本控制 从充分代表相关兴趣人群的样本中收集数据的能力 非代表性抽样得到的推论不具备普遍意义 取决于两个因素 1 识别和到达受访者合适样本的能力 2 确保每个受访者合作的能力 个人访问具有多样性 效果最佳 电话调研在达到家庭代表性样本时候面临障碍 邮件调研的回复率最低 虽然可用激励方式获得高回复 但是代表性并没增强 非代表性样本的发生率在网络调研中最高 最大益处是到达大规模人群的能力 督导控制 减少访问员错误的能力 由于没有访问员 网络和邮件比个人和电话访问更占优势 个人最易出现访问错误 难以对各个访问员进行督导 阐明机会 在回答某些问题时 受访者需要有发现和解决问题的能力 因为缺乏互动 邮件调研最容易出问题 而个人访问是最好的 问卷开展方式的比较 22 观察的类型 自然观察和策划观察 尼尔森的模拟营销 stm 首先样本客户填写人口统计和购买习惯资料 然后受访者在真实的竞争情景下体验营销 例如收看新产品的电视节目 然后以小组的形式进入商店 自由选择产品 采用销售数据并结合采购反馈进行预测 计算机模拟营销 伪装观察和非伪装观察 最流行的伪装观察 神秘购物 采用结构化的提纲记录购买体验 人工观察和机械观察 直接观察和间接观察 结构观察和非结构观察 23 定性调研 定义 收集 分析和解释那些不能被数量化得数据或不能数字概括的数据 非结构性的调研和观察调研 主要为了获得预感和假说 为正式调研进行测试 定量调研的特点是更结构性 大规模和代表性的受访者群体 为收集数据 能够提供最终路线的情景服务 如果调研的目的是为了了解问题或开发新产品概念 则用定性 如果是为了预测销售 建立价格点 选择最佳的目标市场 则用定量 24 焦点人群访问 定义 依赖主持者向受访者介绍主题 指导他们在非结构和自然的方式下讨论该主题最佳规模 6 12人同质性的重要性 人口特征相同 推到结论的危险 不具备代表性 正确的筛选程序 第一题确保受访者有相关的经验 第二 三题反应客户公司提出的限制性特征 第四 五题筛选非典型和专业的受访者 调研从业 最近参加调研 主持人特征 友善但是坚定 宽容 参与性 不完整的理解 鼓励 灵活 敏感等开展实施 持续时间 1 5 2h如实记录 设备干扰优势 数据丰富 多样性 调研特定受访者 对客户的影响缺点 缺乏概括性 误用的机会 成本应用 了解消费者的感受 产品计划 广告创意新技术 电子键盘 录像会议 在线焦点访谈 25 其他定性调研 深度访问 焦点访谈的变形 26 其他定性调研 投射技术 向受访者提供非常模糊的刺激 为回应刺激 受访者间接的揭示内在情感 单词关联测试 几个到100多不等的词语 包含不相关的词语和中性词来伪装 大声朗读给被访者 询问其头脑中第一个词语是什么 在新产品 品牌名 关键字的感受时有用 完成句子 要求被访者完成一组不完整的句子 也包括不相关的词语 主题领悟 简称tat 展示系列的画面 每次一张 要求对每个画面写一个故事 发生了什么 为什么发生 感情 个性测试 广告图片 促销画册 产品包装卡通测试 对话框测试 在卡通图片的2个人中 一个人的对话框有刺激语言 要求在另外一个人的空白框内写出对话 比主题测试要更加限制 27 市场调研中的实验 实验调研指的是控制可能影响因变量的其他变量条件下 通过操纵独立变量来收集他对因变量的影响 因果关系条件 变量发生的时间顺序 联系的证明 控制其他的因变量 实验室实验 a b两种广告 100人分成2组到广告公司看分别穿插ab的电视 然后填写电视内容和广告 包括ab 的反应 比较两种方案的差异 实地实验 将以上的方式改为两个城市分别播放 并调研 内部有效性和外部有效性的高度一致 但是往往受到不可控制因素的影响 文化差异等选择影响因素 时间 成本 暴露给竞争对手的程度和操纵的性质 28 第一部分市场调研基础 第二部分数据收集 类型和方法 第三部分数据收集 测量手段与抽样 第四部分数据分析 第五部分与调研用户沟通 测量量表 测量的典型定义是在一组指导方针的基础上 将数字与回应联系起来 类表量表 数字只是标签 仅用来区分不同分类的回应 统计用频数 众数 例如 1 男 2 女顺序量表 数字拥有等级顺序的特性 统计还可以用中位数 例如 1 小于5分钟 2 5 10分钟 3 大于10分钟区间量表 在顺序量表基础上 表值之间的区别也能够体现出来 统计可用算术平均数 标准差等 例如 1 一定会买 2 可能买 3 不知道 比例量表 在区间量表上 表中数字的比率拥有丰富的解释 可做加减乘除 前两种是非度量数据 后面的是度量数据 30 变量的类别 属性 人口或统计学上的特征 教育程度 年龄 家庭等行为 去商场的次数 活动的参与程度信念 被访者认为什么是正确的 例如 吸烟会导致癌症吗 态度 在信念基础上 还反映受访者的个人评判 例如是否应该禁烟 31 图形量表与列举量表 图形量表表现为一个连续体 以一条直线的形式 表示理论上可以是无限的数字排列 列举量表设置了一系列不同的选项 任何对选项的不同态度的建议都是暗示的 最基本的表现形式是多项式问题 举例 请在以下的选项中选择一项来表明您对ebay的总体看法 非常糟糕 非常好 非常糟糕 非常好 1 非常糟糕 2 差 3 一般 4 好 5 非常好 1 2 3 4 5 对比式评价与非对比式评价 对比式评价为受访者提供一个通用的参考框架非对比式允许受访者使用任何参考框架 举例 与其他网站相比 您对ebay的总体看法 请对以下的网站进行排序 在您认为最好的网站后写1 依次类推 雅虎 ebay 阿里巴巴 亚马逊 当当 1 非常糟糕 2 差 3 一般 4 好 5 非常好 迫选与非迫选式 迫选式没有为回答者提供表达中立态度的选项 非迫选式则可以表达中立态度 举例 请在以下的选项中选择一项来表明您对ebay的总体看法 1 非常糟糕 2 差 3 好 4 非常好 1 非常糟糕 2 差 3 一般 4 好 5 非常好 平衡与非平衡选项 平衡选项中 积极 赞成的选项与消极 不赞成的选项一样多 举例 请在以下的选项中选择一项来表明您对ebay的总体看法 6 棒极了 1 非常糟糕 2 差 3 一般 4 好 5 非常好 1 非常糟糕 2 差 3 一般 4 好 5 非常好 标记选项与非标记选项 量表通常有锚点标签来界定两个端点 但是调研人员有许多选择 例如采用一个还是多个中间标签 标签应该采用词语 数字还是两者都用 举例 请在以下的选项中选择一项来表明您对ebay的总体看法 非常糟糕 差 一般 好 非常好 1 非常糟糕 2 差 3 一般 4 好 5 非常好 非常糟糕 非常好 1 2 3 4 5 里克特量表 里克特量表是里克特原创的格式 由一系列对态度目标的评价叙述项构成 每项叙述有5项认同或不认同的表 典型的量表大约有20 30项叙述构成 特征 1 回答只有文字抽签 没有数字标签 但可以分配数字 1 5或 2 2 以获得数量的态度测量 2 叙述项本身有认同的也有不认同的 因此在分配数字时候应该按照 对每项叙述高或者低的数字评价应代表相同的态度方向 即是 认同叙述的强烈认同 5 与不认同叙述的强烈不认同 5 应该一致 37 叙述项要求 量表的有效性取决于叙述项 1 叙述项的变化必须多 2 叙述项必须清晰明了 3 叙述项必须敏感 能够有效区分回答者的不同态度 语义差别表 起源于调查词语概念和直接感知意义所作的工作 与里克特量表一样包含由受访者评价的选项 特征 1 包含态度目标的两极形容词 而非完整句子 每对形容词由7个标度的量表隔开 没有数字 文字及锚点标签 2 与里特克一样 在表的左边可能是认同的形容词 也可能是不认同的词语 但在最后统计均值的时候 应该将认同的统一放在同一边 38 U型量表 U型量表是语义差别表的衍生 特征 1 每项仅有一个词语表示特征 2 每项有10个回答 3 每项都是迫选回答 4 回答有数字标签 但是没有文字 39 问卷设计 问卷是为达到调研目的和收集数据而设计好的一系列问题 问卷设计流程 问卷设计前最重要的前提是确定所要收集数据的合适类型和对调研问题 目标或假设的正确定义 40 将数据要求转为问卷草稿 检查问题形式 检查问题实用性及措辞 检查问题先后顺序 检查排版和外观 预先测试草稿 问卷定稿 问题格式 分为结构性和非结构性问题非结构性 开放式问题 允许用户自由作答 例如 您的年龄是 结构性 封闭式问题 限制性答案 例如 您的年龄是 1 18岁以下 2 18 30岁 3 30岁以上非结构性问题得到的数据更加精确 调研员建议以开放性问题开始面对面的访谈 电话访谈 可以激发受访者的兴趣 结构问题包含两类 两分式 只有2个答案选项 和多分式 在应答项中 各个答案为数字时候 应该遵循自然的顺序 总体的原则是全面覆盖 添加不知道选项 相互独立 不能重复 41 问题关联性与措辞 关联性是指每个问题收集到得数据都符合调研目标 但是即使问题关联 但是受访者无法准备回答也是个严重的问题 1 避免双重问题 您认为公司是否关注员工及客户 拆分2 诱导性问题 您不认为中石油的钻井开采对环境有害吗 怎样看到 3 避免单边式问题及不平衡式问题 您认为公司关心员工吗 关心还是不关心 4 避免含蓄假定问题 您在看足球 篮球时候喝咖啡吗 请问您在以下哪些情况喝咖啡 常用过滤问题来消除 1 您吃鸡蛋吗 2 您每周有几天吃鸡蛋 5 避免复杂的问题 专业术语 42 问题排序 1 人口统计学和敏感性问题放在最后面 2 聚焦问题 相关的问题放在一起 3 漏斗型问题与逆漏斗 漏斗型适合于大多数问题 即是先从一般问题到到具体问题 而关于满意度的时候 则采用相反的方式 4 跳过模式 逻辑跳转 43 问卷排序 好标准 清晰说明 问题间有间隔 预留合适的答空间竖立排版 44 1 非常糟糕 2 差 3 一般 4 好 5 非常好 1 非常糟糕 2 差 3 一般 4 好 5 非常好 调查设计介绍信 问卷介绍信要点 1 个人沟通 2 请求帮助 3 调研重要性 4 访问对象如何从调研中受益 5 回答问题的时间短暂 6 问卷内容很简单 可轻松作答 7 访问对象的科学筛选 8 匿名保密 9 感谢语 10 激励措施 11 联系人地址 45 抽样与普查 抽样是从决策制定者的研究全体挑选一部分 最终是是为了研究全体得出的概括性结论 决策者制定的研究总体称为总体 可以从中抽取的总体单位列表称为样本框架 普查是对全体研究得出推论 在可行 必要的时候才使用 抽样的优势 成本低 时间短抽样误差 在抽样过程中生成的统计值和只有通过精确的普查才得到的总体参数之间的差异 增加样本规模 更好的抽样规划 样本尽可能代表总体非抽样误差 样本框误差 不能代表理想总体的样本框架 增大使其更代表总体不应答误差 最终的样本不代表规划的样本 激励措施 复查 延长时间数据误差 收集的数据失真 数据编码分析和阐述中的误差 激励 督导 科学编码 考虑实际情况解读 概率抽样 事先已知每一总体单位抽取概率的客观程序 研究员不决定某一具体的总体单位是否被包含在样本中 非概率抽样 未知 主管决定 46 概率抽样 47 非概率抽样 便利抽样 调研人员的便利性构成了抽样的基础 不需要获取代表性的样本 电视中新闻中的调查 在线弹出调查 判断抽样 也称目标抽样 调研人员努力按照自己的判断选取适合研究目的样本的程序 定额抽样 根据决策者的判断 从各总体单元中抽样的定额单位 非概率中最精致的方式 与分层抽样类似 1 依据某些支配性特点 两个或多个 将总体分成几段 cell 2 决定各单元的样本定额 3 指导面试员完成各个单元分配到的定额 48 抽样误差 参数 对于任何变量 实际的或者真实的总体平均值或总体比例 统计量 对于样本数据的参数评估 抽样误差 以上两个数据之间的差异抽样分布 由抽样程序选取的确定规模的各可能样本中获取的样本统计值及出现的频率 所谓置信度 也叫置信水平 置信水平表示区间估计的把握程度 指总体参数值落在样本统计值某一区内的概率 置信区间是指在某一置信水平下 样本统计值与总体参数值间误差范围 置信区间的跨度是置信水平的正函数 置信区间具有附加的不确定性 估计值 误差幅度 49 样本大小 影响样本大小的因素 1 期望的精确度 2 置信水平 3 样本标准差4 资源 人财物 样本容量公式Z2S2n d2其中 N 代表所需要样本量Z 置信水平的Z统计量 如95 置信水平的Z统计量为1 96 99 的Z为2 68 S 总体的标准差 d 置信区间的1 2 在实际应用中就是容许误差 或者调查误差 50 第一部分市场调研基础 第二部分数据收集 类型和方法 第三部分数据收集 测量手段与抽样 第四部分数据分析 第五部分与调研用户沟通 数据质量控制 编辑 为了提高问卷的准确性和精确性而对数据收集表格进行检查 筛选出问卷中的不清楚 不完整 不一致 模棱两可的答案 编码 为每个问题的每种可能的答案分配一个代码 通常是一个数字 1 对每个问题的答案进行有意义的分类 2 建立互相排斥和完全穷尽的编码分类 3 建立一个适合于电脑分析的数据集 52 初步数据分析 描述性分析 集中趋势的测量 众数 中位数 均值 频数分析 描述单一变量在不同取值间的分布情况 53 样本方差 样本中各数据与样本平均数的差的平方和的平均数 样本方差的算术平方根就是标准差 假设检验 推断分析 超越描述性分析 测试某一假设为目的的数据分析被择假设 研究者想要收集证据予以支持的假设 Ha原假设 也称0假设 研究者想要收集证据予以反对的假设 H0如何判断假设 原假设是表述更为保守的一个 即是样本量不不能拒绝h0 就应该保持现状 而想要证明的假设为ha 显著性水平 犯一类错误的最大概率 0 01 0 05 0 1等 通常是人为设置 需考虑公司成本 风险等实际 置信水平 显著性水平的补数1 临界值 根据给定的显著性水平确定的拒绝域的边界值 检验统计量 标准变量 由样本数据计算而来 通过与临界值 可查概率表 比较决定是否拒绝原假设 Z X2 F T等 一般来说 30个即为大样本 才能适用于z检验 54 假设检验步骤 步骤 1 确定原假设h0和被择假设ha 2 确定抽样分布曲线的性质 选择合适的检验统计量 正态曲线为z值 3 确定假设检验师单尾还是双尾 4 确定合适的显著性水平 依据统计表确定检验统计量的临界值 双尾有2个 5 确定拒绝原假设的决策标准 6 依据样本数据计算出检验统计量 7 运用第五步的决策标准 拒绝原假设或被择假设 单变量假设检验 56 总体均值的检验 案例 某产品经理决定是否进入新市场 一项针对400个家庭的随机调研 家庭收入的标准差为8000 平均收入为3万 基于过去的经验是大于2 9万才会盈利 那么是否应该进入新市场呢 1 h0 2900 ha 2900 2 曲线落在均值附近 并围绕其分布 x检验统计量3 单尾 4 显著性水平 0 05 临界值Zc 1 645 单尾 5 如果样本均值超过Xc 就拒绝原假设 6 在正态检验的抽样分布中 随机变量的取值是每个x 均值是 标准差是 因此 样本足够大 Z作为检验统计量 即 2已知 2未知 Sx 8000 400 400Xc 2900 1 645 400 29658Z 3000 2900 400 2 57 因为 30000 29658 2 5 1 645 所以拒绝原假设 应该投入到新市场去 总体均值的检验 58 U 29000Z 0 Xc 29658Zc 1 645 X 30000Z 2 5 a 0 05 拒绝h0 不拒绝h0 卡方列联检验 案例 电信行业手机潜在用户测试 共200个样本 通过列联表分析蓝牙技术与购买手机意愿是否才存在显著相关 1 h0 蓝牙与手机购买没有关系 ha 存在关系 2 计算第i行 第j列的单元期望频率 Tij Eij ni nj n 即T11 E11 100 100 200 503 计算卡方检验统计量 724 查临界卡方值表 a 0 05 自由度为1 为3 84 5 因为72 3 83 我们可以拒绝原假设 即蓝牙技术与会否购买手机之间的相关性不显著 当卡方为72时 真实显著性水平P小于0 001 59 卡方列联检验 检验时 要根据自由度 查界值表 当时 拒绝H0 接受H1 当时 尚无理由拒绝H0 自由度d f 以样本的统计量来估计总体参数时候 样本中独立或能自由变化的数据的个数称为统计量的自由度 d f 行 1 列 1 在列联表中 那个方向 行 列 计算的单元频率更有意义呢 通常沿着自变量的方向计算百分比 然后与因变量交叉 因为两个变量的关系依赖其他变量 列联表也会隐藏潜在的变量关系 60 单均值检验 案例 某产品经理决定是否进入新市场 一项针对25个家庭的随机调研 家庭收入的标准差为8000 平均收入为3万 基于过去的经验是大于2 9万才会盈利 那么是否应该进入新市场呢 1 h0 2900 ha 2900 2 由于25 30 不能用z检验 只能用t检验 0 6253 查t值表 a 0 05 d f 24 Tc为1 71 4 因为0 625 1 71 所以不能拒绝原假设 不能把新产品引入新市场 与前结论相反 61 单比例检验 案例 某电脑公司营销部白先生调查100个电脑用户 只有20个人听说过该品牌 认为0 2的认知率非常低 需要增加广告支出 但是黄女士认为没有那么糟糕 因为该品牌刚刚进入市场 不同意更多广告支出 除非白先生可以证明 0 5的误差 所有电脑用户的该品牌的真实认知率小于0 3 分析 主要是验证听说过该品牌的电脑用户的人口比例假设1 h0 0 03 ha 0 3 2 理论上样本比例为二项式分布 对于大样本 二项式分布为近似正态分布 而大样本在经验上为n 和n 1 都必须 10 所以可以用z 检验 3 据公式 2 1744 由于 2 174 1 645 单尾 所以拒绝原假设 应该增加广告预算 62 双均值检验 案例 某机构推出公共服务运动来促进健身 为了对广告效果进行受控测试 选了2个类似的城市 城市1是接受检验的 城市2是受控对象 即是用于比较的 城市1中300名 平均每天30分钟 标准差为22分钟 城市2中200名 平均每天35分钟 标准差为25分钟 这两个城市在时间上有差别吗 1 h0 u1 u2ha u1 u2 2 样本量都 30时 服从正态分布 可用z统计量 2 293 由于 2 29 1 96 双尾 所以拒绝原假设 不能肯定两个城市的水平相同 备注 如果两个样本量很小时候 不符合正态时应该用t检验 自由度 n1 n2 2且 样本不独立情况下的双值检验 64 案例 某零售公司抽取了10家连锁店开展促销以扩大销售额 下表是实施前后商店的周销售额 问题 表的样本数据是否充分满足管理者对促销导致销售额显著提高的预期 样本不独立情况下的双值检验 因为来自相同商品的数据 所以活动前后的数据不是独立的 把两个样本的数据转变成一个单样本的差异数据组 与单均值检验过程相似 1 h0 d 0 ha d 02 对样本 d的估值为 53 对xd的重复抽样分布属于t分布 其中 自由度 n 1 7 53 那么检验统计量是 2 14 查t值表 a 0 05 d f 9 单尾 的临界值为1 83 5 因为2 1 1 83 所以拒绝原假设 该活动有很好的效果 65 双比例检验 案例 宝马公司广告部经理 考虑使用短片x y吸引年轻的消费者 目标市场为18 30岁 随机抽取400个样本 随机分配200个分别给x和y 看过x片子的有40人喜欢 20 看过y片的有50人喜欢 25 可判断Y片 1 更加能够吸引目标消费吗 1 h0 1 2 ha 1 22 对于大样本 样本比例间的差异近似正态分布 而大样本在经验上为nipi和ni 1 pi 都必须 10 所以可以用z 检验 其中 Q 1 P3 因为z 1 019 1 645 单尾 所以不能拒绝原假设ho 不能证明y比x更好 相关分析方法概览 67 斯皮尔曼相关系数 讨论两个定序变量间的相关的程度与方向 又称等级相关 计算等级相关系数可以将数据变换成等级以后用原有的相关系数公式计算 也可以将算出每一对样本的等级之差di 然后用下列公式计算 t检验法 将r和n代入公式 算出统计量tr 按 0 05 自由度d f n 2查附表的t界值表 若tr t界值 则P 0 05 反之 tr t界值 则P 0 05 68 皮尔森相关系数 简单相关系数又称皮尔逊相关系数 它描述了两个定距变量间联系的紧密程度 其中 查表法检验法1 H0 p 0 变量间不存在线性相关关系 H1 p 0 变量间有线性相关关系 p是总体相关系数 d f n 1 a 0 05 2 比较r与临界值 双尾 r 临界值 或者r 临界值 就做出拒绝原假设的决定 69 一元线性回归 自变量 也称预测变量 引起其他变量变动的原因 在散点图中用x描述 因变量 也称解释变量 自变量影响的那个变量 散点图中y 一般表达式 y a bx a b都是常数 a是截距 b是斜率 回归方程评价 拟合优度是回归方程中自变量对因变量预测程度的一个整体测量 R2的取值与相关系数r一样 取值在0 1之间 如果散点图中是一条水平线 那么R2 0 如果没有明显的上扬或下降趋势 那么接近于0 如果具有完全的上扬和下降趋势 那么接近1 R2值越大 说明回归方程的可信度越高 R2 回归方程解释的平方和 总平方和 SSr SSt检验R2的显著性 1 p是方程中自变量的个数 n是样本规模 分子自由度p 分母自由度n p 1 通过f值表查找临界值 2 如果f大于临界值 我们拒绝认为R2的值并非显著不为0的原假设 回归系数的显著性检验 H0 bi 0 H1 bi 0 构造并计算统计量T统计量的自由度为n p 1 因此 比较t与临界值 双尾 t 临界值 或者t 临界值 就做出拒绝原假设的决定 70 运用回归分析时需要注意的问题 1 与线性分析得情形类似 回归分析只适用于分析自变量和因变量之间的线性关系 2 一个具有显著R2值的回归方程并不能表明自变量和因变量之间具有的因果关系 3 当预测所需要的自变量的值超过了构建方程时所适用的取值范围时 回归方程不太可能得到令人信服的因变量预测值 4 建立一个数据相对较少的样本上的回归方程也可能是不精确的 5 自变量和因变量数据的取值范围将会影响回归方程的有效性 71 多元回归方程 在许多实际问题中 还会遇到一个随机变量与多个变量的相关关系问题 需要用多元回归分析的方法来解决 72 相依分析 一个变量作为因变量 其他变量作为自变量 前三种互依分析 不指定因变量和自变量 只研究变量之间的关系模式 后四种 多变量分析方法 73 方差分析 方差分析 ANOVA analysisofvariance 和回归分析有着密切的联系 因为方差分析也是检验因变量和自变量的关系 然而 方差分析和回归分析存在一个基本的不同 回归分析中 因变量和自变量都是可以度量的 区间或比例 而在方差分析中只有因变量是可以度量的 自变量是类别变量和顺序变量 因子方差分析是用于分析一个以上类别数据的自变量对可度量因变量的影响 74 辨别分析 辨别分析 discriminalanalysis 是根据事先确定的因变量类别 例如产品的主要用户 普通用户或是非用户 自有房屋或租赁电视观众或非电视观众找出相应处理组的区别性特性 在辨别分析中 因变量为类别数据 有多少类别就有多少类别处理组 自变量通常为可度量数据 辨别分析的目的如下 建立能够最大限度地区分因变量类别的判别函数 考察自变量的组间差异是否显著 判断哪些自变量对组间差异贡献最大 评估分类的准确程度 根据自变量的值将样本归类 因子分析 因子分析是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个代表变量间关系的因子 并使因子具有一定的命名解释性 通常是从考察原始变量中矩阵配对的相关关系入手 然后再将这些变量组合为少数几个能够最大限度代表相关变量的因子 应用 首先 我们可以用它来开发简单但全面的多项目量表 第二 是在在现有的数据基础上解释截然不同的维度的性质 从而提供管理建议 为细分市场和营销组合策略提供参考 第三 因子分析把大量的数据转化成有限数量的不相关因素的一组因子得分 这种功能使该项技术可以与其他分析过程了联合使用 比如多元回归分析和判别分析 聚类分析 聚类分析是将对象 消费者 市场区域或产品 划分为不同的群体 群体内成员间在诸多方面表现出相似性 聚类分析对于旨在区分出不同的消费群体的市场细分非常有用 这一技术可以根据对一系列变量的赋值找出对象的自然群体 而不必将其中的任何一个设定为因变量 企业进行市场细分的一种方法是对收集到的数据进行聚类分析 尽管聚类分析和判别分析都是将很多研究对象分割成不同的群体 使各组包含的研究对象彼此相似 但这两种方法是不同的 在判别分析中 研究者研究各个组是基于一个独立的因变量 然后根据一组自变量的作用来有效地区分不同的组群 在聚合分析中 各个组没有作事前的详尽分析 相反 这种技术生成出各个组是基于研究对熊在很多变量上的相似性 多维标度分析 聚类分析是根据预设的维度上数据间的相似性进行对象分组 多维标度分析则在一定程度上是相反的过程 它是找出消费者评估中所表现出的关键维度 根据给定数据集中的消费者对产品或品牌的偏好得出相似和偏好的判断 这种方法在营销中最常用于找出竞争性品牌 商店等在消费者心目中的相对定位 描述感受相似性或偏好的数据不一定是可度量的 例如可以是排名 也可以是度量的 例如更确切的排名 联合分析 联合分析用于估计不同特性对消费者的相对重要性 以及不同特性水平给消费者带来的效用 联合分析的第一步是通过结合选择特征的不同水平构造几个描述性的形式或者假定的促进因素 联合分析的结果是相对于每个特征的一组效用值 对任一特性的某一水平 效用值越高 消费者对包含那一水平的描述性形式的偏好越大 市场篮分析 数据挖掘是一个分析过程 用于收集数据 从中发现一个固定的模式或变量间的系统关系 常用的软件有statistica数据挖掘者 spssclementine sas insightfulminer 常用的分析方法有 市场篮分析 分类模型 评分模型和rfm分析 预测等 为了处理庞大的数据 新的数据挖掘技术正在发展 例如文本和语音挖掘 视频挖掘等 市场篮分析是通过检查消费者的购物推车来确定哪些商品最经常被同时购买 市场蓝分析是运用一种运算方法来分析长长的购物清单 进而确定哪些商品最经常被同时购买 假设一家商店发现一个受欢迎的玩具65 的时候是随着糖果一起销售的 这个发现的潜在市场暗示是 1 在商店里保持玩具和糖果彼此邻近 2 把糖果和玩具绑在一起 3 把玩具和糖果以及另外一件滞销的商品绑在一起 以促进滞销商品销售 4 提高一种商品的价格 同时降低另一种商品的价格 5 保持玩具和糖果位于商店的两端 以确保消费者经过尽可能多的商品区收集玩具和糖果 市场篮分析 高级市场蓝分析举例来说 可以通过如下问题的研究得到消费者购买行为的更深入了解 消费者多久购物一次 消费者购物花费的费用是多少 消费者多久购买一次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论