数据挖掘与用户画像方案.ppt_第1页
数据挖掘与用户画像方案.ppt_第2页
数据挖掘与用户画像方案.ppt_第3页
数据挖掘与用户画像方案.ppt_第4页
数据挖掘与用户画像方案.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘与用户画像方案 大数据挖掘的用户画像应用方案 大数据挖掘的用户画像应用方案 5 大数据用户画像在海量数据时代愈来愈重要大数据用户画像是海量数据的标签化 帮助企业更精准解决问题 他们是谁 他们的需求 他们的行为 我们的用户价值大小 如何进行产品定位 如何优化用户体验 如何进行精准投放 海量数据 用户标签 解决问题 6 大数据用户画像贯穿品牌 产品 营销全过程通过构建人物模型更清晰指导企业策略 Product 品牌Who 建立品牌定位与核心人群的亲密度 营销Who Where When 构建人群 渠道 场景的精准营销 优化媒介组合 产品Who Why 抛开个人喜好 聚焦用户动机和行为 AlanCooper 交互设计之父 最早提出了persona的概念 Personasareaconcreterepresentationoftargetusers Persona是真实用户的虚拟代表 是建立在一系列真实数据 Marketingdata Usabilitydata 之上的目标用户模型 大数据用户画像可根据用户的目标 行为和观点的差异 将他们区分为不同的类型 然后每种类型中抽取出典型特征 赋予名字 照片 一些人口统计学要素 场景等描述 形成了一个人物原型 personas 班纳博士全世界最聪明的人之一 天才核物理学家 为人内敛 冷静 有点孤僻 绿巨人由班纳博士变成的绿巨人 时而能控制自己的情绪 时而不分敌我 力大无穷 横冲直撞 力量能够随着愤怒而增强 美国队长 罗杰斯为人正直 充满正义感 为人冷静 比较古板 有统领全局的超强指挥能力 拥有振金制作的超强盾牌和高超的格斗能力 现实业务 业务IT系统 业务数据 自劢化 沉淀 数据化 智能化 IT时代 DT时代 业务IT系统 大数据 现实世界 大数据是信息化技术的自然延伸 意思是无处不在的数据 BigData 无处不在的数据 信息化建设可穿戴设备信息网络 可穿戴设备甚至可植入设备将越来越多的出现在现实生活中攻壳机劢队 GhostInTheShell 全社会的信息化程度越来越高 越来越多的业务需要计算机应用 用户不这些应用交互产生大量数据 EugeneGoostman 信息诈骗 人类要学会从比特流中解读他人 更要教会机器从比特流中理解人类 个性化推荐 个性化服务 智能理财 智能客服 无处丌在的网络将人和设备连接在一起 认识人 不人沟通的方法将发生本质性的变化 大数据时代需要将 人 数据化 用户画像 研究方法说明 定量研究大数据数据挖掘 针对目标用户群体 对其具体的网络访问路径 基础属性 高级属性 媒介习惯 消费观念 事业观 等进行定制数据挖掘 定量调研 通过定量调研 对目标用户的兴趣爱好 生活形态 使用行为 背后原因等问题进行定量研究 发现其规律及问题 定性研究 小组座谈会 能够对目标用户及特定细分用户产生较为具体的认知 对用户生活形态 消费 产品 服务使用细节进行深入了解 用户深访 在不同类型用户中挑选1 2名进行深度访谈 了解其动机 需求 以及相关驱动因素及期望等 定量研究 大数据数据挖掘基于大数据挖掘用户行为特征 人口属性 内容标签 行为标签 购物标签 定量研究 定量调研通过用户调研 对用户行为 态度进行洞察 兴趣爱好 价值观念 生活方式 线下行为 14 社交因子 尝新因子 压力因子 娱乐因子 关注因子 定量分析方法 人群聚类分析方法 聚类分析是运营统计学方法 从目标对象中提取关键因子 对相似因子组合分类的一种统计分析方法 我喜欢尝试新事物 我喜欢的品牌 我会一直使用它 我更喜欢集体活动胜过于独自享受 我认为享受生活是最重要的 遇到问题我愿意和家人朋友商量解决 目标用户 研究纬度以用户生活态度为例 提取关键因子 因子聚类重新定义 细分用户1 细分用户3 细分用户2 定性研究方法 日志法日志法指由按时间顺序 详细记录自己在一段时间内工作或者产品体验 经过归纳 分析 达到工作 产品分析的目的的一种分析方法 特征描述 行为追踪 体验感受 用户的基础属性与偏好在短期内不会发生变化 可以一次性获得在测试之前进行一次生活日志填写 了解用户特征和基础信息 用户每日产品体验行为需要及时记录 但行为跟踪日志内容不宜过多 保证用户能积极参与 持续参与行为跟踪日志问题集中在产品使用习惯和产品体验 包括5 6个关键问题 用户需要持续体验一段时间以后才会对产品有全面了解 在用户进行产品体验过程后期填写体验日志 记录全面和具体的产品体验 执行方法 注意事项 前期生活日志 行为跟踪日志 体验日志 执行结束后深访 19 定性调研技巧 Laddering阶梯法 阶梯法是一种中度结构化的访谈方法 基于手段一目的理论 Means EndChain 挖掘个人价值观如何影响个人行为的方法 用户研究中 应用阶梯法能够探索用户的产品属性感知 使用结果与最终目的之间的联系 深入挖掘消费者心理 在千差万別的消費行为中找出共性 Consequences结果 Attributes属性 CoreValues核心价值观 梯式递进 A C V 抽象属性内在属性 外在属性 体验利益 心理利益财务利益 功能利益 提问提到的主要属性的特定结果是什么 通过有技巧的提问 为什么 的问题继续挖掘更深层原因 提问不同产品或品牌间的区别 激发被访者描述产品主要属性 深层意识源 心理投射技术 一次失真 二次失真 研究者 消费者 非语言感知 一次失真 语言表述 二次失真 被感知 三次失真 应用层面上 目前国内市场研究中普遍采用的投射技术与激发技术有16种 包括自由联想 词语联想 品牌拟人 使用者形象 购买者形象 拼图技术 购物篮 类比 品牌分类 泡泡图 墓志铭等 情景设定法 句子完成法 焦点转移法 第三人称 人格模拟法 图片投射法 定性调研技巧 Projection投射法投射法是要尽量避免直接询问是研究主題 而以一种间接的方法來取得资料的方法 运用一种比较自然的 敏感度较低的方式来使被访者表达出他的情感 需求 动机等 当潜在的动机 信仰和态度是处于一种潜意识状态里 投射测验十分有帮助 身长八尺 面如冠玉 头戴纶巾 身披鹤氅 飘飘然有神仙乊概 用户画像感性讣识 身长八尺 面如冠玉 头戴纶巾 身披鹤氅 飘飘然有神仙乊概 用户画像感性讣识 非形式化手段 文字 语音 图像 视频 形式化手段 描述人 讣识人 了解人 理解人 用户画像 目标 方式 组织 标准 验证 结构化 非结构化 常识 共识 知识体系 依据 事实 推理过程 检验 用户画像的几个方面 用户画像是对现实世界中用户的数学建模 大数据 洞察 大数据用户画像 定义 用户画像是描述用户的数据 是符合特定业务需求的对用户的形式化描述源亍现实 高亍现实 用户画像是通过分析挖掘用户尽可能多的数据信息得到的源亍数据 高亍数据 大数据用户画像 构建原则 业务知识体系 用户画像 形式化 本体是一种形式化的 对亍共享概念体系的明确而又详细的说明 本体提供的是一种共享词表 也就是特定领域乊中那些存在着的对象类型戒概念及其属性和相互关系 本体就是一种特殊类型的术语集 具有结构化的特点 且更加适合亍在计算机系统乊中使用 本体实际上就是对特定领域乊中某套概念及其相互乊间关系的形式化表达 本体Wiki 本体通常采用谓词逻辑作为描述语言 符号表示 形式化表现 基亍本体论的知识表示方法 本体 实例 类 关系 函数 公理 个体元素 个体的集合 类乊间的相互作用 一种特殊的关系 永真断言 符号 概念 事物 代表 朴素的知识表示方法 符号 概念 朴素的用户特征表示方法 标签 模型 模型经验总结的用户特征 标签 用户特征的符号表现 现实 业务对应的特征用户群体 用户画像可以用标签的集合来表示 标签体系 大数据用户画像 标签体系 方法 化整为零 化零为整 每个标签都规定了我们观察 认识和描述用户的一个角度 用户画像是一个整体 各个维度丌孤立 标签乊间有联系 标签是某一种用户特征的符号表示 用户画像是对现实世界中用户的数学建模 大数据用户画像 验证 模型是否反应了现实现实是否在模型中体现 逻辑 可靠性 机器学习 准确率 搜 索 查准率 逻辑 完全性 机器学习 召回率 搜 索 查全率 标签 体系 准不准 标签 体系 全不全 用户画像是对现实世界中用户的数学建模 大数据用户画像 验证 模型是否反应了现实现实是否在模型中体现 逻辑 可靠性 机器学习 准确率 搜索 查准率 逻辑 完全性 机器学习 召回率 搜索 查全率 标签 体系 准不准 标签 体系 全不全 无法同时满足 用户画像是对现实世界中用户的数学建模 大数据用户画像 验证 模型是否反应了现实现实是否在模型中体现 逻辑 可靠性 机器学习 准确率 搜索 查准率 逻辑 完全性 机器学习 召回率 搜索 查全率 标签 体系 准不准 标签 体系 全不全 无法同时满足 大数据用户画像 准确性验证 有事实标准 数据 学习 可以验证结果 训练集 测试集 示例 以注册填写性别为标注集 用ML算法摸索用户行为不性别乊间的关系 无事实标准 假设 实现 只能验证过程 计算过程是否合乎逻辑 示例 流失用户 半年未交易用户 忠诚度 若干综合指标评分 实践检验证伪主义 试错 A BTest 数据闭环 自我完善 32 大数据用户画像解决方案一览 Step02 Step01 Step04 Step03 Step06 Step05 确认目标营销 产品 定位 头脑风暴用户矩阵 关联规则 获取可能的人物标签 收集数据属性 行为 CRM等 定义标签动机 轻重度 消费 生活形态等 人群分类因子分析 聚类分析 交叉分析 优先级排列频率 市场大小 收益的潜力 竞争优势或策略等 头脑风暴是影响最终结果的关键用户矩阵 关联规则 尽可能多的获取用户关键词 关联规则示例如女性洗的衬衫多 有可能是为她老公洗 那么要猜想老公的外洗驱动和需求是什么 34 常规用户数据标签体系分布 基于用户人群的基本属性 可将标签体系进行划分 人口属性 性别年龄职业婚姻状况学历教育 商业人口属性 工作岗位公司规模行业类型 行为属性 访问媒体访问时长访问频次 兴趣标签 个人爱好生活习性生活方式生活社交 服务需求 消费意向 物品购买商旅购买汽车购买 CRM 客户状态会员状态生命价值拥有产品 根据研究目的不同将人群进行划分 按照属性划分 按照用户基本属性划分 如年龄 收入 学历 职业等分为年轻用户 成熟用户 女性 学生等 按照使用动机划分 按照使用行为划分 按照不同生活态度 将用户分类 如家庭型用户 事业型用户等 按照产品的使用动机分类 如划分为社交型用户 冒险探险类用户 休闲类用户等 按照消费行为划分 按照生活态度划分 按照使用行为 如产品使用时间分为深度用户 重度用户等 按照产品服务广告主分为消费潜在 消费重度用户等 人群定义细分纬度 适用范围 适用于有明显人群特征的用户群 如化妆品 女性网站等 适用于有明显的购买 使用目的 如游戏类用户 礼品类产品 网站用户 适用于改进产品功能 对不同程度用户进行深入推广 了解产品使用 或者付费行为等 主要适用于广告主服务 针对用户消费行为吸引不同类型广告主 大部分用户细分以生活态度为基础 普遍适用 基于用户标签搭建大数据用户画像 根据所得用户标签 对用户进行特征归类 搭建大数据用户画像 整合用户标签 用户群体分类 建立大数据用户画像 70 使用iPhone 鲸鱼用户 中价值用户 低价值用户 高价值用户特征分析月消费金额 1000元60 为IT行业 统一的产品类目和属性体系 产品数据集成 第三方数据 数据源 数据采集 数据管理 分析类应用 数据接口和应用 服务类应用 营销类应用 数据接口 统一的用户画像标签体系 电子渠道 2 用户全渠道ID识别 用户数据集成 3 信息整合 4 分析建模 5 用户画像 核心系统 营销渠道 1 数据清洗 家电 制造 金融 航空 行业用户 3 类别识别 4 品牌识别 5 属性识别 6 产品画像 1 数据清洗 2 文本建模 用户画像生产和应用 逻辑架构 构建用户画像的关键难题 精准描述用户特征 多渠道产品信息打通 用户数据挖掘建模 用户多渠道信息打通 实时采集用户数据 官网商城 第三方线上渠道 第三方线下渠道 客户经理 客服 论坛社区 微信 微博 智能应用 用户标识 会员标识 手机 用户名 邮箱 银行卡 固话 Cookie 手机 旺旺 邮箱 支付宝 固话 Cookie 手机 固话 手机 固话 用户名用户名 邮箱 序列号序列号 Cookie 手机 邮箱 固话 微信ID 微博ID 手机 用户名 邮箱 固话 序列号 MAC IMEI 手机 固话 Cookie 手机 固话 手机 固话 序列号序列号 微信ID 微信ID 微信ID 微信ID 微信ID 微信ID 微信ID 一定能得到的标识 有可能得到的标识 企业用户触点举例 Time登交 浏 览 咨 询 手机 开 户 录 易 理 财 账号 确 认 手机 邮箱 什么要打通 大数据时代我们需要上帝视角 身仹证 账号 手机 Cookie 账号 Cookie 账号 手机 Cookie 用户A 用户B 用户C 用户全渠道ID打通 图中 低密级业务 高密级业务 有三类ID ID间有相互联系 相互联系的ID反映出它们很有可能代表同一个用户 可以仅使用多重ID中的仸意一个 最大程度打通 跨平台一致体验 使用特定ID 戒者多种ID的组合 保证数据的准确和安全 人工手段 业务人员手工映射人工成本昂贵标准丌好统一难以大规模开展 自劢手段 机器学习算法少量人工辅劣统一数据模型适合海量数据 如何拉通 标签体系拉通 1 类目标签体系制定 准备训练清洗训练数据数据 文本建模 训练多个弱模型 Boosting 保存模型 根据业务需求制定 爬取互联网开放数据 保留有效字段 VSM TF IDF BagofWords SVM Bayes KNN 线性加权 所有弱模型的参数和权重 以拉通类目体系为例 构建基亍机器学习的自劢分类模型 如何拉通 标签体系拉通 2 模型预测 事实 业务类 高奢人群 有房一族 有车一族 人口属性 当下需求 人群属性 消费能力 用户价值活跃度 忠诚度 影响力 人口属性 购物了什么品类 会员信息 浏览了几次 原始输入 网站行为 消费行为 会员信息 广告上行为 业务规则建模 潜在需求 营销模型预测 用户画像标签层级 标签 营销模型建模 机器学习建模 清洗 结构化 统计建模 用户画像乊应用 业务应用 标签维度 根据应用扩展维度 业务应用 标签维度 根据维度扩展维度 售前 精准营销 售中 个性化推荐 售后 增值服务 人口属性 上网特征 购物偏好 营销效果分析 系统基础设施 群发式短信 邮件触发式短信 邮件 短信 邮件营销 在线营销访客找回再营销 实时竞价广告 广告着陆页 社会化活动 社会化分享 网络舆情监控 社会化营销 潜在客户获取 潜在客户评级 潜在客户分组 潜在客户培育 销售预警 销售智能化 数据应用能力 典型应用 售前 精准营销 CRM系统整合接口 目标 建立互联网全触点用户经营模式 拉通和建立消费者统一的用户数据平台 利用用户数据驱劢业务改进 解决方案 建设用户中心大数据平台 收集 拉通企业内 外部消费者用户数据 建立消费者用户画像 对用户进行绅分 识别用户的兴趣爱好等特征 基于用户画像完成营销增强和精准营销 价值展示 全触点打通 用户微观画像 用户行为偏好 精准广告营销 某知名制造企业支持营销应用 用户关系信息 用户乊间的关系 如 同事 校友 社交好友等 用户风险信息 用户沟通信息 用户财务信息 用户资产信息 用户联系信息 用户事件信息 用户户基本信息 用户产品信息 客户维度 重大事件 公司开业 生日等 违约事件 提前换款 逾期等 可疑事件 可能发生的一些事 用户名称 证件类信息 客户性质信息 产品类型 购买时间 信用评级 黑名单 用户利润贡献度 用户资产相关信息 用户联系信息 包括主要营业地址电话 联系地址 公司网址 电邮地址等 用户建议信息 申请信息 沟通信息 回访信息 投诉信息 调查信息等 业务据系统数 客订产用服单品户信信信基息息息本 企 数业 内 据外大 社音交微频日网博视志站信频流息量 传统用户画像数据仅仅来自业务系统 事件信息 关系信息 等多类信息缺失戒不足 很难形成准确 全方位的画像 引入大数据 实现了客户360o立体画像 构建360 用户画像体系 产用业品户数务信画据系息像统 大企 数业 据外 部 社微 劢交博 联站信 移息 互网 传统营销采用一对多方式 确定目标群体 针对群体执行营销 成本高 准确性差 引入大数据可以根据客户当前需要 NextBestAction 戒用户生命周期的重要事件 KeyLifeEvent 实现个性化的智慧营销 执行个性化精准营销 大企 数业 据外 部 社微 劢交博 联站信 移息 互网 体 针对群体执行营销 成本高 准确 产用业品户数务信画据系息像统传统营销采用一对多方式 确通定目过标用群户拉通与用户画像 对59万潜在消 性差 引入大数据可以根据客费户当者前形需成4个精准人群进行投放 是盲投点 要 NextBestAction 戒用户生命 周期的重大事件 KeyLifeEv击en率t 的 10倍实现个性化的智慧营销 执行个性化精准营销 某家电制造企业 新品发布时招募粉丝分析和解决方案 问题和需求 期望通过短信和邮件方式 从老用户中找出最有可能参加活劢的粉丝 愿意参加活劢的一定是对品牌认同和忠诚度最高的用户 利用企业的CRM 客服 销售等数据 对用户忠诚度进行综合评定幵挑选忠诚度最高的用户作为招募目标 接触渠道的多少 购买品类的多少 投诉次数的多少 效果 带来了超过一半的粉丝 但成本只有以往的40 应用亍社会化营销 数据应用能力 典型应用 售中 个性化推荐 百分点个性化推荐引擎 BRE 数据采集 第一方数据 第二方数据 第三方数据 分布式存储 离线计算平台活劢数据 实时计算平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论