版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【标签画像系列】标签画像体系建设方法论5月11日录制了数栈全新数据中台精讲系列——「数智赋能实战六讲」的第一场直播,主要对标签体系的建设进行了抽象,分成几个步骤,便利大家理解。
你能看到:
数字营销是数字化转型排头兵;标签体系建设方法论;标签体系在某基金的建设案例。一、数字营销是数字化转型排头兵
《⼗四五数字经济进展规划》中强调,要⼤⼒推动数字化转型,形成数据驱动的智能决策能⼒,提升企业整体运营效率。
要做好数字化转型,企业可从产、研、供、销、⽤等多个环节入手,而“销”恰好是第一关键要素,企业转型往往从营销场景入手,因此我们说数字化营销是企业数字化转型的排头兵。
在数字化营销转型过程中,由于各个企业的数字化建设进程不同,往往会遇到多种挑战,如:
企业数据如何打通?客户画像如何建设?营销ROI如何提升?营销策略如何迭代?
要想解决以上问题,在业务⽣产与业务应⽤之前,让产业数字化营销,我们需要进⾏:
数据的统⼀存储;OneID的数据打通;OneModel的数据模型建设;数据资产的统⼀管理。打好这些基础,接下来就能开头建设企业自己的共性化标签体系,让标签作为企业数字化营销的基石,关心消费者画像更加精确。
实现用数据指导营销,而不再只是模糊的阅历;让活动的数据再回流到数仓中,作为标签数据来源的一部分,形成营销业务闭环。
二、标签体系建设方法论
那么如何关心企业构建完善的标签体系呢?我们总结出“三目标+五步法”的方法论:
1.标签体系建设三目标
目标一:解决业务问题
要确定我们建设标签体系是为了解决什么详细的业务问题,想要达到什么效果,时间上要做到分期而治,小步快跑,早日推广应用。
目标二:业务人员好用、易用
标签体系的建设目标是要敏捷可扩展,让业务人员可以轻松衍生标签、生产效率高。同时标签应用方式还需要多种多样,以适应不同的业务要求。
目标三:可持续更新迭代
标签体系作为重要数据资产,需要我们对它进行持续完善,形成业务应用与数据开发部门良好互动,助力生产更有价值的数据。
2.标签体系建设五步法
1)第一步明确建设目标
在开头建设标签时,我们需要明确建设目标,目标可以指导我们的执行策略无偏差,最终达到想要的结果,否则在建设过程中随着一些信息的输入、困难的消失,简单今日一榔头明天一棒槌,顾此失彼,达不到业务期望的结果。
(1)业务建设目标
业务建设目标,指通过标签项目想解决什么样的问题,达到什么样的业务效果。比如
现在属于粗略式的运营,需要基于标签体系实现精细化运营,将营销活动的转化率提升5%。标签加工流程过于缓慢,从业务人员提需求到需求实现需要1-2周时间,需要将改时间缩短至1-3天。现在数据来源过于单一,只有交易域,需要汇总其他域的数据,比如行为数据、评论数据、活动数据等丰富标签体系维度。一般列举5-10条目标,业务部门与技术部门一起制定,基于这些目标,进行系统建设。
(2)系统建设目标
为实现对应的业务目标,需要建设一个怎样的系统,是内部实现,还是外部选购,各自的实现周期与成本,若外部选购,选购的标准是什么等都需要考虑,该问题一般是技术部门来考虑。
系统给谁使用:是建设一个标签加工与管理的标签管理工具,主要给技术部门使用,由于企业已经有了营销系统、涵盖标签圈群与推送给的功能。还是需要一个集合加工、管理、圈群、分析一体化的工具,数据分析师、业务人员也要用。不同的使用对象,系统建设的内容不一样。系统的技术架构要求:公司内部的大数据部门若已经用了一些底层平台或技术组件,从节约成本方面,应当尽量用同一套底层存储与计算平台,比如已经选购了CDH、TDH的Hadoop,那标签系统需要可直接对接这些系统进行数据存储与计算。以及标签系统需要和CRM系统、营销平台实现对接,便需要有相应的对接方案,如通过标签服务API接口,或数据同步、推送等当时,将数据给到下游系统。系统功能要求:基于标签的加工、标签的生名周期管理、标签的数据平安、标签的评估治理、标签圈群、画像洞察、对外服务等多方面梳理需要的功能。系统性能要求:基于司内的数据量,标签加工的速度、并发,标签圈群与分析的查询时间,所需要的部署资源、一年需要花费的成本需要进行评估与计算。(3)参加部门与执行方案
依据我们一些标签项目的建设经理,会消失这样的状况,大数据部门一期项目建好的标签,很难推动业务人员使用起来,主要有以下几点缘由:
业务人员觉得建设的标签有用的很少,大多数都用不上;用了一下标签,觉得数据不精确 ,不敢用;领导没有说要用这些标签,还是根据自己的既定模式来工作好了。基于这些问题,标签项目推动之初,需要拉上业务部门的领导、对接人一起参加,确定一个先应用标签的项目或场景,做出效果,再应用到更多的部门及项目,否则刚开头大而全,周期长、且没有目标性,往往后续推广使用时会遇到阻碍。
参加部门包含以下:
需要标签项目服务的业务部门(核心):如市场部、运营部、客服部、风控部等,各指定一名对接人员。项目需求收集分析者:数据产品经理、数据分析师。系统建设和标签加工者:数据科技部门。制定执行方案:
项目是否需要分期,一期项目的目标和建设的标签有哪些。各期项目时间周期、负责人,上线场景。上线后业务人员需要持续反馈使用状况,业务变化状况,不断的优化迭代。2.其次步标签体系设计
明确好建设目标之后的下一步就是标签体系设计。
在此之前,我们先对一些标签的重要概念做一些介绍:
标签体系设计是一种对对象统一进行本质刻画的数据描述方法,把个体观看升级为群体观看,而非过去对个体现象的归纳,更具有面对将来的场景化适应力量。标签体系设计的整体流程可分为4大步骤+2大阶段:
在此过程中我们需要:
1)规划实体对象
确定标签体系的对象,梳理标签间的关系,设计标签体系,做好标签类目创建。
实体指我们要建立标签体系的对象,如客户标签体系、商品标签体系、渠道标签体系、客户经理标签体系,客户、商品、渠道、客户经理都属于我们的实体对象。其类似一颗树的根,后续要基于“实体”,长出树的枝干、叶子、花等,所以划分正确的实体很重要。
关系指多个实体之间的关系,如“客户”购买“基金”,会使客户实体与基金实体发生关系,形成新的标签,比如加工“投资风险偏好”标签,标签值为“高风险”、“中高风险”、“低风险”等,需要利用客户最近一年的交易记录结合基金维表,当用户购买基金的基金类型包含高风险,且最近一年购买金额5000时,为高风险偏好。需要用到2个实体形成一个关系,来加工这个标签。
2)探查数据
依据标准数据建仓规范,梳理下也许的客户的数据域、业务过程、数据表、表的数据量、数据分布等,把握基于该数据,可以加工出哪些标签。
3)设计标签类目
基于已采集的业务需求、把握的数据状况、规划的实体的对象,建立实体对象的标签类目体系。除依据客户业务建设外,也会供应一些行业通用模板,作为参考。
标签类目体系是“实体”树的枝干,为以后标签生长的繁茂建立基础,需要做到枝枝粗大、分明,即每个类目需要有明显的分割,且标签的数量不能过多和过少,建议一个子类目不超过20个标签,不少于3个标签。
标签类目层级依据业务实际状况划分,一般2~3层即可(不包含标签、标签值)。如下图:
4)设计标签内容
包含标签定义、加工方法推断、加工范围推断等。
依据前面的需求调研、数据调研、类目划分,梳理标签体系中的标签,需包含以下内容:
标签中文、英文名:标签的中文名称、英文名称;标签所属类目:标签所属一级、二级、三级类目;标签类型:依据不同维度的划分,采纳其中一种。比如事实标签、统计类标签、猜测类标签,亦或是原子标签、衍生标签、组合标签、自定义标签等;标签值定义:定义每个标签的标签值,如“近一个月买入金额区间”标签,可依据购买金额的区间段定义“零/低端”、“一般”、“中端”、“准高端”、“高端”等标签值;标签含义(描述):描述该标签业务含义,如“最近30天的购买商品的金额区间,对用户消费劲进行评估”标签业务口径:标签以哪个数据定义为准,如“用户活跃城市”标签,以用户购买次数最多的城市为口径加工,而不是扫瞄次数、评论次数等;标签技术口径:描述该标签从哪个表的哪个字段取值,SQL取数规律是什么;业务方来源:该标签的业务需求方是谁;标签更新周期:描述标签更新频次,天(如T+1、T+2等)、周、月、小时、分钟更新等;标签更新优先级:同一时间端跑多个标签时,若资源有限,先跑优先级高的标签;3.第三步:标签加工与更新
标签加工与更新包含各类型标签加工、标签测试和标签上线与更新几个步骤,在技术层面实现营销需求。
推断标签加工方法:
梳理标签的加工方式,推断哪些是离线标签、实时标签、算法标签,从而引入对应的产品和相应的开发人员来开发。业务场景中,离线标签偏多,实时标签次之,算法标签少之。
离线标签:定时跑批,一般为天粒度,T+1跑批,晚上跑标签结果,业务人员其次天做查询。一些标签若高频率更新,也支持小时、分钟粒度的更新。常需要Spark、Presto、Impala等跑批组件及产品。实时标签:实时加工,一般为秒或毫秒级加工,常见于用户行为实时传上来,基于用户的实时行为,打标签,进行商品推举等。常需要采纳Kafka消息队列、Flink实时计算引擎组及产品。算法标签:利用机器学习算法、深度学习算法,做一些猜测类标签,如依据用户的购物商品和频率,猜测家里是否有小孩、小孩年龄等。常需要Python开发环境和机器学习算法包。不用的加工类型,往往需要采纳不同的计算引擎和框架,需推断企业内容是否有这样的力量加工,若无,外部选购的话需要供应商有什么样的力量,需要有大致的推断。
划分加工范围:
标签的使用人员是业务人员,在以往老的流程中,需要业务人员向数据开发提需求加工新标签,开发一个新标签的周期一般1-2周之间。
为了使业务人员能够敏捷的加工规章标签,尽快提取自己想要的数据,标签的加工、管理目前多通过产品化的方式,使数据开发、数据分析师、业务人员都能参加标签的开发。
这里便涉及到哪些标签由开发人员加工,哪些标签由业务人员加工,标签加工流程是什么等。
可根据上述流程,在数据开发和业务人员之间有个标签管理团队,用来维护标签的生命周期,包括标签需求的分解、上下架等,可由数据分析师、业务人员组成。
大的划分原则是:
基础标签的标签由数据开发团队加工,这类标签是基于数仓数据加工的最细粒度标签(是能打在用户身上的标签,不是某个单纯的字段),不能再被拆解。
基于基础标签可通过规章衍生的,由业务人员完成。
以上图为例:当有一个“是否30天登录未注册用户”标签需求时,标签管理团队可推断该标签是否可基于基础标签衍生,若不行,则由数据开发加工对应的标签。
若可以,则推断是否有对应的基础标签可衍生,如举例标签,可拆解成“APP最近一次登录日期”或距最近一次登录时间,与“是否注册”2个基础标签,便可基于基础标签,业务人员完成这2个标签的加工与上线。
4.第四步标签生命周期管理
标签生命周期管理是指包含标签评估、标签治理和标签迭代等几个对标签的实际使用状态负责的管理流程,关心实现标签建设与营销的有机结合,不铺张任何一个动作指标。
从以下维度来评估标签的重要性:
标签使用度评分:依据标签引用次数、标签分析次数、标签调用次数来评估标签的使用度;标签关注度评分:依据标签搜寻次数、标签扫瞄次数、标签保藏次数来评估标签的关注度;标签质量评分:依据标签值的掩盖状况来评估标签的质量,若null值过多,则说明标签规章设置不合理;标签持续优化度评分:依据标签上线后,再编辑优化的次数来评估标签的持续优化状况;标签平安评分:依据标签是否脱敏、是否设置行级权限、是都需要申请、是否设置可见性来推断标签的平安度。基于以上5个维度计算标签的综合评分,可查看各标签的评分、评估标签的重要性。
同时,基于标签使用度评分、标签关注度评分、标签持续优化度评分来计算热门标签排行、缄默标签排行,找出不太用的标签进行下线,完成标签的“定义——开发——上线——优化——下线”全生命周期管理。
5.第五步标签应用与回流
标签应用与回流则是指标签圈群、画像洞察和对外服务几项详细的落地结果操作,也是标签建设必不行少的一环。
以一个场景举例:
营销策略:为维持老顾客的忠诚度,并引导现在购买初级产品的老客户向高级产品进阶,圈选出为“老顾客升级”用户,为这些客户发放高端产品的优待券;人群包选择:“最近1年购买次数=1”且“最近1年消费金额=1000”且“性别=女”的客户。基于目前群组进行画像洞察:
群组画像:进一步分析“老客户升级”这批用户的会员等级、月消费支出、是否为活跃用户等,进一步把握群组特征,依据活动预算调整自己的营销策略群组分析:圈选出一个“高端产品用户”群组,监控每天忠有用户的人数,看是不是有明显波动,某些活动发放后,数据是否有提升;某个时间人数是否有骤减,保障群组的稳定持续上升。群组交并差计算:分析“老顾客升级”群组与“高端客户”的重合度,看是否有重复人群,最终推送优待券可进行策略调整,不针对这部分重合客户进行本次推送。确定好人群后,便可进行市场投放,看其对业务带来的作用,除分析活动带来的GMV、客单价提升外,我们也需要知道活动参加状况也是用户行为数据的一种,需要将这些数据也回流至数仓,生成新的标签。
三、标签体系在某基金的建设案例
在上文中我们介绍了标签体系建设的方法论,如何将理论落地实践,袋鼠云数栈智能标签产品给出了答案。
智能标签管理分析平台(DataTag),通过标签萃取、标签管理、群组细分、全面画像,构建以业务价值为导向的标签体系和多样化群组,将数据资产标签化,数据标签价值化,应用于企业智能化运营与营销。
接下来我们以某基金客户的案例,来为大家介绍标签体系建设的实际应用。
1.项目背景
身处一个全方位数字化的平台型经济时代,企业的数字化转型已是由内而外的必定趋势,在数字化浪潮下,基金客户的各项业务迅猛进展、客户数据量急剧增长,公司对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中物理第九章固体液体和物态变化第2节液体课件新人教版选修3-
- 高考数学全真模拟试题第12625期
- 【中考考点基础练】第11章 内能与热机 2025年物理中考总复习(福建)(含答案)
- 2024年山东省泰安市中考地理试题含答案
- 2024至2030年中国无菌设备数据监测研究报告
- 2024至2030年中国数码固体立体声全自动播放器数据监测研究报告
- 2024至2030年中国微电脑控制抽真空精密加酸机数据监测研究报告
- 2024至2030年中国引线式热敏电阻器行业投资前景及策略咨询研究报告
- 2010-2012年液态豆奶行业市场研究与竞争力分析报告
- 2024至2030年中国土碱行业投资前景及策略咨询研究报告
- 外墙保温一体板监理细则
- 类风湿关节炎诊疗规范2023版
- 浙江省杭州市西溪中学2023-2024学年八年级上学期期中科学试卷
- 费用报销单模板
- 从铝土矿提取铝
- 广东省江门市新会区会城镇城南小学2023-2024学年四年级上学期11月期中英语试题
- 浙江省嘉兴市2023年八年级上学期期中数学试卷(附答案)
- 2023年上半年(上午)《系统规划与管理师》真题
- 求雨后姐弟小故事
- 水果会变色(教案)全国通用一年级上册综合实践活动
- 高中化学学法指导
评论
0/150
提交评论