版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于大数据的用户标签体系建设思路和应用如何设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?商业价值怎么使用用户表情符号创建商业价值?在大数据时代,数据在呈现出海量化、多样化和价值化变化的多样同时,也改变了传统IT行业的价格竞争环境、广告投放策略和服务模式。如何在ZB级的海量数据中获取并筛选有价值的第三级信息,是对IT企业的一大挑战。通过构建客户表情符号,支撑精细营销服务,是应对上述挑战的有效解决方案。但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么创办使用用户标签创建技术实力?这些都是产品设计能够层面需要解决的问题。掌上医讯一直以来都今日致力于打造医师的今日
2、头条和智能化的学习平台,通过大数据技术实现医生学习的智能化和个性化,而要依托这样一个学习平台,下工夫最基础的就是要建立用户的标签体系。经过长时间的学习、思考、借鉴和实践,现在已经有了自己的标签构建思路,并且也已经提取出了符合自身业务的标签。我们十分重视用户行为日志的收集,现在已经有资料库了亿万级别的日志数据资料,正在搭建信息处理和标签计算平台,以下是校正我们校对的建设思想。标签系统可以分为三个部分:数据加工层、数据服务层和数据网络协议。每个层面向的用户对象不一样,处理事务有所区别。层级越往下,与投资业务的耦合度就越小。层级越往上,业务关联性就越强。数据加工层收集、清洗和提取数据。掌上医讯有诸多
3、的学习模块,同时又有网站、APR小程序等多个产品形式,每个产品模块和产品端都会大量的业务数据和行为数据,这些数据极为相似又略有不同,为了搭建完善的用户表情符号体系,可能需要尽可能汇编汇总最大范围的数据。收集了所有数据之后,需要经过清洗、去重、去无效、去异常等等。数据加工层为业务层提供最基础的数据能力,提供数据原材料。业务层属于公共资源层,并不归属某个产品或投资业务线。它主要用来维护整个指标体系标签体系,集中在一个地方来进行管理。在这一层,运营人员和产品能够参与进来,提出业务要求:将原材料或进行切割。主要完成以下核心任务:应用层的任务是展示出产品和运营人员标签的工具能力,聚合业务数据,构建具体的
4、数据应用场景。(1)标签的类型从数据提取度量来看,标签可分为:事实标签、数学方法标签和预测标签。(2)事实标签从生产系统反之亦然,定性买家或定量描述客户的自然属性、产品属性、消费属性、资源属性等,以及根据沉淀工作人员经验积累的业务规则进行筛选、分析生产的标签,如是否活跃用户、是否是考生等。(3)模型标签普通用户对用户属性及行为等属性的抽象和聚类,的剖析用户通过基础数据为用户贴上相应的总结概括性标签及指数,标签代表消费者的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。(4)预测标签基于用户的属性、行为、信令、位置和特征,挖掘用户潜在需求,针对这些潜在需求配合营销策略、规则进行
5、打标,实现营销适时、适机、适景推送给用户。从数据的时效性来看,标签可分为:静态属性标签和静态属性标签。(5)静态属性标签持续性长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的客观事实,几乎不会改变。(6)动态属性标签存在有效期,需要定期地更新,保证标签的公平性。比如:用户的购买力,用户的活跃情况。标签的定义给用户打标签,建立用户画像,最终都是为了去运用,所以我们要站在应用场景上去定义用户的标签体系,每个标签都有最终的用途。比如:我们做考试技术培训服务,我们需要建立“是否考生”的标签。另外,不同的行业他们的用户也是有显著区别的,比如:医生用户相比普通用户来说,就多了像“科室”、
6、“职称”、“所在医院等级”等一般而言含义的标签。而标签是有层级关系的,既是为了管理,更好的理解,又是为了控制粗细力度,方便最终的应用。标签深度一般控制在四级比较靠谱,到了第四级就是具体的标签实例。我们根据公司产品销售的业务首先划分了人口属性、行为属性、用户分类和商业属性四个大的分类,下面又分了上网习惯、学习惯、人群属性、消费能力、消费习惯等分类,最末级精准到用户的活跃等级、阅读来源、考试偏好等具体的标签。ARMtt7枷MMi我国©力,8Hga学平痔F*“7件两自忖导&三士RffSa©W日nm<M.”星证狂星弄屿正常求!(惨标签的维护每个标签都不会凭空产生的,也
7、不会一成不变,更不会凭空消失。标签的维护和平需要生成规则,需要定义权重,需要更新策略。生成规则如第一部分所说,标签分为事实标签,模型标签和预测标签三大类。对于这三类的标签,生成的难度和复杂性也是逐级递增的。事实标签只公家机关需要考虑从什么地方提取即可,它即涵盖明确的标签定义,又包含无法穷举的标签集,比如:关注的病种。而模型标签需要有条码进行数据的关联和逻辑关系的设计,通过一定的模型对数据进行计算得来。而预测标签相对网页内容就非常的复杂,无法从原始数据萃取标签,标签的生成准确度就太依赖我们大数据分析依赖和机器翻译技术的应用。'J.Enn堇享二,4工5.油不十匚里)g通4L-1C;.
8、65;fr.:1sq-c-app一4:、土.V-|'fZM2L,利史凡般Ldtf*:/Flm,Ma>.学鬲曰山,ii一rEW庆九”网4翼公,师寰,相用+响电洪阶H射下*rtrVftftfrK取上的XHN属itil91工:收.cNLr有力胃.可“JTt丁时押d上值R电*/H昂卢八忆氏小人0及甚/11rl.中4e也Ntetl;。感编时户W,出.总入,内,%|"忸1箱一.一.一MiXfiJEWf.1死曲王1W.而如闻Ml/1:后工日受出&%血.里五AM*:厅*K天而户:;”-r;,f."用尸江打璃修日4iE3aq口J*3:风出Ur?邛t艮事款用户驾0L35&
9、quot;*.r7事£1降门备便需哪TB'r财中-fi10rnisT止始m;一:.*,irJi-*1a*谑j。注«冷到j;Xff立由定义权重一个标签会在多个场景下出现,比如:一个疾病标签,它极可能在浏览操作过程中生成,也有可能在搜索场景下产生,但是对于这两个故事情节所对应的同一个标签,他们的权重是多种不同的。浏览相比搜索,权重要小得多,因为搜索的主动融资需求更大。更新策略上文我们从数据的时效性上对标签分为动态属性标签和动态属性标签,对于静态较为简单属性标签的处理相对比较简单,就不停的累加即可。但是对于动态类型标签,需要对过期标签降权甚至删除处理,比如:医生考试前和考
10、试后,会影响“是否考生”这个标签的,这就需要制定更新操作方式。标签建设的技术架构标签体系的建设涉及很多环节,系统资源也十分巨大,需要有一个健壮且高效的存储架构来支持数据的技术及计算,掌上医讯采用了sql数据库和no-sql数据库来满足结构化切合数据和非结构化数据的存储。使用hadoop的分布式固态及hive和hbase组件作为数据仓库,使用MapReduce口spark分布式计算来提高计算速度,使用kylin进行多维分析,通过BI工具和接口对外提供软件系统,使用sqoop和kettle需要进行数据的抽取及流程的调用。MapReduce数据计.接口HDFS数据伐库mongodbmysqloracle«park存凭过程数博取及流程»度aonpkmKir更多的应用场景用户标签建立掌上基本应用在已经医讯的内容智能推荐的学习场景中,但随着标签的完善嵌入式以及智能化处理的提升,这套标签体系将有更广阔的应用场景。(1)智能化研习场景的构建通过用户学习需求条码的标签的分析进行用户分群,基于不同的用户群在APP的功能和内容上进行个性化展示,满足不同学习需求新颖的用户个性化的学习服务。(2)精准营销手段推广的建立更细粒度的对用户进行筛选,同时想要精准预测可能存在的需要进行目标用户进行推广,从而扩大医
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年版:供应链管理服务合同
- 2024年特种门采购合同范本3篇
- 2024年某企业关于知识产权许可的合同
- 马鞍山职业技术学院《安装工程计量计价实训》2023-2024学年第一学期期末试卷
- 2024年文化产业融资借款合同范本大全6篇
- 2025年货运从业资格证模拟试题题库及答案解析
- 2025年货运从业资格证考试题目和答案
- 2025年昆明考货运从业资格证考试题目
- 2024事业单位聘用合同教师(附教育质量监控与管理)3篇
- 2025建筑工程民工劳动合同范文
- 京瓷哲学培训课件
- 天猫电子商务案例分析
- 2022年1201广东选调生考试《综合行政能力测验》真题
- 有机肥料采购项目售后服务方案
- 综合实践活动(1年级下册)第3课时 感恩卡设计与制作-课件
- 2023河南省科学院招聘144人笔试参考题库(共500题)答案详解版
- (完整版)小学生英语百科知识竞赛题及答案
- 肥料、农药采购服务方案(技术方案)
- 脑卒中后吞咽障碍患者进食护理(2023年中华护理学会团体标准)
- 妊娠期高血压疾病诊治指南(2022版)解读
- 政府经济学网上作业-第2次任务-以“政府支出”为主题-撰写一篇不少于1000字的小论文
评论
0/150
提交评论