阿里数字商业知识图谱构建及开放_第1页
阿里数字商业知识图谱构建及开放_第2页
阿里数字商业知识图谱构建及开放_第3页
阿里数字商业知识图谱构建及开放_第4页
阿里数字商业知识图谱构建及开放_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

阿里数字商业知识图谱构建及开放陈强(拉普)阿里巴巴业务中台商品智能负责人消费电商加速进化:消费观念的变化ԣՋԍஙஙੜᕡᜓᗦঅੜᇔ҅ੜᏟଛ᪁অሻ᩻ํ໺ฬฬᚆᑀଝӧଝᑁమ᨝ێڠ఺܈᪃ԎฦӮհ꧊ᇇ๦఺ᦩ҅ଘ๦̵لፅ̵ሾכᔜսᨶقቖᔜᭌ̵ᶮᕆঅᇔᗦ᷏꧊ᗦ஑ᦏՈஞᑮහഝ๶რғॠሞੜἓፋ̽2020ᕚӤෛߝၾᩇ᩽۠ಸޞ̾

2021ๅړ۸݄ߝᇈ݄ग़֟ๅ୮ӥๅӻ௔当下商品面临的挑战:标准化程度不够类目庞杂,商家无从选择类目CPV管理跟不上变化问题诊断对商品管理来代替商品定义市场管理差异导致商品信息差当下商品面临的挑战:商品信息结构化不够精准丰富,商家的商品运营困难商家为了经营需要,可能存在如下的商品信息质量问题:标题堆叠

/

sku主品不符/图片牛皮癣

/类目错放

/SKU营销关键词堆叠,可读性较差平台结构化不够丰富精细๜ᨶᵙᅩܕਹ෫ဩᕮ຅۸ጱᤒᬡࠟߝጱӻ௔۸ᇙ௔מ௳当下商品面临的挑战:特性和个性缺乏结构化表达123୮ڡ๋ቘమጱᦡᦇڡᤙֺ҅ই܄ړ᷏ᜋ̵੮Ꮁᇔቘં௔܄ړࠟߝ܄ړሿࣁࣁVNX᯾ᬮํܕ޾Ԇࠟߝਠقӧፘଗጱӳᥜֺ҅ইࣁಋ๢᯾ܕಋ๢ॎᒵ̶០ᲀۑᚆᆐݸےف០ᲀۑᚆֺ҅ইԣՋԍᭆՋԍ҅ॺᷧ下一代商品模型概述以“机制+模型”升级为基座,以数据智能为驱动,实现商品全面能力及全链路应用的更新换代品牌类目条码产品标签图像视频人群场景评价POI内容时间…浏览加购搜索属性收藏下单图知片识图谱卖家品牌商商家体验提升 消费者体验提升消费者质量分价格力 趋势力口碑力精品优品中品潜力品差品机制1:类目属性标准化&智能化机制2:商品信息BC联动机制2:商品信息BC联动机制1:类目属性标准化&智能化杭州成功获得2022亚运会举办权杭州2022亚运会主体体育馆竣工杭州亚运会天猫旗舰店上线下周冷空气席卷华东华为正式发布P40新机会员域门店域商品域内容域张三李四耐克旗舰店华为旗舰店王品城西银泰店老王商品:华为P40包邮商品:欧莱雅复颜玻尿酸水光充盈导入面霜产品:欧莱雅玻尿酸导入面霜品牌:华为/HUAWEI冬天保暖应该知道的注意事项皮肤干性人群爱美有钱人吃辣人群西溪园区附近情侣七夕官旗约会玻尿酸保湿送女朋友礼物护肤杨幂代言5G手机冬季意图生活意图体育关键词保暖关键词充值女装美妆3C数码性别年龄连衣裙针织衫衬衫香水护肤霜手机男笔记本女老年人中年人年轻人本体层概念层实体层事件层时序时序关联具有需要属于售卖属于浏览模型升级:数字商业知识图谱概览点击1 本体层

一般由领域专家建设,规模在千、万级别结构化的刻画某一个真实事件,规模在千万、亿级别2

概念层有相同属性的一类实体称之为概念,具备一定的泛化性、可解释性,规模在几十万到百万级别3 实体层

知识图谱中的实体、实例,规模在千万、亿级别4 事件层本体层:类目属性标准化&智能化淘宝

类目属性盒马

类目管理本地生活类目属性新市场...相互独立关联互通共享+个性定制新市场...淘宝

类目属性盒马

类目管理本地生活类目属性集团标准类目属性集团标准类目属性淘宝

类目属性盒马

类目管理本地生活类目属性新市场...ᕪḵݍḇҁᑌຄ/ၾຄ҂概念层:消费决策过程分析ၾᩇᘏࠟߝ܃ᯈَࣳጱၾᩇᘏ٬ᒽᬦᑕٖࢩᨻԣێي᪁ᕪḵՈኞᴤྦྷӻ௔ŏŏक़ࢩ෈۸ᐒտሾहਹꁿଠޞ០ᲀၚۖŏŏᵱ࿢ᨻԣᦧհ೮ᖅࡅཻ֦5מձᨻԣמձ֦4ොໜᦧ֌ࡅཻ֦3מ௳තᵞԧᥴ֦2Ꮯᦊᵱ࿢Ꭳ֦᭲1ၾᩇᘏՈฎၾᩇၚۖጱԆ֛҅໑ഝḘේ၎ᵱ࿢੶ེਖ਼Ոጱᵱ࿢ړԅԲӻ੶ེ҅ीے੒Ոጱԧᥴ҅ݢզ൉܋Ոᨵ܃ᯈጱපሲ̶ݶ෸҅ၾᩇݑݱᐿٖक़ࢩᔰጱᖓݳ֢አጱ୽ߥ̶ᵱ࿢ᵱ࿢ӧӞਧฎกᏟጱ҅ᘒฎ࣋ว۸ጱ҅ᵱᥝกᏟᥴ٬ᳯ᷌ጱᔄࣳ޾࣋ว҅ই჋̵်዇᭗Ḙ໲ᒵҔמ௳තᵞکᨻԣᰒ੒ӧݶᔄࣳጱᵱ࿢҅٬ᒽᬦᑕӧӞ໏ғ1.֗᷇ṛհ꧊ғ࿻᫣̵ಋ๢̵ፘ๢ᒵԾߝ҅ӧՐտᧇᕡጱԧᥴ݇හ҅ᬮտ᭗ᬦၥᦧ҅ᦶḩ/ᦶሻᒵᧇᕡ؉ڊ੒ྲҔ2.ԟబ௔ၾᩇғᔕရᶎᒵ҅ၾᩇᘏ૪ํӞਧጱԟబ҅ӧտᜰᩇय़ᰁ෸ᳵ੒ྲҔ3.ग़໏۸֛ḵғ੤ᦶӧݶݗޱ̵ܱᷧᒵ4ŏŏ.ᰒ੒ၾᩇᘏஞቘ҅਍ᘏ՗ᲀࠓᘏ᥯ଶ൉ڊԧ)$%(ᲀࠓဩ҅൉܋Ոᨵ܃ᯈጱපሲҔ满足某个生活场景的购物需求人群:20-30岁、0-1岁宝妈事件:滑雪、游泳、聚会…将购物需求分解为细分品类品类:滑雪服款式:双层内胆、两件套…品类下产品优劣对比品牌:哥伦比亚、北面货号:MY1020、4R52-918948…选择信任的商家及合适的价格、服务店铺:官方旗舰店、百年老店服务:顺丰包邮、花呗分期…使用评价客服服务:售后服务特别好品质:品质真、防寒效果特别好…藏经阁项目总体框架图知识建模:该模块核心任务主要是从不同类型的多源数据中,构建生成领域知识体系。领域知识体系的构建是对领域分类、属性以及分类之间关系的定义知识获取:该模块核心任务主要是从各种多源异构的数据源中结构化出各种知识知识融合:该模块核心任务主要是发现碎片化及异构知识之间的关联,获得更完整的知识描述和知识之间的关联关系,实现知识的互联、互补和融合知识推理:该模块核心任务主要是构建面向大规模知识图谱的推理与计算引擎,基于已有知识、背景知识推理和发现未知的知识知识建模:关键属性树构建模型整体框架异质信息融合模块关键属性树推理模块Interpretableand

Low-ResourceEntity

Matching

viaDecoupling

FeatureLearning

from

DecisionMaking[C]ACL

Anthology

2021知识获取:基于半监督局部标注学习模型研究策略由于词典自身的不完备性,训练数据中会存在一定程度的漏标。为缓解漏标数据对训练过程的影响,我们在训练中引入局部标注(PartialAnnotation)的思想引入Self-training,训练交叉标注完成对训练数据的迭代标注基于阅读理解的大规模属性识别:句子和属性分别编码,再利用注意力机制权重生成新表达A

Distantly-Supervised

Self-Training

Method

for

Low

Resource

Named

Entity

Recognition(在投)挑战点实体类型规模大(上千种实体类型)增强新实体发现能力(NER

OOV)知识融合:多模态表征模型CAPTURE三种transformer网络架构来编码,同时结合单流式架构和双流式架构先对齐后融合,跨模态对比学习融合部分,基于2个无监督遮掩mask任务,MLM和MRP相关成果已经发表在ICCV

2021上Product1M:

TowardsWeaklySupervised

Instance-LevelProduct

Retrieval

viaCross-Modal

Pretraining阿里数字商业图谱实践分享1:商品智能发布利用知识图谱理解商品信息,自动化补全商品信息,助力商家商品智能发布,提升商品发布效率和质量> 条码图片智能链接标准产品,辅助智能回填产品信息。标准产品量1.6亿覆盖品牌商品50%+> 类目回填比例100%,

识别准确率98.6%;> 根据商品蓝海词库优化标题关键字,推荐准确率90%+> 智能识别重点决策属性,

优先推荐卖家回填和诊断信息准确性、提供智能回填>

一键自动扣图、合成白底图、透明图、长图>

算法辅助详情生成。推荐商品搭配组合,支持模特图搭配生成前置输入条码+图片智能回填类目+属性商品标题诊断,蓝海词推荐详情智能模板6白底图、透明图、长图合成5决策属性前置4321图片待找总计帮助商家优化商品近2亿,为社会累积节省了20万人日工作量阿里数字商业图谱实践分享2:精准购物引导覆盖淘系商品近20亿商品,支持淘宝/天猫搜索、猜你喜欢、榜单等31个核心流量场基于知识图谱沉淀一套围绕场景的商品决策树体系,辅助实现基于场景的商品导购,重构供需关系品类标签“

篮球鞋相关

”跨品类标签“

送给爱人的礼物

”跨品类标签“

喂奶必备

”阿里数字商业图谱实践分享3:商品实时管控商品管理智能管控商品信息审核每秒审核5000条商品信息商品图片审核每秒扫描2.2万张商品图片在线商品巡检6小时扫描全网近20亿+商品标题识别出多个品牌词判断出”真皮”和”含量30%及以下”描述有冲突通过图像算法、文本识别算法、形式化的管控知识、商品事实类知识

实现实时管控商

家平

台峰值亿级别 实时拦截率达90% 每周拦截问题商品1500万商品上架商品售卖阿里数字商业图谱实践分享4:跨渠道商品流通铺货利用知识图谱链接跨渠道商品信息,自动化映射转换对齐商品信息,助力商家多渠道商品运营,提升商品流通效率和质量基于概念图谱,挖掘沉淀商机库1000w+,指导商家多渠道商品运营基于标准类目属性,和淘宝、猫超、盒马、饿了么、考拉、1688、ICBU等13个渠道建立了映射关系,覆盖新零售GMV90%跨渠道差异化供给分析类目映射关系配置属性映射关系配置智能回填类目+属性5商品同款预测4321图片待找累计帮助商家多渠道铺货经营商品17亿+,帮助商家节省了3500万人日工作量基于1.6亿标准产品,利用实体对齐技术,实现跨渠道商品同款预测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论