产品经理数据中台实战:基于标签的推荐系统必须要解决的4个核心问题_第1页
产品经理数据中台实战:基于标签的推荐系统必须要解决的4个核心问题_第2页
产品经理数据中台实战:基于标签的推荐系统必须要解决的4个核心问题_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、编辑导语:在推荐系统中,标签的使用可以让定位更精准,提升匹配的水平和效率。那么,在业务过程中,我们应当采用哪种标签推荐方式?本篇文章里,作者结合实际经验,总结了如何利用数据中台解决问题、搭建符合实际业务的标签推荐系统,一起来看一下。最近公司开了个新的产品线叫:圆猿买手,大家都知道我公司搭了一个B2B 的女装批发平台,主要服务的是全国做服装批发生意的采购商、供应商。圆猿买手这个产品是从B2B 平台独立出来专门服务二批采购商的产品。简单来说就是大客户,他们一般在二级的服装批发市场如郑州银基等有自己的档口,主要去一级的批发市场(一级的批发市场如广州十三行、杭州四季清等)拿货,拿完货后销售给自己的所在

2、城市的终端门店或者三批采购商。作为二批采购商,他们每次拿货(采购)的量都是非常大的,因为是我们的大客户,所以我司配备专门的买手给二批采购商提供一对一的推款、找款、发货的服务。买手是活跃在批发市场的一类角色,他们的核心竞争力就是对市场的档口、档口的新款、爆款比较熟悉,而且他们是常驻在批发市场的,这样二批采购商拿货就不用每次都长途跑到一批市场,只用和我们的买手沟通,就能拿到市场的新款、爆款。为什么圆猿买手这个业务能够存在?我觉得有2 点原因。第一由于买手的存在,大大降低了采购商的交易成本。交易成本就是买卖双方所付出的时间和金钱成本,交易类产品是否能够存在,都可以用这个交易成本这个理论来衡量,交易成

3、本理论是诺贝尔奖获得者科斯老爷子很多年前提出来的。二批采购商一般都在二三线城市的批发市场,每次跑到如广州十三行这种一级批发市场,来回都要很多的时间,路费也是一笔不少的钱,有了买手的存在大大节省了他们的时间和钱。第二买手的存在让人货匹配更加精准,这里的人是指二批采购商,货是指一级批发市场的商品。电商产品的创新很重要的一点就是提高人货匹配的效率,我提供的商品刚好是你需要的,这样买卖双方付出的时间成本最低。一个经验丰富的服装买手对市场中的档口和档口的新款、爆款都是非常熟悉的,而且由于买手长期和采购商沟通,这样他会非常清楚当前服务的这个采购商的偏好,这种情况下买手推的商品会更能命中二批采购商的口味。由

4、于买手的存在,交易模式从二批采购商到市场去找商品,到买手精准的推给采购商大致符合他口味的商品,采购商从买手推的商品中挑一个商品就好了,这种模式好像搭建了一个人肉的推荐系统。这篇文章我们谈的是基于标签的推荐,那必定要解决以下几个问题:首先看一下数据情况,数据库中有2 类数据,一个是埋点的数据,一个是业务库中的数据。埋点的数据记录了采购商曾经访问了那个买手的那个商品,也就是采购商的访问行为数据。业务数据分为两种,一种是采购商询盘了买手的那个商品( B2B 批发类的产品因为订单量大,每次下单前,采购商和买手要确认商品信息),另外一种是采购商支付了买手的那件商品。通过这三类数据即可分别给买手和采购商打

5、上相应的偏好标签。因为无论是访问、询盘、下单,都是和商品绑定的,商品是有所属店铺、品类、风格、价格段的属性的,通过这些属性就可以给采购商打上偏好的店铺、品类、风格、价格段的标签,同时也可以给买手打上擅长的店铺、品类、风格、价格段的标签。比如某个采购商A只有2条数据,分别是访问了某个店铺的商品B,询盘了某个店铺的商品C、下单了某个店铺的商品D:假设采购商访问商品的权重是1 分,询盘 3 分,下单 5 分,那采购商A 偏好的店铺的排行就是店铺3(5 分)、店铺2( 3 分)、店铺1( 1 分),如果取分数前 2名的标签作为采购商的标签,那么采购商A 偏好的店铺就是店铺3(5分)和店铺2 (3分),

6、同样的采购商A偏好的品类就是T柚(5分)、毛衣( 3 分)。假设买手 1 和买手 2 也只有这几条数据,那么同样可以给买手1 和买手 2打上同样的标签。什么是主观标签?主观标签就是人为给采购商或者买手打上的标签,比如你通过采购商填的一些信息,给他打上了偏好牛仔裤的标签,或者这个采购商在注册的时候自己填了自己喜欢牛仔裤这样一个标签,这类的标签就是主观标签,同样的买手也可以打上相应的主观标签。主观标签的问题是标签不一定可信,比如刚才那个例子,他选了牛仔裤这个标签,但是他真的就喜欢牛仔裤吗?每个人的兴趣都是在不断的变化的,谁也不能保证他这辈子都喜欢牛仔裤吧?第一个问题中通过访问、询盘、下单数据给采购

7、商和买手打上的标签就是客观标签,是通过数据算出来的标签。现在的问题是这两类标签怎么结合完成采购商与买手的匹配,从数据层面来看,有些采购商同时有主观标签和客观标签,有些采购商只有主观标签没有客观标签,还有些采购商只有客观标签没有主观标签,买手的情况也是类似。我们是采用单独种类标签推荐的方式,还是混合标签推荐的方式呢?单独种类标签推荐的方式是指通过买手的主观标签和采购商的主观标签完成采购商与买手的匹配,同时通过买手的客观标签和采购商的客观标签完成采购商与买手的匹配,采用这种方式会产生2 种推荐结果,最后需要把主客观标签推荐的结果整合在一起,完成最终推荐结果的输出。混合标签推荐的方式是指无论采购商买

8、手打上了主观、客观的标签,先做一层整合,保证采购商和买手分别只有一套标签,再通过这套标签完成采购商和买手的匹配,这种方式有2 个问题:很明显单独种类标签推荐的方式的推荐结果会更有优势,前期可以分别上线主观标签推荐和客观标签推荐的结果进行单独测试,先验证那种方式的效果更好,后期可以给每种算法不同的权重,结合后给出最终的推荐结果。比如通过主观标签给用户 A 推荐出来买手1、买手 2,通过客观标签给用户 A 推荐出来买手2、买手 3。主观标签算法的权重是1 分,客观标签算法的权重是3 分,那么 2 种算法结合后给用户 A 推荐出来的最终结果就是:买手2( 4 分)、买手3( 3 分)、买手 1( 1

9、 分)。而混合标签推荐的方式,不仅不利于后期的效果数据分析,而且因为提前将两种标签做了结合,很难判定那种算法推荐出来的结果更精准。问题一中我们分别为采购商、买手打上了店铺、品类的标签:第一种方式是不看标签的分数,只要采购商和买手的标签匹配上就计1分,先从店铺的角度来看因为采购商A 偏好的店铺是店铺3 和店铺2,而买手1 擅长店铺3,买手2 擅长店铺2,买手1 和买手 2 各得 1 分,再从品类来看因为采购商A偏好T柚和毛衣,买手1擅长T柚,买手二擅长毛衣1,买手1和买手 2 也各得 1 分,这种方式的最终结果是:这种算法虽然简单,但是明显有些问题,没有考虑采购商和买手针对标签的得分,导致买手1

10、,买手 2 的得分一致。如果加入采购商与买手针对标签的得分:这样买手 1 的总分是 50 分,买手 2 的总分是 18分,优先推荐买手1 给采购商 A 。当然还可以考虑给标签定义不同的权重,可以假设店铺标签的权重是大于品类的,这种算法考虑的就更加全面,但也会更加复杂。做推荐这块我们的追求应该是简单且有用,也就是说付出最低的成本,拿到最好的效果,从简单到复杂、不断优化的过程。基于标签的推荐算法,最终一定要开放出去,用来服务采购商,但前期因为无法确定这套算法的效果,可以先开放给公司内部运营人员使用。首先可以先开放查询采购商/买手所打标签功能给熟悉业务的运营人员,让他们可以快速查看采购商/买手身上基于现有数据所打上的标签:如果经过验证,所打标签数据足够准确,那这些标签的数据也可以指导运营人员针对采购商/买手做更加精细化的运营,当然也可以将采购商的标签开放到给他服务的买手,让买手快速查看到他当前所服务采购商的特点,这样可以做更加精准的服装推荐。接着可以让运营人员提供一些典型的采购商/买手,将标签算法匹配的最终结果(采购商与买手的匹配率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论