高级深度学习AI优惠卷特征处理(知识研究)_第1页
高级深度学习AI优惠卷特征处理(知识研究)_第2页
高级深度学习AI优惠卷特征处理(知识研究)_第3页
高级深度学习AI优惠卷特征处理(知识研究)_第4页
高级深度学习AI优惠卷特征处理(知识研究)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于MySQL的优惠券特征处理1234背景与挖掘目标数据说明与预处理特征构建特征拼接目录CONTENTS以优惠券盘活老用户或吸引新客户进店消费是O2O的一种重要营销方式。随机投放的优惠券会对多数用户造成无意义干扰,且影响商家声誉。个性化投放是提高优惠券核销率的重要技术。使用MySQL完成数据处理,并构建模型所需的标签字段和对应的特征字段。项目目标1234背景与挖掘目标数据说明与预处理特征构建特征拼接目录CONTENTS提供用户在2016年1月1日至2016年6月30日之间真实线上线下消费行为。为了保护用户和商家的隐私,所有数据均作匿名处理,同时采用了有偏采样和必要过滤。数据说明用户线下消费和优惠券领取行为ccf_train.csvFieldDescriptionUser_id用户IDMerchant_id商户IDCoupon_id优惠券ID:null表示无优惠券消费,此时Discount_rate和Date_received字段无意义Discount_rate优惠率:x\in[0,1]代表折扣率;x:y表示满x减y。单位是元Distanceuser经常活动的地点离该merchant的最近门店距离是x*500米(如果是连锁店,则取最近的一家门店),x\in[0,10];null表示无此信息,0表示低于500米,10表示大于5公里;Date_received领取优惠券日期Date消费日期:如果Date=null&Coupon_id!=null,该记录表示领取优惠券但没有使用,即负样本;如果Date!=null&Coupon_id=null,则表示普通消费日期;如果Date!=null&Coupon_id!=null,则表示用优惠券消费日期,即正样本;数据说明用户获取到优惠券后在15天内进行了使用,这类用户为正样本Date!=null&Coupon_id!=null,且Date-Date_received

>15天。同时有一部分用户进行未进行使用的,这类用户为负样本Date=null&Coupon_id!=null(领取了优惠券但没有使用)。Date!=null&Coupon_id!=null,但是Date-Date_received

>15天。用户未使用优惠券进行使用,这类用户为普通样本样本updateccf_trainsetlabel=();标签设定规则数据预处理1234背景与挖掘目标数据说明与预处理特征构建特征拼接目录CONTENTS数据处理1.null值修改为空,即NULL2.distance存在缺失值,用该列的均值填充set@dis=(SELECTavg(distance)distancefromccf_train);哪些因素对你是否使用商家赠送的优惠券有影响?折扣力度、店铺距离、商品品牌、商家知名度……特征构建方向:和优惠券相关和商家相关和用户相关交互关系……1.特征分析特征构建优惠券流行度(考虑15天内使用的情况)通过“被使用优惠券/优惠券总数”计算公式计算优惠券流行度2.优惠券相关特征构建商家发放的优惠券的流行度(考虑15天内使用的情况)以构建的标签列进行对优惠券使用统计,和未使用统计。根据“被使用优惠券/优惠券总数”公式可计算出相应的优惠券流行度,但需要依据“Merchant_id”进行分组,求得各个商户所发放优惠卷的受欢迎程度。3.商家相关特征构建用户领取的优惠券数量以用户ID进行分组,统计每个用户使用的消费卷数量。用户消费过的优惠券数量以用户ID进行分组,设置标签列值为1(用户15天内使用过优惠卷)作为筛选条件,统计每个用户使用的消费卷数量。4.用户相关特征构建用户在商家使用优惠券的次数根据用户ID和商户ID进行分组统计标签为1的数据数量用户在商家领取的优惠券数根据用户ID和商户ID进行分组统计Coupin_id不为空的数据数量用户在商家消费的次数根据用户ID和商户ID进行分组统计Date不为空的数据数量5.交互关系特征构建1234背景与挖掘目标数据处理与预处理特征构建特征拼接目录CONTENTSCoupo_idCoupon_popu26320.25628140350.33333140360.00000140370.00000140380.15385User_idMerchant_idCoupon_id01439408263211439408140332143940826323143940814035414394082632User_idMerchant_idCoupon_idCoupon_popu0143940826320.256281143940814033NaN2143940826320.2562831439408140350.333334143940826320.25628左连offline_train优惠券流行度特征拼接1.优惠券相关User_idMerchant_iduser_merchant_cus0102301030110151102021033User_idMerchant_idCoupon_idDistanceDate_received0102null0null010511002120160528110285910201602172103107802016031921048591020160613User_idMerchant_idCoupon_idDistanceDate_receiveduser_merchant_cus0102null0null3010511002120160528NaN110285910201602170210310

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论