电子商务系统中协同过滤算法研究_第1页
电子商务系统中协同过滤算法研究_第2页
电子商务系统中协同过滤算法研究_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电子商务系统中协同过滤推荐算法研究[摘要]针对电子商务发展的需求,本文通过对协同过滤推荐算法的文献综述,提出传统过滤算法无法适用于用户多兴趣下的推荐问题进行了分析,提出了一种基于用户多兴趣的协同过滤推荐改良算法,分析了基于用户多兴趣的协同过滤推荐算法的电子商务系统。[本文关键词语]电子商务系统协同过滤推荐算法算法研究一、引言电子商务迅猛发展的时代已经到来,网上购物的交易方式正在改变着传统的商业形式。2007年,电子商务的交易额到达了8900亿人民币。面对如此诸多的商品,无疑会大大增长用户发现满意商品的困难。于是个性化推荐系统逐步成为电子商务领域中的一项主要的研究内容,得到了广泛关注。研究电子商务推荐系统对企业和社会具有很高的经济价值。电子商务个性化推荐系统的关键是建立用户模型。推荐系统的热门问题是推荐技术和推荐算法的研究。推荐算法是整个推荐系统的核心,它的性能决定了最终推荐结果的好坏。为了建立合理的用户模型,知足不同用户对实时性、推荐方式等的要求,产生了一系列的推荐技术和算法。牵涉的技术包含基于内容的过滤技术、协同过滤技术、关联规则发掘技术、分类和聚类技术、神经网络技术等等。协同过滤推荐是迄今为止最成功的个性化推荐技术,被应用到许多领域中,协同过滤相当突出的优点是其基础是“人〞而不是“内容的分析〞,能针对任何形态的内容进行过滤,更能处理相当复杂和困难的概念呈现,以获得意料之外的结论。文章重点研究电子商务系统中协同过滤推荐算法。二、电子商务推荐算法的研究当前的电子商务推荐系统中运用的推荐算法重要可分为三大类:基于内容的推荐算法(content-basedrecommendationalgorithm〕、基于规则的推荐算法(rule-basedrecommendationalgorithm)和协同过滤推荐算法〔collaborativefilteringrecommendationalgorithm〕。1.基于内容的推荐算法是信息过滤研究的派生和继续基于内容的推荐系统需要分析资源内容信息,根据用户兴趣建立用户档案(profile〕,用户档案中包括了用户的档次、偏好和需求信息。然后根据资源内容与用户档案之间的类似性向用户提供推荐效劳。在一个这样的系统中,通常采取相关特征来定义所要推荐的物品。2.关联规则发掘技术在零售业得到了广泛的应用,它能够发现不同商品在销售经过中的潜在相关性随着数据发掘的兴起,关联规则被应用于推荐系统,构成了一种新的推荐技术——基于规则的推荐技术。基于规则的推荐技术在评价表上发掘项目间的关联规则(项目关联)和用户间的关联规则为当下用户进行推荐。使用项目关联进行推荐时,每条项目关联的前件相当于一个兴趣组,而规则的后件则相当于这个兴趣组的推荐。假如当下用户对该规则前件中的所有项目都喜欢,那么就把规则的后件以一定可信度推荐给当下用户。而使用用户关联进行推荐时,用户关联的后件必需是当下用户,使用用户关联的前件中的用户的共同兴趣模仿当下用户的兴趣,模仿的可信度就是用户关联的可信度,以此作为推荐的根据。3.协同过滤(collaborativefiltering〕的基本概念就是把这种推荐方式变成自动化的流程协同过滤重要是以属性或兴趣相近的用户经历体验与建议作为提供个性化推荐的基础。透过协同过滤,有助于搜集具有类似偏好或属性的用户,并将其意见提供应同一集群中的用户作为参考,以知足人们通常在决策之前参考别人意见的心态。本人以为,协同过滤技术应包含如下几方面:(1)一种比对和搜集每个用户兴趣偏好的经过;(2)它需要很多用户的信息去预测个人的兴趣偏好;(3)通过对用户之间兴趣偏好相关水平的统计去发展建议那些有一样兴趣偏好的用户。三、协同过滤推荐现有算法的分类研究与分析恰是由于传统协同过滤推荐算法存在着众多问题,研究者们才不断提出改良的协同过滤推荐算法。1.全局数值算法全局数值算法每生成针对一个用户的推荐项目列表就需要扫描用户评价数据库一遍,这种方法能随数据的变化而变化,实现也比较简单,所以被大量才采取。但是在理论中数据稀疏性难以解决,面对庞大的用户数据库,推荐产生也非常耗时,进而使得整个电子商务推荐系统的实时性难以保证,成为全局数值算法面临的重要挑战。2.基于模型的算法基于模型的算法只需扫描一遍用户评分数据库就能够完成对所有用户的推荐。优点是建立的模型相对于原始数据集而言小得多,因而能有效缓解推荐算法的实时性问题。但模型具有滞后效应,为了保证模型的有效性,必需周期性的对模型进行更新。而模型的训练代价高,因而该算法不合适数据更新频率快的系统。3.组合推荐算法〔1)协同过滤和基于内容的结合算法。两种算法的结合能够利用基于内容算法的优点,对项目进行类似度匹配,尤其当项目尚未得到用户评价的情况下也能推荐给用户,避免新项目问题;另一方面利用协同过滤的特点,当用户数和评价许多时,协同过滤推荐更精确。(2)协同过滤和基于关联规则的结合算法。关联规则技术用于协同过滤系统是利用apriori算法通过发掘用户的评价记录的关联来进行推荐。该算法往往首先对客户的购买行为进行关联规则发掘,并进行单一客户的偏好建模;然后,应用协同过滤技术寻找与此客户兴趣类似的客户集,并从客户集中找出和目的最类似的客户;最后根据匹配集合求解推荐意见。规则模型的构成能够离线进行,协同过滤推荐算法与基于规则算法的结合能够保证有效推荐系统的实时性要求。四、协同过滤推荐算法的改良传统的协同过滤推荐算法是用邻居用户对某一项目的偏好信息来判定用户对该项目的偏好,邻居用户是和当下用户具有类似兴趣喜好的用户。但在传统的协同过滤推荐算法中,邻居用户和当下用户的共同兴趣喜好并不一定是要预测的项目方面的兴趣喜好,而可能是另一方面的兴趣喜好。假如还是用这些邻居用户来预测,其误差可想而知。1.基于用户多兴趣的协同过滤推荐算法基于此,我对传统协同过滤算法将作如下改良:〔1〕对用户兴趣进行分类,由于在系统顶用户的兴趣是通过对项目的选择来进行了解的,所以把对用户兴趣的分类转化为对项目的分类,引入用户兴趣度的概念,来讨论用户在不同类别项目中所表现出来的兴趣差别,进而实现对用户多兴趣的了解。〔2)对于同一用户,如预测项目所属类别不同,用来预测的邻居用户也不同,也就是邻居用户与待预测的项目在内容上具有一定类似性,进而保证用来预测的邻居用户与当下用户在待预测项目上具有类似的兴趣喜好。(3)用户具有多兴趣性,但用户对每类项目的兴趣也是不尽一样的,在推荐集中考虑以用户对不同类别项目的兴趣度作为权重,来分配每类项目的推荐数目。首先将项目采取某种技术根据某种标准划分为不同类别,然后把对此类项目有评价的用户的评价信息映射到此类,统计参数,计算用户在每类项目的兴趣度,当跨越阈值时,以为该用户对该类项目有兴趣偏好,并由这些用户构成聚类,从聚类中搜索针对此类项目的邻居用户,产生推荐。〔1)根据分类规则对项目进行分类。把整个项目空间划分成若干类别,每个项目可能属于多个类别,每个类别包括至少一个项目。当前对项目进行分类有诸多方法。〔2)映射评价信息,统计参数,计算用户兴趣度,建立用户兴趣度矩阵,构造用户兴趣偏好特征。假设提出了用户兴趣度ai,j,即用户i对项目类别j的兴趣度,来衡量用户对某一类别项目的兴趣偏好。其中mi,j表示用户i所评价的项目类别j中的项目数目;nk表示项目类别k中包括的项目数目。〔3)根据用户兴趣度矩阵和项目类别体系,进行用户聚类,构成用户兴趣模型。2.算法说明〔1)由于对同一用户,需要分别在不同的项目类别中分别计算其邻居用户。〔2)该算法对数据的浓密性要求比传统的协同过滤推荐算法要高。〔3)用户的兴趣可能会随着时间而变化,有的项目类别可能会随着时间的推移使用户对他失去兴趣,所以推荐系统必需亲密留意用户的兴趣能否改变,最好的办法就是连续跟踪。〔4)推荐算法同样具有新异性,但不像传统算法那样更具有新异性,同另一角度也说明该推荐算法更具精确。由于新异性在一定水平上是和精确性相对的,不可能新异性和精确性同时很高,精确性高的算法必定会新异性低,反之亦然。五、基于用户多兴趣的协同过滤推荐算法的电子商务推荐系统分析协同过滤技术基本思想是基于评分类似的近期邻居的评分数据向目的用户产生推荐,推荐算法处理的基础数据是不同用户对项目的评价。评价能够是布尔型的可以以是实数,数值的大小代表喜欢的水平,也称为评分。协同过滤有利于判定符合用户兴趣的商品。例如在用户评价表有m个用户对n个商品进行了评分,要在m个商品项中找出符合用户兴趣的s个项向用户推荐。基于此,我们做如下推荐系统的分析:1.业务需求分析电子商务网站有两个方面需要个性化推荐系统,即改善客户关系和提升网站的销售能力。〔1)改善客户关系。个性化推荐系统要能够在用户的使用经过中尽可能的知足用户的需求,实时地和用户坚持互动和联络,及时获得用户的需求并做出响应,能根据用户的反应信息进行学习和自我完善。(2)提升网站的销售能力。能够吸引更多客户购买;在用户购买时施行穿插销售,用户的推荐恳求,给出最合适于用户的商品,并推荐其他相关的商品;为网站对商品进行更新提供信息支持,辅助网站及时推出有热销潜力的特色商品,实现与其他网站的差别化销售。2.用户需求分析用户访问电子商务网站的重要目的是寻找并购买需要的商品。其需求重要表如今:〔1)用户在网站中要能够顺利地寻找到所需要的商品,根据对商品信息的了解、系统的推荐水平和其别人的评价等决定能否购买。(2)用户能根据自己的认识对商品进行评分和评价。评分是一些个性化推荐算法的数据基础,应该鼓励用户对商品进行评分。评分或评价也是用户做出购买决定的参考。(3)系统效劳定制。用户能选择并享受系统设定的个性化效劳,这些效劳是管理员分析用户的兴趣对系统进行的功能设置。3.业务分析用户访问电子商务网站的重要目的是选择购买符合自己需求商品,整个业务流程从登录网站到购买商品生成订单结束。从什么渠道怎么支付怎样获得商品实体是在网站外部完成的,不在网站上的业务流程之内。4.数据流图(dfd1层)重要处理分析个性化推荐系统重要有下面处理经过:用户定制效劳、行为记录、个性化推荐、购买商品、对商品评分等。第一层数据流图可如此图1所示:用户根据系统设置的效劳进行效劳的定制。系统获得用户选择的效劳项目编号,查询数据库能否设置并开通该效劳,假如是保存用户定制到用户定制表中;否则返回毛病信息。用户定制dfd如此图2所示:用户在个性化推荐系统中的浏览行为,如点击链接、查看商品信息等都会被记录到日志中,也能被系统记录,作为发掘用户兴趣的信息。用户行为记录经过的dfd如此图3所示:六、结束语电子商务推荐系统是个新兴的研究与应用领域。随着用户需求水平的提升,推荐算法与系统的研究在不断发展和完善。文中提出的基于用户多兴趣的协同过滤推荐改良算法,恰是为了解决现实中存在的用户兴趣问题而产生的。算法中由于对项目进行了分类,所以跨越项目类别和推荐的新异性在一定水平上可能不及传统的协同过滤推荐算法。这将在将来的研究中要进一步考虑和研究的问题。以下为参考文献:[1]邓爱林左子叶朱扬勇:基于项目聚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论