




已阅读5页,还剩58页未读, 继续免费阅读
(管理科学与工程专业论文)移动商务中基于定位的个性化推荐系统研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
移动商务中基于定位的个性化推荐系统研究 摘要 无线移动通信技术和移动终端的发展为人们的生活带来了极大的改变,移动 商务因为能在移动中实现随时随地的交易并提供服务而得到重视和快速发展。在 移动商务中基于定位的服务( l o c a t i o n b a s e ds e r v i c e ,l b s ) 被认为是一项杀手铜 级的应用,然而即使在l b s 中用户仍然面对着信息过载的问题,同时移动中用户 的时间和精力、环境、移动终端显示屏等方面的限制使得这一问题更加严重。 推荐技术可以有效地解决用户信息过载的问题,并增加网站的粘度和交叉销 售能力,但是传统电子商务中的推荐技术不能直接平移到移动商务中,因为移动 商务和传统电子商务相比有很多特征和差别。首先,移动商务的位置相关性、紧 急性和随时随地访问等是其独特的价值所在;其次在技术、服务特性和商业模式 两者也存在很大差异。这些差异决定在移动商务中推荐算法必须满足一些特殊的 要求:对用户兴趣变化反应快,能处理短期兴趣;能处理变化很大的项目属性, 对位置敏感;无用户冷开始问题。 从这样的要求出发,本文将推荐看作一种了解用户兴趣、缩小可选空间并帮 助用户决策的过程。从决策的角度考虑,推荐就是在有限个可选的项目中选择一 个适合用户需要的项目,而且每个项目都由多个属性所构成,这样推荐问题就可 以转化成一个多属性决策的问题来解决。本文采用基于案例的模型表示方法并对 其加以修改以适应移动商务中推荐的需要在此基础上本文利用t o p s i s 方法的 思想构建了基于定位的个性化推荐算法。 为测试该推荐模型、推荐算法的可行性及其效果,本文设计实现了一个移动 商务中基于定位的个性化推荐测试系统,通过模拟在移动应用环境下为用户推荐 合适的酒店房间来实际验证推荐算法。试验结果表明,本文所构建的基于定位的 个性化推荐算法能够满足移动商务中应用的需要,即对用户偏好敏感,能处理用 户的短期兴趣,能处理变化很大的项目属性,对位置敏感。测试结果表明该算法 具有较高的推荐精度。 关键词:移动商务;基于定位的服务;个性化推荐;多属性决策 硕士学位论文 a bs t r a c t t h ed e v e l o p m e n to fw i r e l e s sm o b i l ec o m m u n i c a t i o nt e c h n o l o g ya n dm o b i l et e r - m i n a l sh a sb r o u g h ta b o u tt r e m e n d o u sc h a n g e st op e o p l e sl i v e s m u c ha t t e n t i o nh a s b e e nd e v o t e dt om o b i l ec o m m e r c eb e c a u s ei tc a ne f f e c tt r a n s a c t i o n sa n dp r o v i d es e r - v i c e sa n y t i m e ,a n y w h e r e l o c a t i o nb a s e ds e r v i c ei sc o n s i d e r e da sak i l l e ra p p l i c a t i o n i nm c o m m e r c e h o w e v e r , u s e r sa r es t i l li nt h ef a c eo ft h ep r o b l e m ,i n f o r m a t i o n o v e r l o a d ,e v e ni nt h el b s a tt h es a m et i m e ,t h ei i m i t a t i o n so fu s e r s t i m e ,e n e r g y , e n v i r o n m e n t ,s c r e e no fm o b i l et e r m i n a l sw i l lm a k et h i sp r o b l e mw o r s e r e c o m m e n d a t i o nt e c h n e l e g yc a ns o l v et h ei n f o r m a t i o no v e r l o a de f f e c t i v e l ya n d i n c r e a s et h ev i s c o s i t ya n dc r o s s s e l l i n ga b i l i t yo fw e bs i t e s ,b u tt h er e c o m m e n d a t i o n t e c h n o l o g y o ft r a d i t i o n a le l e c t r o n i cc o m m e r c ec a nn o tb et r a n s p l a n t e d t o m c o m m e r c ed i r e c t l y , b e c a u s et h e r ea r em a n yc h a r a c t e r si nm c o m m e r c et h a td i f f e r f r o mt r a d i t i o n a le l e c t r o n i cc o m m e r c e f i r s t ,l o c a t i o nr e l a t i v e ,e m e r g e n c ya n da c c e s s a n yt i m ea n y w h e r ea r et h eu n i q u ev a l u eo fm - c o m m e r c e ;s e c o n d ,t h e r ea r em a n y d i f f e r e n c e si nt e c h n o l o g y , s e r v i c ec h a r a c t e r i s t i e sa n db u s i n e s ss i m u l a t i o nf o rb o t ho f t h e m t h e s ed i f f e r e n c e sd e t e r m i n et h a t t h er e c o m m e n d a t i o na l g o r i t h mo f m c o m m e r c em u s tf i l lt h ef o l l o w i n gn e e d s :1 ) r e s p o n s eq u i c k l yf o rt h ec h a n g e so f u s e ri n t e r e s ta n dc a nh a n d l es h o r t t e r mi n t e r e s t 2 ) l o c a t i o n s e n s i t i v ea n dc a nh a n d l e g r e a tc h a n g e so fi t e mp r o p e r t i e s 3 ) n ou s e rr a m p - u pp r o b l e m f r o ms u c hr e q u i r e m e n t 。r e c o m m e n d a t i o ni st r e a t e da st h ep r o c e s so fu n d e r - s t a n d i n gu s e r s i n t e r e s t ,n a r r o w i n go p t i o n a ls p a c ea n dh e l p i n gu s e r st om a k ed e c i s i o n i nt h i sa r t i c l e i nt h ee y e so fd e c i s i o n m a k i n g 。r e c o m m e n d a t i o ni st os e l e c ta ni t e m s u i t e dt ot h en e e d so fu s e rf r o ml i m i t e do p t i o n a lo n e s 。w h e r ee a c hi t e mi sc o m p o s e do f s e v e r a la t t r i b u t e s s ot h er e c o m m e n d a t i o np r o b l e mc o u l db et r a n s f o r m e dt om u l - t i a t t r i b u t ed e c i s i o n m a k i n gp r o b l e m t h er e p r e s e n t a t i o nm o d e li nt h i sa r t i c l ei sb a s e d o nt h ec a s e b a s e dm o d e l ,w h i c hh a sb e e nm o d i f i e dt oa d a p tt h en e e do fr e c o m m e n d a - t i o ni nm c o m m e r c e o nt h i sb a s i s ,t h em e 也o do ft o p s i si su s e dt ob u i l dt h i sl o c a - t i o n b a s e dp e r s o n a l i z e dr e c o m m e n d a t i o na l g o r i t h m i no r d e rt o t e s tt h ef e a s i b i l i t ya n de f f e c to ft h em o d e la n da l g o r i t h m ,at e s t i n g s y s t e mh a sb e e nb u i l tw h i c hs i m u l a t e sr e c o m m e n d i n gf a v o r a b l eh o t e lr o o m sf o ru s e r s i nm o b i l ee n v i r o n m e n t t h er e s u l ts h o w st h a tt h er e c o m m e n d a t i o na l g o r i t h mc a nf i l l t h en e e do fm c o m m e r c ea n dh a sh i g hr e c o m m e n d a t i o np r e c i s i o n k e yw o r d s :m c o m m e r c e ;l o c a t i o n b a s e ds e r v i c e ( l b s ) ;p e r s o n a l i z e d r e c o m m e n d a t i o n :m u l t i a t t r i b u t ed e c i s i o n - m a k i n g h i 移动商务中基于定位的个性化推荐系统研究 插图索引 图1 1 技术路线图4 图3 1 区间属性标准化的函数图形2 2 图4 1 本模拟系统各部件及系统流程2 8 图4 2 用户欢迎界面及系统简介2 9 图4 3 显示相关信息并获取用户偏好3 0 图4 4 显示推荐结果并获得用户最终选择的房间号3 0 图4 5 相同位置下对距离偏好的敏感性3 l 图4 6a 点推荐结果的位置3 2 图4 7b 点推荐结果的位置3 3 图4 8 两种推荐算法精度比较3 4 v i 硕士学位论文 附表索引 表2 1 个性化推荐技术7 表2 2 各种推荐技术的优缺点1 l 表3 1 多属性决策基本方法2 1 表3 2 多属性决策问题类别2 1 表4 1 房间的属性2 8 表4 2 测试偏好信息。3 2 表4 3a 点的推荐结果3 2 表4 4b 点的推荐结果3 3 湖南大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名:像? 弘乞 日期:力嘭年口月) p 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇 编本学位论文。 本学位论文属于 l 、保密口,在年解密后适用本授权书。 2 、不保密囹。 ( 请在以上相应方框内打“4 ) 作者签名:7 猫髟荛 导师签名: 姊 日期:上弼年,o 月沙日 日期:娜2 年o 月加日 硕士学位论文 第1 章绪论 1 1 研究背景 1 1 1 移动商务的兴起 近年来,随着无线通信技术、无线宽带网和移动终端等技术与产品的飞速发 展,人们不再满足于传统的局限在有限空间里的商务交易模式,而希望随时随地 进行交易,甚至在移动过程中获得服务。从而催生了移动商务,并使其得到广泛 的应用 一般而言,移动商务就是利用无线移动设备和无线通信技术进行商品、服务、 信息、知识的交易。由于移动商务的“移动一特性,使得移动商务的交易模式与 传统的电子商务交易模式有很大的区别,同时也带来了更多的商机。截止到2 0 0 7 年l o 月,中国已有5 3 亿手机有效卡数,近几年来中国手机有效卡数增长一直维 持在1 7 以上,平均每个手机用户拥有1 3 3 个手机卡,即目前中国共有4 亿手机 用户,约3 0 的居民拥有手机;同时截至2 0 0 7 年1 2 月,中国网民数增至2 1 亿 人。目前中国4 亿手机用户中,在过去半年有过手机接入互联网行为的网民数是 5 0 4 0 万人,即网民中的2 4 、手机用户中的1 2 6 是手机网民,手机上网已渐成 风气,而随着3 g 在中国的运营,手机上网用户的比例将显著增加【l 】。由此可见, 移动商务具有巨大的市场前景。 1 1 2 基于定位的服务及其发展现状 伴随移动通信网络从2 5 g 向3 g 演进,从日本、韩国到欧美地区,移动定位 业务的发展步伐正在不断加快。基于定位的服务( l o c a t i o n b a s e ds e r v i c e s ,l b s ) 通过对移动设备定位并整合与位置相关的其他信息为用户提供增值服务【2 j l b s 最大的魅力就在于能在正确的时间、正确的地点把正确的位置信息以及与位置相 关的其他信息发送给正确的人。在我国,移动定位业务在行业用户市场加快渗透 的同时,正逐渐向大众用户市场拓展,中国移动亲子通业务和中国联通手机导航 等相关定位业务也相继推出。现在l b s 也不再局限于运营商的一项增值业务,经 过几年的积累已经在电子地图、车载导航、无线导航和交通信息四个领域形成成 熟的应用,也带动一批国内传统家电企业向l b s 产业转型,如新科、t c l 、海尔 以及康佳都有所涉足。l b s 产业的发展得益于国家对电子地图行业的支持,地图 测绘领域关系到国家的安全,但是电子地图是所有位置服务应用的基础,如果没 有企业参与整个行业就会缺乏活力,所以国家还是坚决采取开放的态度,从2 0 0 0 年开始规范电子地图市场,相继出台了中华人民共和国测绘法 、 、中华人民共和国测绘成果管理条例 及国家测绘局 等七部门联合发问加强外国人来华测绘管理工作 等一系列政策,不仅规范了整 移动商务中基于定位的个性化推荐系统研究 个行业,还限制了没有实力的厂商进入该行业,从而为电子地图行业创造了良好 的发展环境。 作为全球拥有移动电话数量最多的国家,移动定位在我国拥有广阔的应用前 景。从目前的实际应用情况来看,移动定位用户规模依然较小,移动定位占移动 运营商增值服务总收益的比重还比较低,总体上讲,移动定位业务在我国还仅仅 处于市场培育阶段。要有效推动移动定位业务的快速、健康发展,就需要与众多 的传统产业相融合。促进产业价值链的多元化,拓展行业市场。而随着移动商务 市场的发展,移动定位市场将保持高速增长,并成为最具竞争力的3 g 核心业务 之一。 1 2 研究目的与意义 1 2 1 研究目的 与传统i n t e r n e t 上相似。在基于定位的服务过程中同样存在信息过载问题。 虽然基于定位的服务在定位的基础上对信息进行过滤,然而在一定的区域范围内 某类商品或服务的信息仍然很多,大量信息对于用户仍是很大的负担。而在移动 过程中,受环境、安全等因素的约束,用户一般没有时间认真翻阅各条信息进而 决定使用什么样的服务。同时为了提高移动设备的便携性,移动设备的显示屏 幕都比较小,这就给大量信息的显示和查阅带来了很大问题。在上述约束下,基 于定位的个性化推荐能很好的解决这些问题,为用户提供个性化的服务信息。在 这里将基于定位的个性化推荐定义为基于对移动设备的定位及与位置相关的信息 向用户自动推荐符合其兴趣偏好或需要的资源。 因此,本研究的目的就在于分析移动商务中基于定位的个性化推荐对推荐算 法的特殊要求,并根据此设计一种合适的个性化推荐算法。 1 2 2 研究意义 本研究具有以下意义: 1 实践意义 我国是全球拥有移动电话数量最多的国家,移动商务的市场容量非常大。同 时,我国幅员辽阔而人口流动也逐渐加剧,人们希望随时随地、甚至在移动过 程中获得服务,因此移动定位业务在我国拥有广阔的市场前景。移动定位不仅仅 是为使用者提供位置信息,更重要的是与传统产业相结合,根据使用者的位置信 息和消费需求,为使用者提供个性化的服务信息。本研究在分析了基于定位的个 性化推荐对推荐算法的特殊要求的基础上设计出一种合适的个性化推荐算法,对 推动移动定位与传统产业相结合及满足使用者的个性化需求都具有重要的实践意 义。 硕士学位论文 ( 1 ) 有助于移动定位业务与传统产业的结合。与传统产业结合是移动定位业 务拓展市场空间、得以真正发挥其作用的关键所在,而基于定位的推荐系统则为 这种结合提供了一条重要路径。 ( 2 ) 有助于满足使用者的个性化需求。在移动环境下,消费者的需求随着环 境的变化而变化,因此基于消费者的位置信息和需求偏好的个性化推荐较之传统 推荐更加快速、准确,从而适应快速变化的环境,更好地满足使用者的个性化需 求 2 理论意义 ( 1 ) 消费者选择商品或服务的过程就是一个根据自己消费偏好对具有多个属 性的不同对象进行评价进而做出决策的过程,而本研究所设计的个性化推荐算法 就是基于多属性决策理论,对多属性决策的理论和方法迸行拓展并应用于移动商 务领域。 ( 2 ) 传统电子商务中的推荐系统所做出的推荐一般都没有考虑消费者所处的 具体环境,同时还存在一个隐含的假设:被推荐项的属性是稳定的。本研究引入 了位置这一重要的环境变量,而且可以认为相对位置是被推荐项属性中的一个随 机变量,因此基于定位的个性化推荐系统是对传统推荐系统思维的突破 1 3 研究内容与技术路线 1 3 1 研究内容 本文的研究内容是在国内外环境敏感的推荐系统和多属性决策研究的基础之 上,对移动商务中基于定位的推荐对个性化推荐算法的特殊需要进行系统的分析, 并基于多属性决策方法构造合适的个性化推荐算法。本文的具体研究脉络是:在 阅读与总结大量的推荐系统、多属性决策和环境敏感的推荐系统的基础上,对移 动商务环境下基于定位的个性化推荐算法的特殊要求在响应时间、用户行为和推 荐项属性等方面进行分析,在此基础上引入多属性决策的理论和方法进而构造出 适合移动商务中基于定位的个性化推荐算法,通过实验对算法进行测试评价并分 析其原因。最后归纳出全文的主要研究结论,根据研究中存在的问题,指出不足 和缺陷,以及今后该领域的相关研究方向。 根据上述研究内容与研究脉络,本论文的整体结构及各章的主要内容介绍如 下2 第l 章绪论:从研究背景出发提出研究问题。阐明本文的研究目的、研究范 围、研究流程及行文结构 第2 章基础理论和研究现状t 本章主要介绍电子商务个性化推荐系统、个性 化推荐算法及移动商务中基于定位的个性化推荐系统的机理及关系,为本文设计 算法提供理论基础。 第3 章基于定位的个性化推荐算法的构建:首先阐明设计算法的思路,然后 抽象出推荐算法模型并设计基于定位的个性化推荐算法。 移动蔚务中基于定位的个性化推荐系统研究 第4 章实验与结果分析:采集合适的数据集,根据定的实验评价标准对算 法进行实验测试,然后对实验结果进行分析并进一步改进算法。 结论:归纳出本研究的成果,进而指出本研究的局限性及后续的研究方向。 1 3 2 技术路线 根据本文的研究内容,本文的整体研究流程如下图所示: : 图1 1 技术路线图 硕士学位论文 第2 章基础理论和研究现状 本章重点是结合本文的研究主题,对基于定位的个性化推荐相关的研究进行 回顾。主要内容包括电子商务个性化推荐系统的概念、作用、构成,各类个性化 推荐算法的特征对比以及移动商务中基于的定位的个性化推荐对算法的特殊要求 等方面。 2 1 电子商务个性化推荐系统 推荐系统最早是由m a l o n e 等人于1 9 8 7 年提出的,当时推荐系统主要被分为 三类:c o g n i t i v ef i l t e r i n g ,s o c i a lf i l t e r i n g 和e c o n o m yf i l t e r i n g l 引。 最初推荐系统( r e c o m m e n d e rs y s t e m ) 被定义为以人们提供的推荐为输入并 对其整合后指导适当的接受者的系统【4 】然而随着推荐技术的发展以及其他领域 的技术应用于推荐,现在推荐系统的含义更加广阔,泛指以个性化推荐为输出或 以个性化的方式指导使用者在庞大的可选空间中发现有趣或有用的项( i t e m ) 的 系统【5 1 。 2 1 1 电子商务个性化推荐系统的构成 根据电子商务个性化推荐系统的工作流程,整个系统主要可以分为输入功能 ( i n p u tf u n c t i o n a l ) 模块、推荐方法( r e c o m m e n d a t i o nm e t h o d ) 模块和输出功能 ( o u t p u tf u n c t i o n a l ) 模块【6 j 。 1 输入功能模块 主要用于收集客户个人和社团群体的信息。 客户个人输入( t a r g e t e dc u s t o m e ri n p u t s ) 主要指目标用户,即要求获得推荐 的人,为得到推荐必须对一些项目进行评价,以表达自己的偏好,主要包括客户 的个人属性、购买的历史记录、页面浏览记录、显式浏览输入、关键词和项目属 性输入等。随着电子商务的发展,网络隐私的保护和电子货币交易日渐成熟,将 会有更多的用户填写真实信息以实现网上直接支付交易。购买的历史记录主要存 放于电子商务网站的后台交易数据库中,它是每位用户以前购物历史的详细记录, 包括购物的时间、所购商品、价格以及折扣等。同时也可收集用户放入购物篮而 未购买的商品、其收藏的商品以及用户过去点击过的商品等,这些信息与用户的 购买信息同样重要,因为它们都可以帮助电子商务企业分析目标客户的偏好,进 而未客户推荐合适的商品,促进客户的购买行为。页面浏览记录存储于服务器的 日志文件中,记录了用户的访问行为、频率及用户来源等重要信息。 社团群体输入( c o m m u n i t yi n p u t s ) 主要指集体形式的评价数据,包括项目属 性、社团购买历史、文本评价和等级评分等。这些信息是进行社会化协同推荐的 基础。 2 推荐算法模块 移动商务中基于定位的个性化推荐系统研究 这模块是推荐系统的核心部分,决定者推荐系统的性能优劣。这个模块的 主要任务就是建立客户行为模型,分析客户的行为特征或偏好,然后根据一定的 推荐方法产生推荐结果。 3 输出功能模块 输出主要是推荐系统获得输入信息后推荐给用户的内容,主要形式有:建 议( s u g g e s t i o n ) 。分为单个建议( s i n g l ei t e m ) 、未捧序建议列表( u n o r d e r e dl i s t ) 和排序建议列表( o r d e r e dl i s t ) ,典型的如t o p n ,即根据客户的喜好向客户推荐 最可能吸引客户的n 件商品;预测( p r e d i c t i o n ) ,系统对给定项目的总体评分; 个体评分( i n d i v i d u a lr a t i n g ) ,输出其他客户对商品的个体评分;评论 ( r e v i e w ) ,输出其他客户对商品的文本评价。 2 1 2 电子商务个性化推荐系统的作用 电子商务个性化推荐系统最大的优点在于它能收集用户感兴趣的资料,并根 据用户偏好主动为用户作出个性化推荐。这样,当用户登录网站或对推荐系统发 出请求时,推荐系统就能按照用户的偏好推荐给用户最喜欢的n 个产品,而且给 出的推荐是实时更新的。也就是说,当系统中的产品信息和用户兴趣发生变化时, 给出的推荐次序也会发生改变,这就大大方便了用户对商品信息的测览,也提高 了企业的服务水平。 总的来说,电子商务个性化推荐系统的作用主要表现在三个方面: 1 将浏览者转变为购买者 电子商务网站的用户经常在网站上浏览但不购买任何商品。推荐系统能够帮 助用户发现其喜欢并乐于购买的商品。 2 提高电子商务网站的交叉销售能力( c r o s ss e l l i n g ) 推荐系统一般通过为用户的购买行为建议附加商品来提高网站的交叉销售能 力。一般而言,如果一个推荐是好的,那么平均的订单规模会增大比如说,一 个电子商务网站可能会根据已经在用户购物车中的商品信息为用户推荐其很可能 购买的附加商品。 3 提高用户对电子商务网站的忠诚度,提高电子商务网站的黏度 在网络世界中。一个电子商务网站与其竞争对手的距离只有鼠标那么远,所 以要在竞争中立于不败之地,拥有顾客忠诚度是十分有效的战略。推荐系统通过 在顾客和电子商务网站之间建立一种增值关系以提高顾客的忠诚度。网站投资于 研究顾客的喜好,使用推荐系统优化这一研究过程并为顾客提供满足其需要的网 站界面。而顾客则选择最能满足其需要的网站并重复在该网站上的购买行为,这 就是顾客对网站的回报。一个顾客越多地使用推荐系统,越多地教授推荐系统他 ( 她) 的需求,那么这个顾客对该网站的忠诚度就越高,即使别的竞争者也拥有 这样的推荐系统,但是顾客不会再愿意花时间和精力去训练别的推荐系统。另外, 在用户之间建立关系也可以提高顾客忠诚度,因为网站会为用户推荐与其志同道 合的朋友【6 j 。 硕士学位论文 2 2 电子商务个性化推荐算法 统分为了三类:c o g n i t i v ef i l t e r i n g ,s o c i a lf i l t e r i n g 和e c o n o m yf i l t e r i n g 【3 1 。 协同龇 u 对。的评价u 对。的评价萎主萎蒜耥意 c o l l a b 。眦i v cf i l c 咖g 评价 ment-basedcontent-basedf i l t 滤e r i n g i u 然嚣基罨黑鼍 评价、测览) 基于d e 朋m o g r 统计a p h i c 籼- b a s 推荐e d 篆激嘉iu 的仝警学裁豢徽:;】 学信息及其对 一 相似的用户,用于推断他们 u t i l i 鼾t y - b a 期s e dr 腓e c o m 荐m e n i 嚣茹譬鬻 的特征述u 的偏好的效 一”。:i = 。二 。 基于知识的推荐 1 。竺竺篓釜竺 对u 的需要或兴推断i 和u 的需要之间的匹 k n 。w l e d g c 。b 鹪c dr c c 何兰苎苎需 磊磊篡 一。 ;。一 o m m e n d a t i o n要的知识 。 移动商务中基于定位的个性化推荐系统研究 推荐系统分别通过电子邮件的方式推荐音乐和电影 9 。i t 】。还有如c l a y p o o l 的新闻 文章推荐系统,u s e n e tn e w s 推荐系统和餐饮推荐系统f o o dr e c i p e s 等f 1 2 13 1 。 如前所述,个性化推荐系统的构成主要包括输入功能模块、推荐算法模块和 输出功能模块,而且推荐算法是核心,它决定了系统的输入和输出的形式。因此, 如果要更细致的考察个性化推荐算法,就必须从推荐算法的特征入手。r o b i n b u r k e 对现有的个性化推荐技术进行了总结和提炼,他认为描述推荐技术的属性 特征主要包括:( 1 ) 背景数据,即在推荐过程开始之前系统所拥有的信息;( 2 ) 输入数据,即为了获得推荐,用户必须和系统之间进行的通信信息;( 3 ) 推荐过 程,即用以利用上述两种数据形成推荐结果的计算过程,并在这些特征的基础上 将现有的推荐算法划分成五种相关技术,即基于内容的过滤( c o n t e n t - b a s e df i l t e r i n g ) 、协同过滤( c o l l a b o r a t i v ef i l t e r i n g ) 、基于人口统计学的推荐 ( d e m o g r a p h i c b a s e dr e c o m m e n d e r ) 、基于效用的推荐( u t i l i t y b a s e dr e c o m m e n d e r ) 和基于知识的推荐( k n o w l e d g e b a s e dr e c o m m e n d e r ) ,如表2 1 所示【1 4 】。 2 2 1 基于内容的过滤( c o n t e n t b a s e df i l t e r i n g ) 基于内容的过滤是信息提取技术研究的延续和提升r 7 1 。在基于内容的推荐系统 中,用户感兴趣的对象是通过这些对象的特征进行定义的o s 例如,像 n e w s w e e d e r 这样的新闻组过滤系统就是将各个新闻文本中的单词作为特征的e l 们 基于内容的推荐系统从用户浏览、购买或评价过的对象的特征中学习并形成用户 感兴趣的档案,这样的推荐方式被称为“项对项的相关性( i t e m t o i t e mc o r r e l a t i o n ) 一f l 列。这种基于内容的推荐技术生成的用户档案依赖于所采用的学习算法 如决策树、神经网络和向量模型等。次方法是基于内容且无记忆性的,它只能根 据用户以前看过或打过分的内容的特征来进行推荐。 总的来说,基于内容的过滤技术是基于访问对象的,根据访问对象之间的内 在关系为一个特定用户请求进行推荐。其主要的缺点在于忽略了用户的相似性, 而单纯的认为用户之间是单一且无关联的。 2 2 2 协同过滤( c o l l a b o r a t i v ef i l t e r i n g ) 与基于内容的过滤不同,协同过滤推荐算法的基本思想是在相似的用户之问 进行个性化推荐,首先通过建立适当的数学模型来描述用户之间的相似性,进而 在此基础上设计高效的算法为目标用户寻找相似的用户,并将相似用户感兴趣的 资源推荐给目标用户,所以这样的推荐方式被称为“人与人的相关性 ( p e o p l e t o p e o p l ec o r r e l a t i o n s ) 一,也就是说该技术肯定了用户之间的群组性u 。 协同过滤被认为是近年来最为成功的个性化推荐技术之一,其相关的研究和 应用都取得了较大的发展【9 l 引。现有的协同过滤算法通常被分为两类,一类是基 于记忆的算法( m e m o r y - b a s e da l g o r i t h m ) ,另一类是基于模型的算法 ( m o d e l b a s e da l g o r i t h m ) 【19 1 。 硕士学位论文 基于记忆的协同过滤算法最早由r e s n i c k 和r i e d l 在g r o u p l e n s 项目中提出p j 。 该算法通过计算数据库中其他用户对某一项目的评分的加权平均值来预测目标用 户对该项目的打分,其权重由其他用户与目标用户之间的相似度决定。由于该算 法思想直观简单,易于实现,同时具有较高的预测准确率,所以在提出之后很快 就吸引了众多研究者的注意。一些院校和研究机构很快提供了专门的测试数据集 ( b e n c h m a r k ) ,如e a c h m o v i e 、m o v i e l e n s 和j e s t e r 等等【2 肛2 2 】。研究者在此基础 上对最初的协同过滤算法进行了大量的改进工作,并取得了许多有意义的研究成 果 2 3 , 2 4 】。这些研究成果使得基于记忆的协同过滤算法在预测精度上得到了较大的 提高,并因此很快得到了商业应用,如a m a z o n 、m o v i e l c n s 及j e s t e r 等【1 8 2 i 。 与基于记忆的协同过滤算法不同,基于模型的协同过滤算法并不直接进行用 户之间相似度的计算,而是在某种统计模型或者机器学习方法的基础上,将用户 的历史数据信息编译成预测模型,并利用该预测模型对目标用户进行预测。目前, 比较成熟的基予模型的协同过滤算法包括b r e e s e 提出的聚类模型和贝叶斯网络模 型,h e c k e r m a n 等提出的d e p e n d e n c yn e t w o r k ,h o f m a n n 提出的高斯隐含语义模 型( g a u s s i a nl a t e n ts e m a n t i cm o d e l ) ,以及g e t o o r 和s a h a m i 提出的概率关系模 型( p r o b a b i l i s t i cr e l a t i o n a lm o d e l ) 等等【弱 2 7 1 由于最初协同过滤技术的提出是针对电子商务网站应用的个性化推荐,因此 现有的对上述两种算法的实现基本上都是采用集中式的计算模式随着网络应用 规模的逐渐增大,以及应用模式的日益开放,这种计算模式在很多方面受到了挑 战。比如基于记忆的协同过滤算法的算法复杂度一般为o ( m 2 n ) ( m 是用户数目, n 是项数目) ,因此用户和项目数量的增长将使算法的计算量急剧上升。这在很大 程度上限制了算法的可扩展性和进一步应用 2 2 , 2 4 】。基于模型的协同过滤算法虽然 通过利用事先构造好的模型对目标用户的喜好进行预测,不需要实时计算用户相 似性,但是由于预测模型的建立需要大量的后台计算,尤其在用户档案信息更新 较快的时候,需要频繁的重构模型,其计算复杂度甚至高于基于记忆的协同过滤 算法。 2 2 3 基于知识的推荐( k n o w l e d g e b a s e dr e c o m m e n d a t i o n ) 基于知识的推荐系统通过使用关于推荐项对用户需要的满足程度的先验知识 来进行推荐【2 7 1 。基于知识的推荐试图在对用户需要和偏好判断的基础上进行推荐 从某种角度上讲,所有的推荐技术都可以被描述为一种推断。基于知识的推荐方 法与其他推荐方法的区别在于它们使用功能知识;即特定项如何满足用户的需要, 并在此基础上推理一个需要和可能的推荐之间的关系,用户档案可以是任何支持 这种推断的知识结构。最简单的如g o o g l e 中用户的查询( w w w g o o g l e t o m ) ,复 杂一点的如t o w l e 和q u i n n 中的对用户需要的详细表述,e n t r 6 e 系统中的基于用 户订购旅馆的案例推理等 2 9 , 3 0 】。s c h a f e r 等将其称为“编辑的选择( e d i t o r sc h o i c e ) 一 方法 1 7 1 。 移动商务中基于定位的个性化推荐系统研究 基于知识的推荐也可以使用其他形式的知识。g o o g l e 使用网页间的链接信息 来推断他们的声望和权威,f i n d m es y s t e m 采用基于知识的推理来为用户感兴趣 的汽车、电影、房屋等对象进行查询定位,e n t r e e 使用烹饪风格方面的知识来推 荐餐馆问的相似【3 l 一3 3 1 。 2 2 4 基于效用的推荐( u t i l i t y b a s e dr e c o m m e n d a t i o n ) 基于效用的推荐技术主要为推荐对象计算一个效用值。从原理上讲,这种计 算是基于效用知识的,但已有的系统并不是使用这种推断,因为它要求用户自己 对自己的需求和产品特征进行匹配,如t e t e a t e t e 设置相应的特征偏好函数对需 求进行描述,商业网站p e r s o n a l o g i c 则提供详细问卷来订制效用需求p 4 1 。 基于效用的推荐系统不是为用户建立一个长期的泛化模型,而是根据用户需 药与一系列可选项的匹配程度进行推荐。该技术通过计算每个对象对用户的效用 进行推荐。所以,其关键在于如何为用户生成效用函数。t e t e 。矗t e t e 以及 p e r s o n a l o g i c 采用不同的技术实现面向用户的特定函数并应用到需要考虑的对象 上阱】。因此,用户档案就是系统提交给用户的效用函数,系统通过使用不同的约 束满意算法来定位最佳匹配。该技术的优点在于可以刻画非产品属性,如提供商 的可靠度和产品有效性。 2 2 5 基于人口统计学的推荐( d e m o g r a p h i c b a s e dr e c o m m e n d a t i o n ) 基于人口统计学的推荐系统通过基于个人属性对用户进行分类,并在分类的 基础上进行推荐。g r u n d y 是较早使用该技术的系统之一,主要通过在用户对话中 收集到的个人信息向用户进行书籍推荐,系统则需要将用户的反馈与手工构造的 用户原型库进行匹配【3 5 】。 这种系统并不多见,因为收集这类信息非常困难p 】。用户不愿意向系统公开他 们的个人信息。在商业系统中这个问题相对比较容易解决,比如系统可以在用户 下订单时收集其电话号码,因此该技术在商业系统中有一定的应用。如k r u l w i c h 使用营销研究中的人口统计分组来推荐一系列的产品和服务,系统通过简单的问 卷收集用户分类的数据;在p a z z a n i ( 1 9 9 9 的系统中,基于机器学习技术,采用 w i n n o w 从用户主页上提取信息来预测用户可能喜欢的餐馆 3 6 , 3 7 】。人口统计方法 同样采用搿人对人的相关性一作为度量,但是使用的数据源不同。不同在于协同 过滤和基于内容的过滤,其优点在于不需要用户评价的历史数据。 除上述推荐技术外,其他一些领域的技术也在推荐系统中得到了一定的应用。 如b a y e s i a n 网络技术,利用训练集创建相应的模型,用决策树表示模型,节点和 边表示用户信息,训练得到的模型非常小,所以对模型的应用非常快,该方法适 合用户的偏好变化比较慢的应用领域【3 引。 聚类技术将具有相似兴趣爱好的用户划分到相同的簇中,聚类产生之后,根 据簇中其他用户对商品的评价预测目标用户对商品的评价。由于聚类过程离线进 行,所以在线的推荐算法产生推荐的速度比较快【3 9 1 。 硕士学位论文 关联规则技术在零售业的得到了广泛的应用,关联规则挖掘可以发现不同商 品在销售过程中的相关性。基于关联规则的推荐算法根据生成的关联规则模型和 用户当前的购买行为向用户产生推荐【4 0 1 。 h o r t i n g 图技术是一种基于图的方法,节点代表用户,边代表两个用户之间的 相似度【4 l 】。在图中搜索近邻节点,然后综合近邻节点的评分形成最后的推荐。 h o r t i n g 图技术可以跳过中间节点寻找最近邻居,考虑了节点之间的传递相似关系 因此推荐精度优于最近邻协同过滤技术。 2 2 。6 各种推荐技术的优缺点 推荐算法的任务就是帮助用户在巨大的可选择空间中发现其感兴趣的信息或 商品,上述各种推荐技术在完成任务的过程中也有自己的优缺点,具体如表2 2 所示5 1 。 表2 2 各种推荐技术的优缺点 技术优点缺点 协同过滤 a 可以进行跨类推荐 b 不需要领域知识 c 自适应:性能随时间提高 d 不需要精确的反馈 基于内容的过滤 b 、c 、d 基于入口统计学的a 、b 、c 推荐 e 不存在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年福建武夷交通运输股份有限公司招聘10人笔试参考题库附带答案详解
- 2025年宣城市开盛控股集团有限公司招聘10人笔试参考题库附带答案详解
- 2025四川泸州航空发展投资集团有限公司及下属公司招聘8人笔试参考题库附带答案详解
- 2025四川达州市某国有企业招聘2人笔试参考题库附带答案详解
- 推拿加盟合同协议
- 2025上半年上海闵行区区管国企公开招聘35人笔试参考题库附带答案详解
- 损坏补偿合同协议
- 鱼池转包合同协议
- 洒店转租合同协议
- 设计部门合同协议
- DB4331T 7-2024 农村社区社会工作室建设与服务
- 2025年天津市南开区中考一模语文试题(含答案)
- 2025年磁粉探伤工职业技能鉴定理论考试题库(浓缩500题)
- 婚姻保证忠诚协议书
- 新2024年-北京市房屋租赁合同自行成交版
- 有效工作时间管理
- 2025年安徽省铜陵市枞阳县浮山中学高三下学期3月适应性考试历史试题含解析
- 劳动合同法员工培训课件
- 2025年上海市房屋租赁合同模板(标准版)
- 详解家庭教育指导师考试试题及答案
- 智慧城市中的公民参与-全面剖析
评论
0/150
提交评论