矩阵分解技术应用到推荐系统_第1页
矩阵分解技术应用到推荐系统_第2页
矩阵分解技术应用到推荐系统_第3页
矩阵分解技术应用到推荐系统_第4页
矩阵分解技术应用到推荐系统_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

矩阵分解技术应用到推荐系统第一页,编辑于星期六:二十三点二十二分。第1页,共25页。CataloguePaperBackgroundIntroductionRecommenderSystemsStrategiesMatrixFactorizationMethodsABasicMatrixFactorizationModelLearningAlgorithmAddingBiasesAddingInputSourcesTemporalDynamicsInputWithVaryingConfidenceLevelsNetflixPrizeCompetitionConclusionFriday,May12,20232第二页,编辑于星期六:二十三点二十二分。第2页,共25页。1、PaperBackgroundFriday,May12,202331.YehudaKoren,YahooResearch2.RobertBellandChrisVolinsky,AT&TLabs-Research3.PaperpublishedbytheIEEEComputerSocietyinAugust20094.AuthorwonthegrandNetflixPrizeCompetitioninSeptember2009第三页,编辑于星期六:二十三点二十二分。第3页,共25页。2、IntroductionModernconsumersareinundatedwithchoices.MoreretailorhavebecomeinterestedinRS,whichanalyzepatternsofuserinterestinproductstopridepersonalizedrecommendationsthatsuitauser'staste.NetflixandAhavemadeRSasalientpartoftheirwebsites.Particularlyuserfulforentainmentproductssuchasmovies,music,andTVshows.第四页,编辑于星期六:二十三点二十二分。第4页,共25页。3、RecommenderSystemStrategiesContentFilteringCollaborativeFiltering

1.Neighborhoodmethods

user-oriented

item-oriented

2.LatentFatorModelFriday,May12,20235第五页,编辑于星期六:二十三点二十二分。第5页,共25页。3.1、ContentsFilteringCreateaproeachuserorproducttocharacterizeitsnature.Needtogatherexternalinformation.AknownsuccessfulrealizationofcontentfilteringistheMusicGenomeProject,whichisusedfortheInternetradioserviceP.Friday,May12,20236第六页,编辑于星期六:二十三点二十二分。第6页,共25页。3.2、CollaborativeFilteringAnalyzerelationshipsbetweenusersandinterdep-enciesamongproductstoidentifynewuser-itemas-Socitions.Disadvantages:coldstartTwoprimaryareas:neighborhoodmethodsuser-orienteditem-orientedLatentfactormodelsFriday,May12,20237第七页,编辑于星期六:二十三点二十二分。第7页,共25页。3.2.1、NeighborhoodmethodsCenteredoncomputingtherelationshipsbetweenitemsor

users.Theitem-orientedapproachevaluatesa

user’spreferenceforanitembasedonratingsof“neighboring”itemsbythesameuser.Theuser-orientedapproachidentifieslike-mindeduserswhocancomplementeachother’sratings.Friday,May12,20238第八页,编辑于星期六:二十三点二十二分。第8页,共25页。Example:第九页,编辑于星期六:二十三点二十二分。第9页,共25页。3.2.2、LatentFactorModelsFindfeaturesthatdescribethecharacteristicsofratedobjects.Itemcharacteristicsanduserpreferencesaredescribedwithnumericalfactorvalues.Assumption:Ratingscanbeinferredfromamodelputtogetherfromasmallernumberofparameters.Friday,May12,202310第十页,编辑于星期六:二十三点二十二分。第10页,共25页。4、MatrixFactorizationMethodsCharacterizebothitemsandusersbyvectorsoffactorsinferredfromitemratingpatterns.RSrelyondifferenttypesofinputdata.Strength:incorporationofadditionalinformation,implicitfeedback.Implicitfeedback:purchasehistory,browsinghistory,searchpatterns,mousemovementandsoon.Friday,May12,202311第十一页,编辑于星期六:二十三点二十二分。第11页,共25页。5、ABasicMatrixFactorizationModelDotproductcapturestheuser’sestimatedinterestintheitem:(1)Here,theelementsofmeasuretheextenttowhichtheitempossessesthosefactors,theelementsofmeasuretheextentofinteresttheuserhasinitemsthatarehighonthecorrespondingfactors.Challenge:Howtocomputeamappingofitemsandusersfactorvectors?Approaches:SingularValueDecompositionn(SVD)

Friday,May12,202312第十二页,编辑于星期六:二十三点二十二分。第12页,共25页。5.1、SingularValueDecompositionRequirefactoringtheuser-itemratingmatrixConventionalSVDisundefinedforincompleteImputationtofillinmissingvaluesIncreasestheamountofdataModelingdirectlytheobservedratingsWeneedtoapproachthatcansimplyignoremissingvalue

第十三页,编辑于星期六:二十三点二十二分。第13页,共25页。5.1、SingularValueDecompositionMeasures:aregularizedmodel(2)Here,isthesetofthe(u,i)pairsforwhichisknown(thetrainingset);theconstantcontrolstheextentofregularization,determinedbycross-validation.第十四页,编辑于星期六:二十三点二十二分。第14页,共25页。6、LearningAlgorithmsTwomethodstominizingEquation(2)

StochasticGradientDescent

AlteringLeastSquaresFriday,May12,202315第十五页,编辑于星期六:二十三点二十二分。第15页,共25页。6.1、StochasticGradientDescentLoopthroughallratingsinthetrainingsetForeachgiventraingcase,thesystempredictsandcomputestheassociatedpredictionerrorBymagnitudeproportionaltointheoppositedirectionofthegradient

第十六页,编辑于星期六:二十三点二十二分。第16页,共25页。6.2、AlternatingLeastSquaresALSteachniquesrotatebetweenfixingtheandfixingtheALSisfavorableinatleasttwocases:AllowsmassiveparallelizationCenteredonimplicitdata

第十七页,编辑于星期六:二十三点二十二分。第17页,共25页。7、AddingBiasesAfirst-orderapproximationofthebiasinvolvedinratingisasfollows:(3)Here,istheoverallaverage;theparameters,indicatetheobserveddeviationsofuseranditemi.Includingbiasparametersintheprediction:(4)Optimize:(5)Friday,May12,202318第十八页,编辑于星期六:二十三点二十二分。第18页,共25页。8、AddingInputSourcesProblem:coldstartSolution:incorporateadditionalsourcesofinformationabouttheusers.Twoinformation:itemattributes,userattributesItemattribute:NormalizingthesumUserattribute:Optimaion:(6)

第十九页,编辑于星期六:二十三点二十二分。第19页,共25页。9、TemporalDynamicsRatingmaybeaffectedbytemporaleffectsPopularityofanitemmaychangeUser'sidentityandpreferencesmaychangeModelingtemporalaffectscanimporveaccuracysignificantlyRatingpredictionsasafunctionoftime:

(7)Friday,May12,202320第二十页,编辑于星期六:二十三点二十二分。第20页,共25页。10、InputwithVaringConfidencelevelsInseveralsetups,notallobservedratingsdeservethesameweightorconfidence.Plan:ConfidenceinobservingisdenotedasCostfounction:

(8)Friday,May12,202321第二十一页,编辑于星期六:二十三点二十二分。第21页,共25页。11、Netflixprizecomp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论