推荐系统总结_第1页
推荐系统总结_第2页
推荐系统总结_第3页
推荐系统总结_第4页
推荐系统总结_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Xiaol v2009-Relevance is more significant than correlation: Information filtering on sparse data本文提出了在针对数据稀疏时,使用相关性信息比关联性信息效果更好,因为在关联性信息中,会用到更多的数据,Recommendation System推荐系统存在的主要挑战:1. Data sparsity.2. Scalability 解决该问题的一般方法(28-30)a) 有必要考虑计算成本问题和需找推荐算法,这些算法要么是小点的要求或易于并行化(或两者)b) 使用基于增量的算法,随着数据的增加,不重新计算

2、所有的数据,而是微调的进行3. Cold start解决该问题的方法一般有a) 使用混合推荐技术,结合content和collaborative数据,或者需要基础信息的使用比如用户年龄、位置、喜好genres(31、32)b) 识别不同web服务上的单独用户。比如Baifendian开发了一个可以跟踪到单独用户在几个电子商务网站上的活动,所以对于在网站A的一个冷启动用户,我们可以根据他在B,C,D网站上的记录来解决其冷启动问题。4. Diversity vs. Accuracy(多样性和精确性)将一些很受欢迎的且高评分的商品推荐给一个用户时,推荐非常高效,但是这种推荐不起多少作用,因为这些商品

3、可以很容易的找到。因此一个好的推荐商品的列表应该包含一些不明显的不容易被该用户自己搜索到的商品。解决该问题的方法主要是提高推荐列表的多样性,以及使用混合推荐方法。(34-37)5. Vulnerability to attacks6. The value of time.7. Evaluation of recommendations8. er interface.除了这些问题外,还有其他的。随着相关学科分支的出现,特别是网络分析工具,科学家考虑网络结构对推荐的效果影响,以及如何有效使用已知的结构属性来提高推荐。比如,(45)分析了消费者-商品网络并提出了一个基于喜好边(preferring

4、edges)改进的推荐算法,该算法提高了局部聚类属性。(46)设计并提高了算法,该算法充分利用了社区结构(community structure)。随之而来的挑战主要有:带有GPS移动手机成为主流,并且可以访问网络,因此,基于位置的推荐更需要精确的推荐,其需要对人的移动有一个高效预测能力(47、48)并且高质量的定义位置和人之间的相似性的方法。(49、50)。智能推荐系统需考虑不同人的不同行为模式。比如新用户比较喜欢访问popular商品并且选择相似的商品,而老的用户有更不同的喜好(51,52)用户行为在低风险商品和高风险商品之间更加的不同。(53,54)推荐系统的一些概念网络网络分析对于复杂

5、系统的组织原则的发现是一个万能的工具(5-9)。网络是由一些元素点和连接点的边组成的。点即为个人或者组织,边为他们之间的交互。网络G可用(V,E)表示,V(vertice)为节点的集合,E为边(edge)的集合。在无向网络中,边无方向。在有向网络中,边有向。我们假设网络中不存在回路以及两个节点之间不存在多条边。G(V,E)图中,一些参数表示是指与节点x连接的节点(即x的邻居)的集合。即为x节点的度。即为度为k的所有节点被随机选中的概率,假设度为k的节点有x个,总节点为N,则=x/N。即网络中的节点个数。即为网络直径,指在所有节点间最大的距离。为平均距离,计算公式为:,为x节点到y 节点的距离。

6、 ,即给定节点x的聚集系数,即x节点的邻居之间存在的边数/x的邻居对的个数。,为x节点的个邻居之间的边数 网络聚集系数,即为所有节点x(1)的聚集参数的和的平均。Bipartite network(由两部分构成的网络)即一个网络G(V;E),如果存在一个分割(V1; V2),使得,并且V1集合的节点与V2集合的节点都有一个边连接。Web-based user-object networks即为该类网络。(51、76-78)以下为对分网络的信息来源:对分网络即bipartite network,是一个属于复杂网络研究的对象。在这篇文章里,作者第一次把它引入到推荐系统的应用当中。依我来看,这是一种

7、非正统的推荐方法,又是去年新发表的文章,兼且我对作者的思路也有一些了解,所以想拿出来介绍一下。所谓正统的推荐方法,可以参考这里的概述。发展到现在,比较成熟常用的推荐方法主要可分类为:1、contented-based;2、collaborative filtering;3、hybrid method。又有以:基于个人历史的推荐、基于社会化的推荐、基于产品的推荐这样的分法。无一例外地,以描述用户的兴趣为出发点,通过不同的搜索策略,最后落脚于对用户未来兴趣的预测。与以往不同的是,这篇文章从开始就以网络模型为研究的基本对象,而非网络中的节点,出发点在于网络特性的研究,在解决了对分网络加权映射的问题之

8、后,有点生产副产品意味地把方法应用在推荐系统上。作者是我的校友,在学期间我也曾经听过他的几次报告,他属于典型的具有理科思维的人。其物理背景加上一个研究复杂系统、复杂网络的团队,造就了作者喜欢从模型的高度,而非从具体某个问题出发思考的习惯。所以我觉得这篇文章对于冲淡以往已成定势的推荐系统思维方式,是有好处的。什么是对分网络如果我们把网络理解为描述现实世界对象间某种关系的数学模型,对分网络就是描述这样的一种特殊的关系:对象可以分为两个集合,如X与Y,关系(即网络的边)仅仅存在于不同集合的节点之间,同一个集合内的节点不存在直接连接,而是通过另一个集合而产生间接关联。这是一种具有广泛意义的模型,如不同

9、作者通过共同撰写的文章所形成的合作关系;化学物质与化学反应所组成的新陈代谢网络;豆瓣上不同的读者因看一样的书而形成的阅读同好网络;amazon上不同用户因购买共同的商品所构成的购买兴趣网络等等。对分网络的单模态映射与赋权要使得对分网络具有应用价值,通常要得到同一个集合内元素之间存在的关系,研究上这叫作对X(或Y)的单模态映射(one-mode projection)。这种映射的结果不单可以实现数据的压缩,并可同时得到极具意义的同一集合内各节点之间的关系。例如,得到“阅读同好网络”中各个用户之间的兴趣相似度或是书籍之间的相似度,自然要比原始的对分网络更有价值。怎样给节点的连接边加权是单模态映射及

10、其应用中关键的问题,因为边的权值意味着两个节点关系的密切程度。比较常见的映射方法可参看图1:对于集合X中的节点x(i)与x(j),如果它们共同地连接了n个Y集中的节点,则x(i)与x(j)的连接权值为n。但这种方法存在着很多的问题,例如:x(i)与x(j)的连接权值随着n的增加而呈线性增长的趋势,但这并非一种符合现实的描述方式,其实我们可以设想两个作者共同合作的文章数从1增长到2,其意义当然是比从100增长到101要更大,所以有人提出要采用双曲正切函数而非线性函数来对n进行映射。这些方法我在这里都不再赘述,只介绍作者在文中提出的比较好的一个解决方案:资源分配过程,来处理这个赋权的问题。 图1,

11、对分网络的单模态映射 资源分配过程(resource-allocation process)见图2,(a) 是一个对分网络,上面的三个节点构成一个集合,下面的四个节点构成另一个集合。设上面三个节点的初始资源值为x, y, z,第一步这些资源根据连接关系流动到另一个集合中(b),流动过程中某节点的资源根据它的“出度”(即从该节点出发的边)而被稀释,如x有三个“出边”,则每一个终点都得到了x/3。在资源分配到下面四个节点后,第二步,把资源再流回原来的集合,遵循的原则与第一步是一致的。这样就得到了原集合最终的资源分配,这个分配是通过两个集合之间的共同连接关系所实现的再分配,携带了这个网络的拓扑结构信

12、息。对比原资源与最终的资源值,我们可以得到一个矩阵的映射关系,见图3。这就是资源分配过程的结果,得到一个从原始资源到最终资源的映射结果。矩阵中w(i, j)所代表的意义为:对于i来说,j有多大的价值。这实质上实现了给节点i与节点j的连接赋权这么一个任务。 图2,资源分配过程 图3,资源分配过程后的映射矩阵 个性化推荐到目前为止,我们都只是解决了对分网络中权值分配这么一个问题,最后我们关注的是这么一个问题的解决对于推荐系统有些什么帮助。(b) 根据上面介绍的模型与流程,可以开始把数学抽象与实际问题结合起来了。现在我们考虑用户看电影这么一个网络,以用户作为一个集合Uu(1), u(2), u(3)

13、, , u(m),电影条目作为一个集合Oo(1), o(2), o(3), , o(n),根据某个用户看过某部电影的关系,我们可以连接两个集合中的对应节点(如果系统记录的是打分关系而非看过关系,可以对打分的分值进行分段处理,较大的分值有连接,较小的无连接),这样就形成了一个用户电影的对分网络。下一步,要通过单模态映射来实现对用户的推荐。假设现在要对用户u(i)进行推荐,该用户看过电影的集合为Oio(j), o(j+1), o(j+2), ,如果不考虑电影之间的差别,可以给每一个Oi中的电影都赋予一个初始的资源值1,不在Oi中的电影则资源值为0。接下来根据上一节介绍的资源分配过程,让O中的资源从

14、O流向U,再从U流回O。这样我们可以得到一个从原始O的资源值到最终O的资源值的一个映射矩阵,就像图3那个矩阵一样。不同的是,现在每一个O都有一个初始的资源值,而不是一个抽象的符号,所以我们可以计算得到每一个O节点的资源值。最后把所有O节点根据资源值的大小进行排序,把资源值高的并且未为U(i)所看过的电影推荐给他。即完成对一个用户的推荐。讨论这种方法来自于复杂网络的研究(用于推荐时作者称该方法为Network-Based Inference, NBI),在某些方面却与协同过滤(CF)有着异曲同工之妙,都是利用一个同好网络进行社会化的推荐。相比而言,CF的原理更为直接,从矢量计算的角度来理解显得很

15、简单明了。NBI本质上也利用用户之间的共同兴趣对条目进行划分,但其基础是网络的动力学,看起来并不那么地直观(但喜欢动态变化的人会觉得这个很优美)。据作者对一个标准数据集的测试结果声称,NBI在预测性能上相比于CF存在着优势。推荐系统参数说明:M为用户数;N为对象(object,item)数;i,j代表用户表示方式;、为商品的表示方式;即为用户i对的评价推荐系统分类:基于内容的推荐:推荐的商品是那些与目标用户以前喜欢的商品在内容上相似。协同推荐:推荐的商品是基于很多用户对该商品的评价的基础上选择的。又可分为:基于内存的协同过滤(Memory-based collaborative filteri

16、ng):推荐的商品是与目标用户具有相似偏好的用户喜欢的商品。或者是那些与目标用户喜欢的其他商品相似的商品。主要模型包括:1) 贝叶斯网络模型(Bayesian networks models)2) 聚类模型(clustering models)3) 潜在语义模型(latent semantic models)4) MDP模型(MDP model)基于模型的协同过滤(Model-based collaborative filtering):是由模式选择的,这些模式可以识别输入数据的模型。1) 基于用户的2) 基于商品的混合方法:将协同和基于内容的方法结合起来。3.4推荐的评价MetricsTab

17、le 3: Summary of the presented recommendation metrics. The third column represents the preference of the metric (e.g., smaller MAE means higher rating accuracy). The fourth column describes the scope of the metric. The last two columns show whether the metric is obtained from a ranking and whether i

18、t depends of the length of the recommendation list L.3.4.1精确度度量(Accuracy Matrics)1)给定一个用户i,推荐系统对所有i没有的商品进行排序,然后推荐最好的几个商品给用户i。如何评价一个推荐系统推荐的结果。评价度量标准有:评分精确性,有两种方法来计算预测的评分与真实评分的接近程度,即Mean Absolute Error (MAE),Root Mean Squared Error (RMSE)参数说明:即为用户i对的真实评价; 即为用户i对的预测评价; 即为隐藏掉的用户-商品评分集;这两个算法那缺陷是:对list中的商

19、品一视同仁,不考虑他们在推荐list中的位置。优点是简单性。且结果越小,推荐效果越好。2)评分和排名相关性另一个评估预测准确性的方法是计算预测值与真实评分之间的相关性。有三种相关性计算方法:1.Pearson product-moment correlation;2.theSpearman correlation;3.Kendalls Tau。皮尔森相关性计算:,分别是真实评分和预测评分。斯皮尔曼相关系数(Spearman correlation coefficient),即斯皮尔曼等级相关系数对于样本容量为 n的样本, n个 原始数据 被转换成等级数据 ,原始数据依据其在总体数据中平均的降序

20、位置,被分配了一个相应的等级。实际应用中, 变量间的连结是无关紧要的, 于是可以通过简单的步骤计算 . 被观测的两个变量的等级的差值 , 则 为计算步骤为:首先,我们必须根据以下步骤计算出 1.排列第一列数据 (Xi)。 创建新列(xi) 并赋以等级值 1,2,3,.n。2.然后,排列第二列数据 (Yi). 创建第四列(yi), 并相似地赋以等级值 1,2,3,.n。3.创建第五列di 保存两个等级列的差值 ( xi)和(yi ).4.创建最后一列 保存 的平方.Kendalls Tau:跟斯皮尔曼相关系数相似,也是计算评分的等级,计算公式为:,C为预测评分在正确的等级排名上的等级数,D是预测

21、在错误的等级排名的等级数。=1,即预测等级与真实等级完全相同时,=-1,当预测等级与真实等级完全相反时。为真实评分相同的商品数量。是商品对预测评分相同时的数值。Kendalls tau是数学统计中一个常用的系数,用来描述两个序列的相关系数。这是一个很有用的参数,可以用来比较两个序列的相似性,例如可以用于搜索引擎的排序结果的好坏。比较一个序列与一个类似标准答案的排序序列的相似性(人工评价),得出排序序列的有效性。举例:如果两个序列完全一致,则Kendalls tau值为1,两个毫不相关的序列的Kendalls tau值为0,而两个互逆的序列的Kendalls tau系数为-1.具体的计算方式为:

22、 1 - 2 * symDif / (n * (n -1),其中n为排列的长度(两个序列的长度相同),symDif为对称距离。对称距离的计算方式如下: 对于两个给定的序列S1 = a,b,c,d; S2 = a, c, b, d. 分别找出两个序列的二元约束集。在这个例子中S1的所有二元约束集为(a,b), (a,c), (a,d), (b,c), (b,d), (c,d), S2的所有二元约束集为(a,c), (a,b), (a,d), (c,b), (c,d), (b,d),比较两个二元约束集,其中不同的二元约束有两个(b,c)和(c,b),所以对称距离为2。代入上面的计算公式可以得到这两

23、个序列的相关系数为: 1 - 2 * 2 / (4 * 3) = 2 / 3 = 0.667the normalized distance-based performance measure (NDPM)计算公式为:试用于用户对商品非常的喜欢的情况。 3)分类精度度量(Classification Accuracy Metrics)该类度量适合像“寻找好商品”这类的只有隐含评分的任务,即没有确切的评分值。计算方法有:1)AUC(Area Under ROC Curve).该方法试图检测一个推荐系统区分相关商品(一个用户喜欢的)和非相关商品(其他用户)的效果。计算时,是比较相关商品被推荐的概率和

24、非相关商品被推荐的概率。,表示相关产品比非相关商品取得更高得分的次数;表示两方得相等的分数时的次数。当所有相关商品比非相关商品分数都高时,AUC=1表示一个非常好的推荐列表;AUC=0.5时,表示一个随机的等级推荐列表。2) Ranking Score与AUC相似,一个给定用户,我们检测的是该用户推荐列表中的相关对象(即用户喜欢的对象)的相对排名。当有O个商品被推荐时,那么排名r的一个相关商品的相对排名为r/o。然后对所有用户的相关商品的相对排名取平均值,我们得到一个平均排名得分RS,越小说明该算准确性越高。precision and recall of recommendation只考虑推荐

25、列表中的最高L个用户相关商品。给定一个用户i,表示在推荐列表中的最高L个相关商品(由i收集的商品)的数量。表示用户i的相关商品的总数。L表示取最高排名的前L个。、表示对所有至少有一个相关对象的用户的、的和的平均值;最后公式为:M是用户数量,N是商品数量;D是相关商品的总数量。3.4.2 等级加权指数(Rank-weighted Indexes)通过考虑每个相关商品的位置并对其进行加权,可以很好的检测用户满意度。一下三种方法:1) Half-life Utility.4.基于相似的方法4.1预测评分算法4.1.1. 用户相似度(User similarity)通过集合其他用户的评分数据,来自动的

26、对用户喜好进行预测。计算用户u对已评分过的商品的平均评分:,即为用户u对商品的评分;为用户u已评分过的商品集合;用户u对商品的预测评分公式计算为:参数说明:为与用户u相似的用户集合;为用户u与用户v之间的相似度;,为归一化因子。当评分不是清晰的,而是隐含的,只知道用户所收集的商品集,我们欲预测一个用户以后会搜集的商品。此时,公式为:为用户u对的推荐得分;是一个用户-商品关联矩阵,即当用户v搜集了时,值为1,否则为0;,即为用户u的邻居集合,选择邻居的策略有:1) 关联阈值;选择所有相似度大于给定阈值的用户。2) 设置邻居最大数量;选择k个最大的与用户u相似的用户。4.1.2. 商品相似(Ite

27、m similarity),即为商品之间的相似,使用加权平均来估算未知评分参数说明:,即为用户u已评价过的商品集合;优势:该方法中商品之间的相似度相比用户之间的相似度更静态化;混合协同过滤算法:结合基于用户、商品或者属性的相似度;该方法不仅提高了预测精确度,而且处理数据稀疏性更健壮性。4.1.3. Slope One predictor是基于商品的协同过滤最简单的形式。参数介绍:表示对两个商品都评分了的用户集合;表示所有用户对商品与商品的平均偏差。给定评分,则用户u对的预测评分为:加权Slope One 算法:双极SlopeOne算法(Bi-Polar Slope One)由给定的用户将商品分

28、组成喜欢和不喜欢两组(一个直接的标示喜欢和不喜欢的准则是检查他们的评分相比指定用户授予的平均评分是高还是低)。这两个组分别进行预测,即,。他们各自的偏差是:最后的合成的一个预测公式是:Slop One算法可以和基于用户的协同过滤结合,通过填充用户-商品矩阵的空白评分,来解决数据稀疏性问题,提高预测精确度。4.2. 如何定义相似度(How to define similarity)基于相似度的算法的关键问题是如何定义用户之间或者商品之间的相似度,当有确切的评分时,相似度一般定义相关性度量比如Pearson;当没有有效的评分信息时,相似度可以从输入数据的结构属性来推断(比如当两个用户都喜欢或者买了

29、许多相同的商品);也可以从额外的信息比如用户属性、标签、商品内容元数据等信息来评估相似度。4.2.1.基于评分的相似度( Rating-based similarity)计算相似度的算法有:1) Cosine index2) 皮尔森系数Pearson coefficient (PC)评分相关性可由PC方法,为了进行量化相似性,有如下公式:参数说明:,即用户u和用户v都评价过的商品集;constrained3) 约束性皮尔森系数(Constrained Pearson coefficient)在上面的公式中,由中心评分代替用户评分平均值(中心评分即为,假设分数从1到5,那么中心评分即为3)4)

30、加权皮尔森系数(weighted Pearson coefficient)based on the idea of capturing the confidence that can beplaced on similarity values (when two users evaluated only a few objects in common, their potentially high similarity should not be trusted as much as for a pair of users with manyoverlapping objects).系数说明:

31、H是一个阈值,由实验决定。5) 商品间的皮尔森相似度参数说明:,同时评价的用户的集合; ,商品的所有评分的平均值;实验证明,皮尔森系数比Cosine index表现的更好。4.2.2. 结构相似性(Structural similarity)结构化相似性是基于数据的网络结构的,最近调查发现,基于结构的相似性在推荐效果方面比皮尔森系数效果更好,特别是数据稀疏时。为了计算结构相似,可将用户-商品对分网络分成一个用户-用户或者商品-商品网络。最简单的案例是,判断两个用户是否相似的方法是如果两个用户对至少一个共同商品都参与评分了,则认为相似。这方面的相似性度量主要有:node-dependent vs

32、. path-dependent, local vs. global, parameterfree vs. parameter-dependent(i)节点独立相似度(node-dependent similarity)最简单的加权相似度指数是CN(Common Neighbors),两个节点的相似度是直接由共同的邻居个数决定的。然后延伸出六个变化的相似度度量1)Salton Index 2)Jaccard Index 3) 4) 5) 6)Leicht-HolmeNewman Index (LHN16)(ii) Path-dependent similarity两个节点相似即为他们之间存在了

33、很多连接的路径。即为N次方邻接矩阵,里面的元素是不同对节点之间存在的不同路径数量。度量公式为:,该公式只包含长度为2,3的路径,提出了包含所有长度路径的计算方法:Katz similarity,公式为:参数说明:,阻尼因数,控制路径权重;(iii) Random-walk-based similarityAverage Commute Time:节点x与节点y之间的平均commute时间即为从节点x到节点y加上从y到x走的平均步数。可以通过网络的拉普拉斯算子矩阵的伪逆获取。E为网络中的边数。那么节点x与节点y的相似度公式为:即通勤时间的倒数。:SimRank4.2.3. Similarity

34、involving external information(i) Attributes.两个用户(商品)相似是通过计算他们相应属性向量的相关性。比如一个用户的个人文档包括年龄、性别、国籍、位置、工作等。那么可以通过认为两个相似用户有很多共同的特征时为相似用户,进而得到量化相似。有一篇文章写的是混合推荐方法,通过使用用户属性和评分信息来提高推荐的精确度。(ii) Contents.现在存在很多可以自动抽取一个有效对象的内容和元数据的技术。因此对象相似性可以通过计算给定对象的内容比较进行确定。该方法一般叫基于内容的推荐算法。该推荐算法一般通过分析目标用户评分过的对象的内容。故问题变为如何对给定一

35、个由目标用户喜欢的对象的内容来找出与该内容相似的对象。典型方法是:TF-IDF (term frequency - inverse document frequency),该方法常用来信息检索和文本挖掘。参数说明:t是一个术语; d是一个文档; 表示t在文档d中的出现次数; 表示所有观察文档的数量;,用于检测对象的相似度;基于内容的和协同过滤方法都有各自的局限性。比如CF无法精确的合并属性信息,并且面临数据稀疏性和冷启动问题。而基于内容的系统没有不必要合并用户喜好信息。混合方法有四类:(i) implement separate collaborative and content-based

36、methods and then combine their predictions(ii) add content-based characteristics to collaborative models(iii) add collaborative characteristics to content-based models (iv) develop a general unified model that integrate both content-based and collaborative characteristics而这些方法只能用在对象有很多可以自动抽取的内容信息时才有

37、效。一般用在书籍,文章,书签等情况,而无法使用在视频,音乐和图片。(iii) Tags.随着Web2.0的出现,协同标签系统也出现了,标签系统允许用户自由的指定关键词,而不会有一个词汇的限制。标签信息的出现,通过用户领域或者商品领域的标签向量,使得推荐系统可以很容易的计算用户相似度和商品相似度。为了减少垃圾邮件的影响以及扩大个性化用户喜好,权重技术经常用来显示在给定的标签向量中各个元素的重要性。5.降维技术(Dimensionality Reduction Techniques)主要目的是减少相关数据的规模,同时保留住主要信息。一般用在数据挖掘,机器学习,聚类分析。主要的技术包括:特征提取(充

38、分利用隐藏变量、或者叫做潜在变量)。比如在电影选择时,潜在用户可能考虑到genres,比如动作片、浪漫片或者喜剧片等特征,这些变量经常描述为多维向量。用于实现推荐系统的几个降维技术有:singular value decomposition (SVD)、Bayesian clustering、probabilistic latent semantic analysis (pLSA)、latent dirichlet allocation (LDA)5.1 奇异值分解(SVD)R矩阵是N*M,矩阵元素表示用户i对商品的评分(如果还没有评分,则其相应值为0)。假设没有数值评分的情况下,R是一个关联

39、矩阵,即如果用户-商品连接,则=1,否则为0.降维技术主要是用于生成K个隐藏变量,这K个变量将用户的兴趣和商品属性归类。原始的R矩阵为:参数说明:W和V分别表示维数为、的矩阵。W矩阵元素是用户的兴趣信息,V元素是商品的内容信息。当隐藏变量数值K小于N 、M时,那么表示R的中的改为NK+KM,即将矩阵的维数降低。该方法叫矩阵因子分解(,matrix factorization)。为了得到W和V,SVD方法是LSA的一个常用代数工具,用于减少相关数据,并找到一个相似的R矩阵。在SVD中,R表示形式为:其中,是一个对角矩阵,且其元素是R矩阵的奇异值(,即为A矩阵的旋转表示)为了降维,我们设置Kmin(N,M),这样的话,矩阵的秩为K,并且在只含有K个最大的奇异值,其他位置为0.5.2. 贝叶斯聚类(Bayesian Clustering)在贝叶斯网络中,一个变量的值取决于该变量父亲变量的值。6. Diffusion-based methods该类算法是基于将输入数据转换为对象-对象网络的。对一个用户的个性化推荐,是通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论