


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习——概率图模型〔推理:消息传递算法〕概率图模型G(V,E)由节点V和边E构成。在之前马尔科夫模型相关的博客中,我谈到马尔科夫模型的本质是当两个人交流后,其意见〔两个随机变量〕同意0与不同意1的概率组合。而势函数表达的是两个意见相同或者相左的程度。我们搞的那么麻烦,最后想要得到的不就是每个意见正确与否〔随机变量取不同值的概率〕吗?与其采用解析的方法去算,去把所有其他的变量边际掉,那干脆采用模拟的方法,让这个消息传递跑起来,把系统迭代N次以后的结果拿出来分析。这种朴素〔Naive〕的想法,就是MessagePassing算法。1.聚类图在执行消息传递之前,我们需要指定两件事情:1.掌握消息的人有哪些,手里都有哪些消息。2.他把这个消息告诉了谁。为了解答这两个问题,需要从我们手里仅有的材料去构造。P(ABCD)=P(AB)*P(BC)*P(CD)*P(DA)
-------
这里的P是未归一化的概率。通过这个联合概率计算式,我们获得一种叫做聚类图的全新图模型。从概率图到聚类图如下所示。其中,聚类图中存在Cluster和Edge.Cluster就是掌握消息的人,Cluster里的内容就是人所掌握的消息。Edge连接了两个交互消息的人,Edge上是两个人交换的消息。当然,聚类图不仅仅是这么简单的结构。还有更复杂的聚类图如下.势函数表达的是两个人意见相同或者相左的程度,两个势函数相乘那么会表达多个消息相同或相左的程度。多个势函数相乘可以成为某个人的消息函数。对于聚类图,有以下性质:1.C(Clusters)由节点组成。2.边上传递的消息,是两个C的交集〔必须要两个人同时知道的消息才能交流〕。3.消息函数是势函数的乘积。总结一下:消息是随机变量,并且都是相关的。人掌握消息之间的关系。人和人之间可以传递消息。我们假设消息A:明天下雨B:明天下雪C:地上有水
那么人们一般都会认为A1B1C1的可能性肯定大于A1B1C0。而E有可能是明天有洒水车。总之,不同的人掌握着不同的消息。消息与消息之间会相互影响。2.消息传递有了消息之后,两个都知道同一件事情的人就会交流和这件事有关的内容,比方2会告诉1关于C(地上有没有水)的事情,这会改变1对消息C的看法〔概率〕。我们把消息传递写成以下形式。i->j表示消息从i传递到j。Sij表示被传递的消息。通式的物理意义有以下三点:1.消息从i传递到j,i会综合所有人给他说的信息〔把所有的δ相乘〕2.加上自己对消息组合的认知〔把
δ相乘的结果乘以消息之间的关系〕3.去除掉不需要传递的局部〔把其他变量边际掉〕以上循环一定次数后,到达某种稳定状态。最终计算某个人对所有消息的看法Belief〔所有稳态输入消息δ乘以消息关系〕这种算法会和精确解法存在一定偏差,故此仅为一种近似算法。3.聚类图的性质不是随便一幅图都可以作为聚类图。聚类图有3个根本要素:1.每个势函数都被使用,且被使用一次。2.聚类图中消息传递不能形成环。3.每个消息如果存在两个知道的人,这两个人必须要有交流途径关于第一点,势函数描述了消息之间的关系,如果漏了,那么失去了消息之间的某个信息,如果重复使用,那么某种关系被多余的加强了。第二点那么比拟有意思,其实际上描述的是一个正反应的情况。假设有个人,编了一个谎话:明天会下雨。并且把这个谎话告诉了A,然后A又告诉B,B->C,C-D。如果恰好编这个谎话的人正好和D认识,又正好交流了明天是否会下雨的情况。那么就“谎话到最后自己都信了”。这就对“明天下雨”这个随机变量的概率产生较大的估计偏差。简而言之就是,消息不能成环。第三点要表达的是,如果甲乙两个人都知道一件事情A,那么他们一定要有交流途径,无论直接交流还是通过其他人转达,总之消息A一定要有在甲乙两人之间联通的路径。值得注意的一点是,明天下雨A和地上有水C之间可能存在较强的相关性,就算A没有形成环,却通过C形成了环,最终也会对结果产生较大影响。比方图中,xy强相关时,消息传递算法的表现并不好。有一种一定能够满足上诉性质的聚类图成为BetheClustersGraph。在使用消息传递算法时,优先考虑构造此聚类图。该聚类图中有两种不同的人,一种掌握多个消息,一种掌握单种消息。这样的聚类图一定不会存在环。其形式如下所示:4.传播算法的性质一群人交换意见,如果大家最后意见都相同了。比方甲乙都认为明天下雨的概率是0.6,乙丙都认为明天地上有水的概率是0.7.........这种情况称为聚类图校准了。公式表示,边际掉无关量,两个人对交流消息的看法是一致的。意见相同还有一个说法,就是交流过程稳定,也就是说,在经过无数次迭代后,消息收敛了。——————消息传递公式
————————δj-i与求和无关,因为不在求和域内,故可以乘出去。发现i,j是对称轮换的——————————最终得出收敛和校准是等价的——————————一种新的符号————
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T-ZJBS 001-2024 城市公共标识系统设计规范
- T-ZSA 230-2024 虚拟数字人多模态交互信息规范
- 二零二五年度荒山土地流转与林业碳汇项目合作合同
- 二零二五年度企业合规管理体系法律服务合同范本
- 二零二五年度离婚协议书模板及婚姻关系终止及财产分配
- 二零二五年度诊所医疗事故处理及责任划分合同
- 二零二五年度养老护理型住宅正规房屋出租合同
- 二零二五年度混凝土班组劳务合作施工安全责任合同
- 二零二五年度销售信息保密管理承诺书
- 2025年度耕地租赁与农业科技推广合同
- SCADA系统操作手册
- 渗透测试报告模版
- 老年人预防及控制养老院院内感染院内感染基本知识
- GB/T 10060-2023电梯安装验收规范
- TB编程从入门到进阶
- 教师沟通能力提升培训幼儿园家长沟通技巧教学课件
- 喀喇沁旗楼子店乡上烧锅白石矿石灰岩矿2022年度矿山地质环境治理计划书
- 第三单元名著导读《骆驼祥子》课件部编版语文七年级下册
- 高老师讲语文-灯笼-部编版
- 事业单位个人德能勤绩廉工作总结(2篇)
- 《英语词汇学》课程教学大纲
评论
0/150
提交评论