版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、受限玻尔兹曼机陈文根2016-6-12河南工业大学目录一玻尔兹曼机(BM)Ising模型能量函数二受限玻尔兹曼机(RBM)结构玻尔兹曼机(BM)Ising模型 Ising模型是统计物理中迄今为止唯一的一个同时具备:表述简单、内涵丰富、应用广泛这三种优点的模型。 Ising模型最早的提出者是Wilhelm Lenz (1920)。后来,他让他的学生Ernst Ising对一维的Ising模型进行求解,但是并没有发现相变现象,因此也没有得到更多物理学家的关注。随后,著名的统计物理学家Lars Onsager于1944年对二维的Ising模型进行了解析求解,并同时发现了二维Ising模型中的相变现象
2、,从而引起了更多学者的注意.玻尔兹曼机模型表述 考虑一个如左图所示的晶格世界。假设第个i节点是一个小磁针,每个小磁针有上下两种状态,我们用si来表示这个状态,并且si=1,-1。 表示磁针朝上或者朝下。网格上相邻的两个小磁针可以发生相互作用。i i i玻尔兹曼机能量函数 我们可以通过总能量的概念来刻画这种相互作用:即如果两个相邻方格的小磁针状态一致(例如都是朝上),则系统的总能量减1单位,否则如果不同就加1单位。外界还可能存在磁场,如果小磁针方向与外场方向一致,则能量也会降低。我们定义总能量: 其中J为一个能量耦合常数,Esi表示系统处于状态组合si下的总能量。求和下标表示对所有相邻的两个小磁
3、针进行求和。我们看到,如果si=sj,则总能量就会减少J。H表示外界磁场的强度,它是一个参数,如果外界磁场向上H为正,否则为负。如果某个小磁针的方向与外场一致,则总能量减少一个单位。sse NiijijissHssJEi,玻尔兹曼机玻尔兹曼机简介 BM的原理起源于统计物理学,是一种基于能量函数的建模方法,能够描述变量之间的高阶相互作用,BM的学习算法较复杂,但所建模型和学习算法有比较完备的物理解释和严格的数理统计理论作基础。BM是一种对称耦合的随机反馈型二值单元神经网络,由可见层和多个隐层组成,网络节点分为可见单元(visible unit)和隐单元(hidden unit),用可见单元和隐单
4、元来表达随机网络与随机环境的学习模型,通过权值表达单元之间的相关性。玻尔兹曼机 玻尔兹曼机简介(续) BM是由Hinton和Sejnowski提出的一种随机递归神经网络,可以看做是一种随机生成的Hopfield网络,是能够通过学习数据的固有内在表示解决困难学习问题的最早的人工神经网络之一,因样本分布遵循玻尔兹曼分布而命名为BM。BM由二值神经元构成,每个神经元只取1或0这两种状态,状态1代表该神经元处于接通状态,状态0代表该神经元处于断开状态。玻尔兹曼机结构能量函数定义为:根据规则,如果与神经元i相邻的所有神经元都激活,并且它们的连接权重为正的话,那么该神经元就有可能被激活。这就相当于最小化一
5、个全局的能量函数。受限玻尔兹曼机(RBM)简介 Smolensky提出的RBM由一个可见神经元层和一个隐神经元层组成,由于隐层神经元之间没有相互连接并且隐层神经元独立于给定的训练样本,这使直接计算依赖数据的期望值变得容易,可见层神经元之间也没有相互连接,通过从训练样本得到的隐层神经元状态上执行马尔可夫链抽样过程,来估计独立于数据的期望值,并行交替更新所有可见层神经元和隐层神经元的值。受限玻尔兹曼机结构RBM网络结构有网络结构有m个可视节点和个可视节点和n个隐藏节点个隐藏节点 受限玻尔兹曼机结构(续) RBM网络有几个参数,一个是可视层与隐藏层之间的权重矩阵Wnm,一个是可视节点的偏移量b=(b
6、1,b2 bn),一个是隐藏节点的偏移量c=(c1,c2 cm),这几个参数决定了RBM网络将一个n维的样本编码成一个什么样的m维的样本。 首先为了描述容易,先假设每个节点取值都在集合0,1中,即i,j,vi 0,1,j 0,1 。 一个训练样本x过来了取值为x=(x1,x2 xn),根据RBM网络,可以得到这个样本的m维的编码后的样本y=(y1,y2 ym),这m维的编码也可以认为是抽取了m个特征的样本。受限玻尔兹曼机结构(续)隐藏节点的第j个特征的取值为1的概率为其中的v取值就是x,hj的取值就是yj。且,)()1(1jinijijcvwvhp受限玻尔兹曼机结构(续) 生成yj的过程就是:
7、1.先利用公式 根据x的值计算概率p(hj=1|v),其中vi的取值就是xi的值。2.然后产生一个0到1之间的随机数,如果它小于p(hj=1|v) , yj的取值就是1,否则就是0。 反过来,现在知道了一个编码后的样本y,想要知道原来的样本x,即解码过程,跟上面也是同理,过程如下:1.先利用公式 根据y的值计算概率p(hj=1|v),其中hj的取值就是yj的值。2.然后产生一个0到1之间的随机数,如果它小于p(vi=1|h),hi的取值就是1,否则就是0。)()1(1jinijijcvwvhp)()1(1ijmjjiibhwhvp受限玻尔兹曼机RBM的基本模型 RBM也可以被视为一个无向图模型。v 为可见层,用于表示观测数据,h 为隐层,可视为一些特征提取器,W 为两层之间的连接权重。 对于一组给定的状态(v; h), RBM作为一个系统所具备的能量定义为受限玻尔兹曼机当参数确定时,基于该能量函数,我们可以得到(v; h)的联合概率分布:对于一个实际问题,我们最关心的是由RBM所定义的关于观测数据v的分布,即联合概率分布的边际分布,也称为似然函数:受限玻尔兹曼机由RBM的特殊
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论