ML-4-1 期望最大算法

上传人：r*** IP属地：贵州上传时间：2020-07-05 格式：PPT 页数：54 大小：1.77MB 积分：25 举报 版权申诉

已阅读5页，还剩49页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1,机器学习,图像中心,第3章期望最大算法,2,内容提要,一、期望最大(Expectation Maximization, EM) 算法及应用二、GMM及其应用,3,一、EM算法及应用,1 最大似然估计(Maximization Likelihood),设总体的密度函数是参数或参数向量，是该总体的样本，对给定的一组观测值，其联合密度是的函数，又称似然函数，记为：,4,其中为参数集，若存在使就称是的最大似然估计值，而是的最大似然估计量。,求最大似然估计法的步骤,第一步:写出似然函数 ; 计算 ; 第二步:如果似然函数关于参数是可微的,求 ; 第三步:解方程 , 从中得到

2、使取得极大值的 , 就是参数的最大似然估计量.,5,6,解方程,得到,7,Problem 1,Fitting points to one line,Solution: LSE,Fitting points to two lines,How to determine which line generates each point? Solution: ?,2 实际问题,8,Problem 2: Parameter Estimation for Mixture Models,Single Gaussian,Solution: MLE by maximizing,9,Multiple Gauss

3、ians,Which component does each point belong to? Solution: ?,10,Incompleteness Analytically hard,Common Feature,Likelihood of parameter given data X: Maximize expectation of L by “tweaking” ,11,Common Feature - Incompleteness,Not Known,A paradox: Interdependency between hidden values and parameters g

4、overning the distribution,12,A more general problem: estimating the parameters of a p.d.f.,No direct access to the needed data (missed) Outcome is an accumulation of simpler outcomes(grouped) The number of underlying data is unknown (truncated),13,A.P.Dempster, et al 1977: “Maximum likelihood from i

5、ncomplete data via the EM algorithm” General statement of the algorithm Prove convergence Coin the term ”EM algorithm”,2 EM Algorithm Creative work,14,在许多实际的学习问题框架中，相关实例特征中只有一部分可观察到已有许多方法被提出来处理存在未观察到变量的问题比如，如果某些变量有时能观察到，有时不能，那么可以用观察到该变量的实例去预测未观察到的实例中的变量的值 EM算法是存在隐含变量时广泛使用的一种学习方法，可用于变量的值从来没有被直接观察到的

6、情形，只要这些变量所遵循的概率分布的一般形式已知用于GMM的训练用于马尔可夫模型的训练,15,Stochastically independent Bayes rule Logarithm Expectation,Review,16,Maximize expectation of L by tweaking : Analytically hard,Idea：,Introduce nonexistent data Y Incomplete data X Stochastically independent Y Complete data Z := (X, Y) - Easier!,17,So

7、lution ： Introducing additional variables to make it complete,Z=(X,Y),Incomplete data likelihood,Complete data likelihood,18,Define,19,Initialize with random/guess, set n=1 E-step: use current parameters to estimate M-step: compute maximum likelihood estimation of using set n = n+1 repeat until conv

8、ergence,EM Algorithm步骤,20,Solution to Line Fitting,Parameters: = a1, b1, a2, b2,Posterior Probability:,where, l=1,2,21,Expectation:,Maximization: Taking the derivative of Q with respect to al, bl and setting the result to zero, we obtain,Where l=1,2,22,Solution to Mixture Modelling,Parameters:,Poste

9、rior Probability:,where,is a single Gaussian,centered at i with covariance matrixi ai is the mixing weight, i=1,2,M,23,Expectation:,Maximization:,Taking the derivative of Q with respect to al, ul and and setting the result to zero, we obtain the following update rules,24,4 EM Algorithm应用举例,例1,假设我们观察

10、到随机序列,求：,（这里用EM算法来求解该问题，当然，也可以用优化算法如Newtons method.）,25,对数似然函数为：,引入辅助变量,26,X是完整的随机序列，Y是观察到的随机序列。则，完整的随机序列的对数似然函数为：,27,E Step:,注：,28,M Step:,29,EM Iteration Results:,Iteration,Theta,Error,1 2 3 4 5 6 7 8 9 10 11,0.6082474 0.624321 0.6264889 0.6267773 0.6268156 0.6268207 0.6268214 0.6268215 0.6268215

11、 0.6268215 0.6268215,0.1082474 0.01607363 0.002167829 0.0002884433 3.830976e-05 5.086909e-06 6.754367e-07 8.968368e-08 1.190809e-08 1.581141e-09 2.099418e-10,30,例2,现在有来自一个概率分布的一些样本,需要使用这些样本来估计概率密度函数。,我们使用高斯混合模型来近似表示该概率密度函数,其中，是均值和协方差阵分别为,，,的正态分布。,31,（1）假设所有中的均可表示为如下形式：,则，可表示为：,求偏导数：,32,最大似然函数的

12、对数为：,33,其中,34,由,可得,（a）,（b）,35,在,的条件下，估计,需用拉格朗日乘子法,由,可得,36,对于j1,m将各式相加，得：,由,可得,带入上式可得,（c）,37,EM Iteration :,设定一个起始参数值（j=1,m（可用K-means方法设定一个较好的起始参数值）使用起始参数计算利用公式（a）（b）（c）来计算令若小于某一個极小的容忍值，则停止。否则令并跳回步骤2。,38,（2）中的不能表示为形式,推导公式类似(1),请自己推导!,39,5 Generalized EM,Assume and function are differentiabl

13、e in .The EM likelihood converges to a point where GEM: Instead of setting (n) = argmax Q (, (n-1) Just find (n) such that Q (, (n) Q (, (n-1) GEM also is guaranteed to converge,40,J.Bilmes, A Gentle Tutorial of the EM algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hi

14、dden Markov Models. TR-CS-Berkeley, 1998 A.Dempster, Laird, Rubin. Maximum Likelihood from Incomplete Data via the EM Algorithm. Journal of the Royal Statistical Society, 1977 Neal, Hinton. A view of the EM Algorithm that Justifies Incremental, Sparse and other Variants. Learning in Graphical Models

15、,1998 A.Moore, Very Fast Mixture Model based Clustering using Multi-resolution k-d trees. NIPS 1999 N.Friedman, The Bayesian Structural EM Algorithm. UAI 1998 Belongie et.al, Color- and Texture-Based Image Segmentation Using EM and Its Application to Content-Based Image Retrieval, ICCV 98,Recommende

16、d Further Readings,41,三、GMM及其应用,1 基于GMMs的简单图像分割方法,基本思想：把图像象素的R、G、B颜色分量分别看作两个高斯模型的混叠，利用整个图像颜色信息通过EM算法分别求出对应于每一颜色分量的两个高斯模型的参数，根据所得高斯模型，即可将所有象素的每一颜色分量分成两类，并分别赋以对应高斯模型的平均值。由于每个颜色分量都可分成两类，则所有象素可分成8类。上述过程已将8类象素赋予不同的值，从而将整幅图分割成8个区域。,42,43,2 Skin color segmentation,Yang, Ahuja 1999: GMMs for Human Skin Col

17、or ,44,Zhu, Yang, Waibel 2000: Segmenting Hands of Arbitrary Color,45,不同人种皮肤颜色分布图,感知均衡色彩系统(Perceptually uniform Color System) RGB-UCS：http:/www.wakayama-u.ac.jp/chen/ucs.html,46,Gaussian肤色模型,47,3 自动语言识别这方面的工作可参见MIT的lincoln实验室的最新进展，网址是：/,4 人脸识别人脸识别算法的主要挑战来自于当被识别者改变姿势时，脸的特征也相应改变，

18、这个问题的一个解决办法就是预先建立由所有头部位置决定的脸部图象的相关模型。但是，在一个自由的场合，预先设定所有的头部位置是不太可能的，例如在一个会议室里，可以利用GMM来对人脸进行特征描述, 从而进一步发展新的算法。,48,作业：题目：基于有限混合高斯模型的图像分割,算法说明、流程请参考本次课讲义、参考实验报告及程序。,要求：用C+ 编程实现该算法。可以2个同学一组，讨论完成作业。,（在研读相关论文基础上，至少实现一种改进的EM算法。）,49,图像建模方法统计建模,图像可以当作二维随机过程(随机场)中的一个样本来分析。在某些场合下，用确定的表示法来描述图像是很困难的，然而却可用图像的平均特性方便地加以描述。图像的灰度强度函数F(x,y)可以看作图像平面上的二维随机变量。这个随机变量在一定范围内的分布规律，就体现了图像在一定范围内的相对宏观的平均特性。通常，对于图像中不同的区域来说，这个随机变量具有不同的统计规律,50,统计建模,时空域统计建模,变换域统计建模,对变换系数的统计建模：小波系数的统计建模,（如小波系数尺度间、尺度内、方向间的相关性等）,51,由于一般正交小波变换不具有平移不变性和方向较少的特点，基于这些不足，现在的发展是在其他变换域内建立模型，如（冗余小波变换，复小波变换，脊波，曲波等）,5

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

ML-4-1 期望最大算法

文档简介

温馨提示

最新文档

评论

ML-4-1 期望最大算法

文档简介

温馨提示

最新文档

评论

相关文档