




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
NLP系列学习:前向算法和后向算法在上一篇文章里,我们简单的概述了隐马尔科夫模型的简单定义SEQUENCESEQUENCE8ENEMLGRAPHS8ENEMLSEQUENCESEQUENCE8ENEMLGRAPHS8ENEML在这一篇文章里,我们可以看到HMM经过发展之后是CRF产生的条件,因此我们需要学好隐马尔科夫模型.在这一部分,我比较推荐阅读宗成庆老师的<自然语言处理〉这本书,这一部分宗老师写的很不错,相关的资源在我之前的文章中已经上传,有兴趣的小伙伴可以阅读下.回到正题,说起HMM,我们知道他是一个产生型模型•这样我们可以把它看作为一个序列化判别器,比方说我们说一句话:上边是我们说的话,我们说一句话,其实就可以看作为一个状态序列,而下边对应的,我们其实就可以看作为一个判别器,假如我们把上边的说的话和下边的状态序列加上一个符号,如下图所示再去求再去求Si->Oj的概率,这样我们写成:朋P)这样我们就可以引申出隐马尔克夫模型的三大问题::估计问题:序列问题:训练问题或参数估计问题为了更加容易理解这三个问题,我发现之前有一个博客的掷骰子的例子很生动,便特地弓I用过来,方便自己理解:假设手里有三个不同的骰子。第一个骰子是我们平常见的骰子(称这个骰子为D6),6个面,每个面(1,2,3,4,5,6)出现的概率是1/6。第二个骰子是个四面体(称这个骰子为D4),每个面(1,2,3,4)出现的概率是1/4。第三个骰子有八个面(称这个骰子为D8),每个面(1,2,3,4,5,6,7,8)出现的概率是1/8。D6D40800000000现在我们开始掷骰子,我们先从三个骰子里挑一个,挑到每一个骰子的概率都是1/3。然后我们掷骰子,得到一个数字,1,2,3,4,5,6,7,8中的一个。不停的重复上述过程,我们会得到一串数字,每个数字都是1,2,3,4,5,6,7,8中的一个。例如我们可能得到这么一串数字(掷骰子10次):1635273524.那这时候我们就把这投掷出来的这些数字成为可见状态链,但是在隐马尔可夫模型中,我们丌仅仅有这么一串可见状态链,还有一串隐含状态链。在这个例子里,这串隐含状态链就是你用的骰子的序列•比如,隐含状态链有可能是:D6D8D8D6D4D8D6D6D4D8
ta卄駅可亠从一卜隐金仪息別卜*ta卄駅可亠从一卜隐金仪息別卜*卜陀就我邑m雄視I从一卩黒含瞋思列…+t呻見牡#帕樹山16含狀裁林关柔示意酣r\但是一般来说,我们用的马尔科夫链都是隐含状态链,因为隐含状态(骰子)之间存在转换概率(transitionprobability)。在我们这个例子里,D6的下—个状态是D4,D6,D8的概率都是1/3°D4,D8的下一个状态是D4,D6,D8的转换概率也都一样是1/3。这样设定是为了最开始容易说清楚,但是我们其实是可以随意设定转换概率的。比如,我们可以这样定义,D6后面不能接D4,D6后面是D6的概率是0.9,是D8的概率是0.1。这样就是一个新的HMM。同样的,尽管可见状态之间没有转换概率,但是隐含状态和可见状态之间有一个概率叫做输出概率(emissionprobability)。就我们的例子来说,六面骰(D6)产生1的输出概率是1/6。产生2,3,4,5,6的概率也都是1/6。我们同样可以对输出概率进行其他定义。比如我有一个被赌场动过手脚的六面骰子,掷出来是1的概率更大,是1/2,掷出来是2,3,4,5,6的概率是1/10。这时候我们再结合这个例子去理解并解决HMM中的三大问题就会容易许多了:第一个问题:我们知道骰子有几种(隐含状态数量),每种骰子是什么(转换概率),根据掷骰子掷出的结果(可见状态链),我想知道每次掷出来的都是哪种骰子(隐含状态链)。第二个问题:还是知道骰子有几种(隐含状态数量),每种骰子是什么(转换概率),根据掷骰子掷出的结果(可见状态链),我想知道掷出这个结果的概率.第三个问题:知道骰子有几种(隐含状态数量),但是并不知道每种骰子是什么(转换概率),观测到很多次掷骰子的结果(可见状态链),我想反推出每种骰子是什么(转换概率)。1:估计问题:在我们知道我们有几种筛子的时候,并且知道筛子是什么,并且已知结果,这时候我们再去推测是哪一种筛子就会容易很多,是可以通过穷举法进行解决的,说白话就是推测所有的隐含状态序列,并且再去计算所以的可能观测序列的概率,但是这样的方法也有问题,如果你的可能,就跟上边的三个筛子一样,还比较0K,因为你的概率还是很大,比较容易猜得对,但是你有100个长度的话,不说多了,每个长度上对应的隐含状态为2,这样你的时间复杂度就是0(2的100方),这个复杂度是很高的,尽管很简单,但是还是不实用的•就跟我们查找中的直接查找一样,尽管简单,但是实则更困难•这样的话,我们就采用了前向算法和后向算法来去计算这个问题.那下边我们就去推一下这个公式:首先,我们要假设一个变量at(i),这个变量的意义是说我们在t时刻(1a;(/)=P(()i02,qf=“)而我们接下来要做的是计算这个at(i),然后就可以根据at(i)来去计算在T时刻的概率,最后也就计算出P(O|u),这时候0是0-T时刻的概率,我们自然就可以计算出所有时刻的概率.在这里,我们要用归纳思想去计算在t+1时刻的at+1(i):
qP(()IG%31+1风心)yg(I)⑺知qP(()IG%31+1风心)yg(I)⑺知这时候我们通过一张图去直观的表示从倒j的状态转移过程:最终的计算得到的概率为:那后向算法其实就跟前向算法类似,过程图如下:那么由上述所知,前向和后向算法的时间复杂度均是0(N2T),这个相比起之前,已经优化了太多,其中N是隐藏状态的长度,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 环境设计写生课件
- 2025企业并购标准版合同
- 掌握宠物营养研究热点试题及答案
- 针灸-十四经穴、经外奇穴之穴位名称、定位及此法
- 武夷学院《临床药学英语》2023-2024学年第二学期期末试卷
- 白银希望职业技术学院《市场与品牌策略》2023-2024学年第二学期期末试卷
- 海南软件职业技术学院《跨文化社会研究方法》2023-2024学年第二学期期末试卷
- 江苏警官学院《小学语文课程标准与教材分析》2023-2024学年第二学期期末试卷
- 湖北师范大学《书法篆刻二》2023-2024学年第二学期期末试卷
- 广东文艺职业学院《当代西方行政改革问题研究》2023-2024学年第二学期期末试卷
- 拟行路难教学课件
- GB/T 3733.1-1983卡套式端直通管接头
- 软测量方法原理及实际应用-课件
- 车床教学讲解课件
- 政策目标确立和方案制定概述课件
- 六年级下册英语课件-Unit 4 Lesson 23 Good-bye-冀教版(共19张PPT)
- 张波-超高温陶瓷课件
- 特洛伊战争(英文版)
- DBJ04-T 410-2021城市停车场(库)设施配置标准
- 保洁岗位培训
- 丽声北极星自然拼读绘本第二级 Pad, Pad, Pad! 课件
评论
0/150
提交评论