版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
隐马尔可夫模型
隐马尔可夫模型
(HiddenMarkovModel,HMM)在MM中,每一个状态代表一个可观察的事件在HMM中观察到的事件是状态的随机函数,因此该模型是一双重随机过程,其中状态转移过程是不可观察(隐蔽)的(马尔可夫链),而可观察的事件的随机过程是隐蔽的状态转换过程的随机函数(一般随机过程)。HMM的三个假设对于一个随机事件,有一观察值序列:O=O1,O2,…OT该事件隐含着一个状态序列:Q=q1,q2,…qT。假设1:马尔可夫性假设(状态构成一阶马尔可夫链)
P(qi|qi-1…q1)=P(qi|qi-1)假设2:不动性假设(状态与具体时间无关)
P(qi+1|qi)=P(qj+1|qj),对任意i,j成立假设3:输出独立性假设(输出仅与当前状态有关)
p(O1,...,OT|q1,...,qT)=Πp(Ot|qt)HMM定义一个隐马尔可夫模型(HMM)是由一个五元组描述的:
λ=(N,M,A,B,π)其中:N={q1,...qN}:状态的有限集合M={v1,...,vM}:观察值的有限集合A={aij},aij=P(qt=Sj|qt-1=Si):状态转移概率矩阵B={bjk},bjk
=P(Ot=vk|qt=Sj):观察值概率分布矩阵π={πi},πi=P(q1=Si):初始状态概率分布观察序列产生步骤给定HMM模型λ=(A,B,π),则观察序列O=O1,O2,…OT
可由以下步骤产生:1.根据初始状态概率分布π=πi,选择一初始状态q1=Si;2.设t=1;3.根据状态Si的输出概率分布bjk,输出Ot=vk;4.根据状态转移概率分布aij,转移到新状态qt+1=Sj;5.设t=t+1,如果t<T,重复步骤3、4,否则结束。HMM的三个基本问题令λ
={π,A,B}为给定HMM的参数,令O=O1,...,OT为观察值序列,则有关于隐马尔可夫模型(HMM)的三个基本问题:1.评估问题:对于给定模型,求某个观察值序列的概率P(O|λ);2.解码问题:对于给定模型和观察值序列,求可能性最大的状态序列maxQ{P(Q|O,λ)};3.学习问题:对于给定的一个观察值序列O,调整参数λ,使得观察值出现的概率P(O|λ)最大。例:赌场的欺诈某赌场在掷骰子根据点数决定胜负时,暗中采取了如下作弊手段:在连续多次掷骰子的过程中,通常使用公平骰子AB0.90.1A,偶而混入一个灌铅骰子B.
0.80.2公平骰子灌铅骰子骰子A骰子B1点1/602点1/61/83点1/61/84点1/63/165点1/63/166点1/63/8公平骰子A与灌铅骰子B的区别:时间1234567骰子AAABAAA掷出点数3345162一次连续掷骰子的过程模拟
隐序列
明序列查封赌场后,调查人员发现了一些连续掷骰子的记录,其中有一个骰子掷出的点数记录如下:
124552646214614613613666166466163661636616361651561511514612356234
…问题1–评估问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题会出现这个点数记录的概率有多大?求P(O|λ)问题2–解码问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题点数序列中的哪些点数是用骰子B掷出的?求maxQ{P(Q|O,λ)}问题3–学习问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题作弊骰子掷出各点数的概率是怎样的?公平骰子掷出各点数的概率又是怎样的?赌场是何时换用骰子的?骰子B
本例中HMM的定义
赌场的例子中:隐状态集:S={骰子A,骰子B}明字符集:V={1,2,3,4,5,6}b21=0,b22=b23=1/8,b24=b25=3/16,b26=3/81/61/61/61/61/61/601/81/83/163/163/8初始状态概率:π1=1,π2=0隐状态转移概率:
a11=0.9,a12=0.1
a21=0.8,a22=0.2
初始状态明字符生成概率:
b11=b12=…=b16=1/61.00
1: 2: 3: 4: 5:骰子A6:
0.1
1: 2: 3: 4: 5: 6:0.80.90.2HMM将两个序列相联系起来:1.由离散隐状态组成的状态序列(路径)Q=(q1,…,qT),每个qt∈S均是一个状态由初始状态概率及状态转移概率(π,A)所决定2.由明字符组成的观察序列O=(o1,…,oT),每个ot∈V均为一个离散明字符由状态序列及各状态的明字符生成概率(Q,B)所决定赌场的例子中:隐状态明观察AAAABAAAAABAAAAAAAAAAAAAAAAAAAAAAABAABAAAAAAAAA…33454141553663441134625445334223332124225631341…q1q2q3q4qT...o1o2o3o4oT...观察序列O状态序列QHMMλ本例中三个基本问题1.评估问题•给定观察序列O和HMM
=(π,A,B),判断O是由产生出来的可能性有多大•计算骰子点数序列的确由“作弊”模型生成的可能性2.解码问题•给定观察序列O和HMMλ=(π,A,B),计算与序列O相对应的状态序列是什么•在骰子点数序列中,判断哪些点数是用骰子B掷出的3.学习问题•给定一系列观察序列样本,确定能够产生出这些序列的模型λ=(π,A,B)•如何从大量的点数序列样本中学习得出“作弊模型”的参数HMM的应用语音识别音字转换词性标注(POSTagging)基因识别问题
•状态:编码区域与非编码区域•字符:ATCG一般化:任何与线性序列相关的现象HMM的一些实际问题初始概率分布的选择
1.随机选择2.利用先验信息3.来自多序列比对的结果HMM的一些实际问题数值计算中的防溢出处理在前向算法、Viterbi算法以及Baum-Welch算法中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年注册会计师备考题库附答案【巩固】
- 2026年中级注册安全工程师考试题库300道及参考答案(达标题)
- 2026年县乡教师选调考试《教师职业道德》题库及参考答案【b卷】
- 乐乎入驻协议书
- 2026年心理咨询师考试题库300道附参考答案【完整版】
- 2026年心理咨询师考试题库300道及完整答案【典优】
- 2026年心理咨询师之心理咨询师基础知识考试题库完美版
- 云存储服务租赁协议2025年
- 2025 年高职服装设计(服装系列设计学)试题及答案
- 2025 年高职电子商务(电商策划)试题及答案
- 2025-2026学年上海市行知实验中学高二上册期中考试语文试题 含答案
- 2026年广东省佛山市六年级数学上册期末考试试卷及答案
- 2026届吉林省长春六中、八中、十一中等省重点中学高二生物第一学期期末联考试题含解析
- 2025年低压电工操作证理论全国考试题库(含答案)
- 2026届浙江省学军中学英语高三第一学期期末达标检测试题含解析
- 2025北京市公共资源交易中心招聘8人(公共基础知识)测试题带答案解析
- 工会女工培训课件
- 雨课堂学堂在线学堂云《临床伦理与科研道德(山东大学)》单元测试考核答案
- 2025新疆和田地区“才聚和田·智汇玉都”招才引智招聘工作人员204人(公共基础知识)综合能力测试题附答案解析
- 2026年医疗机构人力资源配置降本增效项目分析方案
- 消化内镜人工智能年度进展2026
评论
0/150
提交评论