




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、隐马尔科夫模型隐马尔科夫模型-孤立字语音识别孤立字语音识别1.马尔科夫链马尔科夫链2.马尔科夫模型马尔科夫模型3.隐马尔科夫模型隐马尔科夫模型4.孤立字语音识别孤立字语音识别1.1.马尔科夫链马尔科夫链设设S S是一个由有限个状态组成的集合。是一个由有限个状态组成的集合。 S=1, 2, 3, ,n-1, n S=1, 2, 3, ,n-1, n可以把马尔科夫链看做小球随时间在可以把马尔科夫链看做小球随时间在n n种种状态跳动的过程。状态跳动的过程。TS123n.0123t.11220011|,|ttttttttttP qi qi qiqiP qi qi由小球的跳动产生的状态序列由小球的跳动产
2、生的状态序列X X如果序列如果序列X X在在t t时刻处在状态时刻处在状态 ,若有,若有tq则随机序列则随机序列X X构成一个一阶马尔科夫链。构成一个一阶马尔科夫链。(Markov Chain)(Markov Chain)2.2.马尔科夫模型马尔科夫模型 一阶马尔科夫模型可以描述为一个二元一阶马尔科夫模型可以描述为一个二元组组( S, A ) ( S, A ) ,S S是状态的集合,而是状态的集合,而A A是所有是所有状态转移概率组成的一个状态转移概率组成的一个n n行行n n列的矩阵,其列的矩阵,其中每一个元素中每一个元素 为从状态为从状态i i转移到状态转移到状态j j的的概率。概率。ij
3、a一个马尔科夫模型的应用一个马尔科夫模型的应用天气预测:天气预测:我们假设天气只有我们假设天气只有3个状态个状态1(阴天阴天),2(多云多云),3(晴天晴天)对以往天气的观察我们已经统计出了状态转移矩阵。对以往天气的观察我们已经统计出了状态转移矩阵。阴天阴天晴天晴天多云多云0.30.20.60.40.30.10.20.80.10.40.30.30.20.60.20.10.10.8A假设我们今天是晴天,那么我们怎样预测假设我们今天是晴天,那么我们怎样预测明天的天气呢?明天的天气呢?因为晴天是因为晴天是3状态,多以我们只要找出矩阵状态,多以我们只要找出矩阵A中第三行的转移概率最大的那一列即可。中第
4、三行的转移概率最大的那一列即可。因为因为A的第三行第三列最大,也就是或如果的第三行第三列最大,也就是或如果今天是晴天则有今天是晴天则有0.8的概率明天仍然是晴天。的概率明天仍然是晴天。3.3.隐马尔科夫模型隐马尔科夫模型坛子与小球问题坛子与小球问题.12n坛子和小球的问题坛子和小球的问题n n个坛子代表马尔科夫模型的个坛子代表马尔科夫模型的n n个状态的,某人按照马尔科夫模型在个状态的,某人按照马尔科夫模型在n n个坛子个坛子中选择,这是一个马尔科夫过程,当他选择到中选择,这是一个马尔科夫过程,当他选择到一个坛子他就从坛子中取出一个小球,记录小一个坛子他就从坛子中取出一个小球,记录小球的颜色。
5、假设坛子中各种颜色的球的个数是球的颜色。假设坛子中各种颜色的球的个数是不一样的,所以他拿到每种颜色球的概率也是不一样的,所以他拿到每种颜色球的概率也是一个随机过程。这种双随机过程就是隐马尔科一个随机过程。这种双随机过程就是隐马尔科夫模型。夫模型。隐马尔可夫模型隐马尔可夫模型 可以表示为一个五元组可以表示为一个五元组( S, V, A, B, ) S 是一组状态的集合。是一组状态的集合。 S = 1, 2, 3, , N (状态状态n对应坛子对应坛子n) V 是一组输出符号组成的集合。是一组输出符号组成的集合。 V = ( 对应红色小球对应红色小球) A 是状态转移矩阵,是状态转移矩阵,N 行行
6、N 列。列。 A = = ,1 i, j N B 是输出符号的概率分布。是输出符号的概率分布。 B = 表示在状态表示在状态j时输出符号时输出符号 的概的概率率 = P( | j ), 1kM ,1jN 是初始状态概率分布是初始状态概率分布 = = P( = i ) 表示时刻表示时刻1选择某个状态的概率。选择某个状态的概率。ijaija1P|ttqj qi123v , ,Mv vv1vi1q jbk jb kkv jb kkvi 隐马尔可夫过程是一个双重随机过程,隐马尔可夫过程是一个双重随机过程,其中一重随机过程不能直接观察到,通过状其中一重随机过程不能直接观察到,通过状态转移概率矩阵描述。另
7、一重随机过程输出态转移概率矩阵描述。另一重随机过程输出可以观察的观察符号,这由输出概率来定义。可以观察的观察符号,这由输出概率来定义。 可以把隐马尔可夫模型看做符号序列的可以把隐马尔可夫模型看做符号序列的生成装置,按照一定的步骤,隐马尔可夫模生成装置,按照一定的步骤,隐马尔可夫模型可以生成下面的符号序列:型可以生成下面的符号序列:O= ( )= ( )123To ooo抛掷硬币问题抛掷硬币问题 三枚硬币,随机选择一枚,进行抛掷,记录抛掷三枚硬币,随机选择一枚,进行抛掷,记录抛掷结果。可以描述为一个三个状态的隐马尔科夫模型结果。可以描述为一个三个状态的隐马尔科夫模型 。 = (S, V, A,
8、B, ) = (S, V, A, B, ),其中,其中 S = 1, 2, 3 S = 1, 2, 3 V = H,T V = H,T = 1/3, 1/3, 1/3A12310.90.050.0520.450.10.4530.450.450.1B123H0.50.750.25T0.50.250.75问题一:问题一:给定上述模型,观察到下列抛掷结果的概率是给定上述模型,观察到下列抛掷结果的概率是多少?多少?O = (H H H H T H T T T T) = (H H H H T H T T T T)( (估算问题估算问题) () (另一种语言模型另一种语言模型) )问题二:问题二:给定上述
9、模型,若观察到上述抛掷结果,最可给定上述模型,若观察到上述抛掷结果,最可能的硬币选择序列能的硬币选择序列( (状态转换序列状态转换序列) )是什么?是什么?( (解码问题解码问题) )问题三:问题三:若上述模型中的状态转移矩阵若上述模型中的状态转移矩阵A A、状态输出概、状态输出概率率B B 和初始状态分布和初始状态分布 均未知,如何根据观察均未知,如何根据观察序列得到它们?序列得到它们?( (学习问题或训练问题学习问题或训练问题) )隐马尔科夫模型的三大问题隐马尔科夫模型的三大问题第1帧4.孤立字语音识别孤立字语音识别4.1特征提取特征提取第2帧第3帧第4帧第5帧每一帧我们可以取每一帧我们可
10、以取24维特征矢量来表示,这相当维特征矢量来表示,这相当于隐马尔科夫模型中的观察序列。但唯一的问题于隐马尔科夫模型中的观察序列。但唯一的问题是拿小球坛子问题来说就是它的小球种类是无数是拿小球坛子问题来说就是它的小球种类是无数种,因为是种,因为是24维矢量。所以我们要把这些无数种维矢量。所以我们要把这些无数种的矢量归类,这就是矢量量化过程。的矢量归类,这就是矢量量化过程。举例举例:以二维矢量为例以二维矢量为例所有可能的二维矢量就构成了一个平面。所有可能的二维矢量就构成了一个平面。第第i i个二维矢量记为:个二维矢量记为: Xi=xi1,xi2 Xi=xi1,xi2。先把这个平。先把这个平面划分成
11、面划分成J J块互不相交的子区域,从每个子区域中块互不相交的子区域,从每个子区域中找出一个代表矢量。如找出一个代表矢量。如J=7J=7。矢量量化的基本原理矢量量化的基本原理矢量空间的划分矢量空间的划分Y Y1 1Y Y2 2Y Y3 3Y Y4 4Y Y5 5Y Y6 6Y Y7 7x1x2码本码本 Y=YY=Y1 1,Y,Y2 2,Y,YJ J 码本长度码本长度 J=7J=7码字码字 Y Yj j=x=xj1j1,x,xj2j2 ,j=1,2,Jj=1,2,J矢量量化的基本原理矢量量化的基本原理矢量空间的划分矢量空间的划分按照上面的原理把按照上面的原理把2424维的语音特征归类维的语音特征归
12、类到码本中,语音识别的码本一般选到码本中,语音识别的码本一般选64,64,128128,或,或256256。观察序列就产生了观察序列就产生了这里的这里的T T就是孤立字语音分割出来的帧数就是孤立字语音分割出来的帧数, ,O是码本中的码字是码本中的码字构造隐马尔科夫模型构造隐马尔科夫模型(S, V, A, B, )(S, V, A, B, )其中其中A A的状态数的状态数N N一般选在一般选在3-83-8之间效果最好,之间效果最好,V V的大小就是码本长度,它的值就是码字。的大小就是码本长度,它的值就是码字。123To o oo4.24.2形成隐马尔科夫模型形成隐马尔科夫模型设设 = =(A A,B B, ),构造好模型),构造好模型训练训练 的值使的值使P(P(O| )| )最大。最大。储存每个孤立字训练出来的储存每个孤立字训练出来的 和该和该对应的字对应的字
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预防直肠癌的全面指南
- 学习笔记历史(部编版)选择性必修三专项配套练习第五单元 第12课 近代战争与西方文化的扩张含答案或解析
- 上饶农村拆迁合同范例
- 双碳知识科普
- 2025办公室租赁合同模板新版
- 交电设备运输合同范例
- 三轮汽车采购合同标准文本
- 入股店面合同范例
- 19类合同标准文本
- 化工企业劳务合同范例
- 初中同学聚会方案及流程
- 单位廉政风险防控自查表
- 驾校教练员脱岗培训
- COPD的管理 COPD的护理
- 2018版《石油化工工程建设设计概算编制办法》
- GB/T 6892-2006一般工业用铝及铝合金挤压型材
- DB42T1786.3-2023生猪疫病防控技术 第3部分-非洲猪瘟监测样品采集技术规程
- 《人脸识别的法律学问题研究开题报告(含提纲)》
- 部编版三年级下册道德与法治全册课件
- 第一章(诱发电位概论)-第二章(体感诱发电位)课件
- 燃煤锅炉改造生物质锅炉方案设计
评论
0/150
提交评论