




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
CTCCTC概述01任务CTC使用方法02任务学习目标了解CTC的基本概念了解CTC的使用方法1CTC概述1CTC概述CTC(ConnectionistTemporalClassifier)联结时间分类器,是一种改进的RNN模型。它主要解决的是时序模型中,输入数大于输出数,输入输出如何对齐的问题。它由AlexGraves于2006年提出。由于文字的不同间隔或变形等问题,导致相同文字有不同的表现形式,但实际上都是同一个文字。比如图中,在识别时会将输入图像分块后再去识别,得出每块属于某个字符的概率(无法识别的标记为特殊字符“-”)。1CTC概述由于字符变形等原因,导致对输入图像分块识别时,相邻块可能会识别为相同结果,字符重复出现。因此,通过CTC来解决对齐问题。模型训练后,对结果中去掉间隔字符、去掉重复字符(如果相同字符连续出现,则表示只有1个字符,如果中间有间隔字符,则表示该字符出现多次)。可以把CTC理解为一种end-to-end(端到端)计算损失函数的方法,可以避开输入与输出手动对齐的一种方式,是非常适合语音识别或者OCR这种应用的。1CTC概述CTC本身是不需要对齐的,但是我们需要知道X
的输出路径和最终输出结果的对应关系,因为在CTC中,多个输出路径可能对应一个输出结果,举例来理解。例如在OCR的任务中,输入X是含有“CAT”的图片,输出Y是文本[C,A,T]。将X分割成若干个时间片,每个时间片得到一个输出,一个最简答的解决方案是合并连续重复出现的字母,如图:1CTC概述这个问题有两个缺点:(1)几乎不可能将X的每个时间片都和输出Y对应上,例如OCR中字符的间隔,语音识别中的停顿;(2)不能处理有连续重复字符出现的情况,例如单词“HELLO”,按照上面的算法,输出的是“HELO”而非“HELLO”。为了解决上面的问题,CTC引入了空白字符,例如OCR中的字符间距,语音识别中的停顿均表示为。所以,CTC的对齐涉及去除重复字母和去除两部分。
1CTC概述这种对齐方式有三个特征:(1)X与Y之间的时间片映射是单调的,即如果X向前移动一个时间片,Y保持不动或者也向前移动一个时间片;(2)X与Y之间的映射是多对一的,即多个输出可能对应一个映射,反之则不成立,所以也有了特征3;(3)X的长度大于等于Y的长度。2CTC使用方法2CTC使用方法在Keras中,通过以下函数计算ctc损失:importkeras.backendasKde
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络技术应用政策试题及答案
- 网络工程师测试技巧试题及答案
- 机械动力学基础知识试题及答案
- 网络工程师职业素养提升试题及答案
- 2024年信号处理架构试题及答案
- 主题班会秋游安全教育
- 网络工程师零基础学员指南试题及答案
- 酒店设施与设备管理试题及答案
- 劳保用品管理
- 网络工程师技术培训要点试题及答案
- 工程监理部人员分工与职责
- 课程设计 CA6140拨叉说明书
- 最新露天矿山安全培训课件(经典)
- 环境学概论 考验知识点归纳刘陪同
- 成语故事杞人忧天PPT教案
- 部编版三年级上册音乐知识点汇总
- 室内设计施工图详细说明及制图规范说明ppt(智囊书屋)
- 贵州水城矿业集团马场煤矿“3.12”煤与瓦斯突出事故分析(定)
- 生命体征的测量PPT幻灯片课件
- 吉林省吉林市高考报名登记表
- 剧本杀_剧本推荐——四人本《暗船》
评论
0/150
提交评论