版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于AI技术的媒资内容管理平台语音识别需求书1年711月
文档信息产品名称项目需求确认书产品负责人徐志亮负责人联系方式22005899-51472文档修改记录版本修改时间修改人修改章节修改说明1.简介1.简介 错..误!未定义书签。2.产品需求TOC\o"1-5"\h\z\o"CurrentDocument"2.1、产品需求概述 4\o"CurrentDocument"2.1.1、视频预处理 5\o"CurrentDocument"2.1.2、语音识别文字输出 5\o"CurrentDocument"2.1.3高识别率 6\o"CurrentDocument"2.1.4支持多种音频格式 6\o"CurrentDocument"2.1.5多语言识别 6\o"CurrentDocument"2.1.5高识别效率 63.其他需求 错误!未定义书签。 6错误!未定义书签。错误!未定义书签。 6错误!未定义书签。3.2测试需求 3.3运维保障需求 1.简介1.1项.目背景随着计算机自动化技术的发展,语音识别、字幕识别、场景分割等技术已经日趋成熟,智能语义分析、智能素材关联、人脸识别技术也在迅速发展,日本等发达国家已实际应用。的自动编目可从语音识别和字幕识别入手,以新闻、戏曲类节目为切人点,在节目素材入库媒资时将语音和字幕自动进行文字化,减少编目人员工作量。之后,以自动场景分割技术为基础,结合智能语义分析,逐步对节目和素材实现全自动的标引,提高整个媒资编目的自动化率,降低媒资运营的人工成本。2.产品需求2.1、产品需求概述随着计算机自动化技术的发展,语音识别、字幕识别、场景分割等技术已经日趋成熟,智能语义分析、智能素材关联、人脸识别技术也在迅速发展,日本等发达国家已实际应用。可从语音识别入手,在节目素材入库媒资时将语音和字幕自动进行文字化。之后,以自动场景分割技术为基础,结合智能语义分析,逐步对节目和素材实现全自动的标引。该项目的目标是通过语音识别,对视频进行文字内容和关键词的提取,提取后的内容和关键词按照视频名称和视频时间信息进行存储,最终为用户提供文字内容和关键词的检索服务。2.1.1、视频预处理视频预处理主要实现对视频进行提取音频视频提取音频,从视频文件中提取音频文件,音频格式为(或)。2.1.2、语音识别文字输出自动识别音、视频(包括主流格式高、低码格式)中的语音,并将其识别为文本内容,并页面中展示。语音识别文本应包含时间戳,即表示在该段时间内音频的识别结果,语音识别的结果按照时间的顺序(入点时间,出点时间)在每个视频素材的详情页进行展示。语音识别文字输出应当为完整句子形式、词等,另外应具有智能的功能,例如,电话号码、车牌、日期、时间以及量词的规整,如“五点三十”会识别规整为“5:3”。0自动断句,并且在文本中加入标点如好,并且能够识别词属性,词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等2.1.3高识别率在音频中为标准普通话的情况下,语音识别率需要达到90%以上。若音频中为较为不标准普通话,则语音识别率可以稍微降低识别率要求。2.1.4支持多种音频格式语音识别应支持多种视频格式,例如wav,flac,opus,m4a,mp32.1.5多语言识别语音识别可能需要识别普通话,上海话,以及英语等,根据目前项目需求,至少需要能够识别普通话以及上海话,并且达到较好的识别效果。2.1.5高识别效率由于音频量大,所以需要高效率的语音识别软件。音频时长与识别时间的比要大于6:1。否则无法正常完成语音识别业务。3.其他需求3.1测试需求□兼容性测试□
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《6 人间彩虹-桥》(说课稿)-2023-2024学年四年级下册综合实践活动吉美版
- 自行车里的数学(说课稿)-2023-2024学年数学六年级下册人教版
- 7 不甘屈辱 奋勇抗争(说课稿)2023-2024学年统编版道德与法治五年级下册
- 公开课说课稿-光合作用的原理和应用说课稿
- 第6单元 单元分析2024-2025学年四年级语文上册说课稿(统编版)
- 二零二五年度文化创意产业园区入驻管理协议3篇
- 2025年房产贷款合同5篇
- 2025年沪教版二年级语文下册月考试卷含答案
- 2025年北师大新版八年级语文下册阶段测试试卷含答案
- 粤教版高中信息技术选修2说课稿-5.2.1 动画的分类-
- 2025年山东水发集团限公司社会招聘高频重点提升(共500题)附带答案详解
- JJG 1204-2025电子计价秤检定规程(试行)
- 2024年计算机二级WPS考试题库(共380题含答案)
- 《湖南省房屋建筑和市政工程消防质量控制技术标准》
- 中建集团面试自我介绍
- 《工业园区节水管理规范》
- 警校生职业生涯规划
- 意识障碍患者的护理诊断及措施
- 2025企业年会盛典
- 215kWh工商业液冷储能电池一体柜用户手册
- 场地平整施工组织设计-(3)模板
评论
0/150
提交评论