听见智能会议系统建设施工方案设计(一体机)_第1页
听见智能会议系统建设施工方案设计(一体机)_第2页
听见智能会议系统建设施工方案设计(一体机)_第3页
听见智能会议系统建设施工方案设计(一体机)_第4页
听见智能会议系统建设施工方案设计(一体机)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

....22/2011/20听见智能会议系统建设方案XX听见科技20231名目11.1.12.建设内容及目标23.产品施工条件3464.1.64.2.软件具体配置7用户治理错误!未定义书签。音频采集处理错误!未定义书签。实时语音转写10历史语音转写10内容编辑11效果优化12内容展现13内容治理14.全文检索错误!未定义书签。15!未定义书签。!未定义书签。5161.建设背景

工程概述,海量语音的猎取和存储力量愈发强大,基于会议办公的实际场景,会存在需要大量的人力投入、工作效率质量和效果不高。因此,结合会议会务场景对语音技术的实际应用需求,开展了基于会议场景下的语音技术应用关键技术争论,突破语音合成、语音识别、语音转写等核心技术,提升语音技,切实提升日常会议办公的工作效率和效果。建设重要性SpeechRecognize技术,是让机器通过识别和理解过程使之听懂人类语言互的关键技术,目前已经在呼叫中心、电信全应用领域的深入应用,语音识别技术被业界权威人士誉为有可能引发人机界面,语音识别技语音识别技术所研发,可满足会议演讲、会进展实时文字转写的场景。此局部工程的实施主要解决会议记要整相关会议记要的整理工作,同时,每一个人的发言均可记录在纪要当中,可有效削减因不,提升纪要整理的效率。建设内容及目标本工程打算选取1个会议室分别部署单机版听见智能会议系统,进展基于会议场景,实现会议过程中音频实时转写成文字,关心会议记录人员进展纪要的整理与校正,实现快速成稿,在....18/2017/20整体上打造样板化智能语音转写会议室。产品施工条件如下:电源机柜要音频接麦克视频接求 口 风 口环

需配如需上高度:境 6U指 深度:标1.5KW500MM要 对应机求 柜托盘一个

频接口,支

置麦 屏,需克风供给投对每 屏接个说 口,支话人 持声音HDMI进展 或采集 VGA环境要求智能会议系统承受专业定制一体机的硬件形态,6U空间,安装于正常室外室内即可设备深度为500MM,系统本身局域网组建自带,网络带100M以上,主控PC需要连接局域网下使用,整套设备局域网下运行即可。同时需1.5KW电源。音视频需求该系统是基于音频根底上实现语音转写,麦克风等音响设备利用会议室现有环境。,需要现场音响音频供转写,同时设备接口支持卡侬公、大三芯〔6.5、双莲花输入。如有展板上屏需求,需要会议室内配有投影仪或者电视机,且具备VGA或者HDMI接口任意一种,展板通过连接投影仪或者电视机进展投屏展现。系统连线图,其形CCC认证和专业定制一体机+应用端主控电脑。一体式智能会议主机为讯飞听见专业定制设备,集成了包括效劳部件,用于部署引擎等核心力量软件,并供给,掌握会议的开头和完毕,供给软件各个功能的操,同时如需显示,一体机支持显示输出,主控电脑通过网线与一体机连接,整套产品即可使用。如下:参数说明:整机电源:AC100-240V700W;效劳器节点:XEON2.6G20M2023P8CORE,E5-2620V3*2;32GDDR4REG/ECC;接口2*千网口〔IntelI210AT,1*RS232,GPIO,Watch1*USB2.0+后置〔2*USB2.0/2*USB3.0;应用节点:CORE3.2G6M1151P4COREI5-6500;8GDDR4,2*千兆网口Intel82579V1*千兆网口〔Intel82579V,1*RS232,1*VGA,1*PS2,外接:DVI转HDMI;增益旋钮,XLR/6.3mm乐器输入并自带音量增益旋钮,6.3mm接头4个模拟输入<RCA接头>一组唱盘输入并内建RIAA等化放大及自带音量增益旋钮6个模拟输出<RCA接头>一个耳机接孔<6.3mm接头>并自带音量增益旋钮一个光纤数字输出/输入一个同轴数字输出/输入一组MIDII/O。产品连线说明:,只需要接通一根电,并通过一根网线连接主控,就可使用。5.系统概述

建设方案,实现在会议场景下的实时音频或录音采集,功能自动优化文字结果;同时,用户可以使蔽、转写文字实时直播等根本功能。性能参数系统关键性能指标如下:转写结果能够实时上屏展现;转写结果能够音字比照、编辑校正;话转写正确率≥90%;间≤5秒;转写效率指标:实时语音转写效率≤500毫秒。软件功能配置中文语音转写引擎听见智能会议系统需要解决语音转换成从“声音“到“文字“转换的技术,通过将人的语音直接转换成相应的文本语音识别技术的争论工作开头于上世纪五十年月。Bell试验室的争论人员利用模拟元器件提取了语音信号元音共振峰频率变化的信息,有史以来第一次实现了识别十个英文数字的语音识别系统-Audry系统。八十年月,Bell试验室的Rabiner等科学家将原本晦涩难懂的隐马尔科夫模型〔Hidden MarkovModel-HMM理论工程化,形成了较为完善的概率统计模型体系,识别性能也得到了很大的提高。20XX以来DeepLearning理论和技术成为了模式识别领域的一个热门争论方向,G.E.Hinton等深入争论了深度置信网络〔DeepBeliefNetwork-DBN以及深度神经网络〔DeepNeuralNetwork-DNN等模型构造,微软通过与Hinton合作领先将DNN应用于语音识别任务,识别性能取得了显著提升。此后谷歌、蒙特利尔,以及IBM又将循环神经网络〔Recurrent NeuralNetwok-RNN成功应用于语音识别领域,特别是长短时记忆〔Long-ShortTermMemory神经网络构造,取得格外精彩的语音识别性能。加上目前图形处理器〔GPU计算力量的提升,以及互联网时代大规模标注数据猎取成为可能,基于深度学习的语音识别技术已经在多个领域到达有用水平。传统的语音识别技术主要用于解决人与,听见智能会议系统需要基于机器语音识别技术,具体包括中文语音转写引擎与英文语音转写引擎,本系统需要完成中文语音转写引擎的建设。应用系统根本功能听见智能会议系统,可以实现在会议、教,功能自动优化文字结果,可人工进展角色分别;同时,用户可以使用全文检索功能便利检索历史音频。实时语音转写听见智能会议系统需要通过对实时音频,需要用特定的录音效劳,通过麦克风收集后,送达后台效劳端完成编码工作,实时上传到系统,,同时保存到内容治理模块中。系统通过专业麦克风对会议全程进展高保真录音,并针对连续中文语流进展实时语音转写识别,并持续进展转写结果文本内容的输出。历史语音转写,历史语音转写模块供给对于已经录制好的历史音频需要供给的功能按钮,导入历史音频并实现快速离线转写;支持音频批量导入。图:历史音频转写编辑效果图内容编辑在实时语音转写过程中用户可以实时对转写出的文本结果进展编辑,并进展重点内的策略,用户可以在查看到转写文本之后准时,比照修改,便利快捷,会议完毕后即可直接成稿,并依据重点内容,整理导出会议纪要。具体功能包括:,识别,即用户在看到转写文本的时候,同步听到对应的音频,使得校对和编辑更加便利。在实时语音转写过程中或者暂停和完毕时,用户均可以选中文原来进展重点内容的标记,已标记的文本也可以进展修改和标记取消,便利整理睬议纪要,会议完毕会后即可或直接成稿。,,对于文本内容不确定的状况下,双击原始结果即可听到文本对应的音频,便利用户对写结果进展编辑,尤其是不留神误删除了编辑文本,可以写完毕状态时,原始结果及编辑结果均可双击进展音频回听。图:实时语音转写效果图效果优化,听见智能会议系动优化文字转写和显示结果。具体包括:字的过程中,为了便利用户编辑何查看,系统供给依据VAD+固定字数和VAD+固定关认自动分段方式,用户也可依据实际状况进展设置。用户可以在实时语音转写开头前或者进展文稿整理时可以依据需要选择是否开启语气词过滤按钮,假设开启按钮可将语气词和多余的词汇去除,以保证文稿的,已经修改正的内容不支持过滤。用户可通过关键词优化功能,能有效中用户也可添加关键词,并且可以实时生效,后续识别结果可得到有效优化。内容展现语音转写结果的展现。具体功能包括:转写结果。并且,字体颜色和展板背景颜色可以依据实际状况需要进展调整。图:展板效果图用了实时上屏功能,期望保障上屏效果,那么可以使用上屏后台修改功能进展展板端的,调出展板,此时该展板端会同步消灭识别文字。假设在转写过程中消灭明显错误或不适宜展现的词语,则可以在主控端进展展板编辑,可以修改或删除,修改之后按Enter键则修改的内容会同步到现场的投影屏幕上。内容治理全部通过听见智能会议系统转写的实时录制的音频文本数据和本地上传的音频文,后台,整模块随时查看和编辑,并且可以依据名称等信息快速检索。此外,编辑后的全文本、重,用户都可以快速导出,便利快捷。分析技术理解用户意图,执行用户的检索指令〔包括语音、文本等,实现资源文本内容的语音搜寻效劳力量,不仅能检索文本资源,,不,也应当能够支持传统文字检索时的相对自由表述。硬件参数配置,具体脑。产品参数如下:名 参数配置 单称 位讯飞听见专业定制一体式智能会议主机,供给4U设备形态,集成了显示器、路由器等部件。效劳节点配置:2*E5-2620V3定 2.6GHZ/32G/900G*3 SAS制 10KRPM— +raid5/1*USBkey+3*USB2.0/100 1台体 0MNIC;机应用节点配置:Intel Corei5/8G/500G SATA7200RPM/VGA+HDMI\DVI\DP/3*USB2.0/1000MNIC;KVM掌握器:二路信号切换,支序号类别模块功能描述数量序号类别模块功能描述数量单价小计软件语音识识别转写引擎,实1套¥300,000.00¥300,000.0支持路由功能,供给三个连接外WAN口,1个加密狗。主华硕PRO453U。cpu:IntelCore控i5-6200U2.3GHz,内存:8G,1台电500GBSATA,显卡:2GB独显〔满脑足同等配置均可,主机承受专业定制一体机,依据每天八小时的应用数据进展估算,2年的数据存储,产品的容量空间可以通过历史会议备份。6. 工程报价别音的实时转写,并转供给对已转写文字别音的实时转写,并转供给对已转写文字写的后处理及字音同引步对齐力量。擎部署在主控笔记本应上的客户端软件,用供给实时速录、历终史录音整理、会议1端信息治理、用户管套软理、上屏展现、会件议编辑及效果优化等功能。一专业定制一体式会体议主机,集成效劳式硬KVM显示等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论