云知声-语音解决方案

上传人：玲*** IP属地：江西上传时间：2025-02-03 格式：PPTX 页数：35 大小：7.86MB 积分：12 举报 版权申诉

已阅读5页，还剩30页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

云知声智能语音交互应用

321云知声公司简介声纹识别技术介绍语音识别技术介绍语音识别技术介绍1.技术领先2.持续学习3.私有部署国内首批公共语音云服务提供商（2012年9月）国内首家基于深度神经网络（DNN）的语音云服务（2013年1月）业界最高的语音识别准确率（>96%）业界最快的语音识别响应速度（<0.15倍实时）业界最经济高效的服务支持能力（单台服务器支持>80路并发转写）领先而极具特点的语音技术4语音合成具有极高自然度与可懂度的中英文语音合成技术。超过30个领域的自然语言理解技术，让机器理解人说的话。语义理解（NLU）语音识别与转写国际领先的中文语音识别与转写技术，包括基于服务器的在线识别以及基于终端设备的离线识别。完全自有知识产权完善的技术图谱5抗噪特征提取精准数据建模高效识别引擎独创的语音增强、信道及说话人规整技术，有效抑制环境噪声干扰，极大地提高了语音识别在各种复杂环境下的准确率。高效的数据利用效率：为达到相同识别率，只需要使用业界平均水平的1/3的训练数据量。业内最高效的识别引擎，在具备高精度识别性能前提下，识别速度是同类产品的三倍以上。三大技术创新针对移动互联环境下语音识别技术所面临的问题，不断进行技术改进，用最少的训练样本达到业内最佳的识别精度以及最高效的识别速度（领先对手三倍）。6部署方式私有云公有云PC端移动端一套私有云支持多种客户端应用声纹识别技术1.声纹识别介绍2.支持多个平台3.参与测评语音检测噪声抑制特征提取声纹模型声纹匹配声纹注册声纹确认/辨认相似度得分通过人不同的声纹鉴别人的身份，实现账号登录声纹识别技术对比文本无关文本相关语音内容注册、识别语音内容不受限制注册、识别语音内容相同语音长度为保证性能，一般要求注册不少于30s，测试不少于10s较短，2s~5s即可应用场景远程后台监控，海量数据搜索声纹密码声纹识别按照文本内容是否受限制，分为两类：声纹识别分类支持平台NIST全球话者识别评测美国国家标准技术署（NIST）举办着多项计算机领域的最高水平评测项目，几乎每一项都代表着该领域的世界顶尖水平。声纹识别评测（SpeakerRecognitionEvaluation，SRE），是NIST正在进行的评测项目中历史最悠久，参加单位最多，重要性最高的项目之一。是全球影响力最大的、最权威的声纹识别技术评测，是对全球相关研究机构学术及技术水平的一次公开公平的检验。历届参赛单位摘要几十家国内外著名高校、研究所、公司，如麻省理工学院（MIT）、卡耐基梅陇大学（CMU）、斯坦福（Stanford）、IBM、微软、摩托罗拉、PerSay，清华、中科院声学所、中国科大、LPT(意大利Loquendo公司)、CRIM、Brno(布尔诺科技大学)等。团队历届成绩一览NIST声纹识别评测始于1996年，我们团队自2002年起（国内最早）第一次参加NIST评测开始，一直积极参加声纹识别评测，与国内外顶尖的高校、科研机构、公司交流学习。比赛成绩一直在国内保持第一，国际上也处于领先水平。2002、2008、2010年和2012年，获多项全球第一。年份成绩2002第一次参加就获得第一（金星奖）20042项第一、4项第二20052项第一、2项第二2008总名次第一2010总名次第一2012总名次第一NISTSRE08纵轴指标越低越好我们团队MITPersay斯坦福中科院自动化所IBM清华大学NIST10参赛单位数量和质量均创历史之最。国内外报名单位达五十多家，如斯坦福、麻省理工学院、IBM、香港中文大学、意大利都灵理工大学、科大讯飞、清华、中科院声学所、卡耐基梅陇大学等。所有参赛单位共提交了109个系统。历届评测活动中数据规模最大、信道交叉种类最多，难度最高。斯坦福MIT中科院声学所CRIM清华大学香港中文大学我们团队NISTSRE10

单位名称子任务1子任务2子任务3子任务4子任务5子任务6子任务7子任务8我们团队第一名第一名第一名第2名第4名第6名第一名第一名斯坦福97511128意大利都灵理工大学26652833MIT电脑及人工智能实验室23133323971517美国马里兰大学1611131320152522中科院声学所363782910142221香港中文大学313317731262015IBM研究中心34322357163840清华大学电子工程系3741463637233535浙江大学计算机学院4444404442414141云知声声纹识别最新性能相比2010年系统加入最新的噪声抑制和VAD算法加入最新的模型构建及失配补偿技术iVector+lengthNormalization+Variance-SpectraNormalization+PLDANIST2010core-extenddet5（tel）NISTSRE12官方结果斯坦福我们团队cogent清华3浙大中科院声学所Nuance+LPT清华1讯飞腾讯清华2IBM香港理工清华深圳研究院云知声公司介绍1.成长最快的语音企业2.完整的产品体系

3.卓越的技术研发和创新能力专注于语音交互所有技术、产品与服务均围绕着语音识别与语音交互，是最专业的语音交互技术服务提供商。依托于移动互联网，了解用户通过智能语音云对用户极为了解，包括用户的口音、性别、说话习惯、使用环境等。等。打破垄断、高速发展云知声成立不到两年，被誉为行业鲶鱼，打破垄断格局，高速发展，合作伙伴超过6000家。最专业的语音交互服务提供商云知声成立于2012年6月29日。总部位于北京，在上海、深圳设有分公司和办事处。目前云知声已推出了一系列语音识别服务中间件和语音识别服务云平台，广泛应用在移动互联网、智能家电、可穿戴设备、车载导航、医疗、教育、呼叫中心等领域，为企业和用户提供专业的语音识别服务。21云知声人是一支多元化的团队，年轻富有活力。基础研发工程师80%拥有博士学位，多人具有超过十年的研发和应用经验。产品和市场运营人员来自国内外知名互联网企业。公司成立不到500天，完成1亿人民币的A轮融资。云知声语音云已有超8000家合作伙伴，覆盖互联网、智能家电、车载导航、智能穿戴、在线教育、智能客服、智能芯片等众多领域。领先的识别性能、稳定的识别服务、便捷的技术支持、快速增长的合作伙伴。云知声和您一起共赢。实力雄厚，发展迅速多元化团队1亿8000家22专业所有技术、产品与服务均围绕着语音识别与语音交互，是最专业的语音交互技术服务提供商创新开放共赢依托于移动互联网，模式创新不限领域、不限形态、不限商业模式和合作伙伴一起，携手共赢23超大用户容量支持亿级用户规模亿级平台健壮稳定>99.99%服务可用性>99.99%快速响应3G/WIFI下平均响应100ms<100ms语音识别占用极低流量<2KB/s<2KB/s语音平台性能卓越通用汽车以上展示仅为部分成功案例

传统企业智能终端移动互联网

移动

应用基于语音云的示例应用——云知声语音输入法应用场景：移动互联网-智能语音输入软件功能特点：语音识别准：平均准确率超过95%；离线语音识别：信号不好或无网络时用户可自由切换到离线识别，有较高的识别率保证；支持多语种：可识别普通话、英语、粤语三种语言；识别反应快：Wi-Fi或3G下几乎实时返回识别结果；语音输入快：每分钟轻松输入200-300字，非语音输入方式望尘莫及；不怕有口音：完美识别标准普通话及有口音的普通话；超省流量：输入100字只需要20-40kB流量，1M流量可输入2500字；自动加标点：智能引擎根据用户输入内容为用户添加必要的标点符号；扫码即刻下载使用26

移动

应用联想乐云记事应用场景：移动互联网-智能云笔记软件功能描述：乐云记事是联想推出的万能记事本。结合文字、拍照、录音等，全方位记录您的生活、工作或学习。语音自动识别成文字，让手机听懂你，化身小助理。记录安全保存云端，手机、电脑一样看。应用特点：云知声为乐云记事提供智能语音解决方案。颠覆以往云记录应用的录音功能，录音的同时即可转为文字，语义识别，识别用户想做的事，自动设为代办事项，并进行提醒。扫码即刻下载使用27

移动

应用杏树林-病历夹应用场景：智能医疗、电子病历功能描述：能有效帮助医生快速记录病历，把医生朋友从“病历海”中解放出来，有更多的时间和精力用于问诊和学习节省宝贵的人力成本，提高生产力。应用特点：云知声研发的国内医学领域首个语音识别引擎针对医学数据库(数百万的医学专有名词、数千小时的语料积累、极其复杂的中英文混合表述方式)做了大量模型优化对医学专业内容的一次性识别率达到93%，同时辅以云端语义校正技术，整体识别率接近100%扫码即刻下载使用28

智能

电视乐视超级电视应用场景：智能电视、电视盒子，颠覆你的客厅功能描述：通过超级遥控器的语音功能，让你无需动手也能遥控电视。海量视频，抛开复杂拼音输入，所说即所得。更多功能随心语控，轻松换台、调节音量、看节目单、了解天气、查看股票，只动嘴、无需动手。应用特点：云知声和你一起拥抱智能化、信息化、智慧化的家电时代颠覆了传统操作体验，真正把互联网和智能语音“植入”进电视里完美支持iPhone，Android手机与电视连接，任何空闲时间、任何地点都可以追剧。29

智能

电视乐视语音助手应用场景：智能电视、电视盒子，颠覆你的客厅功能描述：电视也能玩Siri!智能语音输入，无需动手也能操控超级电视。电视上也能通过语音发微博、查股票、搜影视、调音量、看节目、查天气。应用特点：对电视进行常用的操作，无论上网与否都能实现语音控制。30智能车载通用汽车应用场景：智能车载功能描述：NGI车载平台基于WIFI热点向用户提供互联网服务。应用特点：云知声为NGI车载平台所有智能应用提供语音交互支持提供语音识别及语音合成两套方案基于WebService提供服务，系统集成及其简单提供灵活及高效率的语音压缩及传输方案31智能车载奔腾ARS车载智能终端应用场景：智能车载功能描述：导航相关：“我要去陆家嘴”，“我要找最近的加油站”生活信息服务

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

云知声-语音解决方案

文档简介

温馨提示

最新文档

评论

云知声-语音解决方案

文档简介

温馨提示

最新文档

评论

相关文档