下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Nuance语音识别技术,开启人机交互方式3 0时代-访Nuance大中华区总经理郑裕庆人物介绍:Nuance大中华区总经理郑裕庆(Daniel Cheng)英国Essex大学计算机系人工智能专业硕士,同时拥有Newcastle大学航海及造船专业学士学位。曾任赛门铁克(Symantec)中国公司董事经理、Business Objects大中华区董事经理。在IT行业拥有近二十年的从业历史,对亚洲及大中华区市场有着深刻的了解。纵观整个电子产品发展史,一个不变的趋势是人机交互界面与操作方式越来越简单化、傻瓜化。微软的WINDOWS视窗系统将计算机从只有资深程序员才可操控的禁脔解放出来,革命性的将图形
2、化操作界面引入到计算机中,大大降低了使用计算机的难度,使得家用电脑得到真正大规模的普及。苹果IPHONE的多点触摸功能将我们的手指从繁杂的键盘中解放出来,任何有手指有眼睛的人都可以通过最简单的手势来控制智能终端,浏览互联网,发布视频和照片,进行电子商务。我们与智能移动终端的距离再一次被拉进。如果将前两次革命性的操作变革分别称为人机交互方式的1.0时代和2.0时代,那么美国Nuance(NASDAQ:NUAN)通讯公司带来的语音识别及输入解决方案则可称为3.0时代。试想一下,当任何文本输入或指令输入都可以用一句话来完成,那么估计3岁的儿童都可以轻易的学会使用智能设备上网,不就是说一句"
3、我要上网"么?还要怎样简单呢?Nuance的语音输入方式将彻底解放用户的双手与眼睛,这将是一项极为神奇的技术,同时也将开启一个新时代-不管是汽车、手持设备、PC、家用电器全都可以通过语音实现操控,这将给用户带来更有效率、更为便利的工作与生活方式。也将给产业界带来更新的应用卖点与商业机会。-题记4月22日,在深圳福田福朋喜来登酒店举行的"2010年Nuance移动论坛"上,Nuance大中华区总经理郑裕庆、Nuance移动业务部产品管理副总裁Matt Revis接受了手机方案设计记者的采访,并就记者所关心的诸多问题进行耐心解答。郑裕庆表示,Nuance作为全球领先的
4、语音、文字智能输入和图像解决方案提供商,将以Nuance领先的语音技术为基础,深入拓展至整个大中华区(包括大陆、香港、台湾)市场,为客户提供完整的解决方案。以下为采访实录:技术领先,更关注具有国际视野的客户手机方案设计:能否介绍一下Nuance公司的背景及发展情况?郑裕庆:Nuance是一家美国的上市公司,我们现在的全球员工数大概有五六千人,去年的公司营收已经超过十亿美元,现在大概有50多亿美元的市值。从软件业来讲,Nuance的发展速度还是比较快的。Nuance目前一共有四个业务部门:一个是医疗业务部,提供医疗中的病历管理及手册转录服务;一个是企业业务部,尤其是银行或者电信行业的用户,提供客
5、户服务及呼叫中心应用;一个是图像业务部,提供MFP多功能扫描、PDF以及文件自动化操作解决方案;最后一个是移动设备业务部,提供手机与汽车设备中的指令及控制功能、语音查找及短信应用。在大中华区,移动业务部与企业业务部是我们最关注的两个部门。手机方案设计:Nuance目前主要合作以及关注的是哪一类的客户?郑裕庆:我们有很多知名的品牌客户,基本上目前全球90%以上的手机输入法都是采用Nuance公司的技术。合作伙伴比如摩托罗拉、诺基亚、北方电讯、三星、索尼等手机品牌,大陆的还有中兴、华为、TCL等厂商也是我们的客户。汽车业来讲,包括上海大众,GM,BMW和Ford等也在运用我们的车载语音解决方案。此
6、外,我们也在跟一些大陆比较有实力的品牌在沟通,比如说联想、海尔、康佳等企业。我们的客户同样包含手机方案公司,比如说龙旗也是我们的一个合作方,在软件的前装、后装方面,我们也有跟一些OEM、ODM的厂家合作开发一些产品。对于珠三角尤其是深圳地区的中小厂商,由于数量太多,而且单个厂商的量不太大。所以我们并未有直接的合作,主要通过ODM来做一些应用的植入,包括目前跟MTK有合作,MTK可以整合Nuance的软件在其客户的产品。如果有一些中低端的手机厂商想要植入这些功能,可以根据自己的需要选择性的购买。手机方案设计:您认为Nuance的产品优势主要在哪一方面呢?郑裕庆:在大陆市场,可能影响客户的很大因素
7、是价格,中低端手机厂商通常会采用一些价格比较低的产品。而Nuance的产品可能在成本上并不具备太大优势。我认为Nuance的优势主要在三个方面:首先是国际化程度更高,Nuance的语音解决方案支持多达52种语言和方言,此外在国际市场我们也具有较高的品牌与市场影响力。我想每个厂家都希望他们的手机不单只是在国内销售,肯定也希望进军更广阔的国际市场。那么有这方面需求的厂家,Nuance可以给予他们更大的帮助。第二,Nuance在整体的解决方案上面是比较完整的。比如现在很多公司有的是做触摸输入的,有的是做九键盘的,有的是做整键盘的。方案太多,变成厂家需要自己去整合一些方案,这中间的成本比较高,整合度也
8、不会这么好。Nuance则可以提供整体的解决方案,所有功能都可以共享,整体功能可以选择。现在一些厂家会看到,同质化的产品已经没有利润了,所以他们也会希望采用一些更高端的功能。第三,领先的技术优势。在手写和语音输入技术上面,我们的功能比其它的厂家都要强。比如Nuance的T9 Write文字输入技术,具备手写与触摸屏装置,用户可在同一位置上下叠加地输入文字,在小屏全屏书写也可实现同样的功能。另外Nuance最新推出的T9 Trace的滑行输入法,提供了无缝的多模态,在一个单词内实现滑行和点击的无缝切换,国内没有厂家可以提供的。此外,现时iphone和ipad里面使用的语音应用都是Nuance的语
9、音技术植入。回到最初所讲的,Nuance不是单一的一个输入方法,而是有整体的解决方案。最终我们会给我们的客户提供多种选择,由客户根据他们的需求自己来选择。语音技术前景广阔,将会加大中国市场的投入人物介绍:Nuance移动业务部产品管理副总裁Matt Revis,哥伦比亚商学院MBA学位,曾就任过Dragon Naturally Speaking(Dragon自然语音技术)的产品经理,这是一款全球销量最好的桌面级应用语音识别软件。手机方案设计:未来您更看好哪一些终端会采用语音输入技术?Matt Revis:市场上有越来越多的触摸屏的产品,不光是手机,还有平板电脑等类似于ipad的产品。触摸屏的输
10、入和传统的有键输入还是有区别的,尤其是像ipad这种产品,它上面设置有虚拟键盘,这个键盘手指头一定要按上去,这个按键感觉跟键盘是不一样的,很多人其实不太习惯。那么在这种设备上,语音输入其实有着很大的潜力,Nuance会继续发展多模式用户界面,为用户提供更多选择空间。这是我们nuance公司接下来要注重发展的一个方面。对于语音识别技术应用,语音在过去主要集中于一些简单的命令,受语法限制,只有设计好的命令才可以使用。在将来你可以发出一些没有语法定义的指令,充分实现自然语言理解和移动语音应用,其中包括可以通过语音同时起草短信、写邮件和调出收件人的信息等完全开放的语音识别,这样真正能实现的是人机之间的
11、对话。对于触摸屏的产品,除了语音之外,我们可以为客户提供多模式输入,并结合Nuance的T9系列文字输入产品,这个技术有智慧预测和联想功能,用户只需单次按键输入,NuanceT9便会根据按键组合智能猜测到所需要输入的文字,这个技术是很有针对性的设计。语音技术有非常好的前景。人们会发现以后在汽车行驶的过程中,有语音的控制你会多么的方便。在几千首音乐中调出歌来,你用不着再在屏幕中搜索了。一说歌名,马上就可以帮你搜索出来。手机方案设计:能否具体介绍一下Nuance的语音控制技术?Matt Revis:我可以演示一个DEMO。比如我手中的手机,我对它说一句话,这句话中含有命令词和内容,手机会通过软件识
12、别并执行命令。我们的系统会自适应不同人的语音、语调、口音,一开始识别的时候,基本的识别率本身就不错;当用户用得越来越多,系统会适应你的声音,精度会越来越高。等到我们实现了中文的语音短信输入和邮件输入时,到时候输入一篇文章可能不需要键盘,就说话就可以了,只需要再做一点编辑。语音技术可以预期在车载应用功能上为广泛使用,因为通过语音控制,可以让驾驶员的眼专注在路上,手专注在方向盘上,从而避免很多事故。现时Nuance的Dragon Dictation(读写)和Dragon Search(搜索)正受iphone广泛使用,在iphone store里已经有超过200万人下载了Dragon语音输入软件(免
13、费),调查下来有20%是每个星期都会用的这项功能。这项技术将会在普通领域都有很广泛的应用。比如专门做翻译的公司可以应用我们的语音输入软件,开发语音翻译的产品。包括现在很流行的物联网,肯定是语音应用的一个新的方面。比如你在家可以跟烤箱、微波炉、电视直接对话。这方面市场也是很大的。所以现在在北美,我们跟一些研究机构合作,做一些探索。当然这个是应用层面的问题,我们主要提供技术,电器制造商会考虑这一方面。现在这个软件在所有的智能手机上面安装都没有问题,至于非智能手机只要用的是ARM9以上的都是可以使用的。手机方案设计:您认为语音识别的目标客户群是哪些?中国市场与其它市场是否有不同?Matt Revis:市场区域不一定有多大的区别,主要还是不同的人群。语音识别更适合那些更注重生产效率的人,因为语音效率更高一些。简单的例子,如果你要在几千个名单中找个地址簿出来,语音是最简便的方法。尤其是在汽车领域,这是很方便的。手机方案设计:作为一家美国公司,您认为应该如何实现本地化,使得用户更容易接受?Matt Revis:首先Nuance作为世界语音技术的领先的公司,我们可以提供
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西瓜磷脂酶基因ClUPLD9在花粉发育中的功能分析
- 员工跟投的驱动因素研究
- 二零二五年度船舶转让手续办理与船舶交易代理协议
- 养殖业环境会计信息披露质量评价研究
- 二零二五年度宗教场所装修承包合同安全责任承诺
- 2025年度二零二五年度车辆转让与环保排放检测协议
- 二零二五年度夫妻财产分割与子女教育资助协议
- 二零二五年度美食短视频拍摄与餐饮品牌推广协议
- 2025年度水稻育秧与农业信息化建设合作合同
- 二零二五年度员工股票期权行权条件调整合同
- 加强教师队伍建设教师领域学习二十届三中全会精神专题课
- 2024-2025学年人教版数学七年级上册期末复习卷(含答案)
- 2024年决战行测5000题言语理解与表达(培优b卷)
- 四年级数学上册人教版24秋《小学学霸单元期末标准卷》考前专项冲刺训练
- 2025年慢性阻塞性肺疾病全球创议GOLD指南修订解读课件
- (完整版)减数分裂课件
- 银行办公大楼物业服务投标方案投标文件(技术方案)
- 第01讲 直线的方程(九大题型)(练习)
- 微粒贷逾期还款协议书范本
- 人教版七年级上册数学全册课时练习带答案
- NBT 47013.4-2015 承压设备无损检测 第4部分:磁粉检测
评论
0/150
提交评论