



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
从“HeySiri”到“Siri”这一小步,是苹果语音识别的一大步“HeySiri,讲个笑话”,信任很多iPhone用户都尝试过这样与苹果的智能语音助手Siri对话,但在将来,大家与Siri谈天时可能就要换一个词了。
日前有消息显示,苹果方面方案将智能语音助理Siri的唤醒词从“HeySiri”简化为“Siri”,这一变化估计将在2023年某个时候或2024年推出,同时苹果正在将Siri整合至第三方APP,来为用户供应更多语境和关心。
作为苹果推出的智能语音助手,早在2022年就已亮相的Siri,无疑是这十余年来手机厂商在AI领域探究的代表之一。别看苹果将来仅仅只是去掉了“Hey”这个单词,但这一微小变化的背后却代表着苹果AI技术的长足进步,同时也意味着苹果在智能语音助手领域已经追上了竞争对手亚马逊的脚步。究竟在很长一段时间里,尽管作为智能语音助手领域的先行者,Siri却始终被用户吐槽“有点蠢”、“不智能”。
从“HeySiri”到“Siri”,反映的是苹果在语音识别技术上有了重大的突破。就像每个人都有自己的名字一样,智能语音助手其实也需要特定的词汇来让它知道用户是在喊自己。
从某种程度上来说,唤醒词同时也是智能语音助手品牌形象的一大组成部分,通过每一次激活语音助手时说出的唤醒词,消费者关于这个品牌的记忆就在这样日复一日的复读中不断被强化。
那么为什么智能语音助手肯定需求一个唤醒词呢?
这是由于智能语音助手如今还不行能24小时时刻保持在线状态,需要保证只有在用户需要时才进入工作状态,其他时间则保持休眠。相比于按专属按键唤醒、点击图标唤醒这类触摸唤醒机制,使用特定的唤醒词来激活智能语音助手,也更契合这一产品的特质。
语音唤醒被称之为keywordspotting(下文简称为KWS),即在连续语流中实时检测出说话人的特定片段,而这个特定片段就是唤醒词。
通常来说,假如不是手动禁用语音助手,后者作为系统级服务会长时间驻留在后台,然而智能语音助手作为一个需要大量AI算力支撑的功能,在工作状态下需要不低的性能开销,同时也会相应的提升功耗。
面对这一问题,开发者想出的方法是通过专用于语音唤醒的低功耗协处理器来实时监听麦克风,一旦监听到类似“HeySiri”、“小爱同学”、“HeyGoogle”这类关键唤醒词时,就会将语音助手从休眠状态转换到工作状态。这个策略的好处除了降低对设备的续航压力外,也会避开始终处于工作状态的语音助手,处理并不是发送给自己的音频信息。
其实语音唤醒的难点,主要就是低功耗与用户临时需求之间的冲突,一个既能有效唤醒语音助手,又不至于让系统误判的唤醒词也是整个KWS机制的核心。
大家想必已经发觉,目前国内市场的智能语音助手唤醒词往往是4个字,比如“天猫精灵”、“小爱同学”、“小度小度”。这是由于汉语发音与音节的关系,大家可以简洁的把字数理解为音节。
为什么唤醒词普遍是4音节,而不是中国人更习惯的3音节或2音节?这是由于音节越短,误唤醒的问题就会越严峻,可假如音节再长,就从短语变成了句子,会降低用户的沟通体验。
同理,“Hey”作为一个英文语气词,就像在中文语境中使用“你好”一样,是为了增加唤醒词的音节,让系统能更精确 的推断监听到的声音究竟是对谁说的。
反过来说,省略掉“Hey”就意味着苹果的KWS技术有了巨大的进步,已经能够实现只需要一个单词即可推断用户意图的水平。之所以能够实现这一效果,技术原理其实并不简单,苹果方面也许率是利用声纹识别技术实现定向人声分别,再通过卷积神经网络搭配声纹识别编码器,在简单的声学环境下精确 捕获到目标用户的声音。
到目前为止,谷歌相关设备依旧需要通过“OKGoogle”与“HeyGoogle”来唤醒GoogleAssistant,其中一个很重要的缘由,就是“Google”一词本身由于谷歌已经深化到了用户的日常生活中,所以并不算冷门,只有这个词作为唤醒GoogleAssistant的“钥匙”,会不行避开的导致频繁误唤醒。
作为对比,Siri这个被生造出来的词汇适用范围就很窄了,iPhone只需监听到契合“Siri”发音的声纹,即可推断用户有使用智能语音助手的需求。
并且值得一提的是,据悉苹果还方案允许Siri与第三方应用结合,而这对于Siri的易用性将有着极大的促进作用。
要知道,此前曾有前Siri团队的成员表示,领导力的缺乏和管理层的不断变化拖累了Siri前进的脚步,其中最关键的缘由,就是苹果方面始终以来坚持的封闭模式并没有对Siri破例,也未能让第三方开发者有更多机会制造更多有用的Siri应用。
在Siri还没有被登录iPhone或被收购前,其创始团队的预想其实是盼望能够拥有一个第三方的开发生态,而这一点也被后来的一众智能语音助手间续实现。比如说,最初Siri被盼望实现的预约餐饮功能,是包含着日期、地点、菜品等多方位要素,而非简洁地搜寻一个餐厅的订餐电话。
将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 车辆抵押贷款合同规范文本(含利息计算)
- 餐饮加盟店特许经营合同
- 武术器械介绍课件模板
- 产后胸口护理专题指南
- 高三数学(理)二轮复习讲义:立体几何高考解答题之空间向量与立体几何
- 呼吸机的护理培训PB培训课件
- 儿科护理复习题及答案
- 读后续写 环境描写六大场景仿写 (解析版)
- 腰腹后背术后护理规范
- 牙周病的药物治疗
- 法人免责协议书
- 2025年交警职业法律知识综合试题库
- 2025-2030中国高等职业教育行业市场现状供需分析及投资评估规划分析研究报告
- 2025年上半年酒店市场营销部工作总结与下半年计划
- 旅居基地免责协议书
- 2025陕西水务集团限公司招聘80人易考易错模拟试题(共500题)试卷后附参考答案
- 现代公司制度试题及答案
- DB42-T 2078-2023 红火蚁监测与防控技术规程
- 企业统计考试试题及答案
- 2022教学能力大赛《智能网联汽车传感器测试与装调》实施报告
- 电动车交通安全教育课
评论
0/150
提交评论