2024智能家用电器的语音交互技术第1部分_第1页
2024智能家用电器的语音交互技术第1部分_第2页
2024智能家用电器的语音交互技术第1部分_第3页
2024智能家用电器的语音交互技术第1部分_第4页
2024智能家用电器的语音交互技术第1部分_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1II目 次前言 II引言 III1范围 12规范性用文件 13术语和义 14智能家语音交分类 3智能家电语音互模块业务系的逻辑系 3技术要求 56.1通用要求 56.2结构设计求 56.3安全要求 56.4功能要求 66.5性能要求 86.6可靠性要求 10标志、指和使说明 117.1标志、指示 117.2使用说明 11附录A(规性)有语音互功能智能家特要求 12参考文献 13PAGEPAGE10智能家用电器的语音交互技术第1部分:通用要求范围(本文件适用于通过语音方式进行交互的智能家电的设计和开发。(GB/T34145—2017中文语音合成互联网服务接口规范GB/T36464.2—2018信息技术智能语音交互系统第2部分:智能家居GB/T37036.5—2023信息技术移动设备生物特征识别第5部分:声纹GB/T40660—2021信息安全技术生物特征识别信息保护基本要求GB/T41807—2022信息安全技术声纹识别数据安全要求SJ/T11540—2015有源扬声器通用规范下列术语和定义适用于本文件。3.1语音交互speechinteraction[来源:GB/T36464.2—2018,3.1]3.2语音识别speechrecognition[来源:GB/T21023—2007,3.1]3.33.43.5

语音合成speechsynthesis[来源:GB/T21024—2007,3.1]语音服务平台speechserviceplatform为智能家电提供语音识别、语义理解、语音交互决策、语音合成等一项或多项服务的平台。智能家电服务平台intelligenthouseholdappliancesserviceplatform;smarthouseholdappliancesserviceplatform[修改:GB/T38052.1—2019,2.2.7]3.6声源定位acousticsourcelocalization对发声物体位置的判断过程。[来源:GB/T36464.1—2020,3.28]3.7关机模式offmode(s)当家电的供电装置连接到主电源时,未出现待机模式、网络模式或活跃模式,且为持续的任何产品模式。带有仅提示用户产品是在关机位置的指示器,包括在关机模式的类别中。注:关机模式不同于断开模式。关机模式也可称作“静态待机”模式。[来源:GB/T35758—2017,3.5]3.8

命令字识别commandwordrecognition一种基于语音识别语法的语音识别方式,是在语音识别语法规则限定的范围内,对于给定的语音输入,语音识别引擎给出语音识别语法覆盖范围内的文本或拒识作为识别结果。[来源:GB/T34083—2017,3.3]3.9连续语音识别continuousspeechrecognition识别任意的连续语音,并给出相对应的文本。注:连续语音识别不限制用户说话的词汇、内容和方式,用户可以以任意说的形式输入语音。[来源:GB/T34083—2017,3.4]3.10语义理解semanticunderstanding使功能单元理解人说话的意图。[来源:GB/T36464.2—2018,3.11]3.11语音唤醒speechwake-up;voicetrigger处于音频流监听状态的语音交互系统,在检测到特定的特征或事件出现后,切换到命令字识别、连续语音识别等其他处理状态的过程。[来源:GB/T36464.2—2018,3.13]3.12误唤醒falsewake-up智能家电处于音频流监听状态,无音频流或者音频流中没有出现唤醒所需的特征或事件时,语音唤醒系统被唤醒的现象。[来源:GB/T36464.2—2018,3.14,有修改]3.13声纹识别voiceprintrecognition11380—2008,3.1.6]3.14语音打断speechinterruption[来源:GB/T36464.2—2018,3.18,有修改]3.15声压级soundpressurelevel声压信号的时间均方与基准值平方之比的以10为底的对数乘以10。注1:声压级用分贝(dB)表示。注2:基准值为20μPa。[来源:GB/T3785.1—2023,3.2]按语音交互功能是否需要联网分为:离线/按拾音距离分为:≤1m;1m<3m<>5m按语音交互功能是否需要唤醒分为:免唤醒;——语音唤醒;——其他非语音方式唤醒(举例:按键、手势、系统调用唤醒)。智能家电的语音交互模块和业务系统的逻辑关系示意图见图1。图1智能家电的语音交互模块和业务系统的逻辑关系示意图注:智能家电的交互结果可以语音、文本、图像等一种或多种形式组合输出。智能家电的语音模块包括前端处理模块和语音处理模块。((()在线型或离线/在线混合型语音智能家电的语音处理功能还可通过通信部件在语音服务平台上实现,语音处理功能可包括:语音识别、语义理解、交互决策、语音合成等。控制模块获取决策信息,对决策信息分析后对执行模块发出操控指令。执行模块接收控制模块的操控指令后执行,并将执行的结果反馈给控制模块。技术要求通用要求通过语音方式进行交互的智能家电应符合以下条款的要求,智能家电根据其类型还应符合附录A的特殊要求。智能家电结构设计要求如下:15dB2dB。安全要求516方式;语音应符合GB/T40660—2021的要求。合GB/T41807功能要求/语音交互功能应能被用户开启和关闭。55dB(A70dB(A)。语音唤醒具有唤醒功能的家电,要求如下:语音识别应至少支持关键字识别(针对连续语音流中的特定关键字进行识别和检出)、命令字识别、连续语音识别中的一种。语义理解宜支持语义理解功能。 注:非目标语音指令举例:非目标人声、电视发声等。回声消除宜支持对输入语音中的回声进行抑制,提升输入语音信号的清晰度和可懂度。噪声抑制宜支持对输入语音中的背景噪声进行抑制,提高输入语音信号的信噪比。声源定位可支持通过对声源的平面角、方位角和声源距离的计算,对发声源进行定位。语音打断开放性聊天可支持开放性聊天功能,能够在随机的语音对话中稳定保持话题延续性的能力。多方言/可支持多方言/多语种混用能力,要求如下:可具有(多)语种识别能力:智能家电可自动对输入语音所属的某个或多个(2个及以上)(多(2智能家电可支持真人语音操控,也可支持语音录制或合成方式的语音操控。(合成的语音音频数据格式应符合GB/T34145—2017中表2的要求。语音提示语音提示功能可被开启和关闭。语音报警智能家电无法识别输入音频时,宜给予相关提示。学习能力智能家电的语音交互系统具有软件升级和数据更新功能,要求如下:声纹识别可具有声纹识别功能,应符合GB/T37036.5—2023第7章要求。性能要求扬声器性能智能家电的扬声器性能宜符合SJ/T11540—20154.4和4.5的要求。拾音距离智能家电根据厂商标注的拾音距离分类,按照表1的测试距离要求进行测试,唤醒成功率和交互成功率应符合6.5.4和6.5.7的要求。表1拾音距离的测试距离拾音距离分类测试距离近程语音智能家电1m中程语音智能家电3m远程语音智能家电5m超远程语音智能家电按制造商声明的距离进行测试唤醒成功率针对需要唤醒的智能家电,满足表1拾音距离要求,唤醒成功率要求如下:(40dB(A)≤45dB(A≥95%;(55dB(A)≤60dB(A)≥90%。唤醒成功率计算方法见公式(1)。𝑃𝑟

=𝑁𝑠𝑤×100%……(1)𝑁𝑤式中:𝑃r——唤醒成功率;𝑁𝑠𝑤——正确唤醒次数;𝑁𝑤——总唤醒次数。误唤醒频度针对需要唤醒的智能家电,误唤醒频度应≤1次/24h。针对需要唤醒的智能家电,唤醒响应时间应≤1000ms。唤醒时延计算方法见公式(2)。Twak=Tr-Te (2)式中:Twakms;Tr交互成功率表1交互成功率序号测试语料集可选/必选指令交互成功率(低噪环境)指令交互成功率(高噪环境)1本机功能操控语料集必选95%90%2泛化后的本机功能操控语料集必选90%85%3语音交互综合测试语料集可选85%80%交互成功率的计算方法见公式(3)。式中:𝐶𝑆——交互成功率;𝑆𝐹

=𝑆𝑆+𝐹

×100%……(3)注:以家电本体执行的准确性统计交互成功的次数,即语音反馈控制成功,但家电本体未正确执行,记为交互失败。离线语音交互的响应时间不应大于2000ms,在线语音交互响应时间不应大于3000ms。交互响应时间的计算方法见公式(4)。𝑇𝑟𝑒𝑠=𝑇𝑠−𝑇𝑐……(4)式中:𝑇𝑟𝑒𝑠——响应时间;𝑇𝑠——家电本体交互给出反馈的开始时刻;𝑇𝑐——语音输入结束的时刻。智能家电如支持语音打断功能,语音打断成功率应符合:≥95%;≥90%(5)式中:𝑃𝑖——语音打断成功率;

𝑃𝑖

=𝑁𝑖×100%……(5)𝑁N——交互过程中需要执行打断操控的次数;𝑁𝑖——被语音交互系统正确响应的次数。语义拒识率 90%。GB/T37036.5—20238.1.1可靠性要求无故障运行智能家电在72h的测试时间内,接受持续的语音交互测试,智能家电功能应能保持正常,如出现家电宕机、语音交互功能无法使用情况则该项测试不合格。容错性智能家电的容错性要求如下:语音温度上升1.℃还是语音易恢复性智能家电出现故障或宕机后,通过自身修复或简单操作可重新恢复语音交互的正常使用。在线型或离线/在线混合型语音智能家电的语音交互应有断网恢复功能,要求如下:60s应有断电恢复功能:6.6.4环境适应性具体品类智能家电的环境适应性按照具体品类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论