TCQJR 006-2023 银行业便民服务 方言智能服务技术要求_第1页
TCQJR 006-2023 银行业便民服务 方言智能服务技术要求_第2页
TCQJR 006-2023 银行业便民服务 方言智能服务技术要求_第3页
TCQJR 006-2023 银行业便民服务 方言智能服务技术要求_第4页
TCQJR 006-2023 银行业便民服务 方言智能服务技术要求_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS03.060A11团 体 标 准T/CQJR006—2023银业便服务 方智能技要求Bankingconvenienceservice—Intelligentdialectservice—Technicalrequirement2023-11-20发布 2023-11-20实施重庆市金融学会发布T/CQJR006—2023T/CQJR006—2023目 次前言 II引言 III范围 1规范性引用文件 1术语、定义和缩略语 1方言智能服务系统通用功能框架 2语音交互界面要求 2语音采集 2语音播报 3输入输出 3环境噪声适应能力 3语种适应能力 3数据资源要求 3音频数据 3文本数据 3前端处理要求 3语音唤醒 4声源定位 4声纹识别 4语音增强 4格式转换 5重采样 5语音处理要求 5语音处理概述 5语音模块 5语义模块 6知识库模块 7服务渠道 7服务渠道概述 7服务渠道功能概述 7电话银行 7手机银行 7网点智能机具 8普惠金融服务点及离行式便民金融服务终端 8参考文献 9前 言本文件按照GB/T1.1—2020《标准化工作导则 第1部分标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本文件由重庆农村商业银行股份有限公司提出。本文件由重庆市金融学会归口。本文件起草单位:重庆农村商业银行股份有限公司、浙江网商银行股份有限公司、重庆富民银行股份有限公司、马上消费金融股份有限公司。II引 言“十四五”规划纲要提出要“优先发展农业农村,全面推进乡村振兴”,大量农村、老年人群不会上网、不会使用智能手机,在出行、就医、消费等日常生活中遇到不便,无法充分享受智20222025年)》明确“公平普惠”的基本原则,提出合理运用金融科技手段“弥合地域间、群体间、机构间的数字化鸿沟,让金融科技发展成果更广泛、更深入、更公平地惠及广大人民群众”,2022年《中国银保监会办公厅关于银行业保险业数字化转型的指导意见》提出“推进个人金融服务数字化转型”“加强大字版、语音版、民族语言版、简洁版等应用软件功能建设”。通过自然语言交互为社会各群体,尤其是农村地区和中老年客群,提供无障碍金融服务,是打通普惠金融最后一公里,助力乡村振兴战略的有效途径。全国各地方言种类众多,通常分为十大方言:官话方言、晋方言、吴方言、闽方言、客家方本文件在考虑上述情况的基础上,给出了银行业金融机构方言智能服务技术要求。III银行业便民服务方言智能服务技术要求范围本文件适用于银行方言智能服务相关工作,包括但不限于产品设计、软件研发、测试和运行维护、业务管理、系统管理、客户服务等。规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T11460信息技术汉字字型要求和检测方法GB18030信息技术中文编码字符集GB/T21024—2007中文语音合成系统通用技术规范GB/T34083—2007GB/T34145—2007SJ/T11380—2008自动声纹识别(说话人识别)技术规范ISO2156BPoRefrenedataforfinncilservicesSpecificationforthedescriptionofbankingproductsorservices(BPoS))术语、定义和缩略语下列术语和定义适用于本文件。方言智能服务 intelligentdialectservice基于人工智能方言识别技术,在线上线下各服务渠道(3.4),向客户(3.3)提供银行产品服务(3.2)。银行产品服务bankingproductorserviceBPoS供应商为满足客户的金融需求或与金融相关的需求而向客户(3.3)提供的输出。[来源:ISO21586:2020,3.3]客户customer期望获得,或已经获得某BPoS(3.2)(即银行产品或银行服务)的个人或组织。[来源:ISO21586:2020,3.5]1服务渠道servicechannel提供方言智能服务(3.1)的电子银行渠道,包括电话银行、手机银行、自助机具等。方言智能服务系统通用功能框架方言智能服务系统(以下简称系统)包括语音交互界面、前端处理、语音处理、服务接口、银行服务渠道、银行金融业务处理、数据资源等功能单元,系统宜在金融机构本地部署,其中:语音交互界面提供系统与人直接进行语音交互的人机界面,包括语音信号输入、输出以及由前端处理、语音处理支撑的语音能力;数据资源包括系统处理的音频数据和文本数据;前端处理提供语音唤醒、声源定位、声纹识别、语音增强、格式转换、重采样等功能;语音处理提供语音模块、语义模块、知识库模块对语音的单独处理及联动调优;服务接口提供外部设备/设施调用系统语音服务的接口;银行金融业务处理对语音处理结果转换为对应的应用指令并反馈业务响应结果;银行服务渠道包括电话银行、手机银行、网点智能机具、便民金融服务终端等电子服务渠道。图1 方言智能服务系统通用功能框架语音交互界面要求语音采集系统应通过传声器或者麦克风阵列等具备语音采集能力的拾音设备对语音进行采集;宜根据不同的拾音距离,提供近场拾音和/或远场拾音中的一种。并满足如下要求:2APPAPP——通过网点智能柜员机、离行式便民金融服务终端等智能机具服务渠道采集语音,系统可尽量复用现有机具和拾音设备,在现有设备不能满足服务需求时,应新增拾音设备。语音播报系统应通过音频播放设备对语音进行播报,满足以下要求——语音播报宜同步提供播报文本显示,供客户核对业务办理信息;——应支持播放语音所需的性能要求,如音频格式、带宽等;——支持语音播放调节功能,能够对语音播放速度、音量等进行调节。输入输出系统应支持中文普通话及地方方言输入输出。环境噪声适应能力系统应在银行营业网点、离行式便民金融服务终端等服务渠道正常环境噪音下能进行语音交互,确保人机交互可用。语种适应能力系统可由低到高提供以下几个等级普通话/方言适应能力,宜支持c)中适应能力。在发起语音交互时,由客户选择接受方言或普通话服务;系统自动判断客户使用方言/普通话,提供相应语种服务;系统自适应提供方言/普通话服务,支持客户方言/普通话混用。数据资源要求音频数据系统音频数据主要用于语音识别和语音合成,要求如下:——在银行金融机构内部场景采集的音频数据宜在行内本地存储;GB/T34083—20171GB/T34083—20171注1:赣方言、徽方言、平话土话。注2:次方言指方言区内细分方言。文本数据系统的文本数据主要用于各功能单元之间的信息传输、交换和共享,要求如下:——应与具体操作系统和平台无关,并且可扩展;——宜是结构化数据,便于系统处理;——中文编码字符应符合GB18030的规定,并依据GB/T11460进行检测;——中文语音合成数据交换格式应符合GB/T21024—2007中第5章的要求。前端处理要求3语音唤醒命令字唤醒——系统应支持使用预先定义的命令字来对系统进行语音唤醒;——系统宜支持普通话和方言命令字语音唤醒;——不同银行服务渠道预定义语音唤醒命令字宜保持一致。自定义唤醒命令字在手机银行等客户自有设备服务渠道,系统宜支持客户自定义语音唤醒命令字。多唤醒命令字系统宜支持使用不同命令字进行语音唤醒;可根据指定的唤醒命令字进入对应的业务办理状态或模式。多音频流监听系统在进行语音唤醒时,应支持同时监听多个音频流。声源定位系统应支持通过对声源的平面角、方位角和声源距离的计算,来对发声源进行定位。声纹识别一般要求系统应支持下列声纹识别功能:——文本相关的声纹识别;——文本无关的声纹识别;——指定文本的声纹识别;——声纹模型训练;——声纹模型自适应;——声纹确认;——声纹辨认;——声纹检出;——声纹追踪;——语言相关的声纹识别;——语言无关的声纹识别;上述功能描述和要求应符合SJ/T11380—2008第3章的要求。声纹文本获取声纹辅助身份认证在满足法律法规和监管要求的前提下,可通过声纹识别辅助客户身份认证。语音增强噪声抑制4系统应支持对输入语音中的背景噪声进行抑制,提高语音的信噪比。混响消除系统应支持对输入语音中的晚期混响进行抑制,提升语音信号的清晰度和可懂度。格式转换系统应支持将音频的格式转换到另外一种格式,以满足语音处理的要求。重采样系统应支持改变数字语音信号的采样率,以满足语音处理的要求。语音处理要求语音处理概述系统宜联动语音、语义、知识库模块,对语音识别进行联动调优,提升方言识别准确率。语音模块客户语音识别要求系统宜支持下列客户语音识别:——使用普通话;——使用地方方言;——普通话和地方方言混用;——使用带有方言口音的普通话;语音识别模型官话方言等与普通话相近的地方方言,宜使用“普通话—方言”混合模型,与普通话差异较大的地方方言宜使用“先分类—后识别”分类识别模型。注3:八种次方言。注4:“普通话—方言”混合模型是指同时使用普通话和方言语料训练的语音识别模型,无论客户使用方言或/和普通话,均使用该模型进行识别。注5:类结果,调用普通话识别模型或方言识别模型进行识别。语音识别功能系统应支持下列全部或者大部分语音识别功能:——自定义语法;——个性化识别;——识别结果多候选;——自定义热词;——自定义同义词库;——自定义错别字词库;——识别结果进阶;——语音信息识别;——说话人信息识别。5话者分流在理财销售双录等双人对话或多人会话场景下,系统应支持按说话人将语音信息分流。远近场音频处理涉及客户个人信息、金融交易信息的服务场景,应使用近场音频处理,避免客户信息泄露;语音识别方式系统应支持关键字识别、命令字识别及连续语音识别。语音合成类型系统宜支持下列一种或多种类型语音合成:——普通话语音合成;——方言语音合成;——男声语音合成;——女声语音合成;——多种音色语音合成;——多种音调语音合成;——多种语速语音合成;——多种语气语音合成。语音合成功能系统应支持下列全部或大部分语音合成功能:——流式语音合成;——多种合成文本编码;——自定义分词;——自定义读音;——合成文本位置信息;——文本分词和拼音信息;——音频时间信息。上述功能描述和要求应符合GB/T34145—2017中4.2和4.3的要求。语义模块自定义语义词典系统能支持自定义语义词典。自定义语义库系统能支持自定义语义库。语义联动调优系统宜支持通过模糊识别、语义抽取、语义排序等方式纠正方言语音识别错误,理解用户意图。——模糊识别,系统应能够处理错别字、同义字、多字少字问题。——语义抽取,系统在交互过程中,应抽取语义要素和用户的关键意图。——语义排序,系统能在语义理解结果中给出多个排序后的理解结果,供用户进行选择或二次确认。6知识库模块知识类型应支持以下类型知识:——文库或/和文档;——FAQ(常见问题解答);——百科类知识图谱。知识构建方法可支持以下几个等级知识构建方法,宜采用b)、c)知识构建方法:人工知识构建;半自动知识构建,在执行自动知识抽取后,由人工校对录入;全自动知识构建。知识库联动调优在方言语音识别效果不佳时,可以通过知识检索引导客户,明确客户意图。服务渠道服务渠道概述金融机构应宜以下一个或多个服务渠道提供方言智能服务:——电话银行;——手机银行;——网点智能机具;——普惠金融服务点及离行式便民金融服务终端。服务渠道功能概述各服务渠道宜提供以下一项或多项方言智能服务功能:——方言智能导航(IVR),客户可通过方言语音命令导航至所需服务;——方言智能填单,客户可通过方言语音输入文本信息,系统自动识别填写;——方言对话交互,客户可使用方言语音与系统进行自然语言交互,支持单轮问答、多轮对话;——方言智能控制,客户可使用方言控制交互UI界面、物联网设备等;——方言播报,可使用方言播报业务办理信息、人机交互信息。电话银行电话银行渠道方言服务宜满足如下要求:——宜同时提供方言智能语音服务及按键式服务供客户选择;——宜提供方言智能导航、方言智能填单、方言对话交互功能;——客户可通过方言语音命令切换到人工服务;——宜在客户使用方言智能填单输入身份证号、银行卡号、交易金额等信息后,语音播报填单信息,由客户确认;——不应使用语音输入交易密码等敏感信息。手机银行手机银行等移动金融客户端应用渠道方言服务宜满足如下要求:7——宜支持方言智能导航、方言智能填单、方言对话交互功能;——宜提供方言语音控制功能,模拟移动金融客户端应用触摸、物理按键等操作,提供无障碍服务;——宜提供文字朗读功能,播报移动金融客户端应用UI界面文字信息。网点智能机具网点智能机具渠道方言服务宜满足如下要求:——宜支持方言智能导航、方言智能填单、方言对话交互功能,可提供方言智能控制功能;——智能机具宜提示客户,系统提供方言语音服务;——智能机具宜提供分离式话筒、听筒,降低厅堂开放环境客户语音信息泄露风险;——智能机具宜支持方言语音命令呼叫网点工作人员。注:分离式听筒和话筒是指客户能贴耳使用的听筒和话筒,可采用有线或无线方式与网点智能机具连接。普惠金融服务点及离行式便民金融服务终端普惠金融服务

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论