(高清版)GBT 26237.13-2023 信息技术 生物特征识别数据交换格式 第13部分:声音数据_第1页
(高清版)GBT 26237.13-2023 信息技术 生物特征识别数据交换格式 第13部分:声音数据_第2页
(高清版)GBT 26237.13-2023 信息技术 生物特征识别数据交换格式 第13部分:声音数据_第3页
(高清版)GBT 26237.13-2023 信息技术 生物特征识别数据交换格式 第13部分:声音数据_第4页
(高清版)GBT 26237.13-2023 信息技术 生物特征识别数据交换格式 第13部分:声音数据_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

GB/T26237.13—2023/ISO/IEC国家市场监督管理总局国家标准化管理委员会I 1 1 1 5 5 6 6 7 8 8 8 87.4语音表示头 7.5语音表示数据 22附录A(规范性)符合性测试方法 A.1概述 24A.2符合性测试 24 Ⅲ—第1部分:框架:本文件等同采用ISO/IEC19794-13:2018《信息技术生物特征识别数据交换格式第13部分: —第4部分:指纹图像数据。目的在于规定一种指纹图像的数据记录交换格式及符合性测试 1GB/T26237.13—2023/ISO/IEC19794-13来自单次会话中的单个说话人。该数据格式用于各种说话人辨认和确认(SIV)应用,包括文本相关的和文本无关的,并且对数据采集条件或收集环境只作最少假设。将这种格式是有可能的,例如自动语音识别(ASR),但这超出了本文件涉及的范围。本文件也不涉及声纹特征或采集得到的原始数据和经过数字处理(增强)的声音数据。对原始输入的任何处理本文件不涉及对存储和传输的生物特征数据加时间戳,也不涉及使用加密技术来保护生物特征数下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文ISO8601数据元和交换格式信息交换日期和时间表示法(Dataelementsandinterchangeformats—Informationinterchange—RepresentationofdISO/IEC2382-37信息技术词汇第37部分:生物特征识别(Informationtechnology—Vo-ISO/IEC19785-1信息技术公用生物特征识别交换格式框架第1部分:数据元素规范(Infor-ISO/IEC19794-1信息技术生物特征识别数据交换格式第1部分:框架(Informationtech-2GB/T26237.13—2023/ISO/IEC19794-13截止频率cut-offfrequency近场near-field一种基于信道的技术,通过网络将模拟信号(通常是电话通话)从源(例如一部电话)交换到目的地3注:从历史上看,不同国家的信道噪声和其他信道特性是不同的,因此,了解发起电话的信道是很有用的。VoIP和其他数字电话网络的出现和发展削弱了国家电信网络的影响力,因为它们不受国界的限制。例如,一个从美国发起的电话可能在到达美国境内目的地之前已经横跨了加拿大(参见网络电话VoiceoverIP)。表示时长representationduration一条语句的持续时间。采样率samplingrate从连续信号生成离散信号时,每秒(或其他单位)的采样数。会话session发生在一个连续的时间段内的单次采集过程。信噪比signal-to-encodingnoiseratio关注的纯信号部分与噪声部分的比值,噪声来自可能的电噪声源。注3:通常以分贝(dB)为单位。将声纹语音样本与关联不同人的一组声纹参考进行比较,判断哪一个是说话人的识别方式。判断两个语音段是否由同一数据主体的发声机制产生的过程。说话人鉴别speakerauthentication一种说话人识别的方式,判断一个语音样本是否由声明身份的人说出。说话人辨认和确认speakeridentificationandverification通过声音特征自动识别说话人的过程。语音speech在说话时由发声器官产生的声响。4GB/T26237.13—2023/ISO/IEC19794-13用于发送或接收信息的经过数字编码的连续信号(数无论接收到的语音样本是否对应预定内容都能够正常工作的要求数据主体重复SIV系统提供的语句或回答一IP语音voiceoverIP5CS-ACELP:共轭结构-代数码激励线性预测编码(ConjugateStructureAlgebraicCodeExcited6GB/T26237.13—2023/ISO/IEC19794-13本条款定义了称之为“采集过程”(按照ISO/IEC2382-37中相关的定义)的SIV交互的基本要为识别说话人身份(或为将来的比较创建参考),可假定语句来自一个说话人。如果语句中包含来a)系统提示改变或重复;b)使用远长于音节节律持续时间的停顿时间。SIV采集过程可以是主动的或被动的(用户知道或不知道采集过程),用户操作配合或非配合的(友好的/熟练用户为了系统性能会愿意配合采集操作),以SIV采集过程称为会话。在图3的示例中:录音样本可以包含注册呼叫的全部通话语音以及单个提示语句。语句是由一个说话人产生的持续发音流;它以停顿为边界,并且可以包含音节间或词间静语音表示(VR)。VR主要包含一个说话人的语音,可以是系统通过向数据主体提示要求响应来发起。图1给出了带有由交互式语音应答(IVR)系统的提示发起的语句的简单验证采集过程。图1中的采集过程展示了一次会话,会话可能包含说话人A说的一条或两条语句。这些可能如图2所示。图2展示出了一个或两个语音表示。7GB/T26237.13—2023/ISO/IEC图2来自采集过程1中的语句得到的语音表示身份参考指针(“身份声称”)。可以使用非特定人的自动语音识别(AS称身份所要求的。对于数据主体与真人(例如,呼叫中心工作人员)交互,图1中的采集过程不需要改变。采集过程1也可以改为请求或允许数据主体手动输入(例如,使用电话的按键键盘)身份参考指针从数据主体的角度来看,最简单的主动SIV采集过程可以只包含一条语句。在采集过程1中,可只有单个语句(仅语句2)。如果使用ASR,采集过程也可以简化为单个语句(仅语句1)。这个语句中,IVR要求说话人A说出账号。ASR解码这些数字并用它们来检索出生物特征参考。然后,它向IVR提示:欢迎来到ABC银行语音注册系IVR提示:谢谢。现在请您重复说四次您的密码。在嘀声之后,请说出你的密码。[嘀]IVR提示:在嘀声之后,再说一遍你的密码。[嘀]IVR提示:在嘀声之后,再说一遍你的密码。[嘀]IVR提示:在嘀声之后,再说一遍你的密码。[嘀]IVR提示:谢谢。您现在已经注册了ABC银行语音安全系统。图3采集过程2:注册表1中列出的注册信息根据CBEFF注册过程来识别语音数据记录格式,CBEFF定义应符合短名声音数据biometricorganization(0)jtcl-sc37(257)b8(必选)框线说明:9数据项类型中规定的有效值没有限制的字符串见表3中规定的有效值AudioMetaInformationT见表5CaptureProcessProto没有限制的字符串中规定的有效值,“Unknown”“Analog”“Digital”“NonVoIP”“DigitalVoIP”“Mixed”3字母的字符串GB/T26237.13—2023/ISO/IEC19794-13语音元素记录模式应给出音频数据的上限和下限截止频率。上限和下限截止频率应为整数,是音频带上下两端频率的最佳整数表示,在截止频率处,能量比平均频带能量低3dB。截止频率没有默认a)《Organization>标识设备供应商;Transducer字段应说明数据主体使用的输“Telephone”“Microphone”“Handheld”“Mobilephone”“Stethoscope”“Other”“Unknown”Microphonetype“Carbon”“Electret”“Other”“Unknown”没有限制的字符串没有限制的字符串没有限制的字符串CaptureTechnologyID是一种定义信号收集传感器特性的声音数据的GB/T26237.13—2023/ISO/IEC1语音记录元素模板应包括CaptureTechnologyID,用于标明所使用的输入设备类型(如果已知)。默认值为“Telephone”。Microphonetype语音记录元素模板应说明输入设备使用的传声器类型(如果已知)。允许的值是Carbon、Electret、Miccutoffupper和Miccutofflower上下限截止频率都是可选的整数,在该频率下,传声器的能量转换能力比平均频带能量低3dB。限于给出作为接收者的SIV引擎或应用程序能够识别和使用的数据。本条给出了用于语音记录中所有VR的信号处理的技术规范。内置类型语音元素记录模板应具有一个表明BitsPerSample属性的整数值,该整数是音频信号单个采样值的位深度。对于使用可变位深度的格式,如OggVorbis,此元素设置为0。GB/T26237.13—2023/ISO/IECCaptureProcessProtocol用于记录采集过程的附加信息,但不包括数据主体或数据采集设备的信采集过程至少有一个语音表示。VR元素如表6所示。数据项类型见表7见表8没有限制的字符串Amd2中规定的有限效值,数据项类型内置类型内置类型内置类型每个采集过程记录应具有符合ISO8601中规定的Start字段,该字段标明语音表示开始的日期和此必选元素应指出该语音表示结束的日期和时间。由于可能使用语音活动检测软件,语音表示中“LinearPCM”“Mu-Law”“A-Law”“Non-streamingOGGVorbis”“Speex”“ADPCM”“CS-ACELP”“PCM”“AMR”“ILBC”“MPEG”“AC3”“AAC”“AMR”“APE”“FLAC”“MMF”“M4A”“MP2”“MP3”“MP4”“RA”“Full-HDVoice”“other”“unkown”内置类型“Unknown”“Spontaneous/Free”“Reading”“Prompt”“Conversational”“Other”3字符串无限制字符串GB/T26237.13—2023/ISO/IEC1按照ISO/IEC19794-1中规定的有效值/Amd2“Near-field”“Mid-field”“Far-field”“Other”“Unknown”“Close”“Mid-range”“Far”内置类型内置类型如果没有进行质量计算(并且没有可用值),则不需要质量元素。如果项目添加了这个元素,应设Microphonedistance“Close”:使用手持设备或耳机的情况(约0.05m~0.15m)。这时使用了集成扬声器/传声器的设“Mid-range”:使用边界传声器、免提电话(看着屏幕说话)或平板电脑的情况(约0.1m~0.5m)。“Far”:输入传声器的距离超出了说话人的手所能碰触的范围(大于0.5m)。Volume<?xmlversion=“1.0”encoding=“utf-8”?><xs:schemaxmlns:xs="/2001/XMLSchema"xmlns="http://storg/isoiec/19794/13/edl"xmlns:vdi=/isoiexmlns:cmn="/isoiec/19794/1/ed2/amd/2"targetNamespstandards,/iso-iec/19794/-13/edl"elementFormDattributeFormDefault="<xs:importnamespace=/iso-iec/19794/-schemaLocation="19794-1_<xs:complexTypename="VoiceRecordGeneralHeaderType"><xs:elementname="Version"type="cmn:VersionType"<xs:elementname="SessionId"type="xs:string"minOccurs="0"/><xs;elementname="Channel"type="ChannelType"/>《xs;elementname="CaptureDevice"type="cmn:RegistryIDT<xs:elementname=e="Transducer"type="T<xs:elementname="CaptureProcessProtocol"type="xs:string"minOccurs="0"/>minOccurs="0"maxOccurs="<xs:complexTypename="ChannelType 《xs:elementname="CountryOfOrigin"ty《xs:simpleTypename="CutOffBo《xs:restrictionbase="xs:uns《xs:maxInclusivev《xs:simpleTypename="CountryOfOriginType"><xs:complexTypename="TransducerTypname="CaptureTechnologyID"type="CaptureTechnologname="Microphone"type="MicrophoneType"minOccurname="Manufacturer"type="xs:string"minOccurname="Model"type="xs:string"minOccur<xs;elementname="MicCutoffUpper"type="CutOffBoundType"minOccuname="MicCutoffLower"type="CutOffBoundType"minOccuname="DeviceInfo"type="xs:string"minOccurs="0"/><xs:simpleTypename="CaptureTechnologyIdTyp<xs:restrictionbase="xs:string"><xs:enumeration<xs:enumerationvalue="MobilePhone"/><xs:simpleTypename="MicrophoneType"><xs:restrictionbase="xs:string"><xs:enumeration<xs:complexTypename="AudioMetaInformation<xs;elementname="ChannelCount"type="ChannelC《xs:elementname="SamplingRate"type="SamplingRateTyp《xs;elementname="BitsPerSample"type="BitsPerSampleType"/><xs:elementname="AudioDuration"type="xs:unsignedInt"/>《xs:simpleTypename="Ch<xs:restrictionbase="xs:unsignedInt"><xs:maxInclusivevalu<xs:simpleTypename="SamplingRateType"><xs:restrictionbase="xs:unsi<xs:maxInclusivevalue="128000"/><xs:simpleTypename="BitsPerS<xs:restrictionbase="xs:unsig《xs:maxInclusivevalue="25<xs:complexTypename="VoiceRepresentationHeaderType"><xs:element<xs:elementname="DateAndTime"type="DateAndTimeType"minOccname="AudioContent"type="AudioContentname="Quality"type="QualityInformationType"minOccuname="SignalEnhancement"type="xs:string"minOccu<xs:complexTypename="DateAnname="StartTime"type="xs:dateTime"minOccname="EndTime"type="xs:dateTime"minOccuname="VoiceStartTime"type="xs:dateTime"minOccname="VoiceEndTime"type="xs:dateTime"minOccname="VoiceElapsedTime"type="xs:dateTime"minOcc<xs:complexTypename="AudioCon<xs:elementname="AudioEncoding"type="AudioEncodingname="Duration"type="xs:unsignedname="Conversation"type="ConversationRoot"minOccuname="DominantLanguage"type="DominantLangu<xs:simpleTypename="AudioEnco<xs:whiteSpacevalue="col<xs;enumerationvalue="Line<xs:enumerationvalue="Non-《xs:complexTypename="Co<xs;elementname="SimpleCases"type="SimpleCasesType"/>《xs:elementname="PromptCase"type="P<xs:simpleTypename="SimpleCasesTyname="StringPromptContent"type="StringPromptContname="AudioPromptContent"type="AudioPromptConte〈xs:simpleTypename="StringPromptContent<xs;restrictionbase="xs:string"/><xs:simpleTypename="AudioPromptContentType">〈xs;simpleTypename="DominantLanguage《xs:restrictionbase〈xs:complexTypename=name="Quality"type="cmn:Qualityname="Field"type="FieldType"minOccurname="MicrophoneDistance"type="MicrophoneDistaname="Volume"type="xs:float"minOccurname="SNR"type="xs:float"minOccur<xs:simpleTypename="F<xs:restrictionbase="xs:string"><xs:enumeration<xs:enumeration<xs:simpleTypename="MicrophoneDistanceType"><xs:complexTypename="VoiceRepresen《xs:elementname="VoiceRepresentationHetype="VoiceRepresentationHeade《xs:elementname="VoiceRepresentationData"type="VoiceRepresentationDataTyp<xs;complexTypename="VoiceRepresentationDataTypeRoot">《xs:groupref="caseVRDataUR<xs:groupref="caseVRD<xs:groupname="caseVRDataURL"><xs;elementname="URL"type="xs:string"

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论