版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
声纹识别听声辨人
北京大学信息科学中心视觉与听觉信息处理国家重点实验室吴玺宏
2001/08/23近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。历史与现状对声纹识别的研究始于20世纪30年代。早期的工作主要集中在人耳听辨实验和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。Bell实验室的L.G.Kesta目视观察语谱图进行识别,提出了“声纹(voiceprint)”的概念。之后,电子技术和计算机技术的发展,使通过机器自动识别人的声音成为可能。Bell实验室的S.Pruzansky提出了基于模式匹配和概率统计方差分析的声纹识别方法,而引起信号处理领域许多学者的注意,形成了声纹识别研究的一个高潮,其间的工作主要集中在各种识别参数的提取、选择和实验上,并将倒谱和线性预测分析等方法应用于声纹识别。70年代末至今,声纹识别的研究重点转向对各种声学参数的线性或非线性处理以及新的模式匹配方法上,如动态时间规整、主成分分析、隐马尔可夫模型、神经网络和多特征组合等技术。如今,声纹识别技术已逐渐走入实际应用,AT&T应用声纹识别技术研制出了智慧卡(smartcard),已应用于自动提款机。欧洲电信联盟在电信与金融结合领域应用声纹识别技术,于1998年完成了CAVE(CallerVerificationinBankingandTelecommunication)计划,并于同年又启动了PICASSO(PioneeringCallAuthenticationforSecureServiceOperation)计划,在电信网上完成了声纹识别。同时,Motorola和Visa等公司成立了V-commerce联盟,希望实现电子交易的自助化,其中通过声音确定人的身份是此项目的重要组成部分。其他的一些商用系统还包括:ITT公司的SpeakerKey、Keyware公司的VoiceGuardian、T-NETIX公司的SpeakEZ等。国内开展声纹识别研究比较早的机构有北京大学、中科院声学所、中科院自动化所、清华大学等,并先后得到了国家自然科学基金重大和重点项目、攀登计划等基金的支持,取得了丰硕的研究成果。说话人识别系统的典型结构图物理基础语音是由发声器官运动产生的。发声器官包括喉、声道和嘴。气流通过喉中的声门,引起声带的周期性振动,形成周期性的脉冲串并进入声道,周期性脉冲的周期称为基音周期。气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,其间的传输通道称为声道。声道是具有某种谐振特性的腔体,当气流通过时,输出的气流频率特性,即声门脉冲串的特性,取决于声道的特性。嘴的作用是完成气流的向外辐射,嘴张开时的形状对语音频谱有影响,但较声道次之。发声的器官和过程确定了语音中特定说话人信息的形式,其中声道的形状是最重要的生理因素。另外,发声的习惯,包括发声速度、韵律和口音构成了语音中特定说话人信息的后天行为因素。语音中的特定说话人信息构成了声纹识别的物理基础。技术原理基于不同的应用环境,声纹识别分为说话人辨识和说话人确认。说话人辨识是指识别说话人是否已经注册,是哪一个注册人;说话人确认是指识别说话人的身份与其声明的是否一致。用户在使用声纹识别系统时,需要向系统提供一段语音,根据发音材料,可分为文本有关(text-dependent)和文本无关(text-independent)两种。与文本有关的识别系统要求用户按照规定的内容发音,并根据特定的发音内容建立精确的模型,从而达到较好的识别效果,但系统需要用户配合,如果用户的发音与规定的内容不符合,则无法正确识别该用户。而与文本无关的识别系统则不规定说话人的发音内容,因而要建立精确的模型较为困难,识别效果较差。另外,与其他生物识别技术类似,若考虑待识别的说话人是否在注册的说话人集合内,则说话人辨识分为开集(open-set)辨识和闭集(close-set)辨识,显而易见,闭集辨识的结果要好于开集辨识,但开集辨识与实际情况更为一致。1.用于银行、证券系统随着电话银行、远程炒股等业务的不断增加,这些业务对用户所做的身份认证只是采用密码方式,其安全性令人担忧。如果采用说话人确认技术并结合原来的密码,可安全有效地实现用户身份的确认,这对用户来说并没有增加任何负担。2.为网络安全出力现在人们越来越多地依赖于口令和密码,随着不同场合的频繁应用其缺陷越发明显。在声纹识别过程中,每次发音都由随机产生的提示文本来控制,可有效地防止复制和剽窃,可以说,声纹识别技术与其他生物识别技术相比有着明显的优势,可以为日益发展的电子购物、电子商务、国际贸易保驾护航,且操作方便、简洁,很容易为广大计算机使用者接受。3.为破案立功对于各种电话勒索、绑架、电话人身攻击等案件,声纹识别技术可以在一段录音中查找出嫌疑人,帮助对嫌疑人的查证。在美国,有关机构还利用这一技术来判断监外执行人员是否在其寓所中。4.在军队安全系统中的应用声纹识别技术可以辨认出电话交谈过程中是否有关键说话人出现,继而对交谈的内容进行处理。另外,在通过电话发出军事指令时,可以对发出命令的人的身份进行确认。-)产品:电话网络语音身份认证(声纹认证)及其通信服务软件系统
经过多年的艰苦努力,自主研发了技术领先的生物特征声纹识别技术产品,它在电话、网络和桌面电脑上,可以根据说话声音自动识别该说话人的身份。由于声音信号便于远程传输和获取,因此语音生物特征认证技术特别适合于基于电信和网络的身份识别应用。我们的技术产品能够适应交叉信道验证,以及不同语音通道环境,如:固定电话、手机或免提电话、甚至VoIP软件网络电话;另外,在语音身份注册和认证的过程中,用户完全可以采用自己熟练的任何方言或腔调来说话,不必限于标准普通话或粤语;只要说话自然流畅,一切随心所愿。
连劲公司不仅提供易于集成的生物特征声纹识别模块软件,更重要的是它可以提供从语音和数据通信、远程身份识别到后台系统集成的整个软件系统服务平台(实际上是一个快速安装,即可直接使用的软件包),其中集成了连劲公司的语音和数据交互通信服务软件(包括IVR,SMS,WEB,E-MAIL,数据库等)。
该技术产品在电子金融、证券、社保、电信服务、监狱管理、公安、军队及其他民用安全认证等行业和部门有着广泛的需求。
(二)连劲声纹识别身份认证产品的特点和优势:
--用户使用简单灵活和方便自然,无需特别的用户操作培训。
--在语音身份注册和认证(包括连劲公司创造的防止录音回放功能)的所有过程中,用户完全可以采用自己熟练的任何方言或腔调来说话,不必限于标准普通话或粤语;只要说话自然流畅,一切随用户所愿。
--能够适应于不同的语音环境-无论用户使用固定电话、手机或免提电话、甚至VoIP软件网络电话均能高效地进行身份识别。
--能够适应交叉信道:用户在某个语音装置上完成注册后,随后使用其它类型的电话亦能完成准确的身份识别。
--语音生物特征识别与个人密码验证的紧密结合,可以提供双重因子安全认证,进一步加强安全强度和提高用户信心。
--连劲不仅提供易于集成的识别模块软件,更重要的是它可以提供从语音通信、身份识别到后台集成的整个软件系统平台(实际上是一个快速安装,即可直接使用的软件包)。
(三)人体生物特征语音声纹认证技术的特性:
与其他生物特征识别技术相比,语音生物特征识别除了具有不会遗失和忘记、不需记忆、不易伪造和模仿、使用方便等优点外,还具有以下特性:
用户接受程度高,由于不涉及隐私问题,用户无任何心理障碍;适应人群范围广,它与语言无关,与方言腔调无关。
利用语音进行身份识别可能是最自然和最经济的方法之一。声音输入设备仅仅依靠电话、手机或电脑麦克风,而其他生物识别技术的输入设备往往造价昂贵。
声音信号便于远程传输和获取,在基于电信和网络的身份识别应用中,如电话银行、电话炒股、电子购物等,与其他生物识别技术相比,语音特征识别更为擅长,得天独厚。
该技术在金融、证券、社保、公安、军队及其他民用安全认证等行业和部门有着广泛的需求。
(四)电话和网络通信时代的身份安全威胁
在电话和网络通信时代,完全依靠简单的密码保护或手机短信号码,来授权存取敏感信息或帐号,其实很不安全。目前通过网络盗窃金融(银行,信用卡等)帐号信息的犯罪越来越猖獗,主要的诈骗方式有:仿造金融机构网站,利用电子邮件或短信等诱骗用户登入该网站,从而窃取密码和帐号信息;采用木马病毒式的间谍软件感染进驻用户个人电脑,记录并转发用户敲击键盘的每一个活动,从而窃取用户敏感信息和帐号;另外,众所周知,现在手机SIM卡可以很容易地被完全克隆。因此,我们的电话网络语音身份认证
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度国际美食餐厅经理聘用合同范本3篇
- 2025年度鱼塘承包与农业科技推广合同4篇
- 2025版文化创意产业贷款担保协议范本9篇
- 二零二五年度互联网数据中心场地租赁与网络服务合同3篇
- 个性化全新矿山承包经营协议电子版一
- 2025版事故车事故处理与车辆置换服务合同3篇
- 二零二五年度商务楼租赁合同范本发放
- 二零二五年度城市排水系统改造承包合同12篇
- 2025年度模特形象授权使用合同
- 二零二五年度学校校园道路照明系统维修合同2篇
- 开展课外读物负面清单管理的具体实施举措方案
- 2025年云南中烟工业限责任公司招聘420人高频重点提升(共500题)附带答案详解
- 2025-2030年中国洗衣液市场未来发展趋势及前景调研分析报告
- 2024解析:第三章物态变化-基础练(解析版)
- 北京市房屋租赁合同自行成交版北京市房屋租赁合同自行成交版
- 《AM聚丙烯酰胺》课件
- 系统动力学课件与案例分析
- 老年人意外事件与与预防
- 预防艾滋病、梅毒和乙肝母婴传播转介服务制度
- 《高速铁路客运安全与应急处理》课程标准
- 23J916-1:住宅排气道(一)
评论
0/150
提交评论