




文档简介
单位代码: 10293 密 级: 硕 士 学 位 论 文 论文题目: 数字助听器自适应声反馈消除的研究 1010010507 唐 燕 张玲华 教授 信号与信息处理 现代语音处理与通信技术 工学硕士 二零一三年四月 学号 姓名 导 师 学 科 专 业 研 究 方 向 申 请 学 位 类 别 论 文 提 交 日 期 ii research on adaptive acoustic feedback cancellation in hearing aids thesis submitted to nanjing university of posts and telecommunications for the degree of master of engineering by tang yan supervisor: prof. zhang linghua february 2013 南京邮电大学学位论文原创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。 本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。 南京邮电大学学位论文使用授权声明 本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子 文档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检 索;可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容 和纸质论文的内容相一致。论文的公布(包括刊登)授权南京邮电大学研究生院办理。 涉密学位论文在解密后适用本授权书。 研究生签名:_ 导师签名:_ 日期:_ 研究生签名:_ 日期:_ i 摘要摘要 数字助听器能有效地帮助听障患者改善听力。 但是放大作用的助听器中麦克风和受话 器间存在闭合环路,容易发生声反馈,引起可听见的啸叫。声反馈限制了助听器的最大稳 定增益, 使得患者对语言可懂度降低。 本文主要研究数字助听器中自适应声反馈抑制技术, 基于系数成比例算法, 提出适用于助听器的变步长算法提高声反馈消除性能。 论文的主要 工作包括: 1、研究了耳聋患者的听觉障碍机制,分析了听障患者的听力损失特点。在此基础上, 重点研究了数字助听器关键算法的基本原理和实现过程,包括:语音增强、压缩放大、 移频、声源定位和几种传统的声反馈抑制方法。 2、自适应声反馈消除主要基于自适应系统辨识系统,本文重点研究了自适应系统辨 识的原理。深入研究了两种基本的自适应滤波算法:lms 和 rls 算法,并仿真分析了他 们的优缺点。详细推导了声反馈抑制系统应用最广泛的归一化 lms(nlms)算法并进 行了实验仿真。 3、声反馈路径往往具有稀疏响应的特点,本文提出将一种系数成比例的 nlms 算法 ipnlms 算法(improved proportion nlms)应用到助听器声反馈消除中,利用冲击 响应的稀疏性获得比 nlms 算法更快的收敛速度。研究发现,当 ipnlms 的全局步长固 定时,收敛速度和稳态失调是一对矛盾的关系。针对该问题,本文提出一种新的变步长 算法,该算法依据滤波器梯度调节 ipnlms 算法的全局步长,步长随滤波器系数梯度的 减小而减小,有效地解决了收敛性能和稳态失调的矛盾。该算法受噪声影响小,适用于 声反馈消除。仿真实验表明,本算法在数字助听器声反馈消除中的性能优于 nlms 算法 和固定步长 ipnlms 算法。 关键词关键词:数字助听器,声反馈消除,系统辨识,自适应滤波算法,变步长 ii abstract digital hearing aids( dha) could help people with hearing loss improve aural comprehension greatly. the acoustic feedback occurs due to the acoustical coupling between the loudspeaker and the microphone in combination with the usually high hearing aid amplification. acoustic feedback limits the maximum stable gain of dha and deteriorates speech intelligibility. this paper research focused on adaptive acoustic feedback suppression based on proportion adaptive filtering algorithm, and proposed a kind of variable step algorithm to enhance feedback cancellation. the main work can be summaries as follows: 1、this paper researches the principle of audition handicap, and analyzed the audition characteristic of people with hearing loss. several technologies used in hearing aids are discussed, including compression amplification, speech enhancement, frequency transposition, source location and some conventional methods of acoustic feedback suppression. 2、 acoustic feedback cancellation in digital hearing aids bases system identification ,so this article researches the theory of system identification by adaptive filter deeply. two kinds of adaptive filtering algorithms are researched:least mean square and recursive least square, and the advantage and disadvantage are considered. normalized least mean square is deduced in detail which is widely applied to acoustic feedback cancellation. 3、 since the feedback path is sparse impulse response, this paper applies ipnlms algorithm (improved proportion nlms) to feedback cancellation to improve convergence speed than nlms considerably. the research shows that the requirements of fast convergence and low steady- state misalignment are conflict. this paper proposes a novel variable step- size algorithm to solve the contradiction. the algorithm regulates step size in accordance with filter weight gradient. a decrease in the gradient of the filter weights causes the step size decrease. the algorithm is insensitive to noise and suitable for digital hearing aids acoustic feedback cancellation. the simulations result shows that proposed algorithm achieves excellent performance than nlms and ipnlms in feedback cancellation system. key words:digital hearing aids, acoustic feedback cancellation, system identification adaptive filter algorithm, variable step iii 目录目录 第一章 绪论 1 1.1 研究意义和前景 . 1 1.2 国内外助听器的发展历史和现状 2 1.3 数字助听器的基本原理 . 3 1.4 本文内容及组织结构 . 5 第二章 人耳听觉特性 6 2.1 听觉系统的结构 6 2.2 听觉特性 . 7 2.3 听力障碍原理 . 8 第三章 数字助听器中的基本算法. 11 3.1 响度补偿技术 11 3.1.1 多通道响度补偿 . 11 3.1.2 压缩放大方法 . 13 3.2 语音增强 . 14 3.2.1 谱减法 14 3.2.2 维纳滤波法 16 3.2.3 多通道语音增强算法. 17 3.3 声反馈消除 . 20 3.4 移频压缩算法 . 23 3.5 声源定位 . 25 第四章 应用于声反馈消除的自适应滤波算法 . 27 4.1 自适应滤波原理和系统辨识 27 4.2 fir 维纳滤波 . 28 4.3 自适应最小均方误差(lms)算法 30 4.3.1 lms 算法基本原理 30 4.3.2 lms 算法收敛性能分析 32 4.3.3 lms 算法稳态误差 34 4.4 自适应的递归最小二乘方(rls)算法 . 34 4.5 lms 和 rls 的仿真实验与性能对比 37 4.6 归一化的最小均方误差(nlms)算法 . 38 4.6.1 nlms 算法的推导过程 . 38 4.6.2 nlms 算法实验仿真 . 40 4.7 本章小结 . 41 第五章 新的自适应声反馈消除算法. 42 5.1 助听器自适应声反馈消除 . 42 5.1.1 助听器自适应声反馈消除模型 . 42 5.1.2 评价自适应声反馈消除算法的标准 . 43 5.2 系数成比例的自适应算法 . 44 5.2.1 proportion nlms(pnlms)算法 . 44 5.2.2 improved pnlms(ipnlms)算法 . 46 5.2.3 ipnlms 与 nlms 用于声反馈消除的仿真实验和性能对比 . 47 5.3 新的变步长 ipnlms 算法 . 48 5.3.1 基于梯度的变步长算法. 49 5.3.2 新的变步长 ipnlms 算法仿真 51 iv 5.3.3 新的变步长 ipnlms 算法应用于声反馈消除的仿真 52 5.4 本章小结 . 54 第六章 总结与展望 55 6.1 总结 . 55 6.2 展望 . 56 参考文献 57 附录:攻读硕士学位期间发表的论文. 59 致谢 60 南京邮电大学硕士研究生学位论文 第一章 绪论 1 第一章第一章 绪论绪论 1.1 研究意义和前景研究意义和前景 “听”是人类接收语音信息的一种重要途径,但是很多人由于年老或者噪声等种原因, 听力不断下降,甚至很多人生来就是听力障碍者,这一生理缺陷严重影响他们与外界的信息 交互。语言是人类进行言语交流沟通的重要工具,听力障碍不仅让他们听不清或者听不见世 界上的声音,让他们无法通过听来获取信息,无法与人自由的交流,而且让他们享受不了美 妙的音乐,躲避不了危害,降低生活品质。据世界卫生组织 2009 年的调查结果显示,全球约 有 6 亿听力残疾者,听力障碍患者的人数已经占五种常见残疾患者之首。目前我国约有 1.2 亿的耳聋患者1,其中 60%左右的听力功能衰退者为 60 岁以上的老年人,随着中国人口老龄 化加快,听力功能衰退的听障患者会日益增多,严重影响我国的经济社会发展。 除了突发性耳聋等少数情况外,特别是感音神经性听力损失患者,目前尚无良好的治疗 手段,在现代医疗手段尚没有重大突破的前提下,补偿人耳听力损失的一个简单有效的办法 就是佩戴助听器。人们对众多耳聋患者的关注极大地推动了助听器的快速发展。然而,我国 助听器在我国并没有得到普及,普及率只有 10%,而西方发达国家的却达到 50%,这是由于 国内生产的助听器产品与国外先进水平相比,其技术上存在较大的差距,尤其是数字信号处 理技术方面。国外先进的助听器主要采用现代数字信号处理技术解决助听器响度补偿、消除 反馈等问题,合理补偿听损,增大听障患者可感知的听觉范围,提高言语理解度,使得佩戴 者听到的语音更加清楚自然。而国内仍然停留在的模拟助听器时代,对数字信号处理技术应 用不多,性能差强人意,很多听力障碍者不愿意佩戴这样的助听器。其次,听力障碍患者的 病因各异,听力损失情况也各不相同,患者的听力损失曲线存在较大差异,对助听器的响度 补偿有不同的要求,模拟助听器无法满足患者的需求。虽然国外早早的已有了较先进数字助 听器,但是其主流数字助听器由于价格昂贵,令中国听力损失患者望而怯步。 因此,开发拥有自主知识产权、高性能、经济适用的数字助听器是非常有必要的,具有 重要的现实意义和社会意义,并且可以带来可观的市场前景。数字助听器的核心是其采用的 数字信号处理算法,这些算法既能满足患者对语音信号清晰度的要求,又能满足助听器的实 时处理要求,算法性能直接决定助听器性能的优劣。因此,研究适用于助听器的数字信号处 理算法具有理论意义和实用价值。对数字助听器在未来的科技领域将体现更多的优势,必使 广大听力障碍患者受益颇丰。 南京邮电大学硕士研究生学位论文 第一章 绪论 2 1.2 国内外助听器的发展历史和现状国内外助听器的发展历史和现状 助听器本质上是一种小型扩音设备,它把对声音进行有针对性的扩大,使得聋哑人听到 原来听不到的声音。其发展经历了以下七个时代:手掌集音时代、炭精时代、真空管、晶体管、 集成电路、微处理器和数字助听器时代。 人们经常可以看到,听力较弱的老年人在倾听别人讲话时将自己的手掌放在耳边形成半 圆形的喇叭状,因为这样可以增大集音面积,更好的收集声音,帮助他们听清别人说话,许 多动物的听力比人好的原因正是因为其有硕大的耳朵。人们受此启发,发明了许多漏斗状或 螺号状的集音装置。由于人们相信越长的听管其集声能力越好,因此这些简单装置的听管都 有几十厘米长,有些甚至达一米,体积庞大。这种简单的装置主要用于一对一的谈话中,听 人说话时拿着集声器对着别人的嘴巴,滑稽可笑,但是这种简单的装置还是被使用了几百年。 1878 年,美国科学家贝尔发明了世界上第一台碳精助听器,助听器进入了碳晶时代。这 种助听器的核心部件是炭精传声器和磁性耳机,当感受到声音时,碳晶传声器的振动膜振动, 炭颗粒时而分开时而聚集,电阻随声音大小变化,电流也就随之大小。声音经过放大后到达 耳机,电流随声音的大小改变着磁场强度,引起耳机中的振动膜振动从而发出声音。 1890 年,奥地利科学家 ferdinant alt 制备出了第一代电子管助听器,它利用低压电源预 加热电子管灯丝,当有声音时,灯丝产生变化的电流,放出电子,然后高压电源给耳机提供 电能,放大电流。不久后又出现了热离子真空管,1920 年,真空管助听器问世。助听器在技 术上已经有了较大的发展和提高,这类助听器虽然增益效果好,但是体积庞大,太笨重,无 法携带。随着技术的不断发展,原来的锌电池发展为体积小很多的汞电池。1943 年,人们开 始研究把传麦克风、放大器和电源集中放在一个盒子里,也就是最早的盒式助听器,这种助 听器大小与香烟盒一般大,已经可以方便携带了,是现代助听器的雏形。 1948 年,半导体问世,工程师们开始考虑制造全半导体助听器, 1953 年,随着晶体管 的面世,助听器的体积进一步减小,向微型化发展,但是声反馈就成为一个必须解决的问题。 为了克服声反馈,助听器设计师设计出一种眼镜式助听器,在眼镜腿上相隔一定距离的位置 装上分别装上麦克风和受话器,两个镜腿上各有一整个助听器,是一种双耳都佩戴的助听器。 为了满足患者心理和美观上需求,继而出现了耳背式助听器。耳背式助听器因为很小的体积 和优越的性能,成为了当时销售最好的助听器。大规模集成电路技术出现后,助听器进一步 向微型化发展,耳内式助听器问世。不久之后,相继出现了耳甲腔式、耳道式、完全耳道式 助听器。 随着科学技术的飞速发展,尤其是数字信号处理技术的发展,使得智能化的助听器变成 南京邮电大学硕士研究生学位论文 第一章 绪论 3 了研究主流。60 年代初期,牛语市立大学(cuny)和美国聋人中央研究院联开始研究将数 字信号处理的方法应用到助听器中。但是当时的电脑运行速度低下,直到 60 年代中期,计算 机处理速度的提高以及集成电路的进一步发展才使得将数字信号处理技术应用到助听器中成 为可能。cuny 制造出了以阵列处理器(anarray processor)为核心部件的助听器。cid 也制 造出了一台用盒式试验性 dsp 助听器。小型高速的 dsp 芯片的发展对助听器的发展具有革 命性的意义。1990 年,电脑编程助听器问世,可编程助听器可以根据病人的听力验配图将参 数输入电脑,根据软件的计算公式自动生成病人的听力补偿图,电脑可编程助听器实现了增 益的初步智能化。听力康复设备逐渐向耳级(wearable)助听器发展。 助听器的发展不仅依赖于这些科学研究人员,商业制造业为制造出高性能的便携数字助 听器也做出了巨大的贡献,auditone 最初的产品虽然无法商用,但是在技术上确实是最早的 数字盒式助听器。nicolet 为 phonenix 研发了一款耳背式数字助听器,但是体积和外观没能达 到可佩戴的要求。巨大的市场需求促使各大厂家在研发上大力投资,并推出了自己的全数字 助听器。1996 年,丹麦唯听和丹麦奥迪康同时在美国市场推出 tm senso和 tm digifocus,之后 德国西门子(sienems) 、美国斯达克(starkey) 、丹麦瑞声达、瑞士峰力(phonix)纷纷 推出自己的 dsp 助听器。商业利益的驱使造成企业激烈的竞争,而企业的核心竞争力就是产 品的技术和研发实力,因此,虽然在功能上大都实现了智能的增益调整、灵活的压缩、方向 性语音增强、声反馈消除等功能,但是各家使用的技术方案各成体系,也不对外公开。 20 世纪 40 年代,我国著名耳科学家刘瑞华教授引进国外的听力学知识,中国才开始发 展听力学。虽然近几年来,中国的企业也大力加大在数字助听器方面的研发,质量、种类和 数量都有较大的发展。但是国内的生产的产品与国际大品牌产品存在较大的差距,国内产品 大多是盒式助听器或者小功率的耳背式助听器,这些模拟助听器虽然便宜,但是在在技术方 面落后较多,尤其是数字信号处理技术和生产制造方面。90 年代后期,国外各大知名的助听 器品牌进驻中国,纷纷在中国投资建厂,生产并销售他们的助听器,中国落后的技术无疑导 致了国外品牌垄断中国市场的现象,而且价钱昂贵,使得一些低收入听力障碍患者家庭无法 承受。我国急需投入人力物力加大力度开发拥有自主产权的数字助听器,以满足中国市场的 巨大需求。今年来,国内一些高校和研究机构也启动了对数字助听器的研究,清华大学、北 京大学、东南大学以及中科院等实验室都搭建数字助听器开发平台,并取得了不少成果。 1.3 数字助听器的基本原理数字助听器的基本原理 助听器的主要功能就是放大声音,帮助耳聋患者听清更多的声音。助听器虽然品种繁多, 南京邮电大学硕士研究生学位论文 第一章 绪论 4 但是基本工作原理几乎是相同的,都包括以下几个结构:传声器、放大器、耳机、耳模、音 量控制开关、电源(电池) 。 图 1.1 数字助听器结构图 首先由麦克风(俗称的传声器)采集外界声音,高性能的传声器的输入输出呈线性关系, 即电压输出的高低与输入声音的声压级成正比,实际的麦克风仍然避免小的非线性失真。然 后经过抗混叠滤波器,除去不必要的噪声。早期的助听器都是采用单个麦克风,全向的采集 声音,然后根据信号的时域特性和频域特性进行语音增强,但是在只有两个人对话的情况下, 这种方式就不大适宜,实际的需要催生了定向采音麦克风,再后来出现后来采用多个麦克风, 提供声源信号的空间信息,以天线阵列算法为理论基础进行消噪处理,拥有更优越的抗噪性 能。 数字助听器与模拟助听器的最大区别就是通过模数转换器把采集到的语音信号转换成数 字信号,以供语音信号处理模块处理。数字信号处理模块是数字助听器最核心的组件,主要 由一块集成的 dsp 处理芯片组成, 它利用数字信号处理算法可以对数字信号进行变换、 增强、 压缩、滤波等处理,得到需要的信号形式。其运行速度可到达每秒数以千万条指令程序,具 有强大的数据处理能力和高运行速度,它强大的运算能力可以实时进行频谱分析,允许为每 一位听力损失患者有针对性的设计响度补偿方案,进行复杂的非线性信号处理,还允许存储 多个程序模式,适应不同的环境。dsp 处理器对信号的处理大多通过软件完成,相对于模拟 器件来说,更加灵活,精准,其强大的运算能力和高速运行满足了数字助听器对尺寸小巧和 实时性的要求。数字助听器所用器件也较少,因此体积也较小,简化了线路,降低故障发生 率,减少了器件因长时间使用引起的非线性失真,因此也提高了使用寿命,对数字助听器的 升级只需要进行软件算法升级,加快其更新换代。dsp 处理器。应用在数字助听器的 dsp 处 理器主要执行以下几个功能2: (1)语音增强 (2)响度补偿(3)声反馈抑制(4)移频压 南京邮电大学硕士研究生学位论文 第一章 绪论 5 缩(5)声源定位与跟踪,这些功能的实现算法将在后续节详细描述。 经 dsp 处理器处理后的数字信号需要通过数模转换成模拟信号,然后经过抗镜像滤波器 处理,最后受话器将电信号转换声波传入人耳。但是受话器容易产生谐波失真,造成语音的 失真,而且通常放置在耳道内,耳道内的分泌物容易影响其使用寿命,因此助听器对受话器 的要求也较高。 助听器产品一般还带有耳模,连接人耳和助听器的,提高声音的清晰度。耳模都是根据 使用者耳道定制的,可以起到固定作用,避免在日常生活中脱落耳损坏。耳模一般有一行平 行的小孔,可以平衡内外耳道压力,但是声反馈也主要是经过这个小孔传输的。数字助听器 其他元部件包括音量控制开关、电池等。 1.4 本文内容及组织结构本文内容及组织结构 由于受话器发出的声音会从耳模的小孔或者耳模与耳道的缝隙泄露出去,被麦克风重新 接受,经助听器放大,也可能是因为助听器的机械构造引起的振动,导致信号在某个频点多 次被放大,声压级超过使用者可以承受的范围,称之为“啸叫” ,迫使降低增益。针对目前主 要使用 lms/nlms 算法实现自适应声反馈抑制的效果不够理想, 研究基于变步长系数成比例 算法的声反馈抑制。 本文研究内容主要基于数字助听器,因此本文的章节安排如下: 第一章概述了助听器的发展历史,研究背景和意义,介绍了数字助听器的工作原理。 第二章主要介绍了耳聋患者的听觉障碍机制,分析了耳聋患者的听觉特点,简要介绍了 语音信号的特征。 第三章研究了 dsp 处理器实现各个功能所使用的基础算法。包括单通道和多通道语音增 强、多通道响度补偿、声反馈抑制技术、移频算法和声源定位中的延时估计算法。 第四章着重研究了自适应系统辨识原理, 介绍了两种基础的自适应算法lms和rls, 并在相同的条件下进行仿真, 比较两种算法的优缺点。 详细推导了最常用的归一化 lms 算法, 并进行了仿真和性能分析。 第五章给出了助听器声反馈抑制模型,根据声反馈的稀疏特征提出应用系数成比例算法 进行声反馈抑制,并提出一种基于梯度的变步长算法解决收敛速度和稳态失调的矛盾关系, 仿真实验结果表明,算法抗噪声性能好,不仅具有较快的收敛速度,稳态误差也较小,能很 好的模拟未知系统。 南京邮电大学硕士研究生学位论文 第二章 人耳听觉特性 6 第二章第二章 人耳听觉特性人耳听觉特性 听觉能力是学习和掌握语言最重要的一种官能,听觉能力的受损直接影响着语言的学习 和运用。然而有些人对于这样的本能只能奢望,他们无法听到声音或者听不清。耳聋的原因 众多,他们有些人是因为年老器官功能衰退,有些是天生性的,有些是后天因为滥用药物导 致意外伤害,还有些是因为在高强度的噪声中工作或者生活中的意外导致的3。在医疗效果 不佳的情况下,佩戴助听器是最安全有效的物理治疗手段,补偿患者下降的听觉敏感度。为 了生产高性能的助听器必须了解人耳听觉特性和人耳产生听觉障碍的机制。 2.1 听觉系统的结构听觉系统的结构 听觉是把外界由空气振动产生的声波转换成神经脉冲并经过大脑听觉中枢处理翻译成人 类可识别的语言信号或者其他声音信息的过程。听觉器官通常称为耳,其结构有特殊分化的 细胞,能感觉机械振动并把声音转换为神经冲动,叫声感受器。人耳是一个复杂的器官,可 分为外耳、中耳和内耳,它负责收集声音并把声音转换成神经信号传给大脑,外耳和中耳主 要负责声音的传导过程,声音的感受主要由内耳的耳蜗完成。 外耳包括耳廓和外耳道。耳廓主要起集声作用,有些人耳后的动耳肌没有退化,在神经 支配下耳廓可以活动,便于捕捉声音。外耳道是一段相对密封的管道,连接耳廓和中耳,一 端开启,另一端被鼓膜封住,声波在这里面能产生共振的作用,可放大 3 至 12 千赫兹的声音 大约 36db,起到对声音进行增压的作用。 声音经过外耳廓收集,然后传输到中耳,引起鼓膜振动。鼓膜虽仅为一片薄膜,却是最 能感应声音,通常鼓膜的振动频率和声波频率一致,其上限振动频率约为 20k 赫兹,也就是 人类能听到的最高频率的声音。鼓膜内侧称为鼓室,鼓室内有听骨链和中耳肌。听骨链由锤 骨、砧骨和镫骨组成,一端的锤骨柄附着于鼓膜内侧,另一端的镫骨地板封盖在内耳的卵圆 窗膜上,砧骨是连接他们的骨头。听骨链起着机械杠杆的放大作用,可以将声波有效地传至 内耳。中耳肌有两块,其中鼓膜张肌的手势通过牵拉锤骨而使鼓膜紧张,镫骨肌的收缩使镫 骨固定,用来限制声音向内耳传播,主要是在音量很大的情况下对其限幅,使人耳免遭损害。 内耳中感受声音的组织主要是耳蜗。耳蜗是一段由骨质外壳包裹着的管状物,对形成听 觉起着重要的作用。其骨壳内有三条平行管道,分别为前庭阶、鼓阶和蜗管。前庭阶和鼓阶 内部均充满淋巴液,叫外淋巴,蜗管处于它们中间,而蜗管的淋巴叫内淋巴,他们之间都有 南京邮电大学硕士研究生学位论文 第二章 人耳听觉特性 7 膜分离,分隔前庭阶和鼓阶的膜叫前庭膜,分隔鼓阶和蜗管的叫基底膜。基底膜上听觉感受 装置也称螺旋器上有许多毛细胞,这些毛细胞就是声音感受细胞,支配这些的毛细胞就是耳 蜗中螺旋神经节的神经细胞。当声波传导到耳蜗,里面的淋巴液就会晃动,从而带到基底膜 振动。基底膜的振动从基部向蜗顶传播,振幅逐渐增大,当声波和基底膜某个部位产生共振 时,振幅最大,超过这个共振部位,振幅快速减小直至停止。基底膜不同部位感受不同频率 的声音,低频时,靠近耳蜗基部的部位响应,高频时,靠近蜗顶的部位响应。基底膜的振动 毛胞发生弯曲和偏转,这种的弯曲和偏转产生生物电能,通过听神经传导神经中枢产生听觉。 2.2 听觉特性听觉特性 声音的三个重要属性,分别为音强、音高和音色。音强是指声音幅度的大小,其单位通 常用分贝表示。音高指声音频率的高低,一般人耳能分辨的声音频率为 20 赫兹到 20k 赫兹, 纯音就是又单一频率的正弦波引起的声音。音色是反应声音频谱特性的主观感受,是人区分 不同声音的主要依据,如男声、女声、吉他声等等,其一频率和强度辨别为基础,但更复杂, 人耳几乎可以辨别的声音是无数的。 人耳对声音的主观感知的主要问题是响度、 音高和掩蔽效应4。 物理上, 客观的用 dyn/cm2 (声压)或 w/cm2(声强)表示声音的强弱,主观上用房(phon) (响度级)或宋(sone) (响 度)表示。当声音的强弱刚好能使人听见,称为听阈(srt) ,就是能引起听觉的最小声音的 强度,听阈越低表示听觉敏感度越好。如果使声音的强度加大一点,人耳就感觉疼痛,这个 强度称为痛域(ucl) 。听阈和痛域的范围就是人耳的听阈范围。声音的听阈和痛域都和频率 有关,对不同频率进行测量,可以得到一组曲线,如图 2.1, 图 2.1 听阈-频率曲线 南京邮电大学硕士研究生学位论文 第二章 人耳听觉特性 8 由图可知,人耳对声音的感受并不是均等的。响度级并不是响度,只是用来表示渐强的 标度,人耳在不同频率感受到相同响度级的声音其响度是不一样的。响度是数量的表示,人 为地规定声强级为 40db 的 1khz 纯音的响度为 1 响。 人的听觉系统还有一个复杂的心理效应叫做掩蔽效应,掩蔽效应是指一个声音阻碍听觉 系统感受另一个声音的现象,其中前者称为掩蔽声音,后者称为被掩蔽声音。听觉的掩蔽效 应分为频率掩蔽和时域掩蔽。频率掩蔽指一个强纯音会掩蔽在它附近同时发声的弱纯音,也 叫同时掩蔽。纯音对纯音的掩蔽主要有两个特点4:1、对中等掩蔽强度来说,纯音最有效的 掩蔽在它的频率附近,2、低频纯音可以有效的掩蔽高频纯音,而高频纯音对低频的掩蔽效果 微弱。声音和掩蔽曲线不是线性关系,人们从感知方面考虑引入了临界频带的概念,定义临 界频带的单位为 bark,将人的听觉范围划分为 24 个 bark 域。同步掩蔽主要和声音的频率有 关,而时间掩蔽只与时间相关。如果一强一弱两个声音在时间上特别接近,较弱的声音会因 为掩蔽效应而不容易被人听出来,如果它等待一会再发出,那这个声音就能被听到,对纯音 而言这个时间达到 5 毫秒就可以了 人耳还有一个重要的作用,那就是声源定位。人一般都是有一对耳,由于声源到两耳的 距离不等以及声音到两耳的传播路径不同,从某一位置发出的声音到达两耳的的时间和强度 都会有所差别,人耳可凭借这些差别对声源进行定位。对于低频声音,双耳定位声音的依据 主要是时间差,对于高频声音,帮助定位的主要是强度差。 2.3 听力障碍原理听力障碍原理 听力系统对人类的生活学习至关重要,听觉系统的任何一个部位发生病变都都会引起听 功能障碍,导致听力衰退,甚至丧失听力。不同程度的听觉障碍统称为耳聋。耳聋直接导致 人们无法接收言语信息,严重影响了听觉障碍者的学习生活。按病变部位分,耳聋可分为传 导性耳聋、感音性耳聋、混合性耳聋和中枢性耳聋。 引起耳聋的原因很多,病因复杂。当病变部位发生在外耳和中耳,声音的传导受到阻碍, 比如:外耳闭锁、听骨发育不全等外耳和中耳的先天性畸形,异物、肿瘤扥引起的外耳道阻 塞,中耳炎症、肿瘤、耳硬化等引起的传导性耳聋。这类患者基本可通过手术和药物等医疗 手段治愈。感音性神经性耳聋指的是耳蜗不能将声波转换成神经冲动或神经病变导致神经冲 动传出障碍,或者大脑无法分辨语言。病变部位在耳蜗部位,称为感音性耳聋,病变部位在 耳蜗之后的部位称为神经性耳聋。先天性感音神经性耳聋主要由母亲妊娠期间被病毒感染或 者服用耳毒性药物和遗传性的基因突变引起的。后天性的感音神经性耳聋常见的有药物中毒 南京邮电大学硕士研究生学位论文 第二章 人耳听觉特性 9 性耳聋、老年性耳聋、传染病源性耳聋、噪声耳聋、外伤性耳聋、自身免疫性感音神经性聋 等。混合性耳聋指传音和感音部位同时存在病变,比如长期慢性化脓中耳炎、耳硬化晚期等。 当病变位于脑干和大脑,以及蜗神经核、中枢传导通路与听觉皮质中枢会导致中枢性耳聋。 按 who 耳聋分级标准,照平均语言频率纯音听阈可将耳聋分为 5 级,如表 2.1 表 2.1 耳聋的等级分割 听阈 听力等级 2640db 轻度聋(近距离听一般谈话无困难) 4155db 中度聋(近距离听话感到困难) 5670db 中重度聋(近距离听大声呼喊困难) 7191db 重度聋(在耳边大声呼喊方能听到) 91db 全聋(听不到耳边大声呼喊的声音) 对于存在感音神经性耳聋患者,目前医疗手段的效果有限,佩戴助听器是一种简单有效的方 式。这类患者的外耳和中耳的传导功能正常,病变发生在耳蜗、听神经或者中枢方面,引起 对声音感知的畸变和障碍, 但是仍然有少许的残余听力。 神经性耳聋患者的临床表现为5:(1) 听觉动态范围缩小:患者的听阈普遍上升,听觉灵敏度下降,而痛域却较正常人下降,存在 重振现象,小声听不到,大声又嫌吵现象; (2)频率分辨率降低:患者较正常人更难准确分 辨两个频率比较接近的声音,同时对听觉掩蔽效应的反应更弱,不能很好的掩蔽掉小的噪声; (3)言语辨别能力降低:高频部分的听觉损失厉害,还常伴有高频耳鸣现象,而语音细节所 处的频段恰恰是高频部分,影响正确的语义辨别和对声源的定位。图 2.3 是某一正常人耳和 某一听障人耳的听力曲线如图 2.2, 图 2.2 正常人耳与听障患者的听阈-频率曲线 南京邮电大学硕士研究生学位论文 第二章 人耳听觉特性 10 数字助听器能够针对患者的特点进行智能个性化的设计,利用患者残余听力,结合先进 的数字信号处理技术对收集到的声音进行一系列处理,改善患者的听力。比模拟的声音放大 器具有更佳的性能、更好的舒适性。在没有有效的治疗手段的前提下,缓解患者的听力缺陷 带来的生活不便。 南京邮电大学硕士研究生学位论文 第三章 数字助听器中的基本算法 11 第三章第三章 数字助听器中的基本算法数字助听器中的基本算法 相比模拟助听器来讲,数字助听器听力补偿效果好,内部噪声小,语音失真小,能明显 提高言语辨别能力。数字助听器的这些优点主要仰仗 dsp 处理器,dsp 处理器的强大的处理 能力才使得优秀的算法得以实现。但是仅仅有数字硬件平台还是远远不够的,软件实现的算 法才是数字助听器的灵魂,算法的目的是要使听觉舒适,得到最高的言语理解率。数字助听 器向微型化、智能化发展,因此算法不仅需要实现基本功能,提高算法的性能,又要尽量满 足算法的实时实现,做到运算量小,耗能量少,所需存储空间少,在性能和实时实现中求得 平衡。目前数字助听器的核心算法主要包括:语音增强、响度补偿技术、声反馈消除、声源 定位和跟踪、移频等算法。本章主要论述数字助听器中涉及的基本算法。 3.1 响度补偿技术响度补偿技术 现代医学的研究发现,听障患者不仅收集的声波能量变小,其听觉动态范围明显缩小, 正常人的听觉动态范围从 10db 声强到 120db 声强,动态范围约为 110db,而患者对声音的感 知范围明显缩小,听阈升高,不适域降低,表现为患者可以听见得最小声比正常人要高,患 者可以忍受的最高声强却比正常人低。助听器的主要功能是补偿患者的听力损失,把实现这 一功能的算法称为响度补偿技术,使患者的动态听觉范围最大程度地映射进正常人。 3.1.1 多通道响度补偿 早期人们认为耳聋患者的听力损失在整个频段的损失情况一致,所以人们对助听器的处 理在整个频段采用统一的线性增益,但是耳聋患者不仅听觉动态范围变小,各个频点的听力 损失情况各不一样,其听阈、最适域、痛域都处于不同点,因此,这种对所有的频率实现简 单的线性放大不能很好的补偿听力损失,容易出现重振现象,让患者感觉不适。相对于传统 的单通道响度补偿,现在数字助听器基本实现了多通道的响度补偿6- 8,如丹麦 oticon 公司 的 digifocus 系列产品就采用了用插值半带滤波器实现的 8 通道等带宽滤波器组9。 多通道响度补偿是用滤波器组对输入信号进行分频段处理后综合,被分隔的每个频率段 称为通道。多通道响度补偿就是对这些频率段进行各自不同的压缩处理,把各个通道的信号 合成输出。单通道响度补偿处理中所以频率的信号增益相同,而多通道响度补偿根据患者的 听损情况实施有针对性的补偿策略,比传统的单通道响度补偿具有更好的鲁棒性。 南京邮电大学硕士研究生学位论文 第三章 数字助听器中的基本算法 12 以往多通道响度补偿方案都是对信号进行等带宽的分隔,一般分为 8 个通道进行补偿, 但是有学者提出,人耳对低频声音的感知更敏感,一般对 800hz 到 5khz 声音频率最敏感, 因此提出非等带宽的响度补偿方案,对低于 5khz 以下的信号进行细分,对高于 5khz 的信号 进行粗分,还有提出用基于 bark 域分割频率的多通道响度补偿10。 标准镜像滤波器组 qmfb 可以最大限度地消除混叠失真、相位失真和幅度失真,实现对 信号的完美重构。下面介绍基于标准镜像滤波器组非等带宽四通道压缩放大方案。该方案首 先对整个语音频段进行分割,分为两个等带宽的高通道 04khz 和低通道 48khz,再把低 频段等分两个通道 02khz 和 2- 4khz,最后将 02khz 再细分为 01khz 和 12khz。均 分频率的过程由线性相位的 fir 滤波器完成,然后按因子 2 对信号进行抽取和插值。以 fir 的标准镜像滤波器组的四通道的分析和综合滤波器的结构图如图 3.1: 图 3.1(a) 分析滤波器组 图 3.1(b) 综合滤波器组 其中 0( ) h 是 04khz 的低通滤波器, 1( ) h 是对应的高通滤波器,他们以频点/ 2共 轭正交镜像对称,可以得到他们的关系: 10 ( )(/ 2)hh=。综合滤波器 01 ( )2( )gh=, 10 ( )2(/ 2)gh= ,整个滤波器组的设计主要基于 0( ) h 。在分析处理时进行因子 2 的 抽取造成的频率混叠被内插引起的镜像抵消掉了。四通道的 fir 标准镜像滤波器组中分析滤 波器组的幅频曲线如图 3.2: 南京邮电大学硕士研究生学位论文 第三章 数字助听器中的基本算法 13 图 3.2 四通道分析滤波器组的幅频特性 多通道响度补偿的使用虽然能更贴近患者的听损情况,但是也带来了一定的问题。信号 经滤波器组被分割成多个窄带的信号,由于目前滤波器的设计无法做到理想状态,总是会有 拖尾,因此当这些窄带信号在交叠区可能会出现被重复放大相加,可能人为地制造波峰出来, 破坏信号的频谱结构,而且通道越多,这样的波峰就可能越多,频谱结构受损越厉害,语音 失真越严重。当语音的共振峰刚好处于滤波器的交界处,相邻两个窄带滤波器把共振峰切成 两部分,共振峰被不同的通道进行不同的函数压缩放大,可能造成共振峰的变形、移位甚至 消失,降低患者的语言辨识率。因此有学者重新回到对单频段压缩放大的研究,提出依频域 宽动态压缩放大,不对信号进行频段的分割,计算全频率段的增益曲线进行响度补偿11。 3.1.2 压缩放大方法 压缩放大是相对线性放大而言,患者相对正常人来说,听觉动态范围变小,也就是小声 听不到,大声又感觉不舒服,压缩放大是把正常人的动态范围映射到患者的残余听觉动态范 围内。其输入和输出声压级的关系可以用图 3.3 表示,横轴表示输入语音的声压级,纵轴为 助听器的输出声压级。从图 3.3 可以看到,正常人耳的听阈(thr) 、最适域(mcl)和不适 域(ucl)都映射到患者的听阈、最适域和不适域,输入和输出并不是线性的,这样可以保 证正常人的动态范围很好的映射到患者的残余听力中。患者的听阈升高,在听阈到最适域 段,患者需要比输入语音更大声压级的声音才能像正常人那样听到,于是斜率大于 1,起到 放大的功能。患者的不适域比正常人低,从最适域到不适域比正常人的范围小,因此图中 南京邮电大学硕士研究生学位论文 第三章 数字助听器中的基本算法 14 段,其斜率小于 1,起到限幅的作用,当超过不适域,输出为上限值,避免过强的声音对患 者造成损害。 图 3.3 压缩算法的输入输曲线 各个通道的压缩函数的确定是通过对病人进行纯音测试决定的。纯音测试时让受试者在 安静的环境中听不同频率不同声压级的声音,并告诉测试者能否听到,一般选取频率呈倍频 的频率点测试,如 250、500、1k、2k、4k、8k,如果相邻的频点的听阈相差 20db 以上,则 还要测量另一组倍频的频率点,750、1500、3k、6k,得到患者的听力曲线,以此确定各个频 段的压缩函数。 3.2 语音增强语音增强 语音增强算法不是在助听器中提出的新技术,人们很早就开始研究语音增强,在通信、 媒体等诸多领域都有消噪的要求,因为噪声无处不在,包括环境噪声、电子设备的热噪声、 混响以及他人声音的干扰都会使人们对语言的理解能力下降。对于听力患者,如果要获得与 正常人相等的言语理解能力,那么听障患者接受到的语音信噪比要比正常人高 4 倍左右。消 噪是助听器另一个重要功能,因此语音增强技术也是助听器的重要研究内容。 3.2.1 谱减法 谱减法1213因为运算量小,容易在 dsp 芯片上实现,满足助听器功耗小的需求,是在助 听器领域应用最广泛的方法之一。谱减法的理论基础是人耳感知语音主要基于各频谱分量的 幅度大小,对其相位信息不敏感。该方法利用句与句之间存在短
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 免责旅游合同样本
- 代理购买商标合同标准文本
- 专业摄影服务合同样本
- 产品工厂直供合同范例
- 企业劳务培训合同样本
- 中介加盟合同样本
- 买卖冷冻食品合同样本
- 人车分流合同标准文本
- jiudian运营协议合同样本
- 供冷合同样本
- GB/T 44982-2024绿色产品评价日用陶瓷
- 科研诚信与学术规范第六讲课件
- 提高施工现场从业人员隐患上报(举报)率 -4:3
- 戏剧常识知识考试试题题库及答案
- 小牛在线2018第四季度营销方案20181106
- 职业院校“金课”建设方案
- 医疗护理员基础理论知识考试试题题库及答案
- JT-T-1051-2016城市轨道交通运营突发事件应急预案编制规范
- 山东省济南市槐荫中区2023-2024学年八年级下学期期中考试物理试卷
- 艺术中国智慧树知到期末考试答案2024年
- 30道计量员岗位常见面试问题含HR问题考察点及参考回答
评论
0/150
提交评论