语音信号处理课件_第02章基础知识_第1页
语音信号处理课件_第02章基础知识_第2页
语音信号处理课件_第02章基础知识_第3页
语音信号处理课件_第02章基础知识_第4页
语音信号处理课件_第02章基础知识_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Speech Signal Processing第第02章基础知识章基础知识第2章 语音信号基础知识1.人类的语言器官2.语音产生过程3.语音信号产生的数字模型4.语音信号的特性5.人类的听觉功能Speech Signal Processing第第02章基础知识章基础知识1. 人类的语言器官 人类能以语言沟通,进而累积知识,形成文化,其中一个主要的原因,就是人类具有较其它生物优越的发音器官。 人类的发音器官能够产生多样性的声音,构成丰富的词汇,无疑是最关键的因素。 声音是一种波,能被人耳听到,它的振动频率在2020 000 Hz之间。 1 1、人类的语言器官、人类的语言器官Speech Sig

2、nal Processing第第02章基础知识章基础知识1. 人类的语言器官o 人体发音器官肺、气管、喉(包括声带)和声道,肺是语音产生的能源所在;声带为产生语音提供主要的激励源;声道是指声门至嘴唇的所有器官:咽、鼻腔 、口腔等,它们具有非均匀截面,且随时间变它们具有非均匀截面,且随时间变化,起共鸣器(或谐振器)的作用。化,起共鸣器(或谐振器)的作用。1 1、人类的语言器官、人类的语言器官Speech Signal Processing第第02章基础知识章基础知识1. 人类的语言器官图2-1 人类的发音器官注:喉部以上的部分统称为声道;气管和肺在声门以下1 1、人类的语言器官、人类的语言器官S

3、peech Signal Processing第第02章基础知识章基础知识1. 人类的语言器官图2-2 最重要的发音器官之一:声带 (a)闭合状态 (b)张开状态 甲状软骨 杓状软骨 环状软骨 声门 声带1 1、人类的语言器官、人类的语言器官Speech Signal Processing第第02章基础知识章基础知识 人的说话过程分为五个阶段(1)想说阶段:人的说话首先是客观现实在大脑中的反映,经大脑的决策产生了说话的动机;接着讲话神经中枢选择恰当的单词、短语以及按语法规则的组合,以表达他想说的内容和情感。这个阶段与大脑中枢的活动有关。(2)说出阶段:由上阶段中枢的决策,以脉冲形式向发音器官发

4、出指令,使它们各自相关的肌肉协调地动作发出声音来。另外还开动另一个“反馈系统”即讲话者的听觉系统,来帮助修正语音。(3)传送阶段:说出来的话语是一连串的声波,凭借空气为媒介传到听话者耳中。(4)接收阶段:听话者从外耳收集到的声波信息,经过中耳的放大作用,到达内耳,经内耳基底内膜振动转化为耳蜗内的毛细胞的电位变化,由听觉神经传给大脑。(5)理解阶段:讲话者大脑听觉神经中枢收到脉冲信息后,辨认出说话的人及其所说的信息,从而听懂讲话者的话。2 2、语音产生的过程、语音产生的过程Speech Signal Processing第第02章基础知识章基础知识2.语音产生过程肺声带声道直流气流声音嘴唇声压波

5、速度波能源激励源谐振源辐射源交流气流2 2、语音信号产生过程、语音信号产生过程Speech Signal Processing第第02章基础知识章基础知识发声机理2 2、语音信号产生过程、语音信号产生过程Speech Signal Processing第第02章基础知识章基础知识2.语音产生过程o 语音的形成过程空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,形成语音。浊音(Voiced sounds) :声带绷紧,气流通过时会使得开口变成一开一闭的周期性动作,这时候就造成周期性的激发气流,如a,o;清音(Unvoiced or Fricative sounds) :声带完全舒展,声

6、道某部位收缩形成一个狭窄的通道,产生空气湍流,如t,d;爆破音:声带完全舒展,声道的某部位完全闭合,一旦闭合点突然开启,空气压力快速释放 ,如b,p。能被人耳听到,它的振动频率在2020 000 Hz之间 2 2、语音信号产生过程、语音信号产生过程Speech Signal Processing第第02章基础知识章基础知识2. 语音产生过程语音的两个重要声学特性:浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力决定,其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在80500 Hz左右。共振峰(Fn , n=1,2,.):声道是一个谐振腔,它放大声音气流的某些频率分量而衰减其

7、他频率分量,被放大的频率我们称之为共振峰或共振峰频率。声道具有的一组共振峰,声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度 。共振峰及其带宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对应于一组不同的共振峰参数。实际应用中,头三个共振峰最重要,越多越精确。2 2、语音信号产生过程、语音信号产生过程Speech Signal Processing第第02章基础知识章基础知识口腔对声源频谱的调制共振峰2 2、语音信号产生过程、语音信号产生过程Speech Signal Processing第第02章基础知识章基础知识o共振峰是声道的重要声学特性。声道对于一个激励信号的响应,可以

8、用一个含有多对极点的线性系统来近似描述。每对极点都对应一个共振峰频率。这个线性系统的频率响应特性称为共振峰特性,它决定信号频谱的总轮廓,或称谱包络。o语音的频率特性主要是由共振峰决定的。而声道的共振峰特性决定所发声音的频谱特性,即音色。 o元音的音色和区别特征主要取决于声道的共振峰特性。共振峰特性可以从语音信号频谱分析得到的幅频特性观察到。 o在声学语音学中通常考虑F1和F2,但在语音识别技术中至少要考虑三个共振峰,而在语音合成技术中考虑五个共振峰是最为现实的。o声波的共振也称为共鸣。声道截面积随纵向位置而改变的函数,称为声道截面积函数,它决定共振峰的特性。 Speech Signal Pro

9、cessing第第02章基础知识章基础知识频率范围/Hz成年男子成年女子带宽F12008002501 0004070F26002 8007003 3005090F31 3003 4001 5004 00060180前三个共振峰的频率范围 2 2、语音信号产生过程、语音信号产生过程Speech Signal Processing第第02章基础知识章基础知识2. 语音产生过程理想状态下共振峰的计算:假设声道截面是均匀的(此时可把声道看作一个粗细均匀的圆筒),从喉到唇的距离L=17 cm,音速c=340 m/s,则共振峰将发生在:谐振频率发生在500Hz的奇数倍 HzLccFHzLccFHzLccF

10、振峰:我们们计算一下前三个n为第n个共振峰的波长LcncFnnn250045,150043500101743404,2, 1)(4123322211)(2 2、语音信号产生过程、语音信号产生过程Speech Signal Processing第第02章基础知识章基础知识Speech Signal Processing第第02章基础知识章基础知识3. 语音信号产生的数字模型在研究了发声器官和语音的产生过程以后,便可以建立一个离散时域的语音信号产生的数字模型,它将是我们将数字信号处理技术应用于语音信号的基础。下图是一个完整的语音信号产生的数字模型:3 3、语音信号产生的数字模型、语音信号产生的数字

11、模型Speech Signal Processing第第02章基础知识章基础知识(1)激励模型 由此模型框图,我们可将语音信号看成准周期序列或随机噪声序列作为激励的线性非移变系统的输出,此模型可分为三个部分:激励模型、声道模型、辐射模型激励模型 根据发浊音和发清音的机理又分为:(a)浊音激励 (b)清音激励3 3、语音信号产生的数字模型、语音信号产生的数字模型Speech Signal Processing第第02章基础知识章基础知识(a)浊音激励 由前面所讲发音过程可知,发浊音时声带不断地张开和闭合将产生间歇的准周期性脉冲波,其周期为基音周期,单个脉冲的波形类似于斜三角波,故数字模型中可用周

12、期为T0单位取样序列串作为声门脉冲模型g(n)的输入,其输出就是浊音激励。 由于人类语音的频率范围主要集中在300Hz3400Hz,数字模型中的信号取样率一般为8KHz。3 3、语音信号产生的数字模型、语音信号产生的数字模型(1)激励模型 Speech Signal Processing第第02章基础知识章基础知识 由图可见,它是一个低通滤波器低通滤波器。频率分析表明,其幅度谱按12 dB/倍频程的速率衰减。如果将其表示为Z变换的全极模型全极模型的形式,有G(z)1/ (1-g1z-1)(1-g2z-1) 如果g1和g2的值都接近于1,则由此形成的激励信号频谱很接近于声门脉冲的频谱。显然,上式

13、表明斜三角波可描述为一个二阶极点的模型斜三角波可描述为一个二阶极点的模型。需要指出,不同人、不同语音,其声门脉冲的形状不一定相同,但在语音合成中对其形状要求不很苛刻,只要其傅里叶变换有近似的特性就可以了。 Speech Signal Processing第第02章基础知识章基础知识 周期性的斜三角波脉冲可看做加权的单位脉冲串激励上述单个斜三角脉冲的结果。而周期冲激序列及幅值因子可表示成下面的Z变换形式 E(z)AV/(1-z-1) (2-5)所以整个激励模型可表示为U(z)G(z)E(z)AV/(1-z-1) 1/ (1-g1z-1)(1-g2z-1) (2-6)3 3、语音信号产生的数字模型

14、、语音信号产生的数字模型(1)激励模型 Speech Signal Processing第第02章基础知识章基础知识(b)清音激励发清音时声道被阻碍形成湍流,所以可把清音激励模拟成随机白噪声。此处用均值为0方差为1并在幅值上为平稳分布的序列,具体实现时可采用随机噪声发生器来产生此序列。3 3、语音信号产生的数字模型、语音信号产生的数字模型(1)激励模型 Speech Signal Processing第第02章基础知识章基础知识(2)声道模型两种建模方法:(a)声管模型(b)共振峰模型 共振峰模型将声道视为一个谐振腔,按此原则导出。 基于各种音素发音的不同谐振特点可建立起三种实用的共振峰模型:

15、(a)级联型 (b)并联型 (c)混合型3 3、语音信号产生的数字模型、语音信号产生的数字模型(2) 声道模型 Speech Signal Processing第第02章基础知识章基础知识(a)级联型:适用于一般单元音,认为声道是一组串联的二阶谐振器:PkkkzaGzV11)(这是一个全极点模型,极点就是这个多项式的根:011Pkkkza若P为偶数,解其根会得到共扼复数(conjugate complex)的根,表示成:2/11*1)1)(1 (Piiizpzp3 3、语音信号产生的数字模型、语音信号产生的数字模型(2) 声道模型 Speech Signal Processing第第02章基础

16、知识章基础知识2/1112/111)()(PiiiPiizczbGzVGzVTFjTiiieep2*F=1/T - 取样频率 i/ - 共振峰的频宽。Fi是 - 共振峰(formant)的中心频率TFjTiiieep2这样分解则每一个二阶因式均对应一个共振峰,其幅频特性是典型的二阶谐振特性,谐振中心频率值等于共振峰。若把语音的各个共振峰所对应的二阶系统级联起来就形成了一个完整的级联型声道模型,且具有明显的谐振特性。3 3、语音信号产生的数字模型、语音信号产生的数字模型(2) 声道模型 Speech Signal Processing第第02章基础知识章基础知识(b)并联型适用于鼻音、复合元音及

17、大部分辅音,发这些音时发音腔体具有反谐振特性,必须在模型中加入零点以减弱谐振强度,故要考虑用零、极点模型:2/1212/11)()(PiiiiPiizCzBAzVzVPkkkRrrrzazbzV101)(通常PR,假设分子与分母无公因子且分母无重根,则此式可分解为以下部分分式之和的形式:这就是并联型共振峰模型,每一个二阶因式对应一个共振峰。每个二阶谐振器的幅度可单独控制。3 3、语音信号产生的数字模型、语音信号产生的数字模型(2) 声道模型 Speech Signal Processing第第02章基础知识章基础知识前面两种共振峰模型各自都只能适用于部分语音,级联或并联的级数取决于声道的长度,

18、一般成人取3到5级。级联型结构较为简单,并联型各谐振器幅度可独立控制,综合考虑两者的优缺点可将两种共振峰模型有机地结合起来就得到一种较为完备的共振峰模型。3 3、语音信号产生的数字模型、语音信号产生的数字模型(2) 声道模型 Speech Signal Processing第第02章基础知识章基础知识(c)混合型我们可以根据发音的需要自动切换串联或并联通路,此外并联部分还有一条直通路径,其幅度控制因子为AB,这是专为一些频谱特性较为平坦的音素如f、p、b而考虑的,以增强反谐振特性。3 3、语音信号产生的数字模型、语音信号产生的数字模型(2) 声道模型 Speech Signal Process

19、ing第第02章基础知识章基础知识在发音腔道内形成的气流经由嘴唇端辐射出来,到达听者耳朵的这段过程,声音信号会衰减,而且有高通滤波的特性,我们常用一个一阶的数字高通滤波器拟这个现象,这个滤波器又叫做辐射模型(radiation model),其数学式如下1, 1),1 ()(0010RRzRzR完整的数字模型的系统函数由激励模型、声道模型和辐射模型的级联来表示 :011( )( ) ( ) ( )(1)(1)qkkkGRH zG z V z R zbzc z3 3、语音信号产生的数字模型、语音信号产生的数字模型(3) 辐射模型 Speech Signal Processing第第02章基础知识

20、章基础知识Speech Signal Processing第第02章基础知识章基础知识总结:1. 到此为止组成语音产生的数字模型的三个组成部分己介绍完毕。此模型并非最完备的模型,因为它对一些音是不适用的如浊音中的摩擦音,这种音要有发浊音和清音的两种激励,而不是简单的叠加关系,对这些音我们可用更精确的模型来模拟。 2. 语音产生的数字模型中增益控制(对Av或AN)代表了输出语音的音响强度;时变线性系统主要用来模拟声道的特性;3. 数字语音处理中两个基本问题,即语音分析和语音合成,都是基于这个模型来实现的;4. 此数字模型的特点:o系统参数固定不变短时分析;o全极点性质零点可由多个极点逼近;o激励

21、源和声道互相独立适用于大多数数字语音处理。3 3、语音信号产生的数字模型、语音信号产生的数字模型Speech Signal Processing第第02章基础知识章基础知识4. 语音信号的特性语音学和语言学概要语音的声学特性语音的时间波形和频谱特性语音信号的统计特性4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识语音信号(Speech Signal)4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识数字语音信号表示(Representations of Speech

22、 Signals)4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.1 语音的声学特性1. 物理属性音色、音调、音强和音长;音色:也叫音质,是一种声音区别于另一种声音的基本特征,是由声道的位置和形状决定。音调:声音的高低,决定于声波的频率的高低,而声波频率的高低又由语音的基音频率F0所决定。F0高则音调高,低则音调低。一般说来,老年男性音调偏低,小孩和青年女性音调偏高。音强:声音的强弱,由声波的振幅所决定。音长:声音的长短,取决于发音时间的长短。4 4、语音信号的特性、语音信号的特性Speech Signal Processi

23、ng第第02章基础知识章基础知识4.2 语音的时间波形和频谱特性语音可以直接用它的时间波形来表示,根据时间波形可以看出语音信号的一些主要特性。就其本性而言,语音波形是时间的连续函数,是随时间而变化的,但比较缓慢,1030ms4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性语音的频谱特性由声道的形状和尺寸决定,随时间变化短时谱(清浊音的不同、对数和线性振幅谱);语谱图(浊音和清音的不同、宽带和窄带语谱图)4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基

24、础知识章基础知识4.3语音的时间波形和频谱特性左图中的u(n)就是前面所讲的声音激励ug(n), 由于声门波脉冲模型g(n)引入两个极点,故在语音信号约0.8至1.0 kHz以上的频率造成12db/倍频程的衰减4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性语音信号时域波形示意图:静息波 脉冲波(清塞音)准周期波(浊音)噪声波(摩擦音 )4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性图4-2 声音的语谱

25、图4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性窄频带的语谱图(narrowband spectrograms)语谱图的产生是用傅里叶转换(Fourier transform),当我们用较长的分析窗口(analysis windows),约20ms,对应频宽约为45 Hz,得到的频率分辨率较高,频谱上可以看到谐振的成分。在语谱图上呈现等距的黑白相间横线条,其间距就是基频(F0) 。4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.

26、3语音的时间波形和频谱特性宽频带的语谱图(wideband spectrograms) 若是在转换演算时用较少的取样点,分析窗口大约3ms ,对应频宽约300 Hz,则频谱上看不到谐振成分,在语谱图上看不到等距的黑白相间。频率分辨率较低,反而是时轴上的分辨率较高,看到明显的垂直线条。4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性共振峰(formant)在频域上,能量集中处就是共振峰(formant)之所在,在语谱图上就是颜色较深的位置。在发元音时,音强较大,声带振动而呈现出基频及其谐振频率,也可以

27、明显看到共振峰,能量集中在低频。如果是发辅音,而且声带不振动,就看不到谐振频率。通常辅音的音强小,颜色看来就比较淡,而且能量较集中在高频。若是在没有语音的空档,则语谱图上呈现的,就是有一段空白。4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性元音与辅音的声学特性(一) 元音发元音的声音时,声带是振动的,音强也较大,波形上可以看到大的振幅,而且呈现周期性。其周期就是音高周期,对应的频率就是基频,通常以F0表示。正常说话时,元音的音长大约是50到400ms之间。元音在频谱上会呈现能量集中的现象,集中处的

28、频带称为共振峰。在5 kHz的语音频带范围内,会有5个共振峰,分别以F1F2F3F4与F5代表,其中F1F2与F3比较明显 。4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性图4-3 三个元音的语谱图(分别对应汉语拼音的 元音i , a , u )4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性图4-4 双元音在语谱图上共振峰转移(过渡)的现象分别对应汉语拼音的双元音 ai , ei , ao , ou4

29、 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性(二) 辅音辅音是对元音的前或后作修饰。带声的辅音会有类似元音的共振峰,因为声带振动,所以和元音一样有谐振的成分,但相对于元音,能量小得多。不带声的摩擦音(如f, s, sh, x, h)类似噪音,能量倾向在高频。发鼻音时,鼻腔的共振效果使得低频成分受到压抑,虽然是声带振动而有共振峰,但低频的共振峰能量较弱。下图分别对应汉语拼音辅音:b b, , p p, , m m, , f f, , j j, , q q, , x x, , zhzh, , chch

30、, , shsh4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识4.3语音的时间波形和频谱特性图4-5 塞音(或爆破音)出现在元音前的例子下图分别对应 baba , , da da , , ga ga , , pa pa , , ta ta , , ka ka在一个音节的开始若有塞音,当气流放出之后,随着就发元音,声带开始振动,在语谱图上可以观察到一小段时间之后,才有明显的共振峰出现,这一小段时间就叫做嗓音的起始时间(voice onset time),简称VOT。返回4 4、语音信号的特性、语音信号的特性Speech Sign

31、al Processing第第02章基础知识章基础知识4.4语音信号的统计特性1.语音信号可以看成是一个遍历性随机过程的样本函数;2.语音信号的统计特性可以用它的振幅概率密度函数和一些平均量(均值和自相关函数)来描述概率密度的估算、逼近方法及意义;自相关函数的估计及影响因素(语音段和滤波情况);3.语音信号的统计特性也可以用功率谱来描述长期平均功率谱可以用周期图来估计;4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识语音信号时域波形4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基

32、础知识章基础知识语音信号的波形与频谱4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识语音波形幅度分布4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识基频变化范围4 4、语音信号的特性、语音信号的特性Speech Signal Processing第第02章基础知识章基础知识5. 人类的听觉功能 用语言作沟通,就是说话的人能让对方听懂他在说些什么,双方用说与听来达成信息交换与感情交流。而语言的学习过程,更是不断地听,然后学习会说,所以语言与听觉有密切的关联性。 本节

33、将说明人类听觉器官的构造,以及如何听声音。并且对于人耳在听觉上的一个重要特性,听觉掩蔽效应做了简要叙述,这是语音处理中常常会用到的听觉特性。5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识语音通信Speech Communication5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识听觉系统中声音表示框图5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识听觉器官5 5、语音感知、语音感知Speech Signal Processing第

34、第02章基础知识章基础知识语音感知模型(Speech Perception Model)5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识5. 人类的听觉功能外耳 从耳翼(pinnas)到鼓膜(eardrum)这一段叫做外耳。耳翼的功能在帮助判断声音的来源方向,它对于听者前方来的声音比较敏感。 耳翼到鼓膜之间的通道叫做耳道(meatus) ,这是一个长约2.7公分直径约0.7公分的通道。对于声波的传播而言,这条通道等于是一个四分之一波长的共振腔,它的第一个共振频率大约是3 kHz,这个共振作用将35 kHz的声波放大15 dB左右,因此使得我

35、们的听觉对于35 kHz的频率范围比较敏感。5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识5. 人类的听觉功能中耳 在鼓膜与耳蜗之间有一个大约6立方公分的小空间,称之为中耳。在这个小空间内,有三块小骨头,分别是槌骨(hammer,或称为malleus), 砧骨(anvil或称为incus)与镫骨(stapes,或称为stirrup)。 槌骨黏接在鼓膜上,声波造成的空气振动会使鼓膜振动,进而推动槌骨的振动,镫骨贴在耳蜗的椭圆形窗(oval window)上,槌骨的振动经过砧骨与镫骨的传递,将振动信号传到耳蜗内的淋巴液,所以中耳可以看成是声波

36、到淋巴液的信号转换,在此转换过程中,对于1 kHz以上的信号做了 -15 dB/10倍频程的衰减,可以看成是一个低通滤波器(low pass filter)。5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识5. 人类的听觉功能人类在分辨声音时,是取决于频域上的分辨率,听觉器官等于是将时域的声音波形转换成在频域的频谱,能否听到声音或分辨声音,是取决于音强(intensity)与频谱(spectrum)。一般人的听觉器官可以感知频率范围16 Hz到18 kHz的声音,动态范围约1000倍。超出人类听觉感知范围,如20 kHz以上的声波,我们称之

37、为超音波(ultrasonic)。人耳对于1 kHz到5 kHz的声音最为敏感,但是对于1 kHz以下与5 kHz以上的声音,就要较大的音强才听得到。5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识5. 人类的听觉功能图5-4人类听觉的范围5 5、语音感知、语音感知Speech Signal Processing第第02章基础知识章基础知识5. 人类的听觉功能掩蔽效应(masking effect) 当一个声音存在时,它会将另一个声音的感知临界值提高,也就是说当某一频率的声音,有一特定音强存在时,另一个不同频率的声音要将音强提高才会被听到,这就是听觉掩蔽效应。 同时存在的声音,常

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论