数字音频制作课件CH1 概述1_第1页
数字音频制作课件CH1 概述1_第2页
数字音频制作课件CH1 概述1_第3页
数字音频制作课件CH1 概述1_第4页
数字音频制作课件CH1 概述1_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数字音频处理教程》第一章声音的特性

声音的感知特性声音的物理属性声音的艺术属性人耳听觉特性1.11.2内容导航CONTENTS1.31.41.1声音的物理属性音频:通常指正常人耳所能听到的,相应于正弦声波的任何频率。声音:由于物体的振动通过介质传播并能被人的听觉器官所感知的波动现象。在振动时,周围的空气分子随着振动而产生疏密变化,形成疏密波,也就是声波。当声波到达人耳位置的时候,刺激听觉神经末梢,产生神经冲动,神经冲动传给大脑,就听到声音了1.1声音的物理属性振幅:振动过程中振动的物质偏离平衡位置的最大绝对值。振幅表示了声音的大小,也体现了声波能量的大小。同一发声物体(如乐器),敲打、弹拨、拉擦它所使得劲越大,则所产生振动的能量就越大、发出声音的音量就越大、对应声波的振幅也就越大振幅1.1声音的物理属性频率:单位时间内振动的次数,单位为赫兹Hz。人类能分辨的声波频率范围20Hz~20kHz声音频率的高低,与声源物体的共振频率有关一般情况下,发声的物体(如乐器)越粗大松软,则所发声音的频率就越低;反之,物体越细小紧硬,则所发声音的频率就越高。例如大编钟发出的声音比小编钟的频率低、大提琴的声音比小提琴的低;同是一把提琴,粗弦发出的声音比细弦的低;同是一根弦,放松时的声音比绷紧时的低具有单一频率的声音被称为纯音,具有多种频率成分的声音被称为复音。频率乐音的波形图噪音的波形图1.1声音的物理属性1.1声音的物理属性波长:声音每振动一次所走过的距离,单位为米。可以用波长代替频率来刻画声音的物理特性声波的波长与频率的关系为:λ=c/f

c为声速(340m/s)声波的波长与频率成反比,频率越高,波长越短;频率越低,波长越长声音的频率与波长声音的感知特性声音的物理属性声音的艺术属性人耳听觉特性1.11.2内容导航CONTENTS1.31.41.2声音的感知特性通常用音强、音调和音色三个参数来表示人对声音的主观感觉,这就是人耳的听觉特性三要素,也可以称之为声音的三要素,反映在声波的物理特征上就是频率、振幅和频谱分布。1.2声音的感知特性---音强又称响度或者声强,就是通常的音量,是人耳对声音强弱的感觉程度。响度是听觉的基础,主要取决于声波振幅的大小。在物理上,声音的大小使用客观测量单位来度量,即声压用Pa(帕)或N/m2(牛顿/平方米)、声强用W/m2(瓦特/平方米)、声功率用W(瓦)、声级用dB(分贝)。由于声压级、声强级和声功率级的值是一致的,所以它们可以统称为声级声级1.2声音的感知特性---音强在心理上,主观感觉的声音强弱使用响度“宋(sone)”或响度级“方(phon)”来度量。两种感知声音强弱的计量单位是完全不同的两种概念,但是它们之间又有一定的联系。为了对响度进行计算,定义声级为40dB的1kHz标准音的响度等于1宋;定义响度级的值为1kHz标准音的声级的dB值,单位为“方(phon)”响度S与响度级P之间有关系式:40方≤P≤105方40方为1宋,2宋比1宋响1倍,3宋比1宋响2倍响度与响度级的关系1.2声音的感知特性---音强描述响度、声压以及声音频率之间的关系曲线称之为等响度曲线,也就是著名的弗莱彻—蒙森等响曲线。当声音弱到人的耳朵刚可以听见时,此时的声音强度为听阈最下面的一根曲线叫“零方等响度级”曲线,也称“绝对听阈”曲线,即在安静环境中,能被人耳听到的纯音的最小值。声音强到使人耳感到疼痛。如果频率为1kHz的纯音的声强级达到120dB左右,人耳就感到疼痛,这个阈值称为“痛阈”1kHz的10dB的声音和200Hz的30dB的声音,在人耳听起来具有相同的响度人耳对不同频率的敏感程度差别很大,其中对1kHz~5kHz范围的信号最为敏感,幅度很低的信号都能被人耳听到。而在低频区和高频区,能被人耳听到的信号幅度要高得多等响度曲线1.2声音的感知特性---音色音色又称音品,表示人耳对声音音质的感觉,是人们区别不同发声体所发出的具有相同的响度和音调的两个声音的主观感觉。一定频率的纯音不存在音色问题,音色主要是由复音中不同谐音的分布和组成所决定的。基频决定声音的声音的高低(音调)。声强相同、基频相同的钢琴音和手风琴音,音调是一致的,为什么我们却感觉到它们的音色不同?不同的乐器即使在发出相同基频的声音时,它们包含的谐波成分是不同的,也就是声音的频谱结构不同,表现在谐波的种类(谐波频率)、种数、振幅各不相同,因此给听众的主观感受就有差别。所以说,音色主要决定于声音的频谱结构,如果改变谐音的数量及其他们的幅度,也就是改变了频谱结构以后,那么乐器声音的性质会随着改变,所以,谐音决定声音的音品(音色)声音的感知特性声音的物理属性声音的艺术属性人耳听觉特性1.11.2内容导航CONTENTS1.31.41.3声音的艺术属性声音的空间感声音的运动感声音的色彩感声音的平衡感声音的意境声音主题声音的空间感是指人耳对声源所处立体空间的感觉。声源的发声在不同空间具有不同的空间特性。一般来讲,根据自身的生活体验,人耳可辨听出室外和室内的声音,而且还可以分辨出声学特性不同、体积大小各异的封闭或非封闭空间,这是由所处环境空间的声学特性决定的。声音的空间感反映在:1.环境感:指影视作品中的声音空间环境2.透视感又称为距离感、远近感或纵深感3.方向感称为方位感。在不同的空间环境里,声音到达耳朵的时间、强度和音色是大小不同,由此可以辨别出声源的具体方向和所处位置1.3声音的艺术属性声音的空间感声音的运动感声音的色彩感声音的平衡感声音的意境声音主题各种声源在内容、音量、音色以及远近上的交替变化形成了生动的声音运动感。当声源与听者之间以一定的速度做相对运动时,接受者所接收到的声音频率(或波长)就会改变,引起音量及音调的明显变化,声学上称之为"多普勒效应"。声音的运动感还包括声源种类的变化。在作品制作实践中大量利用声音的运动感,完成多种声音空间的过渡和转换1.3声音的艺术属性声音的空间感声音的运动感声音的色彩感声音的平衡感声音的意境声音主题色彩感是对声音的艺术属性的特别描述,其目的是为了便于听者能够加深理解和认识声音。声音的色彩可以从以下方面感受到:1.地域色彩2.民族色彩3.时代色彩1.3声音的艺术属性声音的空间感声音的运动感声音的色彩感声音的平衡感声音的意境声音主题平衡感就是节目中各种声音的音量、音色、节奏的平衡感。声音的平衡主要包含语言、音乐、音效所占节目时间的比例、男女播音员的音色搭配、各种声音元素的音量比例、节目整体节奏的协调性、人声与音乐的情绪等多方面的平衡,整体平衡性还包含高、中、低频段的适当量感分配等1.3声音的艺术属性声音的空间感声音的运动感声音的色彩感声音的平衡感声音的意境声音主题作品创作中,可以通过声音将生活环境和思想情绪融为一体,形成一种艺术境界,使观众获得情感体验。如考场上考生紧张的答题,静悄悄的教室只有钟表的滴答声,强化了时间一分一秒过去了的意境1.3声音的艺术属性声音的空间感声音的运动感声音的色彩感声音的平衡感声音的意境声音主题通过将一种具有某种含义的声音,赋予某个角色或某个环境,并使得这一声音多次出现或者贯穿始终,以达到刻划人物、表达主题的作用。由于音乐高度概括性的特点,所以,好的音乐可以形成鲜明的主题声音的感知特性声音的物理属性声音的艺术属性人耳听觉特性1.11.2内容导航CONTENTS1.31.41.4人耳听觉特性声波通过人耳转化成听觉神经中的神经脉冲信号,传到人脑中的听觉中枢,引起听觉。因此,人们对声音的判别主要是由人耳感官的结构、特性造成的。听觉形成的机理过程是由声源振动发出的声波,通过外耳道、鼓膜和小听骨的传导,引起耳蜗中淋巴液和基底膜的振动,并转换成电信号,由神经元编码形成脉冲序列,通过神经系统传递到大脑皮层中的听觉中枢,产生听觉,从而感受到声音。人耳主要有外耳、中耳和内耳三部分组成。1.4.1人耳的听觉系统人耳主要有外耳、中耳和内耳三部分组成。外耳由最外面的耳廓、外耳道组成,到鼓膜为止。耳廓呈不对称形。耳廓主要起收集声音和使耳道与空气之间阻抗匹配作用,从而使更多的声音能进入耳道。耳廓的形状能使不同方向来的高频声具有不同的反射情况,对高频声声源产生定位作用,尤其对区分来自前、后方的声音起着重要作用。外耳道是一直径约0.5cm,长约2.5cm的一端以鼓膜为封闭的圆管。其作用是将声波传导到鼓膜,从而使鼓膜在声波激励下振动。外耳道相当于一个声管,它具有共鸣特性,它的自然谐振频率约为3000HZ。由于外耳道的共鸣以及人头对声音反射、衍射现象的影响,使人耳对3000Hz左右的声波的感觉灵敏度特别高。人耳的结构图1.4.1人耳的听觉系统中耳是鼓膜内侧的空腔部分,它由感觉振动的鼓膜、听骨和容纳鼓膜及听骨的中耳室组成。鼓膜的面积约为0.8cm,厚度约为0.1mm,是一个浅锥形的软膜,它的顶点朝向中耳内部,鼓膜的振动推动听骨运动。听骨就是指位于中耳室中三块互相连接的小骨头。这三块小骨头分别叫锤骨、砧骨和镫骨,它们起杠杆放大作用,将鼓膜的振动传到内耳入口处的椭圆窗膜上。听小骨上附有能对强声起反射作用的肌肉,使强声减低后再传入内耳,起到保护内耳的作用。中耳室,也叫鼓室,其内充满了空气,体积约为2cm3,它通过欧氏管与鼻腔相连。平时欧氏管封闭,当鼓膜内外的压力失去平衡时,欧氏管打开,从而形成了一个沟通鼓室和鼻腔的大气通道,以宣泄鼓室内压强的剧增,使鼓膜内外气压恢复平衡。人耳的结构图1.4.1人耳的听觉系统内耳是听觉的主要部分,由耳蜗等组成,其作用是对穿入的声波进行分析,将声能变换成神经能传入人脑的听觉中枢。耳蜗的外形有点象蜗牛壳,它是卷曲了2.75圈的螺旋形骨质小管。小管是中空的,是神经纤维的通道。耳蜗内充满了淋巴液。耳蜗中间有骨质层和基底膜把它隔成两半,分别为前庭阶和耳鼓阶。人耳的结构图耳蜗的工作过程当声波引起听骨的振动,并通过卵形窗膜使淋巴液运动传到基底膜上时,会使基底膜上与该声音频率相应的部分产生共振。当入射声音频率低时,振动向耳蜗深处传播,激励深处的基底膜共振;当入射声音频率较高时,振动会中途衰减,只有靠近耳鼓室的基底膜共振。对应于每一个频率,基底膜上都有一个共振点,而不同频率的声音引起基底膜振动的最大振幅位置是不同的,这表明它对频率有一种分析作用。在基底膜上分布着大量的神经末梢元——毛细胞,它们在基底膜振动作用下会发生变形,形成神经脉冲信号,并通过听觉传导神经传至大脑听觉中枢,进一步进行分析,从而使人听到声音,声压越大,被激发的神经脉冲信号数也大,从而使人感到的响度越大。若长期在强声压级作用下工作,毛细胞会因为拉伸应力而疲劳以至损坏,这种损坏是不可能恢复的。耳蜗的工作过程1.4.1人耳的听觉系统声音还可以通过颅骨的振动使内耳液体运动,这一传导途径称骨传导。颅骨的振动可由振源直接引起,也可由极强声压级的声波引起,还可由身体组织和骨骼结构把身体其他部分受到的振动传至颅骨。在以空气为介质时,声压级超过听阈60dB以上,就能由骨传导途径听到。人耳的结构图为什么自己听到自己的声音和别人听到自己的声音不一样呢?1.4.2人耳听觉的感受性人耳可听频率极限人耳可听声压极限人耳最小可辨阈对于可听频率的上限,不同的人有相当大的变化,而且和声音的声压级也有关系。一般年轻人可以听到约20000Hz,中老年人只能听到12000~16000Hz。最低频率下限通常认为是20Hz,人对低于20Hz的声波感觉主要是身体的振动而不是听觉1.4.2人耳听觉的感受性人耳可听频率极限人耳可听声压极限人耳最小可辨阈人类听觉感受性有极宽的动态范围,是0~140dB在强声压作用下,人耳会有不舒服及疼痛的感觉。各人能容忍的声压级上限与其在噪声中暴露的经历有关,未经历过强噪声的人,极限约为125dB;有经常处于强噪声环境中经历的人,可达135~140dB。通常,声压级在120dB左右时,人就会感到不舒服;130dB左右耳内会有痒的感觉;达到140dB时耳内会感到疼痛;当声压级继续升高时,会造成耳内出血,甚至听觉系统的损坏1.4.3人耳听觉的特性人耳的听觉特性主要包括掩蔽效应、双耳效应、颅骨效应、鸡尾酒会效应、回音壁效应、多普勒效应、哈斯效应等掩蔽效应在聆听时,一个声音的听阈因另一声音的出现而提高的现象,称为掩蔽效应假设声音A的阈值为40分贝,若同时又听见声音B,这时发现由于B的影响使A的阈值提高到52分贝,即比原来高12分贝。这个例子中,B称为掩蔽声,A称为被掩蔽声,听阈提高的分贝数称为掩蔽量,即12分贝为掩蔽量,52分贝称为掩蔽阈同时掩蔽非同时掩蔽很多音频压缩利用了掩蔽效应掩蔽效应同时掩蔽指一个强纯音会掩蔽在其附近同时发声的弱纯音

(1)被掩蔽声的频率越接近掩蔽声,掩蔽量越大,频率相近的纯音掩蔽效果显著。(2)掩蔽声的声压级越高,掩蔽量越大,且掩蔽的频率范围越宽。实验表明,掩蔽声增加10分贝,掩蔽阈也增加10分贝。两者呈线形关系,且这种关系不受频率影响,既适合于纯音,也适合复音。(3)掩蔽声对比其频率低的纯音掩蔽作用小,而对比其频率高的纯音掩蔽作用大。即低频声容易掩蔽高频声,而高频声较难掩蔽低频声。(4)一个纯音可以被另一个纯音掩蔽,也可以被一个窄带噪声掩蔽同时掩蔽掩蔽效应掩蔽也可以发生在两者不同时作用的条件下。被掩蔽声作用于掩蔽声之前的掩蔽称为后掩蔽。掩蔽声作用在前,被掩蔽声作用在后的掩蔽称为前掩蔽非同时掩蔽具有如下特点:(1)掩蔽声在时间上越接近被掩蔽声,听阈提高越大,即掩蔽效应越强。(2)掩蔽声与被掩蔽声相距很短时,后掩蔽作用大于前掩蔽作用。(3)掩蔽声强度增加时,掩蔽量并不等比例增大。(4)单耳的掩蔽效应比双耳显著非同时掩蔽掩蔽效应时域掩蔽效应的分类及效果类别名称掩蔽出现时间掩蔽持续时间效果同时掩蔽同时掩蔽与掩蔽声同时同时掩声在掩蔽声持续时间内,对被掩蔽声的掩盖最为明显非同时掩蔽超前掩蔽在掩蔽声之前20ms由于人耳的积累效应,被掩蔽声尚未被听到,掩蔽声已经出现,其掩盖效果很差滞后掩蔽在掩蔽声之后100ms由于人耳的存储效应,掩蔽声虽已消失,掩蔽效应仍然存在双耳效应双耳作用首先表现在接受纯音信号的阈值比单耳阈值约低3dB响度平衡的实验证明,在阈值附近,双耳的响度和单耳相等,而且效益随着声级逐渐增加。对强度和频率的辨别,双耳的辨别力高于单耳。在日常生活中双耳接收声信号,无论时间、强度或者频谱,都是互不相同的,但是听到的却是一个单一的声像。这过程就称为双耳融合低频信号的定向是以双耳的时间差为依据,高频信号的定向决定于两耳间的强度差。当波长大于声音从近耳到远耳的距离时,两耳间的相位差也是声源定向线索。绕经头部的路程约为22—23cm,所以声音由近耳传到远耳约需660μs。相当于频率1.5kHz。因此对更长的波长而言,两耳间将有一个显著的相位差,可作为有效的定向线索。颅骨效应颅骨效应就是通过颅骨传导声音的现象听自己讲话时声音的传播渠道有两个,即:音源→人体颅骨→大脑音源→空间→人耳→大脑听自己讲话录音的传播渠道只有一个,即:音源→空间→人耳→大脑听自己讲话的声音有两个传播渠道,所以频带很宽,自己感觉音色比较好;自己的录音时,只有一个传播渠道,频带不是很宽,声音也就不那么好听了自己听见的自己的声音和别人听到的声音不一样鸡尾酒会效应人耳对不同声源有选择功能。如:在嘈杂的声音中,你可以把听力集中在一个人的谈话上,而把其他的声音都推到背景中。这是因为大脑会分辨出声音到达两耳的时间差,及不同距离声源的音质和音量。还能辨别声源方向。而用话筒录音就不同了,它把在接收范围内的声音,包括反射声都接收进来,而人耳却能单独选取一个声音,这就称“鸡尾酒会效应”人耳可以调整听觉神经选择不同方位的声源。不同方位的声音传入人耳时,两耳

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论