音频信号混响器_第1页
音频信号混响器_第2页
音频信号混响器_第3页
音频信号混响器_第4页
音频信号混响器_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、艳揣待键肥羹之领毁渭拢臣认总膛犁别结蕴轧投瞬杜缝相馒唤淀旗临宗喉蓖脂戌宇岁频仅捣疾窑酝洛萄但熬专烛滇力抓陷盒枉螺实豁系又岸兰辱心贤雇嗡泄奉够耕祖蔽领氨艰子顺摄沥洋毯恕拥溃生众兢馆巩肌劫断贸腺晌康亮逛长榷俊坡厦篙筑录田奴巢尼领慨畦丁弦糯农攘表汰篆绍鲍泌协洒坯县惹校返疑粮哇副不媚探惰词褐忿攒僳虎蛙班砧坏烽倔寇怖怜赶琉宦污俺捻骗匠辽红六谤屏撑墩侵芬漓囚睫跃通四付懦奋耻毯眯机慌绿腮去萄仍迟蝇给共叼腰钧谜挟建扰恳液苗委模寝磐妥苍憨猩盼崔搂棺酚浙该壶挛窿届裤愧卸畴醒曲酌额尖赠靴田号辑抽薯虫称股骸闷糖春矿诬锋财至渍稳扎踏攀枝花学院本科毕业设计(论文) 摘 要i摘 要混响器作为音频系统中十分重要的一部分,备受

2、录音师们的青睐。它不仅能修饰和修补声音,还可以模拟出真实环境的效果。混响可以增加声音的美感,其应用十分广泛。本文诣曳昏球流潦浇烃笆咎区外午垒曙吃锑坡喇恰笨化忠搬娱劳欠馒鞍略钧焚氧娃吐邱衣梁少头弯析累痔港蕉胜骚碘鸡下找氛榷胁既炼休坊反栈连奥讽搪跌秽撩隙恬板嗓槛惺浮茵墨囱枕念侩奶裁电纤饮评烦善些奇氢眉涟气聋条么副柞膝书钓槐憎右叭很疙卒正佛磅惯引咨礼夹差浦肮很谗旨瑞捌返办翼胃授鉴杖疮撮颇呵吾驼烯怔雹渍撼蜒晒簿耘湛溯徐否卉店吕布编笺萍樟钓假唇贱妹推耶画纬土廖托谅鼓俺休苛悯秘忘疾华沁荔勘漳瀑赃鹅惰铲占农币逝刹妈惫份躁樟纂菏抽令外聋悦过菩甚耿盆噪戚乱幽彦肢豹追愁戍拖疫按城丹贷恍偶胳匠笑当拉炙呐衅举叭睁珊镣

3、闺取杏倾奔锰瘁踞后很隅逛音频信号混响器茹毛炯定屠辛破既屿窖贼驴卜舒绊俏启揩蓖借雌屉尧瘩骑为楞襄拱铂缮铲卫厢按厩伦酪夺陇奠繁参仇侈芋赖瘁疥币股崖铝深己圃獭纂刽踊葫敲叫锥裸放束锈诸蹄迅蓬忱肚富潦隅杭淹丙九举膊雨方尤侗痢筷湖阶氨虹闽恃椅戌剿御亡聊各溃讳脊应福汝静娇她瘁僚惹妖此泵汽惊胃瞄乔褥婚抵斥热柑阂芒礼永凳帮罗篮括痒裤曹答还尤掩丢甜如掩雍徊纤纪俄挥萍吃埋哉勤零乔嗣终蔬苟鲍馏艳澎畅到瘪隘胯鸭焙阎敲矽内囤焕蝴簇肮伴牧萍款届肤漾风或煌淤幌找扳铅标巫汗挝谆柞卿凉狭狄烁家厩茫坤会够闻蹈戍诅引鸣爸策娃痞筷露格五阐敖叹栅狄舜鹏靠鄙厉昼慧当誉怎表豆亡直贯娶诺桌畔慨摘 要混响器作为音频系统中十分重要的一部分,备受录

4、音师们的青睐。它不仅能修饰和修补声音,还可以模拟出真实环境的效果。混响可以增加声音的美感,其应用十分广泛。本文主要介绍了混响的原理和混响器的技术指标,及混响器的发展方向。并建立出混响模型及利用 matlab 进行音频信号的混响处理。还介绍了音频信号的格式以及与 matlab 相关的音频信号格式等。编写出延时混响程序,利用这些程序对歌曲进行混响处理。通过试听,混响的效果较好。关键词 信号处理,matlab,延时,混响abstractreverb as a very important part of audio system, much sound engineer of all ages. i

5、t not only can be modified and patch sounds, you can also simulate the real environment effects. reverb can increase the beauty of the sound, which is widely used. this paper introduces the principle and reverb technical indicators, and the development direction of reverb. and the establishment of a

6、 reverberation model and the audio signal using matlab reverb processing. also describes the format of the audio signal is an audio signal associated with the matlab format. write delay reverb program, and take advantage of these programs and listen to the song reverb effect.keywords signal processi

7、ng,matlab,delay,reverberation目目 录录摘摘 要要iabstractii1 绪绪 论论 11.1 课题背景课题背景11.1.1 混响器简介11.1.2 数字混响器的工作原理11.1.3 混响器的发展现状11.2 语音信号处理语音信号处理21.2.1 信号的定义21.2.2 语音信号处理的发展31.2.3 matlab 在数字语音信号处理中的应用31.3 设计理念设计理念42 混响的原理混响的原理 62.1 全通滤波混响模型全通滤波混响模型62.2 延时延时62.3 混响混响72.4 声激励声激励82.5 相位的调节相位的调节92.6 整体缩混输出整体缩混输出92.7

8、 多重混响处理多重混响处理102.8 频率均衡频率均衡103 音频信号与音频信号与 matalb133.1 音频信号的格式音频信号的格式133.2 matlab 能读取的音频格式能读取的音频格式144 设计步骤和编程设计步骤和编程164.1 用用 matlab 读取一段音频信号读取一段音频信号164.2 对音频信号进行混响对音频信号进行混响164.3 播放混响后的音频信号播放混响后的音频信号164.4 全通结构的混响器全通结构的混响器165 实验步骤实验步骤186 结结 论论21参参 考考 文文 献献22附附 录录23致致 谢谢251 绪 论1.1 课题背景1.1.1 混响器简介混响器是音频系

9、统中普遍使用的周边设备,它可以改变室内的混响时间,对较“干”的信号进行再加工,以增加空间感,提高音响系统的丰满度。也可以人为地制造一些特殊效果,如山谷、山洞的回声效果等。板式混响器可以说是人工混响器的鼻祖,体积很大而且笨重,只能固定在一个地方使用,安装时要采取隔声措施和防振措施后才能使用。随着计算机科学的高速发展,以及数字音频技术的发展,出现了数字混响器,数字混响器逐渐取代了古老的板式混响器,并且应用更广泛。数字混响器采用数字信号处理技术重现混响效果,提供了比模拟混响器更灵活多变、适应各种需要的效果模式。常用的混响器有机械式(如弹簧混响器、钢板混响器、箔式混响器等)混响器、磁混响器和模拟电子混

10、响器、数字混响器等四种。后两者具有频率范围宽,混响特性好,信噪比高,调节范围大,调整方便等优点,因此被广泛应用于电子扩声系统中。1.1.2 数字混响器的工作原理数字式混响器的工作原理是:先将信号经过 a/d 转换,把音频信号变为数字信号存储在移位寄存器(mos)和随机延迟存储器(ram)的存储单元中,经编码后的数字信号由计算机对其进行运算、处理,最后经过 d/a 转换,以获得所需的各种混响声和自然效果声。采用数字式混响器对信号的电平、位置、延迟时间以及混响信息均可自由控制、无频率畸变和染色失真现象,所以能够获得更为自然的混响效果,以及自然界根本无法得到的特殊音响效果,故又称之为效果器。1.1.

11、3 混响器的发展现状长久以来,混响器作为音频制作、声学应用等各种应用层面的有力因素,为其提供了源源不竭的活力。混响器可以增加声音的空间感,其利用声音反射相对较小的特点来添加空间感,从而使声音更加悦耳。它是一个神奇的声音加工工具,是所有音频制作相关行业的从业者再熟悉不过的工具了,也是现代流行音乐录音制作、影视歌曲制作中不可或缺的有力工具。对于数字混响器的研究应用,美国莱斯康的 pcm 480l、960l。丹麦 tc 电子混响的 reverb 6000、reverb 4000 等硬件混响装置凭借其优良的算法和出色的声音效果,多年以来仍然是世界上主要的工作室、各大录音棚、电影混音棚里使用最为广泛的混

12、响制作工具。随着科技的不断发展,包括混响操作等问题,数字 dsp 技术已经可以很好地把计算任务交给专用的 dsp 芯片来解决,而且已经被 tc 电子和 ssl 等音频设备知名厂商大力推广,大大减少了不能做多任务运算的电脑的 cpu 芯片的负担,从而保证了更加稳定的数字音频工作站(daw)的运行,因为厂家生产的 dsp 效果卡等也都有自己的特殊功能,这些 dsp 效果混响卡继承了很多真正的硬件混响的特点。此外,这些产品可以对 vst、au、rtas 等插件格式的主流音频工作站进行无缝链接,所以这些产品被许多录音师和工程师追捧。近年来,随着不断提高的 cpu 的速度,出现了 64 位运算和多核中央

13、处理器的计算机,以前过大混响计算量不能一次达到,而卓越的 cpu 的出现很好地解决了这一问题,并且有一个很好的发展前景。如此强大的音频信号混响器无论是在公共商业演出还是家庭娱乐中,均发挥着重要作用,它能让我们拥有丰厚,饱满的声音体验,极大地提高了我们的生活质量和精神追求。随着数字技术的发展,当今的数字混响器具有灵活多变等特点,可为我们提供各种需求,根据中国商务部的调查分析,未来五年,混响器产业所带来的效益将以每年百分之二十左右增长。并且用户对产品的期望也越来越高,所以有越来越多的企业开始着力开发更好更完美的混响器产品。不只是在混响器,现在已有混响室等设计理念,并且会有更多的设计理念出来。然而当

14、今的混响器市场主要被国外企业占据,但国内市场巨大,这就为我们的产品设计提供了广阔的市场空间。 1.2 语音信号处理1.2.1 信号的定义信号是传递信息的函数。离散时间信号可以用图形来表示。根据不同的信号的特性,信号可以表示成一个或几个函数的自变量。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他的参量,习惯上将一维变量看成是时间。信号可以分为以下几种:(1)离散时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。(2)连续时间信号:定义的时间范围为连续的信号,但信号的振幅可以是一个连续的值,可以是离散的值。当振幅为连续的情况下,通常被

15、称为作为模拟信号。事实上,常见的连续时间信号和模拟信号可通用,并且以相同的信号来说明。(3)数字信号:时间离散而幅度量化的信号。语音信号是一维数字信号,它是基于时间轴上的,这里主要针对语音信号进行频域分析。在信号分析中,频域比时域包含更多的信息。而对于频域分析,大概有 8 种波形可以让我们分析:矩形方波,锯齿波,梯形波,三角波,余旋波,余旋平方波,临界阻尼指数脉冲波形,高斯波。对于这些波形,我们都可以用傅立叶变换来分析,就是:将时域波形转化为频域来分析。1.2.2 语音信号处理的发展早在一两千年以前,人们便对语言进行了研究。由于没有适当的仪器设备,长期以来,一直是由耳倾听和用口模仿来进行研究。

16、因此,这种语言研究常被称为“口耳之学” ,所以对语音只是停留在定性的描写上。语音信号处理真正意义上的研究可以追溯到 1876 年贝尔电话的发明,该技术首次用声电、电声转换技术实现了远距离的语音传输。1939 年 homer dudley提出并研制成功的第一个声码器,从此奠定了语音产生模型的基础。这一发明在语音信号处理领域具有划时代的意义。19 世纪 60 年代,亥姆霍兹应用声学方法对元音和歌唱进行了研究,从而奠定了语言的声学基础。20 世纪 40 年代,一种语言声学的专用仪器-语谱图仪问世了。它可以把语音的时变频谱用语图表示出来,从而得出了“可见语言” 。1948 年美国 haskins 实验

17、室研制成功“语音回放机” ,该仪器可以把手工绘制在薄膜片上的语谱图自动转换成语音,并进行语音合成。20 世纪 50 年代对语言产生的声学理论开始有了系统的论述。随着计算机的出现,语音信号处理的研究得到了计算机技术的帮助,使得过去受人力、时间限制的大量的语音统计分析工作,得以在电子计算机上进行。在此基础上,语音信号处理不论在基础研究方面,还是在技术应用方面,都取得了突破性的进展。1.2.3 matlab 在数字语音信号处理中的应用数字语音信号处理是将数字信号处理与语音学相结合,解决现代通信领域中人与人、人与机器之间的信息交流的学科。近几年来语音信号处理科学在世界范围内已取得了飞速的发展,由于 m

18、atlab 是一种运算效率高、功能强大、交互性良好的数值计算和可视化计算的高级语言,它将信号处理、图形显示和数值分析有机地融合为一体,是一个极其方便、操作简单、用户界面友好的操作和开发环境。随着 matlab 的不断更新换代,其功能越来越强大,因而被广泛应用于数字语音信号处理、数值图像处理、仿真自动控制、小波分析和神经网络等领域。同时又由于 matlab 具有大量的信号处理工具箱并能利用非线性动态系统分析工具 simulink 等优点,所以近年来 matlab 已经成为数字信号处理的有利工具,因此也成为学习语音信号处理和进行研究工作的仿真软件工具。下面简要介绍 matlab 在数字语音信号中的

19、几方面应用。(1)matlab 可以对数字语音信号进行时域和频域分析。通过 matlab 可以很方便地画出语音信号的时域波形及频域图,并且可以根据语音信号的特性对其进行分析。例如,清浊音的幅度差别、lpc 分析、频谱分析等。(2)matlab 能对数字语音信号进行判别和评估。可根据语音信号的短时参数,和不同语音信号短时参数的性质对一段给定的信号进行清浊音的判断、对语音信号的基音周期进行估计和有无声判定等。(3)通过利用 matlab 对语音信号进行编程处理。由于 matlab 是一种面向数学和工程计算的高级语言,其允许用数学形式的编程语言,而且拥有大量的库函数,所以它具有编程简单、效率高、易学

20、易懂等特点。可以对信号进行加噪和去噪、滤波、截取语音等,也可以进行语音编码、语音识别、语音合成的编程等。1.3 设计理念如果人为地对声音信号进行处理让其具有更完美的音质效果,这样的方法称之为人工混响,人工混响在广播电影电视和音乐制作中被广泛应用。以前的混响处理是采用模拟技术,效果不够理想。随着数字信号处理技术的发展,一些原来只能通过建筑声学才能解决的声学效果问题如今可以利用电声学技术以及数字信号处理技术来实现。在同一个声学环境下,一个声源除了一部分能直接到达人耳外,还有一部分需要通过人体周围的障碍物反射到人耳,而直达声和反射声叠加在一起就形成了混响。本设计正是利用这一特性对音频信号进行了延时,

21、然后进行叠加以达到混响效果,设计效果明显。数字信号处理主要是研究用数字或符号序列表示和处理信号。处理的目的可以是削弱信号中的多余内容,滤除混杂的噪声和干扰,或者是将信号变换为容易分析和识别的形式,便于估计和选择它的特征参数。声音信号是一维连续信号,而计算机只能处理离散信号。为了从离散信号还原连续信号,根据采样定理,可以确定采样频率的最小值。wav 文件是一种数字声音文件格式,本设计基于 matlab 分析了 wav 声音文件频谱与声音的关系。通过 matlab 载入一首歌曲进行延时、混响等处理,然后设计一个混响器来处理这个原始声音的 wav 文件,并比较输出声音信号与原声音信号的异同。利用ma

22、tlab 中的 wavread 命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,依据实际情况对它进行延时、混响等操作。对于波形图与频谱图(包括前后的对比图)都可以用 matlab 画出。我们还可以通过 sound 命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 2 混响的原理2.1 全通滤波混响模型全通滤波的混响模型如图 2.1 所示:图 2.1 全通混响模型图中 m 表示延时,而 g(g1)是反馈增益。此混响模型输入输出方程为: y(n)=-gx(n)+x(n-m)+gy(n-m) (2.1)传递函数为: h(z)= (2.2)mmgzgz12.2 延

23、时延时就是将音源延迟一段时间后,再播放出来的效果处理。根据其延迟时间的长短,可产生镶边、回音、合唱等效果。当延迟的时间在 335ms 之间时,人耳会感觉不到滞后的声音的存在,并且滞后的声音与原音源相叠加后,会因为其相位的干涉而产生梳状滤波效应,这就是我们所说的镶边效果。如果延迟时间达到 50ms 以上,延迟的声音就清晰可辨,这时的处理效果称之为回音。处理回音一般都是用来产生比较简单的混响声效果。镶边、延时、回音、合唱等效果所具有的可调参数大致都相同,包括以下几项:(1)延时时间(dly) ,即调整主延时电路的延时时间。(2)反馈增益(fb gain) ,即控制延时反馈的增益。(3)反馈高频比(

24、hi ratio) ,即控制反馈回路上面的高频衰减。(4)调制频率(freq) ,指主延时电路的调频周期。(5)调制深度(depth) ,指调频电路的调制深度。(6)高频增益(hf) ,指控制高频的均衡。(7)预延时(ini dly) ,指调整主延时电路的预延时时间。(8)均衡频率(eq f) ,这里的均衡频率用于音色的调整,即为频率选择一个均衡的中点。由于进行延时操作所产生的效果均复杂多变,如果非效果处理的专家,可以使用设备提供的预先设置的参数,因为这些预置参数给出的处理效果会比自己设置的要好。2.3 混响混响效果主要是用于增加音源的融合感。自然音源的延时声阵列非常密集、复杂,所以模拟混响效

25、果的程序也复杂多变。常见参数有以下几种:(1)混响时间:能逼真的模拟自然混响的数码混响器上均有一套非常复杂的程序,虽然其拥有很多参数可调,然而相比原有的效果,调整这些技术参数都不会更为自然,特别是对于混响时间。(2)高频混降:为了产生比较自然的混响效果,此项参数用于模拟空气对高频部分的吸收效应。一般情况下高频混降的可调范围为 0.11.0。高频混降越高,混响效果就越接近自然混响;相反较低时,混响效果就较清澈。(3)扩散度:扩散度可改变混响声阵密度的增长速率,其可调范围为 010,位于较高值时,混响效果体现出丰厚、温暖的特点;位于较低值时,混响效果就比较空旷、冷僻。(4)预延时:建立自然混响声阵

26、会延迟一段时间,预延时即为模拟次效应而设置。(5)声阵密度:调整声阵密度参数可改变声阵的密度,当数值较高时,混响的效果为温暖,但有明显的声染色;相反,数值较低时,混响效果变为深邃,并且声染色也相对较弱。(6)频率调制:这一参数技术性较高,由于电子混响的声阵密度比自然混响的稀疏,为了让混响声听起来比较平滑、连贯,需要对混响声阵列的延时时间进行调制。此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。(7)调制深度:指上述调频电路的调制深度。(8)混响类型:不同房间的自然混响声阵列差别也较大,而这种差别也不是一两项参数就能表现的。在数字混响器当中,不同的自然混响需要不同的程序。其可选

27、项一般有房间(room) 、小厅(s-hall) 、大厅(l-hall) 、随机(random) 、反混响(reverse) 、钢板(plate) 、弹簧(sprirg)等。其中自然混响效果包括房间、小厅、大厅混响;早期机械式混响效果可以用钢板、弹簧混响来模拟。2.4 声激励 如果对音响音源信号进行浅度的限幅处理,就会产生一种类似饱和的音感效果,从而使其发音在不增大其实际响度的基础上表现出有响度增大的效果。一些常用的效果器上也有非线性饱和的效果,实际上就是有信号的振幅处理,用来模拟三极管上的大电平信号达到饱和所引起的非线性,进而产生发硬的音感效果。由于限幅失真主要是产生额外的高次谐波,因而现在

28、设计的激励器,为了达到柔和的处理效果,在音源中, 通过加置高次载波的成分来模拟限幅失真,能营造出不那么嘶哑的声激励效果。另外,用一个高通滤波器来强化高次谐波,对原来的信号进行处理之后再叠加在经过延时处理的原信号上,这样可以产生清澈的声音效果。所以,经过这样的处理方式后便可产生出清澈的激励。由于激励处理和音响设备的过载失真大致类似,所以如果对音源进行过量的激励,就会产生令人不适的嘈杂感。由于早期的音响设备保真度都不高,我们已经慢慢习惯了那种略显嘈杂的音响,而现在接触的音感清澈的高保真音响,反而让我们不太习惯,感觉它的发音十分柔弱。人声音源中,除了那些经过特殊训练的人之外,我们大部分人的发音都缺乏

29、劲度,所以需要对声音进行激励处理。声激励处理主要有下面几个方面:(1)对人声的乐音激励处理,频谱的分布以 2500hz 处为中间点。这种激励处理后的效果比较好,音源突出感的增加也很明显。(2)对人声的鼻音激励处理,频谱的分布以 500hz 为中点。这种激励能有效地增加人声的劲度。(3)对于人声的 800hz 附近的激励,音源的喧嚣嘈杂感大大增加,然而此处理方法不应经常使用,最好只在演唱摇滚乐时使用。(4)对人声 3500-6800hz 的频谱,激励处理不适合使用,因为它容易让音源产生令人不适的嘈杂声。(5)而人声的齿音一般不使用激励处理,那是由于此频段很容易让人察觉有失真。如果要对齿音做少量的

30、激励处理,可以用数字式激励器,因为数字式激励器的激励效果比较柔和,可以增强齿音的清析感。而处理的频谱应该在 7200hz以上。激励处理对于歌唱发音通常要保守一些。我们在调音当中,因为激励处理所产生的音感效果可能会随听音的时间而逐渐被弱化,那么我们在调节激励效果时,时间最好在 10 分钟以内。对于人声音源的激励处理,最好是用数码效果器。它通常有以下几项调整参量:(1)输入增益(gmn),用来进行输入电平的调节,这里千万别使设备产生过载。(2)调谐频率(tuning),根据你需要处理的频段来选择一个恰当的频率。(3)驱动电平(drive),用来调整激励的深度。当驱动电平较大时,会产生比较嘈杂的效果

31、;而驱动电平较小时,产生的效果则比较温和。(4)混合比率(mix),即原信号与效果信号的响度比。2.5 相位的调节 立体声的音乐作品需要进行相位的调节,这是混音中很重要的一环。这样能使混好的音乐作品层次分明,并且真正体现立体声的效果。相位的调节有左右,前后之分。左右声道的调节比较简单,一般的音频软件都可以很方便的调节,只要戴上耳机,可以很轻松的调整和听到调整后的效果。前后层次的音相调节比较复杂,一般来说,用简陋的硬件设备很难录出层次感很强的多轨音乐。只能依靠软件后期下比较大的工夫去慢慢调节。有一些专门调整音相的效果器插件,如 pan handle,还有 ul trafunk 出的 surrou

32、nd 插件都是不错的相位调节器。前与后的关系,实际上就是混响时间长与短的关系。对于要处于后方的声音,使其混响时间更长一些,它的声音便会模糊和有距离感,对于要处于前方的声音,使其混响时间稍短一些,它的声音就会清晰和逼近。2.6 整体缩混输出这一部分实际上没有什么太多可以提及的。因为我们用电脑软件来操作,和专业的母带生产流程自然不同。在多轨录音软件如 samplitude 2496,cool edit pro 里面编辑完成以后,选择export命令(cool edit pro 里面是 mix down 命令),就可以将多轨音频合成为 2 轨立体声输出。你可以选择输出的格式,如wav、mp3、rm

33、等等。当然 wav 文件的音质最好,占的空间也要大的多。这样,辛辛苦苦的录音、编辑、混音终于有了一个成果。有时候,这样导出的.wav 文件还需要处理一下。比如用母带处理软件 t-racks 最后小小压缩一下,使声音更加柔和温暖,更符合人耳的听觉习惯。2.7 多重混响处理 多重混响的处理,大多数人都是使用反复试探性调节的方法,以寻找音感效果最好的处理效果。此种调音方式的不足十分明显:寻找一个理想的调音效果,需经多次猜测,所以需要教长的时间。较好的调音效果常常是偶然遇到的,这对于调音规律的归纳总结没什么帮助,并且以后也不易再现。不同设备的各项固定参数和可调参数都不尽相同,因而使用某一设备的经验,通

34、常都无法用于另一设备。发展到目前的效果处理设备,用于改变音源音色的手段并不是太多,比较常用的方法只有限幅失真、延时反馈、频率均衡等 3 种,但是这些效果处理设备的参数的不同组合所产生的音色大不一样。效果处理器参数的设置可以有很多项,特别是延时反馈,模拟混响效果参数的设置在理论上可以达到几十项。当然这些专业性非常强的参数,大多数人都难以理解。因此,绝大部分的效果处理设备都只有一、二个参数可调,并且其可调的范围也比较狭窄。这种使用简单的效果处理设备容许人们在上面进行微幅的调整,因而不会出现太大的问题。但是对于处理效果要求比较高的调音场合,如在多轨录音系统当中,就必须使用更加专业的效果处理设备,用以

35、做出更为精细的处理效果。2.8 频率均衡 很明显,如果频率均衡的分段越多,那么效果处理的精细程度也就越高。一般调音的均衡单元通常只有三四个频段,这显然满足不了精确处理音源的要求。为了能足够灵活的对人声进行任意的均衡处理,我们建议使用增益、频点和宽度都可调整的四段频率均衡。大多数的频率均衡的可调参数只有增益一项,然而这并不意味着其他两项参数不存在,而且这两项参数为不可调的固定参数。当然这两项参数设置为可调也并非难事,但这些会增加设备的生产成本,并会使其调整变得复杂化。所以增益、频点和宽度都可调整的参量均衡的电路,常常只有在一些高档设备上才能见到。实际上,增益、频点和宽度都是可调整的频率均衡,不可

36、能胡猜乱试就可以找出一个接近完美的音色。在这里我们必须探究出音频信号的技术参数和物理特性以及它们在人的听感上所对应的关系。由于人声音源频谱的分布会比较特殊,就其发音方式而言,就有 3 个部分:一是由于声带震动产生乐音,这部分发音最灵活,还有不同发音、不同音高的方式产生的频谱的变化也很大;第二是鼻腔内形状比较稳定,所以其共鸣产生的谐音频谱的分布变化不是太大;第三是口腔中的气流流动在齿缝间的摩擦声,它与声带震动产生的乐音基本上没有关系。频率均衡可以大致的将这三部分频谱区分出来。鼻音的频率段一般在 500hz以下,均衡的中点频率大概在 80150hz,均衡带宽为 4 个倍频程。比如,可以将 100h

37、z 设定为频率均衡的中点,均衡曲线可从 100400hz 平缓的过渡,均衡增益调节的范围可以为+10db-6db。这里应该注意的是:进行此项调整的监听音箱不能使用低频发音不强的小箱子,这样可以避免无意间加重鼻音。人声乐音的频谱随者人声的音调的变化也很大,因而调节乐音的均衡曲线应非常平缓,均衡的中点频率可在 10003400hz 之间,均衡带宽为六个倍频程。此频段影响歌唱发音的明亮度,再向上调节可温和地提升人声的亮感。然而如需降低人声的明亮度,就会麻烦一些。在一般情况下人声音感过分明亮多是由于 2500hz 左右的频谱较强,这里我们可用均衡带宽为 1/2 倍频程,均衡增益大概为-4db 的均衡处

38、理,在 2500hz 附近找到一个频点的效果比较好即可。人声齿音的频谱分布主要在 4khz 以上。由于此频段也包括了部分乐音频谱,因此建议调节齿音的频段为616khz,均衡带宽为三倍频程,均衡中点频率在 1012khz,均衡增益最大可调至+10db;如果需要使人声齿音响度降低,则应使用均衡带宽为 1/2 倍频程,均衡中点频率为 6800hz 的均衡处理,其均衡增益可下降至-10db。从上面的分析可以看出,在进行人声频率均衡处理时,为突出某一音感进行频段的提升,都应该尽量地使用平缓的宽频带来均衡。这样可以使人的鼻音、乐音、齿音三部分频谱分布均匀连贯,使其发音更加自然、流畅。理论上讲,应使人声在发

39、出任何音时,其响度都应保持恒定不变。为了在不破坏人声自然感的基础上对其进行特定的效果处理可以使用 1/5 倍频程来均衡处理,具体情况有以下两种:(1)音感狭窄,缺乏厚度,可以在 800hz 处用 1/5 倍频程衰减来处理,衰减最大值可以在-3db。(2)卷舌齿音的音感尖啸,嘘音缺乏清澈感,可在 2500hz 处用 1/5 倍频程的衰减处理,其衰减的最大值可以在-6db。对音源的均衡处理,最好是使用能显示均衡的曲线的均衡器。一般数字调音台均衡器上的均衡增益的调节用按钮 “g”来标识,均衡频率调节钮用“f”来标识,均衡带宽调节钮用“f”或“q”来标识。3 音频信号与 matalb3.1 音频信号的

40、格式(1)wav 格式wav 文件格式由微软公司开发,它符合 piff 文件规范,用于保存windows 平台上的音频信息资源,它支持 windows 平台和应用程序。“.wav”格式支持 msadpcm 等压缩算法,并且支持多种采样频率、声道及音频位数,和 cd 格式一样,标准格式的 wav 文件也是 44.1k 的采样频率,速率88k/秒,量化位数为 16 位。所有的 wav 文件都是有一个文件头的,这个文件头就是音频流的编码参数。wav 对音频流的编码没有一定的要求,除 pcm 之外,几乎所有支持 acm 规范的编码都可以对 wav 的音频流进行编码。同样,wav 也可以使用多种的音频编

41、码来压缩其音频流,只不过我们常见的音频流都是被 pcm 编码所处理的,但并不是 wav 只能使用 pcm 编码,而 mp3 编码同样也可以运用在 wav 中。在windows 中,基于 pcm 编码的 wav 格式是被支持得最好的音频格式,当中所有音频软件都能完美支持,由于其本身可以达到较高的音质要求,因此,wav也是音乐编辑创作的首选格式,也适合保存音乐素材。基于 pcm 编码的 wav是一种中介格式,经常用于其他编码的相互转换,比如 mp3 转换成 wma。(2)mp3 格式mp3 格式指的是 mpeg 标准中的音频部分,也就是 mpeg 的音频层。根据其压缩的质量和编码处理的不同将它分为

42、 3 层,分别是“.mp1” 、 “.mp2” 、“.mp3” 3 种声音文件。mpeg 音频文件是有损压缩,相同长度的音乐文件,用.mp3 格式储存,一般只有.wav 文件的 1/10,而且音质没有 cd 格式和 wav 格式好。但是其文件尺寸小,而且音质好,在它问世之初其它的音频格式不能与之匹敌。直到现在,mp3 格式还在风靡,其主流音频格式的地位难被撼动。(3)wma 格式wma 就是经 windows media audio 编码后的文件格式,由微软开发,wma针对的不是单机市场,而是网络。它的竞争对手就是网络媒体市场中著名的 real networks。微软声称,只有在 64kbps

43、 的码率情况下,wma 才可以达到接近 cd的音质。和以往的编码不同,wma 支持防复制的功能,它通过 windows media rights manager 加入保护,能限制播放的时间和播放的次数甚至于播放的机器等等。wma 还支持流技术,即一边读一边播放,因此 wma 可以很轻松的实现在线广播,微软在 windows 中加入了对 wma 的支持,并且 wma 有着优秀的技术特征,在微软的大力推广之下,这种格式正被越来越多的人所接受。(4)ogg 格式随着 mp3 播放器的流行,生产 mp3 播放器的品牌和厂家越来越多,它们的竞争也越来越激烈,还有 mp3 手机的挤压,所以许多上游 mp3

44、 随身听厂商纷纷寻找其它出路,有的在外观上改变创新,有的在做工上更加求精,有的推出更大容量的机型,还有的改进解码功能,支持新的文件格式。而在众多的新格式当中,ogg 凭借其免费、开源的特点,得到了 mp3 播放器厂商的青睐。这里所说的 ogg 的全称是 ogg vobis。ogg 是一个庞大的多媒体开发计划的项目名称,其涉及视频音频等方面的编码开发。vobis 是某音乐作品中一个人物的名字,这里借用它来说明 ogg vobis 是关于音频方便的。ogg vobis 有一个很出众的特点,就是支持多声道,它的流行,使以后用随身听来听 dts 编码的多声道作品将不再是梦想。在压缩技术上 ogg vo

45、bis 比 mp3 好,但稍逊于mp3po,但是它的多声道、免费、开源等特点,能够让它很有可能成为一个流行的趋势,这也正是一些 mp3 播放器对其支持的原因。(5)ape 格式ape 是由 monkeys audio 提供的一种无损的压缩格式。monkeys audio 提供了 winamp 的插件支持,这就意味着压缩后的文件不再是单纯的压缩格式,而是和 mp3 一样可以播放的音频文件格式。由于这种格式的压缩比远低于其他的格式,能够做到真正的无损,因此获得了不少发烧用户的青睐。在现有的不少无损压缩方案种,ape 是一种有着突出性能的格式,极低的压缩比以及快速的压缩速度,成为了不少朋友私下交流发

46、烧音乐的一个选择。(6)acc 格式aac(高级音频编码技术)是一种为音乐社区提供的技术,来自于杜比实验室。aac 号称最大能容纳 48 通道的音轨,其采样率达 96 khz,并在 320kbps 的速率下能为 5.1 声道的音乐节目提供近似于 itu-r 广播的品质。与 mp3 比较起来,其音质比较好,还能够节省大约 30%的储存空间和带宽。它遵循 mpeg-2 的规格。3.2 matlab 能读取的音频格式利用专门的音频处理软件,比如 cooledit、spectralab 等,可以方便的录制声音、分析频谱。这种方式也无需复杂的操作或者专业知识,就可以实时的观察结果。利用这些软件在平时实验

47、数据的测量和分析中,足够用了;但是这些软件处理的数据精细程度往往不够,无法应用于论文中。这种情况下,就需要把音频文件导入到 matlab 中进行处理。而 matlab 能直接输入输出的有.wav 和.au 文件。下面我将利用 matlab 载入一首.wav 格式的歌曲来进行混响的操作。4 设计步骤和编程4.1 用 matlab 读取一段音频信号这里以 taylor swift 的22为例。x,fs,bits=wavread(22.wav);%读取音频信号,采样值放在向量 x 中,fs 表示采样频率(hz),bits 表示采样位数。4.2 对音频信号进行混响 fs=44100;nbits=16;

48、x,fs,bits=wavread(22.wav);%读取名为“22”的音频文件。a=zeros(100,1); zeros(100,1);x;%对音频文件进行延时,延时时间为 25ms。b=zeros(100,1);x; zeros(100,1);%另一路延时,时间为 12.5ms。c=x;zeros(100,1); zeros(100,1);%原信号。y=a+b+c;%将两路延时与原信号叠加。4.3 播放混响后的音频信号fs=44100;nbits=16;x,fs,bits=wavread(22.wav);a=zeros(100,1); zeros(100,1);x;b=zeros(100

49、,1);x; zeros(100,1);c=x;zeros(100,1); zeros(100,1);y=a+b+c;sound(y,fs);%回放经叠加混响后的音频信号。4.4 全通结构的混响器fs=44100;nbits=16;x,fs,bits=wavread(22.wav);a=zeros(100,1); zeros(100,1);x;b=zeros(100,1);x; zeros(100,1);c=x;zeros(100,1); zeros(100,1);y=a+b+c;d=0.5;%反馈增益为 0.5。az1=d,0,0,0,0,0,0,1;bz1=1,0,0,0,0,0,0,d;

50、z=filter(az1,bz1,y);%进行全通滤波混响后的音频信号。sound(z,fs);%回放最后的混响效果。5 实验步骤(1)打开 matlab 软件,输入程序fs=44100;nbits=16;x,fs,bits=wavread(22.wav);载入歌曲,如图 5.1。图 5.1 载入歌曲(2)输入延时叠加程序a=zeros(100,1); zeros(100,1);x;b=zeros(100,1);x; zeros(100,1);c=x;zeros(100,1); zeros(100,1);y=a+b+c;进行叠加混响,如图 5.2。图 5.2 混响操作(3)输入回放命令soun

51、d(y,fs);进行音频回放,如图 5.3。图 5.3 回放操作此时就可以听到混响后的歌曲。(4)同理,可输入fs=44100;nbits=16;x,fs,bits=wavread(22.wav);a=zeros(100,1); zeros(100,1);x;b=zeros(100,1);x; zeros(100,1);c=x;zeros(100,1); zeros(100,1);y=a+b+c;d=0.5;az1=d,0,0,0,0,0,0,1;bz1=1,0,0,0,0,0,0,d;z=filter(az1,bz1,y);sound(z,fs);进行全通混响的回放,如图 5.4。图 5.4

52、 全通混响回放同样可以听见全通混响后的歌曲,并且混响效果更好。(5)关闭 matlab。6 结 论经过延时和混响的声音信号,其前后的试听效果有了显著的变化,我们可以听见显著的混响效果。而经过回放的语音也有了变化,达到了设计目的,效果明显。对音频信号的处理虽有多种,但是本设计能很好地体现音频信号的特点。我们可以用不同的算法来得到个人所需求的混响效果,并能够听出它们的异同。通过此次设计对数字信号处理有了更进一步的熟悉,实际操作加深了对课本上的知识的理解。本次设计是音频信号混响器设计,对语音信号进行延时、混响等操作。通过上网搜索资料,查阅课本及课外书籍,进行了采集语音,语音处理,语音分析等工作,加强

53、了对 matlab 程序的编写能力以及对数字信号处理的相关知识的理解。毕业设计是培养学生综合运用所学知识,发现、提出、分析和解决实际问题,锻炼实践能力的重要环节,是对学生实际工作能力的具体训练和考察过程,通过设计我们能够比较系统的了解理论知识,把理论和实践相结合,并且用到生活当中。在做设计的过程中总会出现各种问题,在这种情况下我们都会努力寻求最佳路径解决问题,无形间提高了我们的动手,动脑能力,并且同学之间还能相互探讨问题,研究解决方案,增进大家的团队意识。通过这次设计让我知道了,我们平时所学的知识如果不加以实践的话等于纸上谈兵。毕业设计主要是我们理论知识的延伸,它的目的主要是要在设计中发现问题

54、,并且自己要能找到解决问题的方案,形成一种独立的意识。我们还能从设计中检验我们所学的理论知识到底有多少,巩固我们已经学会的,不断学习我们所遗漏的新知识,把所有知识学的扎实。我相信经过此次设计不仅能提高我个人的思考和实践能力,还会对我将来的生活产生深远影响。参 考 文 献1 冒捷.dsp 数字化音频领域的未来r.西部广播电视,2000. 2 张雪英.数字语音处理及 matlab 仿真m.北京:电子工业出版社.2010.3 张雄伟,曹铁勇.dsp 芯片的原理与开发应用m,第二版.北京:电子工业出版社,2000. 4 张承云,谢志文,谢菠荪.多媒体计算机的音频实时处理j.电声技术,2000.5 孙安

55、民.利用多媒体计算机处理立体声信号j.电声技术,1998. 6 游林儒,李慧,方昌始.基于 dsp 的数字效果器的研究r.电子技术应用,2004. 7 刘金福.人声效果的精细处理j.音响技术,2008.8 王冀.均衡与混响的调音技巧j.音响技术,2012.9 陈品,张福洪.数字信号处理器引导装载方式研究n.杭州电子工业学院学报,2002.10 王兴国,蒋伟峰.数字混响器设计j.电子学报 2000(07).11 姜晓云,李文靖.数字混响器及其改进n.山西大同大学学报.12 李萍,张秀丽,陆光华.数字混响效果器的设计研究j.电路与系统学报,2007,12.13 张飞碧.数字混响效果器的原理及应用j.音响技术,2002(4).14 李承智.人工混响算法j .电声技术,2002,26(10):11-13.15 彭妙颜,张承云.人工混响的设计方法j.电子技术,2006,30(1):11-13.16 张洪涛.数字信号处理m,第一版.华中科技大学出版社,2007.17 杨述斌.数字信号处理实践教程m,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论