数字音频处理技术第三章_第1页
数字音频处理技术第三章_第2页
数字音频处理技术第三章_第3页
数字音频处理技术第三章_第4页
数字音频处理技术第三章_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字音频处理技术第三章第3

数字音频处理技术3.1音频处理概述3.1.1什么是声音3.1.2声音的基本参数3.1.3人的听觉特性3.1.4音频信号处理过程3.2音频的数字化3.2.1音频的采样3.2.2音频的量化3.2.3声道数3.2.4音频的编码与压缩技术3.2.5数字音频的质量3.3音频文件格式及标准3.3.1波形文件格式3.3.2MPEG音频文件格式3.3.3流媒体音频文件格式3.3.4MIDI3.4音频软件的使用3.4.1常见音频软件简介3.4.2CoolEdit3.5音频效果处理技巧3.5.1常用音频编辑命令3.5.2常用音效命令3.5.3特殊音频的生成3.1音频处理概述物理学角度:声音是一种由物体振动产生的机械波,并在弹性介质(如空气等)中传播。可以用“声波”来表示声音,声波是一条随时间变化的连续曲线。3.1.1什么是声音声音信号的波形单音信号波形

由单一频率和振幅组成的声音信号。一般只有电子仪器才能产生。复合信号波形由若干频率和振幅各不相同的正弦波组成。自然界存在的声音大多是复合音。3.1.2声音的基本参数1.频率表示声波每秒中出现的周期数目,即变化的次数。以赫兹Hz为单位。频率反映音调高低:频率越高,音调越细尖;频率越低,音调越粗低。声音的基本参数:频率和振幅2.振幅振幅决定声音的强度,振幅越高,声音越强;振幅越低,声音越弱。以分贝dB为单位。人耳的听觉范围在听阈与痛阈之间。听阈:人耳刚刚能听到的最低声音,如0dB。痛阈:当声强过高,超过120dB时,会使人耳感到疼痛。3.1.3人的听觉特性1.频率与音强的关系人耳对不同频率段声音的音强敏感度差别很大,不同频率的声音要达到能被人耳听到的水平所需要的强度是不一样的。人耳对2KHz~4KHz范围的信号最敏感一种音频信号会阻碍听觉系统感受另一种音频信号的现象,前者称为“掩蔽音”,后者称为“被掩蔽音”。2.掩蔽效应在一定频率范围内,强音频信号会掩蔽在其附近同时存在的弱音频信号,使得弱音被强音“掩蔽”掉。除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象。包括超前掩蔽和滞后掩蔽。频域掩蔽时域掩蔽3.1.4音频信号处理过程

将时间和幅度都连续的模拟音频信号,经过一定的变化和处理,使其变成时间和幅度都离散的二进制数字信号的过程。音频数字化过程3.2音频的数字化

把模拟音频信号在时间域上,按照设定的时间间隔,读取音频信号波形的幅度值,再用若干位二进制数表示此幅度值的过程。采样3.2.1音频的采样采样时间间隔称“采样周期”采样周期的倒数称“采样频率”,单位为Hz。采样频率决定每秒钟所取声波幅度样本的次数。隔相等的时间间隔的采样称为“均匀采样”;采样时间间隔不恒定的,称“非均匀采样”。采样周期和采样频率fs>=2f或Ts<=T/2其中:fs―采样频率;f―音频信号的最高频率;Ts―采样周期;T―音频信号的最小周期。奈奎斯特理论(Nyquisttheory)采样频率与声音质量的关系采样频率直接影响到声音的质量,采样频率高,每秒采集的样本多,声音保真度越好,但数据存储量也越大。几种常用的采样频率人类话音频率范围:300Hz~3000Hz人耳能听到的声音频率范围:20Hz~20KHz3.2.2音频的量化量化是对采样后信号幅度值进行离散化处理。1.量化过程①划分量化阶距。

将声波幅度值划分为有限个小幅度(量化阶距△)的集合:

量化阶距△=2Xmax/2B,其中:

Xmax

―声波最大幅值;B―二进制量化值的位数②赋量化值。

把落入某个量化界线±1/2范围内的采样值归为一类,赋予同样的量化值。均匀量化与非均匀量化采用相等的量化阶距处理采样得到的信号值称为均匀量化(线性量化)。实际量化中,通常会以人的听力敏感度为准来设定更适合且不同大小的量化阶距,这种方式称为非均匀量化。

指量化后二进制样本值的位数(bit/s或b/s)。

2.量化精度样本值位数取值范围量化精度3位0~71/816位0~655351/65536

量化位数越多,声音质量越高,但数据量也越大。量化精度用信噪比SNR(单位:分贝dB)表示:其中:Vsignal

―信号电压Vniose―噪声电压量化后的样本值Y与原始值X的差E=Y-X。量化误差随量化阶距变大而增加,样本位数的大小影响声音质量,位数越多,声音还原越真实。量化误差(量化噪声)3.2.3声道数一次采样记录的声音波形个数决定声道数多少。声道数多,音质音色更好更真实,存储容量也要相应增加。单声道Mono:记录声音时,每次生成一个声波数据。立体声Stereo:记录声音时,每次生成两个声波数据。多声道:如4.1声道,即前后左右各一个声道,“.1”是指低音音箱(低音炮),用来播放分离的低频声音。3.2.4音频的编码与压缩技术音频质量数据量计算复杂度音频压缩编码时考虑的因素:常见音频编码算法和标准

基于音频数据的统计特性进行的编码,其目标是使重建语音波形保持原波形的形状。特点:算法简单,易于实现,可获得高质量语音。1.波形编码

将音频信号以某种模型表示,再抽出合适的模型参数和参考激励信号进行编码;播放声音时,使用这些参数通过话音生成模型重构声音信号。特点:算法复杂,计算量大,音质比较差,但保密性能好,压缩率高,常用在军事上。2.参数编码

将波形编码的高质量和参数编码的低数据率结合在一起的编码方式。特点:效果较好。

3.混合编码

利用人耳的听觉特性,如掩蔽效应等,在编码过程中保留人耳可以听到(感知)的部分,而忽略人耳听不到(不能感知)的部分,将听众察觉不了的信号去除。特点:属于有损压缩编码。4.感知编码3.2.5数字音频的质量音质与数据率3.3音频文件格式及标准CDA文件CD唱片采用的格式音质好无法复制3.3.1波形文件格式WAV文件微软和IBM公司联合开发的通用音频文件基本无数据压缩声音效果好数据量大VOC文件Creative公司开发声霸卡使用的音频文件格式带有浓厚的硬件相关色彩MPEG运动图像专家组(MovingPicturesExpertsGroup)

1988年由国际标准化组织ISO和国际电工委员会IEC联合成立,负责开发电视图像数据和声音数据的编码、解码和同步等标准。3.3.2MPEG音频文件格式现有的MPEG标准:MPEG-1:数字电视标准MPEG-2:数字电视标准MPEG-4:多媒体应用标准MPEG-7:多媒体内容描述接口标准

全称“MPEG-1Layer3”音频文件。MP3声音文件存储空间只相当于WAV文件的十分之一,但音质与CD唱片大体接近,因此在网络、可视、通信方面应用十分广泛。MP3声音文件MPEG-1标准提供三个独立的压缩层次,各层压缩率:3.3.3流媒体音频文件格式主要有:RealNetwork公司的RealMedia(*.RA,*.RAM或*.RM)Microsoft的WindowsMedia(*.asf和*.wmv)Apple公司的QuickTime(*.MOV)采用流式传输的方式在Internet播放的各种媒体信息,如音频、视频、动画等。相对于传统的下载后播放方式,流媒体使得用户可以边接收边播放,减少了大量的等待时间。流媒体电子乐器数字接口(MusicalInstrumentDigitalInterface)的缩写,一种定义MIDI电子音乐设备与计算机之间交换音乐信息的国际标准协议,规定了使用数字编码来描述音乐乐谱的规范。常见的MIDI文件:*.MID、*.RMI等

MIDI音频文件是一个脚本语言,它通过对“事件”编码,产生声音。一个MIDI事件包含一个音阶的音调、持续时间和音量等参数。

3.3.4MIDIMIDI原理:根据傅立叶级数理论,任何一种波形信号都可被分解成若干个频率不同的正弦波1.MIDI乐音合成方法频率调制(FM)合成法FM声音合成器波形也称波形表合成法。原理:先记录各种乐器的真实声音,并进行数字化处理,形成波形数据,存储在ROM中。

发音时通过查表找到所选乐器的波形数据,再经过调制、滤波、再合成等处理形成立体声回放。优点:直观、真实,更接近自然的声音。乐音样本合成法2.MIDI系统简介

当作乐器使用的设备,如乐器键盘。

MIDI控制器产生一套指示电子音乐合成器要做什么、怎么做(如演奏某个音符、加大音量、生成音响效果)的标准指令。MIDI控制器与其他设备的接口,包括MIDIIn输入、MIDIOut输出、MIDIThru传输三种。MIDI端口为MIDI作曲而设计的计算机程序或电子装置,用于记录、编辑、播放MIDI声音文件。分硬件和软件两种,目前大多数为软件音序器。音序器集成在声卡上。

利用数字信号处理器或其他芯片产生音乐或声音的电子装置。功能:解释MIDI文件中的指令符号,然后生成所需要的声音波形,经放大后由扬声器播出。合成器两种合成器说明:音色:声音的音质音调:指合成器能够播放的音符数。播放音频的设备。扬声器3.MIDI乐音特点生成的文件比较小。容易编辑。适合重现打击乐。需要长时间播放高质量音乐时;需要以音乐为背景的音响效果,同时从CD-ROM中装载其他数据时;需要以音乐为背景的音响效果,同时播放波形音频或实现文-语转换,实现音乐和语音同时输出时。MIDI音乐适合的情况3.4音频软件的使用专业级多轨录音和音频处理软件。

SyntrilliumSoftwareCorporation公司开发。

功能强大、效果出色。详见下节介绍。1.CoolEditPro3.4.1常见音频软件简介

Windows操作系统附带的声音处理软件,支持*.WAV格式文件,功能简单:设置不同的参数录音;使用不同的算法压缩声音,向文件中添加、删除部分声音;更改声音回放速度和音量;更改或转换声音文件格式类型;添加回音,反转声音。2.Windows录音机共享软件,小巧,即拷即用。主要功能:可将文件保存成MP3、WAV、AU、SND、RAW、AFC等多种格式;从CD、DVD、VCD及其它视频文件中获取声音;以不同的采样频率录制声音信号;声音剪辑,如删除、复制和连接声音片段;增加特殊效果,如混响、回音、变频、淡入淡出、反转等。3.GoldWaveSonicFoundry公司开发,具有全套的音频处理、工具和效果制作等功能,界面简单、可操作性强。4.SoundForgeCakewalk。最著名的MIDI工具软件,功能强大,可编辑、创作、调试MIDI音乐。MidisoftStudio。专业MIDI制作软件,能够录制、播放MIDI等格式的乐曲,并能够编辑可打印乐谱(五线谱)。5.MIDI音乐软件录制音频文件;多文件、多音轨操作。剪切、粘贴、合并、混合音频;提供多种特效,如降噪、回声、延迟、调整音调等;可生成噪音、静音、电话信号等声音;自动静音检测和删除,自动节拍查找;多种文件格式转换。软件功能3.4.2CoolEdit简介分为“波形文件编辑界面”和“多音轨编辑界面”两种。

用功能键F12或切换按钮进行切换。CoolEdit界面1.CoolEdit界面——波形文件编辑界面1.CoolEdit界面——多音轨编辑界面2.菜单结构2.菜单结构3.5音频效果处理技巧3.5.1常用音频编辑命令1.声音的插入、混合和替换插入:将数据插入到当前文件插入点之后,原波形文件数据后移。替换:被插入的数据替换原波形数据。混合:被粘贴的数据与当前选定的部分叠加。操作步骤拖动鼠标,选择需要混缩粘贴的声音波形,单击【编辑】—【复制】;单击【编辑】—【混合粘贴】,打开【混缩粘贴】对话框。【编辑】—【转换音频格式】2.将单声道转为立体声3.调整采样率【编辑】—【调整采样率】3.5.2常用音效命令1.菜单栏【效果】的常用命令反相:将波形振幅交换。静音:产生无声音的波形倒置:把声波从后往前,反向播放反相前反相后【效果】—【变速变调】—【变速器】2.改变声音频率和节拍预设框【效果】—【波形振幅】—【渐变】恒量改变:改变声波振幅,即改变音量淡入淡出:声音波形振幅逐渐增大或减小3.调节音量大小【效果】→【噪音消除】可降低背景噪音,并进行破音修复等操作。4.特殊音效5.噪音消除【效果】—【波形振幅】—【渐变】房间回声:产生在房间中的回声效果延迟:产生一个滞后播放的声音3.5.3特殊音频的生成菜单栏【效果】-【生成】静音DTMF信号音调(Chord)噪波(白噪)音调(A440)本章小结本章介绍了声音的基础知识,如声音的基本参数和人的听觉特性等。详细介绍了数字化音频的过程和一些关键技术,如采样、量化的概念,几种常见的音频编码技术等。此外还介绍了一些常见的音频文件格式,并对音频处理软件CoolEdit做了详细介绍。思考与练习一、选择题1.下述声音分类中质量最好的是

。A.数字激光唱盘

B.调频无线电广播

C.调幅无线电广播

D.电话2.下面哪个不是常用的音频文件的后缀?A.WAVB.MIDC.MP3D.DOC3.下列采集的波形声音

的质量最好。A.单声道、8位量化、22.05kHz采样频率

B.双声道、8位量化,44.1kHz采样频率C.单声道、16位量化、22.05kHz采样频率

D.双声道、16位量化、44.1kHz采样频率4.在数字音频信息获取与处理过程中,下列顺序正确的是

。A.A/D变换、采样、压缩、存储、解压缩、D/A变换B.采样、压缩、A/D变换、存储、解压缩、D/A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论