《音频信息处理技术》PPT课件

上传人：A*** IP属地：广东上传时间：2022-02-04 格式：PPT 页数：68 大小：2.53MB 积分：22 举报 版权申诉

已阅读5页，还剩63页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、本章导读音频信息处理技术是多媒体信息处理的主要技术之一，它使计算机具备了录音、音频信息处理技术是多媒体信息处理的主要技术之一，它使计算机具备了录音、声音编辑、语音合成、声音播放等功能。在声音编辑、语音合成、声音播放等功能。在MPC中，可以通过声音传递信息、制造效中，可以通过声音传递信息、制造效果、营造气氛及演奏音乐等。目前的音频信息处理技术主要包括模拟声音信号的数字果、营造气氛及演奏音乐等。目前的音频信息处理技术主要包括模拟声音信号的数字化、数据压缩编码、数字音效处理、音频文件存储、传输、播放等内容。本章主要介化、数据压缩编码、数字音效处理、音频文件存储、传输、播放等内容。本章主要介绍声音

2、信号及其数字化的基本概念、音频卡的组成及其工作原理、数字音频的采集与绍声音信号及其数字化的基本概念、音频卡的组成及其工作原理、数字音频的采集与编辑、编辑、MIDI音乐以及几个常用的音频处理软件等内容，并以音乐以及几个常用的音频处理软件等内容，并以Adobe Audition3.0版本为版本为例，详细介绍音频信息编辑处理的具体方法。例，详细介绍音频信息编辑处理的具体方法。本章主要内容本章主要内容4.1 4.1 音频基础知识音频基础知识 4.2 4.2 音质标准与评价音质标准与评价4.3 4.3 音频的数字化与编码音频的数字化与编码4.4 4.4 音频卡音频卡4.5 4.5 数字音频的采集与编辑

3、数字音频的采集与编辑4.6 MIDI4.6 MIDI音乐音乐4.1 4.1 音频基础知识音频基础知识4.1.1 4.1.1 声音的物理特征声音的物理特征声音是由物体振动产生的，并以声波形式通过介质（如空气、水、金属等）传播。物声音是由物体振动产生的，并以声波形式通过介质（如空气、水、金属等）传播。物理上，声音可以用一条连续曲线来表示，理上，声音可以用一条连续曲线来表示，, ,如图如图4-1 4-1 。物体振动的最大位移称为振幅。物体振动的最大位移称为振幅A A，声，声波中两个连续波峰（或波谷）之间的距离称为周期波中两个连续波峰（或波谷）之间的距离称为周期T T，周期，周期的倒数的倒数1/T1

4、/T即为频率即为频率f f，以赫兹（，以赫兹（HzHz）为）为单位，频率反映了单位时间（单位，频率反映了单位时间（1 1秒）物体秒）物体振动的次数。振动的次数。图图4-1 4-1 声波的振幅与频率声波的振幅与频率TAt0 声音按频率可分为三类：音频、次声、超声声音按频率可分为三类：音频、次声、超声 l 低于低于20Hz20Hz的声音称为次声的声音称为次声l 频率范围在频率范围在20Hz20Hz20kHz20kHz范围的可听声音称范围的可听声音称为音频，为音频，其中人说话发出的语音信号的其中人说话发出的语音信号的频率范围是频率范围是300Hz300Hz3kHz3kHzl 频率高于频率高于20k

5、Hz20kHz的称为超音频（或超声）的称为超音频（或超声）15 20 300 3k 20k 50k f(Hz)音频信号音频信号语音信号语音信号超声信号超声信号次声信号次声信号图图4-2 4-2 不同声音信号的频率范围不同声音信号的频率范围可听的音频声音又可分为语音、乐音、效果音、合成音、噪音（声）等五种。可听的音频声音又可分为语音、乐音、效果音、合成音、噪音（声）等五种。 4.1.2 4.1.2 音频三要素音频三要素音频有三个主要属性，分别是音调、音强和音色，它们既反映了音频信号的基本特征，音频有三个主要属性，分别是音调、音强和音色，它们既反映了音频信号的基本特征，也是人感受声音信号的三个

6、主要因素，因此又被称为音频三要素。也是人感受声音信号的三个主要因素，因此又被称为音频三要素。音调：又称音高，反映声音的高低程度，由声音信号的频率大小所决定。频率越大，音调：又称音高，反映声音的高低程度，由声音信号的频率大小所决定。频率越大，音调越高；频率越小，音调越低。音调越高；频率越小，音调越低。音强：又称响度，反映声音的大小或强弱，由振幅和声源距离共同决定。振幅越大，音强：又称响度，反映声音的大小或强弱，由振幅和声源距离共同决定。振幅越大，距离越小，音强（响度）越大。距离越小，音强（响度）越大。音色：又称音质，反映声音的品质，它由振动物体（声源）的材料、结构、状态等自音色：又称音质，

7、反映声音的品质，它由振动物体（声源）的材料、结构、状态等自身因素决定，表现为声源的频带宽度。身因素决定，表现为声源的频带宽度。4.1.3 4.1.3 数字音频的三种形式数字音频的三种形式音频（音频（AudioAudio）是指频率在）是指频率在20Hz20Hz20kHz20kHz范围内的可听声音，是多媒体信息中的一种媒范围内的可听声音，是多媒体信息中的一种媒体类型体类型听觉类媒体。听觉类媒体。目前多媒体计算机中的音频主要有波形音频、目前多媒体计算机中的音频主要有波形音频、CDCD音频和音频和MIDIMIDI音乐音乐3 3种形式。种形式。1 1、波形音频：、波形音频：是由外部声音源通过数字化

8、过程采集到多媒体计算机中的所有声音形式。可通过编辑是由外部声音源通过数字化过程采集到多媒体计算机中的所有声音形式。可通过编辑（裁剪、合成、效果等）、编码压缩、存储、传输以及还原播放等方式进行处理。在波形（裁剪、合成、效果等）、编码压缩、存储、传输以及还原播放等方式进行处理。在波形音频中，有一类特殊的声音需要特别提到，即人的语音。语音是波形声音中人的说话声音，音频中，有一类特殊的声音需要特别提到，即人的语音。语音是波形声音中人的说话声音，具有内在的语言学、语音学的内涵。具有内在的语言学、语音学的内涵。2 2、CDCD音频音频 CD-CD-音频（音频（CD-AudioCD-Audio）是存储在音乐

9、）是存储在音乐CDCD光盘中的数字音频，可以通过光盘中的数字音频，可以通过CD-ROMCD-ROM驱动器读驱动器读取并采集到多媒体计算机系统中，并以波形音频的相应形式存储、传输和处理。取并采集到多媒体计算机系统中，并以波形音频的相应形式存储、传输和处理。3 3、MIDIMIDI音乐音乐也称也称MIDIMIDI音频。它将音乐符号化并保存在音频。它将音乐符号化并保存在MIDIMIDI文件中，并通过音乐合成器产生相应文件中，并通过音乐合成器产生相应的声音波形来还原播放。的声音波形来还原播放。音频是时间的函数，具有很强的前后相关性，所以实时性是音频处理的基本要求。音频是时间的函数，具有很强的前后相

10、关性，所以实时性是音频处理的基本要求。4.1.4 4.1.4 数字音频的文件格式数字音频的文件格式音频文件通常分为两大类：声音文件音频文件通常分为两大类：声音文件和和 MIDIMIDI文件文件下表介绍几种常用的音频文件格式及后缀名：下表介绍几种常用的音频文件格式及后缀名：序号序号音频文件名称音频文件名称后缀名后缀名1 1WaveWave文件文件 .WAV .WAV 2 2AIFFAIFF文件文件 .AIF/.AIFF .AIF/.AIFF 3 3AudioAudio文件文件 .AU .AU 4 4 Sound Sound文件文件 .SND .SND 5 5VoiceVoice文件文件 .VO

11、C .VOC 6 6 Mpeg Mpeg音频文件音频文件 .MP1/.MP2/.MP3 .MP1/.MP2/.MP3 7 7RealAudioRealAudio文件文件 .RA/.RM/.RAM .RA/.RM/.RAM 8 8Windows Media AudioWindows Media Audio文件文件 .WMA/.ASF/.ASX/.WAX .WMA/.ASF/.ASX/.WAX 9 9MIDIMIDI文件文件 .MID/.RMI/.CMI/.CMF .MID/.RMI/.CMI/.CMF 1010ModuleModule文件文件 .MOD/.S3M/.XM/.MTM/.FAR/.K

12、AR/ .MOD/.S3M/.XM/.MTM/.FAR/.KAR/ 4.1.5 4.1.5 音频处理工具软件简介音频处理工具软件简介音频工具软件在内容上主要指处理数字音频和音频工具软件在内容上主要指处理数字音频和MIDIMIDI乐谱的各种工具软件，在功能上包括乐谱的各种工具软件，在功能上包括音频采集、编辑、合成、编码压缩以及音频采集、编辑、合成、编码压缩以及MIDIMIDI乐谱的创作、编辑、发布等环节。乐谱的创作、编辑、发布等环节。按照音频处理的基本过程，通常可把音频工具软件分为：按照音频处理的基本过程，通常可把音频工具软件分为： 1 1、MIDIMIDI制作软件制作软件 2 2、音频处理

13、软件、音频处理软件 3 3、音频压缩软件、音频压缩软件 4 4、音乐、音乐CDCD刻录软件刻录软件4.2 4.2 音质标准与评价音质标准与评价4.2.1 4.2.1 音质等级标准音质等级标准音质是指音频信号经传输、处理后所再现的声音质量（保真度）。音质是指音频信号经传输、处理后所再现的声音质量（保真度）。等级等级频率范围频率范围音质音质高端高端DVDDVD0 048kHz48kHz顶级顶级标准标准DVDDVD0 024kHz24kHzCD-DACD-DA音质音质10Hz10Hz20kHz20kHz高高FMFM广播音质广播音质20Hz20Hz15kHz15kHz较高较高AMAM广播音质广播音质

14、50Hz50Hz7kHz7kHz中中电话音质电话音质200Hz200Hz3.4kHz3.4kHz低低4.2.2 4.2.2 音质客观评价音质客观评价客观评价是指通过检测仪器测量音频信号的技术指标来进行声音质量评价，主要技术指客观评价是指通过检测仪器测量音频信号的技术指标来进行声音质量评价，主要技术指标有：频带宽度、动态范围和信噪比等。标有：频带宽度、动态范围和信噪比等。理论上，声音信号是由许多频率不同的分量信号组合而成的复合信号，因此，声音的频理论上，声音信号是由许多频率不同的分量信号组合而成的复合信号，因此，声音的频带宽度特指复合声音信号的频率范围，范围越大，频带越宽，可包含的音频信号（

15、谐波）越带宽度特指复合声音信号的频率范围，范围越大，频带越宽，可包含的音频信号（谐波）越丰富，因而声音质量就越高。丰富，因而声音质量就越高。实际上，再现声音（特别是乐音）的质量与所用的播放设备和场地条件有关。高质量的实际上，再现声音（特别是乐音）的质量与所用的播放设备和场地条件有关。高质量的音频信号要通过高品质的音响设备在较好的音响环境中，才能再现出高质量的音响效果。对音频信号要通过高品质的音响设备在较好的音响环境中，才能再现出高质量的音响效果。对于音响设备而言，主要关注失真度、频响、瞬态响应、信噪比、声道分离度、声道平衡度等于音响设备而言，主要关注失真度、频响、瞬态响应、信噪比、声道分离度

16、、声道平衡度等指标。指标。 4.2.3 4.2.3 音质主观评价音质主观评价主观评价是指通过人聆听各种声音而产生的好恶感觉来进行声音质量评价。主观评价是指通过人聆听各种声音而产生的好恶感觉来进行声音质量评价。 1 1、语音质量评价方法、语音质量评价方法常用的主观评价方法有：平均主观分法，失真平均主观分法，判断满意度测量法等。常用的主观评价方法有：平均主观分法，失真平均主观分法，判断满意度测量法等。 ITU-TP800ITU-TP800标准中定义的标准中定义的MOSMOS，它将语音质量分为，它将语音质量分为5 5级，如表所示：级，如表所示：等级等级音质音质主观感觉主观感觉5 5优优未察觉失真

17、未察觉失真4 4良良刚察觉失真，但不讨厌刚察觉失真，但不讨厌3 3中中察觉失真，稍微讨厌察觉失真，稍微讨厌2 2差差讨厌，但不令人反感讨厌，但不令人反感1 1劣劣极其讨厌，令人反感极其讨厌，令人反感 2 2、乐音质量评价、乐音质量评价乐音音质的优劣取决于多种因素，如声源特性、音响器材的信号特性、声场特性、乐音音质的优劣取决于多种因素，如声源特性、音响器材的信号特性、声场特性、听觉特性等。因此，对音响设备再现的乐音音质的准确评价难度较大。听觉特性等。因此，对音响设备再现的乐音音质的准确评价难度较大。主观评价乐音音质，一般是通过再现乐音的响度、音调和音色的变化及其组合来评主观评价乐音音质，一般

18、是通过再现乐音的响度、音调和音色的变化及其组合来评价音质的，价音质的，几种典型的听感：几种典型的听感：定位感定位感，空间感，空间感，层次感，层次感，厚度感，厚度感，立体感，立体感。除此之外，。除此之外，还有力度感、亮度感、临场感、软硬感、松紧感、宽窄感等许多评价音质的听感。还有力度感、亮度感、临场感、软硬感、松紧感、宽窄感等许多评价音质的听感。 4.3 4.3 音频的数字化与编码音频的数字化与编码计算机在处理音频信号之前，必须将模拟的声计算机在处理音频信号之前，必须将模拟的声音信号数字化，形成数字音频。具体过程包括：采音信号数字化，形成数字音频。具体过程包括：采样、量化、编码。样

19、、量化、编码。4.3.1 4.3.1 采样与采样频率采样与采样频率采样是每间隔一段时间读取一次声音信采样是每间隔一段时间读取一次声音信号幅度，使声音信号在时间上被离散化，如号幅度，使声音信号在时间上被离散化，如图图4-24-2所示。采样的主要参数是采样频率所示。采样的主要参数是采样频率。采样频率：是指将模拟声音波形数字化时，每秒钟所抽取声波幅度样本的次数，其计采样频率：是指将模拟声音波形数字化时，每秒钟所抽取声波幅度样本的次数，其计算单位是算单位是kHz(kHz(千赫兹千赫兹) )。如图。如图4-34-3是模拟声音信号数字化时的采样图示。是模拟声音信号数字化时的采样图示。一般来讲，采样

20、频率越高声音失真一般来讲，采样频率越高声音失真越小，用于存储数字音频的数据量也越越小，用于存储数字音频的数据量也越大。大。采样频率的高低是根据声音信号本采样频率的高低是根据声音信号本身的最高频率和采样定理决定的。身的最高频率和采样定理决定的。图图4-3 4-3 声音信号采样声音信号采样采样定理：在进行模拟采样定理：在进行模拟/ /数字信号的转换过程中，当采样频率数字信号的转换过程中，当采样频率f fs s大于信号中最高频率大于信号中最高频率f fmaxmax的的2 2倍时，即倍时，即f fs s=2f=2fmaxmax，采样之后的数字信号完整地保留了原始信号中的信息。采样定，采样之后的数字

21、信号完整地保留了原始信号中的信息。采样定理又叫奈奎斯特定理（理又叫奈奎斯特定理（Nyquist theoryNyquist theory）。）。表表4-4 4-4 不同音质数字音频的常用采样率不同音质数字音频的常用采样率采样率采样率音质音质频率范围频率范围8,000 Hz8,000 Hz电话电话0 04,000 Hz4,000 Hz11,025 Hz11,025 Hz低于低于AMAM广播广播0 05,512 Hz5,512 Hz22,050 Hz22,050 Hz接近接近FMFM广播广播0 011,025 Hz11,025 Hz32,000 Hz32,000 Hz优于优于FMFM广播广播0 0

22、16,000 Hz16,000 Hz44,100 Hz44,100 HzCD-DACD-DA0 022,050 Hz22,050 Hz48,000 Hz48,000 Hz标准标准DVDDVD0 024,000 Hz24,000 Hz96,000 Hz96,000 Hz高端高端DVDDVD0 048,000 Hz48,000 Hz4.3.2 4.3.2 量化与量化位数量化与量化位数量化就是把采样得到的声音信号幅度转换为数字值，是声音信号在幅度上被离散化。量化就是把采样得到的声音信号幅度转换为数字值，是声音信号在幅度上被离散化。量化位数量化位数n n定义了每个采样点的数据范围（定义了每个采样点

23、的数据范围（0 02 2n n-1-1），也叫量化等级，量化等级的），也叫量化等级，量化等级的多少决定了声音的动态范围。多少决定了声音的动态范围。图图4-4 4-4 量化位数与动态范围量化位数与动态范围 4.3.2 4.3.2 量化与量化位数量化与量化位数表表4-5 4-5 不同音质的量化位数、量化范围、动态范围不同音质的量化位数、量化范围、动态范围量化位数量化位数音质音质量化等级量化等级动态范围动态范围8 8位位电话电话25625648 dB48 dB1616位位CDCD65,53665,53696 dB96 dB2424位位DVDDVD16,777,21616,777,216144 dB1

24、44 dB3232位位顶级顶级4,294,967,2964,294,967,296192 dB192 dB4.3.3 4.3.3 声道声道声道个数是反映音频数字化质量的另一个因素。声道个数是反映音频数字化质量的另一个因素。单声道：采集声音数据时，仅采集一个声波的数据单声道：采集声音数据时，仅采集一个声波的数据双声道（立体声）：采集两个声波数据双声道（立体声）：采集两个声波数据多声道（环绕立体声）：采集两个以上声波数据多声道（环绕立体声）：采集两个以上声波数据声道数越多，再现出的音响效果就越好。声道数越多，再现出的音响效果就越好。4.3.4 4.3.4 音频采样的数据量音频采样的数据量数字音频的

25、数据量主要取决于两个因素：数字音频的数据量主要取决于两个因素：u音质因素：由采样频率、量化位数和声道数音质因素：由采样频率、量化位数和声道数3 3个参数决定。个参数决定。u时间因素：时间因素：单位时间的数据量可用下式表示：单位时间的数据量可用下式表示： fcbs8v= v= v v：为单位时间的数据量（：为单位时间的数据量（KbpsKbps）fc：为采样频率（：为采样频率（kHzkHz）b b：为量化位数（：为量化位数（bitbit）s s：为声道数：为声道数4.3.5 4.3.5 音频数据编码音频数据编码音频数据压缩方法分类音频数据压缩方法分类PCMPCM为脉冲调制编码，为脉冲调制编码，DP

26、CMDPCM为差分脉冲调制编码，为差分脉冲调制编码，ADPCMADPCM为自适应差分脉冲调制编码为自适应差分脉冲调制编码, ,VSELPVSELP为矢量和激励线性预测编码，为矢量和激励线性预测编码，MPLPCMPLPC为多脉冲激励线性预测编码，为多脉冲激励线性预测编码，CELPCELP为码本激励线性预测编码。为码本激励线性预测编码。4.3.6 4.3.6 音频编码标准音频编码标准 1 1、一般语音音质的音频压缩标准、一般语音音质的音频压缩标准u特点：音质低，能听到声音就可以特点：音质低，能听到声音就可以u应用：各类提示音应用：各类提示音u压缩标准：压缩标准： CCITT A LawCCITT

27、A Law CCITT Law CCITT Law 低采样率或低量化位数的低采样率或低量化位数的PCM PCM 2 2、电话音质的音频压缩标准、电话音质的音频压缩标准u频率范围频率范围:300Hz:300Hz3.4kHz3.4kHz，用标准的，用标准的PCMPCM编码。编码。u压缩标准：压缩标准： G G系列音频压缩标准系列音频压缩标准uG G系列音频压缩标准利用的技术：系列音频压缩标准利用的技术：线性预测技术线性预测技术矢量量化技术矢量量化技术综合分析技术综合分析技术u典型的算法：典型的算法： ADPCMADPCM CELP CELP LD-CELP LD-CELP（短时延码本激励线性

28、预测编码）（短时延码本激励线性预测编码） RPE-LTPRPE-LTP（长时线性预测规则码激励）（长时线性预测规则码激励） VSELPVSELP（矢量和激励线性预测编码）（矢量和激励线性预测编码）标准标准参数说明参数说明G.711G.711PCMPCM编码，采样速率编码，采样速率8kHz8kHz，量化位数，量化位数8Bit8Bit，比特流速率为，比特流速率为64kb/s64kb/s。使用非线性量化。使用非线性量化技术技术G.721G.721ADPCMADPCM编码：每个数值差分用编码：每个数值差分用4 4位编码，采样率为位编码，采样率为8kHz8kHz，比特流被转换为，比特流被转换为32kbp

29、s32kbpsG.723G.723SB-ADPCMSB-ADPCM编码（有损压缩），比特流被转换为编码（有损压缩），比特流被转换为5.35.3 6.3kbps6.3kbps之间之间G.728G.728LD-CELPLD-CELP编码，比特流被转换为编码，比特流被转换为16kbps16kbps，带宽限于，带宽限于3.4kHz3.4kHz；音质与；音质与G.721G.721标准相当标准相当表表4-6 4-6 电话音质的音频编码标准电话音质的音频编码标准3 3、 AMAM广播音质的音频压缩标准广播音质的音频压缩标准u频率范围频率范围:50Hz:50Hz7kHz 7kHz u压缩标准：压缩标准：ITU

30、ITU制定的制定的G.722G.722标准标准 uG.722G.722标准采用的算法：标准采用的算法：SB-ADPCMSB-ADPCM（子带（子带ADPCMADPCM）uSB-ADPCMSB-ADPCM算法：将现有的带宽分成两个独立的子带信道，使输入信号进入滤波算法：将现有的带宽分成两个独立的子带信道，使输入信号进入滤波器组分成高子带信号和低子带信号，然后分别进行器组分成高子带信号和低子带信号，然后分别进行ADPCMADPCM编码，最后进入混合器编码，最后进入混合器形成输出码流形成输出码流 4 4、高保真立体声音频压缩标准、高保真立体声音频压缩标准u包括包括:CD-DA:CD-DA以上音质、以

31、上音质、FMFM广播音质广播音质uFMFM广播音质频率范围广播音质频率范围:20Hz:20Hz15kHz 15kHz uCD-DACD-DA音频信号的频率范围：音频信号的频率范围：50Hz50Hz20kHz 20kHz u压缩标准：压缩标准： 1 1）MPEG1MPEG1，MPEG2MPEG2的的layer1layer1、2 2、3 3，MPEG 4 AACMPEG 4 AAC音频编码，杜比音频编码，杜比AC-3AC-3等。用等。用于数字广播、数字电视广播、消费电子产品、音频信息的存储和下载等。于数字广播、数字电视广播、消费电子产品、音频信息的存储和下载等。 2 2）ITU-T G.722.1

32、ITU-T G.722.1、3GPP AMR-WB+3GPP AMR-WB+和和3GPP 2 4GV-WB 3GPP 2 4GV-WB 。用于像。用于像3G3G通信这样通信这样的高音质低码率应用场合。的高音质低码率应用场合。4.4 4.4 音频卡音频卡 4.4.1 4.4.1 音频卡的功能音频卡的功能u 录制和播放数字声音文件录制和播放数字声音文件u 控制音量和混音效果控制音量和混音效果u 声音文件的压缩与解压缩声音文件的压缩与解压缩u MIDIMIDI接口与音乐合成接口与音乐合成 4.4.2 4.4.2 音频卡的组成与工作原理音频卡的组成与工作原理图图4-6 4-6 音频卡的一般组成与结构示

33、意图音频卡的一般组成与结构示意图DSPDSP音频输出音频输出放大器放大器麦克风麦克风MicMic线路输入线路输入Line inLine in音乐合成器音乐合成器系统总线系统总线接口接口CDCD输入输入混合信号混合信号处理器处理器MIDIMIDI与游戏与游戏接口接口系统总线系统总线放大器放大器音频卡的主要功能部件：功率放大器、混合信号处理器、音频卡的主要功能部件：功率放大器、混合信号处理器、DSPDSP数字信号处理器、音数字信号处理器、音乐合成器以及相关的外围接口等。乐合成器以及相关的外围接口等。声音的合成与处理：由声音的合成与处理：由DSPDSP数字声音处理器、音乐合成器及数字声音处理器、

34、音乐合成器及MIDIMIDI接口控制器组成接口控制器组成, ,主主要任务是完成声波信号的模要任务是完成声波信号的模/ /数、数数、数/ /模转换，利用调频技术控制声音的音调、音色和幅模转换，利用调频技术控制声音的音调、音色和幅度。度。混合信号处理器及功率放大器：内置数字混合信号处理器及功率放大器：内置数字/ /模拟混音器，混音器的声源可以是模拟混音器，混音器的声源可以是MIDIMIDI信信号、号、CDCD音频、线性输入、话筒以及音频、线性输入、话筒以及PCPC机的扬声器等，可以选择输入一个声源或将几个不机的扬声器等，可以选择输入一个声源或将几个不同声源进行混合录音。同声源进行混合录音。 4.

35、4.3 4.4.3 音频卡的音频卡的I/OI/O接口接口图图4-7 音频卡的外围接口连接示意图音频卡的外围接口连接示意图4.4.3 4.4.3 音频卡的音频卡的I/OI/O接口接口图图4-8 支持支持5.1环绕的声卡插口环绕的声卡插口4.5 4.5 数字音频的采集与编辑数字音频的采集与编辑一般的数字音频采集首先需要选择和设置恰当的采样参数，然后再开始录音采集，最一般的数字音频采集首先需要选择和设置恰当的采样参数，然后再开始录音采集，最后再使用相应的编辑软件对录制的音频数据进行剪辑和效果处理。后再使用相应的编辑软件对录制的音频数据进行剪辑和效果处理。 4.5.1 4.5.1 录音采集录音采集u

36、选择采样参数选择采样参数u 调整输入音频的频响调整输入音频的频响u 检测输入音频的强度检测输入音频的强度 u 开始录音开始录音图图4-9 4-9 设置录音参数设置录音参数1 1、选择采样参数、选择采样参数首先要根据实际情况选择最佳的采样参数，做到音质与数据量的折中考虑，避免采样首先要根据实际情况选择最佳的采样参数，做到音质与数据量的折中考虑，避免采样过程中出现存储空间不足的现象发生。过程中出现存储空间不足的现象发生。 CDCD音质、音质、电话质量电话质量收音质量收音质量Default Quality Default Quality 2 2调整输入音频的频响调整输入音频的频响表表4-7 各

37、频段参数对音质的影响各频段参数对音质的影响频段频段频率范围频率范围音质影响音质影响低频低频202060Hz60Hz空间感。提升低频共振（嗡），降落空虚；空间感。提升低频共振（嗡），降落空虚；6060100Hz100Hz浑厚感。提升轰鸣浑厚感。提升轰鸣( (轰轰) )，降落无力；，降落无力；100100150Hz150Hz丰满度。提升浑浊、降落单薄；丰满度。提升浑浊、降落单薄；中频低段中频低段150150300Hz300Hz声音力度、男声力度。提升声音硬、无特色，降落软、飘；声音力度、男声力度。提升声音硬、无特色，降落软、飘；中频中频300300500Hz500Hz语音主要音区，提升语音单调、降

38、落语音空洞；语音主要音区，提升语音单调、降落语音空洞；5005001KHz1KHz人声基音、声音廓，提升语音前凸、降落语音收缩感；人声基音、声音廓，提升语音前凸、降落语音收缩感； 1k1k2kHz2kHz通透感、顺畅感，提升有跳跃感、降落通透感、顺畅感，提升有跳跃感、降落松散；松散；中频上段中频上段2k2k3kHz3kHz对明亮度最敏感，提升声音硬，不自然；对明亮度最敏感，提升声音硬，不自然；3k3k4kHz4kHz穿透力，提升穿透力，提升咳音；咳音；4k4k5kHz5kHz乐器表面响度，提升乐器距离近、降落乐器表面响度，提升乐器距离近、降落乐器距离远；乐器距离远；高频高频5k5k6k

39、Hz6kHz语言的清晰度，提升声音锋利、易疲劳；语言的清晰度，提升声音锋利、易疲劳；6k6k8kHz8kHz明亮度、透明度，明亮度、透明度，提升齿音重、降落提升齿音重、降落声音黯淡；声音黯淡；8k8k10kHz10kHzS S音，影响音色的清晰度和透明度；音，影响音色的清晰度和透明度；极高频极高频10k10k12kHz12kHz高频泛音，光泽；高频泛音，光泽；12k12k16kHz16kHz高频泛音，光彩；高频泛音，光彩；16k16k20kHz20kHz色彩色彩提升有神秘感；提升有神秘感；3 3、检测输入音频的强度、检测输入音频的强度在在Win2KWin2K环境下，可通过环境下，可通过

40、“音量控制音量控制”对话框来检测、调节进入计算机的音源强度。对话框来检测、调节进入计算机的音源强度。打开打开WindowsWindows下的音量控制台，选择菜单栏中的下的音量控制台，选择菜单栏中的“选项选项”“属性属性”命令打开命令打开“属性属性”对话框。对话框。图图4-10 4-10 音量控制台音量控制台在在“属性属性“对话框中的音量调节选项中选择对话框中的音量调节选项中选择“录音录音”，在显示音量控制栏中选中，在显示音量控制栏中选中麦克风等选项，如图麦克风等选项，如图4-114-11所示。所示。在弹出的录音控制台中选中麦克风或线路输入或在弹出的录音控制台中选中麦克风或线路输入或CD

41、CD音频，使相应的音源有效，如音频，使相应的音源有效，如图图4-124-12所示。所示。图图4-11 “属性属性”对话框对话框图图4-12 录音控制对话框录音控制对话框4 4、开始录音、开始录音图图4-11 录音机操作面板录音机操作面板4.5.2 4.5.2 抓取抓取CDCD、VCDVCD和和DVDDVD音轨音轨获取数字音频的另一个快捷途径就是从不同的多媒体产品中直接抓取音轨信息，并转换压获取数字音频的另一个快捷途径就是从不同的多媒体产品中直接抓取音轨信息，并转换压缩成所需的音频格式。缩成所需的音频格式。 WaveLab 5.0版版：抓取音乐：抓取音乐CD、DVD中的音轨中的音轨 “豪

42、杰超级解霸豪杰超级解霸”软件：抓取音乐软件：抓取音乐CD、VCD或或DVD光盘等格式音轨光盘等格式音轨豪杰超级解霸豪杰超级解霸9.0版版：可从：可从DVD、VCD、RM/RMVB、AVI、MPG、MV等音视频混合的媒等音视频混合的媒体中提取音频信息，并保存为一种称为体中提取音频信息，并保存为一种称为DAC高音质压缩格式或高音质压缩格式或WAV、MP3格式的声音文件格式的声音文件注意：在使用抓取音轨来采集数字音频时，应该遵守有关法律规定，取得相应的使用权，注意：在使用抓取音轨来采集数字音频时，应该遵守有关法律规定，取得相应的使用权，避免以后出现知识产权纠纷。避免以后出现知识产权纠纷。 4.

43、5.3 4.5.3 编辑数字音频编辑数字音频音频编辑一般包括音频内容剪切、合成以及音质和效果的编辑等方面。音频编辑一般包括音频内容剪切、合成以及音质和效果的编辑等方面。多音轨（多音轨（Multiple TracksMultiple Tracks）切边（切边（TrimmingTrimming）拼接和组合（拼接和组合（Splicing and AssemblySplicing and Assembly）音量调节（音量调节（Volume AdjustmentsVolume Adjustments）格式转换（格式转换（Format ConversionFormat Conversion）

44、重采样或降低采样率（重采样或降低采样率（Resampling or Down samplingResampling or Down sampling）淡进淡出（淡进淡出（Fade-ins and Fade-outsFade-ins and Fade-outs）均衡（均衡（EqualizationEqualization）时间拉伸（时间拉伸（Time StretchingTime Stretching）数字信号处理（数字信号处理（Digital Signal Processing-DSPDigital Signal Processing-DSP）4.6 MIDI4.6 MIDI音乐音乐4

45、.6.1 4.6.1 什么是什么是MIDIMIDI MIDI MIDI（Musical Instrument Digital InterfaceMusical Instrument Digital Interface）乐器数字接口。它是由）乐器数字接口。它是由YamahaYamaha、RolandRoland等公司在等公司在19831983年联合提出并不断发展确定的数字音乐的国际标准，它规定了电子乐器年联合提出并不断发展确定的数字音乐的国际标准，它规定了电子乐器和多媒体计算机之间进行连接的硬件及数据通信协议，是多媒体计算机所支持的又一种声音和多媒体计算机之间进行连接的硬件及数据通信协议，是多媒

46、体计算机所支持的又一种声音产生方法产生方法MIDIMIDI方法。方法。 MIDIMIDI方法就是将数字式电子乐器的弹奏过程记录下来，如选的是什么乐器，弹下哪一个方法就是将数字式电子乐器的弹奏过程记录下来，如选的是什么乐器，弹下哪一个键，用了多大力气，持续了多长时间等。键，用了多大力气，持续了多长时间等。 MIDIMIDI格式的数字化文件可以看作是乐谱的数字化描述，它记录的不再是声音的波形，而格式的数字化文件可以看作是乐谱的数字化描述，它记录的不再是声音的波形，而是乐器的种类以及音阶的高低、长短、强弱、速度等因素，这些被称为是乐器的种类以及音阶的高低、长短、强弱、速度等因素，这些被称为MIDIM

47、IDI消息，存储为消息，存储为MIDIMIDI文件。文件。 4.6.2 MIDI4.6.2 MIDI设备的配置与连接设备的配置与连接一件乐器只要包含了能处理一件乐器只要包含了能处理MIDIMIDI信息的微处理器以及相关的硬件接口，就可以认为信息的微处理器以及相关的硬件接口，就可以认为是一台是一台MIDIMIDI设备。设备。两台两台MIDIMIDI设备之间可以通过接口发送信息而进行相互通信。设备之间可以通过接口发送信息而进行相互通信。一台一台MIDIMIDI设备可以有设备可以有1 13 3个端口：个端口：uMIDI In MIDI In 接口：接收来自其它接口：接收来自其它MIDIMIDI

48、设备上的设备上的MIDIMIDI信息；信息；uMIDI OutMIDI Out接口：用来输出本设备生成的接口：用来输出本设备生成的MIDIMIDI信息；信息；u MIDI ThruMIDI Thru接口：将从接口：将从MIDI InMIDI In端口传来的信息发送到另一台相联的端口传来的信息发送到另一台相联的MIDIMIDI设备上。设备上。接收设备的接收设备的MIDI InMIDI In连接器内常采用光电耦合器实现收、发设备之间的电气隔离。连接器内常采用光电耦合器实现收、发设备之间的电气隔离。 MIDIMIDI信息采用异步串行方式传输，传输速率为信息采用异步串行方式传输，传输速率为31.25

49、31.25 KbpsKbps。在进行在进行MIDIMIDI通信时，用户可以通过标准的通信时，用户可以通过标准的MIDIMIDI电缆来相互连接各端口。如图电缆来相互连接各端口。如图4-144-14所示。所示。图图4-14 MIDI4-14 MIDI与游戏接口电缆与游戏接口电缆MIDIMIDI接口接口游戏接口游戏接口InIn和和OutOut图图4-14 4-14 多媒体计算机与多媒体计算机与MIDIMIDI设备连接示意图设备连接示意图 MIDIMIDI软件（音序器）是软件（音序器）是用于记录、编辑和播放用于记录、编辑和播放MIDIMIDI文件的一种软件，其作用相文件的一种软件，其作用相当于是当于

50、是MIDIMIDI乐器的一台多轨乐器的一台多轨磁带录音机。磁带录音机。 MIDI MIDI设备可以配备电子键盘、合成器、音序器（设备可以配备电子键盘、合成器、音序器（MIDIMIDI软件）以及扬声器或音箱等。软件）以及扬声器或音箱等。 MIDIMIDI键盘主要用于产生键盘主要用于产生MIDIMIDI信息信息 MIDIMIDI合成器是一种电子设备，使用数字信号处理器或其他类型的芯片产生音乐或声音。合成器是一种电子设备，使用数字信号处理器或其他类型的芯片产生音乐或声音。 4.6.3 4.6.3 播放播放MIDIMIDI音乐音乐声卡播放声卡播放MIDIMIDI音乐最常用的方法有两种：音乐最常用的方

51、法有两种：FMFM合成与波表（合成与波表（WaveTableWaveTable）合成。）合成。 FMFM是运用声音振荡的原理对是运用声音振荡的原理对MIDIMIDI进行合成处理的。进行合成处理的。波表合成，效果较好。它是将各种真实乐器所能发出的所有声音波表合成，效果较好。它是将各种真实乐器所能发出的所有声音( (包括各个音域、声包括各个音域、声调调) )录制下来，存储在声卡的录制下来，存储在声卡的ROMROM中，称为硬波表。中，称为硬波表。4.6.4 4.6.4 制作制作MIDIMIDI音乐音乐制作制作MIDIMIDI音乐，需要按图音乐，需要按图4-144-14的示意构成系统。的示意构成系

52、统。乐谱创作软件能够录制、编辑、打印乐谱创作软件能够录制、编辑、打印MIDIMIDI乐谱并播放乐谱并播放MIDIMIDI音乐。有些乐谱创作软件还能对音乐。有些乐谱创作软件还能对乐谱进行量化来调节节拍的不一致问题。乐谱进行量化来调节节拍的不一致问题。 MIDIMIDI编辑中很重要的是选择编辑中很重要的是选择MIDIMIDI乐器，乐器，MIDIMIDI标准规定了不同的演奏乐器并用编号加以区标准规定了不同的演奏乐器并用编号加以区分，范围在分，范围在0 0127127之间，见附录三。之间，见附录三。在在MIDIMIDI乐谱中，乐器乐谱中，乐器IDID用来决定以何种乐器来播放乐曲，为改变乐器，只需改

53、变该数值即用来决定以何种乐器来播放乐曲，为改变乐器，只需改变该数值即可。可。 MIDIMIDI是为多媒体项目创建原始音乐素材的最佳途径。准备发布时应将其转换成数字音频数是为多媒体项目创建原始音乐素材的最佳途径。准备发布时应将其转换成数字音频数据。据。创作创作MIDIMIDI乐谱的软件：乐谱的软件：CakewalkCakewalk（Cakewalk 9.0 xCakewalk 9.0 x版）版）4.6.5 4.6.5 乐谱的扫描与识别乐谱的扫描与识别除了通过除了通过MIDIMIDI方法创作乐谱（方法创作乐谱（MIDIMIDI音乐）以外，还可以利用扫描音乐）以外，还可以利用扫描- -识别技术，

54、快速将印刷识别技术，快速将印刷乐谱数字化，保存为乐谱数字化，保存为MIDIMIDI乐谱。乐谱。 SmartScoreSmartScore软件扫描识别过程：软件扫描识别过程：首先，通过扫描仪将乐谱以图像的方式扫描成数字图像首先，通过扫描仪将乐谱以图像的方式扫描成数字图像, ,扫描参数的选择与设置扫描参数的选择与设置: :u 分辨率分辨率: :一般选择一般选择150150300300 dpidpi，u 图像类型图像类型: :黑白二值或黑白二值或OCROCR，u 扫描后的图片存储格式扫描后的图片存储格式:TIF:TIF格式格式；然后，通过乐谱识别功能识别出可编辑的数字乐谱并进行校对、编辑。然后，

55、通过乐谱识别功能识别出可编辑的数字乐谱并进行校对、编辑。识别后的乐谱识别后的乐谱识别前的乐谱图片识别前的乐谱图片图图4-16 SmartScore4-16 SmartScore软件的乐谱识别画面软件的乐谱识别画面 SmartScore SmartScore也可以打开事先存储好的乐谱图片并进行识别，识别完成后会提示将识别也可以打开事先存储好的乐谱图片并进行识别，识别完成后会提示将识别的结果保存为的结果保存为SmartScoreSmartScore专用格式的专用格式的.enf.enf文件。文件。 4.6.6 MIDI4.6.6 MIDI与数字音频的比较与数字音频的比较 MIDIMIDI数字音频数字

56、音频是乐谱是乐谱是一段录音是一段录音取决于音乐设备的质量和音响系统的性能取决于音乐设备的质量和音响系统的性能取决于音响系统的性能取决于音响系统的性能文件小文件小数字化波形文件大数字化波形文件大与设备有关与设备有关与播放设备无关与播放设备无关依赖于特定的回放设备依赖于特定的回放设备与回放的设备关系不大，播放效果几乎与回放的设备关系不大，播放效果几乎一样。一样。较小的数据存储空间较小的数据存储空间需要较大的数据存储空间需要较大的数据存储空间MIDIMIDI文件文件多用于多用于CDCD和和MP3MP3文件文件 MIDI MIDI具有以下几个优点：具有以下几个优点： MIDIMIDI文件比数字音频文件

57、尺寸更小，文件比数字音频文件尺寸更小，MIDIMIDI文档的大小与播放质量完全无关。文档的大小与播放质量完全无关。由于由于MIDIMIDI文件非常小，可以嵌入到网页中，因此下载和播放要比相当的数字音频速文件非常小，可以嵌入到网页中，因此下载和播放要比相当的数字音频速度快。度快。在有些情况下，如果使用的在有些情况下，如果使用的MIDIMIDI声源质量很高，声源质量很高，MIDIMIDI将会比数字音频文件听起来更将会比数字音频文件听起来更好。好。 MIDIMIDI数据是完全可编辑的，可对数据是完全可编辑的，可对MIDIMIDI音乐的音符、音高、输出设备等很小的乐谱单音乐的音符、音高、输出设备等

58、很小的乐谱单元作精确编辑和修改。元作精确编辑和修改。 MIDI MIDI也有以下几方面的不足：也有以下几方面的不足：由于由于MIDIMIDI数据并不表示实际的声音，而是音乐设备的声音，因此只要数据并不表示实际的声音，而是音乐设备的声音，因此只要MIDIMIDI的播放设的播放设备与制作备与制作MIDIMIDI时使用的设备不一样，就无法保证播放的最佳效果完全无误。时使用的设备不一样，就无法保证播放的最佳效果完全无误。采用采用MIDIMIDI无法表示语音信号。无法表示语音信号。采用数字音频还有两个，而且经常起决定性作用的原因：采用数字音频还有两个，而且经常起决定性作用的原因：u Macinto

59、shMacintosh和和WindowsWindows平台为数字音频提供了更多的应用软件和系统支持。平台为数字音频提供了更多的应用软件和系统支持。u 创建数字音频的准备和编程并不需要具备音乐理论的专业知识，但是处理创建数字音频的准备和编程并不需要具备音乐理论的专业知识，但是处理MIDIMIDI数据不但数据不但需要了解音频制作，而且需要对音乐乐谱、键盘和音符有所了解。需要了解音频制作，而且需要对音乐乐谱、键盘和音符有所了解。4.74.7音频工具软件音频工具软件 Adobe Audition Adobe Audition是是AdobeAdobe公司的音频处理产品，简称公司的音频处理产品，简称AuA

60、u，是一款集音频录制、混，是一款集音频录制、混合、编辑和控制于一身的音频处理工具软件。合、编辑和控制于一身的音频处理工具软件。可以录制、混合、编辑和控制数字音频文件，也可轻松创建音乐、制作广播短片、可以录制、混合、编辑和控制数字音频文件，也可轻松创建音乐、制作广播短片、修复录制缺陷等，以获得所需的音频处理效果。修复录制缺陷等，以获得所需的音频处理效果。 Au 3.0Au 3.0是是Adobe Adobe 公司公司20072007年年1111月月8 8发布的新版音频处理软件，其扩充或增强的新功能发布的新版音频处理软件，其扩充或增强的新功能包括：包括：4.7.1 Au 3.04.7.1 Au 3

人人文库> 全部分类> 应用文书 > 工作计划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《音频信息处理技术》PPT课件

文档简介

温馨提示

最新文档

评论

《音频信息处理技术》PPT课件

文档简介

温馨提示

最新文档

评论

相关文档