音频信息处理技术_第1页
音频信息处理技术_第2页
音频信息处理技术_第3页
音频信息处理技术_第4页
音频信息处理技术_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- http:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 第第2 2页页/ /共

2、共6868页页本章导读 音频信息处理技术是多媒体信息处理的主要技术之一,音频信息处理技术是多媒体信息处理的主要技术之一,它使计算机具备了录音、声音编辑、语音合成、声音播放它使计算机具备了录音、声音编辑、语音合成、声音播放等功能。在等功能。在mpc中,可以通过声音传递信息、制造效果、中,可以通过声音传递信息、制造效果、营造气氛及演奏音乐等。目前的音频信息处理技术主要包营造气氛及演奏音乐等。目前的音频信息处理技术主要包括模拟声音信号的数字化、数据压缩编码、数字音效处理、括模拟声音信号的数字化、数据压缩编码、数字音效处理、音频文件存储、传输、播放等内容。音频文件存储、传输、播放等内容。本章主要介绍声

3、音信本章主要介绍声音信号及其数字化的基本概念、音频卡的组成及其工作原理、号及其数字化的基本概念、音频卡的组成及其工作原理、数字音频的采集与编辑、数字音频的采集与编辑、midi音乐以及几个常用的音频处音乐以及几个常用的音频处理软件等内容,理软件等内容,并以并以adobe audition3.0版本为例,详细版本为例,详细介绍音频信息编辑处理的具体方法。介绍音频信息编辑处理的具体方法。http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- htt

4、p:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 第第3 3页页/ /共共6868页页本章主要内容本章主要内容4.1 4.1 音频基础知识音频基础知识 4.2 4.2 音质标准与评价音质标准与评价4.3 4.3 音频的数字化与编码音频的数字化与编码4.4 4.4 音频卡音频卡4.5 4.

5、5 数字音频的采集与编辑数字音频的采集与编辑4.6 midi4.6 midi音乐音乐第第4 4页页/ /共共6868页页4.1 4.1 音频基础知识音频基础知识4.1.1 4.1.1 声音的物理特征声音的物理特征 声音声音是由物体振动产生的,并以是由物体振动产生的,并以声波形式声波形式通过介质(如通过介质(如空气、水、金属等)传播。物理上,声音可以用空气、水、金属等)传播。物理上,声音可以用一条连续曲一条连续曲线线来表示,来表示,, ,如图如图4-1 4-1 。物体振动的最大位移称为。物体振动的最大位移称为振幅振幅a a,声,声波中两个连续波峰(或波谷)之间的距离称为波中两个连续波峰(或波谷)

6、之间的距离称为周期周期t t,周期,周期的倒数的倒数1/t1/t即为即为频率频率f f,以,以赫兹(赫兹(hzhz)为单位,频率为单位,频率反映了单位时间(反映了单位时间(1 1秒)物秒)物体振动的次数。体振动的次数。图图4-1 4-1 声波的振幅与频率声波的振幅与频率tat0第第5 5页页/ /共共6868页页 声音按频率可分为三类:声音按频率可分为三类:音频、次声、超声音频、次声、超声 l 低于低于20hz20hz的声音称为次声的声音称为次声l 频率范围在频率范围在20hz20hz20khz20khz范范围的可听声音称为音频,围的可听声音称为音频, 其中人说话发出的语音信号的其中人说话发出

7、的语音信号的频率范围是频率范围是300hz300hz3khz3khzl 频率高于频率高于20khz20khz的称为超音的称为超音频(或超声)频(或超声)15 20 300 3k 20k 50k f(hz)音频信号音频信号语音信号语音信号超声信号超声信号次声信号次声信号图图4-2 4-2 不同声音信号的频率范围不同声音信号的频率范围 可听的音频声音又可分为可听的音频声音又可分为语音、乐音、效果音、合语音、乐音、效果音、合成音、噪音(声)成音、噪音(声)等五种。等五种。 第第6 6页页/ /共共6868页页4.1.2 4.1.2 音频三要素音频三要素 音频有三个主要属性,分别是音频有三个主要属性,

8、分别是音调、音强音调、音强和和音色音色,它们,它们既反映了音频信号的基本特征,也是人感受声音信号的三个既反映了音频信号的基本特征,也是人感受声音信号的三个主要因素,因此又被称为音频三要素。主要因素,因此又被称为音频三要素。 音调音调:又称音高,反映声音的高低程度,由声音信号的:又称音高,反映声音的高低程度,由声音信号的频率大小所决定。频率越大,音调越高;频率越小,音调越频率大小所决定。频率越大,音调越高;频率越小,音调越低。低。 音强音强:又称响度,反映声音的大小或强弱,由振幅和声:又称响度,反映声音的大小或强弱,由振幅和声源距离共同决定。振幅越大,距离越小,音强(响度)越大。源距离共同决定。

9、振幅越大,距离越小,音强(响度)越大。 音色音色:又称音质,反映声音的品质,它由振动物体(声:又称音质,反映声音的品质,它由振动物体(声源)的材料、结构、状态等自身因素决定,表现为声源的频源)的材料、结构、状态等自身因素决定,表现为声源的频带宽度。带宽度。第第7 7页页/ /共共6868页页4.1.3 4.1.3 数字音频的三种形式数字音频的三种形式 音频(音频(audioaudio)是指频率在)是指频率在20hz20hz20khz20khz范围内的可听声范围内的可听声音,是多媒体信息中的一种媒体类型音,是多媒体信息中的一种媒体类型听觉类媒体。听觉类媒体。 目前多媒体计算机中的音频主要有目前多

10、媒体计算机中的音频主要有波形音频、波形音频、cdcd音频和音频和midimidi音乐音乐3 3种形式。种形式。1 1、波形音频:、波形音频: 是由外部声音源通过数字化过程采集到多媒体计算机中是由外部声音源通过数字化过程采集到多媒体计算机中的所有声音形式。可通过编辑(裁剪、合成、效果等)、编的所有声音形式。可通过编辑(裁剪、合成、效果等)、编码压缩、存储、传输以及还原播放等方式进行处理。在波形码压缩、存储、传输以及还原播放等方式进行处理。在波形音频中,有一类特殊的声音需要特别提到,即人的语音。语音频中,有一类特殊的声音需要特别提到,即人的语音。语音是波形声音中人的说话声音,具有内在的语言学、语音

11、学音是波形声音中人的说话声音,具有内在的语言学、语音学的内涵。的内涵。第第8 8页页/ /共共6868页页2 2、cdcd音频音频 cd-cd-音频(音频(cd-audiocd-audio)是存储在音乐)是存储在音乐cdcd光盘中的数字音光盘中的数字音频,可以通过频,可以通过cd-romcd-rom驱动器读取并采集到多媒体计算机系驱动器读取并采集到多媒体计算机系统中,并以波形音频的相应形式存储、传输和处理。统中,并以波形音频的相应形式存储、传输和处理。3 3、midimidi音乐音乐 也称也称midimidi音频。它将音乐符号化并保存在音频。它将音乐符号化并保存在midimidi文件中,文件中

12、,并通过音乐合成器产生相应的声音波形来还原播放。并通过音乐合成器产生相应的声音波形来还原播放。 音频是时间的函数,具有很强的前后相关性,所以实音频是时间的函数,具有很强的前后相关性,所以实时性是音频处理的基本要求。时性是音频处理的基本要求。第第9 9页页/ /共共6868页页4.1.4 4.1.4 数字音频的文件格式数字音频的文件格式音频文件通常分为两大类:音频文件通常分为两大类:声音文件声音文件 和和 midimidi文件文件下表介绍几种常用的音频文件格式及后缀名:下表介绍几种常用的音频文件格式及后缀名:序号序号音频文件名称音频文件名称后缀名后缀名1 1wavewave文件文件 .wav .

13、wav 2 2aiffaiff文件文件 .aif/.aiff .aif/.aiff 3 3audioaudio文件文件 .au .au 4 4 sound sound文件文件 .snd .snd 5 5voicevoice文件文件 .voc .voc 6 6 mpeg mpeg音频文件音频文件 .mp1/.mp2/.mp3 .mp1/.mp2/.mp3 7 7realaudiorealaudio文件文件 .ra/.rm/.ram .ra/.rm/.ram 8 8windows media audiowindows media audio文件文件 .wma/.asf/.asx/.wax .wma

14、/.asf/.asx/.wax 9 9midimidi文件文件 .mid/.rmi/.cmi/.cmf .mid/.rmi/.cmi/.cmf 1010modulemodule文件文件 .mod/.s3m/.xm/.mtm/.far/.kar/ .mod/.s3m/.xm/.mtm/.far/.kar/ 第第1010页页/ /共共6868页页4.1.5 4.1.5 音频处理工具软件简介音频处理工具软件简介 音频工具软件在内容上主要指处理数字音频和音频工具软件在内容上主要指处理数字音频和midimidi乐谱乐谱的各种工具软件,在功能上包括的各种工具软件,在功能上包括音频采集、编辑、合成、编音频采

15、集、编辑、合成、编码压缩以及码压缩以及midimidi乐谱的创作、编辑、发布等环节乐谱的创作、编辑、发布等环节。 按照音频处理的基本过程,通常可把音频工具软件分为:按照音频处理的基本过程,通常可把音频工具软件分为: 1 1、midimidi制作软件制作软件 2 2、音频处理软件、音频处理软件 3 3、音频压缩软件、音频压缩软件 4 4、音乐、音乐cdcd刻录软件刻录软件第第1111页页/ /共共6868页页4.2 4.2 音质标准与评价音质标准与评价4.2.1 4.2.1 音质等级标准音质等级标准 音质音质是指音频信号经传输、处理后所再现的声音质量是指音频信号经传输、处理后所再现的声音质量(保

16、真度)。(保真度)。等级等级频率范围频率范围音质音质高端高端dvddvd0 048khz48khz顶级顶级标准标准dvddvd0 024khz24khzcd-dacd-da音质音质10hz10hz20khz20khz高高fmfm广播音质广播音质20hz20hz15khz15khz较高较高amam广播音质广播音质50hz50hz7khz7khz中中电话音质电话音质200hz200hz3.4khz3.4khz低低第第1212页页/ /共共6868页页4.2.2 4.2.2 音质客观评价音质客观评价 客观评价客观评价是指通过检测仪器测量音频信号的技术指标来进是指通过检测仪器测量音频信号的技术指标来进

17、行声音质量评价,主要技术指标有:频带宽度、动态范围和信行声音质量评价,主要技术指标有:频带宽度、动态范围和信噪比等。噪比等。 理论上,理论上,声音信号是由许多频率不同的分量信号组合而声音信号是由许多频率不同的分量信号组合而成的复合信号,因此,声音的频带宽度特指复合声音信号的成的复合信号,因此,声音的频带宽度特指复合声音信号的频率范围,范围越大,频带越宽,可包含的音频信号(谐波)频率范围,范围越大,频带越宽,可包含的音频信号(谐波)越丰富,因而声音质量就越高。越丰富,因而声音质量就越高。 实际上实际上,再现声音(特别是乐音)的质量与所用的播放,再现声音(特别是乐音)的质量与所用的播放设备和场地条

18、件有关。高质量的音频信号要通过高品质的音设备和场地条件有关。高质量的音频信号要通过高品质的音响设备在较好的音响环境中,才能再现出高质量的音响效果。响设备在较好的音响环境中,才能再现出高质量的音响效果。对于音响设备而言,主要关注对于音响设备而言,主要关注失真度、频响、瞬态响应、信失真度、频响、瞬态响应、信噪比、声道分离度、声道平衡度噪比、声道分离度、声道平衡度等指标。等指标。 第第1313页页/ /共共6868页页4.2.3 4.2.3 音质主观评价音质主观评价 主观评价是指通过人聆听各种声音而产生的好恶感觉来进主观评价是指通过人聆听各种声音而产生的好恶感觉来进行声音质量评价。行声音质量评价。

19、1 1、语音质量评价方法、语音质量评价方法 常用的主观评价方法有:常用的主观评价方法有:平均主观分法,失真平均主观分平均主观分法,失真平均主观分法,判断满意度测量法法,判断满意度测量法等。等。 itu-tp800itu-tp800标准中定义的标准中定义的mosmos,它将语音质量分为,它将语音质量分为5 5级,如级,如表所示:表所示:等级等级音质音质主观感觉主观感觉5 5优优未察觉失真未察觉失真4 4良良刚察觉失真,但不讨厌刚察觉失真,但不讨厌3 3中中察觉失真,稍微讨厌察觉失真,稍微讨厌2 2差差讨厌,但不令人反感讨厌,但不令人反感1 1劣劣极其讨厌,令人反感极其讨厌,令人反感第第1414页

20、页/ /共共6868页页 2 2、乐音质量评价、乐音质量评价 乐音音质的优劣取决于多种因素,如乐音音质的优劣取决于多种因素,如声源特性、音响器声源特性、音响器材的信号特性、声场特性、听觉特性材的信号特性、声场特性、听觉特性等。因此,对音响设等。因此,对音响设备再现的乐音音质的准确评价难度较大。备再现的乐音音质的准确评价难度较大。 主观评价乐音音质,一般是通过再现乐音的响度、音调主观评价乐音音质,一般是通过再现乐音的响度、音调和音色的变化及其组合来评价音质的,和音色的变化及其组合来评价音质的, 几种典型的听感:几种典型的听感:定位感定位感 ,空间感,空间感 ,层次感,层次感 ,厚度,厚度感感 ,

21、立体感,立体感 。除此之外,还有力度感、亮度感、临场感、。除此之外,还有力度感、亮度感、临场感、软硬感、松紧感、宽窄感等许多评价音质的听感。软硬感、松紧感、宽窄感等许多评价音质的听感。 第第1515页页/ /共共6868页页4.3 4.3 音频的数字化与编码音频的数字化与编码 计算机在处理音频信号之前,计算机在处理音频信号之前,必须将模拟的声音信号数字化,必须将模拟的声音信号数字化,形成数字音频。具体过程包括:形成数字音频。具体过程包括:采样、量化、编码采样、量化、编码。4.3.1 4.3.1 采样与采样频率采样与采样频率 采样是每间隔一段时间读采样是每间隔一段时间读取一次声音信号幅度,使声音

22、取一次声音信号幅度,使声音信号在时间上被离散化,如图信号在时间上被离散化,如图4-24-2所示。采样的主要参数是所示。采样的主要参数是采样频率采样频率 。第第1616页页/ /共共6868页页 采样频率采样频率:是指将模拟声音波形数字化时,每秒钟所抽:是指将模拟声音波形数字化时,每秒钟所抽取声波幅度样本的次数,其计算单位是取声波幅度样本的次数,其计算单位是khz(khz(千赫兹千赫兹) )。如图。如图4-34-3是模拟声音信号数字化时的采样图示。是模拟声音信号数字化时的采样图示。 一般来讲,采样频率一般来讲,采样频率越高声音失真越小,用于越高声音失真越小,用于存储数字音频的数据量也存储数字音频

23、的数据量也越大。越大。 采样频率的高低是根采样频率的高低是根据据声音信号本身的最高频声音信号本身的最高频率和采样定理率和采样定理决定的。决定的。图图4-3 4-3 声音信号采样声音信号采样第第1717页页/ /共共6868页页 采样定理采样定理:在进行模拟:在进行模拟/ /数字信号的转换过程中,当采数字信号的转换过程中,当采样频率样频率f fs s大于信号中最高频率大于信号中最高频率f fmaxmax的的2 2倍时,即倍时,即f fs s=2f=2fmaxmax,采,采样之后的数字信号完整地保留了原始信号中的信息。采样定样之后的数字信号完整地保留了原始信号中的信息。采样定理又叫奈奎斯特定理(理

24、又叫奈奎斯特定理(nyquist theorynyquist theory)。)。表表4-4 4-4 不同音质数字音频的常用采样率不同音质数字音频的常用采样率采样率采样率音质音质频率范围频率范围8,000 hz8,000 hz电话电话0 04,000 hz4,000 hz11,025 hz11,025 hz低于低于amam广播广播0 05,512 hz5,512 hz22,050 hz22,050 hz接近接近fmfm广播广播0 011,025 hz11,025 hz32,000 hz32,000 hz优于优于fmfm广播广播0 016,000 hz16,000 hz44,100 hz44,1

25、00 hzcd-dacd-da0 022,050 hz22,050 hz48,000 hz48,000 hz标准标准dvddvd0 024,000 hz24,000 hz96,000 hz96,000 hz高端高端dvddvd0 048,000 hz48,000 hz第第1818页页/ /共共6868页页4.3.2 4.3.2 量化与量化位数量化与量化位数 量化量化就是把采样得到的声音信号幅度转换为数字值,就是把采样得到的声音信号幅度转换为数字值,是声音信号在幅度上被离散化。是声音信号在幅度上被离散化。 量化位数量化位数n n定义了每个采样点的数据范围(定义了每个采样点的数据范围(0 02 2

26、n n-1-1),),也叫量化等级,量化等级的多少决定了声音的动态范围。也叫量化等级,量化等级的多少决定了声音的动态范围。图图4-4 4-4 量化位数与动态范围量化位数与动态范围 第第1919页页/ /共共6868页页4.3.2 4.3.2 量化与量化位数量化与量化位数表表4-5 4-5 不同音质的量化位数、量化范围、动态范围不同音质的量化位数、量化范围、动态范围量化位数量化位数音质音质量化等级量化等级动态范围动态范围8 8位位电话电话25625648 db48 db1616位位cdcd65,53665,53696 db96 db2424位位dvddvd16,777,21616,777,216

27、144 db144 db3232位位顶级顶级4,294,967,2964,294,967,296192 db192 db第第2020页页/ /共共6868页页4.3.3 4.3.3 声道声道声道个数是声道个数是反映音频数字化质量的另一个因素。反映音频数字化质量的另一个因素。单声道:单声道:采集声音数据时,仅采集一个声波的数据采集声音数据时,仅采集一个声波的数据双声道(立体声)双声道(立体声):采集两个声波数据:采集两个声波数据多声道(环绕立体声)多声道(环绕立体声):采集两个以上声波数据:采集两个以上声波数据声道数越多,再现出的音响效果就越好。声道数越多,再现出的音响效果就越好。第第2121页

28、页/ /共共6868页页4.3.4 4.3.4 音频采样的数据量音频采样的数据量数字音频的数据量主要取决于两个因素:数字音频的数据量主要取决于两个因素:u音质因素音质因素:由采样频率、量化位数和声道数:由采样频率、量化位数和声道数3 3个个参数决定。参数决定。u时间因素:时间因素:单位时间的数据量可用下式表示:单位时间的数据量可用下式表示: fcbs8v= v= v v:为单位时间的数据量(:为单位时间的数据量(kbpskbps)fc:为采样频率(:为采样频率(khzkhz)b b:为量化位数(:为量化位数(bitbit)s s:为声道数:为声道数4.3.5 4.3.5 音频数据编码音频数据编

29、码音频数据压缩方法分类音频数据压缩方法分类pcmpcm为脉冲调制编码,为脉冲调制编码,dpcmdpcm为差分脉冲调制编码,为差分脉冲调制编码,adpcmadpcm为自适应差分脉冲调制编码为自适应差分脉冲调制编码, ,vselpvselp为矢量和激励线性预测编码,为矢量和激励线性预测编码,mplpcmplpc为多脉冲激励线性预测编码,为多脉冲激励线性预测编码,celpcelp为码本激励线性预测编码。为码本激励线性预测编码。第第2323页页/ /共共6868页页4.3.6 4.3.6 音频编码标准音频编码标准 1 1、一般语音音质的音频压缩标准、一般语音音质的音频压缩标准u特点:特点:音质低,能听

30、到声音就可以音质低,能听到声音就可以u应用:应用:各类提示音各类提示音u压缩标准:压缩标准: ccitt a lawccitt a law ccitt law ccitt law 低采样率或低量化位数的低采样率或低量化位数的pcm pcm 第第2424页页/ /共共6868页页2 2、电话音质的音频压缩标准、电话音质的音频压缩标准u频率范围频率范围:300hz:300hz3.4khz3.4khz,用标准的,用标准的pcmpcm编码。编码。u压缩标准:压缩标准: g g系列音频压缩标准系列音频压缩标准ug g系列音频压缩标准利用的技术系列音频压缩标准利用的技术: 线性预测技术线性预测技术 矢量量

31、化技术矢量量化技术 综合分析技术综合分析技术u典型的算法典型的算法: adpcmadpcm celp celp ld-celp ld-celp(短时延码本激励线性预测编码)(短时延码本激励线性预测编码) rpe-ltprpe-ltp(长时线性预测规则码激励)(长时线性预测规则码激励) vselpvselp(矢量和激励线性预测编码)(矢量和激励线性预测编码)第第2525页页/ /共共6868页页标准标准参数说明参数说明g.711g.711pcmpcm编码,采样速率编码,采样速率8khz8khz,量化位数,量化位数8bit8bit,比特流速率,比特流速率为为64kb/s64kb/s。使用非线性量化

32、技术。使用非线性量化技术g.721g.721adpcmadpcm编码:每个数值差分用编码:每个数值差分用4 4位编码,采样率为位编码,采样率为8khz8khz,比特流被转换为比特流被转换为32kbps32kbpsg.723g.723sb-adpcmsb-adpcm编码(编码(有损压缩),比特流被转换为有损压缩),比特流被转换为5.35.3 6.3kbps6.3kbps之间之间g.728g.728ld-celpld-celp编码,比特流被转换为编码,比特流被转换为16kbps16kbps,带宽限于,带宽限于3.4khz3.4khz;音质与;音质与g.721g.721标准相当标准相当表表4-6 4

33、-6 电话音质的音频编码标准电话音质的音频编码标准第第2626页页/ /共共6868页页3 3、 amam广播音质的音频压缩标准广播音质的音频压缩标准u频率范围频率范围:50hz:50hz7khz 7khz u压缩标准:压缩标准:ituitu制定的制定的g.722g.722标准标准 ug.722g.722标准采用的算法:标准采用的算法:sb-adpcmsb-adpcm(子带(子带adpcmadpcm)usb-adpcmsb-adpcm算法:算法:将现有的带宽分成两个独立的子带将现有的带宽分成两个独立的子带信道,使输入信号进入滤波器组分成高子带信号和低信道,使输入信号进入滤波器组分成高子带信号和

34、低子带信号,然后分别进行子带信号,然后分别进行adpcmadpcm编码,最后进入混合器编码,最后进入混合器形成输出码流形成输出码流 第第2727页页/ /共共6868页页4 4、高保真立体声音频压缩标准、高保真立体声音频压缩标准u包括包括: :cd-dacd-da以上音质、以上音质、fmfm广播音质广播音质ufmfm广播音质频率范围广播音质频率范围: :20hz20hz15khz15khz ucd-dacd-da音频信号的频率范围:音频信号的频率范围:50hz50hz20khz20khz u压缩标准:压缩标准: 1 1)mpeg1mpeg1,mpeg2mpeg2的的layer1layer1、2

35、 2、3 3,mpeg 4 aacmpeg 4 aac音频编码,杜比音频编码,杜比ac-3ac-3等等。用于数字广播、数字电视广。用于数字广播、数字电视广播、消费电子产品、音频信息的存储和下载等。播、消费电子产品、音频信息的存储和下载等。 2 2)itu-t g.722.1itu-t g.722.1、3gpp amr-wb+3gpp amr-wb+和和3gpp 2 3gpp 2 4gv-wb 4gv-wb 。用于像用于像3g3g通信这样的高音质低码率应用场合。通信这样的高音质低码率应用场合。第第2828页页/ /共共6868页页4.4 4.4 音频卡音频卡 4.4.1 4.4.1 音频卡的功能

36、音频卡的功能u 录制和播放数字声音文件录制和播放数字声音文件u 控制音量和混音效果控制音量和混音效果u 声音文件的压缩与解压缩声音文件的压缩与解压缩u midimidi接口与音乐合成接口与音乐合成 第第2929页页/ /共共6868页页4.4.2 4.4.2 音频卡的组成与工作原理音频卡的组成与工作原理图图4-6 4-6 音频卡的一般组成与结构示意图音频卡的一般组成与结构示意图dspdsp音频输出音频输出放大器放大器麦克风麦克风micmic线路输入线路输入line inline in音乐合成器音乐合成器系统总系统总线接口线接口cdcd输入输入混合信号混合信号处理器处理器midimidi与游与游

37、戏接口戏接口系统总线系统总线放大器放大器第第3030页页/ /共共6868页页 音频卡的主要功能部件音频卡的主要功能部件:功率放大器、混合信号处理:功率放大器、混合信号处理器、器、dspdsp数字信号处理器、音乐合成器以及相关的外围接口数字信号处理器、音乐合成器以及相关的外围接口等。等。 声音的合成与处理声音的合成与处理:由:由dspdsp数字声音处理器、音乐合成数字声音处理器、音乐合成器及器及midimidi接口控制器组成接口控制器组成, ,主要任务是完成声波信号的模主要任务是完成声波信号的模/ /数、数数、数/ /模转换,利用调频技术控制声音的音调、音色和幅模转换,利用调频技术控制声音的音

38、调、音色和幅度。度。 混合信号处理器及功率放大器混合信号处理器及功率放大器:内置数字:内置数字/ /模拟混音器,模拟混音器,混音器的声源可以是混音器的声源可以是midimidi信号、信号、cdcd音频、线性输入、话筒音频、线性输入、话筒以及以及pcpc机的扬声器等,可以选择输入一个声源或将几个不机的扬声器等,可以选择输入一个声源或将几个不同声源进行混合录音。同声源进行混合录音。 4.4.3 4.4.3 音频卡的音频卡的i/oi/o接口接口图图4-7 音频卡的外围接口连接示意图音频卡的外围接口连接示意图第第3232页页/ /共共6868页页4.4.3 4.4.3 音频卡的音频卡的i/oi/o接口

39、接口图图4-8 支持支持5.1环绕的声卡插口环绕的声卡插口第第3333页页/ /共共6868页页4.5 4.5 数字音频的采集与编辑数字音频的采集与编辑 一般的数字音频采集首先需要选择和设置恰当的采样参一般的数字音频采集首先需要选择和设置恰当的采样参数,然后再开始录音采集,最后再使用相应的编辑软件对录数,然后再开始录音采集,最后再使用相应的编辑软件对录制的音频数据进行剪辑和效果处理。制的音频数据进行剪辑和效果处理。 4.5.1 4.5.1 录音采集录音采集u 选择采样参数选择采样参数u 调整输入音频的频响调整输入音频的频响u 检测输入音频的强度检测输入音频的强度 u 开始录音开始录音第第343

40、4页页/ /共共6868页页图图4-9 4-9 设置录音参数设置录音参数1 1、选择采样参数、选择采样参数 首先要根据实际情况选择最佳的采样参数,做到音质与首先要根据实际情况选择最佳的采样参数,做到音质与数据量的折中考虑,避免采样过程中出现存储空间不足的现数据量的折中考虑,避免采样过程中出现存储空间不足的现象发生。象发生。 cdcd音质、音质、电话质量电话质量收音质量收音质量default quality default quality 第第3535页页/ /共共6868页页2 2调整输入音频的频响调整输入音频的频响 表表4-7 各频段参数对音质的影响各频段参数对音质的影响频段频段频率范围频率

41、范围音质影响音质影响低频低频20206060hzhz空间感。提升低频共振(嗡),降落空虚;空间感。提升低频共振(嗡),降落空虚;6060100100hzhz浑厚感。提升轰鸣浑厚感。提升轰鸣( (轰轰) ),降落无力;,降落无力;100100150hz150hz丰满度。提升浑浊、降落单薄;丰满度。提升浑浊、降落单薄;中频低段中频低段150150300300hzhz声音力度、男声力度。提升声音硬、无特色,降落软、飘;声音力度、男声力度。提升声音硬、无特色,降落软、飘;中频中频300300500500hzhz语音主要音区,提升语音单调、降落语音空洞;语音主要音区,提升语音单调、降落语音空洞;5005

42、001k1khzhz人声基音、声音廓,提升语音前凸、降落语音收缩感;人声基音、声音廓,提升语音前凸、降落语音收缩感; 1k1k2k2khzhz通透感、顺畅感,提升有跳跃感、降落通透感、顺畅感,提升有跳跃感、降落 松散;松散; 中频上段中频上段2k2k3k3khzhz对明亮度最敏感,提升声音硬,不自然;对明亮度最敏感,提升声音硬,不自然;3k3k4k4khzhz穿透力,提升穿透力,提升 咳音;咳音;4k4k5k5khzhz乐器表面响度,提升乐器距离近、降落乐器表面响度,提升乐器距离近、降落 乐器距离远;乐器距离远;高频高频5k5k6k6khzhz语言的清晰度,提升声音锋利、易疲劳;语言的清晰度,

43、提升声音锋利、易疲劳;6k6k8k8khzhz明亮度、透明度,明亮度、透明度, 提升齿音重、降落提升齿音重、降落 声音黯淡;声音黯淡;8k8k10k10khzhzs s音,影响音色的清晰度和透明度;音,影响音色的清晰度和透明度;第第3636页页/ /共共6868页页3 3、检测输入音频的强度、检测输入音频的强度 在在win2kwin2k环境下,可通过环境下,可通过“音量控制音量控制”对话框来检测、调对话框来检测、调节进入计算机的音源强度。节进入计算机的音源强度。 打开打开windowswindows下的音量控制台,选择菜单栏中的下的音量控制台,选择菜单栏中的“选选项项”“属性属性”命令打开命令

44、打开“属性属性”对话框。对话框。 图图4-10 4-10 音量控制台音量控制台第第3737页页/ /共共6868页页 在在“属性属性“对话框中的音量调节选项中选择对话框中的音量调节选项中选择“录录音音”,在显示音量控制栏中选中麦克风等选项,如图,在显示音量控制栏中选中麦克风等选项,如图4-114-11所所示。示。 在弹出的录音控制台中选中麦克风或线路输入或在弹出的录音控制台中选中麦克风或线路输入或cdcd音频,使相应的音源有效,如图音频,使相应的音源有效,如图4-124-12所示。所示。 图图4-11 “属性属性”对话框对话框 图图4-12 录音控制对话框录音控制对话框第第3838页页/ /共

45、共6868页页4 4、开始录音、开始录音图图4-11 录音机操作面板录音机操作面板第第3939页页/ /共共6868页页4.5.2 4.5.2 抓取抓取cdcd、vcdvcd和和dvddvd音轨音轨 获取数字音频的另一个快捷途径就是从不同的多媒体产品获取数字音频的另一个快捷途径就是从不同的多媒体产品中直接抓取音轨信息,并转换压缩成所需的音频格式。中直接抓取音轨信息,并转换压缩成所需的音频格式。 wavelab 5.0版版 :抓取音乐抓取音乐cd、dvd中的音轨中的音轨 “豪杰超级解霸豪杰超级解霸”软件软件:抓取音乐:抓取音乐cd、vcd或或dvd光盘等光盘等格式音轨格式音轨 豪杰超级解霸豪杰超

46、级解霸9.0版版 :可从:可从dvd、vcd、rm/rmvb、avi、mpg、mv等音视频混合的媒体中提取音频信息,并保存为一种等音视频混合的媒体中提取音频信息,并保存为一种称为称为dac高音质压缩格式或高音质压缩格式或wav、mp3格式的声音文件格式的声音文件 注意:在使用抓取音轨来采集数字音频时,应该遵守有关注意:在使用抓取音轨来采集数字音频时,应该遵守有关法律规定,取得相应的使用权,避免以后出现知识产权纠纷。法律规定,取得相应的使用权,避免以后出现知识产权纠纷。 第第4040页页/ /共共6868页页4.5.3 4.5.3 编辑数字音频编辑数字音频 音频编辑一般包括音频编辑一般包括音频内

47、容剪切音频内容剪切、合成合成以及以及音质和效音质和效果的编辑果的编辑等方面。等方面。 多音轨(多音轨(multiple tracksmultiple tracks) 切边(切边(trimmingtrimming) 拼接和组合(拼接和组合(splicing and assemblysplicing and assembly) 音量调节(音量调节(volume adjustmentsvolume adjustments) 格式转换(格式转换(format conversionformat conversion) 重采样或降低采样率(重采样或降低采样率(resampling or down samp

48、lingresampling or down sampling) 淡进淡出(淡进淡出(fade-ins and fade-outsfade-ins and fade-outs) 均衡(均衡(equalizationequalization) 时间拉伸(时间拉伸(time stretchingtime stretching) 数字信号处理(数字信号处理(digital signal processing-dspdigital signal processing-dsp)第第4141页页/ /共共6868页页4.6 midi4.6 midi音乐音乐4.6.1 4.6.1 什么是什么是midimid

49、i midi midi(musical instrument digital interfacemusical instrument digital interface)乐器数)乐器数字接口字接口。它是由。它是由yamahayamaha、rolandroland等公司在等公司在19831983年联合提出并不年联合提出并不断发展确定的数字音乐的国际标准,它规定了电子乐器和多媒断发展确定的数字音乐的国际标准,它规定了电子乐器和多媒体计算机之间进行连接的硬件及数据通信协议,是多媒体计算体计算机之间进行连接的硬件及数据通信协议,是多媒体计算机所支持的又一种声音产生方法机所支持的又一种声音产生方法mid

50、imidi方法。方法。 midimidi方法方法就是将数字式电子乐器的弹奏过程记录下来,如就是将数字式电子乐器的弹奏过程记录下来,如选的是什么乐器,弹下哪一个键,用了多大力气,持续了多长选的是什么乐器,弹下哪一个键,用了多大力气,持续了多长时间等。时间等。 midimidi格式的数字化文件格式的数字化文件可以看作是乐谱的数字化描述,它可以看作是乐谱的数字化描述,它记录的不再是声音的波形,而是乐器的种类以及音阶的高低、记录的不再是声音的波形,而是乐器的种类以及音阶的高低、长短、强弱、速度等因素,这些被称为长短、强弱、速度等因素,这些被称为midimidi消息,存储为消息,存储为midimidi文

51、件。文件。 第第4242页页/ /共共6868页页4.6.2 midi4.6.2 midi设备的配置与连接设备的配置与连接 一件乐器只要包含了能处理一件乐器只要包含了能处理midimidi信息的微处理器以及信息的微处理器以及相关的硬件接口,就可以认为是一台相关的硬件接口,就可以认为是一台midimidi设备设备。 两台两台midimidi设备之间可以通过设备之间可以通过接口发送信息接口发送信息而进行相互而进行相互通信。通信。 一台一台midimidi设备可以有设备可以有1 13 3个端口个端口:umidi in midi in 接口接口:接收来自其它:接收来自其它midimidi设备上的设备上

52、的midimidi信息;信息;umidi outmidi out接口接口:用来输出本设备生成的:用来输出本设备生成的midimidi信息;信息;u midi thrumidi thru接口:接口:将从将从midi inmidi in端口传来的信息发送到另端口传来的信息发送到另一台相联的一台相联的midimidi设备上。设备上。第第4343页页/ /共共6868页页 接收设备的接收设备的midi inmidi in连接器内常采用连接器内常采用光电耦合器光电耦合器实现收、发实现收、发设备之间的电气隔离。设备之间的电气隔离。 midimidi信息采用信息采用异步串行方式传输异步串行方式传输,传输速率

53、为,传输速率为31.2531.25 kbpskbps。 在进行在进行midimidi通信时,用户可以通过标准的通信时,用户可以通过标准的midimidi电缆电缆来相互连来相互连接各端口。如图接各端口。如图4-144-14所示。所示。图图4-14 midi4-14 midi与游戏接口电缆与游戏接口电缆midimidi接口接口游戏接口游戏接口inin和和outout第第4444页页/ /共共6868页页图图4-14 4-14 多媒体计算机与多媒体计算机与midimidi设备连接示意图设备连接示意图 midimidi软件软件(音(音序器)是用于记录、序器)是用于记录、编辑和播放编辑和播放midimi

54、di文文件的一种软件,其件的一种软件,其作用相当于是作用相当于是midimidi乐器的一台多轨磁乐器的一台多轨磁带录音机。带录音机。 midi midi设备可以配备设备可以配备电子键盘、合成器、音序器(电子键盘、合成器、音序器(midimidi软软件)以及扬声器或音箱件)以及扬声器或音箱等。等。 midimidi键盘键盘主要用于产生主要用于产生midimidi信息信息 midimidi合成器合成器是一种电子设备,使用数字信号处理器或其是一种电子设备,使用数字信号处理器或其他类型的芯片产生音乐或声音。他类型的芯片产生音乐或声音。 第第4545页页/ /共共6868页页4.6.3 4.6.3 播放

55、播放midimidi音乐音乐 声卡播放声卡播放midimidi音乐最常用的方法有两种:音乐最常用的方法有两种:fmfm合成合成与与波波表(表(wavetablewavetable)合成)合成。 fmfm是运用声音振荡的原理对是运用声音振荡的原理对midimidi进行合成处理的。进行合成处理的。 波表合成波表合成,效果较好。它是将各种真实乐器所能发出,效果较好。它是将各种真实乐器所能发出的所有声音的所有声音( (包括各个音域、声调包括各个音域、声调) )录制下来,存储在声卡录制下来,存储在声卡的的romrom中,称为硬波表。中,称为硬波表。第第4646页页/ /共共6868页页4.6.4 4.6

56、.4 制作制作midimidi音乐音乐 制作制作midimidi音乐,需要按音乐,需要按图图4-144-14的示意构成系统。的示意构成系统。 乐谱创作软件乐谱创作软件能够能够录制、编辑、打印录制、编辑、打印midimidi乐谱乐谱并并播放播放midimidi音乐音乐。有些乐谱创作软件还能对。有些乐谱创作软件还能对乐谱进行量化来调节节拍的不乐谱进行量化来调节节拍的不一致问题。一致问题。 midimidi编辑编辑中很重要的是中很重要的是选择选择midimidi乐器乐器,midimidi标准标准规定了不规定了不同的演奏乐器并用编号加以区分,范围在同的演奏乐器并用编号加以区分,范围在0 0127127

57、之间,之间,见附录见附录三。三。 在在midimidi乐谱中,乐谱中,乐器乐器idid用来决定以何种乐器来播放乐曲,用来决定以何种乐器来播放乐曲,为改变乐器,只需改变该数值即可。为改变乐器,只需改变该数值即可。 midimidi是为多媒体项目创建原始音乐素材的最佳途径。准备是为多媒体项目创建原始音乐素材的最佳途径。准备发布时应将其转换成数字音频数据。发布时应将其转换成数字音频数据。 创作创作midimidi乐谱的软件乐谱的软件:cakewalkcakewalk(cakewalk 9.0 xcakewalk 9.0 x版)版)第第4747页页/ /共共6868页页4.6.5 4.6.5 乐谱的扫

58、描与识别乐谱的扫描与识别 除了通过除了通过midimidi方法创作乐谱方法创作乐谱(midimidi音乐)以外,还可以利音乐)以外,还可以利用用扫描扫描- -识别技术识别技术,快速将印刷乐谱数字化,保存为,快速将印刷乐谱数字化,保存为midimidi乐谱。乐谱。 smartscoresmartscore软件扫描识别过程:软件扫描识别过程: 首先,通过扫描仪将乐谱以图像的方式扫描成数字图像首先,通过扫描仪将乐谱以图像的方式扫描成数字图像, ,扫描参数的选择与设置扫描参数的选择与设置: :u 分辨率分辨率: :一般选择一般选择150150300300 dpidpi,u 图像类型图像类型: :黑白二

59、值或黑白二值或ocrocr,u 扫描后的扫描后的图片存储格式图片存储格式:tif:tif格式格式; 然后,通过乐谱识别功能识别出可编辑的数字乐谱并进行然后,通过乐谱识别功能识别出可编辑的数字乐谱并进行校对、编辑。校对、编辑。第第4848页页/ /共共6868页页识别后的乐谱识别后的乐谱识别前的乐谱图片识别前的乐谱图片图图4-16 smartscore4-16 smartscore软件的乐谱识别画面软件的乐谱识别画面 smartscoresmartscore也可以打开事先存储好的乐谱图片并进行也可以打开事先存储好的乐谱图片并进行识别,识别完成后会提示将识别的结果保存为识别,识别完成后会提示将识别

60、的结果保存为smartscoresmartscore专专用格式的用格式的.enf.enf文件。文件。 第第4949页页/ /共共6868页页4.6.6 midi4.6.6 midi与数字音频的比较与数字音频的比较 midimidi数字音频数字音频是乐谱是乐谱是一段录音是一段录音取决于音乐设备的质量和音响取决于音乐设备的质量和音响系统的性能系统的性能取决于音响系统的性能取决于音响系统的性能文件小文件小数字化波形文件大数字化波形文件大与设备有关与设备有关与播放设备无关与播放设备无关依赖于特定的回放设备依赖于特定的回放设备与回放的设备关系不大,与回放的设备关系不大,播放效果几乎一样。播放效果几乎一样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论