版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章数字音频基础1.1数字音频基础
1.1.1音频的概念以及特征1.1.2音频数字化1.2音频的处理设备
1.2.1模拟音频处理设备1.2.2数字音频处理设备1.3数字音频的获取1.3.1使用录音笔录音1.3.2在计算机录音工作室中录音1.3.3从Internet上搜索和下载1.4数字音频的格式以及转换1.4.1常见的数字音频格式1.4.2不同音频格式间的转换1.4.3音频格式转换应用实例1.5数字音频编辑软件12023/2/62.1.1音频的概念及特性物理学上,声音被看成一种波动的能量,即声波。同时在物理学上,一般用声音的三个基本特性来描述声音,即频率、振幅和波形。生理学上,声音是指声波作用于听觉器官所引起的一种主观感觉。如响度、音调、音色和音长等。1.1数字音频基础22023/2/632023/2/61.1.1音频的概念及特性在物理学上声音的三个基本特性:频率、振幅和波形,对应到人耳的主观感觉就是音调、响度和音色。所谓频率即发声物体在振动时,单位时间内的振动的次数,单位为赫兹(HZ)。振幅是指发声物体在振动时偏离中心位置的幅度,代表发声物体振动时动势能的大小。振幅是由物体振动时所产生的声音的能量或声波压力的大小所决定的。声能或声压愈大,引起人耳主观感觉到的响度也愈大。音色是指声音的纯度,它由声波的波形形状所决定。即使某种声音它们的振动和频率都一样,也就是说它们的音调高低,声音强弱都相同,但它们的波形不一样,所以听起来就会有明显的区别。42023/2/61.1.1音频的概念及特性52023/2/61.1.1音频的概念及特性声音的分类按照人耳可听到的频率范围,声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20~20000赫兹间。声音高于20000赫兹为超声波,低于20赫兹为次声波。按照声音的来源以及作用来看,可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑,感叹等;乐音也可成为音乐,是指人类通过相关乐器演奏出来的声音,如影视作品中的背景声音,一般起着渲染气氛的作用;响音是指除语言和音乐之外电影中所有声音的统称,如动作音响、自然音响、背景音响、机械音响、特殊音响。62023/2/672023/2/682023/2/61.1.2音频数字化模拟音频信号。一般,模拟信号在时间或者空间维度上可以无限制的细分下去。模拟信号最大的特点就是它是一种连续的不间断的信号。对音频模拟信号进行处理时,一般采用模拟的技术手段。电器元件是将连续的原始信号的变化形式原封不动的传递给下一单元,这就是模拟的处理方式。92023/2/61.1.2数字音频数字音频是指用一连串二进制数据来保存的声音信号。102023/2/61.1.2音频的数字化过程数字化的音频信号两种途径:第一种途径就是将现场声源的模拟信号或已存储的模拟声音信号通过某种方法转换成数字音频;第二种途径就是在数字化设备中创作出数字音频,比如电子作曲。音频数字化一般经过三个阶段“采样——量化——编码”。112023/2/61.1.2音频的数字化过程音频数字化过程的具体步骤包括:第一步,将麦克风转化过来的模拟电信号以某一频率进行离散化的样本采集,这个过程就叫采样;第二步,将采集到的样本电压或电流值进行等级量化处理,这个过程就是量化;第三步将等级值变换成对应的二进制表示值(0和1),并进行存储,这个过程就是“编码”。通过这三个环节,连续的模拟音频信号即可转换成离散的数字信号——二进制的0和1。122023/2/61.1.2音频的数字化过程数字化过程两个指标:一是量化深度,也可称之为量化分辨率,是指单位电压值和电流值之间的可分等级数;二是采样频率,即采样点之间的时间间隔。两者与音质还原的关系是:采样频率越高,量化深度越大,声音质量越好。132023/2/61.1.2音频的数字化过程横坐标是时间轴(采样频率),纵坐标是幅度值(量化分辨率),曲线代表的是模拟信号对应的波动曲线,带颜色的方格是采样量化后的所得结果。采样量化
142023/2/61.1.2音频的数字化过程由图中可以得知,当频率越小(时间间隔越短),量化深度(量化分辨率)越大,二者的轮廓越吻合,这也说明数字化的信号能更好的保持模拟音频信号的形状,有利于保持原始声音的真实情况。152023/2/61.1.2音频的数字化过程在数字音频的衡量指标中,采样频率的单位是HZ,量化深度一般用比特(Bit)来度量。例如:某一音频的数字化指标是44.1kHZ,8个比特位。那么这里的44.1kHZ比较容易理解,但8比特位并不是说把某一单位的电压(电流)值成8份,而是分成28=256份;同理16位是把纵坐标分成216=65536份。通常情况下,在音频数字化的过程中,设置的采集频率可已选择三种:32kHz、44kHz、48kHz。特别是在CD制作过程中,一般的采样频率是44.1kHz,那么为什么会设置这三个档次呢?162023/2/61.1.2音频的数字化过程如图,上半部分表示原始音频的波形;下半部分表示录制后的波形;红色的点表示采样点。采样频率对波形的影响
172023/2/61.1.2音频的数字化过程上下波形之所以不吻合,是因为采样点不够多,或是采样频率不够高。这种情况关于合理的采样频率这一问题在Nyquist(奈奎斯特)定理中早已有明确的答案:要想不产生低频失真,则采样频率至少是录制的最高频率的两倍(上图中,采样频率只是录制频率的4/3倍)。这个频率通常称作Nyquist极限。,称之为低频失真。182023/2/61.2.1模拟音频处理设备1.2音频的处理设备在对声音进行处理的过程中,除了对声音进行记录之外,还需要对声音进行一些其它方面的调整。如对声音进行音调的调节、多声音混合、高中低音的调整,还有诸如原始声波信号的拾取等等问题。这就会涉及到一些其它的音频处理设备。话筒(Microphone麦克风)音箱(speaker,扬声器)模拟调音台192023/2/6(1)话筒(Microphone麦克风)话筒的主要功能就是进行声音能量的收集。当出现磁性记录技术之后,话筒的功能就开始发生变化,除了完成声音的收集外,还要完成声能向电能的转化(声音信号转化成电流信号),但是其还原声音的功能已逐渐消失。202023/2/6(2)音箱(speaker,扬声器)音箱的主要功能就是还原声音,将音频电流信号变换成声音信号,可以说是留声机中大喇叭另一功能的转化。212023/2/6(3)模拟调音台调音台在现代电台广播、舞台扩音、音响节目制作中是一种经常使用的设备,它具有多路输入,每路的声音信号可以单独被处理,还可以进行各种声音的混合,且混合比例可调;拥有多种输出。调音台在诸多系统中起着核心作用,它既能创作立体声、美化声音,又可抑制噪声、控制音量,是声音艺术处理必不可少的一种设备。222023/2/61.1.1音频的概念及特性声音的分类按照人耳可听到的频率范围,声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20~20000赫兹间。声音高于20000赫兹为超声波,低于20赫兹为次声波。按照声音的来源以及作用来看,可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑,感叹等;乐音也可成为音乐,是指人类通过相关乐器演奏出来的声音,如影视作品中的背景声音,一般起着渲染气氛的作用;响音是指除语言和音乐之外电影中所有声音的统称,如动作音响、自然音响、背景音响、机械音响、特殊音响。232023/2/6调音台
242023/2/61.2.2数字音频处理设备数字音频处理设备可以分为两类:一类是专用数字音频设备,另一类是非专为处理音频而设计的多媒体计算机。(1)数字调音台:前面介绍过模拟的调音台,可以知道调音台的作用有两个:其一是将每一路进行优化和调节;其二,对多路声音进行混合输出。(2)数字录音机:如图所示是数字录音机。数字录音机是对模拟录音方式进行了升级,采用数字记录方式来存储音频信号。一般可用硬盘记录方式或者光盘记录方式。252023/2/6数字录音机262023/2/6(3)数字音频工作站:数字音频工作站是一台能够完成从录音、编辑、混合、压缩,一直到最后刻出母盘的全部音频节目制作过程的设备。拥有这样一台设备就相当于有了调音台、多轨录音机、编辑机、效果器等这些录音棚的价值不菲的全部家当。它最大的特点就是集成度高,免去录音连线的烦恼,且便于携带。272023/2/6数字音频工作站282023/2/6在进行数字音频处理时,除了用到上述几种专用的硬件设备外,还会用到一些其它配套设备,如麦克风、音箱等等。其实,不管是专用设备,还是多媒体计算机,在处理数字音频时,其关键的硬件技术内核包括:1)模数转换器:模数转换器(AnalogtoDigitalConverter,ADC)是一个硬件芯片,一般用在带录音功能的音频处理设备之中,其作用就是将模拟的音频电压(流)信号转成数字脉冲电压(PCM)信号。任何ADC都包括上面提到的三个基本功能:采样、量化和编码,用来完成从模拟的音频信号向数字音频信号的采集过程。292023/2/62)数模转换器:数模转换器(DigitaltoAnalogConverter,DAC)也是一个硬件芯片,一般用在数字音频的重放设备中,用来将数字音频信号还原成模拟的音频信号。可以把DAC想像成16个小电阻,各个电阻值是以二的倍数增大。当DAC接受到来自计算机中的二进制PCM信号,遇到0时相对应的电阻就开启,遇到1相对应的电阻不作用,这样每一批16Bits数字信号都可以转换为相对应的电压大小。如图中所示,还原后的电流信号看起来就像阶梯一样,当然会跟原来平滑的信号有些差异,但是人的耳朵没有那么灵敏,只要采样的频率和量化深度足够的话,一般不会察觉到差异。302023/2/6采样量化312023/2/61.3数字音频的获取1.3.1使用录音笔录音1.3.2在计算机录音工作室中录音
1.3.3从Internet上搜索和下载322023/2/61.4数字音频的格式以及转换其实,不同的编码方式就对应计算机中不同的文件格式,反映在计算机中就是文件的后缀名不同。对于数字音频的常见格式有以下几种:(1)WAV格式:WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。(2)MIDI格式:MIDI是MusicalInstrumentDigitalInterface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。1.4.1常见的数字音频格式332023/2/6(3)CDA格式:大家都很熟悉CD这种音乐格式了,扩展名CDA,其取样频率为44.1kHz,16位量化位数。CD存储采用了音轨的形式,又叫“红皮书”格式,记录的是波形流,是一种近似无损的格式。(4)MP3格式:其全称是MPEG-1AudioLayer3。MP3能够以高音质、低采样率对数字音频文件进行压缩。342023/2/6(5)MP3Pro格式:MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。(6)WMA格式:WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA还可以通过DRM(DigitalRightsManagement)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。352023/2/6(7)MP4格式:MP4在文件中采用了保护版权的编码技术,只有特定的用户才可以播放,有效地保证了音乐版权的合法性。另外MP4的压缩比达到了1:15,体积较MP3更小,但音质却没有下降。不过因为只有特定的用户才能播放这种文件,因此其流传与MP3相比差距甚远。(8)SACD格式:SACD(SA=SuperAudio)是由Sony公司正式发布的。它的采样率为CD格式的64倍,即2.8224MHz。SACD重放频率带宽达100kHz,为CD格式的5倍,24位量化位数,远远超过CD,声音的细节表现更为丰富、清晰。362023/2/6(9)Quicktime格式:QuickTime是苹果公司于1991年推出的一种数字流媒体,它面向视频编辑、Web网站创建和媒体技术平台,QuickTime支持几乎所有主流的个人计算平台,可以通过互联网提供实时的数字化信息流、工作流与文件回放功能。(10)VQF格式:VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。但VQF未公开技术标准,至今未能流行开来。372023/2/6(11)DVDAudio格式:DVDAudio是新一代的数字音频格式,与DVDVideo尺寸以及容量相同,为音乐格式的DVD光碟,取样频率为“48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz”可选择,量化位数可以为16、20或24比特,它们之间可自由地进行组合(12)MD格式:Sony公司的MD(MiniDisc)大家都很熟悉了。MD之所以能在一张小小的盘中存储60~80分钟采用44.1khz采样的立体声音乐,就是因为使用了ATRAC算法(自适应声学转换编码)压缩音源。382023/2/6(13)RA格式:RealAudio是由RealNetworks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据。(14)LiquidAudio格式:LiquidAudio是一家提供付费音乐下载的网站。它通过在音乐中采用自己独有的音频编码格式来提供对音乐的版权保护。LiquidAudio的音频格式就是所谓的LQT。(15)Audible格式:Audible拥有四种不同的格式:Audible1、2、3、4。格式1、2和3采用不同级别的语音压缩,而格式4采用更低的采样率和MP3相同的解码方式,所得到语音更清楚,而且可以更有效地从网上进行下载。392023/2/6(16)VOC文件格式:在DOS程序和游戏中常会遇到这种文件,它是随声霸卡一起产生的数字声音文件,与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。(17)AU格式:AU文件是UNIX操作系统下的数字声音文件,由于早期Internet上的Web服务器主要是基于UNIX的,所以这种文件成为WWW上唯一使用的标准声音文件。(18)AIFF格式:AIFF(.AIF)是苹果公司开发的声音文件格式,被Macintosh平台和应用程序所支持。(19)Amiga格式:Amiga声音(.SVX):Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩。402023/2/6(20)MAC格式:Apple计算机公司所开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩。(21)S48格式:S48(stereo、48kHz)采用MPEG-1layer1、MPEG-1layer2声音压缩格式,由于其易于编辑、剪切,所以在广播电台应用较广。(22)AAC格式:AAC实际上是高级音频编码的缩写。AAC是MPEG-2规范的一部分。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。412023/2/61.4.2不同音频格式间的转换音频转换软件的主要功能是对音频进行编解码,即对数字音频进行解码,并根据数字音频编码规范保存为新音频格式。常见的转换模式包括:CD转MP3、CD转WAV、WAV转MP3、APE转WAV、MP3转AAC、OGG转MP3等。常用的转换软件有TotalVideoConverter、超级转换秀、格式工厂等。422023/2/61.4.3音频格式转换应用实例在此主要通过千千静听播放器为例,给大家介绍这类比较简单的音频格式转换的基本过程。步骤1、打开千千静听播放器,将要播放的曲子拖到播放器列表,在需要转换格式的曲目上,单击鼠标右键选择【转换格式】,弹出转换格式窗口。如图1-11所示。图1-11转换格式窗口在“输出格式”后面的下拉列表中选择要转换的格式。点击【配置】,根据需要配置好选项,点击确定返回。如果对音频编码格式不熟悉推荐使用默认配置。步骤2根据需要,选择“音效处理”下的选项,推荐全部取消(默认)。步骤3选择指定目标文件夹存储歌曲,点击立即转换,转换前可以根据需要选择“转换完成后添加到播放列表”和“自动为目标文件添加序号”。格式转换完毕后对话框会自动关闭。432023/2/61.5数字音频编辑软件数字音频编辑软件可分为两种:一种是音源软件(音序器软件),主要是针对数字音乐创作而言。它是一种可以用来产生和模拟各种乐器或发声物的应用软件。音源软件中最核心的是音序器,其主要作用是把音乐元素或事件进行系列或序列编程。这类软件一直与MIDI音乐创作联系在一起。另外一种软件是编辑软件,可以完成对声音的录音、剪辑、混音合成、特效处理。下面来介绍几款较为常用的数字音频编辑软件。442023/2/61.5.1音源软件首先来介绍两款音序器软件。(1)Cakewalk:Cakewalk是全世界使用率最高的专业作曲软件,其功能非常全面。使用Cakewalk,不但可以制作MIDI,还能录制音频;在歌曲伴奏制作完后,通过Cakewalk的音频功能,可以将作者制作的歌曲伴奏录制成音频(WAV)文件,也可以在Cakewalk的界面下直接录制人声,将MIDI和音频文件混合编辑。1.5数字音频编辑软件452023/2/6(2)FLStudio:FLStudio是一款音乐创作利器,能够让作者的计算机变成全功能的录音室。它首先提供了音符编辑器,可以根据音乐创作人的要求编辑出不同音律的节奏,例如鼓,镲,锣,钢琴,笛,大提琴,筝,扬琴等等。其次提供了音效编辑器,音效编辑器可以编辑出各类声音在不同音乐中所要求的音效,例如各类声音在特定音乐环境中所要展现出的高,低,长,短,延续,间断,颤动,爆发等特殊声效。另外它还提供了方便快捷的音源输入,对于在音乐创作中所涉及的特殊乐器声音,只要通过简单外部录音后便可在FLSTUDIO中方便调用,音源的方便采集和简单的调用造就了FLSTUDIO强悍的编辑功能。1.5数字音频编辑软件462023/2/61.5.2音频工作站软件音频编辑软件及功能包括:(1)Cubase:Cubase是德国著名的Steinberg公司出品的苹果、PC双平台软件。Cubase在许多方面技术都比Cakewalk要优秀,其录音、混音功能更加完善。但是Cubase的操作不太人性化,很不方便,需要花较多的时间去学习,而且要想发挥ASIO的优势,需要安装一块支持ASIO技术的专业声卡。音频方面,Cubase比Sonar较成熟;而软件合成器方面,Cubase占有绝对优势。Cubase从5.0版开始全面支持软件合成器技术。它是目前最成熟的MIDI/音频/合成器一体化音乐工作站。1.5数字音频编辑软件472023/2/6(2)Nuendo:Nuendo是Steinberg新推出的,它似乎是Cubase的变种版本。但它主要强调的是录音、混音和环绕声制作。著名的老牌摇滚乐队Queen刚刚推出的最新杜比环绕声DVD音乐大碟就是用Nuendo做的。Nuendo也能够进行视频配音配乐工作。Nuendo的MIDI较弱。它是一个非常优秀的多轨录音、混音软件。(3)LogicAudio:LogicAudio是一个功能太强大的“音乐工作站”。LogicAudio既有苹果版又有PC版,在美国用得很多,适合专业人士使用。它是MIDI/音频/合成器一体化的音乐工作站。1.5数字音频编辑软件482023/2/61.5数字音频编辑软件(4)Samplitude:Samplitude并不是一个全能的音乐工作站软件,因为它的MIDI功能非常弱,而且不支持软件合成器插件。但它的混音能力效果好,比较适合在独立的电脑里工作。它是一款非常优秀的多轨录音、混音、音频编辑软件。(5)VegasAudio/Video:VegasAudio是一款多轨音频软件,VegasVideo则是多轨视频软件,它们都是著名的SonicFoundry公司出品的。功能上很接近,所不同的是前者有一条视频轨,后者有无限条。它们都没有MIDI功能,只有音频和视频功能。492023/2/6VegasAudio的音频编辑能力非常强,具有无限轨道,26个Aux,而且操作非常方便。Vegas对各种格式的支持非常好,能够在同一轨道里混排不同格式的音频数据。VegasAudio是一款很好的多轨音频软件。VegasVideo既是一个强大的多轨音频工作站,又是一个专业的视频编辑软件。它的视频功能几乎等同于著名的Premiere:无限视频轨,强大灵活的剪辑操作,支持各种视频格式,全面支持DV,全面支持网络流媒体文件,支持DVD,各种特效、字幕工具,支持效果插件。它的运行速度和处理速度比Premiere快得多,对系统的消耗很少。除开视频,它在音频方面则更是遥遥领先于其他视频软件。1.5数字音频编辑软件502023/2/6(6)SoundForge:SoundForge是著名的SonicFoundr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 牲畜交易合同签订步骤
- 高校食堂招标文件模板
- 贷款融资居间服务合同
- 农村土地使用权赠与合同模板
- 农村污水处理设施施工招标
- 培训咨询技术支持合同
- 软件项目外包协议格式
- 蔬菜购销协议文本
- 借款合同终止协议书
- 公共保证样本
- 第5章 自动驾驶技术
- an-encounter-with-nature-与大自然的一次邂逅课件
- 相邻建筑物保护措施
- 学院校食堂餐饮企业承包经营退出管理制度
- 语文版五年级语文下册《珍珠鸟》课文
- usbcan ii v6 1用户手册3 2 CAN接线端
- 初中生物-济南出版社八年级上册 第六单元第二章第二节 食物链和食物网教学课件设计
- 焦点解决短期治疗
- 中华人民共和国药典(2023年版)
- 【2022年】陕西省宝鸡市警察招考公安专业科目预测试题(含答案)
- 《线性代数》课后习题答案
评论
0/150
提交评论