数字音频技术7章_第1页
数字音频技术7章_第2页
数字音频技术7章_第3页
数字音频技术7章_第4页
数字音频技术7章_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字音频技术第7章

数字音频文件格式与接口标准第7章数字音频文件格式与接口标准§7.1数字音频文件格式§7.2数字音频接口标准简介7.2.1AES/EBU(AES3—1992)接口标准7.2.2标准型民用接口(IEC958,类型2)7.2.3SPDIF-2接口7.2.4多通道音频数字接口(MADI)7.2.5其他标准接口§7.3小结§7.4习题§7.1数字音频文件格式是直接记录了原始真实声音信息的数据文件数字音频文件的格式波形音频文件MlDI文件压缩格式非压缩格式Wave文件(*.wav)、Voice文件(*.voc);MP3文件、RealAudio文件(*.ra/*.rm)、WMA文件是一种乐器演奏指令序列,相当于乐谱.因此又称之为非波形音频文件。

1.Wave文件——*.wavWave格式是Microsoft和IBM公司开发的一种波形(Wave)音频文件格式,符合RIFF(ResourceInterchangeFileFormat)文件规范,被Windows平台及其应用程序所广泛支持。Wave文件所存储的音频数据是对声音模拟波形进行采样所得的PCM样值数据,也称为波形文件。Wave文件的大小=采样频率(Hz)×量化比特数(bit)×(声道数/8)×录音时间(s)。例如,用44.1kHz的采样频率对声波进行采样,每个采样点的量化比特数选用16bit,则录制1s的立体声节目,其*wav文件的大小为44100×16×2/8B=176400B。可见,*wav文件所需的存储容量相当可观。Wave文件——*.wav如果对声音质量要求不高,则可通过降低采样频率,采用较少的量化比特数或利用单声道来录制*.wav文件。此时的*.wav文件大小可以成倍地减小。实践表明,用22.05kHz采样频率和8bit的量化精度,可取得较好的音质,其效果可以达到相当于调幅(AM)广播的音质。Wave文件格式支持CCITTA律和µ律、ADPCM等压缩算法,是PC机上最为流行的音频文件格式。Windows的convert工具也可以将PCM音频文件转换成*.wav/文件。微软SoundSystem软件SoundFinder可以将*.aif和*.voc文件转换成*.wav文件。2.Voice文件——*.vocVoice文件是CreativeLabs(创新公司)开发的一种波形音频文件格式。在DOS程序和游戏中常遇到这种文件,多用于保存CreativeSoundBlaster(创新声霸)系列声卡所采集的声音数据,被Windows平台和DOS平台所支持,支持CCITTA律和u律等压缩算法。3.音频交换文件——*.aif/*.aiffAiFF(AudioInterchangeFileFormat)是苹果计算机公司开发的一种音频交换文件格式,被Macintosh平台及其应用程序、NetscapeNavigator浏览器中的LiveAudio、SGI工作站以及其他专业音频软件包支持。4.Audio文件——*.auAudio文件是SUNMicrosvsterns公司和NeXTComputer公司推出的一种声音文件存储格式(8位u律编码或者16位线性PCM编码),是Internet中常用的多媒体声音文件格式,5.MPEG音频文件

——MP1/MP2/MP3/MP4/AACMPEG(MovingPictureExpertsGroup)音频文件格式指的是MPEG标准中的音频部分,即MPEG音频层(MPEGAudioLayer)。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分3层(MPEGAudioLayer1/2/3),分别对应MP1、MP2和MP3这3种声音文件。MPEG音频文件一MP1/MP2/MP3/MP4/AAC续MPEG音频编码具有很高的压缩率。MP1和MP2的压缩率分别为4:1和6:1~8:1MP3的压缩率则高达10:1~12:1,即1minCD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,其音质基本保持不失真,因此,目前使用最多的是MP3文件格式。MP4采用的是美国电报电话公司(AT&T)开发的以“感知编码”为关键技术的音乐玉缩技术,由美国网络技术公司(GMO)及RIAA联合公布的一种新的音乐格式。MP4在文件中采用保护版权的编码技术,只有特定用户才可以播放,有效地保证了音乐版权的合法性。另外MP4的压缩比达到了15:1,体积比MP3更小,但音质并没有下降。AAC是由FraunhoferⅡS-A、Dolby(杜比)和AT&T共同开发的音频格式。是MPEG-2规范的一部分。它同时支持多达48千音轨、15个低频音轨、更多种采样频率和数码率、多种语言的兼容能力、更高的解码效率。6.RealAudio文件——*.ra/*.rmRealAudio文件是RealNetworks公司开发的一种流式音频(StreamingAudio)文件格式,最大的特点就是可以实时传输音频信息,尤其是在网络速度较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。现在的RealAudio文件的主要格式有RA(RealAudio)、RM(RealMedia)等,这些文件的共向性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽的听众获得较好的音质。对于14.4kbit/s的网络连接,可获得调幅(AM)广播的音质;对于28.8kbit/s的连接,可以达到广播级的声音质量;如果拥有ISDN或更快的线路连接,则可获得CD音质的声音。7.WMA文件——*.wmaWMA(WindowsMediaAudio)格式是Microsoft公司针对RealNetworks公司开发的新一代网上流式音频文件格式。其特点是同时兼顾了保真度和网络传输需求,所以具有一定的先进性。优点:1)采用WMA格式压缩的音频文件比MP3文件要小得多,并且音质要强于MF3格式,更远胜于RA格式;2)压缩比一般可以达到18:1左右。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。WMA文件——*.wma续3)WMA的另一个优点是内容提供商可以通过数字版权管理(DigitalRightsManagement)方案如WindowsMediaRightsManager7加入防复制保护,这种内置了版权保护技术可以限制播放时间、播放次数甚至播放的机器等等,可有力地防止盗版。4)在操作系统WindowsXP中,WMA是默认的音频编码格式。可以使用WindowsMediaPlayer或WinAMP进行播放。WindowsMediaPlayer7.0更是增加了直接把CD光盘转换为WMA声音格式的功能,WMA这种格式在录制时可以对音质进行调节。8.MIDI文件——*.midMIDI是乐器数字接口,是数字音乐/电子合成器的统一国际标准,它定义了计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方式,还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可用于不同乐器创建的数字声音,可模拟大提琴、小提琴、钢琴等常见乐器.MIDI文件存储MIDI消息的标准文件格式,文件中包含多达16个通道的乐器定义以及每个通道的演奏音符信息:键、通道号、音长、音量和力度(击键时,键达到最低位置的速度)。所以,MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。计算机将这些指令发送给声卡,声卡按照指令将声音合成出来,MIDI声音在重放时可以有不同的效果,这取决于音乐合成器的质量。由于MIDI文件记录的是一系列指令而不是数字化后的波形数据,因此它占用存储空间比Wave文件要小很多。§7.2数字音频接口标准简介模拟音频设备在进行连接时要注意设备之间的电平匹配、阻抗匹配以及连接方式的一致性(指平衡与不平衡的一致性),即使产生一些偏差也不会造成信号很大的失真,因此在模拟设备中不特意提及设备之间的接口.但在数字音频设备的互连系统中,接口模式至关重要。其原因在于数字化设备在进行A/D、D/A变换以及数字信号处理时所使用的采样频率及量化比特数彼此存在差异,因此要求互连设备的采样频率及量化比特数应保持一致,否则对传输的信号将产生损伤乃至不能工作。为了实现不同格式的数字音频设备之间的相互连接,故而制定出大家共同遵守的、统一的数字信号输入/输出格式对接,即数字音频接口标准。目前在数字音频应用领域中,数字音频接口标准有很多,下面对一些主要的接口标准进行简单的介绍。7.2.1AES/EBU(AES3-1992)接口标准AES/EBU接口标准是由AudioEngineeringSociety/EuropeanBroadcastUnion(美国音频工程协会/欧洲广播联盟)制定的一种专业的数字音频接口标准,现广泛应用于大量的民用产品和专业的数字音频设备,如CD机、DAT、MD机、顶级采样器、大型数字调音台、专业数字音频工作站等。AES/EBU接口标准与AES3-1992、国际电工委员会(InternationalElectrotechnical图7-1平衡式接口Commission)的IEC958(类型1)、CCIRRec.647和EBUTech3250E基本一致,它可以通过一个平衡式接口来串行传送被复用的双通道数字音频信号,采用的平衡驱动器和接收器与用于RS422数字传输的标准类似,其输出电平为2~7V,如图7-1所示。AES/EBU(AES3-1992)接口标准-1AES/EBU接口采用的传输介质是同轴电缆或双绞线。专业的接口允许电缆的长度为100~300m。在不加均衡的情况下,这种接口允许的传输距离可以达到100m;如果加均衡,则可以传输得更远。图7-1平衡式接口AES/EBU(AES3-1992)接口标准-通道编码AES/EBU接口的通道编码采用双相标志码,其波形如图7-2所示。它是一种二进制频率调制通道码。无论码元为“1”或“0”,在每个数据比特周期的开始都有一个电平跳变。而且每个码元“1”的中间有一个跳变,为归零码;对于码元“0”,在整个比特周期之内保持电平不变。双相标志码编码的数据流中不会出现连续的“1”或“0”。选种编码方式保证了数据能够自锁定,带宽有限、无直流成分和无极性相关性。图7-2双相标志码AES/EBU(AES3—1992)接口标准-帧格式音频帧格式如下图。在一个采样周期内传输一帧。每一帧由两个子帧构成,每一子帧包含一个通道的音频样值.一个音频样值是一个经采样、量化,并以2的补码方式表示的数字音频信号。对于立体声传输,子帧1包含的是左声道的音频样值,而子帧2则包含右声道的音频样值。192帧复用在一起形成一个音频块,构成AES数字音频流.图7-3AES/EBU的音频帧格式AES/EBU的模式与连接媒质AES/EBU提供“专业”和“消费”两种模式。它们两者最大的不同在于通道状态位格式的提供上。专业模式的状态位格式里包括数字通道的源和目的地址、日期时间码、采样点数、字节长度和其他信息。消费模式包括的内容较少,但包含了复制保护信息。AES/EBU的普通物理连接媒质有:1)平衡或差分连接,使用XLR(卡依)连接器的三芯话筒屏蔽电缆,阻抗为110Ω,电平范围为0.2V~5VP-P,抖动为±20ns。2)单端非平衡连接,使用RCA插头的音频同轴电缆。3)光学连接,使用光纤连接器。标准型民用接口(IEC958,类型2)实际上与S/PDIF(Sony/PhilipsDigitalInterfaceFormat)一样,与专业的AES/EBU接口非常相似,但是它采用特性阻抗为75Ω

的同轴电缆来进行不平衡的电气连接。该接口常用于准专业级或民用级数字音频设备的技术规格中,如CD播放机和DAT机。通常其端口采用的是RCA型唱机接口.尽管有些Hi-Fi设备也采用光缆来传送同样的信号,实用中通常使用格式转换器来将民用格式的信号转换为专业格式的信号,或反过来进行,并可在电气和光格式间进行转换。当IEC对双通道数字音频接口进行标准化时,存在两个要求:1)“为民用级产品使用”,2)用于“广播或类似目的”。单独的IEC标准(IEC958)在民用和专业应用之间只是做了微小的改变。偶然情况下,这将导致设备的互连发生问题.比如民用数据格式传送到了专业电气接口。IEC958目前正在修订中。7.2.2标准型民用接口(IEC958,类型2)民用接口的子帧数据格式与专业接口所用的完全一样,但是通道状态的实现却几乎完全不同。民用接口通道状态的第二个字节已经留给了“种类码”的指示,它们被设定成表示民用应用的种类。目前定义的种类码有:一般种类为(00000000),CD为(10000000),而DAT为(11000000)。一旦种类码确定下来,接收器便可以根据种类码的情况以不同方式对通道状态的某些比特进行译码处理。例如在使用CD时,来自CD的“Q”通道子码的4个控制比特被输入到通道状态块(比特1~4)的头4个控制比特中。在民用接口设备中,它按照串行复制管理系统(SerialCopyManagementSystem,SCMS)的规定也被用来进行复制保护。民用接口的用户比特常常被用来传送由记录的子码产生的信息,比如音轨号和提示点数据。在进行CD和DAT的复制时要用到它们,以便确保音轨起始ID的标志能够与音频数据一起被复制下来,而这样的数据信息通常AES/EBU接口是不传递的。标准型民用接口(IEC958,类型2)7.2.3SPDIF-2接口最常见的厂家指定专用接口是Sony和Philips的SPDIF-2,它被设计为用每根电缆来传送最高量化精度为20bit的一个通道的数字音频信息(尽管大多数的设备仅采用16bit)。在大多数双通道设备中,接口是不平衡式的,并采用75Ω同轴电缆和75Ω的BNC型接口端子,每个通道一个。电平为TTL兼容电平(0~5V)。与音频通道接口端子相匹配的还有单独一个用来传送字时钟信号的接口端子,字时钟是一种采样频率的方波信号,它用来同步接收器的采样时钟。也有符合RS422标准的多通道电气接口,这种接口采用D型多通路接口端子,像以前一样,仍要用单独一个BNC接口端子来传送字时钟。在每个音频采样周期内,由每个接口传送的数据相当于32bit,尽管只有字的最初29bit被认为是有效的,最后的3bit元周期被合成相当平时维持时间1.5倍的两个元,以便于它能够起到同步型的作用。SPDIF-2接口音频数据的传送顺序是先传最高有效位(MSB),接下去是9个控制或用户比特。当采样频率为48kHz时,数据率为1.53Mbit/s;当采样频率为44.1kHz时,数据率为1.2Mbit/s。SPDIF-2接口主要被应用于:1)由Sony专业数字音频设备向外传送音频数据上,尤其是在PCM-1610和1630CD母板PCM转换器上。2)有时在那些要与Sony设备进行连接的其他专业音频设备上。随着时间的推移,大量的其他厂家专用接口也随之出现,尤其是在那些低成本的数字音频设备上大多采用这些接口,这其中有YAMAHA和TASCAM。现在可以使用已经商业化的接口转换器将这种设备与使用标准接口的其他设备简单互连起来。7.2.4多通道音频数字接口(MADI)多通道音频数字接口(Multi-channelAudioDigitalInterface,MADI)是以双通道AES/EBU接口标准为基础的多通道数字音频设备间的互连标准。它可以通过一条75Ω的同轴电缆或光纤来串行传输56个通道的线性量化音频数据,以便每个通道的一个样值能够在一个音频采样周期内传送出去。指定采用75Ω视频同轴电缆和BNC接口连接件,发射机的输出电压峰-峰值应为0.3v~0.6V,最长的同轴电缆长度不超过50m。作为另外一种互连方法,可以用光缆,它可以传送更远的距离。例如,光纤分布式数据接口(FiberDistributedDataInterface,FDDI)可以用于长达2km的连接,也可以采用同步光纤网络(SynchronousOpticalNetwork,SONET)。多通道音频数字接口(MADI)音频采样的量化比特数可以为24比特。另外,AES/EBU接口标准中的音频样值有效位(V)、用户数据位(u)、通道状态位(C)和奇偶校验位(P)也全部传送。采用这种互连方法,可以对原始的音频信号只进行一次A/D变换,然后就可以在数字域内依次通过录音调音台,对多通道录音机和缩混录音机进行所有处理了.虽然利用AES3标准也可以在调音台和多通道录音机间进行互连,但每两个音频通道需要两根电缆(用于信号送出和返回),而用MADI进行互连只要求用两根音频电缆(再加一个主同步信号)就可以传送56个音频通道。MADI协议在文件AES10-1991和ANSIS4.43-1991标准中进行了说明。多通道音频数字接口(MADI)典型的MADI配置如图7-4所示。为了减小带宽,MADI的设计者并没有采用双相标志编码,而是采用了具有4/5编码格式的NRZI编码(这是基于FDDI协议)。在这种通道编码方式中,每32bit子帧被划分为4比特字,然后按照查对表来编码成5比特字,这样做的目的是维持码字中的低直流成分。图7-4MADI发送与接收框图多通道音频数字接口(MADI)在NRZI中,用高电平到低电平或低电平到高电平的瞬态变化来代表二进制的“1”,而无瞬态变化则代表“0”。音频数据采样频率的范围可为32~48kHz,并容许有±12%的偏差。不论采样频率和启动的通道数目如何,链路的传输率固定为125Mbit/s.由于编码方案的限制,所以实际的数据传输率为100Mbit/s。虽然AES3是带有自时钟的,但MADI却设计成异步工作方式。这样,MADI接收机必须从传输来的数据中提取出时基信息,以便接收机的时钟可以被同步。要想保证这一点,MADI协议规定每帧至少传送一次10比特的同步符号(1100010001)。进一步还要将专门的主同步信号(符合AES11定义)应用到所有互连的MADI发射机和接收机上.由于接口的异步性,所以要在连接的两端使用缓冲器,以便数据能够由时钟来重新调整,并以正确的数据率由缓冲器输出。图7-5MADI通道格式MADI通道格式是基于AES3的子帧格式,如上图。MADI通道格式只是头4个比特不同于AES3的子帧格式。每个通道由32个比特构成,其中包括4个模式识别比特,24个音频比特,以及V、U、C和P比特。模式识别比特提供了帧同步、通道启动/关闭状态标志、A/B子帧标志、通道块同步标志信息。56个MADI通道以串行方式传输,先是通道0,最后是通道55,所有的通道均在一个采样周期内传输完成,如图7-6所示。7.2.5其他标准接口1)ADAT(又称Alesis多通道光学数字接口)是美国Alesis公司开发的一种数字音频信号格式,因为最早用于该公司的ADAT八轨机,所以就称为ADAT格式.该格式使用一条光缆传送8个通道的数字音频信号,由于连接方便、稳定可靠,现在已经成为了一种事实上的多通道数字音频信号格式,越来越广泛地使用在各种数字音频设备上,目前许多公司的多通道数字音频接口,像Frontier公司的系列产品,使用的都是ADAT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论