多媒体技术第二章 数字声音_第1页
多媒体技术第二章 数字声音_第2页
多媒体技术第二章 数字声音_第3页
多媒体技术第二章 数字声音_第4页
多媒体技术第二章 数字声音_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章数字声音2.1数字声音基础2.1.1音频信号的特征声音信号由不同的振幅与频率合成而成,称为复音。复音包括基频和谐音,两者决定声音的音质和音色。规则音频分为语音、音乐和音效。声音三要素:音调、音强和音色。基频与音调谐波与音色幅度与音强频带与音宽2.1.2声音信号数字化模拟信号模拟信号是指幅度随时间连续变化的信号。

数字信号数子信号是指时间和幅度都是离散的信号,即离散信号,通常是仅含高低电平的“方波”信号。模拟信号的数字化PCM(pulsecodemodulation脉冲编码调制)采样:将时间连续信号变为时间不连续信号。量化:将幅度变为某一最小量的整数倍,即将幅值离散化,量化过程必定产生量化误差。编码:按一定规律产生二进制位流输出信号。数字化过程两个主要参数:采样频率:采样频率遵从采样定理

fs

>=2f

或者Ts=<T/2量化精度:取决于表示一个采样样本值的二进制位数,位数越多,精度越高。2.1.2声音信号数字化声音20-20kHz话音300-3000Hz

采样频率越高,量化精度越高,声道越多,则声音质量越好,而数字化后的数据量也越大。每秒声音所占数据量为采样频率*量化位数*声道数2.1.3音频的主要技术参数

声音质量与数据率质量采样频率(kHz)量化精度(bit)单声道/立体声数据率(kB/s)频率范围(Hz)电话88单声道8200~3400AM11.0258单声道11.050~7000FM22.0516立体声88.220~15000CD44.1016立体声176.410~20000DAT4816立体声192.010~200002.1.3音频的主要技术参数44.100次/秒的采样频率值根据以下的原则确定:

人耳能够听见的最高声音频率为20kHz,为了避免高于20kHz的高频信号干扰采样,在进行采样之前,需要对输入的声音信号进行滤波。考虑到滤波器在20kHz处大约有10%的衰减,因此再将其提高10%成为22kHz。这个值再乘以2就得到44kHz的采样频率。但是,为了能够与电视信号同步,PAL电视的场扫描为50Hz,NTSC电视的场扫描为60Hz,所以取50和60的整数倍,选用了44,100Hz(或44.1kHz)作为激光唱盘声音的采样标准。2.1.3音频的主要技术参数采样率为1,000Hz、量化等级为10的采样量化过程2.1.3音频的主要技术参数经过D/A转换器得到的信号波形有较大的失真2.1.3音频的主要技术参数采样率为2000Hz、量化等级为40的采样量化过程2.1.3音频的主要技术参数采样率为4000Hz、量化等级为40的采样量化过程2.1.3音频的主要技术参数采样频率、量化位数设置2.1.3音频的主要技术参数PCM编码PCM方法可以按量化方式的不同,分为均匀量化PCM、非均匀量化PCM和自适应量化PCM等几种。如果采用相等的量化间隔对采样得到的信号做量化,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化。2.1.4数字化声音的压缩均匀量化2.1.4数字化声音的压缩改进PCM编码技术的一个方法是采用非均匀量化,即让量化级高度随信号幅度而变化。信号幅度小,则缩小量化级高度,信号幅度大时,则增大量化级高度。这样就可以在满足精度要求的情况下用较少的位数实现编码。在声音数据还原时,采用相同的规则。在非均匀量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一种称为μ律(μ-Law)压(缩)扩(展)算法,另一种称为A律(A-Law)压(缩)扩(展)算法。这两种算法主要用于数字电话通信中。2.1.4数字化声音的压缩μ律的压缩特性2.1.4数字化声音的压缩音频压缩编码的标准国际电信联盟(ITU,原CCITT)先后提出了一系列有关语音压缩编码的建议。1972年制定了G.711,采用的是μ律或A律的PCM编码技术.数据速率为64kb/s。1984年.公布G.721标准.它来用的是ADPCM编码技术.数据速率为32kb/s。以上两个标准均适用于300Hz--3,400Hz窄带语音信号.也可用于公用电话网。针对宽带语音信号(50Hz--7kHz),ITU制定了G.722编码标准,它的数据速率为64kb/s,用此标准编码,可在ISDN(综合业务数据网)的B通道上传输音频数据。2.1.4数字化声音的压缩ISO(国际标准化组织)也制定了一系列的相应的标准其运动图像专业组(MPEG)在制定运动图像编码标准的同时,制定了高保真立体声音频压缩标准“MPEG音频”。虽然MPEG声音标准是MPEG标准的一部分,但它同时也完全可以独立应用。MPEG声音压缩算法是第一个高保真声音数据压缩的国际标准。MPEG音频根据不同的算法分为3个层次。层次1与层次2具有大致相同的算法。MPEG音频的层次3进一步引入了辅助子带、非均匀量化和熵编码等技术,可以进一步提高压缩率。立体声信号的编码也可以在MPEG音频中作为附加功能实现。MPEG音频压缩技术的传输速率为每声道32kb/s--448kb/s。2.1.4数字化声音的压缩2.1.5数字音频的文件格式文件的扩展名说明wav(Waveform)Windows采用的波形声音文件存储格式voc(CreativeVoice)声霸卡存储的声音文件存储格式mid(MIDI)Windows的MIDI文件存储格式mp2MPEGAudioLayer1,2mp3MPEGAudioLayer3ra(RealAudio)RealNetworks公司的流式声音文件格式wmaWindowsMediaAudioauSun和NeXT公司的声音文件存储格式aiffApple计算机上的声音文件存储格式sndSGI图形工作站上的声音存储文件seq,sngMIDI文件存储格式2.1.5数字音频的文件格式MP3是Internet上流行的音乐格式MP3

为MPEGAudioLayer3的缩写,是由ISO/MPEG语音编码标(AudioCodingStandard)所制定的一种声音压缩技术,压缩比是CD的1:10到1:12,采样率为44kHz、比特率为112kbit/s。MP3音乐是以数字方式储存的音乐,如果要播放,就必须有相应的数字解码播放系统,一般通过专门的软件进行MP3数字音乐的解码,再还原成波形声音信号播放输出,这种软件就称为MP3播放器,如Winamp等。

MP3格式文件在播放时需要专门的工具软件,Realplayer是一个集强大的功能和小巧玲现于一体的MP3播放器。它能够对MP3文件的播放做全面的控制,支持MMX(多媒体指令集)技术。它内置的图形化均衡器可以方便地调节音色,使之更符合个人喜好。此外,应用较为广泛的MP3播放软件还有Winplay3和MusicMatch等2.1.5数字音频的文件格式2.1.5数字音频的文件格式WAV(WaveAudioFileFormat)

是Windows用来储存数码声音的格式。它使用三个参数来表示声音:采样位数、采样频率和声道数。声道有单声道和立体声之分。MIDI

是MusicalInstrumentDataInterface的简称,即乐器数字化接口。它采用数字方式对乐器所奏出来的声音进行记录(每个音符记录为一个数字),然后,播放时再对这些记录通过FM或波表合成:FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出产生声音。RA、RAM和RM

都是Real公司成熟的网络音频格式,采用了“音频流”技术,所以非常适合网络广播。在制作时可以加入版权、演唱者、制作者、Mail和歌曲的Title等信息。RA可以称为互联网上多媒体传播的霸主,适合于网络上进行实时播放,是目前在线收听网络音乐最好的一种格式。WMA

是WindowsMediaAudio的缩写,相当于只包含音频的ASF文件。WMA文件在80kbps、44kHz的模式下压缩比可达1∶18,基本上和VQF(是一种比较先进的技术,通常认为96kbpsVQF与128kbpsMP3质量相同)相同。而且压缩速度比MP3提高一倍。Ogg

全称是OGGVobis是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OGGVobis有一个很出众的特点,就是支持多声道.

波形声音文件

波形声音文件,是一种为交换多媒体资源而开发的资源交换文件格式。它支持各种采样频率和量化精度的声音数据,并支持声音数据的压缩。2.1.5数字音频的文件格式电脑音乐的出现使人们的音乐思维方式产生了革命性的突破,为音乐的表现表达提供了全新的工具和工作方式。电子音乐与传统音乐的本质区别在于,它打破了千万年来传统音乐用“声乐语言”和“器乐语言”表达乐思的基本格局,可以创作出闻所未闻的声音,即所谓的“天籁之音”,并且这种扩展是无穷无尽的。在音乐创作领域,由于MIDI、电子乐器和多媒体计算机的结合,给人们提供了一种快捷、独特的制作方式,它更加强调音色的非常规化、电子化、空间感和对比等,并且逐渐形成一种崭新的音乐风格。2.2音乐合成和MIDI技术2.2.1什么是MIDIMIDI(MusicalInstrumentDigitalInterface电子乐器数字接口)是用于乐器合成器、乐器和计算机之间交换音乐信息的一种标准协议。MIDI是将电子乐器键盘的演奏信息(包括键名、力度、时间长短等)记录下来,这些信息成为MIDI消息。对应一段音乐的MIDI文件不记录任何声音信息,而只是包含一系列产生音乐的MIDI消息。播放时只需从中读出MIDI消息,通过音乐合成器芯片解释这些指令并产生音乐。MIDI是由软件部分和硬件部分组成的系统规范,这个规范定义了MIDI设备间数字传送时电缆硬件接口和协议。规范定制的目的是使各生产乐器厂家之间通过统一的MIDI交换信息及控制信号,从而完成音乐的合成。这样,任何电子乐器,只要有处理MIDI信息的处理器和适当的硬件接口都能变成MIDI装置。2.2.1什么是MIDI合成器是利用数字信号处理器DSP或其他芯片来产生音乐或声音的电子装置。利用合成器产生MIDI乐音的主要方法是FM合成法和波表合成法。2.2.2MIDI合成方式FM合成法FM合成法是20世纪80年代初由美国斯坦福大学的JohnChowning发明的,称为“数字式频率调制合成法”,简称FM合成法。FM合成法生成乐音的基本原理是,用数字信号来表示不同乐音的波形,然后把它们组合起来,再通过数模转换器(DAC)生成乐音播放。各种不同乐音的产生是通过组合各种波形参数、采用各种不同的算法实现的。FM合成器的算法包括确定用什么样的波形作为数字载波波形,用什么样的波形作为调制波形,用什么样的波形参数去组合来产生所希望的乐音。例如,改变数字载波频率;可以改变乐音的音调,改变它的幅度,可以改变它的音量。选择的算法不同,载波器和调制器的相互作用不同,生成的音色也不同。2.2.2MIDI合成方式波表合成法使用FM合成法来产生各种逼真的乐音是相当困难的,有些乐音几乎不能产生。为了能真实地再现乐音,目前的声卡一般采用乐音样本合成法,即波表合成法。这种方法就是把真实乐器发出的声音以数字的形式记录下来,播放时改变播放速度,从而改变音调周期,生成各种音节的音符。乐音样本的采集相对比较直观,音乐家在真实乐器上演奏不同的音符,选择44.1kHz的采样频率、16bit的量化位数,这相当于CD-DA的质量,把不同音符的真实声音记录下来,这就完成了乐音样本的采集。2.2.2MIDI合成方式软、硬波表合成硬波表的音色库是存放在声卡的ROM或RAM中软波表的音色库以文件的形式存放在硬盘里,需要是再通过CPU进行调用。“可下载样本”的合成技术(DLS)2.2.2MIDI合成方式2.2.3GM--标准MIDI乐器排序表以前各生产商在设计MIDI发声工具(如声卡、音源器、合成器等)时并没有一个统一的乐器排序标准,基于这种情况,各生产商终于达成了共识,共同编制了一份“标准MIDI乐器排序表”(GeneralMIDIInstrumentMap,GM)。GM共收录了十六类不同的乐器,每类各选八种音色,共有128种音色。在第十号MIDI通道(MIDIChannel10)收录了各种鼓和其他打击乐器。表中最后一类(第十六类)并非乐器声,而是一些声效(SoundEffect),如电话铃声、小鸟叫声、海浪声、直升机声、枪声等。现在大部分的MIDI发声工具均以这“标准MIDI乐器排序表”作为乐器排序的标准。2.2.4MIDI系统的组成MIDI系统实际就是一个作曲、配器、电子模拟的演奏系统。基于计算机的MIDI音乐系统有多种构筑方案,但基本上都由以下几部分组成:多媒体计算机、输入设备(MIDI键盘)、音序器、发生设备、合成器、声音处理设备和还声设备等。这些设备可以是独立的,也可以是集成的。如果在计算机上安装了MIDI软件,可将音乐的创作、乐谱的打印、节目编排、音乐的调整、音响的幅度、节奏的速度、各声部之间的协调、混响都可由MIDI软件控制完成。基于计算机的MIDI音乐制作系统2.2.4MIDI系统的组成输入设备具有USB接口MIDI键盘2.2.4MIDI系统的组成音序器是用来记录、编辑和播放MIDI文件的设备。音序器分硬件和软件两种。最早的是硬件音序器,也称为编曲机。它可以是一个独立的设备,也可以内置于合成器中。这类音序器的编辑和修改必须在它的面板上进行,使用是很不方便的。常见的型号有YamahaQY700等。2.2.4MIDI系统的组成YamahaQY700音序器2.2.4MIDI系统的组成发声设备音源只是一个资源库音源分硬件和软件两种。硬件音源是现在专业MIDI制作不可缺少的设备,因为它们可以提供比任何一块声卡上的波表都要好很多的音色,这些独立音源基本上是专业人士使用的,常见的型号有RolandJV1080和YamahaMU100R等。多媒体声卡上都有一个128种音色的GM音色库。2.2.4MIDI系统的组成声音处理设备通过调音台、效果器、均衡器等声音处理设备对音频信号进行均衡、限幅、压缩、延时、混响等特技处理,也可以用软件进行处理。2.2.4MIDI系统的组成2.2.5MIDI的工作过程

MIDI电子乐器通过MIDI接口与计算机相连,MIDI靠这个接口传递消息(Message)来进行彼此通信。这样,计算机可通过音序器软件来采集MIDI电子乐器发出的一系列消息或指令。这一系列消息可记录到以(.MID)为扩展名的MIDI文件中。在计算机上音序器可对MIDI文件进行编辑和修改。最后,将MIDI文件送往音乐合成器,由合成器将MIDI文件进行解释并产生波形,然后通过声音发生器送往扬声器播放出来。2.2.5MIDI的工作过程2.2.6MIDI的特点及与WAV文件的比较MIDI的特点生成的文件比较小,因为MIDI文件存储的是命令,而不是声音波形;容易编辑,因为编辑命令比编辑声音波形容易的多;使用MIDI文件,其声卡上必需含有硬件音序器或配置有软件音序器;可以作背景音乐,因为MIDI音乐可以和其它的媒体,如数字电视、图形、动画、语音等一起播放,这样可以加强演示效果。WAV与MIDI文件的比较MIDI消息实际上就是乐谱的数字表示,MIDI数据不是声音而是指令,因此它的数据量要比波形声音少得多;对MIDI的编辑灵活,可以自由地改变曲调、音色等属性,波形声音很难做到这点;波形声音与设备无关,MIDI数据与设备有关。2.2.6MIDI的特点及与WAV文件的比较MIDI数据一般用于下列情况由于无法获得足够的RAM存储器、硬盘存储空间、CPU处理能力或带宽而不能使用数字音频;拥有高质量的MIDI声源;您对将要发布的应用软件具有完全的控制能力,因此您的用户将会具有高性能的MIDI播放硬件;无需处理口语对话。2.2.6MIDI的特点及与WAV文件的比较数字音频一般用于下列情况您无法控制回放硬件;您拥有处理数字文件的计算机资源和带宽;您需要处理口语对话。2.2.6MIDI的特点及与WAV文件的比较2.3声卡2.3.1声卡介绍声卡的功能播放数字音乐录音实时的效果器音频解码音乐合成2.3.1声卡介绍声卡的分类按数据采样位数分类:8位、16位、24位按总线方式分类:ISA、PCI、USB按与计算机的连接方式分类:独立声卡、集成声卡按用途分类:普通声卡、专业声卡声卡的性能指标采样和量化能力芯片类型输出声道数合成技术兼容性2.3.1声卡介绍2.3.1声卡介绍2.3.2声卡的工作原理2.3.2声卡的工作原理主芯片主芯片承担着三维音效处理的运算和加速、MP3解码、MIDI的合成及硬件等级的声音处理。CODEC芯片I/O控制芯片负责和协调声卡输入/输出控制音乐合成器

MIDI合成器有两种:频率调制合成器、波形表合成器

I/O设备输出线路输入(LineIn):可与盒式录音机、唱机等相连进行录音。话筒输入(MicIn):可与话筒相连,进行语音录入。线路输出(LineOut):可跳过音频卡的内置放大器,而连接一个有源扬声器或外接放大器进行音频的输出。扬声器输出(Speakerout):从音频卡内置功率放大器连接扬声器进行输出,该插口的输出功率一般为2一4W。游戏棒/MIDI接口(Joystick/MIDI):可连接游戏捧或MIDI设备如MIDI键盘。2.3.2声卡的工作原理音频卡上的插口和接口2.3.2声卡的工作原理2.4音频处理软件音频编辑软件CoolEditPro(AdobeAudition)

CoolEditPro2.0是SyntrilliumSoftware公司出品的,由CoolEditPro1.2版本升级而来,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论