多媒体应用技术3-音频知识_第1页
多媒体应用技术3-音频知识_第2页
多媒体应用技术3-音频知识_第3页
多媒体应用技术3-音频知识_第4页
多媒体应用技术3-音频知识_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本节内容本节内容 数字音频基础知识数字音频基础知识v声音概念声音概念v声音分类和要素声音分类和要素v声音信号数字化过程声音信号数字化过程v数字化声音的技术指标数字化声音的技术指标v声音质量的度量声音质量的度量v数字音频的文件格式数字音频的文件格式v音频信号处理的特点音频信号处理的特点v音频卡工作原理音频卡工作原理 v声音(声音(Sound)是通过一定介质(如空气、水)是通过一定介质(如空气、水)等传播的等传播的连续波连续波,在物理学中称为声波。声音属,在物理学中称为声波。声音属于听觉媒体,其频率范围大约在于听觉媒体,其频率范围大约在20Hz20KHz。 声波特征:声波特征:v1. 周期周期:声

2、波每完成一次振动需要的时间称为周:声波每完成一次振动需要的时间称为周期,通常用期,通常用T表示,单位是秒。表示,单位是秒。v2. 频率频率:声波每秒所完成的振动次数称为频率,:声波每秒所完成的振动次数称为频率,用来体现音调的高低,单位是赫兹用来体现音调的高低,单位是赫兹(Hz)。v3. 振幅振幅:振幅是指声波的高低幅度,表示声音的:振幅是指声波的高低幅度,表示声音的强弱。振幅用来定量研究空气受到压力的大小。强弱。振幅用来定量研究空气受到压力的大小。v4. 带宽带宽:带宽指频率覆盖的范围。:带宽指频率覆盖的范围。3.1.2 声音的分类声音的分类在多媒体技术中,将声音媒体分为语音、音乐和音在多媒体

3、技术中,将声音媒体分为语音、音乐和音响三类:响三类:v1. 语音:是指具有人类语言内涵的声音。语音:是指具有人类语言内涵的声音。v2. 音乐:是指规范的符号化了的声音。音乐:是指规范的符号化了的声音。v3. 音响:是指人们熟悉的其他声音,包括自然界音响:是指人们熟悉的其他声音,包括自然界的风声、雨声以及机器发出的声音等。的风声、雨声以及机器发出的声音等。按频率划分声音按频率划分声音v次声:次声: 低于低于20hz20hzv可听声:超低音可听声:超低音20-4020-40 低音低音50-10050-100 中低音中低音200-500200-500 中高音中高音1k-5k1k-5k 高音高音10k

4、-20k10k-20kv超声:超声: 高于高于20khz20khz根据振幅对声音的分类根据振幅对声音的分类v纯音:只含有一种频率的声音纯音:只含有一种频率的声音v复音:由多种纯音组成的声音复音:由多种纯音组成的声音v基音:复音中具有最低频率的声音基音:复音中具有最低频率的声音v泛音:基音以外的纯音泛音:基音以外的纯音3.1.3 声音的要素声音的要素v1. 音调:人耳对声音频率高低的感觉称为音调。音调:人耳对声音频率高低的感觉称为音调。音调由声源振动频率所决定。音调由声源振动频率所决定。v2. 音色:音色是用来描述声音品质的,主要决定音色:音色是用来描述声音品质的,主要决定于声音频谱结构中的泛音

5、多少。于声音频谱结构中的泛音多少。v3. 音强:音强是衡量声波在传播过程中声音强弱音强:音强是衡量声波在传播过程中声音强弱的物理量,即与声音信号的幅度成正比。的物理量,即与声音信号的幅度成正比。3.2 数字音频基础知识数字音频基础知识3.2.1 声音信号数字化过程声音信号数字化过程v将声音的模拟信号变为数字信号的过程,通过对将声音的模拟信号变为数字信号的过程,通过对声音文件进行声音文件进行采样采样、量化量化、编码编码来实现。来实现。v1采样(采样(sampling)v采样是将声音信号在时间上离散化,即每隔一定采样是将声音信号在时间上离散化,即每隔一定的时间间隔对模拟信号进行取样。的时间间隔对模

6、拟信号进行取样。v2量化量化(quantization)v是对采样后的声音样本在是对采样后的声音样本在幅值上离散化,即把信号幅值上离散化,即把信号强度划分为不同的等级,强度划分为不同的等级,然后将每一个样本归入预然后将每一个样本归入预先编排的量化等级上。先编排的量化等级上。 v3编码编码v是将量化后的离散值用二进制代码表示。是将量化后的离散值用二进制代码表示。3.2.2数字化声音的技术指标数字化声音的技术指标v1. 采样频率:单位时间内采样的个数称为采样频采样频率:单位时间内采样的个数称为采样频率,用率,用fs表示。奈奎斯特定理,即表示。奈奎斯特定理,即fs2fmax。v常见的标准采样频率常见

7、的标准采样频率v 语音信号语音信号11.025khzv 要求较低的背景音乐要求较低的背景音乐22.05khzv 高保真音乐高保真音乐44.1khz3.2.2数字化声音的技术指标数字化声音的技术指标v2. 量化位数:每个取样点能够表示的数据范围。量化位数:每个取样点能够表示的数据范围。v常用的量化位数:常用的量化位数:8bie,16bit,24bitv3. 声道数:指一次同时产生的声波组数。声道数:指一次同时产生的声波组数。v单声道,双声道单声道,双声道3.2.2数字化声音的技术指标数字化声音的技术指标v环绕立体声环绕立体声:与一般的立体声不同,环绕立体声:与一般的立体声不同,环绕立体声音所产生

8、的声场,不仅让人感受到音源的方向感音所产生的声场,不仅让人感受到音源的方向感,且伴有一种被声音所围绕所包围以及声源向四周且伴有一种被声音所围绕所包围以及声源向四周远离扩散的感觉。环绕立体声的功能,增强了声远离扩散的感觉。环绕立体声的功能,增强了声音的纵深感、临场感和空间感,使视听者不仅能音的纵深感、临场感和空间感,使视听者不仅能够感受来自前、后、左、右的声源发出的声音,够感受来自前、后、左、右的声源发出的声音,而且感受到自己周围的整个空间,都被这些声源而且感受到自己周围的整个空间,都被这些声源所产生的空间声场所包围,从而营造出一种置身所产生的空间声场所包围,从而营造出一种置身于歌厅、影剧院的音

9、响效果。于歌厅、影剧院的音响效果。v5.1声道v5.1声道是指中央声道,前置左、右声道、后置左声道是指中央声道,前置左、右声道、后置左、右环绕声道,及所谓的、右环绕声道,及所谓的0.1声道重低音声道。一声道重低音声道。一套系统总共可连接套系统总共可连接6个喇叭。个喇叭。5.1声道已广泛运用声道已广泛运用于各类传统影院和家庭影院中,一些比较知名的于各类传统影院和家庭影院中,一些比较知名的声音录制压缩格式,譬如杜比声音录制压缩格式,譬如杜比AC-3(Dolby Digital)、)、DTS等都是以等都是以5.1声音系统为技术蓝本声音系统为技术蓝本的,其中的,其中“0.1”声道,则是一个专门设计的超

10、低声道,则是一个专门设计的超低音声道,这一声道可以产生频响范围音声道,这一声道可以产生频响范围20120Hz的超低音。的超低音。v7.1声道:v7.1声道系统的作用简单来说就是在观看者的周围声道系统的作用简单来说就是在观看者的周围建立起一套前后声场相对平衡的声场建立起一套前后声场相对平衡的声场,不同于不同于5.1声声道声场的是道声场的是,它在原有的基础上增加了后环绕声道它在原有的基础上增加了后环绕声道, 声场的密度增大了,声道之间衔接得更顺畅了,声场的密度增大了,声道之间衔接得更顺畅了,更加增强了震撼的环绕音体验效果,会感觉更舒更加增强了震撼的环绕音体验效果,会感觉更舒服一些,也是为了不让观看

11、者在听觉上产生声场服一些,也是为了不让观看者在听觉上产生声场的偏差,从而提高观看电影的真实感,是今后影的偏差,从而提高观看电影的真实感,是今后影院系统的必然的趋势,今后的蓝光院系统的必然的趋势,今后的蓝光DVD在前期制在前期制作的过程中就是采用的作的过程中就是采用的7.1音轨进行录制的,用音轨进行录制的,用7.1声道系统播放时能够更好的重放还原制作现场的声道系统播放时能够更好的重放还原制作现场的效果效果3.2.2数字化声音的技术指标数字化声音的技术指标v4. 数据文件格式:数据文件格式:v数据量(数据量(Byte)=(采样频率采样频率量化位数量化位数声道数声道数声音持续时间声音持续时间)/8

12、v 采样频率、量化位数、声道数及存储容量采样频率、量化位数、声道数及存储容量 采样频率采样频率(KHz)量化位数量化位数(bit)单声道单声道(MB/min)双声道双声道(MB/min)11.02580.631.2622.0581.262.5222.05162.525.0444.1165.0410.08v 数字音频等级数字音频等级声音类型声音类型频率范围(频率范围(Hz)采样率(采样率(kHz)量化位数(量化位数(bit)电话话音电话话音200340088调幅广播调幅广播5070001616调频广播调频广播2015k22.0516高质量音频高质量音频2020k44.1163.2.3 声音质量的

13、度量声音质量的度量声音质量的两种方法:声音质量的两种方法:v一种是一种是客观评价客观评价,即音频信号的技术指标,即音频信号的技术指标,如:频带宽度、动态范围和信噪比;如:频带宽度、动态范围和信噪比;v另一种另一种主观评价主观评价。 v1. 音频信号的技术指标:(音频信号的技术指标:(客观评价指标客观评价指标) 频带宽度:音频信号的频率范围,是衡量音质的频带宽度:音频信号的频率范围,是衡量音质的标准。标准。 动态范围动态范围: 音频信号最大强度与最小强度之比。音频信号最大强度与最小强度之比。 信噪比:有用信号的平均功率与噪音的平均功率信噪比:有用信号的平均功率与噪音的平均功率之比。之比。v2.

14、主观评价法:主观评价法:声音质量主观评价评分标准声音质量主观评价评分标准 分数分数质量级别质量级别失真级别失真级别5优优(Excellent)无察觉无察觉4良良(Good)(刚刚)察觉但不讨厌察觉但不讨厌3中中(Fair)(察觉察觉)有点讨厌有点讨厌2差差(Poor)讨厌但不反感讨厌但不反感1劣劣(Bad)极讨厌极讨厌(令人反感令人反感)3.2.4 数字音频的文件格式数字音频的文件格式v1. 波形文件波形文件v扩展名为扩展名为*.wav,是通过对模拟音频以不同的采样频,是通过对模拟音频以不同的采样频率、不同的量化位数进行数字化而得到的数字信号存率、不同的量化位数进行数字化而得到的数字信号存入磁

15、盘而形成的波形文件。入磁盘而形成的波形文件。v适用于:记录讲话语音、适用于:记录讲话语音、CD音质的音乐、单声道或音质的音乐、单声道或立体声的声音信息,并能保证声音不失真。立体声的声音信息,并能保证声音不失真。v缺点是未经压缩的声音文件占用存储盘空间太大。缺点是未经压缩的声音文件占用存储盘空间太大。 v2. PCM:v由模拟音频信号直接通过由模拟音频信号直接通过A/D转换而形成的二进转换而形成的二进制序列文件,特点是保真度高,解码速度快,但制序列文件,特点是保真度高,解码速度快,但编码后数据量大。编码后数据量大。v3. AIFF文件:文件:.AIF/.AIFFv苹果公司开发的一种声音文件格式,

16、被苹果公司开发的一种声音文件格式,被Mac平台平台及其应用程序所支持,及其应用程序所支持,Netscape Navigator浏览器浏览器中的中的LiveAudio也支持也支持AIFF格式,格式,SGI及其他专业及其他专业音频软件包也同样支持这种格式。音频软件包也同样支持这种格式。 v4. VOC:v多用于保存多用于保存Creative Sound Blaster系列声卡所采集系列声卡所采集的声音数据,被的声音数据,被Windows平台和平台和DOS平台所支持。平台所支持。v5. AU:vSun Microsystems公司推出的一种经过压缩的数字公司推出的一种经过压缩的数字声音格式,在声音格

17、式,在Internet中经常使用。中经常使用。v6. RM:vReal Networks公司开发的一种适合于网络实时流公司开发的一种适合于网络实时流技术的音频文件格式,主要用于在低速率的广域网技术的音频文件格式,主要用于在低速率的广域网上实时传输音频信息。上实时传输音频信息。 v7. MP3:vMPEG Audio Layer 3的简写,压缩率高达的简写,压缩率高达10 112 1,音质基本保持不失真。,音质基本保持不失真。v8. CD:v一种数字化的声音,其采样频率为一种数字化的声音,其采样频率为44.1KHz,量化,量化位数为位数为16bit,可以高质量地重现原始声音。,可以高质量地重现原

18、始声音。v9. MIDI:v文件本身不包含任何的音频信息,主要记录指令和文件本身不包含任何的音频信息,主要记录指令和数据,文件所占用的空间非常小。数据,文件所占用的空间非常小。 MIDI文件与文件与Wave文件的区别:文件的区别:v首先,首先,Wave文件是通过直接对模拟声波进行数字文件是通过直接对模拟声波进行数字化得到的音频信号数据。而化得到的音频信号数据。而MIDI文件只是记录了文件只是记录了一系列乐谱指令。一系列乐谱指令。v其次,其次,Wave文件是直接通过声卡输入端口获取的文件是直接通过声卡输入端口获取的音源,并可从输出端口直接播放。而音源,并可从输出端口直接播放。而MIDI 是通是通

19、过过MIDI接口由音序器记录电子乐谱的指令数据。接口由音序器记录电子乐谱的指令数据。v最后,采用最后,采用MIDI格式记录比采用格式记录比采用Wave格式记录格式记录的数据量小两个数量级以上。的数据量小两个数量级以上。 3.2.5 音频信号处理的特点音频信号处理的特点v 由于音频信息是在时间上连续的信号,因此在由于音频信息是在时间上连续的信号,因此在处理时对时序性的要求很高。处理时对时序性的要求很高。v 由于人有左耳和右耳,类似于两个通道,因此由于人有左耳和右耳,类似于两个通道,因此计算机输出的声音应该是立体声的。计算机输出的声音应该是立体声的。v 由于语音信号携带了情感意向,因此对语音信由于

20、语音信号携带了情感意向,因此对语音信号的处理还要抽取语意等其它信息。号的处理还要抽取语意等其它信息。 3.3 音频卡及其应用音频卡及其应用3.3.1 音频卡功能音频卡功能v声卡主要是用来对声卡主要是用来对不同来源的音频信号进不同来源的音频信号进行采集与回放行采集与回放,其功能就是使计算机能够,其功能就是使计算机能够处理音频信号。处理音频信号。声卡的功能主要有以下几点:声卡的功能主要有以下几点:v 录制、编辑与回放声音文件。录制、编辑与回放声音文件。v 在采集和回放过程中对文件进行压缩和解在采集和回放过程中对文件进行压缩和解压缩。压缩。v 编辑与合成音乐文件。编辑与合成音乐文件。v 文本转换和语

21、音识别。文本转换和语音识别。v MIDI音乐的合成。音乐的合成。3.3.2 音频卡工作原理音频卡工作原理v声卡的主要作用是实现对音频信息的采集与回放声卡的主要作用是实现对音频信息的采集与回放。音频信息有很多来源,如磁带录音机、。音频信息有很多来源,如磁带录音机、CD、录、录像机等等。像机等等。声卡的工作原理声卡的工作原理v1. 声卡处理需要的基本条件:声卡处理需要的基本条件:v 采样频率:采样频率:v一般的声卡均支持双声道立体声信号的采集。一般的声卡均支持双声道立体声信号的采集。v 量化位数:量化位数:v声卡中的量化位数一般为声卡中的量化位数一般为8位、位、16位、位、32位以及位以及64位,

22、量化位数越高,声音质量越好。位,量化位数越高,声音质量越好。v 声道数:单声道或立体声。声道数:单声道或立体声。v 实时硬件压缩实时硬件压缩/软件压缩:软件压缩: v2. 混音器混音器v音频卡上的混音器音频卡上的混音器Mixer主要目的是将不同主要目的是将不同输入音源的信号进行混音,并且提供音量输入音源的信号进行混音,并且提供音量的软件控制功能。通过的软件控制功能。通过I/O端口(地址和数端口(地址和数据端口)可对混音器的各种功能进行可编据端口)可对混音器的各种功能进行可编程设置。程设置。v3. MIDI合成器与接口合成器与接口vMIDI是一种用于在不同制造商的电子乐器是一种用于在不同制造商的电子乐器设备和计算机之间进行数据交换的国际标准设备和计算机之间进行数据交换的国际标准。它指定硬件接口,同时指定通信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论