版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、LOGO数字音频基础知识数字音频基础知识 数字音频基础知识数字音频基础知识1声音基础知识声音基础知识 2认识数字音频认识数字音频3数字音频专业知识数字音频专业知识 声音基础知识声音基础知识声音基础知识声音基础知识1.1声音的产生声音的产生声音是由振动产生的。物体振动停止,发声也停止。当振动波传到人声音是由振动产生的。物体振动停止,发声也停止。当振动波传到人耳时,人便听到了声音。耳时,人便听到了声音。人能听到的声音,包括语音、音乐和其它声音(环境声、音效声、自人能听到的声音,包括语音、音乐和其它声音(环境声、音效声、自然声等),可以分为乐音和噪音。然声等),可以分为乐音和噪音。乐音乐音是由规则的
2、振动产生的,只包含有限的某些特定频率,具有确定是由规则的振动产生的,只包含有限的某些特定频率,具有确定的波形。的波形。噪音噪音是由不规则的振动产生的,它包含有一定范围内的各种音频的声是由不规则的振动产生的,它包含有一定范围内的各种音频的声振动,没有确定的波形。振动,没有确定的波形。声音基础知识声音基础知识1.2声音的传播声音的传播声音靠介质传播,真空不能传声。声音靠介质传播,真空不能传声。介质:能够传播声音的物质。介质:能够传播声音的物质。声音在所有介质中都以声波形式传播。声音在所有介质中都以声波形式传播。音速音速声音在每秒内传播的距离叫音速。声音在每秒内传播的距离叫音速。声音在固体、液体中比
3、在气体中传播得快。声音在固体、液体中比在气体中传播得快。15C时空气中的时空气中的声速为声速为340m/s。声音基础知识声音基础知识1.3声音的感知声音的感知外界传来的声音引起鼓膜振动经听小骨及其他组织传给听觉神经,外界传来的声音引起鼓膜振动经听小骨及其他组织传给听觉神经,听觉神经再把信号传给大脑,这样人就听到了声音。听觉神经再把信号传给大脑,这样人就听到了声音。双耳效应的应用:立体声双耳效应的应用:立体声人耳能感受到(听觉)的频率范围约为人耳能感受到(听觉)的频率范围约为20Hz20kHz,称此,称此频率范围内的声音为可听声频率范围内的声音为可听声(audiblesound)或音频或音频(a
4、udio),频率频率20kHz声音为超声。声音为超声。人的发音器官发出的声音(人声)的频率大约是人的发音器官发出的声音(人声)的频率大约是80Hz3400Hz。人说话的声音(话音。人说话的声音(话音voice/语音语音speech)的频率通)的频率通常为常为300Hz3000Hz(带宽约(带宽约3kHz)。)。传统乐器的发声范围为传统乐器的发声范围为16Hz(C2)7kHz(a5),如钢琴的,如钢琴的为为27.5Hz(A2)4186Hz(c5)。声音基础知识声音基础知识1.41.4 声音的三要素声音的三要素 v 音调音调v 响度(音量响度(音量/ /音强)音强)v 音色音色 人们就是根据声音的
5、三要素来区分声音。人们就是根据声音的三要素来区分声音。声音基础知识声音基础知识音调(音调(pitch)音调:声音的高低(高音、低音),音调:声音的高低(高音、低音),由由频率频率(frequency)决定,频率越高音调越高。决定,频率越高音调越高。声音的频率是指每秒中声音信号变化的次数,用声音的频率是指每秒中声音信号变化的次数,用Hz表示。例表示。例如,如,20Hz表示声音信号在表示声音信号在1秒钟内周期性地变化秒钟内周期性地变化20次。次。高音:音色强劲有力,富于英雄气概。擅于表现强烈的感情。高音:音色强劲有力,富于英雄气概。擅于表现强烈的感情。低音:音色深沉浑厚,擅于表现庄严雄伟和苍劲沉着
6、的感情。(鼓低音:音色深沉浑厚,擅于表现庄严雄伟和苍劲沉着的感情。(鼓声)声)声音基础知识声音基础知识响度(响度(loudness)响度:又称音量、音强,指人主观上感觉声音的响度:又称音量、音强,指人主观上感觉声音的大小,由大小,由振幅(振幅(amplitude)和人离声源的距离)和人离声源的距离决定,振幅越大响度越大,人和声源的距离越小,决定,振幅越大响度越大,人和声源的距离越小,响度越大。(单位:分贝响度越大。(单位:分贝dB)声音基础知识声音基础知识音色(音色(musicquality)音色:又称音品,由发声物体本身材料、结构决定。音色:又称音品,由发声物体本身材料、结构决定。每个人讲话
7、的声音以及钢琴、提琴、笛子等各种乐器每个人讲话的声音以及钢琴、提琴、笛子等各种乐器所发出的不同声音,都是由音色不同造成的。所发出的不同声音,都是由音色不同造成的。声音基础知识声音基础知识1.5声道声道声道(声道(soundchannel/track)是分开录音然后结合起来以便同)是分开录音然后结合起来以便同时听到的一段声音。时听到的一段声音。单声道单声道早期的声音重放(早期的声音重放(playback/reproduction)技术落后,只有单)技术落后,只有单一声道(一声道(mono/monophony),只能简单地发出声音(如留声机、),只能简单地发出声音(如留声机、调幅调幅AM广播);广
8、播);立体声(双声道)立体声(双声道)双声道的立体声(双声道的立体声(stereo)技术(如立体声唱机、调频)技术(如立体声唱机、调频FM立体声广播、立体声广播、立体声盒式录音带、激光唱盘立体声盒式录音带、激光唱盘CD-DA),利用人耳的双耳效应,感受到),利用人耳的双耳效应,感受到声音的纵深和宽度,具有立体感。声音的纵深和宽度,具有立体感。声音基础知识声音基础知识环绕声(多声道)环绕声(多声道)多声道的环绕声(多声道的环绕声(surroundsound)重放方式(如)重放方式(如4.1、5.1、6.1、7.1声道),将多只喇叭(扬声器声道),将多只喇叭(扬声器speaker)分布在听者的四周
9、,建立)分布在听者的四周,建立起环绕聆听者周围的声学空间,使听者感受到自己被声音包围起来,具起环绕聆听者周围的声学空间,使听者感受到自己被声音包围起来,具有强烈的现场感(如电影院、家庭影院、有强烈的现场感(如电影院、家庭影院、DVD-Audio、SACD、DTS-CD、HDTV)。)。认识数字音频2.1模拟信号模拟信号音频信号是典型的连续信号,不仅在时间上是连续的,而且在音频信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时间上幅度上也是连续的。在时间上连续,是指在任何一个指定的时连续,是指在任何一个指定的时间范围里声音信号都有无穷多个幅值;在幅度上间范围里声音信号都有无
10、穷多个幅值;在幅度上连续连续是指幅度是指幅度的数值为实数。的数值为实数。我们把在时间(或空间)和幅度上都是连续的我们把在时间(或空间)和幅度上都是连续的信号称为模拟信号信号称为模拟信号(analogsignal)。认识数字音频认识数字音频认识数字音频2.2数字信号数字信号在某些特定的时刻对这种模拟信号进行测量叫做采样在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),在,在有限个特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷有限个特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。把幅度取值的数目限定为有限多个实数值
11、中的一个,因此幅度还是连续的。把幅度取值的数目限定为有限个的信号就称为离散幅度信号。个的信号就称为离散幅度信号。我们把时间和幅度都用离散的数字表示的信号就称为数字信号我们把时间和幅度都用离散的数字表示的信号就称为数字信号(digitalsignal)。从模拟信号到数字信号的转换为模数转换,记为从模拟信号到数字信号的转换为模数转换,记为A/D(Analog-to-Digital);从数字信号到模拟信号的转换为数模转换,记为;从数字信号到模拟信号的转换为数模转换,记为D/A(Digital-to-Analog)。数字音频专业知识人们日常生活听到的各种声音信息是典型的连续信号,它人们日常生活听到的各
12、种声音信息是典型的连续信号,它不仅在时间上连续,而且在幅度上也连续,我们称之为模拟音不仅在时间上连续,而且在幅度上也连续,我们称之为模拟音频。在数字音频技术产生之前,我们只能用磁带或胶木唱片来频。在数字音频技术产生之前,我们只能用磁带或胶木唱片来存储模拟音频,随着技术的发展,声音信号逐渐过渡到了数字存储模拟音频,随着技术的发展,声音信号逐渐过渡到了数字化存储阶段,可以用计算机等设备将它们存储起来。化存储阶段,可以用计算机等设备将它们存储起来。数字音频专业知识数字音频专业知识数字音频专业知识3.1模拟音频的数字化模拟音频的数字化对于计算机来说,处理和存储的只可以是二进制数,所以对于计算机来说,处
13、理和存储的只可以是二进制数,所以在使用计算机处理和存储声音信号之前,我们必须使用模数转在使用计算机处理和存储声音信号之前,我们必须使用模数转换(换(A/D)技术将模拟音频转化为二进制数,这样模拟音频就)技术将模拟音频转化为二进制数,这样模拟音频就转化为数字音频了。所谓模数转换就是将模拟信号转化为数字转化为数字音频了。所谓模数转换就是将模拟信号转化为数字信号,模数转换的过程包括采样、量化和编码三个步骤。模拟信号,模数转换的过程包括采样、量化和编码三个步骤。模拟音频向数字音频的转换是在计算机的声卡中完成的。音频向数字音频的转换是在计算机的声卡中完成的。数字音频专业知识3.2采采样样采样是指将时间轴
14、上连续的信号每隔一定的时间间隔抽取出采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点表示一个信号的幅度样本,把连续的模拟量用一个个离散的点表示出来,使其成为时间上离散的脉冲序列。出来,使其成为时间上离散的脉冲序列。每秒钟采样的次数称为采样频率,用每秒钟采样的次数称为采样频率,用f表示;样本之间的时表示;样本之间的时间间隔称为取样周期,用间间隔称为取样周期,用T表示,表示,T=1/f。例如:。例如:CD的采样的采样频率为频率为44.1kHz,表示每秒钟采样,表示每秒钟采样44100次。次。常用的采样频率有常用的采样频率有8kHz、11.025
15、Hz、22.05kHz、15kHz、44.1kHz、48kHz等。等。数字音频专业知识在对模拟音频进行采样时,取样频率越高,音质越有保证;在对模拟音频进行采样时,取样频率越高,音质越有保证;若取样频率不够高,声音就会产生低频失真。那么怎样才能避若取样频率不够高,声音就会产生低频失真。那么怎样才能避免低频失真呢?免低频失真呢?著名的采样定理(著名的采样定理(Nyquist定理)中给出有明确的答案:定理)中给出有明确的答案:要想不产生低频失真,采样频率至少应为所要录制的音频的最要想不产生低频失真,采样频率至少应为所要录制的音频的最高频率的高频率的2倍。例如,电话话音的信号频率约为倍。例如,电话话音
16、的信号频率约为3.4kHz,采样频率就应该采样频率就应该6.8kHz,考虑到信号的衰减等因素,一般,考虑到信号的衰减等因素,一般取为取为8kHz。数字音频专业知识3.3量量化化量化是将采样后离散信号的幅度用二进制数表示出来的过量化是将采样后离散信号的幅度用二进制数表示出来的过程。程。每个采样点所能表示的二进制位数称为量化精度,或量化每个采样点所能表示的二进制位数称为量化精度,或量化位数。位数。量化精度反映了度量声音波形幅度的精度。例如,每个声量化精度反映了度量声音波形幅度的精度。例如,每个声音样本用音样本用16位位(2字节字节)表示,测得的声音样本值是在表示,测得的声音样本值是在065536的
17、范围里,它的精度就是输入信号的的范围里,它的精度就是输入信号的1/65536。常用的采样精度为常用的采样精度为8bit/s、12bit/s、16bit/s、20bit/s、24bit/s等。等。数字音频专业知识3.4编编码码采样和量化后的信号还不是数字信号,需要把它转换成数字编采样和量化后的信号还不是数字信号,需要把它转换成数字编码脉冲,这一过程称为编码。最简单的编码方式是二进制编码,码脉冲,这一过程称为编码。最简单的编码方式是二进制编码,即将已经量化的信号幅值用二进制数表示,计算机内采用的就是即将已经量化的信号幅值用二进制数表示,计算机内采用的就是这种编码方式。这种编码方式。模拟音频经过采样
18、、量化和编码后所形成的二进制序列就是数模拟音频经过采样、量化和编码后所形成的二进制序列就是数字音频信号,我们可以将其以文件的形式保存在计算机的存储设字音频信号,我们可以将其以文件的形式保存在计算机的存储设备中,这样的文件通常称之为数字音频文件。备中,这样的文件通常称之为数字音频文件。PCM编码编码PCM(PulseCodeModulation),即脉冲编码调制,指即脉冲编码调制,指模拟音频信号只经过采样、模数转换直接形成的二进制序列,未模拟音频信号只经过采样、模数转换直接形成的二进制序列,未经过任何编码和压缩处理。经过任何编码和压缩处理。PCM编码的最大的优点就是音质好,编码的最大的优点就是音
19、质好,最大的缺点就是体积大。在计算机应用中,能够达到最高保真水最大的缺点就是体积大。在计算机应用中,能够达到最高保真水平的就是平的就是PCM编码,常见的编码,常见的WAV文件中就有应用。文件中就有应用。数字音频专业知识3.5音频压缩音频压缩音频压缩属于数据压缩的一种,是减小数字音频信号文件音频压缩属于数据压缩的一种,是减小数字音频信号文件大小(数据比率)的过程。大小(数据比率)的过程。一般数据的压缩方法对于音频数据一般数据的压缩方法对于音频数据不利,很少能将源文件压缩到不利,很少能将源文件压缩到87%以下。音频压缩算法:无以下。音频压缩算法:无损压缩算法和有损压缩算法损压缩算法和有损压缩算法无
20、损压缩是对未压缩音频进行没有任何信息无损压缩是对未压缩音频进行没有任何信息/质量损失的质量损失的压缩机制。压缩机制。有损压缩是尽可能多得从原文件删除没有多大影响的数据,有损压缩是尽可能多得从原文件删除没有多大影响的数据,有目的地制成比原文件小多的但音质却基本一样。有目的地制成比原文件小多的但音质却基本一样。一般来说,一般来说,无损压缩比率在源文件的无损压缩比率在源文件的5060%左右,而有损压缩可以达左右,而有损压缩可以达到原文件的到原文件的520%。数字音频专业知识3.6常见的数字音频文件格式常见的数字音频文件格式常见的数字音频文件格式有很多,每种格式都有自己的优常见的数字音频文件格式有很多
21、,每种格式都有自己的优点、缺点及适用范围。点、缺点及适用范围。CD格式格式天籁之音天籁之音CD音轨文件的后缀名为:音轨文件的后缀名为:cda标准标准CD格式是格式是44.1K的采样频率,速率的采样频率,速率88K/秒,秒,16位量位量化化位数,近似无损的。位数,近似无损的。CD光盘可以在光盘可以在CD唱机中播放,也能用电脑里的各种播放软唱机中播放,也能用电脑里的各种播放软件来重放。一个件来重放。一个CD音频文件是一个音频文件是一个.cda文件,这只是一个文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论索引信息,并不是真正的包含声音信息,所以不论CD音乐的音乐的长短,在电脑上看到的长
22、短,在电脑上看到的.cda文件都是文件都是44字节长。字节长。数字音频专业知识WAV格式格式无损的音乐无损的音乐WAV为微软公司开发的一种声音文件格式。为微软公司开发的一种声音文件格式。标准格式化的标准格式化的WAV文件和文件和CD格式一样,也是格式一样,也是44.1K的取的取样频率,样频率,16位量化位数,声音文件质量和位量化位数,声音文件质量和CD相差无几!相差无几!特点:音质非常好,被大量软件所支持。特点:音质非常好,被大量软件所支持。适用于:多媒体开发、保存音乐和原始音效素材。适用于:多媒体开发、保存音乐和原始音效素材。数字音频专业知识MP3格式格式流行的风尚流行的风尚MovingPi
23、ctureExpertsGroupAudioLayerIII),),是当今较流行的一种数字音频编码和有损压缩格式。是是当今较流行的一种数字音频编码和有损压缩格式。是ISO标标准准MPEG1和和MPEG2第三层第三层(Layer3),采样率,采样率16-48kHz,编码速率编码速率8K-1.5Mbps。特点:音质好,压缩比比较高,被大量软件和硬件支持,特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。应用广泛。适用于:适合用于一般的以及比较高要求的音乐欣赏。适用于:适合用于一般的以及比较高要求的音乐欣赏。数字音频专业知识MIDI作曲家的最爱作曲家的最爱MIDI(MusicalInstr
24、umentDigitalInterface)乐器数字接口乐器数字接口MIDI数据不是数字的音频波形,而是音乐代码数据不是数字的音频波形,而是音乐代码或称电子乐谱。或称电子乐谱。MIDI文件每存文件每存1分钟的音乐只用大约分钟的音乐只用大约510KB。MID文件主要用于原始乐器作品,流行歌曲的业余表演,文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。游戏音轨以及电子贺卡等。.mid文件重放的效果完全依赖声文件重放的效果完全依赖声卡的档次。卡的档次。数字音频专业知识WMA格式格式最具实力的敌人最具实力的敌人WMA(WindowsMediaAudio)由微软开发。音质由微软开发。音质要强于要强于MP3格式,更远胜于格式,更远胜于RA格式,它以减少数据流量但保格式,它以减少数据流量但保持音质的方法来达到比持音质的方法来达到比MP3压缩率更高的目的,压缩率更高的目的,WMA的压缩的压缩率一般都可以达到率一般都可以达到1:18左右。左右。内置了版权保护技术,可以限制播放时间和播放次数甚至内置了版权保护技术,可以限制播放时间和播放次数甚至于播放的机器等等于播放的机器等等。WMA格式在录制时可以对音质进行调
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考物理复习主题单元10第24课时电路识别、连接与设计课件
- 第三章第二节节分子和原子(教案)
- 洛阳市城乡居民基本医疗保险
- 电力行业运维队伍管理办法
- 环保企业法定代表人聘用协议
- 农村公路建设施工安全规范
- 生态环境治理招投标资料清单
- 家庭舞蹈室施工协议
- 企业内部口腔科护士招聘合同
- KTV服务员录用协议书
- aiissti变频器说明书
- 绿化养护报价表
- 《工业革命与工厂制度》
- 课程领导力-资料教学课件
- 老人租房免责协议书
- 特灵中央空调机组RTHD详细介绍
- 2023人民教育出版社在职人员招聘笔试模拟试题及答案解析
- 大学生心理健康教育论文范文3000字(8篇)
- 消费者心理学PPT完整全套教学课件
- 退行性腰椎间盘病诊疗和阶梯治疗
- fas设备应急预案
评论
0/150
提交评论