音频基础知识课件_第1页
音频基础知识课件_第2页
音频基础知识课件_第3页
音频基础知识课件_第4页
音频基础知识课件_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

30八月2023多媒体技术-音频基础1本章内容音频的声学基础声音的数字化声音的存储格式MIDI音乐语音信号、非语音信号03八月2023多媒体技术-音频基础1本章内容音频的声学130八月2023多媒体技术-音频基础2音频媒体音频(audio)或声音(sound)携带信息的极其重要的媒体多媒体技术研究中的一个重要内容与视觉媒体相比具有特殊性不同场合下的重要性不同Passiveviewing(e.g.film,video,etc.)Videoconferencing03八月2023多媒体技术-音频基础2音频媒体音频(au230八月2023多媒体技术-音频基础3声音的概念声音是一种机械振动状态的传播现象,它表现为一种机械被即声波。产生声波的条件有作机械振动的物体:声源有能传播机械振功的弹性介质声波在介质中传播有一定速度,称之为声波的传播速度(声速)03八月2023多媒体技术-音频基础3声音的概念声音是一330八月2023多媒体技术-音频基础4声波示意(L.A.Rowe)压缩稀薄时间幅度正弦波03八月2023多媒体技术-音频基础4声波示意(L.A430八月2023多媒体技术-音频基础5声波频率声压变化可以是周期性的和非周期性频率概念循环(cycle)-压缩/稀薄过程频率(frequency):每秒cycle数,单位hertz(Hz)周期

cycle的持续时间(1/frequency)声音信号一般由许多频率不同的信号组成,称为复合信号;而单一频率的信号称为分量信号03八月2023多媒体技术-音频基础5声波频率声压变化可530八月2023多媒体技术-音频基础6频率范围频率小于20Hz一般称为次声波(subsonic)人的听觉器官能感知的声音频率范围约为20Hz~20kHz的信号称为音频(Audio)信号人发音器官发声频率约是80~3400Hz,但人说话的信号频率约为300~3000Hz,即话音(speech)信号高于20kHz的信号称为超声波(ultrasonic)超声波及次声波一般不能引起人听觉器官的感觉,但可借助一些仪器设备进行观察和测量03八月2023多媒体技术-音频基础6频率范围频率小于2630八月2023多媒体技术-音频基础7乐音与噪音一般乐音指具有确定的基频以及与该基频有较小整数倍关系的各阶谐频(harmonictone)频率比基音高的所有分音统称泛音(overtone),泛音的频率不必与基音成整数倍关系在主观上把令人不愉快或不需要的声音定义为噪音噪音的频谱较为复杂,具有无规则的振幅和波形的连续频谱03八月2023多媒体技术-音频基础7乐音与噪音一般乐音730八月2023多媒体技术-音频基础8声音要素(一)响度(音响)loudness到达人耳的声扰动振幅所产生的听觉的大小声振动能量是物理特性,可用声强(soundpressure)定义,单位:帕斯卡(Pa)实用上通常都以对数方式的声压级(soundpressurelevel)表示,单位:分贝(db)响度是主观量,不能用任何仪器正确地测量声音响度使用了以两个声强之比的对数为基础的相对标度,单位:宋(sone)03八月2023多媒体技术-音频基础8声音要素(一)响度830八月2023多媒体技术-音频基础9声音要素(二)音调(音高)pitch或tone人对声音刺激频率的主观判断与估量,称之为音调(Pitch),单位:美(Mel)Frequency是物理量,而音调是人的感觉听觉经验一般女生的声音比男生高较大物体振动的音调较低03八月2023多媒体技术-音频基础9声音要素(二)音调930八月2023多媒体技术-音频基础10声音要素(三)音色(音质)timber由其频谱决定不同乐器发出同一音高的乐音,仍然可以分辨可以把音色描述为音的瞬时横截面,即用谐音(泛音)的数目、强度、分布和相位来描述。泛音的强度可使音色发生变化,音色的主观特性比响度或音调的主观特性复杂得多。03八月2023多媒体技术-音频基础10声音要素(三)音1030八月2023多媒体技术-音频基础11模拟信号与数字信号在时间和幅度上连续的信号为模拟(analog)信号。巴时间和幅度都用离散的数字表示的信号就称为数字(digital)信号采样(sampling)-时间量化(quantization)-幅度数字化实际上就是采样和量化03八月2023多媒体技术-音频基础11模拟信号与数字信1130八月2023多媒体技术-音频基础12声音的采样和量化两个关键参数:采样频率与量化精度03八月2023多媒体技术-音频基础12声音的采样和量化1230八月2023多媒体技术-音频基础13采样频率每秒钟需要采集多少个声音样本根据奈奎斯特理论(Nyquisttheory)和声音信号本身的最高频率决定的fs>=2f或者Ts<=T/2如果一个信号中的最高频率为fmax,采样频率最低要选择2fmax03八月2023多媒体技术-音频基础13采样频率每秒钟需1330八月2023多媒体技术-音频基础14量化精度反映度量声音波形幅度的精度,一般用每个声音样本的位数(bitpersample,bps)表示常见的量化精度有:8与16声音的质量越高,需要的存储空间越多03八月2023多媒体技术-音频基础14量化精度反映度量1430八月2023多媒体技术-音频基础15声音质量等级质量采样频率

(kHz)样本精度

(bit/s)单道声/立体声数据率(未压缩)

(kb/s)频率范围电话88单道声64200~3400HzAM11.0258单道声88.220~15000HzFM22.05016立体声705.650~7000HzCD44.116立体声1411.220~20000HzDAT4816立体声1536.020~20000Hz03八月2023多媒体技术-音频基础15声音质量等级质量1530八月2023多媒体技术-音频基础16声音质量的度量声音质量的评价目前仍然是一个很困难的问题,需要继续研究声音质量的度量有两种基本的方法客观质量度量:主要用信噪比(signaltonioseratio,SNR)主观质量度量:主观平均判分法对于图象等其它媒体数据的处理同样存在两种质量度量主客观结合?03八月2023多媒体技术-音频基础16声音质量的度量声1630八月2023多媒体技术-音频基础17存储格式(一)用.wav为扩展名的文件格式称为波形文件格式(WAVEFileFormat)RIFF:ResourceInterchangeFileFormatIBM和微软公司于1991年8月联合开发支持存储各种采样频率和样本精度的声音数据,并支持一定的声音数据的压缩主要用于PC类似格式au(SUN),aiff(Apple),snd(SGI)/_articles/AudioFormatIntro.html03八月2023多媒体技术-音频基础17存储格式(一)用17精品课件!精品课件!18精品

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论