版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字音频技术概述第1页,共27页,2023年,2月20日,星期六关于“声音”声音的记录与回放音频文件格式音频驱动常用的数字音频接口第一章数字音频技术概述第2页,共27页,2023年,2月20日,星期六百度百科词目:声音
英语:sound;voice
基本解释
1.使人产生听觉的振动
2.一种由物体振动而发生的波造成的听觉印象
3.[voice]∶某些起与人的语言相同作用的工具或表达手段何为“声音”第3页,共27页,2023年,2月20日,星期六百度百科词目:声音详细解释
1.指由物体振动而发生的声波通过听觉所产生的印象。
《礼记·乐记》:“乐必发於声音,形於动静,人之道也。”南朝宋鲍照
《拟<行路难>》诗之七:“声音哀苦鸣不息,羽毛憔悴似人髠(kūn)。”清李渔
《巧团圆·默订》:“你看卧房门启,想是曹小姐听见声音,知道小生在此,又出来探望了。”沈从文
《从文自传·我读一本小书同时又读一本大书》:“若在四月落了点小雨,山地里田塍上各处全是蟋蟀声音,真使人心花怒放。”何为“声音”第4页,共27页,2023年,2月20日,星期六声音没有质量,也就是没有重量。声音不是物体,只是一个名称,声音是一种机械纵波,波是能量的传递形式,它有能量,所以能产生效果,但是它不同于光(电磁波),光有质量有能量有动量,声音在物理上只有压力,没有质量。“声音”的重量第5页,共27页,2023年,2月20日,星期六(一)响度(loudness):人主观上感觉声音的大小(俗称音量),由“振幅”(amplitude)和人离声源的距离决定,振幅越大响度越大,人和声源的距离越小,响度越大。(单位:分贝dB)(二)音调(pitch):声音的高低(高音、低音),由“频率”(frequency)决定,频率越高音调越高(频率单位Hz(hertz),赫兹[/url,人耳听觉范围20~20000Hz。20Hz以下称为次声波,20000Hz以上称为超声波)例如,低音端的声音或更高的声音,如细弦声。声音的特性第6页,共27页,2023年,2月20日,星期六(三)音色(musicquality):声音的特性,由发声物体本身材料、结构决定。又称音品、音质。频率是每秒经过一给定点的声波数量,它的测量单位为赫兹,是以一个名叫海里奇R.赫兹的音响奇人命名的。此人设置了一张桌子,演示频率是如何与每秒的周期相关的。
1千赫或1000赫表示每秒经过一给定点的声波有1000个周期(khz),1兆赫就是每秒钟有1,000,000个周期,等等。声音的特性第7页,共27页,2023年,2月20日,星期六
(四)乐音:有规则的让人愉悦的声音。噪音:从物理学的角度看,由发声体作无规则振动时发出的声音;从环境保护角度看,凡是干扰人们正常工作、学习和休息的声音,以及对人们要听的声音起干扰作用的声音。(五)混响:也称“交混回响”,指直达声消失后,声音延续所引起的交混现象。在室内,混响常由声音在墙面等连续多次反射所引起。混响时间太长,则前后声音交混,听不清楚,过短则音量不够,声音干涩不动听。第8页,共27页,2023年,2月20日,星期六声音干:混响时间偏短,混响量不足,尤其是中高频段的混响量缺乏造成听感干涩。声音硬:主要是中高频成分偏多,低频缺乏,且高频波衰落过快。对1Khz附近频率作过多的提升,容易造成明显的声音硬的感觉。声音空:混响声(尤其是中高频混响声)比例过大,造成听感上主音不突出,不结实有虚无缥缈的感觉,拾音距离过远也会造成“空”的感觉。常用音质评价术语第9页,共27页,2023年,2月20日,星期六声音薄:是指500Hz低频衰减过多,低频能量欠缺,力度感不够且混响也不足时声音在听感上单薄无力的情况。声音闷:由于3000Hz以上高音部分衰落较多,高频混响不足;而在低频,尤其是100-200Hz频段能量过高,造成声音不亮的现象。声音哄:中低频段能量过强,混响过度,且可能有共振现象,造成一种“哄哄”作响的声音,使清晰度下降。常用音质评价术语第10页,共27页,2023年,2月20日,星期六赫兹赫兹是频率单位,记为Hz,指每秒钟周期性变化的次数。分贝分贝是用来表示声音强度的单位,记为dB。声音的单位第11页,共27页,2023年,2月20日,星期六声音的记录原理:声音能记录下来,是因为它是一种连续的空气振动,属于机械振动中的纵波,具有大小和方向,我们能通过一定的技术手段记录到这种机械振动,于是声音就能被记录。声音的记录与回放第12页,共27页,2023年,2月20日,星期六记录声音的方式常用有两种:1.模拟2.数字声音的记录与回放第13页,共27页,2023年,2月20日,星期六模拟方式——磁记录:就是将声音的空气震动,变成大小强弱对应的连续的电信号,然后再转变为连续的磁信号,记录在能被磁化的介质上,如钢丝录音机(很早的设备)、磁带录音机就是这个原理。被磁化的介质以一定的速度通过线圈(磁头)时,强弱变化的磁场感生出强弱变化的电场,形成对应变化的电流,让后将这种电流通过一定方式的放大,就还原出记录的声音了。声音记录模拟方式第14页,共27页,2023年,2月20日,星期六模拟方式——黑胶唱片:空气震动信号——电信号——机械振动,带动一根记录针,将振动的规律记录在黑胶母碟上,也就是在母碟上刻出一圈一圈的凹槽,就制作出黑胶唱片的母版,然后通过一定的技术手段翻版出能实用的黑胶唱片。还原声音时,则正好是上述记录过程的反向,将唱针放到凹槽里,转动唱片,唱针就会根据凹槽的深浅、弯曲产生对应的机械振动,然后这种机械振动再转换为电信号,通过检波和放大,就还原出记录的声音了。声音记录模拟方式第15页,共27页,2023年,2月20日,星期六数字方式:声音的空气振动转变为连续变化的电信号,然后对这种连续变化的信号进行采样—量化—编码,然后以文件的形式(音频文件)记录下来。回放则是上述过程的逆向运算,最后得到一个变化的电信号,驱动扬声器,将这种变化的电信号转换为空气振动,形成我们听到的声音。声音记录数字方式第16页,共27页,2023年,2月20日,星期六奈奎斯特定理(采样定理):如果连续变化的模拟信号最高频率为F,若以2F的采样频率对其采样,则采样得到的离散信号序列就能完整地恢复出原始信号。语音信号要在数字线路上传输,必须将语音信号转换成数字信号。这需要经过三个步骤:
1)采样——按一定间隔对语音信号进行采样
2)量化——对每个样本舍入到量化级别上
3)编码——对每个舍入后的样本进行编码声音记录数字方式脉冲幅度调制第17页,共27页,2023年,2月20日,星期六声音记录数字方式BACDABCD模拟话音采样时钟PAM信号PCM信号采样电路量化和编码数字化声音PCM(PulseCodedModulation)(脉码调制信号)PAM(PulseAmplitudeModulation)脉冲幅度调制第18页,共27页,2023年,2月20日,星期六声音记录数字方式PCM转换过程举例 3.23.92.83.41.24.2343314011100011011001100
原始信号PAM脉冲PCM脉冲(有量化误差)011100011011001100PCM输出第19页,共27页,2023年,2月20日,星期六常识:采样率:数字音频采样标准频率44.1kHz(20kHz*2)采样的位数:16bit位速:位速是指在一个数据流中每秒钟能通过的信息量;Kbps表示“每秒千字节数”,因此数值越大表示数据越多,位速越高,信息量越大!常用的位速为:128kbps、192kbps、256kbps等。声音记录数字方式第20页,共27页,2023年,2月20日,星期六
音频文件第21页,共27页,2023年,2月20日,星期六媒体格式扩展名公司主要优点主要缺点适用领域WAVwavMicrosoft可通过增加驱动程序而支持各种各样的编码技术。不适于传播和用作聆听。支持的编码技术大部分只能在Windows平台下使用。音频原始素材保存。mp3(MPEG音频)mp3(包括mp2mp1)Fraunhofer-IIS在低至128kbps的比特率下提供接近CD音质的音频质量。广泛的支持。出现得比较早,因此音质不是很好。一般聆听和高保真聆听。mp3PROmp3Fraunhofer-IIS在低至64kbps的比特率下提供接近CD音质的音频质量。专利费用较高,支持的软件和硬件不多。一般聆听和高保真聆听。RealMediara,rmaRealNetworks在极低的比特率环境下提供可听的音频质量。不适于除网络传播之外的用途。音质不是很好。网络音频流传输。WindowsMediawma,asfMicrosoft功能齐全,使用方便。同时支持无失真、有失真、语音压缩方式。失真压缩方式下音质不高。必须在Windows平台下才能使用。音频档案级别保存,一般聆听,网络音频流传输。MIDIMIDMIDIRMI、XMIMIDIAssociation音频数据为乐器的演奏控制,通常不带有音频采样。没有波表硬件或软件配合时播放效果不佳。与电子乐器的数据交互,乐曲创作等。OggVorbisOGGXiphFoundation在低至64kbps的比特率下提供接近CD音质的音频质量。开放源代码,不需要支付使用许可费用。跨平台。发展较慢。推广力度不足。一般聆听和高保真聆听。Monkey'sAudioapeMatthewT.Ashland无失真压缩。部分开放代码。由于是个人作品,使用上存在一定风险。高保真聆听和音频档案级别保存。aiffaiffApple可通过增加驱动程序而支持各种各样的编码技术一般限于苹果电脑平台使用。苹果电脑平台下音频原始素材保存。auauSunUnix和Java平台下的标准文件格式。支持的压缩技术太少且音频数据格式受文件格式本身局限。Unix和Java平台下音频原始素材保存。MusicInstrumentDigitalInterface数字化乐器接口第22页,共27页,2023年,2月20日,星期六MME(Muti-MediaExtensions),一般的Windows驱动程序。响应速度较慢。GSIF(GigaStudiocompactableInterFace),是NemeSys为其著名的软音源GigaSampler/Studio制定的接口规范。符合这个规范的声卡在应用Giga软音源时能获得零延迟的效果。ASIO(AudioStreamInputOutput),音频流输入输出接口,专业声卡或高档音频工作站具备的接口。音频驱动简介同一块声卡采用MME驱动时延迟时间为750毫秒,采用ASIO驱动时延迟降低到40毫秒以下。第23页,共27页,2023年,2月20日,星期六AES/EBO,美国和欧洲录音协会制定的专业数字音频数据格式,接口硬件为卡侬接口。常用的数字音频接口标准第24页,共27页,2023年,2月20日,星期六S/PDIF,Sony公司和Philip公司制定的一种音频格式,民用和普通领域使用,接口硬件使用的是光纤或同轴口,CD机、MD机和计算机声卡普遍采用S/PDIF格式。常用的数字音频接口标准
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 定金合同签订技巧
- 科技期刊经营模式创新
- 网络安全行政人员聘用合同
- 娱乐场所电梯井道施工合同
- 智慧城市监控施工合同模板
- 2024年绿色建筑认证施工单位劳动合同范本3篇
- 绿色建筑评价投标书
- 员工培训合同范本
- 医疗意外处理协议
- 2024年跨境电商担保免责合同模板3篇
- DB32T 4337-2022 可燃性粉尘除尘系统安全验收规范
- 《国画基础》教案
- 三菱伺服电机
- 工程施工安全交底
- 中班听课记录15篇
- GB/T 8750-2022半导体封装用金基键合丝、带
- 体育科学研究方法学习通课后章节答案期末考试题库2023年
- 2023天津市和平区七年级上学期语文期末试卷及答案
- 校园艺术节比赛评分表
- 挖机租赁协议(通用6篇)
- 院内按病种分值付费(DIP)专题培训
评论
0/150
提交评论