DAY4.3音频信号处理基础_第1页
DAY4.3音频信号处理基础_第2页
DAY4.3音频信号处理基础_第3页
DAY4.3音频信号处理基础_第4页
DAY4.3音频信号处理基础_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

音频信号处理基础音频信号处理基础连续信号实数域定义,自变量(时间或空间)取值连续时间域连续信号信号的值在时间上的任意点均有定义如正弦波f=sin(t)空间域连续信号信号的值在空间上的任意点均有定义如图像I=f(x,y)8/23/20122音频信号处理基础幅度连续指幅度的数值有无穷多个模拟信号在时间和幅度上都连续的信号语音信号典型的模拟信号,时间、幅度都连续采样(sampling)在某些特定时刻对模拟信号进行测量8/23/20123音频信号处理基础离散时间信号由这些特定时刻采样得到的信号采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的离散幅度信号把信号幅度取值的数目限定为有限个数值数字信号时间和幅度都用离散数字表示的信号8/23/20124音频信号处理基础采样连续时间的离散化均匀采样每隔相等的时间采样一次量化(quantization)将模拟声音的连续波形幅度转换为离散化的数字先将整个幅度划分成有限个量化阶距的集合,把落入某个阶距内的样本值,并赋予相同的量化值8/23/20125音频信号处理基础线性/非线性量化幅度的划分是等/不等间隔的线性量化示例假设输入电压的范围是0.0V~0.7V,并假设它的取值只限定在0、0.1、0.2,…,0.7共8个值量化办法小数点后第二位四舍五入如果采样得到的幅度值是0.123V,它的取值就算作0.1V如果采样得到的幅度值是0.262V,它的取值就算作0.3V8/23/20126音频信号处理基础线性/非线性量化非线性量化示例数字电话系统流行的量化机制A-law在欧洲占据主导地位μ-law在北美和日本占据主导地位将模拟数值映射到8位离散值,在小值的时候近似随着幅度增长按照对数增加。由于人耳对于音量的感知近似对数曲线,这就使用一定的位数在可听见的声音强度范围提供了更高的信噪比?8/23/20127音频信号处理基础数字化采样+量化声音进入计算机的第一步处理8/23/20128音频信号处理基础采样频率(fs)每秒钟需要采集的声音样本个数倒数称为采样周期采样定律(奈奎斯特定理)采样频率不小于声音信号最高频率的两倍fs≥2f或Ts≤T/2,f为被采样信号的最高频率无损数字化能把数字表达的声音还原成原来的模拟声音8/23/20129音频信号处理基础理论采样把连续信号乘上梳状脉冲波形结果是一个被改变幅度的梳状脉冲波形离散信号就是一连串被改变幅度的波形实际采样模拟-数字转换器(ADC)非理想的采样方法下产生各种失真8/23/201210音频信号处理基础采样失真-I频混现象(频谱混叠效应)当采样信号的频率低于被采样的2倍最高频率时,采样所得的信号中混入了虚假的低频分量注意满足采样定理,只能保证不发生频率混叠。对信号的频谱做逆傅里叶变换时,可以完全变换为原时域采样信号,而不能保证此时的采样信号能真实地反映原信号工程实际中采样频率通常大于信号中最高频率成分的3到5倍8/23/201211音频信号处理基础信号x(t),傅里叶变换X(ω),频带范-ωm~+ωm采样信号x(t),周期频谱,ωsωs>2ωm,周期频谱分离ωs<2ωm,周期频谱相互重叠,频混现象,信号复原时丢失原始信号中的高频信息8/23/201212图

采样信号的频混现象音频信号处理基础时域信号波形图(a)是频率正确的情况,以及其复原信号图(b)是采样频率过低的情况,复原的是一个虚假的低频信号8/23/201213图

发生频混现象时域信号波形音频信号处理基础采样失真-IIJitter采样时基发生偏差积分效应采样所得并非是瞬时的,而是一小段时间内的值在使用电容的采样保持电路中,因为电容无法根据采样立刻改变电压,需要非零宽度的采样信号噪声热噪声、模拟电路噪声...8/23/201214音频信号处理基础采样失真-III量化误差ADC转换整数过程中舍去小数的误差采样率过慢ADC转换速度不够快,无法反映信号变化截断误差当输入信号超过ADC所能转换的大小时,输出就会被截断其他失真当成随机噪声来分析8/23/201215音频信号处理基础量化精度度量-I用每个声音样本的位数bit度量例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536样本位数的大小影响声音质量位数多,声音的质量高,需要的存储空间多位数少,声音的质量低,需要的存储空间少8/23/201216音频信号处理基础

8/23/201217音频信号处理基础声音质量和数据率质量名称采样频率(kHz)样本精度(bit/s)单道声/立体声数据率(kB/s)(未压缩)频率范围电话88单道声8200~3400HzAM调幅11.0258单道声11.020~15000HzFM调频22.05016立体声88.250~7000HzCD激光唱盘44.116立体声176.420~20000HzDAT数字录音带4816立体声192.020~20000Hz8/23/201218音频信号处理基础量化与数据压缩目的是减少数据量量化通过降低变换值的精度,从而减少数据量。精度损失引起的图像、音频质量的下降,可以通过量化位数的选择加以控制有损数据压缩MP3根据心理声学,丢弃人耳不能听见或被掩蔽的部分JPEG对原始的图像数据作离散余弦变换对变换结果进行量化并作熵编码8/23/201219音频信号处理基础传统压缩预测和变换编码首先将信号经某种映射变换变成一个数的序列,然后对其一个一个地进行标量量化编码矢量量化(VQ,VectorQuantization)70年代后期发展,新型数据压缩技术基本思想将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化图像、语音信号编码技术….8/23/201220音频信号处理基础矢量量化码本(codebook)的建立已知信源分布特性未知信源分布,但已知信源的一列具有代表性且足够长的样点集合(即训练序列)

码字(codeword)搜索搜索出与输入最为匹配的码矢全搜索算法和树搜索算法8/23/201221音频信号处理基础矢量量化举例二维平面事先按照概率划分为N个小区域码字(codeword)每个区域对应的一个输出结果码书(codebook)码字的集合输入点落在哪个区域内,矢量量化器就会输出那个区域对应的码字一般会比标量量化效率更高8/23/201222音频信号处理基础窗函数一种在给定区间之外取值均为0的实函数矩形窗在给定区间内为常数而在区间外为0任何函数与窗函数之积仍为窗函数相乘的结果就像透过窗口看其他函数一样8/23/201223音

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论