DAY4.3音频信号处理基础_第1页
DAY4.3音频信号处理基础_第2页
DAY4.3音频信号处理基础_第3页
DAY4.3音频信号处理基础_第4页
DAY4.3音频信号处理基础_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、连续信号 实数域定义,自变量(时间或空间)取值连续 时间域连续信号 信号的值在时间上的任意点均有定义 如正弦波f=sin(t) 空间域连续信号 信号的值在空间上的任意点均有定义 如图像I=f(x, y)8/23/20122幅度连续 指幅度的数值有无穷多个模拟信号 在时间和幅度上都连续的信号 语音信号 典型的模拟信号,时间、幅度都连续采样(sampling) 在某些特定时刻对模拟信号进行测量8/23/20123离散时间信号 由这些特定时刻采样得到的信号 采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的离散幅度信号 把信号幅度取值的数目限定为有限个数值数字信号 时间和幅度都用离散数字表示

2、的信号8/23/20124采样 连续时间的离散化 均匀采样 每隔相等的时间采样一次量化(quantization) 将模拟声音的连续波形幅度转换为离散化的数字 先将整个幅度划分成有限个量化阶距的集合,把落入某个阶距内的样本值,并赋予相同的量化值8/23/20125线性/非线性量化 幅度的划分是等/不等间隔的 线性量化示例 假设输入电压的范围是0.0V0.7V,并假设它的取值只限定在0、0.1、0.2,0.7共8个值 量化办法 小数点后第二位四舍五入 如果采样得到的幅度值是0.123V,它的取值就算作0.1V 如果采样得到的幅度值是0.262V,它的取值就算作0.3V8/23/20126线性/非

3、线性量化 非线性量化示例 数字电话系统流行的量化机制 A-law 在欧洲占据主导地位 -law 在北美和日本占据主导地位 将模拟数值映射到8位离散值,在小值的时候近似随着幅度增长按照对数增加。由于人耳对于音量的感知近似对数曲线,这就使用一定的位数在可听见的声音强度范围提供了更高的信噪比?8/23/20127数字化 采样量化 声音进入计算机的第一步处理8/23/20128采样频率(fs) 每秒钟需要采集的声音样本个数 倒数称为采样周期采样定律 (奈奎斯特定理) 采样频率不小于声音信号最高频率的两倍 fs2f 或 TsT/2,f为被采样信号的最高频率 无损数字化 能把数字表达的声音还原成原来的模拟

4、声音8/23/20129理论采样 把连续信号乘上梳状脉冲波形 结果是一个被改变幅度的梳状脉冲波形 离散信号就是一连串被改变幅度的波形实际采样 模拟-数字转换器(ADC) 非理想的采样方法下产生各种失真8/23/201210采样失真-I 频混现象(频谱混叠效应) 当采样信号的频率低于被采样的2倍最高频率时,采样所得的信号中混入了虚假的低频分量 注意 满足采样定理,只能保证不发生频率混叠。对信号的频谱做逆傅里叶变换时,可以完全变换为原时域采样信号,而不能保证此时的采样信号能真实地反映原信号 工程实际中采样频率通常大于信号中最高频率成分的3到5倍8/23/201211信号x(t),傅里叶变换X(),

5、频带范-m+m采样信号x(t),周期频谱,ss2m,周期频谱分离s2m,周期频谱相互重叠,频混现象,信号复原时丢失原始信号中的高频信息8/23/201212图 采样信号的频混现象时域信号波形图(a)是频率正确的情况,以及其复原信号图(b)是采样频率过低的情况,复原的是一个虚假的低频信号8/23/201213图 发生频混现象时域信号波形采样失真-II Jitter 采样时基发生偏差 积分效应 采样所得并非是瞬时的,而是一小段时间内的值 在使用电容的采样保持电路中,因为电容无法根据采样立刻改变电压,需要非零宽度的采样信号 噪声 热噪声、模拟电路噪声.8/23/201214采样失真-III 量化误差

6、 ADC转换整数过程中舍去小数的误差 采样率过慢 ADC转换速度不够快,无法反映信号变化 截断误差 当输入信号超过ADC所能转换的大小时,输出就会被截断 其他失真 当成随机噪声来分析8/23/201215量化精度度量-I 用每个声音样本的位数bit度量 例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在065536的范围里,它的精度就是输入信号的1/65536 样本位数的大小影响声音质量 位数多,声音的质量高,需要的存储空间多 位数少,声音的质量低,需要的存储空间少8/23/2012168/23/201217声音质量和数据率质量质量名称名称采样频采样频率率(kHz)(kHz)样本精

7、度样本精度(bit/s)(bit/s)单道声单道声/ /立体声立体声数据率数据率( (kBkB/s)/s)( (未压缩未压缩) )频率范围频率范围电话88单道声8 2003 400 HzAM调幅11.0258单道声11.02015 000HzFM调频22.05016立体声88.2 507 000HzCD激光唱盘44.116立体声176.42020 000 HzDAT数字录音带4816立体声192.02020 000 Hz8/23/201218量化与数据压缩 目的是减少数据量 量化通过降低变换值的精度,从而减少数据量。精度损失引起的图像、音频质量的下降,可以通过量化位数的选择加以控制 有损数据压

8、缩 MP3 根据心理声学,丢弃人耳不能听见或被掩蔽的部分 JPEG 对原始的图像数据作离散余弦变换 对变换结果进行量化并作熵编码8/23/201219传统压缩 预测和变换编码 首先将信号经某种映射变换变成一个数的序列,然后对其一个一个地进行标量量化编码矢量量化(VQ,Vector Quantization) 70年代后期发展,新型数据压缩技术 基本思想 将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化 图像、语音信号编码技术.8/23/201220矢量量化 码本(codebook)的建立 已知信源分布特性 未知信源分布,但已知信源的一列具有代表性且足够长的样点集合(即训练序列) 码字(codeword)搜索 搜索出与输入最为匹配的码矢 全搜索算法和树搜索算法8/23/201221矢量量化举例 二维平面事先按照概率划分为N个小区域 码字(codeword) 每个区域对应的一个输出结果 码书(codebook) 码字的集合 输入点落在哪个区域内,矢量量化器就会输出那个区域对应的码字 一般会比标量量化效率更高8/23/201222窗函数 一种在给定区间之外取值均为0的实函数 矩形窗 在给定区间内为常数而在区间外为0 任何函数与窗函数之积仍为窗函数 相乘的结果就像透过窗口看其他函数一样8/23/201223频谱

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论