音频处理技术ppt课件.ppt

上传人：闯*** IP属地：广东上传时间：2020-03-27 格式：PPT 页数：87 大小：4.07MB 积分：0 举报 版权申诉

已阅读5页，还剩82页未读，继续免费阅读

音频处理技术ppt课件.ppt.ppt 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 第4章多媒体音频处理技术 4 1音频信号及其概念4 2模拟音频的数字化过程4 3声卡的组成和功能4 4音频文件的格式与处理软件4 5乐器数字接口 MIDI4 6数字音频的应用 2 3 4 1 1声音处理技术历史回顾记录 19世纪爱迪生留声机电声技术研究可听声频率范围内声音的产生传播存储重放和接收的技术依靠电来记录并播放声音通过电压产生模拟声波变化的电流信号是模拟信号随着计算机技术和存储设备的发展数字化音频处理技术也得到了发展 4 图4 2用磁带记录声音的录音机 5 4 1 2声音信号的形式任何声音都是物体振动产生的现象其在介质中的传播称为声波声源所引起的空气压力变化被耳朵的耳膜所检测然后产生电信号刺激大脑的听觉神经从而使人们能感觉到声音的存在 6 4 1 2声音信号的形式语音信号语言的物质载体具有复杂的语法和语义难于识别非语音信号音乐自然界的声音信息量低识别简单 7 图4 4在自然界声波与水波一样都是一种振动波 8 图4 5用声音录制软件记录的英文单词 Hello 语音的实际波形 9 4 1 3模拟音频信号的物理特征频率体现音调的高低单位Hz幅度体现声音的强弱单位dB语音信号频率范围 300Hz 3000Hz可听频率带宽音频 20Hz 20kHz 10 11 图4 6声波的频率周期与振幅 12 教学进程 13 声音质量分级与带宽图4 8四级声音质量的频率范围 14 声音的质量与声音的频率范围有关一般说来频率范围越宽声音的质量就越高对语音而言常用可懂度清晰度自然度来衡量而对音乐来说保真度空间感音响效果都是重要的指标 15 第4章多媒体音频处理技术 4 1音频信号及其概念4 2模拟音频的数字化过程4 3声卡的组成和功能4 4音频文件的格式与处理软件4 5乐器数字接口 MIDI4 6数字音频的应用 16 17 借助于A D或D A转换器模拟信号和数字信号可以互相转换 18 19 4 2 1采样为实现A D转换需要把模拟音频信号波形进行分割每隔一定的时间间隔测一次模拟音频的值如电压以转变成数字信号这种方法称为采样 Sampling 每秒钟采样的次数称为采样率数字音频是离散的而模拟音频是连续的数字音频质量的好坏与采样率密切相关数字音频信息可以被计算机存储处理和播放 Nyquist采样定理只有采样频率高于声音信号最高频率的两倍时才能把数字信号表示的声音还原为原来的声音 20 图4 9声音的采样和量化示意图 21 4 2 2量化用某种数字化的方法来反映某一瞬间声波幅度的电压值的大小称为量化采样后的信号按照整个声波的幅度幅度轴划分称有限个区段的集合把落入某个区段内的样值归为一类并赋予形同的量化值采用二进制以16位或256位等的方式来进行 22 均匀量化非均匀量化 23 数字音频等级 24 25 教学进程数据量采样频率量化位数 8 声道数声音持续时间例1 对于调频广播级立体声采样频率为44 1kHz 量化等级为16位即2字节声道形式为双声道则转换后每秒以千字节为单位的数据量为 44100 Hz 16 8 B 2 176400B s 172kB s 例2 用44 1kHz的采样频率对声波进行采样每个采样点的量化位数选用16位则录制3分钟的立体声节目其波形文件所需的存储容量为 44100 Hz 16 8 B 2 3 60 31752000B s 31007 8kB s 30 28MB s 26 例3 一般播音员的播音频率是 kHz 采用8bit的采用精度进行采样的时候计算该播音员播音分钟的数据量为 kHz bit 例4 以cd激光盘音质 44 1kHz的采样频率 16位立体声形式记录一首分钟的乐曲所需的存储容量为 44100 Hz 16 8 B 2 60 51600kb 27 4 2 3声音采样与量化过程示例 28 图4 10采样频率为1000Hz 10个量化等级的波形 29 图4 11经过D A转换器得到的信号波形直线段的波形有较大的失真 30 图4 12采样率为2000Hz 量化等级为20的采样量化过程 31 图4 13采样率为4000Hz 量化等级为40的采样量化过程 32 4 2 4压缩编码依据声音信息中存在着多种冗余听觉器官的不敏感性采样的标本中存在着相关性压缩算法通常应能满足下列需求压缩倍数高压缩后的数据率低解码后的信号失真小质量高算法简单执行速度快延迟时间短编码器解码器的成本低 33 压缩方法 compressionmethod 有损压缩无损压缩编码选择 codeselection 机常用的声卡上有自适应差分脉冲码调制方案律 a律等 format structure 34 音频信息的压缩技术有损压缩混合编码码本激励线性预测 CELP 35 图4 14音频信号处理过程 36 第4章多媒体音频处理技术 4 1音频信号及其概念4 2模拟音频的数字化过程4 3声卡的组成和功能4 4音频文件的格式与处理软件4 5乐器数字接口 MIDI4 6数字音频的应用 37 4 3 1声卡的工作原理图4 16声卡工作原理框图采用大规模集成电路设计将音频技术范围的各类电路以专用芯片的形式集成在声卡上并可直接插入计算机的扩展槽中使用 38 1 主芯片数字信号处理器声音信息处理特殊音效过滤与处理语音识别实施压缩等等任务 2 混音芯片 CODEC负责调节各声音来源的音量混音与调整录放音的音量大小图4 18SoundBlasterPCI64声卡的混音器设置界面 39 3 合成器负责MIDI乐曲的合成可以及时创造各种音乐MIDI合成器有两种频率调制合成器 FM合成器波形表 Wavetable合成器 4 总线接口和控制器总线接口和控制器由数据总线双向驱动器总线接口控制逻辑总线中断逻辑和DMA控制逻辑组成 5 外部输入输出口声卡外部输入输出口均为3 5mm规格插口 MIDI Joystick除外 40 41 4 3 2声卡的性能指标1 音频技术指标2 MIDI音频3 声道数 DolbyAC 3等图4 195 1声道系统的布局图 42 4 多音频流输出5 I O设备接口6 声卡软件7 总线结构图4 20支持5 1声道系统的声卡接口 43 44 45 46 杜比与DTS 1 DolbyDigitalMono 杜比数字单声道音效只有单声道的效果并不足以构成立体声 2 DolbyDigitalStereo 杜比数字双声道音效将双声道的立体讯号储存为AC 3格式 3 DoblyDigitalSurround 杜比数字环绕音效4 DolbyDigital4 0 杜比数字环绕音效4 05 DolbyDigital5 0 杜比数字环绕音效5 06 DolbyDigital5 1 杜比数字环绕音效5 1以DolbyDigital来表示DolbyDigital5 1 也就是5 1声道的DolbyDigital或AC 3 7 Dolbydigital7 1 11 1等等 47 杜比与DTS PCM高音质数字音效 DVD利用PCM格式储存未经压缩的双声道讯号由于DVD具有庞大的空间与速度优势可以大胆使用更高的取样率与解析度因此可以提供远高于传统CD的表现DTS数字环绕音效属于5 1声道的环绕效果 DTS采用与AC 3不同的压缩技术将环绕音效储存至DVD 播放时必须采用具有dts译码能力的系统 DTS跟DolbyDigital5 1最大的差别在于两者使用不同的算法 48 4 3 3声卡的主要功能录制与播放声音通过接在声卡上的话筒录制声音并以文件形式保存在计算机中随时可打开声音文件进行播放声音文件的格式可因使用不同的软件而不同音乐合成利用声卡上的合成器将存储在计算机内存中的MIDI文件合成为音乐乐曲通过混合器混合和处理多个不同音频源的声音控制和调节音量大小最后送至音箱或耳机播放 49 压缩和解压缩音频文件目前大多数声卡上都固化了不同标准的音频压缩和解压缩软件常用的压缩编码方法有ADPCM 自适应差分脉冲编码调制和ACM 微软音频压缩管理器等压缩比大约为2 1 5 l 与MIDI设备和CD驱动器的连接通过声卡上的MIDI接口计算机可以同外界的MIDI设备相连接如连接电子琴电吉他等使MPC具有创作电脑乐曲和播放MIDI文件的功能游戏杆也可通过MIDI接口与计算机相连接使游戏玩起来得心应手 50 第4章多媒体音频处理技术 4 1音频信号及其概念4 2模拟音频的数字化过程4 3声卡的组成和功能4 4音频文件的格式与处理软件4 5乐器数字接口 MIDI4 6数字音频的应用 51 4 4 1数字音频的文件格式图4 21常用音频格式 52 1 WAV文件 wav2 MP3 mp33 MP4 mp44 RealAudio文件 ra rm ram5 APE文件 ape 图4 22MP3是Internet上流行的音乐格式 53 6 MIDI文件 midi7 CD文件 cda8 AAC文件 m4a mp4等9 PCM文件 pcm10 WMA文件 wma11 VOC文件 voc12 AIFF文件 aif aiff13 HDTA文件 hdta 54 HDTA 可变结构高解析度音频 Hi DefinitionTransformableAudio 是一种结合了互动性和高解析度音频的新一代音频格式 HDTA按照不同的标准主要分为以下几种 TA 只支持16Bit 44 1KHz传统音频 HDTA立体声只支持高解析度的双声道 HDTA环绕声支持6 8 16个声道的环绕声新一代的HDTA格式音乐是彻头彻尾的数字格式它不以任何光盘为载体而是作为一种计算机数据格式存在 55 4 4 2音频制作与处理软件1 CoolEdit 图4 25CoolEditPro的界面 56 2 SoundForge 图4 26SoundForge音频处理软件 57 第4章多媒体音频处理技术 4 1音频信号及其概念4 2模拟音频的数字化过程4 3声卡的组成和功能4 4音频文件的格式与处理软件4 5乐器数字接口 MIDI4 6数字音频的应用 58 4 5 1什么是MIDIMIDI是数字音乐接口 MusicalInstrumentDigitalInterface 的缩写或者说 MIDI是用来將电子乐器相互连接或将MIDI设备与电脑连接成系统的一种通讯协议通过它各种MIDI设备都可以准确传送MIDI信息不属于数字音响技术的范畴Midi数据不是数字的音频波形而是音乐代码或电子乐谱 4 5乐器数字接口 MIDI 59 4 5 2MIDI系统的组成 60 1 合成器图4 28具有USB接口的MIDI键盘使用振荡器来产生声乐的一种电子乐器通过振荡器的电流震荡产生各种波形并进行处理合成出新的音乐合成器中的音序器和音色分别由软件和独立音源来代替因此产生控制键盘 61 2 音源图4 29硬件音源产品 RolandJV1080 音源音色的数量品种和质量都将对最终音乐作品的效果产生重要的影响音源内部是不同音色的样本波形由音序器来决定何时调用分为软硬件两种专业硬件音源多媒体声卡上包含GM音色库以插件形式的软音源 62 3 音序器 Sequencer 记录编辑和播放midi文件的设备硬件音序器又称为编曲机软件音序器是音乐创作编辑软件比如Cakewalk等 4 采样器对声音进行采样然后编辑成多种的音色 5 其它设备如录音设备监听设备音箱功放等 YamahaQY100音序器 63 4 5 3MIDI的工作过程midi消息实际上是对一段音乐的描述或理解为对乐谱的数字描述包括音符节拍乐器种类等信息消息分为状态信息和数据信息状态信息描述音符被演奏或是声音被加强等数据信息描述那个音符被演奏了或被加强的声音的强度如何这类可以用量来表示的信息 64 图4 31MIDI的工作过程 65 66 4 5 4FM与波表合成方式1 FM合成法FM称为数字式频率调制合成法简称FM合成法 FM合成法生成音乐的基本原理是用数字信号来表示不同音乐的波形然后把它们组合起来再通过数模转换器生成音乐播放 2 波表合成法为了能真实地再现音乐目前的声卡一般采用音乐样本合成法即波表合成法把真实乐器发出的声音以数字的形式记录下来存放在波表文件中播放时根据命令生成各种音阶的音符产生的声音质量比较高 67 FM合成法比如MIDI音乐用符号描述的乐器演奏的音乐声音合成语音用声母韵母或清音基音频率等参数描述的语音等符号化的声音表示方法所产生的声音虽然没有自然声那么真实逼真但数据量要比波形声音小得多 2 3个数量级而且能产生自然界中不存在的声音其编辑处理也比波形声音更加方便一些 68 4 5 5GM 标准MIDI乐器排序表4 5 6MIDI音乐创作软件与音序软件图4 33CakeWalkProAudio音序软件主界面 69 图4 34在CakewalkProAudio能容易地对MID乐谱进行编辑和创作 70 第4章多媒体音频处理技术 4 1音频信号及其概念4 2模拟音频的数字化过程4 3声卡的组成和功能4 4音频文件的格式与处理软件4 5乐器数字接口 MIDI4 6数字音频的应用 71 语音识别语音合成 72 语音识别指机器收到语音信号后如何模仿人的听觉器官辨别所听到的语音内容或讲话人的特征进而模仿人脑理解出该语音的含义或判别出讲话人的过程分类按讲话者分类 1 特定人的语音识别系统其特点是依赖于说话者只有在用特定单词组形成的词汇表系统训练后它才能识别 2 非特定人识别系统此类系统可识别任何用户的语音 73 按识别词的性质分类 1 孤立词语音识别系统一次只提供一个单一词的识别 2 连接词语音识别连接词的语音由所说的短语组成而短语又是由词序列组成连接词语音识别可用于命令和控制应用 3 连续语音识别这种方法比孤立单词或连接词语音识别都复杂许多 74 75 连续语音识别系统分成三部分数字化幅度归一化时间归一化和参数表示分割并把语音段标记成在基于知识或基于规则系统上的符号串识别词序列并进行语音段匹配 76 语音识别系统的组成采样量化语音端点检测计算语音谱估价音调轮廓图分解鉴定语音特征单词识别识别后的语音语音输入参考村料库语义分析理解后的语音语义库 77 语音识别难度大语音变化大不同人不一样同一人也会有变化语音有模糊性不同词语听起耒很相似同一字和词的发音受上下文影响而有不同语音的同化异化换位弱化脱落等音变现象环境噪声的干扰例如墙壁与物体对声波的反射会与主声波重迭连续语音流不易把单字词区分出来端点检测例如若单字词识别正确率为0 95 则

人人文库> 全部分类> 毕业设计 > 开题报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

音频处理技术ppt课件.ppt

文档简介

温馨提示

最新文档

评论

音频处理技术ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档