第二章-多媒体音频技术(1)分解.ppt

上传人：1*** IP属地：浙江上传时间：2020-04-17 格式：PPT 页数：76 大小：4.87MB 积分：20 举报 版权申诉

免费预览已结束，剩余71页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

返回多媒体音频技术主讲教师张敏第二章多媒体媒体元素是指多媒体应用中可显示给用户的媒体组成多媒体中的媒体元素音频动画视频文本图形图像目录 2 1数字音频基础返回 2 2声卡与音箱 2 3MIDI音频 2 4语音识别技术 2 5音频处理软件 2 1数字音频基础 2 1 1声音的基本概念 2 1 2声音的数字化返回 2 1 3数字音频的文件格式音频数字音频 Audio 可分为波形声音语音和音乐波形声音实际上已经包含了所有的声音形式它可以将任何声音都进行采样量化相应的文件格式是WAV文件或VOC文件语音也是一种波形所以和波形声音的文件格式相同音乐是符号化了的声音乐谱可转变为符号媒体形式对应的文件格式是MID或CMF文件 2 1 1声音的基本概念声音是由空气中分子的振动而产生的自然界的声音是一个随时间而变化的连续信号可近似地看成是一种周期性的函数通常用模拟的连续波形描述声波的形状单一频率的声波可用一条正弦波表示如下图所示振幅周期基线声音的质量次声波声音频率可听声波20Hz 20kHz超声波语音信号频率 300Hz 3Khz 与声音的带宽有关一般来说频率范围越宽声音质量也就越高声音质量的频率范围频域或频带声音是具有一定的振幅和频率且随时间变化的声波通过话筒等转化装置可将其变成相应的电信号模拟信号不能由计算机直接处理为使计算机能处理音频必须对声音信号数字化 2 1 2声音的数字化采样编码量化声音的模拟信号声音的数字信号声音的数字化过程模拟信号数字信号 A DADC D ADAC 采样和量化 c 采样信号的量化 a 模拟音频信号 b 音频信号的采样数字化音频的过程如下图所示示意采样定理仅当采样频率 2倍的原始信号频率时才能保证采样后信号可被保真地恢复为原始信号模拟声音在时间上是连续的或称连续时间函数x t 用计算机处理这些信号时必须先对连续信号采样即按一定的时间间隔 T 在模拟声波上截取一个振幅值通常为反映某一瞬间声波幅度的电压值得到离散信号x nT n为整数 T称采样周期 1 T称为采样频率量化为了把采样得到的离散序列信号x nT 存入计算机必须将采样值量化成有限个幅度值的集合x nT 采样值用二进制数字表示的过程称为量化编码对模拟音频信号进行采样量化编码后得到数字音频数字音频的质量取决于采样频率量化位数和声道数三个因素影响数字音频质量的技术参数采样频率是指一秒钟时间内采样的次数在计算机多媒体音频处理中采样频率通常采用三种 11 025KHz 语音效果 22 05KHz 音乐效果 44 1KHz 高保真效果常见的CD唱盘的采样频率即为44 1KHz 1 采样频率 2 量化位数量化位数也称量化精度是描述每个采样点样值的二进制位数例如 8位量化位数表示每个采样值可以用28即256个不同的量化值之一来表示而16位量化位数表示每个采样值可以用216即65536个不同的量化值之一来表示常用的量化位数为8位 12位 16位 3 声道数声音通道的个数称为声道数是指一次采样所记录产生的声音波形个数记录声音时如果每次生成一个声波数据称为单声道每次生成两个声波数据称为双声道立体声随着声道数的增加所占用的存储容量也成倍增加 SamplingResolution8bitSamplingFrequency11KHz SamplingResolution16bitSamplingFrequency22KHz 数字音频文件的存储量存储量采样频率量化位数 8 声道数时间例如用44 1KHz的采样频率进行采样量化位数选用16位则录制1秒的立体声节目其波形文件所需的存储量为以字节为单位模拟波形声音被数字化后音频文件的存储量假定未经压缩为 44100 16 8 2 1 176400 字节数字音频信号的编码一般情况下声音的制作是使用麦克风或录音机来产生再由声卡上的WAVE合成器的模数转换器对模拟音频采样后量化编码为一定字长的二进制序列并在计算机内传输和存储在数字音频回放时再由数字到模拟的转化器数模转换器解码可将二进制编码恢复成原始的声音信号通过音响设备输出如下图所示模拟音频信号输入采样量化编码传输存储解码播放 1 WAV文件扩展名 wav相关公司或组织 Microsoft和IBM主要优点声音层次丰富还原性好表现力强可通过增加驱动程序而支持各种各样的编码技术主要缺点波形文件的数据量大不适于传播和用作聆听支持的编码技术大部分只能在Windows平台下使用适用领域自然语音的保存与重放 2 1 3数字音频的文件格式 2 MP3文件扩展名 mp3 包括mp2和mp1等相关公司或组织 Fraunhofer IIS主要优点在低至128kbps的比特率下提供接近CD音质的音频质量广泛的支持主要缺点出现得比较早因此音质不是很好适用领域一般聆听和高保真聆听 3 mp3PRO文件扩展名 mp3 包括mp2和mp1等相关公司或组织 Fraunhofer IIS CodingTechnologies ThomsonMultimedia主要优点在低至64kbps的比特率下提供接近CD音质的音频质量主要缺点专利费用较高支持的软件和硬件不多适用领域一般聆听和高保真聆听 4 WMA文件扩展名 wma asf相关公司或组织 Microsoft主要优点功能齐全使用方便同时支持无失真有失真语音压缩方式在MP3文件一半大小的前提下保持相同的音频主要缺点失真压缩方式下音质不高必须在Windows平台下才能使用适用领域音频档案级别保存一般聆听网络音频流传输 5 MIDI文件乐器数字接口扩展名 MID MIDI RMI XMI等相关公司或组织 MIDIAssociation主要优点音频数据为乐器的演奏控制通常不带有音频采样主要缺点没有波表硬件或软件配合时播放效果不佳适用领域与电子乐器的数据交互乐曲创作等 2 2声卡与音箱 2 2 1声卡 2 2 2音箱 2 2 1声卡 1 声卡的主要功能 2 声卡的组成原理 3 声卡的性能指标 4 声卡的外部接口 1 声卡的主要功能声卡是负责录音播音和声音合成的一种多媒体板卡其功能包括录制编辑和回放数字音频文件控制各种声源的音量并加以混合在记录和回放数字音频文件时进行压缩和解压缩采用语音合成技术让计算机朗读文本初步的语音识别 MIDI接口和输出放大等 2 声卡的组成原理总线接口芯片混音器 A D和D A 数字音频处理芯片音乐合成器话筒输入线性输入扬声器输出线性输出 MIDI接口 CD接口对以下音源进行混合数字化声音 DAC 调频FM合成音乐 FM CD音频 CD ROM 线路输入 AUX 话筒输入 MIC 及PC声音输出 SPK 将数字音频波形数据或MIDI消息合成为声音完成信号的记录播放任务 ADPCM压缩改变采样频率解释MIDI指令等 3 声卡的性能指标采样和量化能力采样频率和量化位数越高声卡产生的声音越细腻直接影响声卡的频率响应范围芯片类型通常有2声道 2 1声道 4 1声道 5 1声道总线类型输出声道数按声卡与计算机连接方式不同分为ISA总线 PCI总线和USB电缆连接方式 CODEC芯片专用数字信号处理器 4 声卡的外部接口 LINEIN LINEOUT SPKOUT 游戏杆 MIDI 录音机 CD唱机等线性输出话筒扬声器线性输入立体声放大器 MIDI设备游戏杆 MICIN 2 2 2音箱 1 音箱的分类 2 音箱的性能指标音箱的分类按照箱体材质塑料和木质音箱按照功率放大器的内外置通常有2 0 2 1 4 1 5 1 7 1 按照接口按照声道数量普通声卡接口数字接口 USB接口等有源音箱和无源音箱音箱的性能指标输出功率分为额定功率和最大峰值功率两种音箱功率越大音质效果越好频率范围与频率响应信噪比普通音箱 70 80dB 高档音箱 80 90dB 专业音箱 95dB以上音箱的频率响应曲线越平坦失真越小性能越高音箱的性能指标 cont 灵敏度指产生全功率输出时的输入信号输入信号越低灵敏度越高音箱性能就越好阻抗扬声器输入信号的电压与电流的比值低阻抗的音箱可以获得较大的输出功率但阻抗太低又会造成低音劣化等现象分为谐波失真互调失真和瞬态失真3种失真度 2 4MIDI音频 MIDI是MusicalInstrumentDigitalInterface 乐器数字接口的缩写 MIDI是一种国际标准是计算机和MIDI设备之间进行信息交换的一整套规则包括各种电子乐器之间传送数据的通信协议适用于长时间音乐演奏的场合 1 什么是MIDI MIDI音频是将电子乐器键盘上的弹奏信息记录下来包括键名力度时值长短等是乐谱的一种数字式描述当需要播放时只需从相应的MIDI文件中读出MIDI消息生成所需要的声音波形经放大后由扬声器输出 1 什么是MIDI 2 MIDI设备配置 3 MIDI文件的特点 MIDI设备就是处理MIDI信息所需的硬件设备其基本组成包括 2 MIDI设备配置 1 MIDI端口 2 MIDI键盘 3 音序器 Sequencer 4 合成器 1 MIDI端口一台MID设备可以有一至三个MIDI端口分别称为MIDIIn MIDIOut MIDIThru 它们的作用是 MIDIIn 接收来自其它MIDI设备的MIDI信息 MIDIOut 发送本设备生成的MIDI信息到其它设备 MIDIThru 将从MIDIIn端口传来的信息转发到相连的另一台MIDI设备上 2 MIDI键盘 MIDI键盘是用于MIDI乐曲演奏的 MIDI键盘本身并不发出声音当作曲人员触动键盘上的按键时就发出按键信息所产生的仅仅是MIDI音乐消息从而由音序器录制生成MIDI文件 3 音序器 Sequencer 用于记录编辑生成MIDI的声音文件音序器有以硬件形式提供的目前大多为软件音序器音序器可捕捉MIDI消息将其存入MIDI文件 MIDI文件扩展名为 MID 音序器还可编辑MIDI文件 4 合成器 MIDI文件的播放是通过MIDI合成器合成器解释MIDI文件中的指令符号生成所需要的声音波形经放大后由扬声器输出声音的效果比较丰富 1 MIDI合成方式MIDI合成方式主要有调频合成 FM 和波形表合成 WaveTable 两种方式调频合成方式其原理是根据傅立叶级数而来波形表合成的原理是ROM中已存储着各种实际乐器的声音采样合成时以查表方式调用这些样本将其还原回放 2 硬波形表合成与软波形表合成硬波表合成方式的数字声音样本被保存在ROM内或RAM 可动态更换内而软波表的数字化样本保存于系统主存中合成运算靠CPU完成最终的音频合成靠声卡上的WAVE合成器来完成软波表实际上是针对合成MIDI音乐而开发的一套软件其主要作用是控制高速CPU来完成波表MIDI合成器的部分功能 3 MIDI文件的特点 1 由于MIDI文件只是一系列指令的集合因此它比数字波形文件小得多大大节省了存储空间 2 使用MIDI文件其声音卡上必需含有硬件音序器或者配置有软件音序器 3 MIDI声音适于重现打击乐或一些电子乐器的声音利用MIDI声音方式可用计算机来进行作曲 4 对MIDI的编辑很灵活在音序器的帮助下用户可自由地改变音调音色以及乐曲速度等以达到需要的效果 2 4语音识别技术 2 4 1语音识别的发展史 2 4 2语音识别的基本原理 2 4 3语音识别系统的分类 2 4 4语音识别软件 2 4 1语音识别的发展史 1 20世纪50年代 1952 Bell K H David 识别10个数字1952 J W Rorgie 英文元音和孤立字2 20世纪60年代提出DP LP技术 3 20世纪70年代末80年代初 LP DTW成熟提出VQ HMM理论实现了基于线性预测倒谱和DTW技术的特定人孤立词小词汇量与语音识别系统 4 20世纪80年代 HMM ANN 卡内基梅隆大学运用VQ HMM的非特定人大词汇量连续语音识别系统 5 20世纪90年代 IBM ViaVoice AT T NTT 2 4 2语音识别的基本原理 2 4 3语音识别系统的分类 1 按识别的词汇量小词汇量中等词汇量大词汇量 2 从说话者与识别系统的相关性特定人非特定人限定人 3 从说话的方式孤立词连接词语连续语音 2 5音频数据处理 2 6 2音频编辑软件CoolEdit2000简介 2 6 3音频编辑软件CoolEditPro简介 2 6 1准备音频数据 2 6 1准备音频数据 1 音频的获取途径 2 音频的存储格式 3 音频数据的编辑 1 音频的获取途径音频数据的获取方法主要有以下几种 1 使用声卡录制采集声音信息并以文件的形式存储在计算机中 2 使用声卡及MIDI设备在计算机上创作乐曲 3 从互联网下载或购买音频光盘 2 音频的存储格式在多媒体音频技术中存储声音信息的文件格式有多种如WAV MIDI MP3 RM及CD唱盘数字音频 1 WAV格式 2 MIDI格式 3 CD DA格式 4 MP3格式MP3采用MPEGLayer3标准对WAVE音频文件进行压缩而成以达到CD唱盘的音质 5 RM格式RM采用音频视频流和同步回放技术来实现在互联网上提供优质的多媒体信息 3 音频数据的编辑音频数据的编辑包括声音的剪辑删除片段插入声音混入声音特殊效果的添加等操作除了Window自带的录音机程序可进行音频的制作编辑外目前广泛使用的音频处理软件还有SoundForge WaveEdit CoolEdit等 2 6 2音频编辑软件CoolEdit2000简介 1 CoolEdit2000的功能 2 CoolEdit2000应用程序界面 3 音频的录制 4 音频的基本编辑 5 音频特殊效果编辑 1 CoolEdit2000的功能使用CoolEdit2000可以录制音频文件轻松地在音频文件中进行剪切粘贴合并重叠声音操作提供有多种特效如放大降低噪音压缩扩展回声延迟失真调整音调等使用它可以生成噪音低音静音电话信号等声音其他功能有自动静音检测和删除自动节拍查找等另外它还可以在多种文件格式之间进行转换 2 CoolEdit2000应用程序界面 CoolEdit2000应用程序界面主要由标题栏菜单栏工具条状态栏编辑区等组成 3 音频的录制安装好声卡将麦克风与声卡的MICIN连接或将线性输入设备如录音机 CD唱机等输出端与声卡的LINEIN接口正确连接然后运行CoolEdit2000程序执行File New命令弹出对话框在对话框中选择采样频率量化位数声道数后单击确定然后单击功能键中的录音按钮开始录音录制完毕单击停止按钮停止录音最后执行File Save命令保存声音文件 4 音频的基本编辑在CoolEdit2000中不管进行什么操作都要首先选择需要处理的区域如果不选 CoolEdit2000则认为要对整个音频文件进行操作 1 删除选好要操作的选区执行Edit DeleteSelection命令或直接按DEL键就可删除当前被选择的音频片段这时后面的波形自动前移 2 剪切执行Edit Cut命令将当前被选择的片段从音频中移去并放置到内部剪贴板上 3 拷贝执行Edit Copy命令将拷贝选区到内部剪贴板上 4 粘贴执行Edit Pastet命令将内部剪贴板上

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第二章-多媒体音频技术(1)分解.ppt

文档简介

温馨提示

最新文档

评论

第二章-多媒体音频技术(1)分解.ppt

文档简介

温馨提示

最新文档

评论

相关文档