多媒体第三讲音频信息的获取与处理课件_第1页
多媒体第三讲音频信息的获取与处理课件_第2页
多媒体第三讲音频信息的获取与处理课件_第3页
多媒体第三讲音频信息的获取与处理课件_第4页
多媒体第三讲音频信息的获取与处理课件_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三讲 音频信息的获取与处理主要内容2.1 音频技术的主要组成部分2.2 声音卡的功能和分类2.3 声音卡的组成2.4 声音卡的选择及应用2.5 数字音频的文件格式2.6 声音文件工具 2.1 音频技术的主要组成部分 1. 音频信息获取技术的工作原理和主要组成部分如下:音频的信号源是拾音器,如麦克风具有可编程增益控制的音频放大器:立体声分左右两个通道,分别编程控制音频放大器的放大倍数低通滤波器:滤澡声,防止采样混叠采样和A/D变换器:将连续的模拟语音信号离散数字化存储器:存放数字或语音信息)D/A变换器:将处理好的数字式语音信号转换成模拟信号滤波器:改善输出语音信号的质量功率放大和增益控制:可

2、编程的音量控制器,分左右两路输出到音响设备2.1 音频技术的主要组成部分2. 多媒体涉及到的音频处理技术:(1)音频采集:把模拟音频信号转换成数字化音频信 号,然后存储到存储设备中。(2)文语转换:经过语言学处理、语音学处理,把计算 机内的文本转换成声音输出。(3)声音编码/解码:对语音信息进行压缩编码和解压缩 还原。(4)语音识别:电脑辨别和理解人说的话。(5)音乐合成:利用音乐合成芯片,把乐谱转换成乐曲 输出。还有音频数据传输、音频视频同步、音频效果与编辑等2.2 声音卡的功能和分类声音卡的分类 声音卡的分类主要是根据其数据采样量化的位数来确定,通常分为8位、16位和32位,位数越多,其量

3、化精度越高,音质就越好。 声音卡通常带有自己的CPU,具有较高的智能性和灵活性,支持DOS环境和Windows环境下的应用开发。 数字音频部分具有的基本功能有44 .1kHz的采样率,8位以上的分辨率,录音和播放声音信号,同时具有压缩采样信号的能力。最常用的压缩方法是自适应脉冲编码调制。2.2 声音卡的功能和分类2. 声音卡的主要功能(1)录制、编辑和回放数字声音文件(2)控制、混合各声源的音量(3)在记录和回放数字文件时压缩和解压缩(4)采用语音合成技术让电脑朗读文本(5)具有MIDI(Music Instrument Data Interface,即 乐器数字化接口)接口:MIDI是一种用

4、于电子乐器 和计算机之间的通信标准,通过软件,计算机可以 直接对外部电子乐器进行控制和操作。(6)文语转换和语音识别1. 插孔和D形连接器线路输入(Line In)插孔:麦克风(MIC)输入插孔:线路输出插孔:“Line Out”、“Audio Out”、 “Speaker”D形连接器:15芯的D形接口,可以用来连接游戏操纵杆、游戏机入口或MIDI合成器。2. CD-ROM接口及音频信号连接口:通常为4芯插座,有左、右声道以及两根地线。2.3 声音卡的组成3. 音量调节旋钮4. 跳接器 其功能是用来选择声音卡的硬件设备,包括CD-ROM型号、CD-ROM的I/O地址、声音卡的I/O地址的选择。

5、声音卡上游戏口的选择(开或关)以及声频卡的IRQ(中断请求号)和DMA(Directly Memory Access,即直接存储访问)通道的设置不能与系统上其他设备的设置相冲突,否则声音卡甚至整个计算机系统将不能正常工作。5. 声音卡的驱动程序2.3 声音卡的组成 首先应明确准备用声音卡完成什么功能,然后仔细阅读产品说明书所承诺的功能,查看声音卡的技术指标和功能是否符合需求,并按照以下标准来进行衡量。如果允许的话,最好在购买时试听一下声音的效果。模/数转换与数/模转换(1)模/数转换(ADC):将输入的模拟音频信号转换成数值,数字化后的音频信号是数值,是离散的数据,并非像音频卡信号一样为连续的

6、波形。数字化音频信号涉及的两个基本技术指标是: a. 采样频率:单位时间内的采样次数。目前一般采用44.1kHz和48kHz。 b. 采样值的编码位数:采样值使用的二进制编码位数 2.4 声音卡的选择及应用 声音卡涉及三个指标:采样频率(应支持11.025kHz、22.05kHz和44.1kHz三种频率)、采样数据位数(有8位、16位和32位等)以及声道数(单声道与双声道等)(2)数模转换(DAC):完成将数字化的声音数据转换成模拟音频信号输出,它是模数转换的逆过程。其主要指标与模数转换相同。2. 内部声音混合调节器( Internal Mixer) 主要功能是把不同输入源如(LINE IN,

7、MIC及CD-Audio)中输入的声音信号进行混合和音量调节。3. 合成器:合成方法有波表(Wave Table)查询和频率调制(FM),前者效果好但价格高。2.4 声音卡的选择及应用4. MIDI接口 选购声音卡时,首先看有无MIDI合成器,若有还要看MIDI输出采用何种合成方法,是FM合成,还是波表合成5. DSP(Data Signal Processor数字信号处理器)芯片 其功能是用来处理声音合成、特殊效果和音频文件的压缩与解压缩。6. 信噪比(SNR)和THD(总谐波失真)7. I/O设备的支持8. 兼容性9. ASP(高级数字信号处理器)功能10. 即插即用、三维音效、系统参数的

8、可调性等2.4 声音卡的选择及应用 在多媒体技术中,存储声音信息的文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SND文件及RMI文件等。WAV文件 WAV是Microsoft公司的音频文件格式。来源于对声音模拟波形的采样,故它所需要的存储容量都很大,其大小可用以下公式表示: Wav文件的字节数/秒= 采样频率(Hz)X 量化位数(位)X 声道数/82.5 数字音频的文件格式2. VOC文件 VOC文件是Creative公司波形音频文件格式,也是声霸卡使用的音频文件格式。每个VOC文件由文件头块(header block)和音频数据块(data block)组成。3. MIDI文件 MIDI文件中包含音符、定时和多达16个通道的乐器定义,每个音符包括键、通道号、持续时间、音量和力度等信息。所以MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。4. AIF文件:Apple机上声音文件存储格式2.5 数字音频的文件格式2.6 声音文件工具Windows 操作系统自带的“Sound Recorder”买声音卡

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论