版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 9.3多媒体信息处理技术基础从计算机信息处理角度看,对多媒体信息的处理一般有采样转换、压缩/解压缩、集成、管理和控制以及传输等方面的任务。9.3.1音频信息 1基本概念声波在时间上和幅度上都是连续变化的模拟信号,可用模拟波形表示,单一频率的声波可用一条正弦波表示.声波的振幅表示声音信号的强弱程度。声波的频率反映出声音的音调,声音尖细表示频率高,声音粗低表示频率低。 2、模拟信号的数字化过程:将模拟信号转换为数字信号,称为模拟信号的数字化过程。音频信息数字化,就是将声音模拟信号(语音、音乐等)转化成数字信号,这一过程包括采样、量化和编码。(1)采样(sampling) 每隔一定时间间隔在模拟波
2、上取一个幅度值图912 声音的采样采样频率:每秒钟的采样次数(2)量化将每个采样点得到的幅度值以数字存储称量化 ,量化位数(采样精度)是存放采样点振幅的二进制位数,有8位、16位图9-13采样信号的量化(3)编码将采样和量化后的数字数据以一定格式记录下来就是编码。数字波形文件数据量大,数字音频的编码必须采用高效的数据压缩编码技术。音频信号的压缩编码方式可分为波形编码、参数编码和混合编码三种。3数字音频的技术指标和文件格式(1)数字音频的技术指标数字化音频质量的指标有三项,前两项是前面介绍的采样频率、量化位数,第三项是声道数。 (2)声音质量与数据率根据声音的频带,通常把声音的质量分成5个等级在
3、这5个等级中,使用的采样频率、样本精度、通道数和数据率列于表91所示。质量采样频率(kHz)样本精度(bit/s)单道声/立体声数据率(kB/s)(未压缩)频率范围电话*88单道声82003 400 HzAM11.0258单道声11.02015 000HzFM22.05016立体声88.2507 000HzCD44.116立体声176.42020 000 HzDAT4816立体声192.02020 000 Hz(3)数字音频的文件格式存储音频信息的文件格式主要有三种:WAVE( .wav)格式文件。文件较大,存储简短的声音片段 MIDI(.mid)格式文件。 数字音乐的国际标准MPEG(.mp
4、1/.mp2/.mp3)采用MPEG音频压缩标准进行压缩的音频文件。 9.3.2 图像信息1基本概念(1)图形和图像:矢量图形:存储的是描述生成图形的指令,位图:构成图像的每个像素点的亮度、颜色(2)分辨率经常遇到的分辨率有两种:显示分辨率和图像分辨率(扫描分辨率)。(3)像素深度像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。决定彩色图像每个像素可能有的颜色数或灰度图像的每个像素的灰度级数。 2图像的数字化图像是一种模拟信号,需要转变成为计算机能够接受的数字形式,此过程也需要进行采样、量化及编码。 (1)采样将连续的图像转换成离散点的过程就是采样,其实质是用若干像素点(Pixel)来描述图像,结果就是前面所说的扫描分辨率,分辨率越高,图像越清晰,存储量也越大。如图9-15所示。 (a) 原图像 (b) 采样图像 采样和分辨率示意图(2)量化图像离散化后,将表示图像色彩浓淡的连续变化值离散化为整数值的过程称量化。如黑白图、灰度图、RGB24位真彩色。颜色黑白图 图像的深度为1位,即用一个二进制位表示纯白、纯黑两种颜色,如图9-16所示。灰度图 图像的颜色深度为8位。通过调整黑白两色的程度(称颜色灰度)来有效地显示单色图,如图9-17所示。RGB
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论