第四章计算机基础_第1页
第四章计算机基础_第2页
第四章计算机基础_第3页
第四章计算机基础_第4页
第四章计算机基础_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第4 4章章 多媒体技术基础多媒体技术基础n主要内容:主要内容:l4.1 4.1 多媒体的概念多媒体的概念l4.2 4.2 光盘存储系统光盘存储系统l4.3 4.3 多媒体音频信号处理多媒体音频信号处理l4.4 4.4 多媒体图像信息处理多媒体图像信息处理l4.5 4.5 计算机图形处理技术简介计算机图形处理技术简介l4.6 4.6 多媒体视频信息处理多媒体视频信息处理n本章小结本章小结n思考与练习思考与练习n一、思考与练习l1.什么是媒体?媒体是如何分类的?l2.什么是多媒体?多媒体技术有哪些关键特性?l3.一个完整的多媒体计算机系统包括哪几个层次的结构?l4.相对于其他存储介质而言,光盘

2、存储具有哪些特点?l5.常见的光盘标准是如何划分的?可分为哪些类型?l6.DVD与蓝光DVD能够实现大容量存储的原因是什么?l7.简述光盘系统记录与读取信息的原理。l8.可刻录光盘(CDR)是如何写入与存储信息的?l9.什么是音频信号?决定音频信号波形的参数有哪些?l10.常见的数字音频文件有哪些?l11.计算机语音信号处理技术已经介入到日常生活中,请列举几例应用说明它的用途。l12.什么是计算机图像处理?l13.图像的数字化过程的基本步骤是什么?思考与练习l14.图像的采样与分辨率的关系是什么?l15.什么图像量化?量化级数与量化字长有什么关系?l16.常见的数字图像文件有哪些?l17.什么

3、是RGB彩色模型?它与CMYK彩色模型在表示和应用方面有什么不同?l18.图像信息为什么能压缩?常见的数据压缩方法有哪些?l19.什么是行程编码?它适合对哪些类型的图像进行压缩?l20.什么是计算机图形处理?它主要应用于哪些领域?l21.计算机图形处理包括的内容有哪些?l22.图形与图像处理技术的区别与联系有哪些?l23.矢量图和位图的主要特点是什么?l24.什么是视频?简述视频图像的数字化过程。l25.数字化视频的优点有哪些?l26.常用的电视信号制式有哪几种?我国电视信号使用的是什么制式?l27.数字电视系统由哪几部分组成?l28.电视机的机顶盒的作用是什么?思考与练习n二、计算题l1.根

4、据Nyquist理论,若原有声音信号的频率为20 kHz,则采样频率应为多少?l2.若一个数字化声音的量化位数为16,则能够表示的声音幅度等级是多少?l3.用44.1 kHz的采样频率进行采样,量化位数选用8位,则录制2分钟的立体声节目,其波形文件所需的存储量是多少?l4.在CD播放机中,假设音乐信号是均匀分布的,采样速率为44.1 kHz,采用16比特的量化编码,试确定存储50分钟时间段的音乐所需要的存储容量。l5.一帧640480分辨率的彩色图像,图像深度为24位,不经压缩,则一幅画面需要多少字节的存储空间?按每秒播放30帧计算,播放一分钟需要多大存储空间?一张容量为650 MB的光盘,在

5、数据不压缩的情况下,能够播放多长时间?思考与练习l.有一张图片,以W表示白色,B表示黑色:lWWWWWWWWWWWWBWWWWWWWWWWWWBBBl试写出游程编码,并计算压缩率。l7.为了使电视图像获得良好的清晰度和规定的对比度,需要用5105个像素和10个不同的亮度电平,并设每秒要传送30帧图像,所有的像素是独立的,且所有亮度电平等概出现。求此图像所携带的信息熵。l8.现有一幅已离散量化后的图像,图像的灰度量化分成8级,如图所示。图中数字为相应像素上的灰度级。现有一个无噪声信道,单位时间(秒)内传输100个二元符号。l要将图像通过给定的信道传输,不考虑图像的任何统计持性,并采用二元等长码,

6、问需多长时间才能传送完这幅图像?(见下页图)n三、练习与实践l1.用你的数码相机和数码摄像机等设备拍摄一些校园风景,并在计算机上浏览播放,记录图像或视频文件的格式及其容量。思考与练习l2.用Windows的录音软件录制一段0秒的声音并保存,观察其文件格式和容量。l3.MIDI音乐格式已非常流行,尝试用Cakewalk软件制作一个MIDI作品,或从网络上下载一个MIDI文件,感受一下MIDI音乐与真实音乐的不同之处。思考与练习n4.1.1 媒体的分类l在计算机领域中媒体有两种含义:u一种是指用以存储信息的实体(媒质);另一种是指信息的载体。多媒体计算机技术中的媒体是指后者。l媒体可分为以下五种,

7、如图4-1所示。u(1)感觉媒体(perception)u(2)表示媒体(presentation)u(3)显示媒体(display)u(4)存储媒体(storage)u(5)传输媒体(transmission)4.1 4.1 多媒体的概念多媒体的概念4.1 4.1 多媒体的概念多媒体的概念图4-1 国际标准将媒体分为五种类型u各种媒体之间的关系如图4-2所示。4.1 4.1 多媒体的概念多媒体的概念图4-2 各种媒体之间的关系n4.1.2 多媒体与多媒体技术l1.多媒体的定义u通常所指的多媒体就是各种感觉媒体的组合,也就是声音、图像、图形、动画、文字、数据 、文件等各种媒体的组合。u定义1:

8、所谓多媒体技术就是计算机交互式综合处理多种媒体信息文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。u定义2:所谓多媒体就是在数值、文字、图形等由计算机处理的信息中,使静止图像、语音、影像等时间序列信息相互关联,同步处理的技术。4.1 4.1 多媒体的概念多媒体的概念l2.多媒体技术u多媒体技术是指利用计算机综合处理多种媒体信息的技术。l3.多媒体技术的主要特性u信息媒体的多样性、多种技术的集成性和处理过程的交互性。l4.多媒体的关键技术u大容量数据存储技术、多媒体数据压缩编码与解码技术、虚拟现实技术、多媒体数据库技术、智能多媒体技术、多媒体信息检索。4.1 4.1

9、多媒体的概念多媒体的概念n4.1.3 多媒体计算机系统l1.多媒体计算机系统的层次结构4.1 4.1 多媒体的概念多媒体的概念图4-3 多媒体计算机系统的组成l2.多媒体计算机的硬件系统u多媒体计算机硬件系统由多媒体计算机主机、多媒体接口卡、多媒体外部设备、光盘存储器、网络接口卡等组成。一个常见的多媒体硬件系统如图4-4所示。4.1 4.1 多媒体的概念多媒体的概念图4-4 多媒体计算机硬件系统n4.2.1 光盘及其特点l光盘存储系统由光盘和光盘驱动器组成。l光盘存储系统具有一切存储介质的优点,如大容量、耐用、易保存、标准化等。lCD意为高密盘,称之为光盘,因为它是通过光学方式来记录和读取二进

10、制信息的。4.2 光盘存储系统n4.2.2 光盘的标准与类型l由于光盘能存储不同类型的数据,包括音频和视频数据、计算机程序等,而这些数据的组织方式各有不同,由此制定了一些国际标准,以适应多媒体的各种应用。4.2 光盘存储系统l按光盘的读写性能来讲,可分为三种类型:u1.只读型光盘存储器只读光盘中的数据是用压模或化学刻写方法制成的,用户只能读取上面的数据,而不能写入或修改光盘中的数据。 u2.一次可写光盘存储器一次性可写光盘的每一个记忆单元只可以写入一次,不可抹去。u3.多次可擦写光盘存储器多次可擦写光盘具有磁盘一样的可擦写性,允许用户存储、移动、修改光盘上的数据,适合作为计算机的新型标准外存设

11、备。4.2 光盘存储系统n4.2.3 光盘系统记录与读取信息的原理l光盘系统是由光盘驱动器和光盘盘片组成。l光盘的读取信息的过程是基于物理学的“光反射”原理,以图4-5所示的CD-ROM光盘读取过程为例。l光盘是一种多层材料组成的圆盘结构。以CD-ROM为例,其物理结构如图4-6所示。4.2 光盘存储系统4.2 光盘存储系统图4-5 光盘数据读取原理 图4-6 CD-ROM的剖面结构lCD-ROM只读光盘是利用在盘上压制凹坑的机械办法,利用凹坑(Pit) 和平面(Land)部分来记录“0” 和“1”。lCD-R光盘增加了一层有机染料作为记录层。lCD-RW记录原理为在光盘的记录层镀上一层结晶层

12、,这个结晶层的特色是能呈现出结晶与非结晶的状态,借助于激光的照射,可在这两种状态之间互换,而这两种状态也对光的反射不同,产生的0与1的信号,经过解码器分析后,获得所需的数据。4.2 光盘存储系统n4.3.1 音频信号的形式l音频(Audio)信号可分为两类:语音信号和非语音信号。l根据物理学原理,声音是一种在时间和幅度上都是连续的波形,是一种模拟信号。模拟音频信号有两个重要参数:频率和幅度。l人们在日常说话时的语音信号频率范围在300Hz3000 Hz之间。频率范围为20Hz20 kHz的信号称为音频(audio)。l信号的幅度是从信号的基线到当前波峰的距离。l周期是指信号在两个峰点或谷底之间

13、的相对时间。周期和频率之间的关系是互为倒数。(如图4-7所示)4.3 多媒体音频信号处理4.3 多媒体音频信号处理图4-7 声音的幅度和周期n4.3.2 音频的数字化过程l模拟音频信号的数字化过程需要三个步骤:采样、量化和编码。l1.声音的采样u声音的采样就是按一定的时间间隔将声音波形在时间轴(即横轴)上进行分割,把时间和幅度上都是连续的模拟信号转化成时间上离散、幅度连续的信号(图4-9a)。u采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示越精确,声音的保真度也越好,但所要求的存储空间也越大。4.3 多媒体音频信号处理l2.量化u我们把对声波

14、波形幅度的数字化表示称之为“量化”,如图4-9b所示。u量化把采样后在幅度轴上连续取值(模拟量)的每一个样本转换为离散值表示。4.3 多媒体音频信号处理图4-9 声音的采样和量化示意图l3.编码u编码就是按照一定的格式把经过采样和量化后得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据。l4.数字化音频文件的存储容量计算u采样频率、量化位数、声道数的值越大,形成的数字音频文件也就越大。数字音频文件的存储量以字节为单位,模拟波形声音被数字化后音频文件的存储量为:u存储量(字节)=采样频率(Hz)量化位数/8声道数时间(秒)4.3 多媒体音频信号处理n4.3.3 数字音频的

15、文件格式l所谓格式,可以理解为数码信息的组织方式。一段模拟音频经过数字化处理后,所产生的数码信息可以用各种编码格式编排,而形成一个个音频格式文件。l1.WAV格式l2.CD-DA格式l3.MPEG音频文件MP3uMPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层,分别对应MP1、MP2和MP3这三种声音文件。4.3 多媒体音频信号处理l4.VOC文件l5.其他格式u除了上面介绍之外,还有WMA(Windows Media Audio)格式(*.wma);为解决网络传输带宽资源而设计的,被认为是网络灵魂的文件格式Real audio(*.RA/*.RM)和苹果公司开

16、发的,被Macintosh平台和应用程序所支持的文件格式AIFF(*.AIF/*.AIFF)等。u以上介绍的都是数字音频格式,很多人熟悉的MIDI格式并不在其中。n4.3.4 语音信号处理技术l语音信号处理的应用极为广泛,其中的主要技术包括语音编码、语音合成、语音识别和语音增强等。4.3 多媒体音频信号处理l语音识别技术(Automatic Speech Recognition)是指将人说话的语音信号转换为可被计算机识别的文字信息,从而识别说话人的语音指令以及文字内容的技术。l语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算,语言模型主要

17、采用概率统计的方法来揭示语言单位内在的统计规律。l语音合成技术(Text to Speech)是指将文字信息转变为语音数据,以语音的方式播放出来的技术。4.3 多媒体音频信号处理n4.4.1 计算机图像处理的概念l现代图像既包括可见图像(VisibleIimage,可见光范围的图像),也包括不可见光范围内借助于适当转换装置转换成人眼可见的图像(如红外成像技术),还包括视觉无法观察的其他物理图像和空间物体图像,以及由数学函数和离散数据所描述的连续或离散图像。l计算机图像处理研究的主要内容是如何对一幅连续图像取样、量化以产生数字图像,如何对数字图像做各种变换以方便处理,如何滤去图像中的无用噪声,如

18、何压缩图像数据以便存储和传输、图像边缘提取、特征增强和提取、计算机视觉和模式识别等。4.4 多媒体图像信息处理4.4 多媒体图像信息处理n4.4.2 颜色模型l1.RGB模型u基色是指互为独立的单色,任一基色都不能由其他两种基色混合产生。u自然界常见的各种颜色,都可以由红(Red)、绿(Gre-en)、蓝(Blue)三种颜色光按不同比例相配而成。l2.CMYK颜色模型uCMY模型(Cyan、Magenta、Yellow)是采用青、粉红、黄色三种基本颜色按一定比例合成颜色的方法。u虽然理论上利用CMY三原色混合可以制作出所需要的各种色彩,但实际上同量的CMY混合后并不能产生完善的黑色或灰色。4.

19、4 多媒体图像信息处理n4.4.3 图像的数字化过程l1.图像的采样u数字化图像的形成是计算机使用相应的软硬件技术把许多像素点的特征数据组织成行列,整齐地排列在一个矩形区域内,形成计算机可以识别的图像。u图像采样就是将二维空间上连续的图像用许多等距的水平线与竖直线分割成网状的过程(如图4-12所示)。u被分割的图像若水平方向有M个间隔,垂直方向上有N个间隔,则一幅图像画面就被表示成MN个离散像素点构成的集合,MN表示图像的分辨率。u可以将连续变化的二维图像用f(x,y)函数离散值的形式表示出来。4.4 多媒体图像信息处理u在进行采样时,采样点的间隔的选取是一个重要的问题。它决定了采样后的图像是

20、否能真实地反映原图像的程度。u图4-13给出在不同采样频率下获得不同的图像效果。图4-12 采样是对图像在水平方向和垂直方向上分割成网状结构4.4 多媒体图像信息处理图4-13 不同采样频率获得不同的图像效果 l2.图像的量化u图像量化实际就是将图像采样后的样本值的范围分为有限多个段,把落入某段中的所有样本值用同一值表示,是用有限的离散数值量来代替无限的连续模拟量的一种映射操作。u图像可表示的量化级数(颜色数或灰度值)就为2的幂次方,即28、216位、224 种颜色。量化字长越大,所得到的量化级数也就越多,则越能真实地反映原有图像的颜色。u图像文件的大小与图像的分辨率和图像颜色深度有关。u一幅

21、未经压缩的图像文件的存储容量可以按照下面的公式进行估算:图像存储容量(字节)=分辨率颜色深度/84.4 多媒体图像信息处理4.4 多媒体图像信息处理n4.4.4 图像的压缩与编码l1.图像信息为什么能压缩u从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。u连续多帧画面在很大程度上是相似的,而这些相似的信息(或称作冗余信息)为数据的压缩提供了基础。u人的视觉和听觉对某些信号(如颜色,声音)不那么敏感的生理特性,至使信息被压缩之后还不知不觉,也不至对压缩后的信息产生误解。l2.数据压缩与编码分类u(

22、1)数据压缩:分为有损压缩和无损压缩两类u无损压缩算法是为保留原始多媒体对象而设计的。u有损压缩会造成一些信息的损失,关键问题是看这种损失对图像质量带来的影响。u(2)经典压缩编码:通常有预测编码、变换编码和统计编码三种类型u预测编码根据离散信号之间存在着一定的相关性,利用前面的一个或多个信号对下一信号进行预测,然后对实际值和预测值的差进行编码。u变换编码的基本方法是将数字图像分成一定大小的子图像块,用某种变换对子像块进行变换,得到变换域中的系数矩阵,然后选用其中的主要系数进行量化和编码。u统计编码就是根据消息出现概率的分布特性而进行的压缩编码。4.4 多媒体图像信息处理l3.行程编码u行程长

23、度编码,用RLE(Run Length Encoding)表示,具有相同颜色并且是连续的像素数目称为行程长度。uRLE所能获得的压缩比有多大,主要取决于图像本身的特点。uRLE编码方法特别适用于由计算机生成的图像,对于减少图像文件的存储空间非常有效。4.4 多媒体图像信息处理4.4 多媒体图像信息处理n4.4.5 图像文件格式l1.BMPuBMP文件是一种与设备无关的图像文件,它是Windows软件推荐使用的一种格式。l2.JPEGuJPEG是按图像专家联合组制订的压缩标准,JPEG使用一种有损压缩算法,无损压缩算法能在解压后准确再现压缩前的图像,而有损压缩则牺牲了一部分的图像数据来达到较高的

24、压缩率。l3.GIFuGIF是由CompuServe公司为了制定彩色图像传输协议而开发的图像格式文件。l4.PSD格式uPSD是著名的Adobe公司的图像处理软件Photoshop的专用格式。l5.TIFF格式uTIFF称为标记图像文件格式。它是Alaus和Microsoft公司为扫描仪和桌面出版系统研制开发的较为通用的图像文件格式。l6.PNG格式uPNG是一种新兴的网络图像格式。l7.其他格式4.4 多媒体图像信息处理n4.5.1 计算机图形处理的概述l计算机图形处理是指利用由概念或数学描述所表示物体的几何数据或几何模型,用计算机进行显示并存储,并可以进行修改、完善以及有关操作的过程。l图

25、形主要分为两类。一是基于线条信息表示的;二是反映物体表面属性或材质的灰度颜色等非几何要素。l图形处理技术的主要应用领域是计算机辅助设计和制造、计算机教育、计算机艺术、计算机模拟、计算机可视化、计算机动画和虚拟现实。4.5 计算机图形处理技术简介n4.5.2 计算机图形处理包括的内容l如何在计算机中表示图形、以及利用计算机进行图形的建模、计算、处理和显示的相关原理与算法,构成了计算机图形学的主要研究内容。主要有:l几何变换,如平移、旋转、缩放、透视和投影等;l曲线和曲面拟合;l建模或造型;l隐藏线隐藏面消除;l阴暗处理;l纹理产生;l渲染。4.5 计算机图形处理技术简介4.5 计算机图形处理技术

26、简介(a)由Matlab软件生成的三维曲面 (b)3DMAX动画软件中生成的三维模型图4-18 三维图形模型示例n4.5.3 图形与图像处理技术的区别与联系l计算机图形学是指将点、线、面、曲面等实体生成物体的模型,然后模型存放在计算机里,并可修改、合并、改变模型和选择视点来显示模型的一门学科。l计算机图形技术主要应用于CAD、物理实体建模、可视化、虚拟现实,以及计算机动画、游戏等领域。图形学的逆过程是分析和识别输入的图像并从中提取二维或三维的数据模型(特征)。l图像处理技术是采用计算机外部辅助设备(如扫描仪、视频采集装置等)输入的图像像素数据进行处理、压缩、传输的一门计算机技术。4.5 计算机

27、图形处理技术简介l在实际应用中,图形图像技术是相互关联的。把图形处理技术和图像处理技术相结合可以使视觉效果和质量更加完善,更加精美。n4.5.4 矢量图和位图的比较l客观世界中,图可分为两类。一类是可见的图像。另一类是可用数学公式或模型描述的图形。由此对应的图文件有两种,一种是存储图形信息的矢量图(Vector Graphics)文件,另一种是存储图像信息的位图(Bit Graphics)文件。4.5 计算机图形处理技术简介l矢量图主要是把图形元素当作矢量来处理。l矢量图形的特点是精度高、灵活性大,并且用它们设计出来的作品可以任意放大、缩小而不变形失真。l静态图像亦称为位图,它指的是由扫描仪、

28、数码相机等图像采集设备捕捉实际的画面产生的数字图像,是由像素点阵构成的点阵图。4.5 计算机图形处理技术简介4.6 多媒体视频信息处理n4.6.1 视频的定义l视频(video)就其本质而言,实际上就是其内容随时间变化的一组动态图像(25或30帧/秒),所以视频又叫做运动图像或活动图像。l由图4-19可见,视频由一幅幅连续的图像帧序列构成,沿时间轴若一帧图像保持一个时间段t,利用人眼的视觉暂留作用,可形成连续运动图像(即视频)的感觉。l图像与视频是两个既有联系又有区别的概念:静止的图片称为图像(Image),运动的图像称为视频(Video)。 4.6 多媒体视频信息处理l视频与动画都是动态的图

29、像,其主要区别在于帧图像画面的产生方式的不同。图4-19 视频由连续的图像帧序列构成4.6 多媒体视频信息处理n4.6.2 视频的分类l按照处理方式的不同,视频分为:l1.模拟视频(Analog Video)u模拟视频是一种用于传输图像和声音的并且随时间连续变化的电信号。l2.数字视频(Digital Video-DV)u要使计算机能够对视频进行处理,必须把视频源转换成计算机要求的数字视频形式并存放在磁盘上。n4.6.3 电视信号制式l1.NTSC制uNTSC是美国国家电视系统委员会在1953年制定的一种兼容的彩色电视制式,是目前常用的视频标准,在美国、日本和其他国家广为使用。l2.PAL制u

30、PAL是联邦德国1962年制定的一种兼容电视制式。l3.SECAMuSECAM称为顺序传送彩色与存储,是用于法国、俄罗斯及几个东欧国家的彩色电视制式。4.6 多媒体视频信息处理n4.6.4 YUV彩色模型l在PAL彩色电视制式中采用YUV模型来表示彩色图像。其中Y表示亮度,U,V用来表示色差,是构成彩色的两个分量(如图4-20所示)。4.6 多媒体视频信息处理图4-20 PAL彩色电视制式中采用YUV模型来表示彩色图像n4.6.5 视频的数字化过程l视频数字化是将模拟视频信号经模数转换和彩色空间变换转为计算机可处理的数字信号。l在电脑上通过视频采集卡可以接收来自视频输入端的模拟视频信号,对该信

31、号进行采集、量化成数字信号,然后压缩编码成数字视频(图4-21)。l视频数字化操作更多的是对视频进行各种数字化的录制、编辑、处理、格式转换的过程。4.6 多媒体视频信息处理4.6 多媒体视频信息处理图4-21 视频采集卡的作用n4.6.6 数字电视系统l数字电视(Digital Television)系统包括前端系统、传输网络和接收终端,是一个从节目采集、节目制作、节目传输直到用户端都以数字方式处理信号的端到端的系统。l根据信号的空间传播方式,数字电视主要包括四种形式:数字电视地面传输系统、数字有线电视系统、数字卫星电视系统、IP数字电视系统。l国际电联(ITU-T)给出的定义是:“高清晰度电

32、视应是一个透明系统,一个正常视力的观众在距该系统显示屏高度的三倍距离上所看到的图像质量应具有观看原始景物或表演时所得到的印象。” 4.6 多媒体视频信息处理lHDTV采用了全数字信号传输。4.6 多媒体视频信息处理图4-22 不同制式的纵横比屏幕效果比较(电影指环王3截图)(a)NTSC或PAL制式的纵横比为43 (b)HDTV标准规定的纵横比为169n4.6.7 H.264视频编解码标准 lH.264标准的主要目标是:与其他现有的视频编码标准相比,在相同的带宽下提供更加优秀的图像质量。lH.264标准的主要特点如下:u(1)更高的编码效率,同其他视频编码效率相比,能够平均节省大于50%的码率

33、。u(2)高质量的视频画面,H.264能够在低码率情况下提供高质量的视频图像。u(3)提高网络适应能力,H.264可以工作在实时通信应用(如视频会议)低延时模式下,也可以工作在没有延时的视频存储或视频流服务器中。4.6 多媒体视频信息处理lH.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.52倍。4.6 多媒体视频信息处理n4.6.8 常见的视频文件格式l1.本地影像视频l(1) AVI格式uAVI即音频视频交错格式。uAVI格式允许视频和音频交错在一起同步播放,其优点是图像质量好,可以跨多个平台使用,缺点是压

34、缩标准不统一,不具有兼容性。l(2) MOV格式u默认的播放器是Apple公司的QuickTime Player。它具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性。4.6 多媒体视频信息处理l(3) MPEG/MPG/DAT格式uMPEG即动态图像专家组格式,是运动图像压缩算法的国际标准,现已被几乎所有的计算机平台共同支持。uMPEG采用有损压缩方法减少运动图像中的冗余信息,从而达到高压缩比(最高可达2001)的目的,同时图像和音响的质量也非常好,兼容性相当好。l2.网络影像视频l(1)FLVuFLV是FLASH VIDEO的简称,FLV流媒体格式是随着Flash

35、MX的推出发展而来的视频格式。4.6 多媒体视频信息处理u由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点。l(2)WMV格式uWMV也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。l(3)RM格式u对符合RealMedia规范的网络音频/视频资源进行实况转播,并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。4.6 多媒体视频信息处理l(4)3GPu3GP是一种3G流

36、媒体的视频编码格式,主要是为了配合3G网络的高传输速度而开发的。4.6 多媒体视频信息处理n目前,具有多媒体功能的计算机越来越普及,其中最广泛、最基本的是多媒体个人计算机(MPC)。多媒体计算机使得计算机的外部设备日益丰富。通过多媒体计算机,人们可以处理声音、视频图像(静态、动态)等各种媒体信息。n我们现在所说的“多媒体”,常常不是指多种媒体本身,而主要是指处理和应用它的一整套技术。通常多媒体技术是指把文字、音频、视频、图形、图像、动画等多媒体信息通过计算机进行数字化采集、获取、压缩/解压缩、编辑、存储等加工处理,再以单独或合成形式表现出来的一体化技术。本章小结n本章介绍了多媒体技术的基本概念

37、和主要媒体在计算机中的信息表示方式与数字化过程。内容涉及光盘存储技术、音频数字化过程及处理、图像数字化过程及处理、对视频信息获取与处理的基本原理。n无论何种媒体形式,其数字化过程都是一致的,即包括采样、量化和编码三个步骤。模拟量是连续量,而数字量是离散量,因此采样是将在时间上连续的模拟量离散化。量化操作实质上是用有限的离散量在取值空间上取代无限的连续模拟量的映射操作。为减少数字化后的存储容量,一般对多媒体数据都要进行压缩和编码。本章小结n一、思考与练习l1.什么是媒体?媒体是如何分类的?u一种是指用以存储信息的实体(媒质);另一种是指信息的载体。多媒体计算机技术中的媒体是指后者。u媒体可分为以

38、下五种,如图4-1所示。(1)感觉媒体(perception)(2)表示媒体(presentation)(3)显示媒体(display)(4)存储媒体(storage)(5)传输媒体(transmission)l2.什么是多媒体?多媒体技术有哪些关键特性?u各种感觉媒体的组合,也就是声音、图像、图形、动画、文字、数据 、文件等各种媒体的组合。u所谓多媒体就是在数值、文字、图形等由计算机处理的信息中,使静止图像、语音、影像等时间序列信息相互关联,同步处理的技术。思考与练习n一、思考与练习l2.什么是多媒体?多媒体技术有哪些关键特性?u多媒体技术就是计算机交互式综合处理多种媒体信息文本、图形、图像

39、和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。信息媒体的多样性、多种技术的集成性和处理过程的交互性。u大容量数据存储技术、多媒体数据压缩编码与解码技术、虚拟现实技术、多媒体数据库技术、智能多媒体技术、多媒体信息检索。l3.一个完整的多媒体计算机系统包括哪几个层次的结构?u硬件系统u软件系统uAPI(接口)u创作工具软件u多媒体应用系统思考与练习n一、思考与练习l4.相对于其他存储介质而言,光盘存储具有哪些特点?u如大容量、耐用、易保存、标准化等。l5.常见的光盘标准是如何划分的?可分为哪些类型?u国际标准 CD-DA标准 CD-ROM标准 Video-CD标准 DVD标准u1.只

40、读型光盘存储器只读光盘中的数据是用压模或化学刻写方法制成的,用户只能读取上面的数据,而不能写入或修改光盘中的数据。 u2.一次可写光盘存储器一次性可写光盘的每一个记忆单元只可以写入一次,不可抹去。u3.多次可擦写光盘存储器多次可擦写光盘具有磁盘一样的可擦写性,允许用户存储、移动、修改光盘上的数据,适合作为计算机的新型标准外存设备。思考与练习n一、思考与练习l6.DVD与蓝光DVD能够实现大容量存储的原因是什么?u通过激光束来读取。随着轨道密度的增加及使用的激光束波长越来越短,光盘的存储容量呈倍数增长。以前的CD光盘及VCD光盘只能进行单面数据存储,而如今的DVD光盘不仅可以进行单面存储,而且可

41、以进行双层储存,最高版本的达到双面双层,共四层储存空间。一张普通单面DVD光盘的存储量为1.7GB,大约是一张普通VCD容量(640MB)的7倍,而四层DVD可以将存储空间扩大到8.5GB。u Blu-ray的命名是来自于其采用的激光波长405纳米(nm),刚好是光谱之中的蓝光,因而得名。(DVD采用650nm波长的红光读写器,CD则是采用780nm波长)l7.简述光盘系统记录与读取信息的原理。u光盘存储技术是利用激光在介质上写入并读出信息。这种存储介质最早是非磁性的,以后发展为磁性介质。在光盘上写入的信息不能抹掉,是不可逆的存储介质。用磁性介质进行光存储记录时,可以抹去原来写入的信息,并能够

42、写入新的信息,可擦可写反复使用。u工作时,将主机送来的数据经编码后送入光调制器,调制激光源输出光束的强弱,用以表示数据1和0;再将调制后的激光束通过光路写入系统到物镜聚焦,使光束成为1大小的光点射到记录介质上,用凹坑代表1,无坑代表0。读取信息时,激光束的功率为写入时功率的1/10即可。读光束为未调制的连续波,经光路系统后,也在记录介质上聚焦成小光点。无凹处,入射光大部分返回;在凹处,由于坑深使得反射光与入射光抵消而不返回。这样,根据光束反射能力的差异将记录在介质上的“1”和“0”信息读出。思考与练习多种DVD技术规格nCD-ROM能存放650兆比特数据,也就是0.64千兆字节或6.8亿字节.

43、 在下面的列表里,SS/DS 表示单面/双面, SL/DL/ML 表示单层/双层/混合层 (混合层是指盘片一个面有一层,另一个面有两个层), gig 就是千兆(230), BB表示十亿字节 (109). 参阅giga 和 billion 7.2.DVD不同于CD,DVD是可以有多个层面的。DVD-5是指单面单层的DVD,也是最常见的DVD。它的容量大约是4.7GB,接近于5GB,所以就叫做DVD-5。DVD-9是指单面双层DVD,是指在一面DVD中包含两个信息层,两层的容量合计约8.5GB。DVD-9的好处就是可以用一张碟片存储一部120分钟的高质量电影,而不需要中途手动换碟。不过,有些早期的

44、DVD播放器和光驱并不支持DVD-9。DVD-10是一种双面DVD,一般称其为双面单层,说得通俗一点,就是将两片DVD-5背对背的粘在一起,实现了最大9.4GB的容量。不过DVD-10的缺点就是需要手动换面,目前还没有任何一种播放器支持自动换面。DVD-18是双面双层碟片的简称,如同DVD-10是两片DVD-5制成的一样,DVD-18就是两片DVD-9制成,最高容量17GB左右,是目前最大的DVD光盘,市面上极为少见。n一、思考与练习l8.可刻录光盘(CDR)是如何写入与存储信息的?uCD-R光盘增加了一层有机染料作为记录层。染料溶解腐蚀刻录uCD-RW记录原理为在光盘的记录层镀上一层结晶层,

45、这个结晶层的特色是能呈现出结晶与非结晶的状态,借助于激光的照射,可在这两种状态之间互换,而这两种状态也对光的反射不同,产生的0与1的信号,经过解码器分析后,获得所需的数据。l9.什么是音频信号?决定音频信号波形的参数有哪些?u根据物理学原理,声音是一种在时间和幅度上都是连续的波形,是一种模拟信号。模拟音频信号有两个重要参数:频率和幅度。l10.常见的数字音频文件有哪些?u1.WAV格式u2.CD-DA格式u3.MPEG音频文件MP3 MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层,分别对应MP1、MP2和MP3这三种声音文件。u4.VOC文件u5.其他格式:思

46、考与练习n一、思考与练习l11.计算机语音信号处理技术已经介入到日常生活中,请列举几例应用说明它的用途。u语音合成:将文本转换成连续可懂的自然语句输出u语音编码:保证语音质量下尽可能降低编码的比特率u语音识别:人和机器进行自然语言通信(识别内容,说话人的鉴别和确定,语种的鉴别和确认,关键词检测和确认等等)u语音增强:背景噪声的抑制,根据信号消除原理达到消除杂音和提高通话质量的效果,降低噪音能量l12.什么是计算机图像处理?u计算机图象处理研究如何对一幅连续图象取样、量化以产生数字图象,如何对数字图象做各种变换,如何数字图象中的噪声,如何压缩图数据,如何边缘处理、特征增强,及计算机视觉和模式识别

47、等u包括6个方面:a)图像的数字化 b)图像变换 c)图像编码压缩 d)图像增强和重构 e)图像分割 f)图像识别。思考与练习思考与练习n13.图像的数字化过程的基本步骤是什么?u图像的数字化处理过程分为采样、量化和编码三个步骤n14.图像的采样与分辨率的关系是什么?n答:图像在空间上的离散化称为图像的采样。也就是用空间上部分点的灰度值代表图像,这些点称为采样点。在进行采样时,采样点间隔的选取是一个非常重要的问题,,它决定了采样后图像的质量,即忠实于原图像的程度。采样间隔的大小选取要依据原图像中包含的细微浓淡变化来决定。图像分辨率是指每英寸图像含有多少个点或像素,分辨率的单位为dpi。例如,2

48、50 dpi表示的就是该图像每英寸含有250个点或像素。在数字图像中,分辨率的大小直接影响到图像的质量。一般而言,分辨率越高,图像细节越清晰,图像中细节越多,采样间隔应越小。对一幅图像,当量化级数一定时,采样点数MN对图像质量有着显著的影响。即:采样点数越多,图像质量越好;当采样点数减少时,图上的块状效应就逐渐明显,图像质量就越差。奈奎斯特(Nyquist)定理在图像采样时仍然适用,即:图像的采样频率2倍的源图像最高频率分量。l15.什么图像量化?量化级数与量化字长有什么关系?u图像量化指的是幅度上的离散化处理。量化位数越高,量化等级也越高。其关系是量化等级=2的量化位数次方。l16.常见的数

49、字图像文件有哪些?u1.BMP文件是一种与设备无关的图像文件,它是Windows软件推荐使用的一种格式。u2.JPEG是按图像专家联合组制订的压缩标准,JPEG使用一种有损压缩算法,无损压缩算法能在解压后准确再现压缩前的图像,而有损压缩则牺牲了一部分的图像数据来达到较高的压缩率。u3.GIF是由CompuServe公司为了制定彩色图像传输协议而开发的图像格式文件。u4.PSD格式是著名的Adobe公司的图像处理软件Photoshop的专用格式。u5.TIFF格式称为标记图像文件格式。它是Alaus和Microsoft公司为扫描仪和桌面出版系统研制开发的较为通用的图像文件格式。u6.PNG格式是

50、一种新兴的网络图像格式。u7.其他格式思考与练习l17.什么是RGB彩色模型?它与CMYK彩色模型在表示和应用方面有什么不同?nRGB指的是红绿蓝三种基本色,CRT使用3个电子枪分别产生三个电子束,以不同的轰击CRT的荧光涂层,来产生彩色。(目前已经改为单个电子枪发射3个光束来实现)n在笛卡尔坐标系里,CMY色彩模型用一个三维的立方体来表示,与RGB色彩模型不同的是,CMY的坐标原点代表黑色(0,0,0),坐标顶点代表白色(1,1,1),相当于把RGB立方体倒过来。CMY三色分别是青色、品红色、黄色。青(Cyan, 记为C)、品红(Magenta,记为M)、黄(Yellow,记为Y)是打印机等

51、硬拷贝设备使用的标准色彩,它们分别是红(R)、绿(R)、蓝(B)三基色的补色。打印机等硬拷贝设备把C、M、Y颜料通过纸张等介质打印成图片后,我们就能通过反射光来感知图片的颜色。CMY色彩模型是数字色彩常用的色彩模型,它是一种颜料色彩的混合模式,属于减色法混合。这主要是因为1)两种不同的颜色混合生成另一种颜色,且颜色混合的次数越多,得到的颜色就越灰暗、越混浊;(2)C、M、Y等各种颜色等于从白光中减去它们各自的补色。如:青色等于从白光中减去红光。(3)青(C)、品红(M )、黄(Y)三色等量混合生成中性灰色, 当C、M、Y三色达到最高值时,混合的结果生成黑色。思考与练习l18.图像信息为什么能压

52、缩?常见的数据压缩方法有哪些?u从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。u连续多帧画面在很大程度上是相似的,而这些相似的信息(或称作冗余信息)为数据的压缩提供了基础。u人的视觉和听觉对某些信号(如颜色,声音)不那么敏感的生理特性,至使信息被压缩之后还不知不觉,也不至对压缩后的信息产生误解。u(1)数据压缩:分为有损压缩和无损压缩两类u(2)经典压缩编码:通常有预测编码、变换编码和统计编码三种类型 预测编码根据离散信号之间存在着一定的相关性,利用前面的一个或多个信号对下一信号进行预测,然后

53、对实际值和预测值的差进行编码。 变换编码的基本方法是将数字图像分成一定大小的子图像块,用某种变换对子像块进行变换,得到变换域中的系数矩阵,然后选用其中的主要系数进行量化和编码。 统计编码就是根据消息出现概率的分布特性而进行的压缩编码。思考与练习l19.什么是行程编码?它适合对哪些类型的图像进行压缩?u行程长度编码,用RLE(Run Length Encoding)表示,具有相同颜色并且是连续的像素数目称为行程长度。uRLE所能获得的压缩比有多大,主要取决于图像本身的特点。uRLE编码方法特别适用于由计算机生成的图像,对于减少图像文件的存储空间非常有效。l20.什么是计算机图形处理?它主要应用于

54、哪些领域?u计算机图形处理是指利用由概念或数学描述所表示物体的几何数据或几何模型,用计算机进行显示并存储,并可以进行修改、完善以及有关操作的过程。u图形主要分为两类。一是基于线条信息表示的;二是反映物体表面属性或材质的灰度颜色等非几何要素。u图形处理技术的主要应用领域是计算机辅助设计和制造、计算机教育、计算机艺术、计算机模拟、计算机可视化、计算机动画和虚拟现实。思考与练习l21.计算机图形处理包括的内容有哪些?u如何在计算机中表示图形、以及利用计算机进行图形的建模、计算、处理和显示的相关原理与算法,构成了计算机图形学的主要研究内容。主要有:u几何变换,如平移、旋转、缩放、透视和投影等;u曲线和

55、曲面拟合;u建模或造型;u隐藏线隐藏面消除;u阴暗处理;u纹理产生;u渲染。思考与练习l22.图形与图像处理技术的区别与联系有哪些?u计算机图形学是指将点、线、面、曲面等实体生成物体的模型,然后模型存放在计算机里,并可修改、合并、改变模型和选择视点来显示模型的一门学科。u计算机图形技术主要应用于CAD、物理实体建模、可视化、虚拟现实,以及计算机动画、游戏等领域。图形学的逆过程是分析和识别输入的图像并从中提取二维或三维的数据模型(特征)。u图像处理技术是采用计算机外部辅助设备(如扫描仪、视频采集装置等)输入的图像像素数据进行处理、压缩、传输的一门计算机技术。u在实际应用中,图形图像技术是相互关联

56、的。把图形处理技术和图像处理技术相结合可以使视觉效果和质量更加完善,更加精美。思考与练习l23.矢量图和位图的主要特点是什么?u客观世界中,图可分为两类。一类是可见的图像。另一类是可用数学公式或模型描述的图形。由此对应的图文件有两种,一种是存储图形信息的矢量图(Vector Graphics)文件,另一种是存储图像信息的位图(Bit Graphics)文件。u矢量图主要是把图形元素当作矢量来处理。u矢量图形的特点是精度高、灵活性大,并且用它们设计出来的作品可以任意放大、缩小而不变形失真。u静态图像亦称为位图,它指的是由扫描仪、数码相机等图像采集设备捕捉实际的画面产生的数字图像,是由像素点阵构成的点阵图。l24.什么是视频?简述视频图像的数字化过程。u其内容随时间变化的一组动态图像。视频图像的数字化过程分为视频信号的采样和量化2个过程。采样分为色差分量的采样和亮度分量的采样再对上述两个分量进行幅度上的离散化处理。思考与练习l25.数字化视频的优点有哪些?u数字视频克服了模拟视频得局限性,可以大大降低视频的传输和存储费用、增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论