《多媒体技术基础与应用》课件第3章_第1页
《多媒体技术基础与应用》课件第3章_第2页
《多媒体技术基础与应用》课件第3章_第3页
《多媒体技术基础与应用》课件第3章_第4页
《多媒体技术基础与应用》课件第3章_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习单元3多媒体数据的压缩

项目3.1数据压缩项目3.2动态数据的压缩与应用多媒体是先进的计算机技术和视频、音频及通讯等技术的综合产物。多媒体计算机涉及的信息包括文字、语音、音乐、静止图像、电视图像、电影、动画、图形等。这些信息经数字化处理后的数据量非常大,如何在计算机中有效地保存、传送和管理这些数据,成为多媒体技术面临的一个最基本的问题,也是最大的难题之一。以彩色电视信号为例,24位的真彩色视频,每秒的数据量约为100MB。1GB容量的CD-ROM光盘只能保存一分钟的原始电视数据,而电影还包括配音等,因此数据量更大。目前,这样大数据量的光盘根本无法用光驱来播放。因此,要把这些视频、音频等信号在有限的空间上存储和传输,必须采取数据压缩技术。可见,数据压缩技术是多媒体计算机发展的关键技术。项目3.1数据压缩

项目实施要求

掌握数据压缩的方法、数据格式及其特点。

项目主要内容

(1)掌握多媒体数据压缩的基本原理和基本方法。

(2)了解多媒体数据的格式及其特点。3.1.1数据压缩的基本知识

1.数据可以压缩的原因

目前,在计算机应用中的媒体,不管是图像还是声音,记录下来的数据中有很多数据是与有用信息无关的,或者说是重复的、多余的,这就是所谓的数据冗余。数据冗余通常有以下表现。

(1)空间冗余。比如,图像中某一区域的颜色相同,即只用一个点的颜色信息就可以代表这一区域的颜色信息。

(2)时间冗余。动画或视频中前后帧画面很相近,记录时只保存前后帧的不同的一小部分数据即可。

(3)编码冗余。比如,在国际统一字符编码中,用两个字节表示一个字符,而实际上绝大多数英文字符都只需一个字节表示就可以。

(4)结构冗余。图像具有一致的结构,如草席、网格等。

(5)知识冗余。某些信息之间有很大的相关性。比如,人脸都有大致形状,表示多张人脸时,只记录它们与基本脸形的不同部分即可。

(6)视觉冗余。人的视觉系统不是对图像中任何变化都能察觉,如人的视觉系统对色差信号的变化不敏感。一般的动画或视频,每秒30帧或24帧即可,有的简单动画还可以更少。

在记录数据时,除去这些冗余,就可以达到压缩数据的目的。数据压缩的核心问题是用最少的时间和空间,实现对多媒体数据的有效传输和保存。

2.数据的量化

图像、声音的特征信息都可由一些模拟信号来表示。把模拟信号转换成计算机可以处理的数字信号的过程,即A/D转换,称为量化过程。量化过程分为采样和量化两个步骤,声波的采样和量化分别如图3-1-1(a)、(b)所示。图3-1-1声波的采样与量化采样的结果确定了使用多少个像素点来表示一幅图像,决定了图像的分辨率。要得到高分辨率,就需对图像更多的点进行采样。

量化就是数字化地记录信号源的信息,有的信息可以完全量化,一般情况只能量化大部分信息。量化的过程(数/模转换的过程)实际上也是数据压缩的编码过程。不同的量化方法,数据压缩的比例也不同。

3.数据压缩的方法

数据压缩处理一般由编码和解码两个过程组成。编码过程是将原始数据经过某种变换编码的压缩过程;解码过程是对编码数据进行解压缩,使之还原成可使用数据的过程,可以认为是编码的反变换。

根据解码后的数据与原数据是否一致,数据压缩方法可分为以下两类:

(1)可逆压缩。这种压缩方法是可以完全恢复的或者说是没有偏差的,解码后的数据与原始数据严格相同,所以可逆压缩也称为无损压缩。可逆压缩方法的优点是能完整地保存原始数据,缺点是压缩比例相对较小,一般数据容量只能减少在50%以内。可逆压缩方法常用于软件的打包和发布,多文件的捆绑以及重要原始数据的完整保存。

目前实现可逆压缩的方法和工具很多,常用的比如WinRAR、WinZip等。

(2)不可逆压缩。这种压缩方法是编码压缩后的数据与原始数据存在一定的误差,但压缩后的数据反映的信息效果是可以接受的。因为压缩过程中存在一定信息量的损失,所以不可逆压缩也称为有损压缩。不可逆压缩方法的优点是压缩比例大,可以几十倍,甚至上千倍地压缩;缺点是数据中的信息有损失,不能恢复为原始数据。不可逆压缩方法一般用于多媒体素材的采集、保存和传播,比如JPEG图像、MP3音乐、MPEG视频、VCD和RM视频等。

4.无损压缩工具WinRAR

WinRAR是一款常用的压缩文件管理工具,具有创建、管理和控制压缩文件的功能。WinRAR能应用于许多不同的操作系统环境,包括Windows、Linux、DOS、OS/2、MacOS等。

1)解压文件

在Windows系统中安装WinRAR软件后,可以打开各种压缩文件包,解压出其中的文件和文件夹并保存到指定的位置,分别如图3-1-2(a)、(b)所示。

当压缩文件在WinRAR中打开时,它的内容会显示出来,然后选择要解压的文件和文件夹。解压期间,出现一个窗口,这个窗口将会显示操作的状况。如果要中断解压,在命令窗口中单击“取消”按钮即可。(a)打开各种压缩文件包(b)解压文件到指定位置图3-1-2解压文件到指定位置

2) WinRAR的压缩功能

选择一个或多个文件与文件夹之后,按鼠标右键,在快捷菜单中选择“添加到压缩文件”命令,在出现的压缩文件名和参数对话框中输入目标压缩文件名或是直接接受默认名,如图3-1-3所示。在压缩文件名和参数对话框中可以选择压缩文件的格式(RAR或ZIP)、压缩方式、压缩分卷大小,字节。在“高级”选项卡中设置密码和其它压缩参数。当准备好创建压缩文件时,单击“确定”按钮进行压缩。图3-1-3压缩文件名和参数对话框创建压缩文件还可以通过WinRAR工具栏中的“向导”功能来逐步完成,操作十分简单。此外,WinRAR能创建自解压的压缩文件,也就是在计算机中没有安装WinRAR也能解压。自解压文件与可执行文件一样都有.exe的扩展名。制作方法很简单,只需在如图3-1-3右下角复选框中选中“创建自解压格式压缩文件”即可。在此对话框中的“高级”选项卡中还可以设置自解压格式压缩文件的“自解压选项”,制作出个性化的自解压安装向导。3.1.2静态图像压缩

1.计算机静态图像的基本知识

计算机图像是一种数字化的图像。所谓数字化图像,就是将图像上每个点的信息按某种规律(模/数转换)编成一系列二进制数码(0和1),即用数字编码来表示图像信息。这种用数码来表示的图像信息可以存储在磁盘、光盘等存储设备里,不失真地进行通信传输,也可以高效地进行计算机分析处理。

计算机是通过数码相机、扫描仪、鼠标和光笔等外部设备来获取图像的,也就是对图像进行数字化,一般数字化图像的表示会用到以下几个概念。

(1)图像尺寸,即图像的大小。图像的大小是指水平方向上与垂直方向上图像所含的像素个数。图像尺寸与屏幕显示分辨率不一样,如图像尺寸为1280 × 960ppi(点阵/幅)的图像在640 × 480dpi的VGA屏幕上显示时,屏幕一次只能显示整个图像的1/4尺寸。

(2)色彩(色调)模型,即图像色彩的方法。常用的色彩模型有:RGB(红、绿、蓝)色彩模型、CMYK(青、洋红、黄、黑)色彩模型、LAB(亮度、两种色彩变化)色彩模型、HSB(色相、饱和度、亮度)色调模型。

RGB模型:根据人眼锥体接收光线的方法来构造的模型,非常适合于标准显示器的工作人员,它用三组独立的值来定义色调、饱和度和亮度。红(Red)、绿(Green)、蓝(BIue)三组颜色光相互叠加可形成众多的丰富色彩。三组颜色中的任意一组颜色均有256个等级的属性定义值,因此三组色叠加可生成16M(256 × 256 × 256)种颜色空间模型(加法颜色空间模型),它能满足视觉彩色世界。

CMYK模型:使用青(Cyan)、洋红(Magenta)、黄(Yellow)、黑(Black)四个色彩信道产生可在一台印刷机上印制的色彩。RGB模型显示的颜色主要是靠色光叠加形成,而印刷或打印图形图像画面是以青、洋红、黄、黑四种颜色(色液或色粉)呈现在介质(纸或其它介质)表面上的,用颜料(矿物或有机物)来吸收或反射色光,颜料本身不发射光线。因此,通过四色的组合和描述可印刷出可见光谱中的大多数颜色,CMYK模型属于减法色彩模型,应用于印刷模式。

LAB模型:由国际照明委员会(CIE)制定的模型,它与设备无关。色调成分的某一值既可描述打印,又可描述显示色调。LAB的颜色光谱囊括RGB和CMYK的颜色光谱。LAB模型由照明发光率(Luminance)和两个颜色轴通道组成。L表示发光率和亮度值;A表示一根从深绿到灰,再到亮粉红颜色轴色相属性与亮度的变化通道;B表示从蓝到黄的颜色轴通道。LAB模型能表达的色彩空间比RGB、CMYK模型所表达的颜色范围大。

HSB模型:是模拟人眼感知色彩的方法的一种模型,它是最符合人的眼睛所看到的色调空间的模型。HSB模型描述色彩比较自然,但在实际应用中需进行转换,如显示时需转换成RGB模型,打印时需转换成CMYK模型。HSB模型采用色相(Hue)、饱和度(Saturation)、亮度(Brightness)来描述一个颜色(像素色),H为光谱中的单色(纯色)等级值,S为颜色纯度等级值,B为颜色明度等级值。

(3)分辨率和像素。像素是计算机系统生成和再现图像的基本单位,像素的色相、亮度、色彩等特征是通过特定的数值来表示的。数字化图像的形成是计算机使用相应的软、硬件技术把许多像素点的特征数据组织成行、列,整齐地排列在一个矩形区域内,形成计算机可以识别的图像。

在计算机中,数字化图像采用分辨率来描述其大小等特征。分辨率与图形、图像的质量有着密切关系,一般有屏幕分辨率、图像分辨率、像素纵横比、扫描分辨率、打印分辨率等几种形式。屏幕分辨率:数字化图像通过计算机显示系统(如显示卡、显示器等)描述时,屏幕呈现出横向与纵向像素点的个数。显示分辨率与显示系统软、硬件的显示模式有关,如标准显示VGA,其屏幕分辨率为640 × 480像素点,即横向640像素,纵向480像素。

图像分辨率:数字化图像的实际尺寸大小,以水平和垂直的像素表示。

像素纵横比:一个像素点的宽和长之比。不同的像素纵横比的硬件传输会导致数字化图像的变形。扫描分辨率:每英寸扫描所得到的点,表示一台扫描仪输入图像的细微程度,单位是dpi。扫描分辩率数值越大,表示被扫描的图像转化成的数字化图像越逼真,意味着扫描仪质量也越好。

打印分辨率:由打印头每英寸输出数目决定,表示一台打印机输出图像的技术指标,单位也是dpi,高清晰度的打印分辨率超过600dpi。

(4)色阶。色阶也称颜色深度,是指图像中可能出现的不同颜色的最大数目。如一个平面的单色图像,像素位数为4,最大灰度数目为16(24)。又如由R、G、B三个平面组成的彩色图像,若三个位平面中的像素位数分别为4位、4位、2位,则最大颜色数目为1024(2010)种颜色,此时该图像的深度为10(4 + 4 + 2)。

(5)图像文件的大小。图像文件的大小是指在存储设备中存储整幅图像所需的字节数。一幅图像数据容量与该图像的宽度(横向像素点数)、高度(纵向像素点数)、颜色深度(最大颜色数)有关。图像文件的字节数可按下面的公式来计算:图像文件的字节数 = 图像分辨率 × 颜色深度/8。例如:一幅640 × 480图像分辨率、24位真彩色的图像未经压缩的字节数为:640 × 480 × 24/8 = 921600B = 900KB(1KB = 1024B)。

2.计算机描述图形与图像的两种方式

1)矢量图形(或称几何图形)

矢量图形简称图形。图形是由一组命令、数字化仪、鼠标、光笔等来描述和绘制的,它表示的方式用点、线、面(如直线、曲线、矩形、圆、椭圆等)以一定的空间关系建立模型,并以一定的数据结构存储在计算机中。若要在计算机的显示器显示出来,就要对各种点、线、面所组成的形状、位置、颜色等各种属性和参数以一定算法转化(数学描绘合成)为图像。一个较为复杂的画面若用图形方式来描述,计算机的描述难度和运算量都比较大,因为计算机矢量图形法是采用三维空间关系的模式来定位二维画面并映射合成的。在计算机上由操作者交互式地进行绘图,或根据模块库中的一组或几组部分进行放大、缩小、复制、删除、移动、旋转、填色等各种编辑处理的图形工具软件,通常称为Draw或Graph。

计算机绘图可分为非交互式计算机绘图和交互式计算机绘图两类。非交互式计算机绘图是指预先编好程序,一次生成全部图形(比如通过VB程序设计来绘图),编写图形显示程序一般比较复杂。从应用方面来看,大都采用交互式计算机绘图,就是用人机交互手段动态地控制和生成图形的内容、形状、大小和颜色的方法和技术,交互式绘图采用光笔、触摸屏、键盘、鼠标、图形输入板等工具完成图形的生成、修改、显示。

2)点阵位图图像(Bitmap)

点阵位图图像简称图像(Image)。图像主要是针对客观世界存在的物体映像,采用数字化方式形成新的数字化图形。图像数字化即将整幅画面划分为矩形微小区域的像素点的采样过程,它可把像素点的亮度或色彩取值空间离散为有限个数值的量化级数,再将采样后的脉冲幅度调制(PAM)信号和量化后的脉冲编码调制(PCM)信号按某种规律编成二进制数码,以数码表示图像信息。用数码相机或扫描仪获取的图像就属于这种描述方法。图像处理技术很多,关键的图像处理技术有图像噪声滤去技术、数据图像压缩技术、图像对比增强技术、图像模糊/清晰复原技术等。另外,有一种技术叫模式识别,主要研究如何分析和识别输入的图像,找到图像内部蕴含的内在联系或对抽象模型加以辨别。模式识别应用面很广,如信封上的邮编邮政分检、医疗诊断的X光照片的分析、工业机器人对产品品种和纹理的识别、PC上应用的汉字识别系统OCR等。计算机图形学和图像处理技术是有区别的,计算机图形学(ComputerGraphics,CG)是数字计算机用点、线、面(曲面)、体生成物体的模型,将模型存放在计算机里,并可修改、合并、改变模型和选择视点加以显示的一门新兴学科。计算机图形学的重点是如何将数据和几何模型转变成图像,应用于工程制图、机械模型、曲线图表统计、桌面印刷排版等。图像处理技术是采用计算机外部辅助设备(如扫描仪、视频采集器等)对输入的像素数据包(图像、画面数字信息库)进行处理、压缩、传输的一门计算机技术,应用非常广,如电视频带压缩、卫星资源照片、气象云海图、医用辅助诊断的CT扫描、交通道路监视、多媒体影像等。在实际应用中,图形、图像技术是相互关联的,很多情况下两者是结合在一起的,比如平面广告设计、封面设计等。图3-1-4所示的太极图中左边的沙滩和右边的海浪都是位图图像,而分割它们的圆和曲线是矢量图图形。图3-1-4太极图

3.常见静态图像存储格式

常见的静态图像文件格式如下:

(1) BMP格式。BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序支持。BMP格式的特点是包含的图像信息较丰富,但占用磁盘空间过大,所以BMP格式在单机上比较流行。

(2) GIF格式。GIF是英文GraphicsInterchangeFormat(图形交换格式)的缩写。GIF格式的特点是压缩比高,磁盘空间占用较少,所以这种图像格式迅速得到了广泛的应用。目前Internet上采用的大量彩色动画文件多为GIF格式的文件,也称为GIF89a格式文件。但GIF格式有个小小的缺点,即不能存储超过256色的图像。

(3) JPEG格式。JPEG格式也是一种常见的图像格式,它由联合照片专家组(JointPhotographicExpertsGroup)开发并被命名为“ISO10918-1”。JPEG文件的扩展名为.jpg或.jpeg,其压缩技术十分先进,它用有损压缩方式去除冗余的图像和彩色数据,取得较高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像质量。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小、下载速度快,使得Web页可以以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。

(4) JPEG2000格式。JPEG2000同样是由JPEG组织负责制定的,它有一个正式名称叫做“ISO15444”,与JPEG相比,它具备更高压缩率以及更多新功能的新一代静态影像压缩技术。JPEG2000能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示,而不像JPEG由上到下慢慢显示。

(5) TIFF格式。TIFF(TagImageFileFormat)是Mac中广泛使用的图像格式,它的特点是图像格式复杂、存储信息多。TIFF格式存储的图像细微层次的信息非常多,图像的质量也得以提高,因而非常有利于原稿的复制。

(6) PSD格式。PSD(PhotoshopDocument)是Adobe公司的图像处理软件Photoshop的专用格式。PSD是Photoshop进行平面设计的一张“草稿图”,它里面包含各种图层、通道、遮罩等多种设计的样稿,以便于下次打开文件时可以修改上一次的设计。在Photoshop所支持的各种图像格式中,PSD的存取速度比其它格式快很多,功能也很强大,所以这种格式也十分流行。

(7) PNG格式。PNG(PortableNetworkGraphics)格式是一种新兴的网络图像格式。PNG格式是目前最不失真的格式,它汲取了GIF格式和JPG格式二者的优点,包括:存储形式丰富,兼有GIF格式和JPG格式的色彩模式;它能把图像文件压缩到极限以利于网络传输,又能保留所有与图像质量有关的信息,因为PNG格式是采用无损压缩方式来减少文件的大小,这一点与牺牲图像质量以换取高压缩率的JPG格式不同;它的显示速度很快,只需下载1/64的图像信息就可以显示出低分辨率的预览图像;PNG格式支持透明图像的制作,透明图像在制作网页图像的时候很有用,我们可以把图像背景设为透明,用网页本身的颜色信息来代替设为透明的色彩,这样可让图像和网页背景很和谐地融合在一起。PNG格式的缺点是不支持动画应用效果。Macromedia公司的Fireworks软件的默认格式就是PNG格式。

(8) SVG格式。 SVG的英文全称为ScalableVectorGraphics,意思为可缩放的矢量图形。SVG是基于XML(eXtensibleMarkupLanguage),由WorldWideWebConsortium(W3C)联盟进行开发的。严格地说,SVG应该是一种开放标准的矢量图形语言,可设计激动人心的、高分辨率的Web图形页面。用户可以直接用代码来描绘图像,可以用任何文字处理工具打开SVG图像,通过改变部分代码来使图像具有互交功能,并可以随时插入到HTML中通过浏览器来观看。

SVG格式提供了目前网络流行格式GIF和JPEG无法具备的优势:可以任意放大图形显示,但不会以牺牲图像质量为代价;字在SVG图像中保留可编辑和可搜寻的状态;SVG格式文件比JPEG格式和GIF格式的文件要小很多,因而下载也很快。可以相信,SVG格式的开发将会为Web提供新的图像标准。

(9) DXF格式。DXF(AutodeskDrawingExchangeFormat)格式是AutoCAD中的矢量文件格式,它以ASCII码方式存储文件,在表现图形的大小方面十分精确。许多软件都支持DXF格式的输入与输出。

(10) FLIC(FLI/FLC)格式。FLIC格式由Autodesk公司研制而成,FLI格式是最初的基于320 × 200分辨率的动画文件格式,而FLC格式则采用了更高效的数据压缩技术,所以具有比FLI格式更高的压缩比,其分辨率也有了很大提高。

(11) TGA格式。TGA(TaggedGraphics)格式是由美国Truevision公司为显示卡开发的一种图像文件格式,已被国际图形、图像工业所接受。TGA格式比较简单,属于一种图形、图像数据的通用格式,在多媒体领域有着很大影响,是计算机生成图像向电视转换的一种首选格式。

图像格式的转换,一般都可以用图像编辑软件(比如Photoshop、CorelDraw、FireworksMX等)将图像打开,然后另存为其它格式保存即可。项目拓展训练

1.练习使用WinRAR压缩工具

使用WinRAR制作压缩文件、自解压文件和个性化软件安装向导,训练方法和操作步骤详见《〈多媒体技术基础与应用(第二版)〉项目实训指导》“学习单元3”的“项目3.1”。

2.静态图像压缩和格式转换

几乎所有的图像编辑软件都提供压缩和转换功能,Macromedia公司的FireworksMX在图像的压缩和优化方面有近乎完美的表现,尤其是对网页图像,可以让设计师在追求文件大小与图像设计效果之间做出随心所欲的选择。本书附带教学资源中含有FireworksMX的中文免费试用版,只要简单安装就可以体验它的图像压缩功能。

FireworksMX压缩优化功能的应用,具体操作步骤详见《〈多媒体技术基础与应用(第二版)〉项目实训指导》“学习单元3”的“项目3.1”。项目3.2动态数据的压缩与应用

项目实施要求

掌握动画、视频和声音等动态数据的压缩方法、数据格式及其应用。

项目主要内容

(1)了解动画、视频和声音等动态数据压缩的基本原理和基本方法。

(2)掌握动画、视频和声音多媒体数据的格式、特点和转换。项目实施安排

3.2.1计算机动画的基本知识

1.动画的概念

动画的英文是Animation,动画与运动是分不开的。著名的动画艺术家英国人约翰·哈拉斯(JohnHalas)曾指出:“运动是动画的本质”。我们在电影院里看电影或在家里看电视时,看到的画面中人物和动物的运动是连续的。但是仔细看一段电影胶片,就会看到所有的画面并不是连续的。动画提供了静态图形缺少的运动景象,它是一种可感觉到运动相对时间、位置、方向和速度的动态媒体。计算机动画已有30多年的历史,早期的动画创作方法是基于数学公式,由某种算法产生的一系列作品。目前主要通过计算机软件为动画创作提供一个人机交互的环境。本质上,动画创作是一种形象思维活动,对形象思维研究从理论上为动画创作提供清晰的模型,因此动画建模是动画创作工具的基础。目前,基于知识的动画创作系统已问世,它能代替人的部分低层次的有规律的思维。

2.计算机动画的功能和特点

随着计算机动画技术的迅速发展,它的应用领域日益扩大,比如电影、电视片头、广告、教育、娱乐和因特网等。

计算机动画是使用计算机进行角色设计、背景绘制、描线上色等常规工作,它具有操作方便、颜色一致、绘图准确等特点,绝对不用担心颜料变质等问题。计算机动画绘图界线明确,不需晾干,不会串色,改色方便,更不会因层数增多而影响下层的颜色。计算机动画还具有检查方便、保证质量、简化管理、提高生产效率、缩短制作周期等优点。现在,很多重复劳动可以借助计算机来完成,比如计算机生成的图像可以复制、粘贴、翻转、放大、缩小、任意移位以及自动计算背景移动等,还可以使用计算机对关键帧之间的中间帧进行计算。

但是完全靠计算机制作动画仍存在困难,还需要动画制作人员为计算机提供各种信息,“帮助”计算机进行“计算”。计算机的参与,使动画制作的工艺环节明显减少,不需通过胶片拍摄和冲印就能演示结果、检查问题。如有不妥,可随即在计算机上改正,既方便又节省时间,从而降低了制作成本。另外,由于动画软件提供了大量的图库,它们是绘制画面的好帮手。用户可将创建的造型、图画保存在图库中,以便今后重复利用。目前计算机在二维动画制作中还只是起到辅助的作用,只能代替人工完成传统动画中重复性强、劳动量大的部分工作,代替不了人的创造性劳动。计算机不能根据剧本自动生成关键帧,即使是生成关键帧之间复杂的中间帧,也还需要动画制作人员的帮助。目前计算机辅助动画设计的目标是使一系列二维或三维物体组成的图像帧连续变化,运动控制自动化和智能化,它的发展方向是与多媒体技术、可视化技术配合在一起,实现虚拟现实世界。

3.计算机动画制作的硬件和软件

计算机动画制作的硬件主要包括:高性能计算机(配有加速图形卡等部件),输入设备(扫描仪、摄像机等),输出设备(录像、光盘、软盘等)。

计算机动画制作的常见工具软件有:MacromediaDirector,二维动画创作软件(AnimatorPro、AdobeFlash、MacromediaAuthorware等),三维动画创作软件(3DSMAX、Poser3、MaYa等)。

4.计算机动画的分类

计算机动画一般分为二维动画和三维动画,三维动画是在二维动画的基础上发展来的。二维动画是对手工传统动画的一个改进。三维动画是近年来随着计算机硬件技术的发展而产生的新兴技术。

计算机动画按生成的方法可以分为逐帧动画、关键帧动画和造型动画等几大类。

逐帧动画:由一幅幅内容相关的位图组成的连续画面,就像电影胶片或卡通画面一样,要分别设计每屏要显示的帧画面。GIF动画属于逐帧动画。关键帧动画:这种动画制作方式和普通动画的制作方式比较类似,所不同的是,在关键帧创作出来后,中间帧不再需要人来画,而是由计算机“计算”出来的。通常我们见到的Flash动画就是关键帧动画。

造型动画:单独设计画像中的运动物体(也称动元或角色),为每个动元设计其位置、形状、大小及颜色等,然后由动元构成完整的一张画面。一张画面中的动元可以是图像、声音、文字和色调,而控制动元表演和行为的脚本,叫做制作表。动元要根据制作表中的规定在动画中扮演自己的角色。3DSMAX动画属于造型动画。

5.计算机动画格式

目前应用最广泛的计算机动画格式主要有以下几种:

(1) GIF动画格式。GIF图像由于采用了无损数据压缩方法中压缩率较高的LZW算法,文件尺寸较小,因此被广泛采用。GIF动画格式可以同时存储若干幅静止图像,进而形成连续的动画,目前Internet上大量采用的彩色动画文件为这种格式的文件。

(2) FLI/FLC格式。FLIC格式是Autodesk公司在其出品的AutodeskAnimator、AnimatorPro、3DStudio等2D、3D动画制作软件中采用的彩色动画文件格式,FLIC是FLC和FLI的统称。其中,FLI格式是最初的基于320 × 200像素的动画文件格式,而FLC格式则是FLI格式的扩展格式,采用了更高效的数据压缩技术,其分辨率也不再局限于320 × 200像素。FLIC格式文件采用行程编码(RLE)算法和Delta算法进行无损数据压缩,首先压缩并保存整个动画序列中的第一幅图像,然后逐帧计算前后两幅相邻图像的差异或改变部分,并对这部分数据进行RLE压缩,由于动画序列中前后相邻图像的差别通常不大,因此可以得到相当高的数据压缩率。FLI/FLC格式被广泛应用于动画图形中的动画序列、计算机辅助设计和计算机游戏应用程序。

(3) SWF格式。SWF格式是Micromedia公司的产品Flash的矢量动画格式,它采用曲线方程描述其内容,不是由点阵组成内容,因此这种格式的动画在缩放时不会失真,非常适合描述由几何图形组成的动画,如教学演示等。由于这种格式的动画可以与HTML文件充分结合,并能添加MP3音乐,因此被广泛应用于网页上,成为一种“准”流式媒体文件。

(4) AVI格式。AVI格式是对视频、音频文件采用的一种有损压缩方式,该方式的压缩率较高,并可将音频和视频混合到一起,因此尽管画面质量不是太好,但其应用范围非常广泛。AVI文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息,有时也出现在Internet上,供用户下载、欣赏新影片的精彩片段。

(5) MOV格式、QT格式。MOV格式、QT格式都是QuickTime的文件格式。MOV格式、QT格式支持256位色彩,支持RLE、JPEG等领先的集成压缩技术,提供了150多种视频效果和200多种MIDI兼容音响和设备的声音效果,能够通过Internet提供实时的数字化信息流、工作流与文件回放。国际标准化组织(ISO)最近选择QuickTime文件格式作为开发MPEG-4规范的统一数字媒体存储格式。3.2.2视频动画基础和应用

1.视频动画的概念

视频动画是由一系列被称为帧的单个静止画面组成的,也就是我们通常所说的电视画面。一般播放的帧频率在24帧/秒~30帧/秒时,视频运动就会非常平滑,而低于15帧/秒时,视频会有停顿感。

2.视频制式

视频制式常见的有PAL制、NTSC制和SECAM制三种制式。

在PAL制中,规定25帧/秒,每帧水平扫描625行(因采用隔行扫描方式,分奇数行、偶数行,即奇、偶两场)。PAL制视频主要用在英国、中国、澳大利亚、新西兰等国家。在每一帧中,电子束由左上角隔行扫至右下角后再跳回至左上角有一个逆程期,约占整个扫描时间的8%,因此625行中有效行只有576行,即垂直分辨率为576点。按现行4:3电视标准,则水平分辨率为768点,这就是常见的一种分辨率(768 × 576)。另外,还有一种遵循CCIR601标准的PAL制,其分辨率为720 × 576。对于NTSC制,规定29.97帧/秒,525行/帧(隔行扫描,分奇、偶两场),图像大小为720 × 486。NTSC制视频主要用在美国、加拿大等大部分西半球国家,日本、韩国等国家也采用NTSC制视频。

SECAM制规定25帧/秒,625行/帧,主要用在法国、东欧、中东等地区。

3.时间码

视频通常用时间码来识别和记录视频数据流中的每一帧,从一段视频的起始帧到终止帧,其间的每一帧都有一个唯一的时间码地址。根据动画和电视工程师协会SMPTE(SocietyofMotionPictureandTelevisionEngineers)使用的时间码标准,其格式是:小时:分钟:秒:帧或hours:minutes:seconds:frames,即“时:分:秒:帧”。一段长度为00:02:31:15的视频片段的播放时间为2分钟31秒15帧。如果以每秒30帧的速率播放,则播放时间为2分钟31.5秒。

4.采集与压缩

PAL制与NTSC制视频都是模拟信号,要在计算机中进行编辑和管理,必须将其转换为数字信号(A/D转换)。视频采集卡可完成A/D转换,这个过程称视频采集。经过A/D转换,模拟视频即变成数字视频,而这一过程的逆过程可实现数字视频的解压缩与回放。视频采集卡先对输入视频信号以4:2:2格式进行采样,然后进行量化,一般对YUV(即对RGB)各8bit量化,因而产生24位真彩。

由于一帧图像数字化后数据量很大,为节省存储空间,还要对其进行压缩处理。压缩处理可分为有损压缩和无损压缩。压缩可由软、硬件实现,后者可实现实时压缩,而前者往往要在分辨率、颜色深度、帧率等方面做出一些牺牲。选择压缩比时,压缩比越高,图像质量越差。在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,然后再播放,因此可以采用不对称(asymmetric)编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时,则能较好地实时回放,即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要10多分钟的时间,而该片断实时回放时间只有3分钟。

目前有多种视频压缩编码方法,其中最有代表性的是MPEG数字视频格式和AVI数字视频格式。

5.数字视频编辑

数字视频编辑以计算机为中心,把采集的视频、音频素材,按照创作意图或电影脚本,进行剪辑和组合,加入适当的转场或特效,最终输出所需格式的电视节目的过程。具体的应用和操作将在下一章详细介绍。

6.视频格式分类

传统的影像视频格式(如.AVI和.MPEG格式等)一般体积较大且清晰度较差,比如在电脑中播放的VCD格式。然而现在同样一段影像视频,不仅体积可以比原来减小数倍,而且视频压缩技术和视频编辑处理技术的不断创新和改进产生了多种功能的不同视频格式。

视频格式可以分为适合本地播放的本地影像视频和适合在网络中播放的网络流媒体影像视频两大类。后者在播放的稳定性和播放画面质量上可能没有前者优秀,但网络流媒体影像视频的广泛传播性使之正被广泛应用于视频点播、网络演示、远程教育、网络视频广告等互联网信息服务领域。

1)本地影像视频格式

本地影像视频格式包括以下几种:

(1) AVI格式:它的英文全称为AudioVideoInterleaved,即音频视频交错格式。AVI格式于1992年被Microsoft公司推出,随着Windows3.1一起被人们认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一。最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频。所以在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等问题。如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。

(2) nAVI格式:newAVI格式的缩写,是一个名为ShadowRealm的组织发展起来的一种新视频格式(与我们上面所说的AVI格式没有太大联系)。nAVI格式是由MicrosoftASF压缩算法修改而来的,但是又与下面介绍的网络影像视频中的ASF视频格式有区别,它以牺牲原有ASF视频文件视频“流”特性为代价而通过增加帧率来大幅度提高ASF视频文件的清晰度。

(3) DV-AVI格式:DV的英文全称是DigitalVideoFormat,是索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用DV-AVI格式记录视频数据的。DV-AVI格式可以通过电脑的IEEE1394端口传输视频数据到电脑,也可以将电脑中编辑好的视频数据回录到数码摄像机中。DV-AVI视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式。

(4) MPEG格式:它的英文全称为MovingPictureExpertGroup,即运动图像专家组格式,家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用有损压缩方法减少运动图像中的冗余信息,说的更加明白一点,就是MPEG格式的压缩方法依据相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达到200∶1)。目前MPEG格式有三个压缩标准,分别是MPEG-1、MPEG-2和MPEG-4,另外,MPEG-7与MPEG-21仍处在研发阶段。

MPEG-1:制定于1992年,它是针对1.5Mb/s以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准。也就是我们通常所见到的VCD制作格式。使用MPEG-1的压缩算法,可以把一部120分钟的电影压缩到1.2GB左右大小。MPEG-1视频格式的文件扩展名包括 .mpg、.mlv、.mpe、.mpeg及VCD光盘中的 .dat文件等。

MPEG-2:制定于1994年,设计目标为高级工业标准的图像质量以及更高的传输率。MPEG-2格式主要应用在DVD、SVCD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上也有应用。使用MPEG-2的压缩算法,可以把一部120分钟长的电影压缩到4GB到8GB的大小。MPEG-2视频格式的文件扩展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。

MPEG-4:制定于1998年,MPEG-4是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带宽,通过帧重建技术压缩和传输数据,以求使用最少的数据获得最佳的图像质量。目前MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积视频文件。另外,这种文件格式还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。MPEG-4视频格式的文件扩展名包括.asf、.mov和DivXAVI等。

另外,大家熟悉的MP3采用的是MPEG-3(MPEGLayeur3)编码。

(5) DivX格式:由MPEG-4衍生出的另一种视频编码(压缩)标准,即我们通常所说的DVDrip格式,它采用了MPEG-4的压缩算法同时又综合了MPEG-4与MP3各方面的技术,也就是使用DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩,然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。DivX格式画质直逼DVD并且体积只有DVD的几分之一。这种编码对机器的要求也不高,所以DivX视频编码技术可以说是一种对DVD造成威胁最大的新生视频压缩格式,号称DVD杀手或DVD终结者。

(6) MOV格式:美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTimePlayer。MOV格式具有较高的压缩比率和较完美的视频清晰度等特点,其最大的特点是跨平台性,即不仅能支持MacOS,同样也能支持Windows。

2)网络影像视频格式

网络影像视频格式包括以下几种:

(1) ASF格式:它的英文全称为AdvancedStreamingFormat,是微软为了和RealPlayer竞争而推出的一种视频格式,用户可以直接使用Windows自带的WindowsMediaPlayer对其进行播放。由于ASF格式使用了MPEG-4的压缩算法,所以压缩率和图像的质量都不错(高压缩率有利于视频流的传输,但图像质量肯定会损失,所以有时候ASF格式的画面质量不如VCD是正常的)。

(2) WMV格式:它的英文全称为WindowsMediaVideo,也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。WMV格式的主要优点包括:本地或网络的回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言的支持、独立的环境、丰富的流间关系以及扩展性等。

(3) RM格式:它的英文全称为RealMedia,是由RealNetworks公司所制定的音频和视频压缩规范,用户可以使用RealPlayer或RealOnePlayer对符合RealMedia技术规范的网络音频和视频资源进行实况转播,并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。RM格式的另一个特点是用户使用RealPlayer或RealOnePlayer播放器可以在不下载音频和视频内容的条件下实现在线播放。另外,RM作为目前主流网络视频格式,还可以通过其RealServer服务器将其它格式的视频转换成RM视频并由RealServer服务器负责对外发布和播放。RM格式和ASF格式可以说各有千秋,通常RM视频更柔和一些,而ASF视频则相对清晰一些。

(4) RMVB格式:一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了RM格式平均压缩采样的方式,在保证平均压缩比的基础上,合理利用比特率资源,就是说静止和动作场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用。这样在保证了静止画面质量的前提下,大幅度地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了平衡。另外,相对于DVDrip格式,RMVB视频也有着较明显的优势,一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式,其大小最多有400MB左右。不仅如此,RMVB视频格式还具有内置字幕和无需外挂插件支持等独特优点。播放RMVB视频格式,可以使用RealOnePlayer2.0或RealPlayer8.0加RealVideo9.0以上版本的解码器。3.2.3音频数据的编码与压缩

1.多媒体中的音频处理技术

1)数字音频

说到多媒体就离不开声音,计算机中能处理的声音都是数字音频。将声音数字化是通过将声波波形转换成一连串的二进制的数据来再现声音的,这个步骤是由计算机声卡中的数/模转换器来实现的,它以每秒上万次的速率对声波进行采样,每一个采样都会记录下原始模拟声波在某一时刻的状态,我们称之为采样样本。将一连串样本连接起来,就可以描述一段声波了,而每一秒采样的数目为采样频率,单位是Hz(赫兹)。对于每一个采样,系统会分配一定的储存位数(字节数)来表达声波的振幅状态,称之为采样精度,采样精度越高,声音被还原的就越细腻。计算机数字(CD)、数字磁带(DAT)中存储的都是数字声音。模拟/数字转换器把模拟声音变成数字声音,数字/模拟转换器可以恢复出模拟的声音。

2)多媒体语音

多媒体语音输出有两种方法:一是录音/重放,二是文/语转换。第二种方法是基于声音合成技术的一种声音产生技术,它可用于语音合成和音乐合成。而第一种方法是最简单的音乐合成方法,曾相继产生了应用调频(FM)音乐合成技术和波形表(Wavetable)音乐合成技术。

3)乐器数字接口(MIDI)

MIDI(MusicalInstrumentDigitalInterface)是作为“乐器数字接口”的缩写出现的,并用它来泛指数字音乐的国际标准。由于MIDI定义了计算机音乐程序、合成器及其它电子设备交换信息和电子信号的方式,所以可以解决不同电子乐器之间不兼容的问题。另外,标准的多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音乐,且所需的存储量最少。

4)单声道和双声道

单声道和双声道是我们常见的音频方面的名词。在记录音频时,每次生成一个声波数据称为单声道,每次生成两个声波数据称为双声道(又称立体声),立体声更贴近人耳的听觉要求,音频更加逼真。

5)数字音频编辑

数字音频编辑是通过计算机,把录制或采集下来的音频素材,按照创作意图进行剪辑和组合,加入适当的过渡或音频特效,并最终输出所需格式的音频信号的过程。具体的应用和操作将在下一章详细介绍。

2.数字音频格式

常见的数字音频格式有:

(1) WAV格式:微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大,不便于交流和传播。

(2) MIDI格式:数字音乐、电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆、硬件及设备间数据传输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI格式的文件,在MIDI文件中存储的是一些指令,把这些指令发送给声卡,由声卡按照指令将声音合成出来。

(3) CD格式:CD音乐格式的扩展名是CDA,其取样频率为44.1kHz,16位量化位数。CD存储采用了音轨的形式,又叫“红皮书”格式,记录的是波形流,是一种近似无损的格式。

(4) MP3格式:全称是MPEG-1AudioLayer3,它在1992年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。换句话说,音频文件(主要是大型文件,比如WAV文件)能够在音质丢失很小的情况下

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论