第五章-多媒体技术基础-2016_第1页
第五章-多媒体技术基础-2016_第2页
第五章-多媒体技术基础-2016_第3页
第五章-多媒体技术基础-2016_第4页
第五章-多媒体技术基础-2016_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大学计算机基础大学计算机基础第5章 多媒体技术基础5.1 多媒体技术概述5.2 声音5.3 图形和图像5.4 动画5.5 视频n 什么是媒体5.1.1什么是多媒体技术 媒体的分类5.1.1什么是多媒体技术媒体的分类5.1.1什么是多媒体技术 媒体的分类5.1.1什么是多媒体技术 媒体的分类5.1.1什么是多媒体技术 媒体的分类5.1.1什么是多媒体技术 媒体的分类5.1.1什么是多媒体技术CPUOutputDeviceStorageInputDevice表示媒体存储媒体显示媒体显示媒体感知媒体感知媒体传输媒体表示媒体 媒体的分类5.1.1什么是多媒体技术n 数字媒体:指以数字化形式存储、处理和

2、传播信息的媒体;这些信息载体包括数字化的文字、图形、图像、声音、视频影像和动画等感知媒体,和表示这些感觉媒体的表示媒体(编码),以及存储、传输、显示表示媒体的实物媒体。但通常意义下所称的数字媒体常常指感知媒体。n2005中国数字媒体技术发展白皮书将数字媒体定义为:数字媒体是数字化的内容作品,以现代网络为主要传播载体,通过完善的服务体系,分发到终端和用户进行消费的全过程。n 简单来讲,“数字媒体”一般就是指“多媒体”,是由数字技术支持的信息传输载体,其表现形式更复杂,更具视觉冲击力,更具有互动特性。 什么是数字媒体5.1.1什么是多媒体技术包括文字、数字和符号信息,是数字媒体信息系统中出现最频繁

3、的媒体。1, 2,3,4,5,6,7,8,9,05.1.1什么是多媒体技术5.1.1什么是多媒体技术5.1.1什么是多媒体技术5.1.1什么是多媒体技术5.1.1什么是多媒体技术n多媒体是指能同时同时获取、处理、编辑和展示两个两个以上不同类型信息媒体的技术n多媒体技术的特点(1)数字化:多媒体数字化是指文字、数字、图形、图像、音频、动画和视频等多媒体,都是以数字的形式表示,依赖于计算机进行存储和传播,而且便于修改和保存。(2)交互性:交互是指用户可以与计算机的多媒体信息进行交互操作,并能有效地控制和使用信息。(3)多样化:多样化是指计算机所能处理的信息媒体的多样化,包括文字、数字、图形、图像、

4、音频、动画和视频等多种媒体信息。(4)集成性:集成性是指以计算机为中心综合处理多种信息媒体,包括信息媒体的集成和处理这些媒体的硬件、软件的集成。5.1.2 多媒体技术的应用领域视频会议远程教学远程医疗虚拟现实网络游戏交互式电视5.2 声音什么是声音声音就是一种具有一定的频率和振幅且随时间变化的声波。声音的特性(1)声波的频率频率表现为音调的高低音调的高低,不同发音,声音的频率是不同的。通常人能够发出的声音范围是在80 Hz 3400Hz。(2)声波的振幅振幅表现为音强音强,就是声音的大小。通常我们使用音量来描述音强,以分贝分贝(1dB=20logP)为单位。人耳的听觉响应与强度成对数关系,一般

5、的人只能察觉出3dB的音强变化。5.2 声音声音的特性(3)声波的频率范围称为带宽。一般来讲,带宽越宽,音质也越好。人耳能够听到的频率范围是2020000Hz。5.2.2 声音的数字化把模拟声音信号转变为数字声音信号的过程称为声音的数字化。声音的数字化通过采样、量化、编码采样、量化、编码三个步骤来实现。5.2.2 声音的数字化常用的抽样频率声道数:声音通道的个数声音记录只产生一个波形即单音或单声道,若产生两个波形则为立体声或双声道。5.2.2 声音的数字化数字化声音的存储空间 数据量采样频率量化位数声道数/8 思考:存储一段5分钟的CD音质的音乐(采样频率为44.1KHZ,量化位数为16位,立

6、体声双声道),大约需要多少存储空间? 1秒钟的CD音乐需要: 44.1kHz 16bit 2声道/8 = 176.4KB5分钟的CD音乐需要: 176.4*300秒 = 51.7MB5.2.3 音频文件的格式(1)WAV格式,文件扩展名为.WAV。 音频文件最基本的格式就是WAV格式。它是把声音信息直接取样、量化、编码后所得到的数字化音频文件,没有经过任何压缩,可以得到很好的声音质量,但WAV文件的数据量大,要占用较大的存储空间。(2)音乐CD,文件扩展名是 .CDA 音乐CD,即我们一般说的CD光盘上文件所使用的格式。它可以说是所有音频文件中音质最好的,不过它的最大弱点就是容量太大。我们在C

7、D光盘中看到以CDA为后缀名的文件并没有真正包含声音的信息,而只是一个索引信息。不论CD音乐的长短,看到的“*.cda文件”都是44字节长,直接复制cda文件到硬盘上是无法播放的。 (3)MP3格式,文件扩展名为 .MP3 MP3是MPEG1 Layer3规定的音频压缩编码格式,是目前使用最广泛的音频媒体格式。MP3文件采用一种有损的压缩算法,具有101121的高压缩比,解压后的声音质量仍然相当不错。5.2.3 音频文件的格式(4)Windows Media Audio格式,文件扩展名是 .WMA WMA格式是以减少数据流量的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。 WMA还

8、提供了数字版权管理(DRM:Digital Rights Management)技术,可以在WMA文件中加入防拷贝保护(这种内置的版权保护技术可以限制播放时间和播放次数)(5)MIDI格式,文件扩展名是 .mid MIDI是乐器数字化接口(Musical Instrument Digital Interface),是关于数字音乐/电子合成乐器的统一国际标准。它不是具体的记录每个时刻频率的高低、声波的强弱,而是用数字信号的形式说明了在这首乐曲中使用了什么乐器(例如钢琴),弹奏的是什么音调(是1还是7,是高音还是低音),持续的时间是多长(1拍还是1/4拍)。 由于MIDI文件中只是一些数字化的符号

9、,和wav文件相比,文件的大小要小很多,适合于在网络上传送。一个播放0.63秒的wav文件是55KB(字节),而一个播放2分钟的mid文件只有34KB(字节)。5.2.4 音频数据的采集处理5.3 图形和图像n色彩模型 (1)RGB颜色模式自然界中的所有颜色都可以由红、绿、蓝(Red、Green、Blue)三种颜色合成。在数字图像中,对RGB三基色各进行8位编码,针对红(绿/蓝)分量的多少,人为地划分为0255共256个等级,0表示不含红色(绿/蓝)成分,255表示含有100%红色(绿/蓝)成分。例如一个像素,当它的红、绿、蓝成分分别为255、0、255时显示为紫色。这样就就构成了约1677万

10、种颜色,这就是人们常说的真彩色。5.3 图形和图像nRGB彩色空间5.3 图形和图像n色彩模型 (2)CMYK颜色模式它由青、品红、黄和黑(Cyan、Magenta、Yellow、black)4种颜色组成。该颜色模式对应的是印刷用的四种油墨颜色。因为将C、M、Y三种油墨颜色混合在一起,印刷出来的黑色不是很纯正。为了使印刷品为纯黑色,所以将黑色并入了印刷色中,以表现纯正的黑色,还可以借此减少其他油墨的使用量。CMYK模式在本质上与RGB颜色模式没有什么区别,只是产生色彩的原理不同。5.3 图形和图像n色彩模型 (3)HSB颜色模式HSB色彩把颜色分为色相、饱和度、明度(Hue、Saturatio

11、n、Brightness)三个因素。所谓饱和度相当于家庭电视机的色彩浓度,饱和度高色彩较艳丽。饱和度低色彩就接近灰色。明度也称为亮度,等同于彩色电视机的亮度,亮度高色彩明亮,亮度低色彩暗淡,亮度最高得到纯白,最低得到纯黑。可以看出,在选取颜色的时候,HSB模式较为直观和方便。5.3.2 图形和图像的数字化n图形图像数字化的第一步:确定“点”数像素图形图像上“点”的数目,这里所说的“点”称为“像素”。把图形图像上像素的多少称为“像素密度”。图像分辨率像素密度用图像分辨率来度量。图像分辨率的第一种表示:水平方向的像素数垂直方向的的像素数。相乘后的结果就是图像的总的像素的数目。图像分辨率的另一种表示

12、:单位打印长度上的图像像素的数目多少,即用每英寸多少点(dpi:dot per inch)。5.3.2 图形和图像的数字化n图形图像数字化的第二步:如何表示每一个像素。像素点颜色的表示黑白图像灰度图像真彩色图像:红、绿、蓝3基色都有256个层次,三基色叠加后就可以产生256256256种颜色。每个像素编码时所需要的二进制代码的位数称为“像素深度”。图形图像数字化以后,二进制编码文件的大小按以下公式计算:文件大小 = 图形图像总的像素数目像素深度/8 (字节) 不同采样点数对图像质量的影响不同量化级数对图像质量的影响5.3.2 图形和图像的数字化思考: 一幅分辨率为640*480的真彩色图像(2

13、4位)需要的存储空间是多少? 640*480*24/8 = 921 600B = 900KB 5.3.3 位图和矢量图n矢量图矢量图又称几何图形,它是用一组指令来描述图形元素。这些指令给出构成该画面的所有直线、曲线、矩形、椭圆等的形状、位置、颜色等各种属性和参数。这种方法实际上是用数学方法来表示图形数学方法来表示图形,然后变成许许多多的数学表达式,再编制程序,用语言来表达。矢量图特点矢量图形的优点在于不需要对图上每一点进行量化保存无论放大、缩小或旋转,图形都不会失真矢量图的自然度和逼真度低,不适于用来表示色彩矢量图的自然度和逼真度低,不适于用来表示色彩艳丽多变,层次丰富的画面艳丽多变,层次丰富

14、的画面 5.3.3 位图和矢量图n位图是使用像素阵列来表示的图像,每个像素的色彩信息由RGB组合或者灰度值表示。根据颜色信息所需的数据位分为1、4、8、16、24及32位等,位数越高颜色越丰富,相应的数据量越大。其中使用1位表示一个像素颜色的位图因为一个数据位只能表示两种颜色,所以又称为二值位图。通常使用2424位位RGBRGB组合数据位表示的的位图称为真彩色位组合数据位表示的的位图称为真彩色位图图。5.3.4 常见图像格式BMP图像文件,文件扩展名是“.bmp”Windows系统采用的图形文件格式,在Windows环境下运行的所有图像处理软件都支持BMP图像文件格式。可以选择每个像素采用1位

15、(黑白图像)、4位(16色)、8位(256色,或者256个灰度等级),或24位二进制代码(真彩色)的不同图像深度。GIF文件格式,文件扩展名是“.gif”GIF是Graphics Interchange Format的缩写,按字面来翻译就是“图形交换格式”,能在不同的平台上使用。GIF图像是基于颜色列表的图像格式,可以支持256种不同的颜色,每种颜色对应于8位二进制数中的一个数。GIF采用无损压缩存储,在不影响图像质量的情况下,可以生成很小的文件。GIF支持透明色,可以使图像浮现在背景之上。GIF文件可以制作动画,这是它最突出的一个特点。 5.3.4 常见图像格式JPEG文件格,文件扩展名“.

16、jpg”JPEG是由ISO和ITU-T两个国际组织联合建立的专家组(Joint Photographic Experts Group)的名称的简称。JPEG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。JPEG使用有损压缩编码。它依据人的视觉冗余:对于图像中较小的颜色变化、亮度变化的不敏感性。所以JPEG压缩的图像压缩比很高,对于人的视觉效果来说基本没有差别。TIFF文件格式TIFF是Tagged Image File Format的缩写。它是由Aldus公司与微软公司共同开发设计的图像文件格式。TIFF允许多达48位的色彩分辨(R、G、B各16位),可以作为全R

17、GB色彩。TIFF是一种灵活的位图图像格式,实际上被所有绘画、图像编辑和页面排版应用程序所支持。几乎所有桌面扫描仪都可以生成 TIFF 图像。它可以处理黑白、灰度和彩色图像。5.3.4 常见图像格式PNG格式,文件扩展名“.png”PNG是Portable Network Graphic的缩写,被称为是“可移植的网络图像”,是一种无损数据压缩位图图形文件格式。是为了适应网络数据传输而设计的一种图像文件格式。 每个像素可以是48位的真彩色图像;或者是16位的灰度图像。PNG格式可以根据需要来调整图像的透明度、亮度。矢量图的扩展名:不同的矢量图作图软件使用不同的扩展名*.cdr是CorelDraw

18、中的一种图形文件格式。它是所有CorelDraw 应用程序中均能够使用的一种图形图像文件格式。CorelDraw是加拿大的Corel公司推出的平面设计软件。*.dwg是AutoCAD中使用的一种图形文件格式。AutoCAD是著名的计算机辅助绘图工具软件。*.ai是Adobe Illustrator使用的矢量图格式。*.wmf是Microsoft Windows中常见的一种图元文件格式,它具有文件短小、图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,但其图形往往较粗糙,并且只能在Microsoft Office中调用编辑。5.4 动画动画(Animation)是指利用人的视觉暂留特性,

19、以每秒2430帧的速度播放画面,从而产生动态效果。原画:原画也称为关键帧,它一般表达某动作的极限位置、一个角色的特征或其它的重要内容。中间画:也称为中间帧,是位于关键帧之间的过渡画,可能有若干张,目的是使动作更加流畅自然。动画的分类动画的分类二维动画:由平面上的画面组成三维动画:3D动画动画的制作 Flash动画:由美国Micromedia公司出品,用于二维矢量动画编辑和创作的专业软件。Flash源文件的扩展名为.fla制作完毕后发布时的文件扩展名是.swf5.5 视频视频是活动的图像 ,一幅幅静止图像组成了视频 在电视中把每幅图像称为一帧(frame)在电影中每幅图像称为一格 视频信号的组成

20、和存储方式上划分模拟视频:电影、电视数字视频 数字视频的存储量每一秒钟数字视频的存储量是: 一幅图像的总像素像素深度每秒帧数/8(字节)例:使计算机播放分辨率为1024768的24位真彩色高质量电视图像,按每秒24帧来计算,则一分钟的视频需要的存储空间是多少?解:每帧图像的存储空间: 102476824/8 = 2.25MB字节一分钟视频需要的存储空间: 2.2524(帧/秒) 60(秒) = 3.2GB字节5.5.2 视频的压缩技术 数据压缩就是在保持或者基本保持源信息不变的前提下,尽可能减少表示源信息所需要的数据量,以减少存储、传输、处理数据所需要的成本。 视频信号主要的编码和压缩标准是M

21、PEG标准 (Moving Picture Experts Group 活动图像专家组) MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21运动补偿技术运动补偿技术假设每一当前帧都可以从前面某一帧为原型经变换而得到。这一变换是局部的,画面上各点的位移方向和大小不必相同,只要对这些运动信息进行编码,就可以在原来帧画面的基础上再造当前帧的画面。 5.5.2 视频的压缩技术MPEG-2兼容MPEG-1标准,MPEG-2现在是制作DVD光盘的指定标准。MPEG-4是为多媒体应用制订的音视频编码标准。在MPEG-4中,提出了音视频对象的概念。MPEG-4标准要能够对于这些音视频对象单

22、独进行编码,然后按照需要对编码后的对象进行组合,从而构成各种具体的应用场景。MPEG-7定义一种基于内容的多媒体描述标准。MPEG-21用来提供对“多媒体框架”,就是要为不同网络(宽带、移动、广播)上通过不同终端(计算机、移动终端、数字电视)的不同用户提供多媒体综合利用的框架。5.5.3 常用的视频文件格式AVI格式,文件的扩展名是 .AVIAVI格式的英文全称为Audio Video Interleaved,即音频视频交叉存取格式。所谓“交叉”,就是可以将视频和音频交织在一起进行同步播放。优点是图像质量好。缺点是占用空间大;都是.AVI扩展名的文件编码的格式可能不一样,经常造成AVI格式的视频不能正常播放。5.5.3 常用的视频文件格式VCD视频格式,扩展名是 .DATVCD视频格式就是使用MPEG-1标准制作的视频文件格式。使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到两张VCD光盘上采用MPEG-1标准的文件的扩展名也可以是.mpg、.mlv、.mpe、.mpeg等,都称为MPEG文件。5.5.3 常用的视频文件格式DVD视频格式,扩展名是 .VOBDVD视频格式就是使用MPEG-2标准制作的视频文件格式。使用MPEG-2的压缩算法,可以把一部120分钟长的电

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论