《多媒体技术》讲稿第2章_第1页
《多媒体技术》讲稿第2章_第2页
《多媒体技术》讲稿第2章_第3页
《多媒体技术》讲稿第2章_第4页
《多媒体技术》讲稿第2章_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章多媒体信息的表示

本章主要讨论的问题:1.信息量度量2.媒体的表现形式3.

主要的图象格式

本章作业第2章多媒体信息的表示2.1.信息量度量

任何媒体都可以承载一定的信息,承载信息的多少,用信息量来描述。信息论的创始人香农(C.E.Shannon)以概率论的观点和方法,为我们提供了一种度量信息量的方法。(1)信息函数(2)信息熵第2章多媒体信息的表示

信息量度量

信息论的创始人香农(Shannon)以概率论的观点方法,提供了一种度量信息量的方法。

(1)

信息函数定义为:

I(ai)=-logPi(i=1,2,3,…r)(2.1)其中,Pi(i=1,2,…r)

表示随机消息集X:{a1,a2,…,ar}中消息ai(i=1,2,…r)的先验概率。它可以度量每个消息ai(i=1,2,…r)所含的信息量。第2章多媒体信息的表示

(2)信息熵定义为:每个消息的平均信息量称为消息集合X的平均信息量同时描述了信息冗余度单位:位(bit)

例1:设有士兵列队方阵为9排9列,士兵甲被指定站在某个位置的概率为1/81,所以“士兵甲所在方阵位置”的信息量为:-Log(1/81)=6.34(位)例2:设某地天气预报晴天占4/8,阴天占2/8,雨天占1/8,大雨占1/8,则其熵为:

H=-

=(-4/8)Log(4/8)+(-2/8)Log(2/8)+(-1/8)Log(1/8)+(-1/8)Log(1/8)=1.75(位)第2章多媒体信息的表示2.2.媒体的不同表现形式承载信息的媒体有许多不同类型,不同类型的媒体承载的信息量不同。在计算机中,为简化信息处理方式,便于人机交互,常按人的感觉来划分媒体,如分为视觉类媒体、听觉类媒体、触觉类媒体、活动媒体、抽象事实媒体等,并对这些媒体,根据不同的抽象程度分成若干层次,每一层次对应不同的表现形式。

计算机中常见的媒体返回几类媒体的不同表现形式:(1)

视觉类媒体(2)听觉类媒体(3)其它类媒体第2章多媒体信息的表示2.2.1视觉类媒体

凡是通过视觉传递信息的媒体,都属于视觉媒体。包括以下几类:(1)

位图图像

(2)矢量图形(3)动态图像(视频与动画)

(4)符号、

(5)文字与数据

(6)其它《返回》

位图图像是一种对视觉信号进行了直接量化的媒体形式,反映了信号的原始形式。根据量化的颜色深度的不同,可分为二值和灰度(彩色)图像两大类。

矩阵(点,灰度值)

技术参数:分辨率,图象深度,数据量注意:区分图像分辨率、屏幕分辨率、像素分辨率

《返回》图像数据表示的基本形式①将照片或三维景物投影到平面上的模拟信号,变成为计算机能处理的数据形式,称之为digitalImage,或digitalpicture。这种图象用整数元素的矩阵表示。被称作象素(pictureelement,简写为pixel)的离散点构成矩阵,如下图(空间和亮度都离散化)。

模拟图像数字图像灰度,亮度等的分布图像的主要技术参数1).分辨率(resolution)是影响图像清晰度的主要指标。屏幕分辨率——在某一指定的显示方式下,计算机屏幕上最大显示区域,以水平和垂直的像元表示,例如640×480,即满屏情况下水平640个像元,垂直480个像元。图象分辨率——是指数字图象的大小,也以水平与垂直方向的像素表示,如320×240的一幅图,在640×480的屏幕上显示出来,只占屏幕中的1/4位置。像素分辨率——一个像素的点大小,点距和宽长之比,不同的长宽比将导致图形变形。图像分辨率对图像质量的影响2).图像颜色数一幅位图图像中最多能使用的颜色数,如:二值图(亮,暗两值)灰度图(2n)如n=8,则256个灰度

彩色数(2nx2nx

2n)如16,777,216种颜色3)量化深度(Quantizationdeepness)A/D转换时的量化级数量。数量越大,越精细。二值图——当灰度值仅为两个等级时。灰度图(浓淡图)——量化级别的数量,如28=256,灰度值为256个等级彩色图——颜色数量的多少,如8位-256色,24位真彩色-16,777,216色。1比特图像1比特图像中的每个像素非0即1二进制图像一幅640x480的1比特图像的数据量为640x480/8=38400byte(字节)数据量小,易于存储传输只能描述简单的图形和文本8比特灰度图像在计算机的输入输出中,数据是以字节(byte)为单位进行处理的(1byte=8bits)通常用8个比特来记录图像中的一个像素可以表达的取值范围0~2550黑色255白色8比特灰度图像一幅640x480的8比特图像的数据量为640×480=307200byte(字节)数据量更大,需要更多的存储空间和传输带宽描述的内容更丰富,信息量更大彩色图像的表示三基色原理自然界中所有的颜色都可以用红、绿、蓝(RGB)这三种颜色的光(红光波长700nm、绿光波长546.1nm、蓝光波长435.8nm)按不同的强度叠加而成颜色的编码在数字视频中,对RGB三基色各进行8位编码(把每种基色按强度划分为256个等级,0表示没有,255表示强度最大),就构成了大约16兆(224)种颜色,这就是我们常说的真彩色。

例:红色(R=255G=0B=0) 黄色(R=255G=255B=0) 白色(R=255G=255B=255)

…目录

返回24比特彩色图像每个基色用8个比特表示24比特彩色图像可以表示的颜色总数为256×256×256=16777216一幅640x480的24比特彩色图像的数据量为640×480×3=921600byte(字节)8比特彩色图像为了在图像质量和存储空间之前获得折衷,256色图像质量通常是可以接受的利用一张包含256个元素的查找表来存储实际的颜色信息图像中每个像素的对应8比特表示的是其在查找表中的索引8比特图像的查找表用能够代表图像主要特征的256种颜色构成查找表5)数据量数据量D=w×h×q×cw-水平方向像素h-垂直方向像素q-量化深度c-颜色通道数量例如:一幅分辨率640x480的彩色图象数据量为D=640x480x8x3=7,372,800(比特)

BMP文件格式

位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。BMP图像文件由以下三部分组成:位图文件头(BITMAPHEADER)数据结构、位图信息(BITMAPINFO)数据结构和位图阵列。目录

返回位图文件头

位图文件头数据结构包含BMP图像文件的类型、显示内容等信息。它的数据结构如下:typedefstruct{intbfType;/*always"BM"*/longbfSize;/*filesize*/intbfReserved1;intbfReserved2;longbfOffBits;/*imagedataoffset*/}BITMAPFILEHEADER;目录

返回位图信息主要由两个数据结构构成BITMAPINFOHEADERRGBQUAD定义每一种RGB颜色4个字节大小位图信息biBitPlanes设备位平面数,必须为1biBitCount每个像素的位数biCompress该图像所用的压缩格式biClrImportant给出重要的颜色索引值Typedefstruct{longbiSize;longbiWidth;longbiHeight;IntbiBitPlanes;IntbiBitCount;LongbiCompress;LongbiSizeImage;LongbiXpelsPerMeter;LongbiYpelsPerMeter;LongbiClrUsed;LongbiClrImportant;}BITMAPFILEHEADER位图阵列记录图像中每一个像素值非压缩格式压缩格式BI_RLE8由两个字节组成,第一个表示连续像素的数目,第二个表示颜色索引值压缩格式BI_RLE4每个字节包含两个像素BMP图像文件的例子Synthetic.BMP文件内容:目录

返回第2章多媒体信息的表示2.2.1.2矢量图形对图像进行抽象化的结果,反映了图像中实体最重要的特征。抽象化(矢量化)过程可以由计算机自动进行,也可以由人工进行。矢量图形不直接产生描述数据的每一个点,而是描述产生这些点的过程和方法图形(1)基本表示方法是矢量图。计算机图形学=数据结构+图形算法+语言如矩形,RECT0,0,200,200,RED,BLUE。描述了矩形点、线、面。四个点的坐标,边线和内面的颜色

(2)用特征量来构成图形(欧氏空间)点→线,线→面,面→体二次曲线:用单位长度Δx,Δy或来插补,拟合自由曲线和曲面:三次样条→曲线三次混合函数→曲面(四个向量)矢量图形矢量图形占用的存储空间比位图少得多位图比矢量图运行速度快矢量图形变换无失真如放大无失真位图变换会出现失真如放大会产生阶梯效应矢量图形能以图元为单位进行属性编辑位图只能对像素或分块进行处理2.2.1.4线图像结构(图象特殊的表现形式)

线状图在计算机内有三种表示(见下图)它们之间可以互相转换。(a)二值图象(矩阵)

(b)坐标序列

©

链码(3.6),(4.7),(5.7),(6.6),(7.5),(8.5),(9.5),(10.4),(10.3),(9.2)

(b)坐标序列(3.6)701100123

(c)链码数字视频(DigitalVideo)

数字视频是一系列相关图像,其特点是:速度高:每秒25帧,每帧1/25秒,每点约ns级容量大:数据量B=h*w*q*c*f*s(垂直、水平、量化、波段、帧率、专门算法)多制式:NTSC(30),PAL(25),SECAM色坐标变换

---球坐标(I,,)转换公式色坐标变换(R,G,B)球坐标(I,,)其中I表示了亮度值,,决定该点的颜色YUV颜色模式

该模式由—个亮度信号Y和两个色差信号u、V组成。它是将RGB颜色通过下述公式

转换为—个亮度信号Y和两个色度分量信号U、V。

目录

返回YUV特点YUV表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是说Y信号分量构成的黑白灰度图与用U、V信号构成的另外两幅单色图是相互独立的。由于Y、U、V是独立的,所以可以对这些单色图分别进行编码。黑白电视能接收彩色电视信号就是利用了YUV分量之间的独立性。YUV特点YUV表示法的另一个优点是可以利用人眼的特性来降低数字彩色图像所需要的存储容量。人眼对彩色细节的分辨能力远比对亮度细节的分辨能力低。例如,要存储RGB8:8:8的彩色图像,即R、G和B分量都用8位二进制数表示,图像的大小为640×480像素,那末所需要的存储容量为921600字节。如果用YUV来表示同一幅彩色图像,Y分量仍然为640×480,并且Y分量仍然用8位表示,而对每四个相邻像素(2×2)的U、V值分别用相同的一个值表示,那末存储同样的一幅图像所需的存储空间就减少到460800字节。这实际上也是图像压缩技术的一种方法。目录

返回YUV模式主要用于PAL制式的电视机。与YUV颜色模式类似的一种称为YIQ模式,主要用于NTSC制式的电视机,另一种称为YCrCb模式,主要适用于计算机用的显示器。2.2.4视频制式标准NTSC一种兼容的彩色电视制式每幅525条水平扫描线每秒30帧速率隔行扫描,即每幅由两次扫描完成,每次扫描画出一场(需1/60秒),两场构成一帧采用YIQ彩色空间这里Y等价于彩色图中的亮度,它集中了大部分能量,占4MHZ带宽I代表phase—相位,色调值,占1.3MHZ带宽Q代表Quadrate,饱和度,占0.5MHz带宽YIQ与R.G.B的关系

YIQ相位敏感隔行扫描和逐行扫描第一场(称为奇数场)扫描第1、3、5...等奇数行,第二场(称为偶数场)扫描第2、4、6...等偶数行。2场合起来构成一副画面,称为一帧。所以,每秒光栅闪烁次数50次,而实际显示的画面只有25幅,即场频为50Hz,而帧频只有25Hz。与逐行扫描相比,其扫描速度只是后者的一半。传输相同细节的情况下,所需视频带宽为逐行扫描的1/2。隔多行会出现闪烁。返回PAL制(PhaseAlternationLine)在我国和德国等国采用利用了视觉特性的辅助平均作用625条扫描线数,场频50Hz(画面720×576)每秒25帧速度克服了NTSC的相位敏感性色差信号分U\V分量SECAM(法语Séquentielámémoīre)在法国至东欧国家采用·逐行依次传递色度信号(R-Y)和(B-Y)·按时分原则,在同一时间内在传输信道内只有一个信号存在,以免发生互串R-Y和B-Y与RGB关系:Y=0.299R+0.587G+0.114BI=R-YQ=B-Y视频信号的三种类型分量视频Componentvideo复合视频CompositevideoS-video分量视频高端视频系统分别使用三路视频信号来表示红、绿、蓝三种图像平面通常是将红绿蓝三色进行变换后,得到一路亮度和两路色差信号,再进行传输优点:三路信号之间没有任何亮度和色度的干扰,颜色再现能力最好缺点:需要更多的带宽和分量间良好的同步机制复合视频亮度信号与颜色信号混合在一个载波上进行传输用于彩色电视广播,兼容黑白电视广播优点:节省带宽缺点:亮度和色度之间的干扰不可避免S-video亮度单独传输,两个色度信号混合在一起进行传输作为分量视频与复合视频的折衷方案亮度还原准确色度有一定失真第2章多媒体信息的表示2.2.5听觉类媒体凡是通过声音形式以听觉传递信息的媒体,都属于听觉类媒体,它的范围比视觉类媒体要小得多,主要有以下几类:

波形声音

语音

音乐

《返回》第2章多媒体信息的表示2.2.5.1波形声音所谓波形声音,实际上已经包含了所有的声音形式,因为可以把任何声音都按采样量化,并恰当恢复出来。事实上,波形声音就是自然界中所有声音的“

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论