第5章-数字媒体及应用(江苏专转本计算机)_第1页
第5章-数字媒体及应用(江苏专转本计算机)_第2页
第5章-数字媒体及应用(江苏专转本计算机)_第3页
第5章-数字媒体及应用(江苏专转本计算机)_第4页
第5章-数字媒体及应用(江苏专转本计算机)_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章数字媒体及应用5.1文本与文本处理5.2图像与图形5.3数字声音及应用5.4数字视频及应用5.1文本与文本处理

文字:是一种书面语言,它由一系列字符(character)的书写符号构成。文本(text):文字信息在计算机中的表示形式,是基于特定字符集的、具有上下文相关性的一个字符流,是计算机中最常用的一种数字媒体。组成文本的基本元素是字符,字符在计算机中采用二进制编码表示。文本在计算机中的处理

文本在计算机中的处理过程:文本准备(例如汉字的输入)、文本编辑、文本处理、文本存储与传输、文本展现等,根据应用场合的不同,各个处理环节的内容和要求可能有很大的差别。文本存储与传输(阅读器)文本处理(文本处理软件)文本准备电子文本文本编辑(编辑器)格式化的电子文本文本展现5.1文本与文本处理

文本信息的输入方法:(P130第13题)人工输入:通过键盘、手写笔或语音输入方式输入字符特点:速度慢、成本高,不适合需处理大批量文字的应用自动输入:将纸介质上的文本通过识别技术自动转换为文字的编码特点:速度快,效率高文字的自动识别分为:印刷体识别和手写体识别5.1.1文本准备文本信息的输入方法文本信息的输入人工输入自动识别输入键盘输入联机手写输入语音输入印刷体识别手写体识别汉字输入编码方法的分类数字编码:使用一串数字来表示汉字的编码方法,例如区位码等缺点:难以记忆,不易推广字音编码:一种基于汉语拼音的编码方法,简单易学,适合于非专业人员缺点:同音字引起的重码多,需增加选择操作字形编码:将汉字的字形分解归类而给出的编码方法,重码少、输入速度较快,如五笔字形法和表形码等缺点:编码规则不易掌握形音编码:吸取了字音编码和字形编码的优点,使编码规则适当简化、重码减少缺点:不易掌握1.汉字键盘输入以平常书写的习惯,把要输入的汉字写在一块叫书写板的设备上,书写板将笔尖的运动(包括抬笔、落笔、笔段轨迹以及各笔段之间的时间关系等)按时间采样后发送到计算机中,由计算机软件自动进行识别,然后用该汉字(或符号)对应的代码进行保存。汉王笔正识率95℅~90℅,速度12字/秒中科院自动化所,华旗资讯科技发展有限公司(爱国者)2.联机手写汉字识别(笔输入)使用语音输入文本的系统也叫做“听写机”或“语音打字机”按照不同的应用及要求,语音识别的功能区别:孤立语音/连续语音识别小词汇量/大词汇量语音识别特定人/非特定人语音识别最高目标:非特定人大词汇量的连续语音识别技术3.汉语语音识别印刷体汉字识别:将传统纸介质上的文字信息自动输入计算机并转换为数字文本形式的一种技术,也叫做汉字OCR(OpticalCharacterRecognition)。(P130第2题)印刷体文字识别的过程4.印刷体汉字识别(汉字OCR)扫描后的图像文本预处理版面分析文字切分特征提取字符识别后处理识别后的编码文本5.1.2字符的编码

字符是组成文本的基本元素,字符在计算机中采用二进制编码表示。

1.西文字符的编码字符集:常用字符的集合。西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。字符的编码:字符集中每一个字符各有一个代码,即字符的二进制位表示,称为该字符的编码。美国标准信息交换码(AmericanStandardCodeforInformationInterchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。基本的ASCII字符集共有128个字符(P125例1、P127第1题)96个可打印字符(常用字母、数字、标点符号等)32个控制字符特殊字符的ASCII码空格(32)A(65)a(97)0(48)(P128第17、19题)ASCII码0123456789ABCDEF控制字符01234567b3b2b1b0b6b5b4标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0”。扩充ASCII字符集:标准ASCII字符集只有128个不同的字符,在很多应用中无法满足要求。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的八位代码(十进制数128~255),称为扩展ASCII码。扩充ASCII字符集(1)GB2312-80汉字编码《信息交换用汉字编码字符集·基本集》(GB2312-80)组成:第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)第二部分:一级常用汉字,共3755个,按汉语拼音排列第三部分:二级常用字,共3008个,按偏旁部首排列2.汉字的编码(1)GB2312-80汉字编码区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示, 如:“大”字的区号20,位号83,区位码是2083 用2个字节表示为:0001010001010011(即十六进制1453H)2.汉字的编码GB2312-80汉字编码一级汉字(3755个)二级汉字(3008个)(扩充使用)位号: ………………19423字母、数字和各种符号…………区号:1916555687942.汉字的编码(1)GB2312-80汉字编码国标交换码:为了避免汉字区位码与通信控制码的冲突,ISO2022规定,每个汉字的区号和位号必须分别加上32(即二进制00100000,十六进制20H),经过这样处理得到的代码称为汉字的“国标交换码”(简称交换码)。因此,“大”字的交换码是:0011010001110011。2.汉字的编码(1)GB2312-80汉字编码机内码:问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,将汉字的区号和位号必须分别加上160(即二进制10100000,十六进制A0H),就可以得到该汉字的“机内码”,又称内码。如:“大”字的内码是:1011010011110011(B4F3)2.汉字的编码综上所述,可以总结如下公式:(P127页第2题)

国标码=区位码+2020H

机内码=区位码+A0A0H(2)GBK汉字内码扩充规范问题:GB2312-80只有6763个汉字,使用时功能不够。解决方法:1995年发布GBK,全称为《汉字内码扩展规范》,它与GB2312国标汉字字符集及其内码保持兼容。GBK/1:GB2312中的符号;

GBK/2:GB2312中的全部汉字;

GBK/4和GBK/3:包括繁体字在内的大量汉字;

GBK/5:符号。例如:計機係等繁体汉字和冃冄円冇鎔等生僻的汉字。

2.汉字的编码(2)GBK汉字内码扩充规范(P129第23题)组成:21003个汉字,883个图形符号GBK的编码是用2字节编码表示,第1字节的最高位为”1”,第2字节的最高位不一定是”1”,与GB2312-80保持兼容。2.汉字的编码(3)UCS/Unicode与GB18030汉字编码标准(a)通用编码字符集UCS/UnicodeUCS/Unicode用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作

UCS-4)优点是编码空间大,能容纳足够多的各种字符集(13亿字符);缺点是4字节的字符编码使存储空间浪费严重。2.汉字的编码(3)UCS/Unicode与GB18030汉字编码标准(b)GB18030-2000编码(P125页例2)GB18030-2000汉字编码标准时为了既兼容GB2312和GBK,又尽快向UCS/Unicode编码标准过度,而在2000年颁布的汉字编码国家标准。该标准在GB-2312和GBK的基础上进行扩充,增加了4字节编码,收录的汉字达到27000个。2.汉字的编码文本是计算机表示文字及符号信息的最常用也是最基本的一种数字媒体。由于文字和符号采用了二进制编码表示,因而可以方便地进行编辑、排版和各种分析处理(如统计、排序、分类、索引、检索等)。使用计算机制作的数字文本,根据用途分为:简单文本、丰富格式文本和超文本三类。(P130第11题)

5.1.3文本的分类与表示简单文本(plaintext):是由一连串用于表达正文内容的的字符(包括汉字)所组成的,它几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或ASCII文本,其文件后缀名是.txt。特性:呈现为一种线性结构,写作与阅读均按顺序进行。文件体积小,通用性好,几乎所有的文字处理软件都能识别和处理,但不能插入图片、表格等,也不能建立超链接。1.简单文本(纯文本)文件内容有字符的编码、数字图像、数字声音、数字视频信息、标记信息。(P130第14题)例如RTF文件、DOC文件、PDF文件、HTML文件。

RTF是为便于不同的丰富格式文本能在不同的软件和系统中互相交换使用而提出的一种中间格式标记语言。(P127第3题)2.丰富格式文本超文本也称为非线性文本(P128第12题、P131第16题)超文本(hypertext)的阅读方式传统的顺序式阅读通过链接、跳转、导航、回溯等操作实现跳跃式阅读超文本的结构:采用网状结构来组织信息,各信息块按照其内容的关系互相链接例如,Windows中的”帮助”文件或者使用浏览器从Web服务器上下载的网页(html或htm文件)。3.超文本超文本ABCDEFGH超文本结构(1)面向通信的文本处理软件(P128第16题) 计算机网络上最普及的应用是用电子邮件进行通信。大多数情况下电子邮件正文的内容一般都是简单文本,因此电子邮件内嵌的文本编辑器功能比较简单,操作使用方便。典型软件:微软公司的OutlookExpress,具有文字的增、删、改以及字体、字号的设置功能,也可以设定一些简单的格式和插入一些图片。当然邮件所带的附件并不受此限制。在互联网上进行聊天所使用的文本处理软件更加简单。3.常用文本处理软件(2)面向办公的文本处理软件功能要求:文本制作的高效率、高质量软件面向非专业用户,易学好用文本处理能力,既功能丰富,又操作简单排版功能典型软件:MS-OfficeWPS20003.常用文本处理软件(3)面向出版的文本处理软件排版软件的主要功能:将文字、图形和图像等合理地安排在页面内.ps文件:排版软件的输出的一种使用页面描述语言(例如PostScript)描述的文件,该文件记录了每一个页面的排版结果,它被送到装有栅格图像处理器(RIP)的激光照排机去,经过RIP的解释,产生页面的图像,然后驱动激光束对感光材料进行扫描曝光,以得到用于制版的胶片典型排版软件:方正集团公司的“飞腾”排版软件美国Adobe公司的PageMaker和PDFWriter3.常用文本处理软件(4)面向网络信息发布和电子出版的文本处理软件制作HTML文件的软件:微软的FrontPage超链的链宿有两种:书签,指的是文本内部标记有书签的某个地方互联网上的某个信息资源(文件),它用统一资源定位器(URL)指定面向电子出版的软件:PDF格式文件3.常用文本处理软件4.搜索引擎Web服务器使用软件robot遍历Web,将Web上的信息下载到本地文档库,然后对文本内容进行自动分析并建立索引,在用户提出检索请求时,搜索引擎通过检查索引找出匹配的文本并返回给用户。

例如,搜狐(Sohu)、谷歌(Google)、雅虎(Yahoo)、新浪(Sina)、百度(baidu)等。1.色光的三基色(P129第22题)色光的三基色是:红(Red)、绿(Green)、蓝(Blue)自然界中任何一种色光都可由R、G、B三基色按不同的比例相加混合而成。当三基色分量都为0(最弱)时混合为黑色光。当三基色分量都为K(最强)时混合为白色光。2.颜料的三基色:青、品红、黄5.2图像与图形及应用3.色彩的表达方法(1)RGB色彩空间典型应用是计算机的彩色显示器。(2)YUV色彩空间(P126例7)Y亮度信号,U、V色彩信号典型应用是彩色电视系统。(3)HIS色彩空间H—色调,I—亮度,S色饱和度HIS色彩空间是从人的视觉系统出发描述色彩(4)CMYK色彩空间C青色,M品红色,Y黄色,K黑色典型应用为彩色打印系统、彩色印刷系统。4.数字图像分类:从现实世界中通过数字化设备获取的图像,称为图像(image),是来自自然界中的真实的景物。由计算机合成的图像,称为:矢量图形,简称图形(graphics),是虚拟的。1.图像的获取:

从现实世界中获得数字图像的过程。图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤:取样分色量化5.2.2图像的获取与重现2.数字图像获取设备:从现实世界获得数字图像过程中所使用的设备。设备的功能:将现实的景物输入到计算机内并以取样图像的形式表示。2D图像获取设备(如扫描仪、数码相机等)只能对图片或景物的2D投影进行数字化3D扫描仪能获取包括深度信息在内的3D景物的信息5.2.2数字图像获取设备1.图像的表示方法与主要参数:(P125例3)从取样图像的获取过程可以知道,一幅取样图像由M(行)*N(列)个取样点组成,每个取样点是组成取样图像的基本单位,称为像素(pictureelement,

简写为pel)。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有1个亮度值。5.2.3图像的表示与压缩编码取样图像在计算机中的表示方法:单色图像用一个矩阵来表示。彩色图像用一组(一般是3个)矩阵来表示,矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值,使用整数表示,一般是8位至12位。数字图像的表示图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率)(P127第4题)位平面数目,即矩阵的数目,也就是彩色分量的数目。颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目图像的属性信息(1)数字图像压缩的必要性一幅图像的数据量可按下面的公式进行计算(以字节为单位):(P128第15题)图像数据量=图像水平分辨率×图像垂直分辨率×像素深度/8(单位为字节)几种常用图像的数据量2.图像的压缩编码图像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB3.75MB(2)图像数据压缩的可能性:由于数字图像中的数据相关性很强,数据的冗余度很大,因此对数字图像进行大幅度的数据压缩是完全可能的。而且,人眼的视觉有一定的局限性,即使压缩前后的图像有一定失真,只要限制在人眼允许的误差范围之内,也是允许的。2.图像的压缩编码(3)数据压缩类型(P129第21题)无损压缩:压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同 例如:行程长度编码(runlengthcoding,RLC):111110005555333302222222513045431072

哈夫曼(Huffman)编码:对出现概率高(低)的编短(长)码,是变长码有损压缩:使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的正确理解。如变换编码、矢量编码等图像的压缩编码图像压缩方法很多,不同方法适用于不同的应用,在计算机中常常是多种压缩方法的综合使用。为得到较高的数据压缩比,一般都采用有损压缩。P126例4图像数据的压缩比=压缩后的图像数据量/压缩前的图像数据量。2.图像的压缩编码(4)压缩编码方法优劣的评价压缩倍数的大小重建图像的质量(有损压缩时)压缩算法的复杂程度(5)图像压缩编码方法的国际标准和工业标准:ISO和IEC两个国际机构联合组成了一个专家组(JointPhotographicExpertsGroup,JPEG),制定了一个静止图像数据压缩编码的国际标准,称为JPEG标准(P129第20题)JPEG标准的特点:适用范围广;能处理各种连续色调的彩色或灰度图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制(压缩比越低,图像质量越好;压缩比越高,图像质量越差)JPEG2000:适用于各种不同类型(黑白、灰度、彩色等)和不同特性(自然、医学、遥感、合成)的图像,可用于不同的应用模式(实时传输、检索、存档等)。采用了小波分析等先进算法,提供了更好的图像质量,更低的码率,更适合在WWW网上传输等,它兼容JPEG2.图像的压缩编码JPEG图像压缩示例

2.图像的压缩编码中等压缩后的图像高倍压缩后的图像BMP(BitMaP-file)图像:微软公司在Windows操作系统下使用的一种标准图像文件格式,一个文件存放一幅图像,可以使用行程长度编码(RLC)进行无损压缩,也可不压缩。不压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows应用软件都能支持。TIFF(TaggedImageFileFormat)图像文件格式:用于扫描仪和桌面出版,能支持多种压缩方法和多种不同类型的图像,有许多图像图形应用软件支持这种文件格式。由文件头、文件目录、目录条目三个部分组成。3.常用图像文件格式GIF(GraphicsInterchangeFormat):互联网上广泛使用的一种图像文件格式,它的颜色数目较少(不超过256色),文件特别小,适合网络传输。由于颜色数目有限,GIF适用于插图、剪贴画等色彩数目不多的应用场合。GIF格式能够支持透明背景,具有在屏幕上渐进显示的功能。尤为突出的是,它可以将许多张图像保存在同一个文件中,显示时按预先规定的时间间隔逐一进行显示,从而形成动画的效果,因而在网页制作中大量使用。3.常用图像文件格式景物形状的计算机表示景物的模型(model):景物在计算机内的描述景物的建模(modeling):人们进行景物描述的过程绘制(rendering):也称图像合成(imagesynthesis),根据景物的模型生成图像的过程,所产生的数字图像称为计算机合成图像计算机图形学(ComputerGraphics):研究如何使用计算机描述景物并生成其图像的原理、方法与技术5.2.5计算机图形5.3.1波形声音的获取与播放1.声音的产生与信号的特征声音:由振动而产生,通过空气进行传播。它由许多不同频率的谐波所组成,谐波的频率范围称为声音的带宽(bandwidth),带宽是声音的一项重要参数。决定声音信号特征的三个参数:频率决定音调的高低;幅度决定声音的强弱;相位决定声音的音色。5.3数字声音及应用2.数字声音概述数字声音又两种类型:

(1)波形声音,如数字语音(取样于人说话的声音)、全频带数字声音(取样于自然界各种声音)。(2)计算机合成声音,如合成音乐(MIDI)、合成语音。声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程。常用方法是脉冲编码调制法(PCM)。声音信号数字化的过程:(P126例6)取样、量化、编码(P116奈奎斯特采样原理)3.声音信号的数字化模拟声音信号取样量化编码数字声音011010011101……麦克风:将声波转换为电信号(P128第18题)声卡(soundcard):进行数字化(P127第6题)波形声音的获取:把模拟的声音信号转换为数字形式。(话筒或线路输入、单双道)波形声音的重建与播放MIDI(MusicalInstrumentDigitalInterface)声音的输入MIDI声音的合成与播放4.波形声音的获取设备5.声音的播放数字声音解码数模转换插值重建的模拟声音信号011010011101……波形声音的重建

波形声音的播放经过四个步骤:解码、数模转换、插值处理、播放。(P128第13题)声卡输出的声音需送到音箱去发音。音箱分类普通音箱:接收的是重建的模拟声音信号数字音箱:可直接接收声卡输出的数字声音信号,避免信号在传输中发生畸变和受到干扰,其音响效果更加突出6.声音的播放设备1.波形声音的主要参数:(P130第8题)

取样频率量化位数声道数目使用的压缩编码方法数码率(bitrate):指的是每秒钟的数据量,也称比特率、码率数字声音未压缩前,其计算公式为:(P126例5、P128第14题)波形声音的码率

取样频率

×

量化位数

×

声道数压缩编码以后的码率=压缩前的码率

/压缩倍数5.3.2波形声音的表示现压缩编码2.波形声音数据压缩的可能性:声音信号中包含有大量的冗余信息,再加上还可以利用人的听觉感知特性,因此,产生了许多压缩算法声音数据压缩算法的评价:压缩倍数高,声音失真小,算法简单,编码器/解码器的成本低3.波形声音压缩算法的分类

分为有损压缩和无损压缩

有损压缩是指声音信号在压缩过程中存在数据的丢失,不能完整地还原信号的原貌。

无损压缩是指在压缩过程中没有数据的丢失,能够完整地还原信号本来的面貌。一般的,压缩越多,信息丢失越多、信号还原后失真越大。一个好的声音数据压缩算法通常应做到压缩倍数高,声音失真小,算法简单,编码器/解码器的成本低。MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:层1(Layer1):编码简单,用于数字盒式录音磁带层2(Layer2):算法复杂度中等,用于数字音频广播(DAB)和VCD等层3(Layer3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍(P130第6题)MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1,层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。4.波形声音压缩编码标准杜比数字AC-3(DolbyDigitalAC-3):美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。MIDI(MusicalInstrumentDigitalInterface):计算机中描述乐谱的一种标准描述语言,规定了乐谱的数字表示方法(包括音符、定时、乐器等)和演奏控制器、音源、计算机等相互连接时的通信规程。(P130第9题)MIDI文件在Windows系统中可以使用媒体播放器播放。MIDIMIDI音乐的制作与播放:实时演奏MIDI键盘MIDI消息乐谱输入音序器软件MIDI文件媒体播放器MIDI合成器MIDI消息MIDI音乐2.音乐合成MIDI音乐与高保真的波形声音相比:缺点:音质方面较差无法合成出所有各种不同的声音(例如语音)优点:数据量很少(比CD-DA少3个数量级,比MP3少2个数量级)易于编辑修改可以与波形声音同时播放5.4.1数字视频基础1.基本概念视频(video):指的是内容随时间变化的一个图像序列,也称为活动图像(motionpicture)。常见的视频有电视和计算机动画。电视:能传输和再现真实世界的图像与声音,是当代最有影响力的信息传播工具。数字视频:数字化的电视信号称为数字视频。计算机动画:是计算机制作的图像序列,是一种计算机合成的视频。5.4数字视频及应用彩色电视信号的三种制式(1)彩色电视信号有PAL(德国、英国、朝鲜、中国等采用)、NTSC(美国、加拿大、日本等国采用)、SECAM(法国、前苏联、东欧等国采用)三种制式。(2)彩色信号在远距离传输时用亮度信号Y和两个色度信号U、V来表示。优点是能与黑白电视接收机兼容。2.彩色电视信号的三种制式

1.视频采集卡:简称视频卡,PC机中用于视频信号数字化的插卡。(P130第7题)功能:将模拟视频信号(及伴音信号)数字化并存储在硬盘中。数字化后的视频图像,经彩色空间转换(从YUV转换为RGB),与计算机图形显示卡产生的图像叠加,显示在屏幕上。获取数字视频的同时使用数字信号处理器(DSP)进行音频和视频数据的压缩编码5.4.2.视频卡与视频获取设备2.数字摄像头:在线获取数字视频的设备。通过光学镜头采集图像,然后直接将图像转换成数字信号并输入到PC机,不需视频采集卡进行模数转换。最高分辨率:640×480,一般:352×288,速度:30帧/s以下,镜头视角:45~60度光传感器:大多采用CCD,部分采用CMOS,后者分辨率不能很高,但功耗低、速度快接口:USB接口,IEEE1394(火线)接口。5.4.2视频卡与视频获取设备3.数字摄像机:一种离线的数字视频获取设备。原理:与数码相机类似,功能更多压缩编码:视频图像及伴音使用M-JPEG或MPEG-2记录介质:磁带,硬盘接口:USB,IEEE13945.4.2视频卡与视频获取设备数字摄像头

数字摄像机数字视频压缩的必要性:数字视频的数据量很大,1分钟CCIR601数字视频的数据量约为1G字节。数字视频压缩的可行性:画面内部信息相关性很强相邻画面的内容具有高度的连贯性人眼的视觉特性5.4.3数字视频的压缩编码视频压缩编码的标准及其应用名称源图像格式压缩后的码率主要应用MPEG-1CIF格式大约1.2Mb/s~1.5Mb/s适用于VCD、数码相机、数字摄像机等H.261CIF格式,QCIF格式P×64Kb/s(P=1、2时,只支持QCIF格式,P≥6时,可支持CIF格式)应用于视频通信,如可视电话、会议电视等MPEG-2(MP@ML)720×5765Mb/s~15Mb/s用途最广,如DVD,150路卫星电视直播,540路CATV等MPEG-2HighProfile1440×15521920×115280Mb/s~100Mb/s目标是高清晰度电视(HDTV)领域MPEG-4(H.324)多种不同的视频格式与MPEG-1,MPEG-2相当,但最低可达到64Kb/s适合于交互式多媒体应用,包括虚拟现实、远程教学、交互式电视等MPEG-1:一种运动图像及其伴音的编码标准码率:1.2Mb/s~1.5Mb/s图像质量:200多线,相当于一般家用录像机应用:数码相机和数字摄像机VCD视频压缩编码的标准及其应用MPEG-2:针对数字电视(DTV)的应用要求码率:1.5Mb/s~60Mb/s甚至更高特点:通用性,向下兼容MPEG-1应用:(P128第11题)数字卫星电视高清晰度电视(HDTV)广播数字视盘DVD视频压缩编码的标准及其应用MPEG-4:目标:支持各种网络条件下(包括移动通信)的交互式多媒体应用,侧重于对多媒体信息内容的访问支持:自然的(取样)和计算机合成视频和音频,功能强,应用前景广H.261:数字视频编码标准,由国际电联(ITU)前身CCITT制定,适用于在ISDN网上以p×64kbps(p=l,…,30)的速率开展视频会议和可视电话业务视频压缩编码的标准及其应用AVI(AudioVideoInterleavedFormat):一种音频/视频文件格式应用:Windows平台,在获取、编辑以及播放音频/视频流的应用软件中被广泛使用对压缩方法没有限制,只需在文件中加以说明,增强了可扩展性 缺点:不适应在网络上对视频流的实时播放视频压缩编码的标准及其应用ASF(AdvancedStreamFormat)文件格式针对AVI文件的网络实时播放缺陷开发采用技术:WMVideo8和WMAudio8流媒体技术应用:互联网上视频直播(WebTV)、视频点播(VOD)、视频会议等RealNetworks公司的RealMedia(包括RealVideo和RealAudio)与微软公司流媒体技术相当,已在互联网上得到了广泛的应用视频压缩编码的标准及其应用1.VCD与DVDCD(CompactDisc):小型光盘,最早应用于数字音响领域,代表产品是CD唱片。每张CD唱片的存储容量是650MB左右,可存放1小时的立体声高保真音乐。VideoCD(简称VCD):1994年由JVC、Philips等公司联合定义的一种以数字技术在CD光盘上存储视频和音频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论