




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于多媒体技术应用总结第一页,共一百二十九页,2022年,8月28日媒体(media)媒体:指交流、传播信息的工具。是承载信息的载体。
“载体”是指承载知识或信息的物质形体。媒体的种类:感觉媒体、表示媒体、表现媒体、存储媒体及传输媒体。第二页,共一百二十九页,2022年,8月28日感觉媒体能直接作用于人的感官,让人产生感觉的媒体。例如:通过视觉看到的文字、图形;通过听觉听到的音乐、语音等。第三页,共一百二十九页,2022年,8月28日表示媒体为传播和表达某种感觉媒体所指定的各类信息的编码与格式。例如,语言编码,电报码,图像编码,...第四页,共一百二十九页,2022年,8月28日表现媒体用于输入和输出感觉媒体的载体。输出媒体显示器,扬声器,打印机,...
输入媒体键盘,鼠标,扫描仪,...第五页,共一百二十九页,2022年,8月28日存储媒体用于存放表示媒体的载体。例如:内存、软磁盘、硬盘、光盘、纸张、...第六页,共一百二十九页,2022年,8月28日传输媒体用于把表示媒体从一处传输到另一处的物理实体。例如:各种导线、电缆、电话线、光纤、...第七页,共一百二十九页,2022年,8月28日各种媒体形式的关系表现媒体(输入设备)存储媒体表现媒体(输出设备)感觉媒体感觉媒体表示媒体表示媒体第八页,共一百二十九页,2022年,8月28日、多媒体数据的特点数据量大数据类型多数据类型之间的差别大多媒体数据的输入输出复杂第九页,共一百二十九页,2022年,8月28日多媒体数据的多通道异步输入过程第十页,共一百二十九页,2022年,8月28日多媒体技术定义多媒体技术是指计算机综合处理文本、图形、图像、动画、音频及视频等多种信息,使它们建立一种逻辑连接,并集成为一个具有交互性的系统的技术。1.1.3多媒体技术及特性第十一页,共一百二十九页,2022年,8月28日多媒体技术的特性多样性:指信息媒体的多样性集成性:指以计算机为中心综合处理多种信息媒体,它包括信息媒体的集成和处理这些媒体设备的集成交互性:指用户可以与计算机的多种信息媒体进行交互操作,从而为用户提供更加有效地控制和使用信息的手段实时性:音频信息与视频信息均与时间有关第十二页,共一百二十九页,2022年,8月28日1.2、多媒体个人计算机系统的组成结构《多媒体计算机》可以处理数值、文字、图像、动画、音频、视频等信息的计算机被称为多媒体计算机。它具有速度快、存储容量大、能实时处理的特点。第十三页,共一百二十九页,2022年,8月28日多媒体计算机的分类基于IBMPC系列的多媒体个人计算机(MPC)基于AppleMacintosh系列的计算机第十四页,共一百二十九页,2022年,8月28日多媒体PC机(MPC)MPC=multimediapersonalcomputer具有特定多媒体功能的PC机。1990年“多媒体微机市场协会”指定了MPC标准。该标准规定了将一个以Intel处理器芯片为基础的计算机转变成为多媒体计算机的最低软硬件规范。第十五页,共一百二十九页,2022年,8月28日多媒体计算机系统结构多媒体应用系统多媒体创作系统多媒体核心系统多媒体I/O接口多媒体实时压缩与解压缩计算机硬件系统构成多媒体系统的根基,是组成多媒体计算机的所有物理设备。主要用于与时问有关的音频、视频等多媒体信息的压缩和解压缩。完成各多媒体硬件设备的驱动控制,提供相应的软件接口,以便高层软件系统的调用。主要是计算机的操作系统。创作多媒体应用系统的工作环境。包括根据各种需求开发的多媒体应用系统。第十六页,共一百二十九页,2022年,8月28日多媒体系统的三要素用于视频和音频信息处理的多媒体硬件多媒体操作系统支持多媒体的软件开发和编辑工具第十七页,共一百二十九页,2022年,8月28日1.4、多媒体的关键技术数字音频和视频技术:主要解决音频和视频信息的数字化和压缩、解压缩等问题,以便对音频、视频信息做到实时或准实时处理。
多媒体软件平台技术:主要涉及多媒体操作系统、多媒体著作工具等。
多媒体通信技术:是指利用通信网络综合地完成多媒体信息的传输和交换的技术。这种技术打破了计算机、通信、广播和出版的界限,使它们融为一体,向人类提供了诸如多媒体电子邮件、视频会议等全新的信息服务。
多媒体数据库技术第十八页,共一百二十九页,2022年,8月28日1.5、多媒体技术的发展84年:Apple公司引入位图概念85年:推出了世界上第一台多媒体系统86年:推出了交互式紧凑光盘系统CD-I87年:推出交互式数字视频系统DVI90年:指定MPC_I级标准91年:推出CD-ROM/XA标准92年:公布MPEG-I数字电视标准93年:推出了MPC_II级标准01年:推出MPEG-7标准,它提出了一种适用于现实生活中的各种多媒体内容的标准化描述方案,第十九页,共一百二十九页,2022年,8月28日第2章文本信息处理技术第二十页,共一百二十九页,2022年,8月28日2.1文本信息的获取与表现文本信息是计算机最初、最简单的表现形式。所谓文本就是由字符组成的字符序列。第二十一页,共一百二十九页,2022年,8月28日2.1.1文本信息的特点1、表示简单:文本是字母、数字及其他各种符号的集合,通常人们将这个集合称为字符集。在目前的计算机系统中,广泛使用的是ASCII编码字符集。2、处理方便:每个字符占用固定的二进制位数(8位或16位),计算机可以直接对字节进行操作。3、表达问题准确:很多事物只有用文字才能够表达清楚、准确。4、存取速度快:往往一页文字表达的内容要比一幅图像的内容多。由于一页纸的数据量比一幅图像的数据量小,所以,存取数据所花费的时间也会少很多。第二十二页,共一百二十九页,2022年,8月28日2.1.2文本信息的获取方式1、键盘输入方式2、手写输入方式3、语音输入方式4、利用扫描仪输入方式第二十三页,共一百二十九页,2022年,8月28日2.2文本信息的编辑处理在多媒体应用系统的制作中,也需要对文本内容进行修改,因此在多媒体集成工具中都提供了文本编辑功能,比如,文本剪切、复制、粘贴、插入、删除等等。实际上对文本的编辑处理还包括对其进行格式化。第二十四页,共一百二十九页,2022年,8月28日(1)字形:文文
文(2)字号:
文文文(3)字体:点阵字体、TrueType字体2.2.1Windows中的字体第二十五页,共一百二十九页,2022年,8月28日2.2.2格式化文本格式化文本包括:设置字体、字形、字号、颜色、字间距、行间距、段落格式等。具体实现方法有两种:1、利用OLE功能链接相应的服务应用程序;2、在专门的文本编辑软件中格式化后,利用屏幕拷贝功能将其转换成图像,然后再导入多媒体应用系统的画面中。第二十六页,共一百二十九页,2022年,8月28日利用OLE技术嵌入Microsoft
Word或书写器对象OLE(ObjectLinkandEmbedding)是一种对象链接与嵌入技术。它可以将Windows环境下不同应用程序创建的数据作为对象链接或嵌入到其他的应用程序中。其中提供数据对象的应用程序被称为服务应用程序,链接或嵌入数据对象的应用程序被称为客户应用程序。若在一个文档中含有多个数据对象,就将其称为复合文档。第二十七页,共一百二十九页,2022年,8月28日利用OLE技术嵌入Microsoft
Word或书写器对象在客户应用程序中直接嵌入服务应用程序直接嵌入Word文档将文本图形化,并以图像文本的形式插入到多媒体应用系统中第二十八页,共一百二十九页,2022年,8月28日第3章音频信息处理技术第二十九页,共一百二十九页,2022年,8月28日3.1音频信息的处理
人们在接收外界信息以及与他人进行交流的过程中,大约有20%是通过听觉实现的,所以音频(声音)是多媒体计算机技术中一种不可缺少的媒体。第三十页,共一百二十九页,2022年,8月28日3.1.1多媒体中的音频信息
声音是由物体振动引发的一种物理现象。这种振动会不断地向四周传播,当被人耳接收时,我们就听到了声音。第三十一页,共一百二十九页,2022年,8月28日声音媒体分为三类波形声音:实际上已经包含了所有声音形式,这是因为计算机可以将任何声音信号通过采样、量化数字化,在必要的时候,还可以准确地将其恢复。语音:人的说话声不仅是一种波形,而且还通过语气、语速、语调携带着比文本更加丰富的信息。音乐:音乐是一种符号化了的声音,这种符号就是乐谱,乐谱则是转变为符号媒体形式的声音。第三十二页,共一百二十九页,2022年,8月28日声音媒体具有三个要素音调:与声音的频率有关,频率越快,音调就越高。第三十三页,共一百二十九页,2022年,8月28日音强:又称为响度,它取决于声音的振幅。振幅越大,声音就越响亮。音色:音色是由于波形和泛音的不同所带来的一个声音属性。《纯音》一般的声音由几种振动频率的波组成,若该声音只有一种振动频率就叫做纯音;《复音》由许多纯音组成,复音的频率用组成这个复音的基音频率表示,一般的乐音都是复音;《基音》是复音中频率最低部分的声音;《泛音》在一个复音中,除去基音外,所有其余的纯音都是泛音。第三十四页,共一百二十九页,2022年,8月28日主观打分是一种比较快捷、简单的衡量声音质量的方法。不同的应用对象,声音质量的衡量标准也不尽相同。声音质量的衡量第三十五页,共一百二十九页,2022年,8月28日3.1.2数字化声音信号声音是由物体的振动产生的,这种振动引起了周围空气压力的震荡,我们称这种震荡的函数表现形式为波形。第三十六页,共一百二十九页,2022年,8月28日
平时我们听到的大多数声音都是利用模拟元件对模拟信号处理产生的效果。
特点:连续性缺点:精度差、易于老化、易受周围环境影
若使用计算机处理声音信息,首先要解决的问题就是声音信号的数字化.第三十七页,共一百二十九页,2022年,8月28日采样量化的结果将用所得到的数值序列表示原始的模拟声音信号,这就是将模拟声音信号数字化的基本过程。采样量化声音的模拟信号声音的数字信号第三十八页,共一百二十九页,2022年,8月28日影响数字化声音质量的因素采样频率:每秒钟采取声音信号振幅数值的次数,单位是Hz。采样频率越高,数字化后的声音越接近原始声音,但需要的存储空间也越多。量化位数:表示采样数值所使用的二进制位数。二进制位数越多,表示的数值范围越大,量化后振幅的精度越高。声道数:有单声道和双声道两种。第三十九页,共一百二十九页,2022年,8月28日44.1kHz(高保真)
16位
2(立体声)8=176.4KB/秒=0.176MB/秒数字化声音文件的大小数据量(字节/秒)=采样频率量化位数声道数8一张CD光盘650MB/0.176MB=3693秒,约为1小时第四十页,共一百二十九页,2022年,8月28日3.1.4数字化音频信息的编辑与特效处理对于数字化后的波形声音文件,可以使用声音处理实用软件工具对其进行剪切、连接、混合、音调升降处理,并可以为其增加回音、频率过滤、边缘效果等特殊效果。第四十一页,共一百二十九页,2022年,8月28日3.2MIDI与音乐合成3.2.1什么是MIDI?MIDI(MusicalInstrumentDigitalInterface)是乐器数字接口的英文缩写,它是指数字乐器与计算机连接的接口,即在数字乐器与计算机相连接时所使用的可以直接插入在计算机串口上的一个小部件,通过它可以使数字乐器与计算机相互“沟通”信息。MIDI的特点是其文件内部记录的是演奏数字音乐的全部动作过程,所以其数据量相当小。第四十二页,共一百二十九页,2022年,8月28日在80年代,为了使各个厂商生产的设备可以被不同的计算机接收与处理,由几家电子乐器厂商共同制定一个MIDI接口标准,这就是我们常说的“GM(Gernera1MIDI)标准”。
这个标准主要由两部分组成:一是规定了与设备相连的硬件标准;二是规定了MID1数据的格式,主要包括硬件上传输信息的编码方式。
第四十三页,共一百二十九页,2022年,8月28日3.2.2音乐合成常见的音乐合成有两种方法:(1)调频合成法(FM合成法)这种合成技术是早期的电子合成乐器所采用的发音方式,它主要通过叠加不同频率的正(余)弦波,模拟真实的声音波形。
(2)波表合成法(WaveTable)这种合成技术是将各种真实的乐器声音录制下来,并保存在一个波形表格中。播放时根据MIDI文件记录的乐谱信息向波形表格发出指令,然后从中找出对应的声音信息,经过合成后回放出来。由于它采用的是真实乐器的采样,所以效果自然要好于FM。第四十四页,共一百二十九页,2022年,8月28日3.3.1语音识别的发展简史
1952年K.H.Davis用电阻、电容、电子管等分立元件,实现带通滤波器组进行语音频谱分析和匹配,对10个阿拉伯数字的识别率达到了98%。1960年RDenes等人共同研究成功第一个计算机语音识别系统,开创了计算机语音识别的新阶段
1958年,中国科学院声学研究所用电子管设备识别10个元音。1972年起开始用计算机识别语音。至今为止,汉语语音识别的研究工作基本跟上了国际语音识别的基本步伐,结合汉语的特点有些地方还有所独创。第四十五页,共一百二十九页,2022年,8月28日3.3.2语音识别第四十六页,共一百二十九页,2022年,8月28日语音识别的应用
理解特定人的口语辨认说话人:从一些人中辨认出某个人来,可以用于刑事侦查。确认说话人:确认说话人是指依据说话人说出的某个特定语句,确认说话者是其本人,可以用在银行系统中,验证确是顾客本人后才给予服务。
第四十七页,共一百二十九页,2022年,8月28日3.4声音文件的基本格式1.WAV文件:这是Windows环境使用的标准波形声音文件格式,扩展名为.wav。2.VOC文件:这是为特定音频卡设计的文件格式,它主要应用于DOS环境。3.MIDI文件:这是记录MIDI音乐的文件格式,后缀为.mid。与波形文件相比较,它记录的不是实际声音信号采样的数值,而是演奏乐曲的动作过程及属性,因此,它的数据量很小。第四十八页,共一百二十九页,2022年,8月28日4.mp3文件:这种文件格式是受MPEG技术启发产生的。由于它将.wav中的音频信息进行了很好地压缩,所以数据量很小,且保持音质不失真。
5.wma文件:这是微软公司新发布的一种音频压缩文件格式,这种文件格式与MP3相比具有采样频率范围更宽,有版权保护,数据量更小且不失真等优势。
6.ra文件:随着流媒体技术的发展,人们可以实现在网上边下载边收听歌曲,边下载边欣赏视频节目的愿望。这是为了解决网络传输带宽资源而设计的。第四十九页,共一百二十九页,2022年,8月28日3.5音频卡音频卡又称为声卡,是计算机处理声音信息的专用功能卡。音频卡通过一些外部接口实现声音信号的采集和播放。第五十页,共一百二十九页,2022年,8月28日3.5音频卡《音频卡的基本功能》(1)录制、编辑和回放数字声音文件;(2)在录制和回放声音文件时进行压缩和解压缩,以节省存储空间;(3)采用语音合成技术,使计算机能够朗读书面文字;(4)有乐器数字接口(MIDI)。(5)初步的语音识别。
第五十一页,共一百二十九页,2022年,8月28日第4章图形图像信息处理技术第五十二页,共一百二十九页,2022年,8月28日4.1色彩的基本概念人们对颜色感觉的形成有四个要素;即光源、物体、眼睛和大脑。这四个要素不仅使人产生颜色的感觉,而且也是人能正确判断色彩的条件。第五十三页,共一百二十九页,2022年,8月28日发射光及反射光反射光发射光发光物体呈现的颜色是由物体本身发出不同波长的光所造成;不发光物体呈现的颜色是光照射物体时被物体反射出的光所具有的。第五十四页,共一百二十九页,2022年,8月28日三基色原理红、绿、蓝三色光可以混合成自然界的全部色彩,而这三色光本身相互独立,所以人们常常将红、绿、蓝称为色光三原色。从生理学上讲:人们眼睛的视网膜上存在着三种不同类型的锥体细胞,它们分别对红、绿、蓝有很高的灵敏度(对不同波长有不同的灵敏度),物体反射光进入人眼睛以后,在三种锥体细胞的作用下,产生不同颜色的光感。这就是三刺激理论,又称三色学说理论。
第五十五页,共一百二十九页,2022年,8月28日度量色彩的三要素色调:由可见光谱中各分量成分的波长来确定,是彩色光的基本特性。饱和度:是指颜色的纯度,即掺入白光的深浅感觉。亮度:指彩色光对人眼引起的光刺激程度,显然它与光的能量有关。第五十六页,共一百二十九页,2022年,8月28日加色法颜色和减色法颜色加色法颜色是把不同的颜色相加得到的颜色。该系统中,没有任何颜色呈黑色,全部颜色出现时呈白色。加色法系统属于发射光,计算机监视器采用这个系统。加色法采用红、绿、蓝(RGB)三种颜色作为基色。第五十七页,共一百二十九页,2022年,8月28日减色法所得到的颜色是减后的颜色。没有任何颜色时呈白色,全部颜色都出现则呈黑色。减色法利用的是反射光原理。打印机采用此系统。反射光采用青色(Cyan)、粉红(Magenta)及黄(Yellow)三种颜色作为基色。由于打印墨的问题,往往需加一些黑墨,所以真正打印机处理的是四色。简称CMYK。第五十八页,共一百二十九页,2022年,8月28日色彩模型《HSB模型》HSB是艺术家习惯采用的颜色描述方法。Hue:色调Saturation:饱和度Brightness:亮度第五十九页,共一百二十九页,2022年,8月28日《RGB模型》自然界中绝大多数的色彩都可以用适当比例的三基原色混合组成的等效色来模拟。显示器这类发光物体用的就是RGB模型。红+绿=黄红+蓝=品红绿+蓝=青红+绿+蓝=白第六十页,共一百二十九页,2022年,8月28日《CMY模型》用彩色墨水或颜料进行混合,得到的颜色被称为减法色。从理论上说,任何一种颜色都可以用三种基本颜料按一定比例混合而成。这三种颜色是红、绿、蓝色的补色,即青(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY。第六十一页,共一百二十九页,2022年,8月28日《YUV模型》这是一种电视系统使用的色彩表示形式。其中Y表示亮度,U、V表示色差。所谓色差是指三原色信号分量与亮度信号之差。其特点:可以使黑白电视和彩色电视兼容可以利用人眼对彩色的敏感度低于对亮度的敏感度的视觉特性,将UV信息用较少的二进制位数表示,较窄的频带传送第六十二页,共一百二十九页,2022年,8月28日《矢量图形与位图图像的特点》矢量图像:用一组指令集合来描述图形的内容,这些指令用来描述构成该图形的所有直线、圆、矩形等图元。位图图像:图像是通过扫描仪、数字相机、摄像机等输入设备导入到计算机中的。它们将原始图像分成许许多多的点阵,我们将其称为像素。每个像素用若干个二进制位记录色彩、亮度等反映该像素属性的信息,并将每个像素的内容按一定的规则排列起来构成文件的内容,我们将用这种形式表示的图像称为位图图像,简称为图像。
4.2位图图像与矢量图形第六十三页,共一百二十九页,2022年,8月28日矢量图形的优缺点优点:适用于绘制简单的图形,占内存小,数据量比位图小,颜色数不影响文件的大小,易对个别图元进行编辑,放大缩小后输出的图形不失真。缺点:对于复杂图形,矢量命令会变得复杂,创建的图形不自然。由于矢量图形依赖于简单的图元,所以很难表现物体的复杂属性。不如位图表现的形象、逼真。第六十四页,共一百二十九页,2022年,8月28日位图的优缺点优点:自然、直观,容易描述细节内容,并可进行特殊效果的处理。缺点:数据量大,耗费存储。进行图像的放大、缩小和旋转等编辑处理较困难。第六十五页,共一百二十九页,2022年,8月28日矢量图形与位图的关系矢量图形的基本元素是图元位图概念的基本元素是像素。矢量图形的显示过程是依照图元绘制的顺序显示;位图的显示过程按照位图中安排的像素顺序显示,往往是从上到下,从左到右。第六十六页,共一百二十九页,2022年,8月28日矢量图形与位图的关系矢量图形可进行变换,无失真。图像变换会失真。矢量图形可以图元为单位单独进行属性修改编辑等操作,而位图不行。矢量图形实际上是对位图的抽象。第六十七页,共一百二十九页,2022年,8月28日分辨率屏幕分辨率:指显示屏幕上的最大显示区域,即水平和垂直方向的像素个数图像分辨率:指数字图像的尺寸,即水平和垂直方向的像素个数4.2图像的主要属性第六十八页,共一百二十九页,2022年,8月28日颜色深度位图矩阵中表示每个像素颜色的二进制位数称为位深度。常见的彩色或灰度图像位深度有:4位(24)16色8位(28)256色16位(216=65536)增强色24位(224=16777216)真彩色第六十九页,共一百二十九页,2022年,8月28日《图形的获取方式》利用软件绘图图形利用数字化仪绘制图形利用光笔绘制图形《图像的获取方式》利用扫描仪、数字摄象机等图像采集设备获取图像4.3图形图像的获取及表现第七十页,共一百二十九页,2022年,8月28日《图形图像的表现》呈现图形图像的主要设备有两类:光栅扫描显示和硬拷贝设备。目前,使用的主要光栅扫描显示部件是阴极射线管(CRT),图像打印机是典型的硬拷贝设备。第七十一页,共一百二十九页,2022年,8月28日
我们将图像采集到计算机中,常常要对其进行修版、编辑等处理。常见的操作有:图像几何运算、图像增强、图像复原和重建、图像分割和特征提取、图像编码和压缩等。4.4图像的加工处理第七十二页,共一百二十九页,2022年,8月28日图像几何运算图像几何运算包括对图像进行缩放、剪贴、平移、旋转和变形等操作。图像增强所谓图像增强是指增强图像中有用的信息,压低噪音。其目的有:一是处理原始图像使它更清晰、更适于人的观察;二是变换图像以方便人或机器的分析和处理。第七十三页,共一百二十九页,2022年,8月28日
图像复原和重建图像复原就是对退化或劣化的图像进行校正处理、滤去退化痕迹、恢复图像的本来面目。其原则应是尽可能复现或逼近无退化的真实图像。图像分割和特征提取图像分割是将图像分割成不同的部分或区域的过程。其目的是把图像分成一些有用的或有意义的部分或区域,以便进一步对图像进行分析与理解。图像特征提取就是检测和提取图像的特征。第七十四页,共一百二十九页,2022年,8月28日图像编码与压缩多媒体数据量极大,为了存储、传输和实时处理这些数据必须进行有效地压缩,只有这样才有可能播放出高质量的视频、音频。
640*480分辨率24位真彩色图像数据量约为900KB;
NTSC标准的帧速率为30帧/s,视频信号要求传输率为26.4MB/s;采样频率为44.1kHz,量化位数为16,双通道立体声,100MB仅能存储约10分钟。第七十五页,共一百二十九页,2022年,8月28日数据压缩的分类数据压缩是由两个过程组成的:编码过程:压缩解码过程:解压按失真性分为无损压缩有损压缩第七十六页,共一百二十九页,2022年,8月28日无损压缩:利用数据的统计统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩比较小,一般在2:1到5:1之间。这类方法广泛应用于文本数据、程序。有代表性的算法是:游程编码、Huffman编码、算术编码等等。第七十七页,共一百二十九页,2022年,8月28日有损压缩:利用人类视觉和听觉器官对图像或声音中的某些频率成分不敏感的特性,允许在压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但所损失的部分对理解原始图像或声音不会产生影响。有代表性的算法有:PCM、预测编码、变换编码、插值等等。第七十八页,共一百二十九页,2022年,8月28日视频编码的国际标准
静止图像压缩标准JPEGJointPhotographicExpertsGroup“多灰度静止图像的数字压缩编码”它是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。它包括无损压缩和有损压缩两部分。有损压缩的压缩比可达到20~40倍。第七十九页,共一百二十九页,2022年,8月28日运动图像压缩标准MPEGMovingPicturesExpertsGroupMPEG-1:针对传输率为1Mbit/s~1.5Mbit/s的普通电视质量的视频信号的压缩MPEG-2:针对每秒30帧的720*572分辨率的视频信号进行压缩MPEG-4:MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4是第一个使你由被动变为主动的动态图像标准,与MPEG1和MPEG2相比,MPEG4更加注重多媒体系统的交互性和灵活性。
第八十页,共一百二十九页,2022年,8月28日4.5图形图像的文件格式PCX格式:由Z-Soft公司设计。最初只支持16种颜色,现在可以支持256色甚至真彩色图像。使用游程长编码方法压缩,压缩比适中,速度较快。BMP和DIB格式:是Windows所使用的与设备无关的点位图文件存储格式。BMP文件有压缩和非压缩。支持各种颜色。第八十一页,共一百二十九页,2022年,8月28日GIF格式:全称是“图形交换文件格式”(GraphicsInterchangeFormat)由CompuServe开发,可支持黑白、16色和256色的彩色图像,采用IZW压缩算法,压缩比高。TIF格式:由Aldus和Microsoft合作开发。最初用于扫描仪和桌面出版业。分为压缩和非压缩两种。第八十二页,共一百二十九页,2022年,8月28日JPG和PIC格式:是AppleMac机器上使用的格式。最大特点是文件非常小,而且可以调整压缩比,但显示较慢,有一定的失真。PCD格式:是Kodak开发的照片文件格式,是Photo-CD的专用存储格式,一般存储在CD-ROM上,读取需要Kodak提供的专门软件。第八十三页,共一百二十九页,2022年,8月28日4.6显示系统及数字像机显示系统负责计算机的所有显示输出,它主要由显示器和显示适配器组成。显示器的英文名称是Monitor,“监视器”,其作用是将主机发出的信号经过一系列处理后转换成光信号,最后在屏幕上显示出各种文字、图形、图像等信息。目前市场上的显示器主要有两类:一类是CRT显示器;另一类是LCD显示器,LCD具有许多优点,它占空间小、低功耗、低辐射、无闪烁,可以降低视觉疲劳。第八十四页,共一百二十九页,2022年,8月28日CRT显示器的工作原理CRT显示器的核心部件是显像管,它直接决定了显示器的价格、性能和显示质量。它的基本工作原理是将显像管内部的电子枪阴极发出的大量电子束,经过强度控制、聚焦和加速,形成很细的电子流,高速、定点地去轰击荧光屏。荧光屏上的荧光粉经过电子的轰击发出亮光。荧光屏上的每一点(像素)都是由红、绿、蓝三原色组合而成,电子枪发出的三束电子按不同强度比例点亮荧光粉从而合成各种颜色。第八十五页,共一百二十九页,2022年,8月28日数字像机数字相机是一种新型的图像输入设备,它与普通照相机的主要区别有两点:1、是存储的照片不是实际的影像,而是一个个数字文件;2、是存储体不是传统的胶卷,而是数字化存储片。其特点有:由于每张照片以数字文件的形式存储,所以可直接导入计算机中,以便利用计算机对其进行加工、展示、永久性保存,并且具有保留时间长,质量高,可以无损坏地无限次复制等优点。第八十六页,共一百二十九页,2022年,8月28日第5章视频信息处理技术第八十七页,共一百二十九页,2022年,8月28日什么是“视频”?视频动态图像是由多幅连续的单帧图像序列构成的,当每一帧图像为实时获取的自然景物或活动对象时,称之为动态影像视频,简称动态视频或视频(Video)。第八十八页,共一百二十九页,2022年,8月28日数字视频数字视频就是对模拟视频信号进行数字化后的产物。模拟信号在时间和幅度上具有连续性,它是基于模拟技术以及图像显示的国际标准来产生视频画面的。它具有成本低、还原性好等优点,因此,我们从电视机中看到的大自然风景会让你具有身临其境的感觉。
第八十九页,共一百二十九页,2022年,8月28日数字视频的优点可无限复制而不失真可进行视频编辑,创意可将视频溶进计算机环境第九十页,共一百二十九页,2022年,8月28日几个概念电视扫描:逐行扫描、隔行扫描长宽比例:4:3、16:9同步信号:水平时序信号、垂直时序信号水平分辨率:取决于扫描敏感点的大小垂直分辨率:取决于一帧的扫描行数扫描频率:指屏幕刷新的速度
第九十一页,共一百二十九页,2022年,8月28日电视制式所谓电视制式,实际上是一种电视显示的标准。不同的制式,对视频信号的解码方式、色彩处理的方式以及屏幕扫描频率的要求都有所不同,因此如果计算机系统处理的视频信号的制式与连接的视频设备的制式不同,在播放时,图像的效果就会有明显下降,甚至根本无法播放。第九十二页,共一百二十九页,2022年,8月28日NTSC制式NTSC是NotionalTelevisionSystemCommitte的缩写,译为国家电视制式委员会。它是1953年美国研制成功的一种兼容的彩色电视制式。它规定每秒30帧,每帧526行,水平分辨率为240~400个像素点,隔行扫描,扫描频率60Hz,宽高比例4:3。第九十三页,共一百二十九页,2022年,8月28日PAL制式PAL是phaseAlternateLine的缩写,译为相位逐行交换。它是前联邦德国1962年制定的一种电视制式。它规定每秒25帧,每帧625行,水平分辨率为240~400个像素点,隔行扫描,扫描频率50Hz,宽高比例4:3。第九十四页,共一百二十九页,2022年,8月28日SECAM制式SECAM是SequentialColorMemorySystem的缩写,译为顺序传送彩色存储。它是法国于1965年提出的一种标准。它规定每秒25帧,每帧625行,隔行扫描,扫描频率为50Hz,宽高比例4:3。上述指标均与PAL制式相同,不同点主要在于色度信号的处理上。第九十五页,共一百二十九页,2022年,8月28日HDTV
HDTV是HighDefinitionTV的缩写,译为高清晰度电视。它是目前正在蓬勃发展的电视标准,尚无完全统一,但一般认为:宽高比例16:9,每帧扫描在1000行以上,采用逐行扫描方式,有较高扫描频率,传送信号全部数字化。第九十六页,共一百二十九页,2022年,8月28日全屏幕视频全屏幕视频是指显示的视频图像充满整个屏幕,因此它与显示分辨率有关,对于标准VGA全屏幕意味着640480分辨率,而对于SuperVGA则可以是800600或1024768等分辨率。在Windows环境中,提供了播放视频文件默认窗口大小的设置。
第九十七页,共一百二十九页,2022年,8月28日全运动视频全运动视频是指以每秒30帧的速度刷新画面,只有到达这个速度,才不会产生闪烁和不连贯的现象。
第九十八页,共一百二十九页,2022年,8月28日动态图像数据的特点动态图像具有时间连续性,故非常适合于表示“过程”;数据量大;动态图像的帧与帧之间具有很强的相关性;动态图像对实时性要求得很高第九十九页,共一百二十九页,2022年,8月28日
视频信号的获取方法摄象机录象机电视机模拟视频信号压缩存储数字视频信号视频卡A/D第一百页,共一百二十九页,2022年,8月28日视频信息的处理对视频信息可以实施的编辑操作包括剪切、复制、粘贴片断,与音频片段合成,调整叠加透明度,增加场景过渡特技,滤镜效果、叠加字幕等。
第一百零一页,共一百二十九页,2022年,8月28日视频文件的格式AVI文件格式:AVI是AudioVideoInterleaved的缩写MOV文件格式:MOV文件格式是QuickTime视频处理软件所选用的视频文件格式MPG文件格式:是采用MPEG方法进行压缩的全运动视频图像文件格式DAT文件格式:是VCD和卡拉OKCD数据文件的扩展名,也是基于MPEG压缩方法的一种文件格式第一百零二页,共一百二十九页,2022年,8月28日视频卡所谓视频卡就是PC机上用于处理视频信息的设备卡,其主要功能是将模拟视频信号转换成数字化视频信号或将数字信号转换成模拟信号。
第一百零三页,共一百二十九页,2022年,8月28日视频卡的分类视频采集卡:用于将摄像机、录像机等设备播放的模拟视频信号经过数字化采集到计算机中;压缩/解压缩卡:用于将静止和动态的图像按照JPEG/MPEG标准进行压缩或还原;视频输出卡:用于将计算机中加工处理的视频信息转换编码,并输出到电视机等设备上;电视接收卡:用于将电视机中的节目通过该设备卡的转换处理,在计算机的显示器上播放。第一百零四页,共一百二十九页,2022年,8月28日流媒体技术简介
近年来,互联网的应用规模迅速扩展,更多的宽带用户希望能够通过网络去观看电影、收听广播、进行视频会议等。如果单纯的希望带宽的扩充显然是不现实的,因此要实现网上音频、视频传播就必须在传播文件本身下功夫,流媒体技术就在这样的背景下应运而生。第一百零五页,共一百二十九页,2022年,8月28日流媒体的概念
流媒体(StreamingMedia)简单来说就是应用流媒体技术在网络上传输的音频、视频等多媒体格式的文件。而流媒体技术就是把连续的视频和音频信号经过压缩处理后放上网站服务器,让用户实时的观看、收听,而不需要把整个文件下载到自己机器后才可以使用的的网络传输技术。第一百零六页,共一百二十九页,2022年,8月28日流媒体技术的基本原理首先,流媒体技术采取了降低音频、视频文件的品质并且对文件进行高效压缩的手段,使得音频、视频文件的体积大大减小以适应网络的传输。其次,流媒体技术先在客户端的电脑上创造一个缓冲区,在播放媒体文件之前预先下载一段资料作为缓冲,避免播放的中断。科学家还制订了一些专门针对于音频和视频文件的网络传输协议,例如实时传输协议(RTP)和实时流协议(RTSP)等。第一百零七页,共一百二十九页,2022年,8月28日流媒体播放平台和文件格式1.Realnetworks公司
Realnetworks是流媒体技术的先行者,它最大优势在于其采用了自己开发的RTSP协议来传输多媒体数据,并且采用专门的服务器来做为流媒体服务器,该公司主要开发的流媒体文件格式有RM、RA、RAM。2.Mircosoft公司
Mircosoft公司在Windows系列操作系统中捆绑了自己的媒体播放器WindowsMediap1ayer,这使得WindowsMediap1ayer占据了很大一部分市场份额。该公司主要开发的流媒体文件格式有ASF、ASX、WMA、WMV等。3.App1e公司相对而言,App1e的流媒体播放平台Quicktime在完整性和兼容性上处于劣势,而且价格相对较高。只是在一些习惯使用MAC计算机和有其他特殊要求的用户中有一些市场,很多专业美工设计人员还是习惯于使用Quicktime作为App1eMAC平台上的首选媒体播放器。第一百零八页,共一百二十九页,2022年,8月28日流媒体技术的应用1.网络电台和电视台流媒体技术支持单播、组播、点播、广播的播放方式,同一台流媒体服务器可以同时接受多个用户进行随意的点播,也可以像广播电台和电视台一样随时向网络上发布音频和视频信息。2.网络直播流媒体技术的发展使得网络直播成为可能。3.远程会议基于流媒体技术平台的远程会议系统能够轻易的使处在全球不同国家的人能够通过网络进行面对面的交流。4.近程教育通过网络进行远程教学是一个综合性的系统,采用流媒体技术进行远程教学的系统能够为教师和学生提供更加直接的交流方式。学生可以看到教师的讲解过程,而教师也可以像在真实的课堂中一样提问学生,这使得教学的效果更好。第一百零九页,共一百二十九页,2022年,8月28日第6章光存储技术第一百一十页,共一百二十九页,2022年,8月28日磁存储介质的优缺点存储密度高、易于读写,但长期保存也存在着风险性,气候环境、磁环境、人为因素都有可能破坏磁记录,造成不可挽回的损失。利用磁技术对数据进行读写。对应的存储介质为磁盘,磁带等。磁存储技术第一百一十一页,共一百二十九页,2022年,8月28日
光存储技术随着激光技术的产生和发展,科技工作者研究出了利用激光进行高密度数据存储的技术光存储技术是通过光对数据进行写入和读出的存储技术。由于使用的是激光,因而对应的存储介质--盘称作光盘。第一百一十二页,共一百二十九页,2022年,8月28日光盘系统光盘系统是由光盘驱动器和光盘片组成。驱动器是用于读/写信息的设备,而光盘片是用于存储信息的介质。第一百一十三页,共一百二十九页,2022年,8月28日光盘的分类
只读光盘(CD-ROM)
一次写多次读光盘(CD-R,WORM)
可擦写光盘第一百一十四页,共一百二十九页,2022年,8月28日光存储介质特点密度高,存储容量大采用非接触方式读/写信息能自由更换光盘不易划伤无磨损可长期保存信息第一百一十五页,共一百二十九页,2022年,8月28日光盘的ISO标准——红皮书CD-DA:CDAudio激光唱盘标准由荷兰Philips公司和日本Sony公司共同制订内容为记录音频的标准。第一百一十六页,共一百二十九页,2022年,8月28日光盘的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论