版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多媒体技术基础多媒体技术的基本知识1、媒体的基本概念媒体(Media)是指信息的表现形式或传播的载体,如文字、图形、图像、声音、动画和视频等。2、媒体的类型媒体有5种类型:感觉媒体、表示媒体、显示媒体、存储媒体、传输媒体。3、多媒体的基本概念多媒体(Multimedia)可以理解为文字、图形、图像、声音、动画和视频等多种媒体合成的人—机交互信息和传播媒体。计算机能处理的多媒体信息从时效上可分为两大类:静态媒体:包括文字、图形、图像。动态媒体:包括声音、动画和视频。4、多媒体技术的基本概念多媒体技术是指利用计算机技术把多种媒体信息综合一体化,使它们建立起逻辑联系,并能进行加工处理的技术。是一种基于计算机的综合技术,包括数字化信息的处理技术、音频和视频技术、计算机硬件和软件技术、人工智能和模式识别技术、通信和图像处理技术等,因而是一门跨学科的综合技术。5、多媒体信息的类型多媒体信息是指多媒体应用中可显示给用户的信息形式。在多媒体对象的表示中,含有多种不同的数据类型。基本类型包括:文本、图形、图像、音频、视频和动画。文本:是以文字和各种专用符号表达的信息形式,是现实生活中使用得最多的信息存储和传递方式。另外还有一种称为“超文本”它主要是指在计算机上处理文本时能链接到与文本相关联的内容,让计算机能够响应人的思维充及能够方便地获取所需要的信息。实际上,“超文本”的真正含义是“链接”的意思,通过链接将相关内容组织在一起,方便用户浏览信息。图形:是指从点、线、面到三维的黑白或彩色几何图,一般指用计算机绘制的画面。由于图形文件中只记录生成图的算法图上某些特征点(图形的大小、颜色及位置等),因此称为矢量图。图像:是指通过绘制、摄制或印制的形象。可由输入设备(扫描仪、数码相机、摄像机)进行画面录入,数字化后以位图形式存储。常用AdobePhotoshop等图像处理软件进行处理。音频:音频(Audio)包括音乐、话语以及各种动物和自然界(如风、雨、雷等)发出的各种声音。在计算机中的音频处理主要包括声音的采集、量化和编辑过程把模拟信息转化为离散的数字信息进行存储、处理和传输。动画:动画(Animation)就是运动的图画。动画是利用人的视觉暂留特性,在人脑中产生物体运动的形象。可以通过Flash、3DMAX等软件制作。视频:视频(Video)是一系列的静态图像或图形在一定时间内连续变化的结果。通过录像带、摄像机、影碟机等视频信号源设备获取。按照信息载体的不同,分为数字视频和模拟视频。6、多媒体技术的基本特性多媒体是一门综合性的高新技术,强调的是交互式综合处理多种信息媒体的技术。因此,多媒体技术的特性在于信息载体的多样性、交互性、集成性和实时性,其中“集成性”是多媒体技术的主要特征。多样性所谓多样性是指信息媒体多样化或多维化,这些信息媒体包括文字、声音、图形、图像、动画、活动影像等。交互性交互性是指用户与计算机之间进行数据交换、媒体交换和控制权交换的一种特性,提供了用户更加有效地控制和使用信息的手段,是多媒体技术的关键特性。集成性多媒体的集成性包括两方面,一是多种信息媒体的集成,二是处理这些媒体的设备和系统的集成。实时性当多媒体集成时,其中的声音和运动图像是与时间是密切相关的,因此,多媒体技术必然要支持实时处理,这是传达声音和图像所必需的。例如视频会议系统是一种实时的多媒体软件应用的实例,要求传输的声音和图像必须同步等。7、多媒体信息处理的关键技术(1)多媒体数据压缩/解压缩技术多媒体数据压缩技术是多媒体技术中的核心技术。多媒体信息数字化后的数据量非常庞大,采用先进高效的压缩和解压缩编码算法对数字化后的视频和音频信息进行处理,即可节省存储空间,又可提高传输效率。(2)多媒体数据存储技术多媒体技术是所有计算机应用领域中信息量最大的领域,如何实现大容量信息的存储必将是多媒体技术关键所在,实现这一技术主要还是依靠数据的压缩和解压缩。(3)多媒体专用芯片技术专用芯片是多媒体计算机硬件体系结构的关键。多媒体计算机专用芯片可归纳为两类:一类是固定功能的芯片;另一种是可编程的数字信号处理器(DSP)芯片。(4)多媒体输入与输出技术多媒体输入/输出技术包括媒体变换技术、媒体识别技术、媒体理解技术和媒体综合技术。(5)多媒体软件技术多媒体软件技术主要包括:多媒体操作系统、多媒体素材采集与制作技术、多媒体编辑与创作工具、多媒体数据库技术、超文本/超媒体技术和多媒体应用开发技术。(6)多媒体通信技术多媒体通信技术包含语音压缩、图像压缩及多媒体的混合传输技术。宽带综合业务数字网(B—ISDN)是解决多媒体数据的传输问题的一个比较完整的方法。其中ATM(AsynchronousTransferMode,异步转移模式或异步传输模式、异步传送模式)是B—ISDN的核心技术。(7)虚拟现实技术就是采用计算机技术生成一个逼真的视觉、听觉、触觉及味觉等的模拟现实环境,用户可以直接用人的技能和智慧对这个生成的虚拟实体进行考察的操纵。8、多媒体技术的应用领域及发展趋势(1)多媒体技术的应用领域近年来,多媒体技术得到迅速发展,其主要的应用领域有教育与培训、桌面出版与办公自动化、多媒体电子出版物、多媒体通信、多媒体信息咨询系统、家庭信息中心等。随着多媒体技术的发展,多媒体的应用前景将十分广阔。随着流媒体技术的发展,人们可以通过多媒体网络进行收听、观看动态的音、视频信息。所谓流媒体是一种可以使音频、视频等多媒体文件能在Internet上以实时的、无需下载等待的流式传输方式进行播放的技术。例如互联网直播、VOD(VideoOnDemand)视频点播技术、网络远程教育模式、视频会议系统。21世纪将是多媒体迅速发展的年代,也是多媒体应用不断拓展的年代。展望不久的将来,视频压缩传输、模式识别、虚拟实现、多媒体通信等尖端技术的民发展,会改变整个人类的生活方式。(2)多媒体技术的发展趋势多媒体技术的发展览多种多样的,但总的发展趋势是:一是数字通信网络发展趋势,与宽带网络通信等技术相互结合,使多媒体技术进行科研设计、企业管理、办公自动化、远程教育、远程医疗、检索咨询、文化娱乐、自动测控等领域;二是多媒体终端的部件化、智能化和嵌入化,提高计算机系统本身的多媒体性能,开发智能化家电。二、多媒体信息处理多媒体信息处理是指对文字、声音、图形、静态影像、活动影像等多媒体信息在计算机运算下的综合处理。多媒体采用数字化方式对声音、文本、图形、图像和视频等媒体信息进行展示和处理。对声音、图像和视频信息,计算机通过采样、量化和编码将其数字化,再通过数字化的方法对其进行表示、处理和显示。1、数字音频(1)数字音频概念与传统的模拟音频技术不同,数字音频系统是通过将声波波型转换成一连串的二进制数据来保存和还原原始声音的。分为三个步骤:一是采样,通过模数转换器(A/D)以每秒上万次的速率对声波进行采样;二是量化,系统会将采样得到的振幅转化成数据并分配一定的存储位(bit)来存储,位数越多,声波的还原就越细腻;三是编码,即按照一定的规律,把量化后的值用二进制数字表示,然后转换成二值或多值的数字信号流。数字化音频的质量主要取决于采样频率和量化位数这两个参数。①采样频率数学家奈奎斯特特已证明,要获得一个无损的采样,就必须以波形最高允许频率的两倍作为采样频率。人类能够接受的听觉带宽是20~40KHZ。为了保证声音不失真,采样频率应在40KHZ。常用的音频采样频率有11.05KHZ(语音效果)、22.05KHZ(音乐效果)、44.1KHZ(高保真效果)。②量化将采样后得到的音频信息数字化的过程称为量化。系统中的量化精度的bit数目直接决定了采用多少个“台阶”来表示声波振幅的范围(即动态范围)。当数字音频系统中的量化bit数量每增加一个bit,用来表示音量大小的“台阶”就增多一倍,其动态范围也要相应增加,增加幅度为6dB/(1—bit)。在多媒体个人计算机中一般为了获得较好采样音质,往往选用字长16bit或32bit进行采样。③编码数字化的波形声音是一种使用二进制表示的串行比特流,它遵循一定的标准或规范进行编码,其数据是按时间顺序组织的。波形声音的主要参数包括:采样频率、采样精度、声道数目、使用的压缩编码方法以及比特率,也称为码率,它指的是每钞钟的数量量。数字声音未压缩前,码率的计算公式是:波形声音的码率=取样频率×量化位数×声道数由于声音的数字化,将有大量的数据需要计算机存储,如果对这些音频数据不加编码压缩,则很难在个人计算机上实现多媒体功能。鉴于人类听觉的生理特性,只有对20HZ~20KHZ范围内的声音可听到,其他范围内即使有声音也听不到,因而可实现高压缩比。AC—1,每代数字音频编码系统。AC—2是一种自适应变换算法,录音棚和影视后期制作设施中采用该技术,从而实现远程监控和对话复录会议等目的。杜比数字(AC—3)是声名远播的数字技术。该技术可以传输和存储多达5个全频带声道,以及一个低频效果声道。MLP无损压缩技术是一个真正“无损”编码系统,是DVD—Audio的核心技术,提供多达5.1个纯净、无损的全频带声道。所有的DVD—Audio播放器都具备MLPLossless解码。AAC高级音频编码是一种高质量感谢性音频编码技术,应用于广播和网络音乐下载,AAC的编码效率优于MP3。作为MP3的继任者,AAC现在已经获得了越来越多软硬件生产商的支持。苹果iPod和苹果iTunes支持AAC格式。(2)常用的声音压缩标准压缩算法包括有损压缩和无损压缩;有损压缩是指解压后数据不能完全复原,要丢失一部分信息。根据不同的应用,可以选用不同的压缩编码算法,如PCM(脉冲编码调制)编码,ADPCM(自适应差分脉冲编码调制)编码,MPEG—1、MPEG—2等。MPEG的全称是运动图像专家组(MovingPictureExpertsGroup),是专门制定多媒体领域内的国际标准,负责开发电视图像数据和声音数据的编码、解码和它们的同步等标准。这个专家级开发的标准称为MPEG标准,已经开发并常用的MPEG标准有MPEG—1、MPEG—2、MPEG—4等。其中,MPEG—1的声音压缩编码标准分为三个层次:层1(layer1)的编码较简单,主要用于数字盒式录音磁带;层2(layer2)的算法复杂度中等,其应用包括数字音频广播(DAB)和VCD等;层3(layer3)的编码较复杂,主要应用于因我网上高质量声音的传输,如今流行的MP3音乐就是一种采用MPEG—1层3编码的高质量数字音乐。最新的MPEG—4是下一代全球多媒体标准,该规范于2000年正式成为一项国际标准。MPEG—4传输速率在1800~6400bps之间,分辨率为176×44。因此,它将在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、Internet/intranet上的视频流与可视游戏、DVD上的交互多媒体应用等方面大显身手。(3)声音文件的存储格式声音文件格式很多,但目前比较流行的有以下几种:①WAV文件格式。WAV是Windows使用的标准数字音频文件格式,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。②MIDI文件格式。MIDI格式的声音文件记录的不是数字化后的声音波形数据,而是一系列描述乐曲的符号指令。相同音乐的情况下,MIDI格式文件比WAV格式文件小很多,它是目前最成熟的音乐格式,文件的长度非常小。③CDAudio音乐CD其扩展名为CDA,是唱片采用的格式,记录的是波形流。但是无法编辑,文件长度太大。④MP3文件格式MP3是MPEGLayer3和简称。是现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和CD唱片相比,音质不能令人非常满意。⑤RA和RM文件格式这种格式的高压缩量比和极小的失真使其在众多格式中脱颖而出。RA也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。⑥WMA文件格式WindowsMediaAudio(WMA)是由微软公司制定的一种流式声音格式。采用格式WMA压缩的声音文件比由相同文件转化而来的MP3文件要小得多,而且在音质上也不逊色。(4)语音识别声音是人类信息交流最自然的一种方式,随着声音数字化技术的不断成熟,数字语音的应用领域日趋广泛,人机交互更加自然。目前数字语音的应用大都集中在语音识别和语音合成两个方面。在语音识别方面,我国成功研发了汉字的语音输入,其正确率可达90%。而文—语转换则是语音合成方面一个较有发展前途的应用。(5)常用的音频处理软件①Windows内置的“录音机”软件使用“录音机”可以录制、混合、插入和编辑声音文件(.wav)文件,也可以将声音文件链接或者插入到另一文档中。“录音机”是通过麦克风和已安装的声卡来记录声音的,所录制的声音以文件.wav保存。②音频处理软件CoolEditCoolEdit2000是一个功能强大的音乐编辑软件,能高质量地完成录音、编辑、合成等多种任务,只要拥有它和一台配备了声卡的电脑,也就等于同时拥有了一台多轨数码录音机、一台音乐编辑机和一台专业合成器。CoolEdit2000能记录的音源包括CD、卡座、话筒等多种,并可以对它们进行降噪、扩音、剪接等处事,还可以给它们添加立体环绕、淡入淡出、3D回响等奇妙音效,制成的音频文件,除了可以保存为常见的.wav、.snd和.voc等格式外,也可以直接压缩为MP3或CoolEdit2000(.rm)文件,放到互联网上或通过E-mail发送给朋友,大家共同欣赏。当然,如果需要,你还可以记录到CD上。甚至,借助于CoolEdit2000对采样频率为96KHZ、分辨率为24位录音的支持,你还可以制作更高品质的DVD音频文件。2、图形和图像(1)色彩的基本概念①色彩的三要素任何一种颜色都可以用色相、明度和纯度这3个物理量来确定,称为色彩的三要素。色相:即色彩的相貌和特征。自然界中色彩的种类很多,色相指色彩的种类和名称。如:红、橙、黄、绿、青、蓝、紫等颜色的的变化就叫色相。明度:指色彩的亮度或明度。颜色有深浅、明暗的变化。如深黄、中黄、淡黄在明度上就不一样;紫红、深红、大红等在亮度上也不尽相同。这些颜色在明暗、深浅上的不同变化。纯度:指色彩的鲜艳程度,也叫饱合度。原色是纯度最高的色彩,颜色混合的次数越多,纯度越低。②三基色人们在对人眼进行实验时发现:只要用3种不同颜色的我按一定比例混合主可以得到自然界中绝大多数的颜色。通常把具有这种特性的3种颜色称为三基色。彩色电视中使用的三基色就是红(R)、绿(G)、蓝(B)三色。(2)数字图像的分类计算机中的图像有两类:一类是位图(也叫点阵图),另一类是矢量图。通常把点阵图称为图像,矢量图称为图形。矢量图是用一系列计算机维为描述的,一幅图由一系列图元,如点、线、面等组成。位图是用像素点来描述的,即描述每个像素点的颜色和亮度。由于矢量图和位图的表达方式和产生方式不同,因而两者都具有不同的特点。位图可以采用将自然图像进行转换的方式来获取,这个过程称为图像的扫描。一幅位图是由许多描述每个像素点的数据组成的,这些数据通常称为图像数据,而这些数据作为一个文件来存储,称为图像文件。(3)图像的主要参数①图像分辨率与显示分辨率图像分辨率即图像中每单位长度的像素数目,通常以像素/英寸(dpi)表示。显示分辨率有最大显示分辨率和当前显示分辨率之分。最大分辨率即显示器分辨率,取决于显示器的大小和显示卡的参数;当前显示分辨率由当前在操作系统的设置来选择的。②图像色彩尝试与色彩类型图像色彩深度是指位图中记录每个像素点所占的位数,它决定了彩色图像中可出现的最多颜色数。颜色模式除了确定图像中能显示颜色数之外,还影响图像的通道数和文件大小。常用的颜色模式有RGB和CMYK模式。RGB模式就是给彩色图像中每个像素的R(红)、G(绿)、B(蓝)三个分量各分配一个0~255范围的强度值。这三种颜色混合可产生256×256×256=16777216种不同的颜色。CMYK模式是一处基于印刷处理的颜色模式,CMYK模式对应的是印刷用的四种油墨颜色,即青(C)品红(M)黄(Y)黑(K)。(4)图像数据的容量在扫描生成一幅图像时,实际上就是按一定的图像分辨率和一定的图像色彩尝试对模拟图片或照片进行采样,从而生成一幅数字化的图像。图像的分辨率越高,图像色彩深度越深,则数字化后的图像效果就越逼真,数据量就越大。图像数据量=图像的总像素×图像色彩深度/8(Byte)例如,一幅1024×768真彩色(24位)的图像,其文件大小为:1024×768×24/8=2359296Byte=2.25MB(5)图像压缩的基本概念数字图像由于数据量很大,不仅占用存储空间,而且影响到。因此,图像处理的重要内容之一就是图像的压缩编码。图像的压缩可采用无损压缩和有损压缩两种方法。无损文件可以完全还原,不会影响文件内容;而有损压缩损失一定的信息,但所损失的信息对人眼观看图像的影响很小甚至不影响。压缩前的图像数据量图像压缩的主要参数之一是图像压缩比,定义如下:压缩前的图像数据量压缩后的图像数据量图像数据压缩比=压缩后的图像数据量常见的静态图像压缩标准有JPEG标准和JPEG2000标准。JPEG标准是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。更高压缩率以及更多新功能的新一代静态图像压缩技术JPEG2000随着多媒体应用领域的激增而诞生了。(6)常用图像文件格式图像文件常见的格式包括:JPEG、BMP、PSD、GIF、PDF、TIF、AI等。JPEG文件格式。JPEG文件格式采用有损压缩,是互联网上最常用的图片文件格式之一。BMP文件格式。该格式是Windows操作系统中“画图”程序的标准文件格式,采用无损压缩,但文件尺寸较大。PSD和PDD文件格式。是Photoshop软件的专用文件格式,能保存图层、通道、路径等信息,缺点是保存文件较大。GIF文件格式。只能处理256种色彩,常用于网络,其传输速度要比其他格式的文件快很多,并且可以将多张图像存成一个文件而形成动画效果。PDF文件格式。专为网上出版而制定的,是网络信息交流经常使用的文件格式。TIF文件格式。用于在不同应用程序和计算机平台之间交换文件。主要用于出版和印刷行业。AI文件格式。是Illustrator的源文件格式。在Photoshop软件中可以将保存了路径的图像文件输出为AI格式,然后在Illustrator和CorelDRAW软件中直接打开它并进行修改处理。3、动画按照计算机处理动画的方式划分,可分为造型动画和帧动画两种。造型动画属于三维动画,而帧动画一般属于二维动画。常见的动画制作工具有Flash、3DMAX、MAYA等软件。4、视频(1)基本概念视频信号是指连续的随着时间变化的一组图像(24帧//秒、25帧//秒、30帧/秒),又称运动图像或活动图像。常用的视频有电影、电视和动画。视频信号分为模拟和数字两种。在模块视频中,常用两种视频标准:NTSC制式(30帧//秒,525行/帧)和PAL制式(25帧//秒,625行/帧);我国广播电视采用的是PAL制式。(2)视频的数字化从模拟视频到数字视频的过程需要计算机和视频采集卡,视频采集卡负责将模拟信号数字化。视频采集卡一般提供1394插口,通过1394口连接到摄像机的1394端口,并将数字化的数据进行压缩,编码成数字视频文件保存到硬盘上。(3)视频压缩对视频数据进行压缩有两种基本途径:一是通过硬件,如视频采集卡;另一种是通过软件的方式,这种软件也称视频编码器(Codes)。视频压缩有无损压缩和有损压缩。目前视频压缩编码标准主要有MPEG—1、MPEG—2、MPEG—4。MPEG—1是用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码格式,VCD采用的就是该标准。MPEG—2平均传输速率可达9.8Mbps,已成为DVD指定标准广泛应用在广播级别的数字电视、多媒体宽带网络上。MPEG—4主要针对互联网上流媒体、语言传送、互动电视广播等技术发展要求,它的传输速率在4.8~64Mbps。常用的视频文件格式不同的视频编码器会有不同的视频文件格式,它可分为两大类:一类是影像文件,另一类是流式视频文件。①影像视频文件格式AVI格式。即音频视频交错格式,该格式的缺点是体积过于庞大。MOV(QuickTime)格式。它是Apple计算机公司开发的一种音频、视频文件格式。QuickTim文件格式作为开发MPEG—4规范的统一数字媒体存储格式。MPEG格式。家里常看到的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩的方法来减少运动图像中的冗余信息。目前MPEG格式有三个压缩标准,分别是MPEG—1、MPEG—2、MPEG—4。②流媒体文件RM格式。可以根据不同的网络促进会办事謴写出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。使用RealPlayer进行播放。ASF格式。使用了MPEG—4压缩算法,压缩率和图像的质量都很不错,事使用Windows自带的Windows确MediaPlayer进行播放。WMV格式。主要优点包括可扩充的媒体类型、本地网络回放、可伸缩的媒体类型、多语言支持。RMVB格式。是RM格式升级延伸出的新视频格式,该格式在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量。三、多媒体计算机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024货物道路运输合同样书范文
- 2024至2030年中国磁悬浮实验装置行业投资前景及策略咨询研究报告
- 2024至2030年中国滑动水口行业投资前景及策略咨询研究报告
- 2024至2030年中国橡木条凳数据监测研究报告
- 2024至2030年中国指南温度计数据监测研究报告
- 2024至2030年中国多工位织物印刷机数据监测研究报告
- 《100% 可再生能源供应合同》
- 福建省电力有限公司农网配电设施改造技术规范(试行)
- 浙江省杭州市2025届高三年级上学期期中教学质量检测语文试题及答案
- 广东省2025届普通高中毕业班第二次调研考试 生物试卷(含答案解析)
- (完整版)二年级乘除法竖式计算
- 60立方油罐容积细表
- -精神病医院设置基本标准
- 铝土矿采矿项目可行性研究报告写作范文
- A01083《纳税人(扣缴义务人)基础信息报告表》
- 元旦、春节前我市建筑领域农民工工资支付工作通知
- 医疗废物流失泄漏应急处理流程图
- 长方形、正方形的面积和周长复习课件
- 信号与系统(第十章Z-变换)
- 广东省高级人民法院民一庭关于建设工程施工合同纠纷案件若干问题的意见
- 家装施工组织设计方案模板
评论
0/150
提交评论