第6章多媒体技术课件_第1页
第6章多媒体技术课件_第2页
第6章多媒体技术课件_第3页
第6章多媒体技术课件_第4页
第6章多媒体技术课件_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章多媒体技术7.1多媒体技术概述媒体(medium)是指人们用于传播和表示各种信息的载体,媒体分有感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体五大类。媒体7.1.1多媒体技术的基本概念1.媒体、多媒体和多媒体技术7.1.1多媒体技术的基本概念多媒体是指利用计算机交互式综合技术和数字通信网技术处理文本、图形/图像和声音等多种媒体,使多种信息建立逻辑连接,集成一个交互系统。多媒体多媒体技术是指利用计算机技术把多种媒体信息综合一体化,使它们建立起逻辑联系,并能进行加工处理的技术。多媒体技术7.1.1多媒体技术的基本概念2.多媒体技术的特点主要表现在两个方面,首先是处理对象的多样性,其次是涉及媒体种类的多样性。多样性交互性是多媒体有别于传统信息交流媒体的关键特性。传统信息交流媒体只能单向地、被动地传播信息,而多媒体技术则可以实现人对信息的主动选择和控制,用户可以根据自己的意愿来选择信息的呈现范围和方式。交互性所有信息都是通过数字化编码后的结果,采用数字化信息有效地解决了数据在处理传输过程中的失真问题数字化集成性主要表现在两个方面,即信息媒体的集成和处理工具的集成。集成性1985年1986年1987年1993和1995年1997年1984年1985年8月美国Apple公司在研制Macintosh计算机时,创造性地使用了位映射(bitmap)、窗口(windows)、图标(icon)等技术。7.1.2多媒体技术的发展1985年1986年1987年1993和1995年1997年1984年1985年8月美国Commodore公司率先推出了世界上第一台多媒体计算机Amiga。7.1.2多媒体技术的发展1985年1986年1987年1993和1995年1997年1984年1985年8月美国Microsoft公司借鉴Apple公司在Macintosh计算机上所使用的技术而推出了运行在DOS基础上的Windows系统。

7.1.2多媒体技术的发展1985年1986年1987年1993和1995年1997年1984年1985年8月交互式紧凑光盘系统CD-I的出现,将多种媒体信息以数字化的形式,存储在650MB的只读光盘上,使用户可交互地读取光盘中的内容。

7.1.2多媒体技术的发展1985年1986年1987年1993和1995年1997年1984年1985年8月交互式数字视频系统-DVI的出现,DVI以计算机为基础,用光盘存储和检索图像、声音以及其他的信息。

7.1.2多媒体技术的发展1985年1986年1987年1993和1995年1997年1984年1985年8月1993年5月提出了MPC-2标准;1995年6月提出了MPC-3标准。

7.1.2多媒体技术的发展1985年1986年1987年1993和1995年1997年1984年1985年8月美国Intel公司推出了具有MMX(多媒体扩展指令集)技术的奔腾处理器,使它成为多媒体计算机硬件体系的一个标准。

7.1.2多媒体技术的发展7.1.3多媒体计算机系统多媒体计算机MPC(MultimediaPersonalComputer)是具有多媒体功能的能综合处理文字、图形图像、声音、视频和动画的,并使多种媒体建立联系且具有交互能力的计算机。多媒体计算机由多媒体硬件系统和多媒体软件系统组成。多媒体计算机由以下部分构成:多媒体计算机的硬件系统多媒体主机音频处理设备视频处理设备多媒体计算机的软件系统多媒体操作系统多媒体设备驱动软件多媒体处理系统工具教育与培训娱乐多媒体电子

出版物其它领域医疗商业媒体

元素7.1.4多媒体技术的应用7.1.5多媒体信息处理的关键技术1.多媒体信息的类型文本图形和图像音频视频动画7.1.5多媒体信息处理的关键技术2.多媒体信息处理的关键技术数据压缩/解压缩技术数据存储技术虚拟现实技术多媒体数字技术7.2音频处理技术基础7.2.1声音的数字化处理1.声音的数字化处理采样当把模拟信号变成数字信号时,按固定时间间隔在模拟声音波形上截取幅度值,把时间上连续信号变成离散信号的过程,称为采样。量化量化就是把每个采好样的模拟值转换成数字量。量化的过程就是先将整个幅度划分为有限的量化阶距的集合,把落在同一阶距的幅度值归为一类,并赋予相同的量化值。编码将数字信号格式化,把每个量化数据表示成二进制形式存储。常见的编码方法有脉冲编码调制(PCM)、差分脉冲编码调制(DPCM)和自适应差分编码调制(ADPCM)等。文件大小=取样频率×量化位数×声道数×时间(秒)/8(B)声音的数字化过程7.2.1声音的数字化处理2.声音的压缩音频压缩编码技术主要有熵编码(如Huffman编码、算术编码)、波形编码、参数编码、混合编码和感知编码等。波形编码的特点是在高码率的条件下获得高质量的音频信号,适用于高保真度音响和音乐信号的压缩,它在ISDN网络中有应用。感知编码是一种有损压缩,其音频信息压缩率达10:1,甚至12:1,但是人耳却分辨不出失真,所以经常应用于音响领域,Dolby公司的AC-3就采用了该编码方式。在语音编码领域,各厂家都在大力开发与推广自己的编码技术,比如ITU-T开发的G系列语音压缩标准,主要应用于电话方面。目前常见的声音压缩标准有MPEG-1Audio、MPEG-2Audio、MPEG-4Audio和DolbyAC-3等。格式说

明WAV(.wav)微软公司制定的声音格式,在Windows操作系统中被广泛应用。WAV源于wave一词,意谓“波”。它的音质可以达到CD标准,但占用存储空间大。1分钟长度的声音文件大约在10MB左右。MP3(.mp3)MP3是目前最流行的一种音乐文件格式,相同时长的MP3文件大小只有WAV文件的1/10左右,而音质和CD格式相当。WMA(.wma)WMA也是微软推出的音频格式,在压缩比和音质方面都超过MP3,即使在较低的采样频率下也能产生较好的音质,并且支持流式播放,具有防复制能功。APE(.ape)APE是一种无损压缩音频技术,在不降低音质的前提下能有限地压缩WAV音轨文件,压缩比率一般在55%左右。在音质上,相对于WMA、MP3、AAC等有损数据压缩的格式有着绝对的优势。MIDI(.mid)MIDI是musicalinstrumentdigitalinterface(乐器数字化接口)的缩写,它是由世界主要乐器制造厂商建立起的一个数字音乐国际标准,用来规定计算机音乐程序、电子合成器和其它电子设备之间的交换信息和控制信号的方法。它记录的不是数字化后的声音波形数据,而是一系列描述乐曲的符号指令。CD格式(.cda)CDA格式是CD的单轨文件,长度固定为44个字节。当时确定CD唱片格式标准时,电脑上用的CD-ROM格式并未确定,故未考虑要让CD-ROM驱动器识别CD唱片,后来为了电脑上方便使用CD音轨,规定一个CD音轨就是一个.CDA文件。7.2.2常见的数字化音频格式Windows内置的“录音机”软件“录音机”是Windows内置的一款简单易用的音频处理软件,它可以和电脑声卡配合同时完成声音录制,可以完成简单混合和编辑声音文件,但其的功能很有限,只能播放和录制不超过1分钟的声音。AdobeAuditionAdobeAudition是一款专业级的数字音频软件,它的前身是Syntrillium公司旗下著名的数字音频处理软件CoolEditPro。后被Adobe公司收购,改造升级为现有版本。Cubase7.2.3常见的音频处理软件7.3图形图像处理图形是用数学方法描述的一系列点、线、面形状,它存储的数据主要是生成图形的数学描述。图形又称为矢量图、向量图。图像它是用像素值阵列表示的图,位图文件中存储的是构成图像的每个像素点的亮度、颜色等信息,一幅位图图像是由成千上万个像素点信息构成的。图像又叫位图、点阵图、栅格图像。7.3.1图形与图像放大4倍后的矢量图放大4倍后的位图图形与图像的放大效果对比类

型格式说

明位

图Bmp微软公司绘图软件专用格式,是与一种与设备无关的图像格式,支持RGB、索引、灰度等颜色模式,但不支持Alpha通道。GIF由美国CompuServe公司开发的,最高支持256种色彩,用于网络传输的格式,有GIF87a和GIF89a两个规格,具有交错、透明色和动画效果。jpeg(JPG)一种压缩效率很高的有损压缩格式,对单色和彩色图像的压缩比分别可达10:1和15:1,支持CMYK、RGB和灰度等颜色模式,但不支持Alpha通道。PNG针对网络图像开发的文件格式,色彩深度多达48位,支持无损压缩、交错和透明色。TIFF一种跨平台的位图图像格式,它在Photoshop中支持24个通道,是除了PSD格式外唯一能存储多个通道的格式,采用无损压缩,多用于排版印刷及喷绘广告行业。PSDPhotoshop软件的专用文件格式,能保存图层、通道、路径等信息,便于再次修改,该格式文件一般较大。矢

图WMF图元文件,属于位图和矢量图的混合形式,MicrosoftOffice软件中的一些剪贴画以此格式存储。EPS用PostScript语言描述的一种ASCII码文件格式。AIAdobeIllustrator专用的矢量文件格式。DXFAutoCAD的矢量文件格式,以ASCII码方式存储。EMF扩展图元文件。CDRCorelDRAW软件专用的矢量文件格式。7.3.2常见的图形图像文件格式7.3.3常用的图形图像处理软件PhotoshopPhotoshop是Adobe公司旗下最为出名的图像处理软件之一,集图像扫描、编辑修改、图像合成和图像输出于一体的图像处理软件,深受广大平面设计人员和电脑美术爱好者的喜爱。CorelDRAWCorelDRAW是一款由加拿大的Corel公司开发的矢量图型编辑软件。CorelDRAW以其优异的矢量图编辑处理功能广泛的应用于广告出版、商标设计、标志制作、模型绘制、插图描画、排版及分色输出、杂志设计和报纸编辑等诸多领域。美图秀秀(光影魔术手)美图秀秀是美图网推出的一款免费的图片处理软件。它号称使用简单,1分钟能做出影楼级照片,海量精选素材每天更新,主要面向非专业人员和图像的平常应用。案例及拓展练习7.4动画与视频处理动画动画是通过连续播放一系列画面,给视觉造成连续变化的效果。这个效果由于人的眼睛的“视频暂留”特性造成的——即人的视觉会短暂保留之前观看到的影像,在前一影像消失之前观看另一影像,就会产生影像之间连续变化的效果。帧影像动画中最小单位的单幅影像画面,相当于电影胶片上的每一格镜头。一帧就是一副静止的画面,连续的帧就形成动画。我们通常说帧数,就是在1秒钟时间里传输的图片数,也可以理解为图形处理器每秒钟能够刷新几次,通常用fps(FramesPerSecond)表示。7.4.1动画制作概述AdobeFlashFlash原来是美国Macromedia公司推出的动画制作软件,后来公司及软件产品线被Adobe收购。用Flash制作的动画文件很小,有利于互联网传输,且其采用流式播放技术,可以边下载边播放动画。UleadGIFAnimatorUleadGIFAnimator是由友立公司出版的GIF动画制作软件,可以把一系列图片保存为GIF动画格式,还能产生二十多种2D或3D的动态效果,它内置现成的特效可以方便的套用,还能将AVI文件转成动画GIF文件。3Dmax是Discreet公司开发的(后被Autodesk公司合并)基于PC系统的三维动画渲染和制作软件。7.4.2常见动画制作软件7.4.3视频处理概述1.视频与数字视频视频是连续变化的运动图像,当连续的图像变化每秒超过24帧画面时,人类视觉无法会把它们当成平滑连续的视频效果,这样连续变化的画面就构成视频。视频可以分为模拟视频和数字视频。数字视频(DigitalVideo)是指先用视频捕捉设备将外界影像的颜色和亮度信息转变成电信号,再记录到储存介质上。播放时视频信号被转变成帧信息,并以每秒约25幅的速度显示出来,使人眼睛认为它是连续不间断的运动着。模拟视频要在计算机中使用必须经过数字化处理,它和音频数字化一样经过采样、量化和编码,转换成二进制表示的数字信号。格

式说

明AVI(.avi)AVI(AudioVideoInterleaved)格式,即音频/视频交错格式,是将语音和影像同步组合在一起的文件格式。它对视频文件采用了一种有损压缩方式,但压缩比较高,因此尽管画面质量不是太好,但其应用范围仍然非常广泛。该格式文件体积庞大,压缩标准不统一,兼容性差,播放时易出现编码错误。MPEG(.mpg)运动图像压缩算法的国际标准格式,采用有损压缩方法减少运动图像中的冗余信息,同时保证每秒30帧的图像动态刷新速率,被大多数的计算机平台支持。MPEG文件的图像和音质非常好,并有统一的压缩标准,兼容性好。QuickTime(.mov)MOV即MOV(Moviedigitalvideotechnology)即QuickTime影片格式,它是Apple公司开发的一个音频、视频文件格式,在某些方面它甚至比WMV和RM更优秀,并能被众多的多媒体编辑及视频处理软件所支持。RM(.rm、.rmvb)RM格式包含在RealNetworks公司所制定的音频视频压缩规范RealMedia中,它是视频流技术的开拓者,它可以在低速率的网络中实现不间断的视频播放。RM文件的大小取决于制作时选择的压缩率。

ASF(.asf)ASF(AdvancedStreammingFormat)即高级串流格式。它是微软公司WindowsMedia的核心。这是一种包含音频、视频、图像以及控制命令脚本的数据格式。ASF采用MPEG-4的压缩算法,压缩率和图像质量都比较高。WMV(.wmv)WMV是一个基于微软自有技术开发的能在Internet上实时传播多媒体的技术标准。WMV格式具有网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、多语语支持等优点。7.4.4常见的视频文件格式AdobePremiereAdobePremiere是由Adobe公司推出的一款专业级视频编辑软件。它具有素材组织管理、素材剪辑处理、过渡效果制作、滤镜效果编辑和视频输出等功能,有很好的兼容性,可以与Adobe公司推出的其他软件相互协作。会声会影会声会影(CorelVideoStudio)是一套专为个人及家庭所设计的影片剪辑软件。用户可以快速完成剪辑、输出的影片剪辑。7.4.5常见视频编辑和处理软件7.5多媒体数据压缩技术7.5.1数据压缩算法分类

无损压缩有损压缩用无损编码压缩的数据是可以完全恢复的,故也称无失真编码或可逆编码。无损编码的特点是压缩比较小。有损压缩又称为有失真编码,即在编码过程中要丢失一些人的视(听)觉不敏感的信息,且丢失的信息不可恢复。有损编码的特点是压缩比较大,压缩比越大,丢失的数据越多,还原后的效果越差。

7.5.2静态图像压缩标准JPEG

JPEG标准即ISO/IEC1091-1标准,是theJointPhotographicExpertsGroup的缩写,它主要适用于连续色调、多级灰度、彩色或者单色的静态图像的压缩,但也可用于对连续运动图像进行压缩,压缩时将连续图像的每一帧看作一幅静止图像进行压缩,若压缩/解压速度足够快,还可以实时处理视频信号,构成以JPEG为基础的实时视频系统。

7.5.2静态图像压缩标准

经过JPEG标准压缩后的视频图像数据量大大减小,一般可达到10∶1~80∶1的压缩比,对同样的硬盘可以存储更多的图像,因而在现代数字视

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论