第四章多媒体技术_第1页
第四章多媒体技术_第2页
第四章多媒体技术_第3页
第四章多媒体技术_第4页
第四章多媒体技术_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.1多媒体技术基本概念1什么是多媒体计算机技术第四章

多媒体技术计算机领域的媒体包括了两种含义:(1)是指存储信息的实体,即介质,比如磁盘、磁带、光盘、优盘等;(2)是指传递信息的载体,比如数字、文字、声音、音乐、动画片、视频、图形和图像等。多媒体计算机技术中的媒体,指的是后者。

1人们通常讲的“多媒体”,指的就是多媒体计算机技术。

媒体包括文字、图形、图像、声音、动画和影视。

多媒体技术是指能够同时获取、处理、编辑、存储和展示两个以上不同类型信息媒体的技术。2(1)集成性(2)交互性(双向)(3)实时性(4)信息媒体多样化和处理方式多样化以计算机为中心,综合处理多种信息媒体。媒体、硬件、软件的集成。用户可以通过与计算机内的多媒体信息进行交互的方式,来控制和使用多媒体信息。声音媒体与视频媒体与时间密切相关信息媒体包括文字、声音、音乐、动画、视频、图形和图像处理方式包括一维、二维、三维2多媒体技术的基本特点3(1)信息压缩及编码技术(3)大容量的光盘技术(2)超大规模集成(VLSI)电路制造技术声音压缩有去掉重复码和去掉无声码。图像压缩采用JPEG压缩标准。视频压缩有MPEG、DVI、H.261算法。CD-ROM存储650MDVD存储4.7G或17G本项技术促成了数字信号处理器(DSP)芯片的发展。3多媒体信息的关键技术压缩原因:数据量、运算速度、冗余度4(5)多媒体网络技术(6)多媒体信息检索技术MPEG-7是解决检索系统中快速定位的一个标准。正式名称是:“多媒体内容描述接口”指的是多媒体信息的时间和空间的同步技术。解决网络中大容量存储设备和数据库管理等问题。(4)多媒体同步技术51图形、图像信息的数字化和存储(1)图形一般指由计算机产生的画面。可以是直线、圆、矩形、图表,以及由这些基本形状组成的场景。计算机中的矢量图就是图形。3DSMax产生的图形

特点:1图形用一些指令描述。2图形放大缩小不会变形。3图形由计算机绘制而成。4容易移动、缩放、旋转和扭曲。图形处理的典型软件有:AutoCAD、CorelDraw、3dsMax4.2多媒体信息的数字化6经由数字图像设备输入,并转换成一些排列成行列的数字点(像素),这些信息称为图像。计算机中的位图就是图像。经扫描仪输入的图像

特点:1由数字设备输入的画面2经放大后会变形或损失信息。图像处理的典型软件有:Windows中的“画图”PhotoshopPhotoStyle影响图像质量的因素:1分辨率:显示分辨率、图像分辨率2色彩位数(2)图像7分辨率是多媒体技术中一个重要的基本概念。

显示分辨率是指显示一幅图像的屏幕像素点数目。例:640*480、1024*768、512*512显示分辨率:组成一幅图像的像素点数。例:200*400、24*24图像分辨率:设备性能参数:扫描仪:dpi(每英寸点数)4800dpi打印机:dpi(每英寸点数)360dpi显示器:0.21mm、0.26mm(点距)8高分辨位图同样尺寸显示一幅图,图像的像素数目越多,即显示分辨率越高,图像越清晰。

低分辨位图9放大后图像变形。

原始图像放大16倍图像10同样尺寸显示一幅图,显示的像素数目越多,即显示分辨率越高,图像越清晰。

同样的显示分辨率,显示时,图像的像素数目越多,图像的分辨率越高,图像越大(存储量越大)。修改显示器分辨率:600*8001024*76811每一像素所用的位数称为色彩位数。有时称为颜色(灰度)分辨率、颜色深度。颜色分辨率(位)颜色数

通常对应图像

一般使用场合

12黑/白打印机、图形、单色显示屏

244色伪彩色

图像处理结果

41616色伪彩色

图像处理结果

8256256级灰度黑白照片

黑白照片

1665536低彩色分辨率

彩色照片

2416777216高彩色分辨率

彩色照片

常用颜色深度与实际应用

色彩位数:12复习一多媒体的定义、特点多媒体关键技术图形的数字化和存储图像的数字化和存储分辨率色彩位数131声音是一种连续的模拟量。2声音是一种波(声波)。波的振幅表示响度(用分贝db量度),声音的频率表示音调(用赫兹Hz量度),频率越高,音调越高模拟音频信号

(1)声音的基本概念:2音频信息的数字化和存储141振幅(A):人可以接受的声音大小的范围在0db—120db之间2频率(f):表示音调声波频率是指信号(空气分子)每秒钟震荡次数。根据人们对声音的接受能力,将声波分成几个层次:-次声:频率小于20Hz的声音。达不到一定频率的声波,人类无法感知。-可听声:频率在20Hz和20,000Hz之间的声音。这是人耳可听到的声音。-超声:频率大于20,000Hz的声音。这就是通常所说的超声波。3周期(T):信号以一定的时间间隔重复波动,这个时间间隔称为声波的周期,周期与频率成反比:T=1/f声波的基本参数:15采样是以特定的时间间隔对连续的模拟信号不断采集。采样所得到的数据是一连串离散的数据,是数字量(见下图)。

采样点音频信号的采样

影响声音质量的因素:1采样频率2采样精度3声道数将采集的数据按一定的大小进行存储的过程称量化。(2)声音的采样与量化16单位时间内的采样个数称为采样频率,单位用Hz(采样次数/秒)表示。

时间间隔越小,即采样频率越高,声音的保真度越高。如果要有效还原原波形,采样频率至少为原波形频率的两倍采样精度:采样精度是指每个采样值需要用多少个二进制数来表示,它反映出度量声音波形幅度值的精确程度。

声道数:采集声波的个数称声道数。采集两个声波数据,称双声道。采样频率:17计算存储容量的公式(单位:字节):存储量=采样频率*量化位数*声道数*采样时间/8例:常见的CD唱片存储量计算:采样频率:44,100Hz量化位数:16位声道数:2一分钟声音的存储量(字节):44100*16*2*60/8=10,584,000前例中量化、编码与存储示意:数值量量化(4位)编码值7.37011110.21010106.8701118.5910017.4701111.4100015.4501018.181000将量化的值用二进制位表示,称为编码。(3)声音的编码与存储183视频信息的数字化和存储视频(video)是由一幅一幅(帧frame)画面组成。每秒显示12帧:12fps1色彩空间的表示RGB(红绿蓝):最常用YUV和YIQ:由亮度信号和色差信号组成。(前者用于PAL制式,后者用于NTSC制式)2视频信号的数字化数字化:以一定的频率对视频信号进行捕获并采样后形成数字化数据的过程附:常用的计算机颜色存储19视频标准制式名称使用地区每秒帧数(fps)彩色空间扫描线每行象素NTSC美国、日本、中国台湾30YIQ525240-400PAL中国大陆、部分欧洲25YUV625240-400SECAN法国、俄罗斯、非洲25YUV62562520复习二声音的基本概念声音的采集声音存储

视频的数字化211硬件系统(1)CPU(2)声卡(3)视频卡带多媒体数据处理功能采集或播放声音(采集频率,量化位)类型:视频叠加卡、视频捕捉卡、电视编码卡、MPEG卡、TV卡4.3多媒体计算机(MPC)22分类:DVD-ROM:只读DVD-R:刻录机,可写入一次,可读出多次DVD-RW:可重复读写千次左右DVD-RAM:可重复读写十万次以上DVD区码:驱动器的地区范围(5)DVD驱动器(4)CD-ROM驱动器分类:只读光驱(CD-ROM)一次写多次读光驱(CD-R)可擦写光驱(CD-RW)23标准名MPC-1(1990)MPC-2(1993)MPC-3(1995)MPC-4(1996)MPC-5RAM2MB4MB8MB16MB32MB/64MBCPU16MHz386SX25MHz486SX75MHzPentium133MHzPentiumPentiumⅡ/Ⅲ硬盘80MB160MB850MB1.6GB3.1GB/6.4GBCD-ROM150KB/s最大寻址时间1s(1x)300KB/s最大寻址时间400msCD-ROMXA600KB/s最大寻址时间200msCD-ROMXA10x20x/40x声卡8Bit数字声音8个合成音MIDI16Bit数字声音8个合成音MIDI16Bit数字声音WaveTable(波表)MIDI16Bit16Bit/32Bit显卡640×48016色640×48065536色800×60065536色1280×102416位真彩色1280×102432位真彩色多媒体计算机标准24(1)操作系统中支持多媒体的功能:

多任务、多进程大容量存储器虚拟内存即插即用(2)多媒体信息处理常用工具a.文字处理:写字板和记事本、WPS、WORD等b.图形图像:Photoshop、PhotoDraw、CorelDraw等c.声音:Windows的Recorder、UleadAudioEdit、Creative录音大师等d.动画:3DSMAX、MAYA、Flashe.视频:UleadVideoEdit、AdobePremieref.多媒体集成工具:Authorware、ToolBook、FrontPage、Dreamweaver以及语言VB、VC++、Delphi2软件系统25(3)应用软件开发过程a.项目内容和框架的确定b.脚本的编写和改编c.媒体素材的准备和计算机处理d.计算机多媒体集成和软件测试(1)应用软件包括 辅助教学 游戏 电子书籍……(2)应用软件特点

多种媒体的集成 超媒体结构 交互操作应用软件开发过程流程图3应用软件261常见声音文件格式:WAVE(波形)文件:WAV、VOC、AU通过声卡采集的一种波形文件。缺点:文件大由两部分组成:格式和数据4.4音频信号的处理质量的优劣与声卡有关(采集频率、量化位数、声道数)。格式部分包括:采样频率、采样精度、声道数等;数据部分包括:实际采样波形数据;WAV文件制作27MIDI(乐器数字接口)文件:MID通过合成器播放声音的文件。合成器是一种能发出各种乐器的声音的电子装置合成器分为两类:MIDI文件存储的是一系列指令,它指定了键、力度、音量、延迟时间和通道编号(乐器类型)等。-调频(FM)合成器:保存电子模仿的声音-波表合成器(软/硬):保存采集的声音MID文件制作MID文件格式举例:波形文件:22.05kHz,8位,1.8秒需317.52K位MID文件:51秒乐曲,需18K位28-基于音频数据的统计特性进行编码(波形编码)-基于音频的声学参数进行参数编码(参数编码)-混合编码,以上两种方法的结合常用编码方法无损压缩:Huffman编码、行程编码有损压缩:波形编码、参数编码、混合编码2音频数据的编码与压缩:使得语音波形保持原形使得音频保持原音频特性按压缩方法分类:PCM(脉冲编码调制方法):最常用的波形编码29MP3是MPEGlayer3的缩写MP3采用有损压缩技术。MP3在各种音质下的性能声音质量带宽(KHz)声道比特率(Kbps)压缩比电话2.5单声道896:1优于短波4.5单声道1648:1优于调频广播7.5单声道3224:1类似调频广播11立体声56-6424~26:1接近CD15立体声9616:1CD>15立体声112-12810~12:1MPEG压缩标准介绍MPEG是一种波形音频文件的压缩标准30(2)语音识别(声音输入技术)利用声音输出信息的技术称为语音合成技术ViaVoice是IBM公司的中文连续语音识别系统(1)语音合成(声音输出技术)用语言代替键盘输入文字-发出预先存入的语音:“一字一字”蹦出来。实现方式:-模拟人类发音:机器人语言。3语音处理合成技术的目标:可懂、清晰、自然、具有表现力。31-可以播放波形音频文件或对数字音频进行编辑和效果处理。-通过CD--音频、麦克风、录音机等输入源录制波形文件(.WAV)。-可以进行复制、插入、与其他声音混合、删除等编辑操作。

(1)功能:播放搜索到尾搜索到头停止播放录音录音机

播放时间播放位置声音波形4音频处理(Windows的“录音机”的使用)32-更改放音速度:效果莱单上选择“加速(按100%)”或“减速(按50%)”-更改声音文件的音量:效果菜单上选择“提高音量(按25%)”或“降低音量(按25%)”。

-“反向”回放声音文件:效果莱单上选择“反向”,然后单击播放按钮

-在声音文件中添加回音:打开声音文件,在效果菜单上选择“添加回音”。

(3)文件菜单的操作(和其他Windows的类似菜单功能相同)-新建-打开-保存-另存为-恢复(2)效果菜单的操作33录音数据的属性

当按“开始转换(C)”按钮时,出现“选择声音”对话框。查看声音文件的属性:按菜单项“文件”/“属性”转换声音数据的格式(4)属性对话框34转换声音数据的格式

这是为录音质量设计的对话框:名称:可以选择CD质量、收音机质量、电话质量等音频质量的名称。格式:决定声音文件的格式。属性:选择采样频率、采样位数、单声道(或立体声)、每秒采样字节。(5)选择声音35复制:将当前文件放到剪贴板上。(“复制”后要“新建”)粘贴插入:将剪贴板上的音频插入到当前位置。粘贴混合:将剪贴板上的音频混入到当前位置。插入文件:把另一个音频文件插入到当前位置。与文件混音:把另一个音频文件混入到当前位置。删除当前位置之前的内容:删除当前位置之前的部分。删除当前位置之后的内容:删除当前位置之后的部分。音频属性:打开多媒体设置的“音频属性”对话框。(6)编辑菜单的操作36(7)设置多媒体属性37复习三1音频信号的文件类型2音频信号的压缩3语音处理4录音机381各种图像文件格式的特点(1)PCX:使用游程长度编码压缩方法,带有一个128字节的文件头。(2)BMP:Windows下的基本位图格式。文件大,在单机上广泛使用(3)GIF:采用无损压缩方法,最多处理256色(8位)图像,可表示多幅两维画面。文件小,可渐进传输,网上的标准格式一般不适用于照片4.5图像信息的处理Windows3.X用得很多。39(4)JPEG:采用有损压缩。用最少的磁盘空间得到较好的图像质量。很高的压缩比,适用于网上的照片(5)TIF:工业标准格式,有压缩格式、非压缩格式。

图像格式复杂、存贮信息多(6)WMF:矢量图形格式。Windows的图形格式。(7)PCD:电子照片格式。Kodak公司的电子照片格式JPEG2000:JPEG的升级版,压缩率比JPEG高约30%左右。采用有损和无损压缩、支持渐进传输、指定区域指定压缩质量40附:不经过压缩的媒体信息存储表多媒体信息分辨率位/每采样点采样范围容量(字节)声音11.02KHz8一分钟661K声音(立体声)48KHz16一分钟11.5M图片12点/mm24A4纸26M显示屏图像1640*48024一幅922K显示屏图像21024*76824一幅2.36M视频(动画)200*2502420秒(25幅/秒)75M2图像数据的压缩41游程长度编码(RLE)方法:用两个数替代连续重复的像素值,一个是重复像素个数,一个是重复的像素值。例子1:11111111111111565656565612012012012012012000000下面是图像的一行像素值(23个值):用游程长度编码(RLE)方法压缩后的数据(8个值):711556612050例子2:下面是图像的一行像素值:11……115656565656120……1200000020个400个用RLE方法(8位)压缩后的数据:20115561271201271201271201912050(1)无损压缩42用游程长度编码(RLE)方法压缩后的数据:201155612712012712012712019120500001010000001011000001010011100001111111011110000111111101111000011111110111100000001011011110000000010100000000123456789101112131420115561271201271201271201912050压缩比:14/430=3.3%43RLE方法要注意:下面是图像的一行像素值:11111156320017120……12000000150个用游程长度编码(RLE)方法(非单纯)压缩后的数据:3115563200171271202312050第八位是“1”3每个重复数最大为127(例2)。1三个或三个以上连续相同值用两个值代替。例子3:2若邻值不同或连续两个像素值相同,用一个第8位是“1”的值表示本值后有几个不连续相同的值(例3)44JPEG方法:丢弃高频成分,保留低频成分。可选择压缩比:Photoshop分11级;一般压缩为10:1~40:1根据:人的眼睛对高频变化不敏感,注意力会停留在低频部分。人眼感觉压缩后的图像与压缩前的图像不会有太大的差异。方法介绍:将图像划分成若干个像素块(比如每块8*8个象素),像素块处理比对整个图像处理要快得多。3数字图像的处理图像颜色模式变换;部分图像对象选择;大小缩放、剪切、翻转、旋转、扭曲;多幅图像的编辑、合成;特殊效果:模糊、玻璃化、水印、马赛克;图像文件格式转换和图像打印;(2)有损压缩45视频信息的处理技术一数字视频文件格式AVI:Windows中比较通用的视频格式,压缩比较高MOV:Apple公司的QuickTime视频处理软件选用的视频文件格式MPG文件:用MPEG方法压缩,比AVI格式所占存储空间小DAT文件:VCD数据文件的扩展名SWF文件:Macromedia公司的Flash制作的动画输出格式DIR格式:Macromedia公司使用的Director多媒体著作工具产生的电影文件格式46视频信息的处理技术二视频信息压缩基本原理为什么要压缩:数据量过大,存在冗余数据压缩处理一般包括两个部分:编码和解码压缩方法分为两类:可逆编码方法(无损压缩)不可逆编码方法(有损压缩)MPEG标准分:MPEG视频、MPEG音频和视频音频同步三个部分三视频信息的处理视频信息的获取:利用视频捕捉卡,将摄像机或录像机中的模拟信息传输到计算机中视频信息的处理:常用的视频处理软件有:VideoForWindowsAdobePremiere、QuickTime、UleadVideoEditor47视频信息的处理技术四动画处理技术-Flash文件格式:有fla和swf两种,其中fla为源文件格式,可以在Flash软件环境中进行修改,swf为导出的影片文件格式,生成后不能修改元件、库和实例:元件相当于电影中的“演员”,存放在库中的元件可以重复使用,库中的元件放入场景变成为了一个实例帧、关键帧和空白关键帧:逐帧动画:每一帧都是关键帧,都必须制作补间动画:只制作关键帧,其余帧由补间自动生成,补间分为动作补间和形状补间(用于变形动画,必须把对象打散为“点点状”,习题二、四、八为形变动画)48视频信息的处理技术四动画处理技术-Flash图层:在Flash中,一个图层只能放置一个运动的对象,若是多个对象同时运动则必须设置多个图层,教材中的习题5、910、12、13、14、15为多层动画对象(实例)的编辑:放大、缩小、翻转、平移、颜色的设置(包括亮度、色调和Alpha的设置)、动作补间中缩放和旋转的设置习题分析:1、放大动画,同时修改对象的透明度,操作要点:按F11出现库面板使用工具栏上的自由变形工具进行缩放选中对象,在下方属性面板的颜色设置中修改Alpha的值49复习四1、图像文件的格式2、无损压缩3、有损压缩4、数字图像处理50嘉16*16点阵:32字节6763个汉字:3.3MB64*64点阵:512字节6763个汉字:3382KB24*24点阵:72字节51声音质量

采样频率(kHz)

采样精度(位)

声道数

存储量(位/分钟)电话音质8813849K调幅广播音质

11.025815292K调频广播音质

22.0516242336KCD音质44.116284672K各类声音信息的存储量52分辨率:每英寸所能分辨的像素点数(单位:dpi)。扫描幅面:可分为A4幅面,A3幅面和A0幅面接口:SCSI接口、EPP接口和USB接口。扫描位:24位、3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论