版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章
多媒体技术基础15.1多媒体技术概述 5.1.1、媒体与多媒体
1.媒体(媒介、媒质)
媒体是信息表示、传递和存储的载体
存储信息的实体纸张、磁盘、光盘
表示信息的载体文本、图形、图像
声音、动画、视频命运2媒体的种类(CCITT)
感觉媒体人的感官,如视觉、听觉等
表示媒体为了处理和传输感觉媒体而人为构造的媒体,如文本、图形、动画等
显示媒体获取和表现信息的物理设备,如键盘、鼠标器、显示器和音箱等
存储媒体用来存放表示媒体的介质,如磁盘、光盘和内存等
传输媒体传输数据的载体,如光缆32.多媒体
通常是指表示媒体,也就是
静态媒体:文本、图形、图像
动态媒体:声音、动画、视频多媒体是融合两种或两种以上表示媒体的一种人机交互式信息交流和传播媒体。
多媒体的实质:各种媒体数字化。45.1.2、多媒体技术
定义将多种媒体信息通过计算机进行数字化采集、编码、存储、传输、处理和再现等,使多种媒体信息建立逻辑连接,并集成一个具有交互性的计算机系统。利用计算机综合处理图文声像。
特征多样性:综合处理多种媒体信息集成性:信息集成及设备集成交互性:控制和使用信息的手段 实时性:支持实时处理55.1.3、多媒体技术的应用
1.教育与培训多媒体教学课件多媒体技能培训系统虚拟课堂、虚拟实验室、虚拟图书馆
2.出版与图书
电子出版物具有容量大、体积小、成本低、检索快、易于保存和复制、能存储图文声像信息等,如光盘百科全书、e-book。6
3.商业与咨询商品简报、查询服务、产品演示、商贸交易(电子商务)等。利用多媒体技术可为公众提供各类咨询服务,也可通过触摸屏进行操作。
4.通信与网络信息家电(电话、电视、冰箱、音响)、视频会议、可视电话、远程医疗系统。7
5.军事与娱乐军事遥感战场模拟核武器模拟
CD、VCD、DVD、(三维)游戏多媒体技术的优势可能不在于某些具体的应用,而是在于它能把复杂的事物变得简单、把抽象的东西变为具体。85.2多媒体系统的组成5.2.1、多媒体系统的层次结构多媒体硬件系统:多媒体控制板卡及I/O电路多媒体驱动程序:用来控制和操纵多媒体硬件多媒体操作系统:CD-RTOS(专用),Windows(通用)多媒体应用软件多媒体开发工具多媒体操作系统多媒体驱动程序多媒体硬件系统95.2.2、多媒体系统的基本组成101、多媒体硬件:计算机:MPC或工作站 MPC:多媒体计算机系统
工作站:采用工业标准POSIX和XPG3,整体运算速度高、存储容量大、具有较强的图形处理能力。多媒体板卡: 为多媒体数据解决输入和输出问题的硬件设备。常用的多媒体板卡有:显示卡、音频卡和视频压缩卡等。11显示卡(显示适配器): 计算机与显示器之间的接口,用于将数字信号转换成图像信号并在显示器上输出。音频卡: 用来录制、编辑和回放数字音频文件,在记录和回放数字音频文件时进行压缩和解压缩。视频压缩卡:
视频信号处理平台,汇集视频源和音频源的信号,具有捕获、压缩、存储、编辑和特技制作等处理手段。12多媒体外部设备: 常用的多媒体外部设备有: 光盘、扫描仪、数码相机、摄像头、数字摄像机、触摸屏、麦克风、扬声器、显示器和投影机等。☻多媒体软件:
系统软件、支持软件和应用软件。多媒体系统软件:
多媒体驱动程序和多媒体操作系统(数据压缩、媒体硬件接口的驱动、新型交互方式等)13多媒体支持软件:创作和开发工具
多媒体素材制作工具文字特效制作软件:MSWord/艺术字音频处理软件:Syntrillium
Cooledit
TwelveToneCakewalk图形图像处理软件:CorelCorelDRAW
AdobePhotoshop14动画制作软件:MacromediaFlashMXDiscreet3dsmax视频编辑软件:AdobePremiere多媒体著作工具
MicrosoftPowerPointMacromediaAuthorware
多媒体编程语言
VB、VC++多媒体应用软件:
多媒体应用软件又称多媒体应用系统或多媒体产品。155.3.1、声音的基本概念
声音是模拟信号,其幅度随时间而连续变化5.3音频信息处理tt周期TF=1/T振幅A正弦信号语音信号
振幅A—反映信号的强度或声音的大小;
频率f—反映振动的快慢或音调的高低。单位为:振动次数/每秒。f=1/T(周期)165.3.2、声音的数字化
计算机只能识别数字信号。数字信号的优点:
①易于进行信息处理(信息的识别、比较、压缩、加密等)
②高保真度(“0”、“1”两种状态,容易判决,存储,不怕噪音干扰,无失真地进行远距离传输)声音数字化过程:模拟信号数字信号A/DADCD/ADAC17
A/D转换(AnalogtoDigital模数转换):
PCM法
(PulseCodeModulation脉冲编码调制)
采样:在连续信号中每隔一定时间取一个值;
量化:把信号大小取整为n位二进制数表示;
编码:按一定规律产生二进制位流输出信号。采样量化编码声音的模拟信号声音的数字信号18例,将下面信号数字化。t4.014.9连续信号采样量化和编码t439715数字信号结果19声音数字化三要素:采样频率量化位数声道数每秒钟抽取声波幅度样本的次数每个采样点用多少二进制位表示数据范围使用声音通道的个数采样频率越高声音质量越好数据量也越大量化位数越多音质越好数据量也越大立体声比单声道的表现力丰富,但数据量翻倍11.025kHz22.05kHz44.1kHz8位=256个值16位=65536个值单声道立体声
采样定理:采样频率要高于信号最高有效频率的两倍,信号才可能完全复原。
如:话音4KHz,采样8K次;声音20KHz,采样40K次。20
声音数字化计算公式数据量=采样频率×量化位数
×声道数/8(字节/秒)采样频率(kHz)量化位数(bit)数据量(KB/s)单声道立体声11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.27215.3.3、音频的文件格式
①WAV格式
WAV是Microsoft/IBM共同开发的,标准的WindowsPCM波形文件,是一种未经压缩的PCM脉冲编码调制数据,是对声波信号数字化的直接表示形式,主要用于自然声音的保存与重放。
特点:声音层次丰富,还原音质好22
②MP3格式:
MP3(MPEGAudiolayer3)是一种按MPEG标准的音频压缩技术制作的有损压缩音频文件。 MP3Pro是MP3的改进算法,对声音中的低频成分采用较高压缩率,对高频成分采用低压缩率。
特点:高压缩比(11:1),优美音质MPEG标准:(MovingPicturesExpertsGroup动态图像专家组)
主要包括: MPEG-1、MPEG-2、
MPEG-4、MPEG-7、MPEG-21。23
③CD格式:
CD格式的音频文件扩展名为.cda。采样频率为44.1kHz,量化位数为16bit,速率为176kB/s。CD音轨是近似无损的,一张CD盘可以播放74分钟左右。 一个cda文件存放的只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在计算机上看到的*.cda文件都是44B。
特点:高保真、不能直接复制。需要使用音频抓轨软件进行格式转换。24
④WMA文件
WMA(WindowsMediaAudio)是WindowsMedia格式中的一个子集(音频格式)。
特点:压缩到MP3一半且保留同样音质
⑤MIDI文件
MIDI(乐器数字接口)是由一组声音或乐器符号的集合。
特点:数据量很小,缺乏重现自然音255.3.4、音频的获取与处理
音频的获取主要有:①利用录音软件直接录制②使用专业录音棚录制③从唱盘或录音带中进行转录④购买数字音频库26
音频处理:①删除无用的部分,将需要合并的音轨拼贴起来。②降噪,去除录音时的背景噪音。③调节均衡,使得高、中、低几个频段听起来更加悦耳。④添加混响、延迟和变速等效果。⑤压缩与限制,即动态处理。⑥音频文件格式的转换。275.4图像信息处理5.4.1、图形与图像
1.图形(矢量图形、几何图形)矢量图是用一组指令来描述的,这些指令给出构成图形的各种属性和参数。例如:
圆(圆心坐标,半径及粗细,色彩)
优缺点:①图形文件占用空间较少②图形复杂时耗时相对较长
绘图软件:CorelDRAWFreeHand282.图像(位图图像、点阵图像) 图象没有明显的线条。 位图是指在空间和亮度上已离散化的图像,通过描述每一像素点的颜色或亮度来表示该图像。它适应表现包含大量细节的图片,如明暗、浓淡、层次和色彩变化等。29 优缺点:①色彩和色调丰富,景物逼真
②缩放处理易失真,数据量大绘画软件:PhotoshopPhotoImpact
图形与图像几个不同点:
构成原理不同;
图形颜色数目与文件的大小关系不同
经缩放、旋转等操作后失真现象不同
对事物的表现力不同。30图形与图像的比较图形图像文件大小与图形的复杂程度有关,一般较小与图像的尺寸和颜色有关,一般较大文件内容图形指令图像点阵数据缩放、旋转处理无失真有失真处理技术绘制、创造和艺术性获取、复制和技巧性适合范围表现变化的曲线简单图案、运算结果表现自然和细节景物层次、色彩较丰富图形图像真实感图形绘制模式识别技术315.4.2、图像的数字化
连续空间位置的离散和数字化亮度值的离散和数字化空间位置采样m×n20×13256亮度量化8b24b5.4图像信息处理32 每个网格用一个亮度值表示,一幅图像就要用m×n个亮度值表示,这个过程称为采样。 把亮度分成k个等级区间,分别对应k个不同的亮度值,这个过程称为量化。 将k个不同的亮度值由一定位数的二进制数表示,这个过程称为编码。
采样量化编码图象的模拟信号图象的数字信号33
图像的主要参数:
⑴分辨率分辨率直接影响图像质量。
显示分辨率:指在显示器上能够显示的像素数目。(640*480,800*600,1024*768)
图像分辨率:指数字图像的实际像素数目,它反映图像在屏幕中显示的大小。
像素分辨率:指像素的宽高比(1:1),在像素分辨率不同的机器间传输图像会变形。34
⑵颜色深度指记录每个像素所使用的二进制位数。
二值图象(黑白图像):每个象素点由1bit位表示“0”或“1”。
灰度图象:每个象素点由多位表示的黑白图象。如,8bit位表示256种黑白灰度。
彩色图象:每个象素点由多位表示的彩色图象。如,8bit位表示256种彩色。
真彩色图象:用24个bit位表示一个象素,可得到1677万种颜色,称为真彩色。35位数颜色数说明4位16种Windows3.x中画笔支持16种颜色8位256种多媒体应用中的最低颜色深度16位32768种RGB5:5:5,剩余1位表示其它属性(透明度)24位16M种真彩色,超出人眼所能识别的颜色范围32位16M种RGB8:8:8,剩余8位表示其它属性(透明度)表5-3、图象的颜色数量36
图像数据量的计算:
数据量=图像分辨率×颜色深度/8(B)
例,
①一幅640×480的真彩色图像,未压缩的图像数据量是多少?640×480×24/8=921600B=900KB ②一张3×5英寸的照片,经由1200dpi(点/英寸)分辨率扫描仪扫描入计算机,其图象文件大小约: 1200×1200×3×5×24/8≌63MB。375.4.3、图像的文件格式
BMP:Windows标准图像文件格式
JPG:一种高效率压缩格式(1:10~20)
GIF:用于交换图片的,对灰度
图像表现佳,但不超过256色的图像。JPEG:静态有损压缩,真彩色,文件小
PNG:流式网络图形格式,它使用LZ77派生的无损数据压缩算法。
PNG存储灰度图像时图像深度达16位
PNG存储彩色图像时图像深度达48位5.4图像信息处理385.4.4、图像的获取与处理
1.图像的获取方法采用扫描仪、数码相机进行模数转换从数字图像库、网上获取、自行绘制
2.图像的处理技术图像处理手段很多,所有处理都是建立在对数据进行数学运算的基础上,一般用户可通过图像处理软件(Photoshop)来完成。例如:图像亮度、对比度的调整等。5.4图像信息处理395.5.1、视频的基本概念
1.视觉暂留现象人眼有一种视觉暂留的生物现象,即人观察的物体消失后,物体映像在人眼的视网膜上会保留一个非常短暂的时间(约0.1s)。利用这一现象,将一系列画面中物体移动或形状改变很小的图像,以
足够快的速度连续播放,就会
产生连续活动的场景。5.5视频信息处理40
2.视频的定义
视频又称运动图像或活动图像,它是指连续地随着时间变化的一组图像。
帧:一幅单独的图像
帧率:每秒种播放的帧数,单位是f/s
典型的帧率:24f/s、25f/s、30f/s
常见的视频信号:电影、电视41
3.电视的制式色度信息处理方法→三种彩色电视制式
⑴NTSC制式(美国、日本、中国台湾等)
NationalTelevisionSystemsCommittee(1953,美国)①30帧/秒(29.97fps),525行/帧
②隔行扫描:2场/帧,262.5行/场
③颜色模型:YIQ
④宽高比:4:3(帧大小:352*240)42
⑵PAL制式(中国、德国、英国、朝鲜等)
PhaseAlternationLine(1962,德国)①25帧/秒,625行/帧
②隔行扫描:2场/帧,312.5行/场
③颜色模型:YUV
④宽高比:4:3(帧大小:352*288)⑶SECAM制式(法国、俄罗斯、东欧国家)“轮流传送彩色与存储”(1966年,法国)类似PAL制式435.5.2、视频的数字化扫描采样量化编码模拟视频信号数字视频信号
视频是连续的图像
图像是离散的视频5.5视频信息处理扫描采样量化编码模拟视频信号数字视频信号44数字视频的特点:
优点:①数字视频便于创造性的编辑与合成②数字视频可不失真地进行多次复制③在网络环境下容易实现资源共享④数字视频可与其它媒体组合使用
缺陷:①处理速度慢②数据量巨大(压缩、光盘)455.5.3、视频的文件格式
⑴AVI文件AVI是一种音视频交叉记录的文件格式,微软在1992年推出AVI文件及其应用软件VideoforWindows。
特点:①AVI采用帧内压缩,可用一般的视频编辑软件进行编辑。
②提供无硬件视频回
放,其窗口大小和帧率可
根据播放环境调整。5.5视频信息处理46
⑵MOV文件MOV(Moviedigitalvideo)文件是Apple公司在其Macintosh机推出的视频文件格式,其相应的视频应用软件QuickTime。QuickTimeforMacintoshQuickTimeforWindowsMOV文件格式的压缩算法
Video编码支持16位图像深度
的帧内压缩和帧间压缩。47
⑶
MPG文件MPG文件是采用MPEG算法进行压缩的全运动视频文件格式。它在1024*768的分辨率下可用每秒25或30帧的速率同步播放全运动视频图像和CD音乐伴音。
DAT文件也是基于MPEG
压缩算法的一种文件格式,
它是VideoCD和卡拉OKCD
数据文件的扩展名。485.5.4、视频的采集与处理
采集视频数据主要有:①从模拟设备中采集视频数据②从数字设备中采集视频数据③从影视光盘中截取视频数据5.5视频信息处理视频数据的处理包括:①在保证图像质量的前提下尽可能压缩视频图像的数据量②消除视频产生、获取和传输过程中引入的失真和干扰③从视频图像中提取某些特征,以便对其进行描述、分类和识别495.6多媒体存储技术5.6.1、光盘技术光盘(CD-CompactDisc,高密盘)
特点:①存储容量大:CD-ROM→650MB
DVD→4.7GB~17GB②记录密度高:107-108bit/cm2③长期保存信息:10-100年④非接触方式、价格低廉50
1.CD-ROM技术
CD-ROM是只读光盘或固定型光盘(只能读,不能改-重写、擦除)。一张普通光盘可以存储650MB数据,它包括文本、表格、图形、图
像、视频、音频等文件。凹坑→0平坦→151
CD-ROM的工作原理:
CD-ROM驱动器读取数据时由激光束照射到光盘的平面上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学方程式的书写计算和物质的构成教案
- 华银田径学期教案(全套)
- 文书模板-自来水安装报告申请书
- 国际民航日节日活动安全乘机指南飞机趣味问答课件
- 采购行业年终总结报告课件模板
- 2025《黑神话:悟空》高中语文试卷(1)含答案
- 2024届广东省珠海一中高三全真数学试题模拟试卷
- 残疾人合同管理制度
- 不嫁不娶协议书模板
- 毕业协议书户口
- 工程量自动计算结果表格(新增文字注释上标功能)
- 幼儿园保教工作管理
- 产后乳房肿胀的护理课件
- 基本不等式说课-高一上学期数学人教A版(2019)必修第一册
- 物理学(高职)全套教学课件
- Unit 8 Section B(2a-2e)Thanksgiving in North America教学设计2022-2023学年人教版八年级英语上册
- 人工智能在软件测试中的应用
- Unit2-social-media-detox课件-高一英语外研版(2019)选择性必修二
- 2023版设备管理体系标准
- 编排设计试卷
- 专业学位硕士研究生英语智慧树知到课后章节答案2023年下黑龙江中医药大学
评论
0/150
提交评论