版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多媒体应用(yngyng)基础第1章 多媒体技术应用(yngyng)概论 共一百零四页 多媒体一词来自(li z)于英文“Multimedia” multiple:有“多重、复合”之意。 media:则是指“介质、媒介和媒体”。 按照字面理解(lji),多媒体就是“多重媒体”或“多重介质”的意思。Multimediamultiplemedia=+1.多媒体p1多媒体应用基础共一百零四页感觉媒体表示媒体显示(xinsh)媒体存储媒体传输媒体2. 媒体p23多媒体技术中媒体主要(zhyo)是指表示媒体,即信息在计算机内部的表示。 直接作用于人的感官,使人能直接产生感觉。例如,语言、声音、文字、图形
2、、图像和动画等。 信息在计算机中的表示,通常是信息的各种编码。例如, ASCII编码、汉字编码、语音编码和图像编码等。 用于表达信息,是信息的输入和输出设备。例如,键盘、鼠标、摄像机、话筒、光笔、显示器、扫描仪和打印机等。 用于存储信息,是存放表示媒体的实体。例如,软盘、硬盘、 磁带、光盘和半导体存储器等。 用于信息的传输,是传输介质。它是媒体从一处传到另一处的物理载体。例如,双绞线、同轴电缆和光纤等。多媒体应用基础共一百零四页 p24多媒体是文本、图形、图像、音频、视频和动画等“多重媒体”的集合(jh),多媒体信息从时效上可分为两大类: 静态媒体:包括文本、图形和图像 动态媒体:包括音频、视
3、频和动画 文本、图形(txng)、图像、音频、视频和动画多媒体应用基础共一百零四页多媒体信息元素(yun s)的类型1)文本(wnbn)(Text) 文本是以各种文字和符号表达的信息集合,在多媒体计算机中,文本主要用于对知识的描述性表示。可利用文字处理软件对文本进行一系列处理,如输入、输出、存储和格式化等。 多媒体应用基础共一百零四页2)图形(txng)(Graphic) 图形一般指计算机绘制的画面,描述的是点、线、面等几何图形的大小、形状和位置,在文件中记录的是所生成(shn chn)图形的算法和基本特征。一般是用图形编辑器产生或者由程序产生,因此也常被称作计算机图形。多媒体应用基础共一百零
4、四页3)图像(t xin)(Image) 图像是指由输入设备所摄取的实际场景的画面,或以数字化形式存储的画面。 图像有两种来源:扫描静态图像和合成静态图像。前者是通过扫描仪、普通相机与模数转换装置、数码相机等从现实生活中捕捉;后者是由计算机辅助创建或生成,即通过程序、屏幕(pngm)截取等生成。 多媒体应用基础共一百零四页4)音频(ynpn)(Audio) 音频也泛称声音,在多媒体计算机中,按其表达形式,可将声音分为(fn wi)语音、音乐、音效三类。计算机的音频处理技术主要包括声音的采集、无失真数字化、压缩/解压缩及声音的播放等。 多媒体应用基础共一百零四页5)视频(shpn)(Video)
5、 视频是一系列图像连续播放形成(xngchng)的,具有丰富的信息内涵。视频信号具有时序性。由多幅连续的、顺序的图像序列构成动态图像,序列中的每幅图像称为一“帧”。若每帧图像为实时获取的自然景物图像时,就称为动态影像视频,简称视频。第一帧 第二帧 第三帧 第四帧 第五帧 第六帧 第七帧连续播放 多媒体应用基础共一百零四页3.多媒体技术 多媒体技术就是计算机综合处理多种媒体信息(文字、图形、图像、声音和视频(shpn)),使多种信息建立逻辑连接,集成为一个系统并具有交互性。 多媒体应用(yngyng)基础共一百零四页3.多媒体技术多媒体应用(yngyng)基础 多媒体技术最简单的表现形式就是多媒
6、体计算机。多媒体计算机相对于普通计算机的一个根本不同点在于在多媒体计算机中增加了对活动图像(包括(boku)伴音在内)的处理、存储和显示的能力,其硬件配以声卡、视频采集卡等。其主要特征体现在它能够有效地对电视图像数据进行实时的压缩和解压缩,并能够使在时间上有相关性的多种媒体保持同步。共一百零四页4多媒体通信 多媒体通信技术是多媒体技术、计算机技术、通信技术和网络技术等相互结合和发展的产物。多媒体通信系统同时(tngsh)具有以下三个特征:p29集成性交互性同步性多媒体应用(yngyng)基础共一百零四页集成性:主要(zhyo)是对各类信息进行存储、传输、处理、显现的能力。 1)内容数据信息:文
7、本、图形、静止图像与二值图像、声音、运动图像 。 2)多媒体和超媒体信息:是结构化信息,由结构框架+内容数据组成。 3)脚本信息 4)特定的应用信息多媒体应用(yngyng)基础共一百零四页交互性:指的是在通信中使用者与系统之间的相互沟通的特性,它使用户可以更有效地控制(kngzh)和使用信息,增加对信息的注释和理解。 交互性有两个方面的内容:人机接口:也就是人在使用系统的终端时,系统向用户提供的操作界面。通信协议:用户终端与系统之间的应用层通信协议。多媒体应用(yngyng)基础共一百零四页同步性:多媒体通信终端上显现的图象、声音和文字等信息(xnx)是以同步方式工作。检索“刘谦 春晚”,显
8、示多媒体信息,各信息同步显示。多媒体应用(yngyng)基础共一百零四页通信技术(电话、传真)广播技术(广播、电视)计算机技术文本图形图像音频视频动画存储传送处理多媒体技术多媒体应用(yngyng)基础共一百零四页 多媒体技术发展历程 1984年:美国Apple公司开创了用计算机进行图像处理的先河 1985年:美国Commodore公司推出了首台多媒体计算机系统 1986年:PHILIPS公司和SONY公司共同制定(zhdng)了CD-I(交互式光盘系统标准) 1990年:Microsoft和SONY等公司成立了多媒体个人计算机市场协会1991年:制订出多媒体计算机(MPC)硬件配置的最低标准
9、, 即MPC1标准 1993年:推出了MPC2标准1995年:推出了MPC3标准 此后:推出了MPC4标准 多媒体应用(yngyng)基础共一百零四页多媒体技术特点(tdin) 多媒体技术是指利用计算机技术将多种媒体信息综合一体化,使它们建立起逻辑联系,并能进行加工(ji gng)处理的技术。具有许多特点。 多样性集成性交互性实时性数字化 多媒体技术提供了多维信息空间下的视频和音频信息的获取和表示方法。 是指以计算机为中心,综合处理多种信息媒体的特性,还包括媒体设备的集成。 指用户与计算机之间进行数据交换、媒体交换和控制权交换的一种特性。 将计算机系统的交互性、通信系统的分布性和电视系统的真实
10、性有机地结合在一起,在人的感官系统允许情况下,进行多媒体实时交互。 指各种媒体信息都以数字形式(0和1的方式)进行存储和处理 多媒体应用基础共一百零四页多媒体的相关(xinggun)技术 1).数据压缩(sh j y su)与编码技术 多媒体信息,如音频和视频等,数据量大,存储和传输都需要大量的空间和时间。因此必须考虑对数据进行压缩编码。 选用合适的数据压缩与编码技术,可以将音频数据量压缩到原来的1/21/10,图像数据量压缩到原来的1/21/60。多媒体应用基础共一百零四页2006年7月27日:英特尔酷睿2双核处理器诞生(dnshng)。该处理器含有2.9亿多个晶体管。2007年1月8日:英
11、特尔酷睿2四核处理器含有5.8亿多个晶体管。2)大规模集成电路(jchng-dinl)技术 集成电路是采用专门的设计技术和特殊的集成工艺,把构成半导体电路的晶体管、二极管、电阻、电容等基本元器件,制作在一块半导体单晶片或绝缘基片上,能完成特定功能或者系统功能的电路集合。大规模集成电路(Large Scale Integrated circuites,LSI ) 超大规模集成电路(Very Large Scale Integrated circuites, VLSI)通常指含逻辑门数为100门1万门,或元件数100010万个)。通常指含逻辑门数超过5000个,或元件数高于10万个。多媒体应用基础
12、共一百零四页3)多媒体存储技术 光存储技术是通过光学的方法读、写数据,使用(shyng)的光源基本上是激光,又称为激光存储。 在多媒体计算机中使用的最广泛的是CD-ROM光盘。1996年又推出了DVD(Digital Video Disc)光盘标准,使得计算机的光盘驱动器能从单个盘面上读取4.7GB17GB的数据量。多媒体应用(yngyng)基础共一百零四页4)多媒体通信技术(jsh) 多媒体通信技术使计算机、通信网络和广播电视三者有机(yuj)地融为一体,是多媒体技术和通信技术的完美结合,它使人们的工作效率大大提高,改变了人们的生活和娱乐方式,如可视电话、视频会议、视频点播以及分布式网络系统
13、等,都是多媒体通信技术的应用。 多媒体应用基础共一百零四页5)超文本与超媒体技术(jsh) 超文本使得单一的信息元素之间通过指向对方的地址字符串相互交叉“引用”。是一种非线性的信息组织形式。 利用超文本形式组织起来的文件不仅仅是文本,也可以是图、文、声、像以及视频等多媒体形式的文件。这种多媒体信息就构成了超媒体。 超文本向超媒体的转变不仅是将文本媒体扩展到其它媒体,而且还要使系统能自动地判断媒体类型(lixng),并执行对应的操作。多媒体应用基础共一百零四页6)多媒体数据库技术(jsh) 多媒体数据库要解决的关键技术有多媒体数据库的存储和管理技术、分布式技术、多媒体信息再现和良好的用户界面处理
14、技术等。 多媒体数据库模型主要采用(ciyng)关系数据库模型的扩充和面向对象的设计方法。多媒体应用基础共一百零四页7)虚拟现实(x n xin sh)技术 虚拟现实技术是一项综合集成技术,它综合了计算机图形学、人机交互技术、传感技术、人工智能等领域最先进的技术,生成模拟现实环境(hunjng)的三维的视觉、听觉、触觉和嗅觉的虚拟环境(hunjng)。 目前,虚拟现实技术已广泛应用于航空航天、医学实习、建筑设计、军事训练、体育训练和娱乐游戏等许多领域。多媒体应用基础共一百零四页多媒体计算机系统(xtng) 在普通计算机系统基础上,增加一些硬件设备和相应软件就构成了多媒体个人计算机,通常(tng
15、chng)简称为MPC。 多媒体个人计算机 多媒体应用基础共一百零四页 1990年11月,美国Microsoft和日本SONY等公司成立的“多媒体个人(grn)计算机市场协会(Multimedia PC Marketing Council)”,为了促进多媒体计算机的标准化,先后发布了4个MPC标准。多媒体计算机标准(biozhn)MPC4要求在PC机的基础上增加四类软、硬件产品:声/像输入设备声/像输出设备功能卡 软件支持 光驱、话筒、扫描仪、录音机和摄像机等。 音频卡、刻录光驱、投影仪和打印机等。 电视卡、视频采集卡、视频输出卡、网卡和VCD压缩卡等。 音响、视频和通信信息以及实时、多任务处
16、理软件。多媒体应用基础共一百零四页多媒体计算机硬件(yn jin)系统 多媒体计算机系统一般由多媒体计算机硬件和软件系统组成。多媒体计算机硬件系统是在个人计算机基础上,增加各种( zhn)多媒体输入和输出设备及其接口卡。 多媒体计算机硬件配置的基本要求是:功能强大的CPU和内存储器;可高分辨率处理图像的视频显示卡和显示设备;可高保真处理音频的声卡和设备;可存放海量多媒体数据的存储设备以及其他输入、输出设备。多媒体应用基础共一百零四页多媒体计算机硬件(yn jin)系统p8打印机扫描仪光盘机话筒音响设备MIDI电视机录像机影碟机摄像机网卡网络通讯视频卡显示器声音卡扬声器主机多媒体计算机硬件系统示
17、意图 多媒体应用(yngyng)基础共一百零四页1)声卡 通过主板扩展槽与主机相连(xin lin),用于处理音频信息。声卡可以把话筒、录音机和电子乐器等输入的声音信息进行模数转换(A/D)、压缩等处理,也可以把经过计算机处理的数字化的声音信号通过还原(解压缩)、数模转换(D/A)后用音箱播放出来,或者用录音设备记录下来。 多媒体应用(yngyng)基础共一百零四页2)显卡 显卡又称图形适配器,是显示高分辨率色彩图像的必备硬件,用于控制最终呈现在屏幕上的像素,这些像素组成(z chn)了图像并且有颜色。 多媒体应用(yngyng)基础共一百零四页3)光盘(un pn)驱动器(光驱) 分为只读光
18、驱(un q)和可读写光驱。可读写光驱又称刻录机,用于读取或存储大容量的多媒体信息。 多媒体应用基础共一百零四页4)交互(jioh)控制接口 用来连接触摸屏、鼠标、光笔等人机交互设备,这些设备将大大方便(fngbin)用户对多媒体计算机的使用。 多媒体应用基础共一百零四页5)扫描仪 扫描仪可以将一幅图形、图片和文字材料快速地输入计算机。扫描仪一般通过RS-232或USB接口与主机相连。扫描仪也可以快速方便地将各种( zhn)中西文印刷体扫描到计算机内,利用文字识别(OCR)软件,转换为文本文件,加速计算机文字录入过程。 多媒体应用(yngyng)基础共一百零四页 是一种数字成像设备,是一种与计
19、算机配套使用的照相机。是集光、机、电于一体(yt)的数字化产品。与普通光学照相机相比,最大区别在于数码照相机用存储器保存图像资料,而不通过胶片保存图像。6)数码(shm)照相机 家庭用数码照相机 专业用数码照相机 多媒体应用基础共一百零四页 7)数码(shm)摄像机(DV) 数码摄像机的优点(yudin)是动态拍摄效果好,电池容量大,DV带支持长时间拍摄。数码摄像机拍、编、播自成一体,按照功能和使用场合可分为家庭用和专业用两种。 家庭用数码摄像机 专业用数码摄像机 多媒体应用基础共一百零四页 8) 触摸屏 一种坐标定位装置(zhungzh),安装在显示器表面,触摸显示器上的菜单或按钮时,该装置
20、将触摸位置的坐标信息传送给触摸检测装置,送往计算机主机,做出相应的反应。触摸一次相当于单击一次鼠标。触摸屏分类 按照安装方式可分为四种: 外挂式、内置式、整体式和投影仪式。 按照技术原理可分为五种: 红外线触摸屏、电容(dinrng)触摸屏、电阻触摸屏、表面声波触摸屏和矢量压力触摸屏。 多媒体应用基础共一百零四页表面声波触摸屏五线电阻触摸屏电容触摸屏红外线触摸屏多媒体应用(yngyng)基础共一百零四页多媒体计算机软件系统 p21 多媒体计算机软件系统按功能可分为(fn wi)系统软件和应用软件。多媒体应用系统多媒体编辑与创作工具多媒体库函数和素材制作工具多媒体操作系统多媒体库计算机主机与外围
21、设备设备驱动软件与接口程序多媒体计算机系统的主要系统软件1. 系统软件 系统软件是多媒体系统的核心,管理、监控和维护(wih)多媒体计算机资源 启动操作系统时,多媒体设备驱动程序将设备状态、型号和工作模式等信息提供给操作系统,并驻留在内存储器中,供系统调用。通常驱动程序有视频子系统、音频子系统及视频音频信号获取子系统等。 是一个实时多任务软件系统,是多媒体计算机的控制中枢,控制所有设备和软件协同工作。保证音频、视频同步控制及信息处理的实时性,提供多媒体信息的各种基本操作和管理。 是为多媒体应用程序准备数据的软件。常见多媒体素材制作软件有3种:第一种为图像处理软件,常用的有Photoshop等;
22、第二种为动画制作软件,常用的有Flash等;第三种为音频处理软件,常用的有Easy CD-DA Extractor等。 多媒体创作软件可以完成多媒体素材的组合与处理、控制手段的实施、交互功能的实现、输入与输出控制和界面的生成等。常用的多媒体创作软件有Visual Basic、Authorware和Macromedia Director等。2. 应用软件 是多媒体创作平台上设计开发的面向应用的软件。多媒体应用软件不仅要求用计算机技术将文字、声音、图形、图像、动画及视频等有机地融合为图、文、声、形并茂的应用系统,而且要进行精心创意和组织,使其变得更加人性化和自然化。多媒体应用基础共一百零四页多媒体
23、计算机应用(yngyng)系统多媒体应用(yngyng)基础1)互联网络 计算机网络是20世纪60年代末开始发展起来的,是通信技术和计算机技术结合的产物。 20世纪90年代,多媒体技术迅速发展起来,塑造了计算机发展史上的一个里程碑,21世纪初,多媒体网络发展起来,它是通信技术、计算机技术、多媒体技术结合的产称,呈现在我们面前的Internet信息高速公路已成为多媒体信息交互通信的媒介。p28共一百零四页2)IPTV网络(wnglu)电视 IPTV即交互式网络电视,是一种利用宽带有线电视网,集互联网、多媒体、通信等多种技术于一体,向用户提供包括数字电视在内的我种交互式服务的新技术。 IPTV可以
24、实现媒体服务者和消费者互动,能根据用户的选择提供视频点播、网页浏览、电子邮件及娱乐、商务和教育等多媒体服务功能。 目前由宽带内容制作商、网上播出单位、内容整合(zhn h)商/分发商、宽带网络运营商和技术设备提供商构成的网络电视产业链已基本形成。 IPTV的迅速发展,将给广播电视业和通信业带来一个崭新的局面。共一百零四页多媒体应用(yngyng)基础2)网络(wnglu)视频会议 网络视频会议是宽带网络普及后的一种多媒体应用。只要在网络两端连接网络摄像头,就可以通过网络传送文字、声音和图像,用户间可实时进行信息交换,如MS或RealNetworks公司的流媒体播放器。 若建立多人同时进行的网络
25、视频会议通信,由需要架设专业的视频会议服务器与相关设备。 目前,已将这一技术运用到了企业咨询和家庭娱乐等方面,构建了企业咨询平台和视频聊天平台。共一百零四页多媒体应用(yngyng)基础3)虚拟现实(x n xin sh) 虚拟现实是一种营造虚拟环境的技术,采用虚拟现实造型语言VRML(Virtual Reality Modeling Language)描述三维物体及行为,构造出一个虚拟世界,使参与者获得与现实世界相同的感觉。 模拟训练是VRML一个重要应用领域,可应用于模拟高难度和危险性环境下的训练,如医疗手术训练、航天运载器的空间活动、空间站的操作等地面训练。 VRML还可广泛应用于军事领
26、域、产品设计与性能评价领域及娱乐领域等。共一百零四页多媒体应用(yngyng)基础4)电子(dinz)出版物电子出版物(电子书、电子著作、电子杂志)是以光磁介质或网络为载体的新型媒体,它以、图、文、声像并茂、超链接人机互动的形式,吸引人们,它不受行业和学科的限制,让用户方便而快捷地享受实时的各类信息。共一百零四页多媒体应用(yngyng)基础5)远程教育(yun chn jio y)远程教育的特点是不受时空的限制,接受专业或技能教育和知识更新。网络流媒体完全音频课件可以将各学科学术权威、专家、学者和名师的研究、课程和讲座保存下来,通过远程教育网络,为边远山区、农牧区、厂矿等地区的民众服务。共一
27、百零四页多媒体应用(yngyng)基础6)静动态(dngti)广告 广告是商品经济的产物,是一种简洁、易懂的图像语言,使人们能在最短的时间内了解并接受信息。它一直被新思维、新观念、新科技、新媒体等引导着向前发展。共一百零四页多媒体应用(yngyng)基础7)计算机动画及动漫产业(chny)该行业主要应用领域:(1)面向影视制作的应用 不强调画面的真实性,只追求观赏性和趣味性,其中角色的运动可以有些虚幻,但绘制技术要求较高。能模拟出各种真实感效果。(2)面向模拟的应用 着眼于各种真实问题的仿真研究,追求数据的正确性和结果的可信性,以及能使各种以前仅能得到大批数据的科学试验可视化。共一百零四页多媒
28、体应用(yngyng)基础8)在线(zi xin)游戏 在线游戏是目前最为流行的互动多媒体游戏应用,通过Internet让许多人在一起享受游戏的快乐,视频与声光效果渲染,吸引着众多的游戏爱好者。共一百零四页多媒体应用(yngyng)基础9)家庭(jitng)娱乐 家庭影院是家庭中最普遍的多媒体休闲娱乐应用。由多媒体计算机或DVD-ROM机搭配一台数字投影仪,以高品质扬声器音频输出,就可以组成具有电影院水准的家庭影院。共一百零四页1多媒体数据压缩(sh j y su)技术 数据压缩的必要性和可能性。补充(bchng):多媒体通信中的关键技术共一百零四页多媒体信息(xnx)的特点1.多媒体信息的类
29、型(lixng) 文本、图形、图像、动画、声音、视频2. 常用多媒体处理软件 CorelDraw Illustrator 图形类图像类photoshop ACDSee 共一百零四页多媒体信息(xnx)的特点 动画类二维动画Flash ANIMO 三维动画(sn wi dn hu)3ds max mayaCooledit pro VEGAS 声音类影视编辑类交互演示类Authorware director flashPremiere after effect 编程类Vb VC Delphi Java共一百零四页cool editCool Edit Pro 是美国(mi u) Syntrilliu
30、m Software Corporation 公司开发的一款功能强大、效果出色的多轨录音和音频处理软件。它是一个非常出色的数字音乐编辑器和MP3制作软件。不少人把Cool Edit形容为音频“绘画”程序。你可以用声音来“绘”制:音调、歌曲的一部分、声音、弦乐、颤音、噪音或是调整静音。而且它还提供有多种特效为你的作品增色:放大、降低噪音、压缩、扩展、回声、失真、延迟等。共一百零四页cool edit你可以同时处理多个文件,轻松地在几个文件中进行剪切、粘贴、合并、重叠声音操作。使用它可以生成的声音有:噪音、低音、静音、电话信号等。该软件还包含有CD播放器。其他功能包括:支持可选的插件;崩溃恢复;支
31、持多文件;自动静音检测和删除;自动节拍查找;录制等。另外,它还可以在AIF、AU、MP3、Raw PCM、SAM、VOC、VOX、WAV等文件格式之间进行转换,并且(bngqi)能够保存为RealAudio格式!共一百零四页GoldWaveGoldWave是一个集音频剪辑软件,音频转换器,处理制作工具,编辑,播放,录制,和转换的音频工具,体积小巧,功能却不弱。GoldWave下载安装后可打开的音频文件相当多,包括WAV, OGG, VOC, IFF, AIF, AFC, AU, SND, MP3,MAT, DWD, SMP, VOX, SDS, AVI, MOV等音频文件格式,你也可以从 CD
32、 或 VCD 或 DVD 或其它视频文件中提取声音。内含丰富的音频处理特效,从一般特效如多普勒、回声、混响、降噪到高级的公式计算(利用公式在理论上可以产生任何你想要的声音),效果多多。goldwave5.08 版在处理速度上有了很大提高,而且能够支持(zhch)以动态压缩保存 MP3 文件。共一百零四页3. 多媒体信息的特点(tdin)多媒体数据类型复杂(多样性) 多媒体数据种类繁多也决定了多媒体数据表示的复杂性多媒体数据的实时性 由于在多媒体技术中新引入的复杂媒体类型大部份都含有与时间有关(yugun)的信息,因此在许多场合都要求实时处理共一百零四页3. 多媒体信息的特点(tdin)多媒体数
33、据的同步性 另一由于引入与时间有关的媒体而形成的重要特点数据量大 多媒体系统需要大量的存储空间来存放复杂类型的数据多媒体数据的交互性码率可变、突发性强 人们讲话时的停顿、 所传场景图像中物体的运动(yndng)等都会形成码流速率的波动, 而且这种波动往往呈现出极强的突发性。共一百零四页信息(xnx)压缩的必要性由于多媒体数据量非常大,造成计算机的存储和网络传输负担若帧速率为25帧秒,则1s的数据量大约为25MB,一个640MB的光盘只能存放大约25s的动态图像一幅640480分辨率的24位真彩色图像的数据量约为900KB;一个100MB的硬盘只能存储约100幅静止图像画面解决办法之一就是(ji
34、sh)进行数据压缩,压缩后再进行存储和传输,到需要时再解压、还原。共一百零四页表1 各种信号的特性(txng)和未压缩速率共一百零四页信息(xnx)压缩的必要性 从上图可以看出: 未进行任何形式编码和压缩的窄带语音信号需要128 kb/s的速率, 即两倍于普通电话的速率。 信号未被压缩的宽带话音需要256 kb/s的速率, 未压缩的双声道立体声CD音频需要1.41 Mb/s的速率。 在保持原始信号质量的前提下, 窄带语音可以压缩到4 kb/s(301的压缩比), 宽带话音可以压缩到约16 kb/s(151的压缩比), CD音频可以压缩到64 kb/s(221的压缩比)。显然, 多媒体信号在进行
35、有效的存储和传输之前, 必须进行处理(chl), 而最关键的处理(chl)方法是进行数据压缩。共一百零四页信息压缩的可行性 研究表明,一个文件所包含的数据量并不等于它所包含的信息量,数据中通常包含很大的冗余,其关系(gun x)如: D=I+r 其中D为数据量, I为信息量,r为冗余量。压缩:在多媒体信息中包含大量冗余的信息,把这些冗余的信息去掉的过程。 共一百零四页信息压缩的可行性音频、图像和视频数据中存在的冗余主要有以下几种:(1)空间冗余 图象本身的数据冗余 在任何一幅图像中, 均有许多灰度或颜色都相同(xin tn)的邻近像素组成的局部区域, 它们形成了一个性质相同(xin tn)的集
36、合块, 即它们之间具有空间(或空域)上的强相关性, 在图像中就表现为空间冗余。空间冗余的压缩(y su)方法:把这种局部区域集合块当作一个整体, 用极少的数据量来表示, 从而节省存储空间。 这种压缩方法叫空间压缩或帧内压缩, 它的基本点就在于减少邻近像素之间的空间(或空域)相关性。共一百零四页信息压缩的可行性该图为一张俯视图, 图中央的黑色是一块表面均匀的积木(jm)块, 在图中, 黑色区域所有点的表示数据差不多都是相同的, 因而黑色区域的数据表达有很大的冗余。共一百零四页信息压缩的可行性(2)时间冗余 序列图像和语音数据中包含(bohn)的冗余。 活动图像(视频)中的两幅相邻图像之间存在的相
37、关性或一段时间内连续音频存在的相关性。共一百零四页信息压缩的可行性(3)信息熵(shng)冗余 信息熵冗余也称为编码冗余,它是指一块数据所携带的信息量少于数据本身所产生的冗余。例如,利用等长码表示信息就比不等长码如Huffman编码表示信息量存在冗余。(4)结构冗余 指图象各部分结构上的类似性所产生的冗余,例如物体表面(biomin)图象上的纹理结构。 共一百零四页信息压缩的可行性(5)知识冗余 指某些图象的结构可由这些图象的先验知识和背景知识获得。 例:汽车图象的结构可由汽车的经验知识和背景知识得到。这种冗余称为知识冗余。 例: 人脸的图像有固定的结构, 嘴的上方有鼻子, 鼻子的上方有眼睛,
38、 鼻子位于正脸图像的中线上等等。 这类规律的结构可由先验知识和背景知识得到, 因此(ync)这类信息对一般人来说是冗余信息。共一百零四页信息压缩的可行性(6)视觉听觉(tngju)冗余 视觉听觉冗余是指人的视觉、听觉分辨率低于实际图象、音频的分辨率所产生的冗余。例如,人的视觉对灰度等级的分辨率是2个等级,而一般图象量化所采用灰度等级是2等级。 例如, 人的视觉对于图像边缘的急剧变化不敏感, 对图像的亮度信息敏感, 对颜色的分辨率较弱等。 因此, 如果图像经压缩或量化发生的变化(或称引入了噪声)不能被视觉所感觉, 则认为图像质量是完好的或是够好的, 即图像压缩并恢复后仍有满意的主观图像质量。(7
39、) 其他冗余共一百零四页4. 压缩的种类无损压缩 也称为冗余压缩或无失真压缩。冗余压缩法去掉或者减少了数据中的冗余,但这些冗余数据是用特定的方法重新插入到数据中。冗余压缩是可逆的,它能保证百分之百地恢复(huf)原始数据。 在多媒体技术中,一般用于文本的压缩。但这种方法压缩比较低。常用的压缩编码方法有LZW编码、行程编码、霍夫曼(Huffman)编码等,压缩比一般在2:15:1之间。共一百零四页有损压缩 也称为有失真压缩或熵压缩法。压缩了熵,会减少信息量,而损失的信息量是不能恢复的,因此这种压缩方法是不可逆的。 这种方法适合对图像、声音、动态视频等数据进行压缩,对动态视频的压缩比可达到(d d
40、o)50:1200:1。当然,对多媒体数据进行有损压缩后,就涉及到压缩质量的问题,一般的要求是压缩后的内容不应该影响人们对信息的理解。共一百零四页数据压缩的主要(zhyo)指标 有较高的压缩比、压缩和解压缩时间短、解压缩后信息恢复(huf)质量高是评价压缩好坏的主要方面。1. 有较高的压缩比 即压缩前后的数据量之比,如果文件的大小为1MB,经过压缩处理后变成0.5MB,那么压缩比为2:1。高的压缩比是数据压缩的根本目的,无论从哪个角度看,在同样压缩效果的前提下,数据压缩得越小越好。当然还要考虑多媒体数据压缩后的输入和输出表示方式。共一百零四页数据压缩(sh j y su)的主要指标2. 解压缩
41、后信息恢复(huf)质量高 对于文本等文件,特别是是程序文件,是不允许在压缩和解压缩过程中丢失信息的。因此需要采用无损压缩,不存在压缩后恢复质量的问题。对于图像、声音和视频影像,数据经过压缩后允许信息的部分丢失。 在这种情况下,信息经解压缩后不可能完全恢复,压缩和解压缩质量就不能不考虑。因此,是否具有好的恢复质量是数据压缩的另一个重要指标。共一百零四页共一百零四页数据压缩的主要(zhyo)指标3. 压缩(y su)和解压缩(y su)时间短 数据的压缩和解压缩是在一定数学模型的基础上,通过一系列数学运算实现的。计算方法的好坏直接关系到压缩和解压缩过程所需要的时间。共一百零四页1.2 多媒体通信
42、中的关键技术视频压缩 从图像压缩编码的发展过程看,可以分为三个阶段,即第一代、第二代、第三代图像压缩编码方法。第一代图像压缩编码方法以仙农信息论为基础(jch),考虑图像信源的统计特性,采用预测编码、变换编码、矢量量化编码、子带编码、小波变换编码、神经网络编码等方法。第一代图像压缩编码方法于80年代初已趋于成熟,目前利用第一代技术对视频图像的压缩可以得到848Kb/s的最低码率。 第二代图像压缩编码方法充分考虑了人眼的视觉特性,从人类的主观特性出发,采用基于方向滤波的图像编码方法和基于图像轮廓纹理的编码方法,利用第二代图像压缩编码方法可以获得极低码率的图像数据,目前第二代技术尚未发展到成熟的阶
43、段。 第三代图像压缩编码方法考虑到了图像传递的景物特征,采用分形编码方法和基于模型的编码方法,其中基于模型的压缩编码方法是目前最活跃的研究领域,代表着新一代的压缩编码方向。共一百零四页有关图像压缩编码的国际标准主要有:JPEG、H.261、H.263、MPEG-1、MPEG-2/H.262、MPEG-4等。MPEG-7和MPEG-21是MPEG系列标准中的新成员,MPEG-7的正式名称为“多媒体内容描述接口”,用于描述多媒体内容数据。MPEG-21即“多媒体框架”,这一概念是在1999年10月的MPEG会议(huy)上提出的,它是一种用于协调处于不同地点、与不同类型的网络相联接的各种设备间进行
44、多媒体信息交互的综合性标准。音频压缩 基本上与图像压缩编码技术相同,不同之处在于图像信号是二维信号,而音频信号是一维信号。相比较而言,其数据压缩难度较低。涉及的声音压缩编码的国际标准主要有:G. 711、G. 721、G. 722、G. 728、G. 729、G. 723.1等。共一百零四页2多媒体数据的获取与显示技术 多媒体数据的获取与显示主要指人机交互的界面,它介于用户和计算机系统之间。用户通过人机界面向系统提供命令、数据等输入信息,系统则将输出信息通过人机界面呈现给用户。 字符界面,输入工具是键盘 图形化界面,输入工具是鼠标、跟踪球、电子笔、触摸屏、摄像头和视音频采集卡等;输出手段可采用
45、声音、图形图像以及活动视频作为信息的显示形式(xngsh)。 文字识别技术 语音识别技术共一百零四页3多媒体数据库及其检索技术传统的数据库管理系统管理多媒体数据的方法的局限性,集中表现在以下三个方面。 第一,多媒体数据所包含的信息量非常大,用人工注释难以准确描述; 第二(d r),多媒体数据随时变化,因而难以统计及预测; 第三,多媒体数据内部有各种复杂的时域、空域以及基于内容的约束关系,传统的数据库系统未曾涉及到这些方面。由此开发出新的多媒体数据库系统,同时基于内容的多媒体信息检索研究方案也应运而生。共一百零四页多媒体数据的内容包括概念级内容、感知特性(例如图像的颜色、纹理,声音的音色、音质等
46、)、逻辑关系(例如音视频对象的时空关系等)、信号特征(通过信号处理方法例如小波变换获得的媒体特征)、特定领域的特征(与应用相关,例如人的面部(min b)特征、指纹特征)等。4多媒体通信网络技术随着视频会议、视频点播、远程教育等多媒体网络应用的开展,能够满足多媒体应用需要的通信网络必须具有高带宽、可提供服务质量的保证、实现媒体同步等特点。共一百零四页目前的多媒体网络应用主要涉及到网络传输、服务质量、服务模式等方面的技术。因为传统的基于分组交换的IP网络只提供尽力而为型的服务,要在IP网上得到QoS的保证需要额外的协议或标准,目前有综合服务模型(IntServ)/RSVP、区分服务模型(Diff
47、Serv)、多协议标签交换MPLS等,而IETF新公布的IPv6协议则在一定程度上满足了QoS的服务质量要求。对于电路交换网,则通过已有的ITU-T H.32X和T.120等相关的系列标准来获得有保证的服务质量。而ATM网从协议本身就考虑了对多媒体应用的支持,可以为多媒体应用预留资源。多媒体应用还需要组播服务,其发展是多媒体应用的趋势。目前,应用在传统IP分组网上的组播技术正在得到进一步的研究和推广,相关的协议有因特网组管理协议IGMP(Internet Group Management Protocol),组播路由协议DVMRP、MOSPF、PIM和CBT等。ATM网的组播技术也是研究的一个
48、重要内容,其信令控制已经(y jing)可以采用组播技术,但是数据分发的组播技术还没有成熟。以软交换为核心的NGN网络为多媒体通信开辟了更广阔的天地。 共一百零四页5多媒体信息存储技术 既要保证存储设备的存储容量足够大,还要保证存储设备的速度要足够快,带宽要足够宽。满足(mnz)上述要求的存储设备有多种,包括硬盘、光盘、磁带、冗余磁盘阵列和存储区域网络等。6多媒体数据的分布式处理技术 用于分布式多媒体系统的业务多种多样,不同业务所用的多媒体终端也各不相同。目前常用的多媒体终端有多媒体计算机终端以及针对某种特定应用的专用设备,如机顶盒、可视电话终端设备等。终端的软件平台则包括系统软件以及各种应用
49、软件,其中操作系统是软件的核心。 多媒体操作系统有Apple公司的QuickTime、微软公司的Windows XP等。微软公司于2004年推出的Windows XP Media Center Edition 2004操作系统是专为多媒体个人电脑设计的。 流媒体技术也是一种分布式多媒体技术,它主要解决了在多媒体数据流传输过程中所占带宽宽,用户下载数据等待时间长的问题。 共一百零四页1.3 多媒体通信的应用(yngyng)多媒体通信系统的应用非常广泛,可以提供VOD视频点播,远程教学、远程办公、远程医疗(ylio)、多媒体电子邮件、可视电话、桌面视频会议,数字图书馆、电子百科书等多种多样的业务。
50、共一百零四页 多媒体通信的体系结构 传输网络:它是体系结构的最低层,它为多媒体通信的实现提供了最基本的物理环境(hunjng)。 网络服务平台:该层主要提供各类网络服务,是用户能直接使用这些服务内容,而无需知道底层传输网络是怎么提供这些服务的,即网络服务平台的创建使传输网络对用户来说是透明的。 多媒体通信平台:该层主要提供其通信支援(如多媒体信息处理),并支持各类多媒体的应用。 一般应用:指人们常见的一些多媒体应用。如多媒体文本检索。 特殊应用:指业务性较强的某些多媒体应用。如电子邮件。共一百零四页多媒体通信的体系结构 一般应用 特殊应用多媒体通信平台网络服务平台传输网络LAN、MAN、WAN
51、、ISDN共一百零四页多媒体网络(wnglu)的典型应用p28多媒体应用(yngyng)基础(1)交互式远程教学(网络多媒体教学,创建虚拟课堂)(2)远程医疗(远程医疗的多媒体网络首先要能对病历进行多媒体的文档管理,其次还能够通过多媒体网络共享医学专家和先进的医疗设备)(3)交互式视频服务 (视频点播、信息点播、视频会议)(4)多媒体通信(该层主要提供其通信支援(如多媒体信息处理),并支持各类多媒体的应用。如:多媒体电子邮件、可视电话、语音信箱、手机上网、发送彩色图像信息 )共一百零四页p29多媒体通信的的主要业务范围:(1)会话型 (2)电子邮件(din z yu jin)型(3)检索型 (
52、4)分配型P30多媒体计算机网络现存问题 :(1)宽带问题(2)服务质量(QOS)控制问题(3)网络可靠性和自愈能力(4)网络地址问题)多媒体应用(yngyng)基础共一百零四页多媒体项目(xingm)开发方法及过 程 p241 1) 主题策划、分析和确定(qudng)选题选题的基本原则:(1)要有积极进取和健康的思想内涵;(2)应具备一定的创新性、创造性和实用性。 选题应尽可能瞄准学科前沿知识、新技术。应根据文化、教育或企业信息化等行业领域的经济建设和社会需求进行,而且应具备一定的实用性和应用价值。共一百零四页多媒体项目(xingm)开发方法及过 程 1) 主题(zht)策划、分析和确定选题
53、选题的基本原则:(4)选择较为方便的素材资料库或较容易获取的素材源来确定选题,这样可以大大加快开发速度,缩短开发周期,有利于提高项目开发质量和效果。(3)应尽可能地靠近自己的专业研究方向、兴趣爱好或就业志向。 利用以往自己的经验知识,进一步掌握多学科的专业知识和技术技能,提高自己的综合业务能力和研发技术水平。共一百零四页多媒体项目(xingm)开发方法及过 程 2) 结构设计 多媒体项目(xingm)结构设计就是围绕主题建立系统结构。系统结构设计包括应用层、信息元层和数据元层的设计。(1)应用层 应用层从应用的角度考虑实现系统的人机交互功能、用户界面和目录结构等。 例如,在介绍旅游景点的多媒体
54、项目中,可以以图形化界面为使用者提供索引或导航,这是一种较为直观的人机交互方案。共一百零四页多媒体项目(xingm)开发方法及过 程 2) 结构设计(2)信息元层 信息元层具有一定信息内容所组成信息系统的信息子块,通常由一个或多个单媒体数据元复合而成,并以图、文、声、像并茂的形式(xngsh)与整个项目融为一体,具有集成性、同步性和实时性等特点。(3)数据元层 数据元层是由多媒体输入设备输入的数字化媒体,经格式化和数据压缩的数据文件,这里考虑的是对它们的存储、管理和调用方法等。共一百零四页多媒体项目(xingm)开发方法及过 程 共一百零四页多媒体项目(xingm)开发方法及过 程 3) 编写
55、制作(zhzu)脚本,明确工作任务 脚本是整个多媒体项目的主干,不仅要描述各项内容显示的顺序和步骤,还要将其中的分支路径、衔接的流程和每一步骤的详细内容完整地表现出来。 在编写脚本的时候应当说明项目的系统结构,描述项目的屏幕样本设计以及项目中的各种交互、导航关系,在固定的脚本格式表中填写画面的进入方式和时机、画面中所涉及的媒体文件以及如何从该画面进入其他画面等信息。共一百零四页多媒体项目(xingm)开发方法及过 程 3) 编写制作脚本,明确(mngqu)工作任务 脚本编写时应采用规范的格式,其中包括屏幕样本、注释信息和交互信息。屏幕样本:指每一幅屏幕上将要显示的文字、图像等信息的具体内容和它们在整个屏幕中的位置,可以通过绘制草图直观的表示。注释信息:说明屏幕样本中各种媒体信息呈现的时间,以及这些媒体信息所对应的文件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年旺铺租赁及合作合同版B版
- 2024年供应链管理合同的供应产品和流程
- 2024年度钢筋工施工分包协议3篇
- 2024年民间个人借贷协议范本集锦版B版
- 2024年房地产买卖合同标的及交付时间表
- 2024年度美容院品牌授权与许可使用合同3篇
- 国考行测题库及答案解析
- 企业技术负责人的职责
- 临床试验基本流程
- 2024年工业厂房抗漏工程合同3篇
- 刑法学(上册)(第二版) 课件 第5、6章 犯罪客体、犯罪客观方面
- 土方开挖工程检验批质量验收记录
- 小学数学-《认识多边形》单元复习教学课件设计
- 价值流PSI拉动畅流
- 跨学科学习:神奇的学科跨越
- 如何做好无负压供水设备维护和保养
- 公转私借款合同(标准版)
- 保障农民工工资支付条例解读课件
- 碎石物资运输及组织供货方案
- 标准横梁货架承载速查表(超实用)
- 德能勤绩廉量化考核表
评论
0/150
提交评论