基于OPENCV的视频播放器设计_第1页
基于OPENCV的视频播放器设计_第2页
基于OPENCV的视频播放器设计_第3页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、沈阳理工高校学士学位论文摘 要本文旨在通过vc+6.0 开发平台开发一个基于opencv 的视频播放器。opencv 是计算机视觉库,基于opencv 的视频播放器可以更简洁的实现avi 视频的播放。首先,本文简洁介绍了vc+6.0 软件开发平台,opencv 计算机视觉库的特点和应用领域,计算机视频技术的进展,以及各种视频格式的分类等;其次选择在微软的microsoft visual studio 6.0开发平台上使用c+语言进行开发,编写出基于opencv 的功能简洁有用便利的视频播放器。主要包括以下几个方面:开发本软件所使用的开发平台与技术;功能模块;功能设计;功能实现等。关键词:mic

2、rosoft visual studio 6.0;opencv;c+;视频播放器;avi 格式ivabstractthis paper aims to develop a vc + + 6.0 development platform based on the video player opencv, opencv is based on computer vision, the video player can opencv more simple realization video playback. avi.firstly, the paper simply introduces vc

3、+ + 6.0 software development platform under opencv, computer vision, the characteristics and application fields of the library, computer video technology development, as well as various video format of classification, second choice at microsoft microsoft visual studio 6.0 development platform using

4、c + + language development, and write a simple and practical opencv based on the function of video player convenience.mainly includes the following aspects: the development of the software development platform and technology of use, function module, functional design, functions, etc.keywords: micros

5、oft visual studio 6.0; opencv; c+;video player; avi format目 录1 绪论11.1 概述11.2 opencv 简介21.2.1 opencv21.2.2 opencv 的应用领域31.2.3 计算机视觉41.3 论文主要争辩内容及争辩意义61.4 论文组织结构62 视频技术概述72.1 多媒体技术72.2 视频格式及视频流播放回放132.2.1 视频格式分类132.2.2 视频流播放与回放173 opencv 库使用183.1 在vc 下安装opencv.184 vc 开发环境224.1 vc+的组件工具224.1.1 编译器工具234

6、.1.2vc+库234.1.3vc+开发环境245 视频播放器的设计与实现255.1 模块划分255.1.1 播放器功能模块图255.2 具体设计265.2.1 主界面的实现265.2.2 文件把握的实现285.2.3 播放把握的实现305.2.4 进度把握的实现345.2.5 系统声明346 程序运行结果及分析356.1 运行结果测试356.2 结果分析37结 论38致 谢39参考文献40附录 a英文原文41附录 b汉语翻译47附录 c程序源代码52沈阳理工高校学士学位论文1绪论1.1 概述c+语言是一种优秀的面对对象程序设计语言,它在c 语言的基础上进展而来,但它比 c 语言更简洁为人们学

7、习和把握。c+以其独特的语言机制在计算机科学的各个领域中得到了广泛的应用。面对对象的设计思想是在原来结构化程序设计方法基础上的一个质的飞跃,c+完善地体现了面对对象的各种特性。1c+程序设计语言是由来自 at&t bell laboratories 的bjarne stroustrup 设计和实现的,它兼具 simula 语言在组织与设计方面的特性以及适用于系统程序设计的c 语言设施。c+最初的版本被称作“带类的 c(c with classes)”stroustrup,1980,在 1980 年被第一次投入使用;当时它只支持系统程序设计和数据抽象技术。支持面对对象程序设计的语言设施在

8、 1983 年被加入 c+;之后,面对对象设计方法和面对对象程序设计技术就渐渐进入了 c+领域。在 1985 年,c+第一次投入商业市场。在 1987 至 1989 年间, 支持范型程序设计的语言设施也被加进了 c+。2随着若干独立开发的 c+实现产品的消灭和广泛应用,正式的 c+标准化工作在1990 年启动。标准化工作由 ansi(american national standard institute)以及后来加入的 iso(international standards organization)负责。1998 年正式公布了 c+语言的国际标准c+,1998。而 vc 是基于 c,c+语

9、言,主要由是 mfc 组成,是与系统联系格外紧密的编程工具,它兼有高级,和低级语言的双重性,功能强大,机敏,执行效率高,几乎可说 vc 在 windows 平台无所不能。3avi(audio video interleave)是一种音频视像交插记录的数字视频文件格式。1992 年初microsoft 公司推出了avi 技术及其应用软件vfw(video for windows)。在 avi 文件中,运动图像和伴音数据是以交错的方式存储,并独立于硬件设备。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。avi 可以算是 windows操作系统上最基

10、本的也是最常用的一种媒体文件格式,兼容性比较好。构成一个 avi 文件的主要参数包括视像参数、伴音参数和压缩参数等。67opencv 是 intel 公司支持的开源计算机视觉库。它轻量级而且高效由一系列 c函数和少量 c+ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。计算机视觉市场巨大而且持续增长,且这方面没有标准api,目前的计算机视觉软件或许有以下三种:1. 争辩代码(慢,不稳定,独立并与其他库布兼容)2. 耗费很高的商业化工具(比如 halcon, matlab+simulink)3. 依靠硬件的一些特别的解决方案(比如视频监控,制造把握系统,医疗设备) 这是目前的现状。而标准

11、的 api 将简化计算机视觉程序和解决方案的开发。opencv致力于成为这样的标准 api。本文在此基础上设计一个基于 opencv 的视频播放器,可以更简捷的实现 avi 格式视频文件的播放,暂停,停止等操作。1.2 opencv 简介1.2.1 opencvopencv 是 intel 资助的开源计算机视觉库。它由一系列 c 函数和少量 c+ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。opencv 拥有包括 300 多个 c/c+函数的跨平台的中、高层 api。它不依靠与其它的外部库,尽管也可以使用某些外部库。opencv 对非商业应用和商业应用都是免费的。另外 opencv

12、也为 intel 公司的integrated performance primitives (ipp) 供应了透亮接口。 这意味着假如有为特定处理器(intel 的处理器)优化的的 ipp 库, opencv 将在运行时自动加载这些库。opencv 的一个目标是构建一个简洁易用的计算机视觉框架,以挂念开发人员更便捷地设计更简单的计算机视觉相关应用程序。opencv 包含的函数有 500 多个,掩盖了计算机视觉的很多应用领域,如工厂产品检测、医学成像、信息平安、用户界面、摄像机标定、立体视觉和机器人等。由于计算机视觉和机器学习亲热相关,所以opencv 还供应了 mll(machine lear

13、ning library) 机器学习库。该机器学习库侧重于统计方面的模式识别和聚类(clustering)。mll 除了用在视觉相关的任务中,还可以便利地应用于其他的机器学习场合。开发 opencv 的目的是为了促进 cpu 密集型应用。为了达到这一目的,intel 启动了多个项目,包括实时间线追踪和三维显示墙。一个在 intel 工作的 opencv 作者在访问一些高校时,留意到很多顶尖高校中的争辩组(如 mit 媒体试验室)拥有很好的内部使用的开放计算机视觉库 (在同学们之间相互传播的代码),这会挂念一个新生从高的起点开头他/她的计算机视觉争辩。这样一个新生可以在以前的基础上连续开头争辩,

14、而不用从底层写基本函数。因此,opencv 的目的是开发一个普遍可用的计算机视觉库。在intel 的性能库团队的挂念下,opencv 实现了一些核心代码以及算法,并发给intel 俄罗斯的库团队。这就是 opencv 的诞生之地:在与软件性能库团队的合作下,它开头于 intel 的争辩中心, 并在俄罗斯得到实现和优化。1.2.2 opencv 的应用领域大多数计算机科学家和程序员已经意识到计算机视觉的重要作用。但是很少有人知道计算机视觉的全部应用。例如,大多数人或多或少地知道计算机视觉可用在监控方 面,也知道视觉被越来越多地用在网络图像和视频方面。少数人也了解计算机视觉在玩耍界面方面的应用。但

15、是很少有人了解大多数航空和街道地图图像(如 google 的 street view)也大量使用计算机定标和图像拼接技术。一些人知道平安监控、无人飞行器或生物医学分析等方面的应用,但是很少人知道机器视觉是多么广泛地被用在工厂中:差不多全部的大规模制造的产品都在流水线上的某个环节上自动使用视觉检测。opencv 全部的开放源代码协议允许用户使用opencv 的全部代码或者opencv 的部分代码生成商业产品。使用了opencv 后,用户不必对公众开放自己的源代码或改善后的算法,虽然intel 公司格外期望用户能够开放源代码。很多公司(ibm,microsoft, sony,siemens 和 g

16、oogle 等其他公司)和争辩单位(例如斯坦福高校、mit、cmu、剑桥高校和 inria)中的人都广泛使用 opencv,其部分缘由是 opencv 接受了这个宽松的协议。yahoo groups 里有一个 opencv 论坛( 20 000 个会员。opencv 在全世界广受欢迎, 在中国、日本、俄罗斯、欧洲和以色列都有浩大的用户群。自从 opencv 在 1999 年 1 月公布 alpha 版本开头,它就被广泛用在很多应用领域、产品和争辩成果中。相关应用包括卫星地图和电子地图的拼接,扫描图像的对齐,医学图像去噪(消噪或滤波),图像中的物体分析,平安和入侵检测系统,自动监视和平安系统,制

17、造业中的产品质量检测系统,摄像机标定,军事应用,无人飞行器,无人汽车和无人水下机器人。将视觉识别技术用在声谱图上,opencv 可以进行声音和音乐识别。在斯坦福高校的 stanley 机器人项目中,opencv 是其视觉系统的关键部分。stanley 在darpa 机器人沙漠挑战赛中,赢得了二百万美元奖金thrun06。41.2.3 计算机视觉计算机视觉是将来自静止图像或视频的数据转换成一个决策或者一种新的表达方 式的过程,全部的这些转换都是为了达到某个目标。输入数据可以包含一些关心信息, 如“摄像机架在汽车上”或“激光扫描仪在 1 米处发觉一个物体”。最终的决策可能是“场景中有一个人”或“在

18、这个切片中有 14 个肿瘤细胞”。一种新的表达方式可以是将一张彩色照片转为灰度照片,或者从图像序列中去除摄像机晃动影响。由于人类是视觉动物,所以会误以为可以很简洁地实现计算机视觉。当人们注视图像时,就会很简洁从中找到一辆汽车。人们凭直觉会觉得很简洁。人脑将视觉信号划分入很多个通道,将各种不同的信息输入了大脑。大脑有一个关注系统,会依据任务识别出图像的重要部分,并做重点分析,而其他部分则分析得较少。在人类视觉流中存在大量的反馈,但是目前我们对之了解甚少。肌肉把握的传感器以及其他全部传感器的输入信息之间存在广泛的关联,这使得大脑可以依靠从诞生以来所学到的信息。大脑中的反馈在信息处理的各个阶段都存在

19、,在传感器硬件(眼睛)中也存在。在眼睛中通过反馈来调整通过瞳孔的进光量,以及调整视网膜表面上的接收单元。在计算机视觉系统中,计算机接接收到的是来自摄像机或者磁盘文件的一个数值矩阵。一般来说,没有内置的模式识别系统,没有自动把握的对焦和光圈,没有多年来阅历的积存。视觉系统通常很低级。实际上,计算机视觉问题比前面我们提到的更糟糕,它是不行解的。给出三维世界的二维视图,是没有固定方法来重建出三维信息的。在理论上,此类病态问题没有惟一和确定的解。即使数据很完善,同一张二维图像也可以表示多种三维场景。然而,如前面提到的,数据会被噪声和形变影响。这些影响来自真实世界的变化 (天气、光线、反射、运动),镜头

20、和机械结构的不完善,传感器上的长时间感应(运动模糊),传感器上和其他电子器件上的电子噪声,以及图像采集后的图像压缩引入的变化。都是很令人头疼的问题。设计实际系统时,为了克服视觉传感器的限制,通常会使用一些其他的上下文知 识。考虑这样一个例子,移动机器人在室内查找并捡起订书机。机器人可以利用这个先验学问:可在办公室内发觉桌子,订书机最可能在桌子上被找到。这给出了一个隐含的尺寸参考或参照,也就是订书机能够放在桌子上。这也可以用于消退在不行能的地方(例如在天花板或者窗户上)错误识别出订书机的可能性。机器人也完全可以忽视一个 200 英尺大小的跟订书机外形类似的广告飞艇,由于飞艇四周没有桌子的木纹背景

21、。与之相反,在图像检索中,数据库中的全部订书机图像都是对真正的订书机拍摄的,而且尺寸很大和外形不规划的订书机图像一般不行能被拍到。也就是拍摄者一般只拍摄真正的、一般大小的订书机图像。而且人们拍照时一般会将被拍物体置于中心,且将物体放在最能表现其特征的方向上。因此在由人拍摄的图像中,具有相当多的隐含信息。5人们也可以使用机器学习技术对上下文信息进行显式建模。隐含的变量 (例如物体大小、重力方向及其他变量)都可以通过标记好的训练数据里的数值来校正。或者,也可以通过其他的传感器来测量隐含的变量。使用激光扫描仪可以精确测量出一个物体的大小。计算机视觉面临的另一个难题是噪声问题。我们一般使用统计的方法来

22、克服噪 声。例如,一般来说不行能通过比较一个点和它紧密相邻的点来检测图像里的边缘。但是假如观看一个局部区域的统计特征,边缘检测会变得简洁些。由局部区域卷积的响应连成的点串,构成边缘。另外可以通过时间维度上的统计来抑制噪声。还有一些其他的技术,可以从数据中学习显式模型,来解决噪声和畸变问题。例如镜头畸变,可以通过学习一个简洁多项式模型的参数来描述这种畸变,然后可以几乎完全校正这种畸变。计算机视觉拟依据摄像机数据来实行行动或者做出决策,这样的行动或决策是在一个指特定目的或任务的环境中来解决。我们从图像去除噪声和损坏区域,可以让监控系统在有人爬过栅栏时给出报警,或者在一个游乐园里监控系统能够数出总共

23、有多少人通过了某个区域。在办公室巡游的机器人的视觉软件所接受的方法与固定摄像机的不同, 由于这两个系统有不同的应用环境和目标。通用的规律是:对计算机视觉应用环境的约束越多,则越能够使用这些约束来简化问题,从而使最终的解决方案越牢靠。6opencv 的目标是为解决计算机视觉问题供应基本工具。在有些状况下,它供应的高层函数可以高效地解决计算机视觉中的一些很简单的问题。当没有高层函数时,它供应的基本函数足够为大多数计算机视觉问题创建一个完整的解决方案。对于后者,有几个经过检验且牢靠的使用 opencv 的方法;全部这些方法都是首先大量使用 opencv 函数来解决问题。一旦设计出解决方案的第一个版本

24、,便会了解它的不足,然后可以使用自己的代码和学问来解决(更为广知的一点是“解决实际遇到的问题,而不是我们想像出来的问题”)。解决方案所存在的不足可以通过系统所用的环境限制来解决。71.3 论文主要争辩内容及争辩意义本课题主要是在vc6.0 开发环境下,通过调用opencv api(计算机视觉库),实现一个基于 opencv 的视频播放器的设计。该视频播放器需要实现的基本功能有:有用户界面,avi 格式视频文件的播放,暂停,停止,进度拖动等。最终,对本软件的开发过程进行简要总结,并介绍一下本人的体会和感想。通过本次课题设计可使更多的人们了解microsoft visual studio 6.0的

25、进展背景,把握基本的vc+6.0 软件开发平台的应用,生疏vc+6.0 编程环境,学习基本操作;同时还可以更广泛的推广计算机视觉库(即opencv)的应用,使人们对其有较深的生疏,深化了解 opencv 的进展历史,主要特点。1.4 论文组织结构本文主要包括了背景介绍,多媒体介绍,vc+6.0 软件开发平台和opencv 的应用,模块设计,系统设计,测试结果及分析等内容。第一章主要介绍了课题争辩的背景及本设计的主要内容;其次章主要是对视频技术进行了简洁介绍,包括多媒体技术及视频的格式等; 第三章是对opencv 函数库做了一些相关介绍包括特点及主要应用等;第四章是对 vc6.0 的开发环境做了

26、较具体的介绍包括 microsoft visual studio 6.0 的进展过程,组件工具(编译器工具、vc+库、vc+开发环境)等;第五章具体的介绍了视频播放器的设计与实现,包括模块划分与系统设计,流程图及具体的的程序编码等;第六章介绍了程序的运行结果,播放器功能的实现及对设计结果的分析,找出设计过程中存在的不足之处,以便加以改正。2视频技术概述对于视频,我们并不生疏,日常生活中经常看的电影、电视就是视频的典型应用。人类接收的信息中约有 70来自视觉,四周景物在人眼视网膜上的映像是人类最有效、最重要的信息沟通方式。视频具有精确、直观、具体生动、真实和高效的特点,这正是视频技术的无穷魅力所

27、在。简介动态图像传输在电信领域被称为视频业务或视讯业务,在计算机界经常称为多媒体通信、流媒体(下载像流水)通信等。视频通信技术是实现和完成视频业务的主要技术。其压缩标准是 mpeg( 动态图像专家小组 ),它提出了一种电视图像和声音编码的国际标准,用在数据传输率为 1.5mb/s 。 对于视频业务应用而言,主要是宽带网络技术。随着计算机软硬件技术的迅猛进展,视频技术也得到了飞速进展。现在,数字消遣、多媒体通信、高清楚度电视、数字电视、宽带网络等都是围绕如何有效地沟通视频信息而开放争辩的。但是,由于视频信息格外丰富且信息量大,故对视频信号的处理、传输、存储和显示等都提出了新的要求。因此,视频技术

28、的争辩和应用是目前信息技术领域最热门的话题之一。2.1 多媒体技术多媒体到底是什么?通常,每个人对此都有自己的观点。多媒体曾经被用来描述很多东西,从简单的新型交互式艺术到摇滚音乐会中闪耀的彩色聚光灯。但是多媒体是一种真正的媒体,不能局限于一个简洁的,有框架的定义。今日,这个词可能会更加模糊, 就象“数字化”这个词,在它的全盛时期也让入迷惑一样。“多媒体”一词译自英文“multimedia”,媒体(medium)原有两重含义,一是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等,中文常译作媒质;二是指传递信息的载体,如数字、文字、声音、图形等,中文译作媒介。从字面上看,多媒体就是由单媒体复合

29、而成的。多媒体技术从不同的角度有着不同的定义。有人定义多媒体计算机是一组硬件和软件设备;结合了各种视觉和听觉媒体,能够产生令人印象深刻的视听效果。在视觉媒体上,包括图形、动画、图像和文字等媒体,在听觉媒体上,则包括语言、立体声响和音乐等媒体。用户可以从多媒体计算机同时接触到各种各样的媒体来源。也有人定义多媒体是 “文字、图形、图像以及规律分析方法等与视频、音频以及为了学问创建和表达的交互式应用的结合体”。概括起来就是:多媒体技术是以数字技术为基础, 把通信技术(电话和传真),广播技术(电台和电视)和计算机技术融于一体,能够对文字,图形,图像,声音,视频等多种媒体信息进行存储,传送和处理的综合性

30、高新技术。简言之,多媒体技术就是具有集成性、实时性和交互性的计算机综合处理声文图信息的技术。在人类信息科学技术史上,它是继活字印刷,无线电 -电视技术,计算机技术之后的又一次新的技术革命,在信息社会中占有重要的地位。多媒体技术的制造,最终使人和机器从原来的对立中摆脱出来,人性化的局面、虚拟现实的消灭,直到人工智能的进步,语音的输入使我们刹时感到 pc 已不再冰冷,芯片上已能消灭人的情感,而且是高智能的集成。众所周知,早期的计算机仅处理数值或文字信息,其输入和输出信息只能以“文本” 的形式消灭。20 世纪 80 年月问世的图形用户界面,使计算机可用图形来参与人-机交互, 从今令用户界面面目一新。

31、从 20 世纪 90 年月以来,多媒体技术逐步成熟,先后公布了mpc 1.0,mpc2.0,mpc3.0 等多媒体个人计算机技术规范,推动了多媒体计算机的性能不断提高。但是,多媒体技术的应用并不限于多媒体计算机。在现代生活中,从 vcd 光盘的播放到电子出版物的制作,从多媒体万维网到电视会议的运行,处处都包含了多媒体技术的应用。多媒体技术和计算机网络技术,已成为当代计算机应用中最热门的两个主题。多媒体技术不仅集成了多媒体,而且集成可多种技术,包括计算机技术,通信技术,电视技术和其他音像处理技术。通过在一个文件中把来自多个通道的信息同一猎取,组织,存储和合成,使文字,图像,声音等各种信息能在播放

32、时同步的作用于我们的听觉, 视觉等感官,从而取得最佳的效果。在多媒体系统中,声音和活动着的视频图像都是与时间轴亲热相关的。随着多媒体技术的进步,多媒体系统已经具备对多媒体信息进行实时处理的力量。可视电话,电视会议,远程教学,远程医疗,使千里之外的人物与场景如同近在咫尺,可面对面地实现对话。交互性是多媒体技术的关键特性之一。传统电视中也包含了多媒体的信息,但它缺乏交互性,用户只能被动的收看。在多媒体系统中, 用户借助交互活动可把握信息的传播,甚至参与信息的组织过程,使之能够对感爱好的画面或内容进行记录或者特地的争辩。8我们知道,多媒体技术是建立在计算机技术的基础之上的,而计算机只能识别“0”,

33、“1”这两种二进制数据。因此在多媒体系统中,全部的多媒体信息都是用数字信号表示。与传统电视使用的模拟信号相比,数字信号不仅易于进行加密,压缩等数值运算,因而可提高信息的平安与处理速度;而且由于它只有“0”,“1”这两种状态,所以抗干扰力量强,在信号存储和复制中能够达到更高的保真度,尤其是用于远程距离的无失真传输。多媒体技术的无限进展需要计算机硬件的支持,早期的 pc 只能处理文本和数字, 借助键盘和显示器用文本媒体进行人-机交互。多媒体个人计算机( mpc)的诞生,使计算机能够集声音,文,图,像的处理于一身,同时把人 -机交互扩充到声音和图像等媒体。所谓多媒体个人电脑(multimedia p

34、ersonal computer, mpc)就是具有了多媒体处理功能的个人计算机,它的硬件结构与一般所用的个人机并无太大的差别,只不过是多了一些软硬件配置而已。一般用户假如要拥有 mpc 或许有两种途径:一是直接够买具有多媒体功能的 pc 机;二是在基本的 pc 机上增加多媒体套件而构成 mpc 。其实, 现在最近用户所购买的个人电脑绝大多都具有了多媒体应用功能。9一般的多媒体系统主要由四个部分的内容组成:多媒体硬件系统、多媒体操作系统、媒体处理系统工具和用户应用软件。(1) 多媒体硬件系统: 包括计算机硬件、声音/视频处理器、多种媒体输入/输出设备及信号转换装置、通信传输设备及接口装置等。其

35、中,最重要的是依据多媒体技术标准而研制生成的多媒体信息处理芯片、光盘驱动器等(2) 多媒体操作系统: 也称为多媒体核心系统(multimedia kernel system),具有实时任务调度、多媒体数据转换和同步把握对多媒体设备的驱动和把握,以及图形用户界面治理等。(3) 媒体处理系统工具:或称为多媒体系统开发工具软件,是多媒体系统重要组成部分。(4) 用户应用软件:依据多媒体系统终端用户要求而定制的应用软件或面对某一领域的用户应用软件系统,它是面对大规模用户的系统产品。一般来说,多媒体个人计算机(mpc)的基本硬件结构可以归纳为七部分:至少一个功能强大、速度快的中心处理器(cpu);可治理

36、、把握各种接口与设备的配置;具有肯定容量(尽可能大)的存储空间;高辨别率显示接口与设备;可处理音响的接口与设备;可处理图像的接口设备;可存放大量数据的配置等;这样供应的配置是最基本 mpc 的硬件基础,它们构成 mpc 的主机。除此以外,mpc 能扩充的配置还可能包括如下几个方面:光盘驱动器:包括可重写光盘驱动器(cd-r)、worm 光盘驱动器和 cd-rom 驱动器。其中cd-rom 驱动器为 mpc 带来了价格廉价的 650m 存储设备,存有图形、动画、图像、声音、文本、数字音频、程序等资源的 cd-rom 早已广泛使用,因此现在光驱对宽敞用户来说已经是必需配置的了。音频卡:又称声卡,声

37、卡用处理音频信息。它可以把话筒、唱机(包括激光唱机)、录音机、电子乐器等输入的声音信息进行模数转换、压缩处理,也可以把经过计算机处理的数字化的声音信号通过还原(解压缩)、数模转换后用扬声器放出或记录下来。声卡和多媒体计算机中所处理的数字化声音信息通常有多种不同的采样频率和量化精度 可以选择,以适应不同应用场合的质量要求。采样频率越高,量化位数越多,质量越高。图形加速卡:图文并茂的多媒体表现需要辨别率高,而且同屏显示颜色丰富的显示卡的支持,同时还要求具有 windows 的显示驱动程序,并在 windows 下的像素运算速度要快。所以现在带有图形用户接口 gui 加速器的局部总线显示适配器使得

38、windows 的显示速度大大加快。视频卡:可细分为视频捕获卡、视频处理卡、视频播放卡以及 tv 编码器等专用卡, 其功能是连接摄像机、vcr 影碟机、tv 等设备,以便猎取、处理和表现各种动画和数字化视频媒体。扫描卡:它是用来连接各种图形扫描仪的,是常用的静态照片、文字、工程图输入设备。打印机接口:用来连接各种打印机,包括一般打印机、激光打印机、彩色打印机等, 打印机现在已经是最常用的多媒体输出设备之一了。交互把握接口:它是用来连接触摸屏、鼠标、光笔等人机交互设备的,这些设备将大大便利用户对 mpc 的使用。网络接口:是实现多媒体通信的重要 mpc 扩充部件。计算机和通信技术相结合的时代已经

39、来临,这就需要特地的多媒体外部设备将数据量浩大的多媒体信息传送出去或接收进来,通过网络接口相接的设备包括视频电话机、传真机、lan 和 isdn 等。多媒体计算机的具体应用除了要具有肯定的硬件设备外,更重要的是软件系统的开发和应用。自从多媒体计算机问世以来,很多国家和部门都在软件的的开发和应用上下了很大功夫。microsoft 、ibm、和 apple 等公司相继推出了在基本功能上旗鼓相当的多媒体软件平台,而其特点又都是在已有的操作系统上追加实现多媒体功能的扩充模块而形成的,这就为用户供应了较为便利和有用的使用环境。在多媒体语言中,对存放在cd-rom 上的多媒体应用软件产品,称作多媒体cd-

40、rom 节目(multimedia cd-rom title)。在多媒体节目中包含了文本、图形、声音、动画和影视等视听媒体。这些多媒体节目大致上可分为下列几个方面的应用:训练、商业、电子出版、消遣、玩耍以及通信工程中的多媒体终端和多媒体通信系统。多媒体技术主要应用于多媒体个人计算机、多媒体信息治理系统、多媒体通信、多媒体电子出版物等,近期以来,运用多媒体手段来对学术科技期刊进行编辑加工、行政治理和发行宣扬,也成为一种显著的趋向。多媒体技术的应用将引发传统编辑手段的全面变革。传统编辑方法与手段同多媒体技术结合后,将给将来学术科技期刊的编辑工作带来全新的变化。多媒体技术与计算机、网络技术、通信技术

41、、数字技术的结合,使期刊出版工作过程和学术科研信息传播不受时间、地点、国界、环境等影响,这将有利于提高世界信息的流通速度,促进远隔重洋的各民族文化科技的准时沟通。多媒体综合了报纸、广播、电视等功能,将文字、声音、图像、动画等要素结合起来,这一结合也成为学术期刊编辑、发行的一种全新形式,给受众以全方位的、多维的信息,光纤通道将电视网、电话网、计算机网三网合一,使三大传统媒介开头走向高度的综合。充分利用多媒体文、图、声、像的优势,有利于全面提高学术期刊编辑工作效率和刊物质量,促进电脑多媒体编辑技术的有的放矢地进展,并为今后计算机技术的普及、富强打下良好基础。多媒体编辑要处理大量的 3d 图形、 数

42、字音频和视频信息, 还有从 web 网络传来的高带宽信息。加速图形端口(agp)马上大量投入应用,这是一种用来连接 cpu 和图形加速器、比 pci 更快的总线,agp 同时还供应图形适配器与系统内存之间的连接, 有了这种连接,在 3d 应用程序中就可以将大量的纹理贴图保存在系统内存中。近期出版的一些专业电子排版系统,已集文字处理与图形图像处理功能于一身。不仅大大降低了此前很多排版软件在文稿中植入特定图像时的繁琐操作和不便,而且可以利用软件供应的多种绘图、制图功能,使非美工专业人员也能便利地制作出具有专业水准的图形图像,并通过手写板或扫描仪顺当实现图文混排。使数学、化学、物理等科学公式的排版简

43、便规范,同时供应各种流程图、电子电路以及各类图库。ibm 公司分别推出中、英文语音识别系统的语音录入软件,它们以声音接收装置为媒介,将阅读文稿的语音直接转化成计算机上文本的版面,尽管目前此类软件在配置、环境、程序设计等方面有不少尚待完善之处,但随着新的优化软件的不断问世,它必将极大地提高文字输入的速度,从而最大限度地转变期刊计算机排版接受键盘输入的格 局。可以预见在不久的将来,我们真的可以与计算机进行交谈,正如一些科幻电影中描述的一样,计算机可以听懂我们话语,并按我们所说的去做。计算机关心教学系统在教学上的运用,标志着教学媒体质的飞跃。计算机的应用, 使教学手段更加丰富,将对教学效果的提高起到

44、促进作用。由于计算机是人脑的延长, 是人脑思维活动的模拟,是对人类思维活动的结构、功能及其规律的把握,因此,其在教学上的运用格外有利于同学的进展,符合现代化教学规律的要求。多媒体技术是信息领域的又一次革命,在教学上,它既能向同学快速供应丰富多彩的集图、文、声于一体的教学信息,又能为同学供应生动、友好、多样化的交互方式。多媒体教学可产生优良的视听效果。由于人的视觉、听觉是接收信息的主要渠道, 获得的信息也最大。多媒体教学有利于信息传递和同学对信息的接受、储存。其特有的优势对同学产生肯定强度的刺激,引起同学的留意。假如没有留意,感知就不会产生猛烈观看力。而观看力是在感知过程中并以感知为基础形成起来

45、的,离开了感知也就没有了观看。利用多媒体的优势引人入胜,可以不断提高同学留意的品质,使同学心理活动处于乐观状态。多媒体能克服时间和空间的限制。教学中常有一些宏观的自然现象、逝去的景色或者需长时间才能感知的事物,因受时间和空间的制约,无法让同学亲眼观察;一些微观的事物和微小的变化,无法通过仪器设备让同学进行观看,这些都是课堂教学难点。多媒体的运用,为同学供应了形象生动、内容丰富、直观具体、感染力强的感性生疏材料, 使同学看到了事物在运动、进展、变化。真情实感取代了凭空想象,难题无须多讲,“百闻不如一见”。同学通过听、视、评、悟充分感知原先较为抽象的教学内容,适应了同学从具体到抽象的生疏规律,从而

46、保证了教学活动的顺当进行。多媒体教学是提高课堂教学效果的先进教学手段。多媒体的恰当运用,使课堂教学活动更加符合同学的心理特点和生疏规律,促使同学始终在愉悦的氛围中乐观主动地猎取学问,学会学习,提高力量。同学当堂学习新学问,当堂消化吸取,无须课上损失课下补,减轻了同学的学习负担,提高了课堂教学效率。事实表明,很多好课使同学久久不忘,对同学产生深远的影响。随着计算机网络技术和计算机多媒体技术的进展,可视电话、视频会议系统将为人类供应更全面的信息服务。可视电话可使单身在外的游子通过电视传真,身临其境地参与新年的家庭聚会,也可以让分布在各地的工作人员讲座设计方案,沟通阅历。实际上, 多媒体系统现代商业

47、、通信、艺术等人类工作和生活的各个领域,正转变着人类的生活和工作的方式,描绘着一个绚丽多彩的划时代的多媒体世界。2.2 视频格式及视频流播放回放2.2.1 视频格式分类视频或许有以下几种:本地影像视频;网络影像视频;手机电影视频。其中每类视频又有各自的格式:1、本地影像视频avi 格式:它的英文全称为 audio video interleaved,即音频视频交叉格式。它于1992 年被 microsoft 公司推出,随 windows3.1 一起被人们所生疏和熟知。所谓“音频视频交叉”,就是可以将视频和音频交错在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体

48、积过于浩大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本 windows 媒体播放器播放不了接受早期编码编辑的avi 格式视频,而低版本 windows 媒体播放器又播放不了接受最新编码编辑的 avi 格式视频,所以我们在进行一些 avi 格式的视频播放时常会消灭由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调整播放进度和播放时只有声音没有图像等一些莫名其妙的问题,假如用户在进行 avi 格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。navi 格式:navi 是 newavi 的缩写,是一个名为shadowrealm 的地下组织进展起来的一种新视频格

49、式(与我们上面所说的 avi 格式没有太大联系)。它是由 microsoft asf 压缩算法的修改而来的,但是又与下面介绍的网络影像视频中的 asf 视频格式有所区分,它以牺牲原有 asf 视频文件视频“流”特性为代价而通过增加帧率来大幅提高asf 视频文件的清楚度。dv-avi 格式:dv 的英文全称是 digital video format,是由索尼、松下、jvc 等多家厂商联合提出的一种家用数字视频格式。目前格外流行的数码摄像机就是使用这种格式记录视频数据的。它可以通过电脑的ieee 1394 端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的

50、文件扩展名一般是.avi,所以也叫 dv-avi 格式。mpeg1:制定于 1992 年,它是针对 1.5mbps 以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准。也就是我们通常所见到的 vcd 制作格式。使用 mpeg-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2gb 左右大小。这种视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg 及 vcd 光盘中的.dat 文件等。mpeg2:制定于 1994 年,设计目标为高级工业标准的图像质量以及更高的传输率。这种格式主要应用在 dvd/svcd 的制作(压缩)方面,同时在一些 hdtv(高清楚电视

51、广播)和一些高要求视频编辑、处理上面也有相当的应用。使用mpeg-2 的压缩算法, 可以把一部 120 分钟长的电影压缩到 4 到 8gb 的大小。这种视频格式的文件扩展名包括.mpg、.mpe、.mpeg、.m2v 及 dvd 光盘上的.vob 文件等。mpeg 格式:它的英文全称为 moving picture expert group,即运动图像专家组格式,家里常看的 vcd、svcd、dvd 就是这种格式。mpeg 文件格式是运动图像压缩算法的国际标准,它接受了有损压缩方法削减运动图像中的冗余信息,说的更加明白一点就是 mpeg 的压缩方法依据是相邻两幅画面绝大多数是相同的,把后续图像

52、中和前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达到 200:1)。目前 mpeg 格式有三个压缩标准,分别是 mpeg1、mpeg2、和 mpeg4,另外,mpeg-7 与 mpeg-21 仍处在研发阶段。mpeg4:制定于 1998 年,mpeg4 是为了播放流式媒体的高质量视频而特地设计的,它可利用很窄的带度,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量。目前 mpeg-4 最有吸引力的地方在于它能够保存接近于 dvd 画质的小体积视频文件。另外,这种文件格式还包含了以前 mpeg 压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权爱护等

53、一些特别功能。这种视频格式的文件扩展名包括.asf、.mov 和 divx avi 等。divx 格式:这是由 mpeg4 衍生出的另一种视频编码(压缩)标准,也即我们通常所说的 dvdrip 格式,它接受了 mpeg4 的压缩算法同时又综合了 mpeg-4 与 mp3 各方面的技术,说白了就是使用divx 压缩技术对 dvd 盘片的视频图像进行高质量压缩,同时用 mp3 或 ac3 对音频进行压缩,然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。其画质直逼 dvd 并且体积只有 dvd 的数分之一。这种编码对机器的要求也不高,所以 divx 视频编码技术可以说是一种对 dvd

54、 造成威逼最大的新生视频压缩格式,号称 dvd 杀手或 dvd 终结者。mov 格式:美国 apple 公司开发的一种视频格式,默认的播放器是苹果的quicktimeplayer。具有较高的压缩比率和较完善的视频清楚度等特点,但是其最大的特点还是跨平台性,即不仅能支持 macos,同样也能支持 windows 系列。2、网络影像视频asf 格式:它的英文全称为 advanced streaming format,它是微软为了和现在的real player 竞争而推出的一种视频格式,用户可以直接使用 windows 自带的 windows media player 对其进行播放。由于它使用了 m

55、peg-4 的压缩算法,所以压缩率和图像的质量都很不错(高压缩率有利于视频流的传输,但图像质量确定会的损失,所以有时候asf 格式的画面质量不如 vcd 是正常的)。wmv 格式:它的英文全称为windows media video,也是微软推出的一种接受独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。wmv 格式的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。rm 格式:real networks 公司所制定的音频视频压缩规范称为 real media,用户可以使用realplaye

56、r 或 realone player 对符合 realmedia 技术规范的网络音频/视频资源进行实况转播并且 realmedia 可以依据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是用户使用realplayer 或realone player 播放器可以在不下载音频/视频内容的条件下实现在线播放。另外,rm 作为目前主流网络视频格式,它还可以通过其real server 服务器将其它格式的视频转换成 rm 视频并由 real server 服务器负责对外公布和播放。rm 和 asf 格式可以说各有千秋,通常 rm 视频更严

57、峻一些,而 asf 视频则相对清楚一些。rmvb 格式:这是一种由 rm 视频格式升级延长出的新视频格式,它的先进之处在于 rmvb 视频格式打破了原先 rm 格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源,就是说静止和动作场面少的画面场景接受较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在消灭快速运动的画面场景时被利用。这样在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。另外,相对于dvdrip 格式,rmvb 视频也是有着较明显的优势,一部大小为 700mb 左右的 dvd 影片,假如将其转录成同样视听品质的 rmvb 格式,其个头最多也就 400mb 左右。不仅如此,这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。要想播放这种视频格式,可以使用 realone player2.0 或 realplayer8.0 加 realvideo9.0 以上版本的解码器形式进行播放。quicktime(mov)是 apple(苹果)公司创立的一种视频格式,在很长的一段时间里,它都是只在苹果公司的 mac

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论