高保真实时准动态图像采集压缩和远程传输平台的研究与实现_第1页
高保真实时准动态图像采集压缩和远程传输平台的研究与实现_第2页
高保真实时准动态图像采集压缩和远程传输平台的研究与实现_第3页
高保真实时准动态图像采集压缩和远程传输平台的研究与实现_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    高保真实时准动态图像采集压缩和远程传输平台的研究与实现    高保真实时准动态图像采集压缩和远程传输平台的研究与实现    类别:通信网络      摘要:基于大量的实际研究工作,论述了高保真实时准动态图像采集压缩和远程传输平台的设计思想、总体结构、关键技术和优化策略。着重对视频采集技术、压缩技术、图像实时传输技术、同步技术和自适应技术作了具体阐述。在相关技术领域有重要的学术价值和实际意义。 在interne

2、t飞速发展和广泛普及的今天,信息传输从两方面加强力度:一是多媒体化;二是实时化。在此基础上,高保真准动态图像采集、压缩和远程传输技术成为许多先进国家计算机领域的重要研究课题。在军事上,战场信息已经不只是文字类型,而需要为决策者提供高质量的动态实时图像信息,以便及时准确地了解战场真实情况;另外,对国外新式战斗机、导弹等先进武器和装备,也不只是从文字上了解散其功能、从静态图片上了解其形状,而是要解其在实战中的具体功能、实际威力以及真实效果,使决策者和科技人员获得动态和感性的认识,有身临其境之感。在工业上,需要对一些多变的、有毒的、人类不宜久留的场合进行监测。在医疗上,则需要一些高级专家对异地的病人

3、进行诊断和治疗这些都是基于高保真实时准动态图像采集压缩和远程传输技术的综合实现。本文结合课题组长期的研究阐述其主要技术及其优化策略。1 系统设计思想本系统的设计目标是基于internet实现远程部点之间的高保真准动态图像的实时传输。整个系统贯彻如下设计思想:发送站点和接收站点都具对图像质量的控制功能,以适应internet传输率不稳定的情况;对图像采用多种类型的压缩技术,以适应不同的图像分辨率和环境要求;在internet信道传输率较差时,能够启动自适应功能。2 系统总体结构在物理上,本系统分为发送站点和接收站点两部分。在逻辑上,本系统分为图像采集、压缩和传输子系统、性能控制子系统。整个系统包

4、含如下六个独立的功能模块,如图1所示。(1)图像采集、压缩和传输子系统·图像采集模块,发送站点从摄像机读原始视频流,按一定的格式存储为视频数据。·图像压缩模块,发送站点将视频数据压缩,为网络传输作准备。·视频传输模块,利用rtp和udp协议将压缩后的视频数据发送到远程站点。·视频解压缩模块,接收站点将接收到的压缩数据用解压缩算法还原成视频数据。(2)性能控制子系统·客户/服务器同步模块,使发送站点和远程接收站点在视频格式和设置方面保持一致。·自适应模块,在信道传输率较差时,能自动启动自适应功能,使系统的视频传输适应复杂的网络情况。3

5、系统设计中的关键技术和优化策略3.1 视频采集技术分析和选择为了实时视频采集,需要安装相应的视频采集设备。即视频采集卡和摄像头等。并需要安装相应的驱动软件来支持这些设备的运行。windows2000操作系统提供了vfw(video for windows sdk)。vfw包含了大量与视频采集有关的编程接口。这些编程接口通过操作系统提供的vfw-to-wdm voide capture mapper调用设备驱动程序中的相关例程,为系统的图像采集提供了底层接口编程基础。本系统用到最主要的编程调用有如下几个:capcreatecapturewindow,创建一个视频采集窗口;capcrivercon

6、nect,连接视频采集设备驱动程序;capsetvideoformat,设定视频格式;capdlgvideoformat,设置对话框。vfw提供了两种视频采集模式:preview(简称p模式)和overlay(简称o模式)。笔者在系统设计中通过实验和测试比较了这两种模式。·p模式占用较多的系统资源。在这种模式中,硬件将采集的视频帧传送到系统内存中,然后在视频采集窗口用windows gdi函数进行显示;而o模式下,视频采集子系统直接通过硬件方法显示视频,相对来说节省内存,且速度较快。·o模式稳定性较好,但也要求电源性能较好。在直流电源性能较好情况下,采用overlay模式进

7、行视频采集。实际运行过程表明,上述分析是正确的。本系统设计中采用了overlay模式。这一选择对稳定性起到了较好的优化作用。3.2 视频压缩、解压缩技术的优先和优化针对视频应用中可能遇到的各种情况,本系统的压缩、解压缩模块设计采用三种压缩方案,使用时可以从中选择一种,以适应不同环境和不同需求。一是国际通用的高压缩进比方案h.263,该方案压缩比高,但图像质量较差,适用于网络传输性能较差的情况,该方案大体符合现场图像的处理要求。二是图像压缩质量最好、算法最先进的mpeg-4方案,该方案图像质量好,便压缩比较低,适用于网络传输性能良好的情况。三是在h.263的基础上作为较大幅度修改和优化的th.2

8、63方案,该方案在压缩比与h.263相近的情况下,图像质量有明显改善。th.263方案是在对h.263深入分析基础上实施的。通过分析h.263的整个系统程序,得以其设计思想如下:首先将采集到的原始图像划分成8×8的宏块,然后判断此帧是不是关键帧。如果是关键帧,则对每个宏块作dct(discrete cosine transform)变换,对变换后的视频数据采集视觉能够接受的量化比量化,量化后许多高频分量将变成零,为了最大限度提高压缩编码效果,采用z形扫描技术将其重新组合,然后对组合串做行程编码,最后对得到的结果进行哈夫曼编码;如果是非关键帧,则对每个宏块先进行运行矢量的计算,然后与上

9、一帧图像作差,再象关键帧那样经过dct变换、量化和行程编码、哈夫曼编码得到压缩的图像。图像解压缩与压缩过程正好相反,即先将压缩的函数数据作行程解码和哈夫曼解码,然后进行反量化,并据此进行idct变换。如果此帧是关键帖,则直接将这个宏块重组即得出还原后的图像;否则,根据运行矢量将各宏块的数据与上一帧进行组合才得出不定期原后的图像。由于解压缩不需要分析图像和网络的情况,也不需要考虑压缩比和压缩质量,只是简单地将图像还原,所以程序比较简单。通过分析和测试表明,格式转换、对关键帧和非关键帧离散余弦变换dct、对非关键帧的帧间压缩是最重要最耗时的环节。为此,在设计中对这些环节进行了优化。具体讲,在格式转

10、换、dct变换中,一是在采集到的rgb色彩空间图像到压缩算法视频输入格式cif变换中,用整型算法和移位相结合的优化转换函数代替速度较慢的浮点运算;二是在关键帧和非关键帧的dct变换中,采用零系数预测策略对dct变换的输入数据分类,节省了大量无效运算;三是采用多媒体处理指令集mmx实现dct变换,大幅度提高了运算速度。此外,为了实现良好的帧间压缩,比较了两种不同的压缩方式。第一种方式是以象素为基础,首先将其与上一帧作差,得到一个稀疏矩阵。在作差的过程中,采用小范围匹配的方法去掉一部分噪声,然后采用优化的行程编码得到最后结果,并把当前帧保存在指定的内存区,作为下一帧作差的参考帧。第二种方式是以宏块

11、为基础的运行补偿方式,首先计算运动矢量,然后采用行程编码和哈夫曼编码。用运动补偿技术既可以达到较高的压缩比又有相当好的图像质量。对于第一种以象素为基础的编码方式,在保证较高的帧频和压缩比的情况下,图像质量好。而对于第二种以宏块为基础的运动补偿编码方式,图像质量稍差,但压缩比较高,适用于数据传输率较低的情况。为吸收二者的长处,笔者在对h.263源程序分析的基础上进行了优化,采用混合压缩编码方案。此方案将上述两种方式结合起来,从而使系统有效地适用于internet传输。因为远程站点之间通过internet进行传输时,信道的数据传输率不是固定的。所以,系统中通过信道测试反馈信息改变量化时的步长,从而

12、调节视频信息的数码率,以便更好地适应信道传输率的变化。优化方案的思想是:通过传输模块反馈回来的信息,得知当前网络的传输速率,以此来调整压缩算法的各个参数,即压缩质量、每秒帧数等,获得当前最好的帧率和质量。具体从两方面实施:一是对帧内压缩方法进行优化;二是对帧间压缩方法进行优化。对帧内压缩方法的优化主要通过改变压缩质量的参数来调节图像质量和压缩比。对帧间压缩方法的改进是通过改变频率、关键帧间的距离调节传输速率。改变每秒采集和传输图像的数目,以改变传输数据的大小。帧间压缩要用到运动补偿,其关键在于两帧之间的差别大小。如果图像只有微小的变化,那么经过作差后压缩效果较好;如果图像变化很大,那么经过作差

13、后压缩效果较差。为充分利用运行压缩的特点,根据图像变化的大小来调节关键帧间的距离。在图像变化不大的情况下,非关键帧数据较少,此时拉长关键帧间的距离既可以低传输率,又不影响图像的质量;在图像变化较大的情况下,非关键帧数据较多,此时缩短关键帧间的距离,以增加运动补偿的效果。3.3 用udp和rtp实现图像传输并进行实时优化视频图像的实时传输有如下特征:·数据量大,尤其是高保真活动图像的数据量更大,从而带宽要求高;·实时性要求高。上述特点使视频图像传输对传输环境提出很高的要求。但另一方面,图像数据包在少量丢失情况下不影响还原质量。为此,采用建立在udp基础上的实时传输协议rtp。

14、用udp协议进行数据传输的优点是不需要建立连接,传输速度快。缺点是容易丢失数据包,而且数据包的顺序容易混乱。rtp是基于udp的网络传输协议,编程时通过时间标签(time-temping)机制、信息序列编号(sequence本设计中,对实时可靠性进行了优化,具体程序设计中,采用了如下策略:·建立一条以udp作为传输协议的数据通路,在传输时把压缩过的视频流打包,打包时考虑到两个因素:第一,某些压缩的关键帧会很大;第二,关键帧与非关键帧数据量相差很远。这两个因素可能导致数据包乱序,为此,不能简单地将视频帧作为打包单位,而是将数据流划分成等量的小包,并在包头标上序号进行顺序传输。·

15、;另建一条以tcp为传输协议的控制通路,其作用是反馈一些控制命令给发送方,从而最小限度地防止传输中的错误。接收方建立个可容纳0.30.8s图像的缓冲区,按照数据包头的编号将数据流进行重构。如果数据包编号出现不连接,则说明发生了丢包或乱序。于是,接收方立即通过控制通路发送命令要求重发所丢失是数据包。采用tcp可保证控制命令传输的准确性。3.4 视频传输中的自适应技术由于网络带宽有限且随机变化,因此视频传输的实时性会受到严重影响,甚至会使接收到的视频出现不连续或停顿现象。为此,在系统设计中,引入了视频传输的自适应机制。具体实现的,系统一边传输一边检测网络状态,并据此调整发送策略以适应网络变化。图2

16、表示了在远程控制系统中加入自适应机制后的结构。自适应机制由检测模块、反馈模块和决策模块组成。发送端将视频图像压缩后,打成rtp数据包,然后用rtp协议发送。发送站点的自适应检测模块检测并记录有关的发送信息,包括传输率、字节数等。接收站点通过自适应反馈模块检测有关的信息,并将其发送到接收站点的检测模块。后者将发送和接收时的信息相比较,再将比较结果传送到自适应决策模块。为了尽可能节省信息量,接收端自适应反馈模块向发送端检测模块只发送一个信息包序列号。这样后者可计算出信息包的传输时间,并在多次检测基础上得到带宽平均评估值。发送端再根据评估值改变视频采集频率和压缩比,调整视频数据量,从而实现自适应功能

17、。3.5 发送和接收的同步技术本系统采用client/server结构。在这种结构中,只有client端才能连接请求建立连接,而且一个client端可与多个server建立连接。因此,将接收站点作为client,发送站点作为server。当接收站点需要得到远端的视频图像时,便发出连接请求。这种方式适用于系统视频采集站点处于恶劣环境中无人看管的情况。server端采集视频数据并进行压缩后,发送给client,client将数据解压缩后显示视频图像。系统设计中,为了适应不同的网络环境和图像要求,对视频质量配置了双向调节功能。即一方面,视频采集站点可直接调节图像质量,另一方面接收站点也可以调节采集站点的图像采集和压缩参数,从而是调节图像质量。对图像质量的双向调节功能基于如下设计:·将client端控制面板中的参数(采样间隔、关键帧数、关键帧质量、非关键帧质量)传递给s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论