李娜多媒体网络通信技术

上传人：y*** IP属地：天津上传时间：2022-01-16 格式：DOCX 页数：30 大小：286.98KB 积分：25 举报 版权申诉

免费预览已结束，剩余25页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、多媒体网络通信技术大作业1、题目：基于局域网的可视对讲系统设计 2、系统开发环境与工具:（1）、硬件环境：实验室局域网（2）、软件环境：WindowsXP操作系统（3）、开发工具：自己熟悉的面向对象的网络通信编程工具与平台，相关音频、视频编码与传输协议类库3、要求与评分标准:（1）要求：在以上硬软件环境下，利用合适的开发工具，设计一套可视对讲软件，实现局域网内两台计算机之间的可视对讲功能，要求音视频信号连续性、实时性较好，满足正常交流需要。（2）评分标准系统原理分析（20分）1.系统原理概述（10分）2.关键技术分析（10分）系统总体方案设计（30分）1.按模块化设计要求画系统结构图（15分

2、）2数据流分析（15分）系统具体设计（30分）呼叫处理模块流程图与关键代码（6分）音视频采集与播放模块流程图与关键代码（6分）音视频处理（编解码）模块流程图与关键代码（6分）音视频封包与解析模块流程图与关键代码（6分）音视频发送与接收模块流程图与关键代码（6分）系统测试与评价（20）实现语音通信（6分）实现视频通信（6分）实现音视频同步（8分）1 系统原理分析1.1 系统原理概述视频聊天系统应该具备提供便捷、灵活、全面的音频、视频信息的传递和服务的功能，并且实时传输给聊天软件在线的人。本次方案采用 Microsoft Visual C+ 6.0 编程开发视频聊天系统的一套比较常用的解决方案

3、。语音视频聊天采用UDP模式，在客户端之间点对点的进行，因为 UDP传输速度快,TCP是面向连接的，建立连接时双方需经过三次握手，数据传输可靠，FTP、TELNET等就是基于TCP的，UDP是面向非连接的，发出信息不需对方确认，但这样速度比TCP快,但有可能丢失数据，象SMTP、TFTP等就是基于UDP的。在该方案中，通过函数库 VFWVideo for Windows )来实现视频捕获、影像压缩以及影像播放。微软公司提供的专门用于视频捕获开发的工具包 VFW,为在Windows操作系统中实现视频捕获提供了标准的接口，从而大大降低了程序的开发难度。在视频传输方面，则通过组建视频帧，将位图形

4、式的视频帧压缩成帧格式的 MP EG4流，传输到客户端后，解压并显示影像。同时采用线程来实现语音录制和语音回放,最终实现了通过服务器中转的文字聊天、点对点的语音视频聊天。1.2 关键技术分析可视对讲的关键技术之一是音视频同步问题。解决同步问题的方法有很多种，其中时间戳是最成熟最完美也是最复杂的解决办法，可以解决任何多媒体领域的音视频同步问题。其原理是选择一个参考时间，在生成数据流时依据参考时间上的时间给每个数据块都打上时间戳；在播放时，读取数据块上的时间戳，同时参考当前时钟上的时间来安排播放，让快于这个参考时间的包等待，丢弃慢于这个参考时间的包。在基于时间戳的同步机制中，仅仅对不同

5、步的数据进行处理是不完备的，还需要反馈机制，如基于Windows 平台的 DirectShow 就提供这样一个反馈机制，它的质量控制 (Quality Control) 可以将播放的状态反馈给源，让源端加快或者放慢数据流的速度。多媒体文件的采集，播放及对同步的要求都非常严格，如果从多媒体文件中分离出音视频数据的数据不同步，音视频的时间差则会越来越大，这是无法忍受的，所以在多媒体文件中，不但要求有同步机制，还要求有反馈机制。可视对讲的关键技术之二是数据压缩技术。多媒体信息数字化后的数据量非常大，尤其是视频信号，数据量更大，需要占用更大的信道带宽，成本十分昂贵。为了节省存储空间充分利用有限

6、的信道容量传输更多视频信息，必须对视频信息进行压缩。目前，在视频图像信息的压缩方面已经取得了很大的进展。有关图像压缩编码的国际标准主要有JPEG H.261、H.263、MPEG-1、MPEG-2、MPEG-4等。有关音频信号的压缩编码技术基本上与图像压缩技术相同，不同之处在于图像信号是二维信号，而音频信号是一维信号，相比较而言音频信号数据压缩难度较低。可视对讲的关键技术之三是视频采集。对于视频的采集，主要采用微软公司的关于数字视频的一个软件包 VFW (Video for Windows )。VFW是Microsoft 1992年推出的关于数字视频的一个软件包，它能使应用程序通过数字

7、化设备并播放从传统的模拟视频源得到数字化的视频剪辑。为了解决数字视频数据量大的问题，需要对数据进行压缩，它引进了一种叫 AVI 的文件标准，该标准未规定如何对视频进行捕获、压缩及播放，仅规定视频和音频该如何存储在硬盘上，以及在 AVI 文件中交替存储视频帧和与之相匹配的音频数据。VFW给程序员提供VBX和AVICap窗口类的高级编程工具，使程序员能通过发送消息或设置属性来捕获、播放和编辑视频剪辑。用户不必专门安装VFW，在安装Windows 时，安装程序会自动地安装配置视频所需的组件，如设备驱动程序、视频压缩程序等。2 系统总体方案设计2.1 系统模块分析2.1.1 视频捕获VFW软

8、件包主要由以下六个模块组成:AVICAP.DLL:包含执行视频捕获的函数，它给 AVI文件、I/O和视频、音频设备驱动程序提供一个高级接口；MSVIDEO.DLL:包含一套特殊的DrawDib函数，用来处理屏幕上的视频操作;MCIAVI.DRV:包括对VFW的MCI命令解释器的驱动程序;AVIFILE.DLL :包含由标准多媒体I/O（mmio）函数提供的更高的命令，用来访问AVI 文件 ;压缩管理器（ICM）:用于管理的视频压缩/解压缩的编译码器（Codec）；6)音频压缩管理器（ACM）:提供与ICM相似的服务，适用于波形音频。AVICap支持实时的视频流捕获和单帧捕获，并提供对视频源的控

9、制。虽然MCI也提供数字视频服务，比如，它为显示 AVI 文件的视频提供了 AVIVideo 命令集，为视频叠加提供了 overlay 命令集，但这些命令主要是基于文件的操作，不能满足实时地直接从视频缓存中获取数据的要求。对于使用没有视频叠加能力的捕获卡的PC机来说，用MCI提供的命令集是无法捕获视频流的。而 AVICap 在捕获视频方面具有一定的优势，它能直接访问视频缓冲区，不需要生成中间文件，实时性很强，效率很高。同时，它也可将数字视频捕获到文件。在视频捕获之前需要创建一个捕获窗，所有的捕获操作及其设置都以它为基础。用AVICaP窗口类创建的窗口（通过 capCreateCaptur

10、eWindow函数创建）被称为“捕获窗”，其窗口风格一般为 WS_CHILD口 WS_VISIBLE实际上，捕获窗类似于标准控制（如按钮、列表框等）。捕获窗具有下列功能:（ 1）将视频流和音频流捕获到一个 AVI 文件中;2）动态地同视频和音频输入器件连接或断开;（3）以 Overlay 或 Preview 模式对输入的视频流进行实时显示;（ 4）在捕获时可指定所用的文件名并能将捕获文件的内容拷贝到另一个文件;（ 5）设置捕获速率;（ 6）显示控制视频源、视频格式、视频压缩的对话框;（ 7）创建、保存或载入调色板;（ 8）将图像和相关的调色板拷贝到剪贴板;（9）将捕获的一个单帧图像保存为 D

11、IB格式的文件。视频捕获编程涉及视频捕获的结构、宏、消息和函数。发送AVICa P窗口消息所能完成的功能都能调用相应的宏来完成。如，SendMessage与capDriverConnect的作用相同,都是将创建的捕获窗同视频输入器件连接起来。灵活编写AVICap提供的回调函数可满足一些特殊需求。将宏 capCaptureSequenceNoFile 和用 cap S etCallbackOnVideoStream登记的回调函数一起使用，可使应用程序直接使用视频和音频数据。在视频聊天的应用程序中可利用这一点来获得视频帧，回调函数将捕获的图像传到远端的计算机。应用程序可用捕获窗来登记回调函数（

12、由用户编写，而由系统调用），以便在发生下列情况时，它能通知应用程序，作出相应的反应 , 捕获窗状态改变，出错；视频帧和音频缓存可以使用；在捕获过程中，其它应用程序处于让步（ Yield ）地位。2.1.2 视频压缩解压缩视频压缩（视频编码）是把数字视频流用更少的数据位进行存放的方法。未经压缩的视频数据量非常大，所以压缩对于数字视频的存储和传输来说都是必须的。图像压缩包括一对互补系统，一个编码器（encoder）和一个解码器（decoder）。编码器利用图像数据之间的相关性。在保证图像质晕的情况下使用较少的数据以传播或存储该图像；而解码器则把压缩后的图像还原出原始的视频数据。

13、视频压缩解压缩采用MPEG-4标准。MPEG-4是为在国际互联网络上或移动通信设备（例如移动电话）上实时传输音/视频讯号而制定的最新MPEG标准，MPEG4采用ObjectBased方式解压缩，压缩比指标远远优于以上几种，压缩倍数为450倍（静态图像可达 800倍），分辨率输入可从 320 ）240到1280 X024，这是同质量的 MPEG1和MJEPG的十倍多。MPEG-4使用图层（layer）方式，能够智能化选择影像的不同之处，是可根据图像内容,将其中的对象（人物、物体、背景）分离出来分别进行压缩，使图文件容量大幅缩减，而加速音 /视频的传输，这不仅仅大大提高了压缩比，也使图像探测的功

14、能和准确性更充分的体现出来。在网络传输中可以设定MPEG-4的码流速率，清晰度也可在一定的范围内作相应的变化，这样便于用户根据自己对录像时间、传输路数和清晰度的不同要求进行不同的设置，大大提高了系统使用时的适应性和灵活性。也可采用动态帧测技术，动态时快录，静态时慢录，从而减少平均数据量，节省存储空间。而且当在传输有误码或丢包现象时，MP EG-4受到的影响很小，并且能迅速恢复。）、 InitInstance （）、 OnIdle （）、 PreTranslateMessage （）等函数。最后调用性。最显著的差别在于它采用基于对象的编码理念；即在编码时将一幅景物分成若干个在时间和空间上

15、相互联系的视频音频对象，分别编码后经过复用传输到接收端，在接收端再对不同对象分别解码。最后合成所需的视频和音频。这样便于对不同对象进行不同的编码和操作，也有利于不同数据类型间的融合。MPEG-4 的应用前景将是非常广阔的。它的出现将对以下各方面产生较大的推动作用：数字电视、动态图像、万维网（WWW）、实时多媒体监控、低比特率下的移动多媒体通信、于内容存储和检索多媒系统、 Internet/Intranet 上的视频流与可视游戏、基于面部表情模拟的虚拟会议、 DVD 上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等。2.1.3 语音的录制、回放我们主要利用线程

16、来处理语音部分的录制、回放。线程是一个独立的执行流，是进程内部的一个独立的执行单元，相当于一个子程序，它对应于 Visual C+ 中的 CWinThread 类对象。单独一个执行程序运行时，缺省地包含了一个主线程，主线程以函数地址的形式出现，提供程序的启动点，当主线程终止时，进程也随之终止。根据实际需要，应用程序可以分解成许多独立执行的线程，每个线程并行的运行在同一进程中。一个进程中的所有线程都在该进程的虚拟地址空间中，使用该进程的全局变量和系统资源。操作系统给每个线程分配不同的CPU时间片，在某一个时刻，CPU只执行一个时间片内的线程，多个时间片中的相应线程在CPU内轮流执行,由于

17、每个时间片时间很短，所以对用户来说，仿佛各个线程在计算机中是并行处理的。操作系统是根据线程的优先级来安排 CPU的时间，优先级高的线程优先运行，优先级低的线程则继续等待。Windows 提供了两种线程：用户界面线程和工作线程（又称为后台线程）。这里主要介绍用户界面线程的运用。用户界面线程通常用来处理用户的输入并响应各种事件和消息，其实，应用程序的主执行线程 CWinApp 对象就是一个用户界面线程，当应用程序启动时自动创建和启动，同样它的终止也意味着该程序的结束，进程终止。1）线程的启动创建一个用户界面线程，首先要从类 CwinThread 产生一个派生类，同时必须使DECLAREDYN

18、CREATB IMPLEMENT_DYNCREATE来声明和实现这个CwinThread 派生类。第二步是根据需要重载该派生类的一些成员函数如： ExitInstanceAfxBeginThread() 函数的一个版本： CWinThread* AfxBeginThread (CRuntimeClass* pThreadClass,int nPriority = THREAD_PRIORITY_NORMAL, UINT nStackSize = 0,DWORD dwCreateFlags = 0, LPSECURITY_ATTRIBUTES lpSecurityAttrs = NULL) 启动

19、该用户界面线程，其中第一个参数为指向定义的用户界面线程类指针变量，第二个参数为线程的优先级，第三个参数为线程所对应的堆栈大小，第四个参数为线程创建时的附加标志，缺省为正常状态，如为 CREATE_SUS PENDEM线程启动后为挂起状态。2）线程的优先级 CwinThread 类的成员函数用于线程优先级的操作： intGetThreadPriority ()； BOOL SetThradPriority () (int nPriority) 。3）线程的挂起和恢复CWinThread 类中包含了应用程序挂起和恢复它所创建的线程的函数，其中 SuspendThread （）用来挂起线程，暂

20、停线程的执行； ResumeThread）用来恢复线程的执行。如果你对一个线程连续若干次执行 SuspendThread （），则需要连续执行相应次的 ResumeThread （）来恢复线程的运行。4）结束线程终止线程有三种途径，线程可以在自身内部调用 AfxEndThread（）来终止自身的运行；可以在线程的外部调用 BOOL TerminateThread（HANDLE hThread,DWORD dwExitCode）来强行终止一个线程的运行，然后调用 CloseHandle （）函数释放线程所占用的堆栈；第三种方法是改变全局变量，使线程的执行函数返回，则该线程终止。2.1.4

21、视频传输语音视频聊天采用用户数据报协议（User Datagram Protocol ）传输协议。UDP是无连接的网络协议，无连接服务是邮政系统服务的抽象，每个分组都携带有完整的目的地址，各分组在系统中独立传送。无连接服务不能保证分组的先后顺序，不进行分组出错TCP协议是的恢复与重传，不保证传输的可靠性。 UDP协议提供无连接的数据报服务。而 TCP/IP协议已经很难适应视音频通信，特别是连续的媒体流（如视频流）通信的要求。面向连接的协议，被用于各种网络上提供有序可靠数据传输的虚电路服务。它的重传机制和拥塞控制机制（ Congestion Control Mechanism ）都是不适

22、合用于实时视音频传输的。因为IP协议只提供无连接、无 QOS保证的服务，并且只是尽最大努力地传送数据报。当网络带宽不足而造成较长的时延和较多的丢包时，IP协议并不提供QOS反馈2。因此,需要利用 IP 层之上的协议来满足网络视频实时传输的时延和丢包率的要求。UDP协议是面向非连接的网络数据协议，在正式通信前不必与对方先建立连接，直接向接收方发送数据，是一种不可靠的通信协议。正是由于UDP协议不关心网络数据传输的一系列状态，使得UDP协议在数据传输过程中节省了大量的网络状态确认和数据确认的系统资源消耗，大大提高了 UDP协议的传输速度，且UDP无需连接管理，可以支持海量并发连接。但是，视频传输

23、的特点要求传输协议能够处理传输中的延迟和抖动现象，能够处理突发的视频传送，并且能够根据接收端的接收质量判断网络状况，做出相应的反馈3 。 UDP协议本身并不能很好地处理这些情况。由于 UDP 协议不能可靠传输视频图像，为此在应用层添加如下机制实现视频图像的可靠传输。在发送端和接收端各开一个视频缓冲区，暂存待发送和已接收的数据帧。通过流量控制，可以避免因网络拥塞导致包丢失率增加。通过确认技术，可以实现图像可靠传输。而超时处理可以避免发送端和接收端长时间等待，根据网络当前状况作出相应2.2的反馈。软硬件环境两台以上电脑，分别配有摄像头、麦克风、音箱或耳机等外部设备；Win dows XP

24、系统，2.3Microsoft Visual Studio 6.0 编程开发系统等。技术要求语音视频聊天作为一种广泛的网络应用对其基础的承载网络环境有着较高的网络要求。其中应重点考虑的是网络的带宽情况、端到端的时延、丢包率、时延抖动等问题。1）网络带宽需求，视频聊天对网络的带宽需求为“视频带宽+IP 包头开销”，计算方法为：网络带宽=视频带宽X 1.2。2）端到端的时延，网络传输不可避免的会发生传输时延，通常建议视频聊天的通用时延小于 150ms 。3）丢包率，网络数据传输经常会出现丢包现象，视频传输过程中数据丢包严重的话会影响在线视频聊天质量。因此，在设计上应将网络上的丢包率控制在 1%

25、以内。4）时延抖动，由于音频 / 视频的传输为实时的交互，因此网络的时延抖动更为重要，一般，视频聊天的时延抖动控制在 50ms 内。2.4系统结构图241硬件结构系统该系统采用的是Client/Client结构，客户端是两台PC机和一个数字摄像头、耳机和麦克风。进行语音视频聊天是客户端与客户端之间直接进行的点对点的连接，它们之间的网络拓扑结构如图1。在图中，为了简便，没有画出麦克风、音箱或耳机等外部设备。客八机语昔视频W犬霁户机图1网络拓扑结构图2.4.2系统功能模块图语音视频聊天是对整个在线客户端两两之间进行点对点的视频聊天。语音视频聊天包括了视频捕获、视频压缩、解压缩、语音录制、语音回

26、放以及视频传输等。整个系统的功能模块图如图2所示。图2系统功能模块图243系统各模块流程图语音视频聊天流程图如下图3所示。在有两个客户在线的情况下，才能进行语音视频聊天。两个用户要进行语音视频聊天时，一个用户选中另一个用户的用户名，根据该用户名在后台链表中的对应IP地址查找用户并请求视频连接。当双方确认视频连接后就进行视频传输，并显示在客户端，同时用线程实现语音录制和回放。这样，两个用户就实现了点对点的语音视频聊天。在进行语音视频聊天的过程中，不能再与其它用户进行语音视频聊天，但能够与其它用户进行文字聊天。枚覧即曾吃倾満求退lb图3语音视频聊天流程图2.5数据流在发送端和接收端各开一个

27、视频缓冲区，暂存待发送和已接收的数据帧。由于无线传输带宽和单片机软硬件资源的限制，压缩后的JPG图像(320 X 240)仍然必须在发送端分割成若干帧，到达接受端时重组。在 LINUX中，JPG图像就相当于一个普通文件，可通过open ()函数打开进行读写。2.5.1数据帧结构对每帧加上帧头结构，帧头结构定义了序列号，视频压缩格式，时戳。序列号是数据包发4所示。送的顺序标记，检测传输中是否有数据丢失，并用在接收端来重新排序。视频压缩格式标记用于接收端采用相应的解码流程。时间戳控制视频回放的时间。帧结构描述如图项描述wliicliPictne当前图像序号wIiicliFraiiic帧号Cl J

28、 J )TOT al F171 me图像总帧数To 1 mat视频压缩格式时间戳Data图像数据图4数据帧结构图像在传输过程中还涉及到缓冲区、流量控制、确认技术及超时处理等问题。(1 )缓冲区。由于发送端存在重发数据帧的可能，接收端有可能收到乱序的数据帧,故发送端和接收端确定一个视频传输缓冲区，大小为65 536 (可根据要传送的图像大小适当调整)字节。发送端首先把一幅jpg图像数据一次性写入缓冲区，将其分解为若干数据帧，各帧按照序号递增的顺序从1依次编号，使得每一帧的大小不超过 2 048字节,称为一个数据帧。接收端收到完整的一幅 JPG图像数据后再一次性写入图像文件中。(2)流量控制。U

29、DP借鉴TCP协议流量控制机制：慢启动和线性增长成倍减少过程。在连接建立后的慢启动过程中，先将发送方窗口置为最小值，每当成功传送完窗口中的数据后，就成倍地增大窗口，直到某个阈值。这就保证了网络流量不会突然增大，为其他连接留有余地。(3 )确认技术。在可靠数据传递协议中保证数据可靠传递的基本就是要使用确认技术。为了更好地控制流量，达到最大限度地利用网络资源的目的，可采用捎带确认、累计确认和超时确认以及扩展确认这几种方式结合来实现确认。其中前3种确认方式和TCP中的用法一致。在接收方收到失序数据包时，为了最大限度地减少重传，并不是简单将其丢弃，而是将其存储在本地的失序缓冲队列中，并设置失序包

30、计数器。接收方在计数器超过阈值或者确认定时器超时后向发送方发送扩展确认数据包。该数据包中携带本端已经收到的最大按序包序号和收到的所有失序包的序号信息。发送端收到由接收端传来的扩展确认数据包后，将根据最大确认序号和对端收到的失序包的序号计算出应该重传的数据包序号，并从重传队列中取出相应的数据包进行快速重传。4)超时处理。处理超时和重传的方法之一就是发送一个请求后等待n 秒,如果没有收到应答 ,则重传并再等待另外 N 秒。这是一种线性重传的定时器 ,并且在重传一定次数后就放弃重传。这种办法的问题是 ,数据报在一个互联网上往返的时间 ( RTT) 会从 LAN 上的远远小到 1 s 变成

31、 WAN 上的许多秒。影响往返时间 (RTT) 的因素是距离、网络速度和拥塞 ,当网络条件变化时 , 客户和服务器之间的 RTT 会随着时间很快地变化。因此 ,必须设计一个将实际测得的 RTT 以及 RTT 随时间变化考虑在内的超时和重传算法。计算发送每个数据报的重传超时 ( RTO) 的公式为：delta = RTT - srt t srt t Jsrtt + g x delta rt tvar J rt tvar + h x (| delta卜 rt tvar)RTO = srtt + 4 x rt tvar其中， RTT 为数据报的实际往返时间； srtt 为平滑了的 RTT 估计因

32、子； rttvar 为平滑了的平均偏差估计因子； delta 为测得的 RTT 和当前平滑了的 RTT 估计因子 (srtt) 之间的差；g为施加在RTT估计因子上的增益因子，值为1/ 8 ; h为施加在平均偏差估计因子上的增益因子，值为1/4。当重传定时器超时的时候，对下一个 RTO要用一个指数退回。例如，如果 RTO 是2 s ，这段时间内应答没有收到，则下一个 RTO 是 4 s ；如果仍没有收到，下一个 RT0 是 8 s ，接着是 16 s ，依此类推。2.5.2 视频图像数据传输过程以一幅图像传送为例。如一幅图像共可拆分打包成 n 个数据帧。某次发送编号为 i ，j ， k

33、， m 共 4 帧 ( i < j < k < m)，接收方成功收到 i ， m 两帧。接收方将已收到的所有帧序号打包成确认帧发送出去 ,而不只是仅打包本次收到的 i ， m 两帧。发送方收到确认帧后 ,依据确认帧里各帧序号将表明接收方是否成功收到数据帧的数组相应位置此时发送方依据流量控制原理选取序号大于 m 的帧发送 ,而不是发送上次的序号为 j， k的帧。当帧号等于 n 时再从帧号 1 开始依据序号递增的方法选取还未收到确认帧的各帧。实验表明，这样大大减少了数据帧和确认帧的重发。因为发送方未收到确认帧并不表明确认帧由于受到线路噪声干扰或路由器缓冲区已满而被抛弃，也

34、有可能还在寻找路由。5 所示，TCP 的顺序传送以帧为单位，而本文方法却是以一幅图像为单位。发送流程如图接收流程如图 6 所示。图5图像数据帧发送流程图音频信号是3系统具体设计3.1呼叫处理3.1.1呼叫处理模块在实现语音视频聊天时，采用的是基于 UDP套接字的点对点模式，而 UDP面向的是无连接的数据服务，其套接字的使用如图7所示。L：DP服务器图7 UDP套接字的使用3.1.2呼叫处理关键代码客户端请求连接线程（呼叫处理）关键代码如下:DWORD WINA PI Co nn ectThreadFu nc(LP VOID pP aram)CChatRoomDIg *p ChatRoom =

35、 (CChatRoomDIg *)pP aram;ASSERT( pChatRoom ! = NULL);p ChatRoom ->m_Co nn ectSock = socket (AF_INET ,SOCK_STREAM , I PP ROTO_TC P);if ( p ChatRoom->m_Co nn ectSock = INVALID_SOCKET) AfxMessageBox(_T("新建 Socket 失败！");return FALSE;CString strServIp;pChatRoom->GetDlgItemText(IDC_IP_A

36、DDR, strServIp);int iPort = pChatRoom ->GetDlgItemInt (IDC_CONNECT_PORT);if( iPort <= 0 | iPort > 65535 ) AfxMessageBox(_T(" 请输入合适的端口： 1 - 65535");goto _Error_End;char szIpAddr16 = 0;USES_CONVERSION;strcpy_s(szIpAddr, 16, T2A(strServIp);sockaddr_in server;server.sin_family = AF_IN

37、ET;server.sin_port = htons(iPort);server.sin_addr.s_addr = inet_addr(szIpAddr);if(connect(pChatRoom->m_ConnectSock,(struct sockaddr*)&server, sizeof(struct sockaddr) = SOCKET_ERROR )AfxMessageBox(_T(" 连接失败，请重试！ ");goto _Error_End;pChatRoom->ShowMsg(_T(" 系统信息：连接服务器成功！ "

38、);while( TRUE ) if ( SOCKET_Select(pChatRoom->m_ConnectSock) ) TCHAR szBufMAX_BUF_SIZE = 0;int iRet = recv (pChatRoom->m_ConnectSock, (char*)szBuf, MAX_BUF_SIZE, 0);if ( iRet > 0 ) pChatRoom->ShowMsg(szBuf);else pChatRoom->ShowMsg(_T(" 聊天服务器已停止，请重新进行连接！ ");break;Sleep(500);E

39、rror_End: closesocket(pChatRoom->m_ConnectSock);return TRUE;3.2 音视频采集与播放利用 VFW 接口，视频捕获可以分为以下几个步骤：建立视频采集窗口：该窗口用来接收视频捕捉驱动程序传来的数据和消息。连接视频驱动程序：将建立的视频捕捉窗口与视频设备驱动程序相连。视频捕获初始化。视频捕捉设置： VFW 下视频捕捉参数的设置可以通过调用函数或弹出对话框的形式来实现。一般视频驱动程序允许设置的参数包括视频源选择、视频格式、视频显示格式等。5)设置回调函数：通过回调函数来通知程序视频事件的发生，比如捕捉一帧图像成功的消息，捕捉出错的

40、消息等。6)结束捕捉：结束捕捉是应该有一些清除工作。如释放分配的内存，断开捕捉窗口与视频捕捉驱动程序的连接，清除视频捕捉窗口等。3.2.1 捕获窗口在捕获前必须创建一个捕获窗口( Capture Widnow )，下面介绍有关捕获窗口的情况：创建一个 AVICap 捕获窗口，用 capCreateCaptureWindow 函数并返回一个句柄。将捕获窗口连接至捕获设备，用 capDriverConnect 函数来使一个捕获窗口与一个捕获设备连接或关联连接上后，就可以通过捕获窗口向捕获设备发送各种消息，可以使用函数capGetDriverDescription 来获得已安装的捕获设备名称及

41、版本，将其列举在实现程序过程中。再利用 capDriverGetName 函数来得到捕获设备的名称将获得的版本发送到capDriverGetVersion 。如果断开捕获窗口与捕获设备的连接用 capDriverDisconnect 。捕获窗口的状态，用 capGetStatus 函数来获得当前捕获窗口的状态，得到一个CAP STATUS吉构的拷贝。该结构的内容包含了图片的尺寸、卷轴的当前位置、overlay和 preview 是否已设置。由于其信息是动态的，每当捕获的视频流的尺寸发生改变，程序应该在获取捕获设备的视频格式以后及时进行刷新。而捕获窗口尺寸的改变并不影响实际的捕获视频流的尺

42、寸。该尺寸由视频捕获设备的格式和视频对话框决定。代码如下：/ 捕获窗口BOOL VideoCapture:Initialize() char devname128=0,devversion128=0;int index=0;BOOL ret = TRUE, ret1 = TRUE, ret2 = TRUE, ret3 = TRUE;TRACE("VideoCapture:Initializen");/ 创建一个 AVICap 捕获窗口m_capwnd = capCreateCaptureWindow("Capture",WS_POPUP,0,0,1,1,

43、0,0);if(!m_capwnd) return FALSE;/connect callback functions ret = capSetUserData(m_capwnd,this);/Change destroy functions also ret1 = capSetCallbackOnVideoStream(m_capwnd,OnCaptureVideo);/ 得到已安装的捕获设备的名称及版本ret2 = capGetDriverDescription(index,devname,100,devversion,100);/ Connect to webcam driver / 使

44、一个捕获窗口与一个捕获设备连接或关联ret3 = capDriverConnect(m_capwnd,index);if(!(ret && ret1 && ret2 && ret3)/ Device may be open already or it may not have been/ closed properly last time.AfxMessageBox("Unable to open Video Capture Device");/ log.WriteString("n Unable to connec

45、t driver to the window");m_capwnd=NULL;return FALSE; / Set the capture parameters if(SetCapturePara()=FALSE) / log.WriteString("n Setting capture parameters failed");capDriverDisconnect(m_capwnd); / 使捕获窗口与一个捕获设备断开return FALSE;return TRUE;322 设置 CAPTUREPARAM构VC+采用VFW技术，客户端通过capSetCallb

46、ackOnFrame()注册回调函数，当采集卡采集到一幅图像后，系统就会自动调用回调函数，在其中使用 ICSeqCompressFrame()函数进行压缩。然后再通过 Winsock 将压缩后的数据发送到另一客户端。该客户端接收完一帧以后，交给 ICDecompress() 解压，最后用 SetDIBitsToDevice() 将图像显示出来。基本的捕获设置包括设置捕获速度(每秒捕获多少帧)、是否同时捕获声频、捕获缓冲、允许最大丢失多少帧和是否使用 DOS 内存，以及使用键盘的哪个键或鼠标的哪个键来终止捕获等内容，这些设置使用 CAP TURE PARAMS吉构描述，capCap tur

47、eGetSetup宏来得到当前的设置，然后改变此吉构的成员变量，再使用 capCaptureSetSetup 宏设置新的设置。设置捕获速度，通过使用 capCaptureGetSetup 宏来得到当前的捕捉速度，将当前的捕捉速度保存在 CAPTUREPARAMS吉构的dwRequestMicroSecPerFrame成员变量中，也可以通过设置此变量来改变当前设置值。设置终止捕获，也通过使用 capCaptureGetSetup 宏来得到当前的设置，当前按键设置保存在CAPTUREPARAMS吉构的vKeyAbort成员中，鼠标设置保存在fAbortLeftMouse 和 fAbortRi

48、ghtMouse 成员中，通过修改可以设置新的热健或者鼠标左右键，修改完成后，使用 capCaptureSetSetup 宏来进行更新。捕获的时间限制，用CAPTUREPARAMS吉构中的fLimitEnabled表示捕获是否有时间的限制， wTimeLimit 用来设置指示捕获最大的持续时间，其单位为秒。使用capCaptureGetSetup 宏来得到当前的设置值。F面程序为设置CAPTUREPARAMS吉构的实现代码:BOOL VideoCapture:SetCapturePara()CAPTUREPARMS CapParms=0;capCaptureGetSetup(m_capwn

49、d,&CapParms,sizeof(CapParms);/ 得到当前的捕获速度CapParms.fAbortLeftMouse = FALSE;CapParms.fAbortRightMouse = FALSE;CapParms.fYield = TRUE;CapParms.fCaptureAudio = FALSE;CapParms.wPercentDropForError = 80;if(!capCaptureSetSetup(m_capwnd,&CapParms,sizeof(CapParms) / log.WriteString("n Failed to s

50、et the capture parameters ");return FALSE;/ Set Video Format capGetVideoFormat(m_capwnd,&m_bmpinfo,sizeof(m_bmpinfo);m_bmpinfo.bmiHeader.biWidth=IMAGE_WIDTH;m_bmpinfo.bmiHeader.biHeight=IMAGE_HEIGHT;BOOL ret=capSetVideoFormat(m_capwnd,&m_bmpinfo,sizeof(m_bmpinfo);/ log.WriteString("

51、;n Video parameters set properly");return ret;/终止一个捕获任务BOOL VideoCa pture:Sto pCa pture() capCap tureSto p(m_capwn d);capCap tureAbort(m_ca pwn d);Slee p(500);return TRUE;3.3音视频处理（编解码）音视频编码处理就是对音视频进行压缩。MP EG-4编码算法的完整源代码如下: class CVideoE ncoderX264 : p ublic:CVideoE ncoderX264(void);-CVideoE nco

52、derX264(void);virtual bool Co nn ect(CVideoE nDecodeNotify* pNotify, const CVideoE nDecodeltem &Item);virtual void Release(void);virtual void En code(BYTE* pin Data, i nt nLe n, BYTE* p OutBuf, i nt& n OutLe n, int& n KeyFrame);p rivate:x264_picture_t m_Pic;x264_t *h;x264_ param_t p aram

53、;void Flush(void);文件：VideoEncoderX264.cppmemcpy(m_Pic.img.plane0, pInData, param.i_width * param.i_height);CVideoEnDecodeItem& Item)CBase:Connect(pNotify, Item);ParseSize(Item.m_stSize);x264_param_default( &param );param.i_threads = 1;param.i_frame_total = 0;param.i_width = m_nWidth;param.i_

54、height = m_nHeight;param.i_keyint_min = Item.m_nKeyInterval;param.i_keyint_max = Item.m_nKeyInterval * 10;param.i_fps_num = Item.m_nFps;*/ param.i_log_level = X264_LOG_NONE;if( ( h = x264_encoder_open( &param ) ) = NULL ) return false; /* Create a new pic */ x264_picture_alloc( &m_Pic, X264_

55、CSP_I420, param.i_width, param.i_height );return true; void CVideoEncoderX264:Release(void)Flush();x264_picture_clean( &m_Pic );x264_encoder_close( h );CBase:Release(); void CVideoEncoderX264:Encode(BYTE* pInData, int nLen, BYTE* pOutBuf, int& nOutLen, int& nKeyFrame) if(nLen != param.i_

56、width * param.i_height * 3) return;param.i_frame_total +;memcpy(m_Pic.img.plane1, pInData + param.i_width * param.i_height, param.i_width * param.i_height / 4);memcpy(m_Pic.img.plane2, pInData + param.i_width * param.i_height * 5 / 4, param.i_width * param.i_height / 4);m_Pic.i_pts = (int64_t)param.

57、i_frame_total * param.i_fps_den;static x264_picture_t pic_out;x264_nal_t *nal = NULL;int i_nal, i;if( &m_Pic ) m_Pic.i_type = X264_TYPE_AUTO;m_Pic.i_qpplus1 = 0; /TraceTime("x264_encoder_encode begin");if( x264_encoder_encode( h, &nal, &i_nal, &m_Pic, &pic_out ) < 0 ) return; /TraceTime("x264_encoder_encode end");int nOutCanUse = nOutLen;nOutLen = 0;for( i = 0; i < i_nal; i+ ) int i_size

人人文库> 全部分类> 应用文书 > 作业报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

李娜多媒体网络通信技术

文档简介

温馨提示

最新文档

评论

李娜多媒体网络通信技术

文档简介

温馨提示

最新文档

评论

相关文档