第六章多媒体通信技术_第1页
第六章多媒体通信技术_第2页
第六章多媒体通信技术_第3页
第六章多媒体通信技术_第4页
第六章多媒体通信技术_第5页
已阅读5页,还剩192页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章

多媒体通信技术

赵问道博士

浙江大学信息与通信工程研究所:1第六章多媒体通信技术多媒体信息与网络多媒体通信系统组成多媒体通信协议及标准流媒体技术多媒体通信应用2多媒体信息与网络多媒体信息在网络中的传输特性

网络技术对多媒体信息传输的支持

3多媒体信息在网络中的传输特性多媒体通信有许多共同特征,但对其他多媒体应用来说这些特征又是多媒体通信特有的。需要实时传输连续媒体的信息,如音频和视频信息,因此要求信息传输端到端延迟小。要交换的数据量特别大,媒体信息需要压缩编码,因此在多媒体通信应用中,音、视频的压缩编码是必不可少的。

所有的媒体类型(包括音频和视频)都可以通过两种模式来传输:用于同步显示的实时传输模式和下载模式。下载是一个异步过程,在网络上下载的是多媒体信息还是其他数据类型对网络的要求都相同,差别在于数据量的大小。在实现多媒体通信的应用系统中,媒体的传输是采用实时传输模式,而这种依赖时间的媒体的实时传输对网络的性能提出了一些新的要求。4多媒体信息在网络中的传输特性对于多媒体通信应用来说,有4个需要考虑的性能指标:比特率、传输延迟、延迟抖动和差错率。比特率:两个通信端系统间的比特率就是指网络在每单位时间内能接收和发送的二进制数字的数量。传输延迟:网络传输延迟是由发送端系统发送的一个数据块的第1比特到接收端系统接收到该数据比特之间的时间。延迟抖动:是指一段时间内最长和最短传输延迟之间的差值。差错率:差错率是对于数据发送中改动、丢失、复制或失序这些行为的度量,也是网络对错误恢复能力的度量。

对于大型的网络还有另外两个在某些应用中非常关键的特征:多播能力和文档缓冲能力。5多媒体信息在网络中的传输特性端系统对网络的要求人对音频和图像的感知差异压缩编码算法对错误率的影响6端系统对网络的要求在一个给定应用框架中通过网络实时传输音频或视频流的端系统可能存在两种情况:一种是在源端中可能传送实况音频或视频,另一种情况是可能传送存储下来的音频或视频。实况传输与存储传输对网络的要求是不存在差别的。传输实况信息并不意味着网络必须反应更快或者必须在数据流内或数据流之间可以减少对时间的依赖性。

对网络要求真正不同的是接收端系统对接收的信息是实时播放还是记录存储,这两种情况的差别主要体现在对服务要求的质量参数(即错误率和传输延时)的忍受程度的不同。

结论:不管源端的音频或视频是实时播放或是存储下来再传输,它们对网络的要求是基本相同的。但是,接收端对接收的信息处理方式不同会造成对网络传输的要求有所不同。因为人们通常能容忍较高的错误率,但对传输延时却比记录系统有较高要求。7人对音频和图像的感知差异人对音频的变化比对可视信号的变化要敏感。也就是说,人类对影响音频流传输错误的容忍程度比影响运动视频流错误的容忍程度要低得多。在很多多媒体通信应用中,音频和视频流同时传输。有些网络为每个流分配独立的信道。而有些网络如分组交换网则将两者混在一起,结果是在大多数分组交换网中,两种数据流竞争同一资源,而竞争可能导致数据丢失。在这种情况下,音频数据流必须有比视频数据流高的优先级。在网络需要同时传送视频和音频信号,而且音频数据流传输的可靠性没有保证的情况下,可以采用混合传输技术实现。混合传输技术的一个最典型例子是将视频数据流使用最大比特速率的分组交换网和IP网络来传输,而音频数据流通过ISDN电路传送。8压缩编码算法对错误率的影响在多媒体通信系统,因考虑到传输带宽的要求,音频数据流可以被压缩,而且视频数据流必须被压缩。如果一个信息块在时间t被接收到,它也包含有对在时间间隔{t-△t,t+△t}内接收到的数据块产生影响的信息。因此,任何影响“第t个数据块”的丢失或中断也会影响这个间隔内的所有数据块。

当使用音频或视频压缩算法时,网络错误率必须更低。因为,一旦音频或视频被压缩,数据块的丢失会造成错误的传播。块t坏块时间与块t负载信息有关的问题图6.1压缩对传输错误忍受度的效果9网络技术对多媒体信息传输的支持现实网络对多媒体应用的支持情况宽带多媒体网络10现实网络对多媒体应用的支持情况局城网LAN广域网WAN帧中断11局城网LAN局城网(LAN)是将一个公司、一座大楼或一所学校内部计算机连接起来进行数据通信的小型网络。LAN的特点体现在两个方面:首先是利用一个单独的媒体将所有的端系统连接起来其次以基带方式传输,在这种模式中,时间片被分给所有站和每个站的所有通信另外,数据流被分成帧,利用帧进行传输以太网、令牌环传送网和FDDI为3种常见的共享媒体LAN。以太网络又可分10M、100M和1000Mbit/s三种类型。最新发展:电信级以太网12广域网WAN所有广域网服务是面向连接的,可分为两种类型:永久或交换的。广域网线路服务包括:模拟租用或交换线路,数字租用线路和数字交换线路。广域网线路是完全等时性的,非常适合支持需要音频和视频传输的多媒林应用。但不支持多点播送。是20世纪70年代早期设计的处理低速低质的分组交换和面向连接的技术,因此它实现了错误检测和恢复这些比较复杂的机制以普通方式实现,因为比特率或传输延迟不能保证,所以网络不支持等时性。最新发展:分组传送网PTN13广域网WANIP可在任何底层传输机制上工作,使用现在设备可以在300bit/s到1000Mbit/s之间工作。如果需要在广域网上支持实时传输音频或视频等多媒体应用时,IP技术受到其自身的局限。端系统可以解决由网络随机性带来的问题,得到的比特率和传输延迟可支持大部分多媒体应用,不论这此应用是同步的还是交互的。对IP技术进行改进以支持实时多媒体应用:电信级以太网和分组传送网。IP技术的另一个主要优点在于支持多点广播。端系统可以随时加进多点广播组。组的创建是动态的。在世界范围的因特网上建立了一个实验性的多点广播网络MBone,用会话目录告诉用户有关广播节目的信息。只需点击即可加入组而且激活相关的必要程序。14帧中继

帧中继是一种分组交换技术,来源于X.25技术,是面向连接而且是为了满足随机复用数据通信而设计的。它查找但不纠正传输错误,只是丢弃有错误的帧。在帧中继中无请求建立连接服务,所以虚拟链路是永久性的。当前帧中继交换机支持工作速度最大为2Mbit/s或8Mbit/s链路。尽管帧中继不是为有带宽需求或实时性要求的多媒体应用而设计,但其面向连接的性质有利于资源分配,某些产品可达到实时性要求,可进行高码率多媒体业务传送。15帧中继DDN可提供固定或半永久连接的电路交换型业务,其传输通道对用户数据完全“透明”,码率为kbit/s延时时间低且固定,带宽较宽,适于多媒体的实时传输。但无论开放点对点,或点对多点通信,都需要网管中心来建立和释放连接,限制了其服务对象。窄带综合业务数字网N-ISDN是以电路交换为基础的网络,从公用网发展而来。能够支持2Mbit/s以下的多媒体应用,可实现实时应用,也可保证服务质量。MPEG-1编码码率为1.5Mbit/s,N-ISDN完全可以支持,再通过N-ISDNMCU建立多点连接,在N-ISDN上可开放较高质量的可视电视和电现会议。16宽带多媒体网络

宽带综合业务数字网(B-ISDN)宽带IP网络宽带IP网络管理17宽带综合业务数字网在ISDN基础上发展出来的B-ISDN,是可支持任何码率的综合业务数字网,能够运行几乎所有的多媒体应用。当某些业务的特性发生变化时,其网络不需要任何变化就可适应。B-ISDN采用ATM交换技术,其特点:传输通道带宽大(155Mbit/s~622Mbit/s);以固定长度(53字节)的信元进行高速交换,网络延时小;能够处理突发性信息,可以动态分配带宽;收发端通过虚电路VC进行连接,并保证提供网络和终端在连接建立时所商定的服务质量QoS;通过建立多条虚电路可以实现多点连接等。ATM是面向连接的,也可模仿一个无连接服务。端系统可以同时与其他用户系统建立若干个虚通路(VC)。其中一些VC可以合并为虚通道(VP)。ATM与服务的主要区别是ATM的虚拟连接是同一个特定的服务类别相联系而建立的。18宽带IP网络IPTCPUDPRTP和RTCPRSVP19IPTCP/IP是为包含多种物理网技术而设计的,包容性主要体现在IP层当中。各种网络技术的帧格式,地址格式等上层协议因素差别很大,设置IP层的重要思想之一就是通过IP向上层(TCP/IP等)提供统一的IP数据报和IP地址,使得各种物理帧的差异性对上层协议不复存在,从而达到屏蔽低层细节提供一致性向上接口的目的。IP主要涉及两个方面的内容:第一是IP层的数据报传输机制和IP层的无连接服务;第二是IP数据报的数据格式。20TCPTCP和UDP是IP网中传输层两个并列的协议。传输控制协议(TCP)除了提供和UDP一样的进程通信能力外,其主要特点是可靠性很高。其主要工作是:连接管理,流量控制等。TCP是建立在不可靠的IP协议之上的,IP协议不可能提供任何可靠性机制。因此,TCP的可靠性完全由自身来实现。TCP采用的最基本的可靠性技术是:确认与超时重传流量控制和拥塞控制TCP是面向连接的,提供高可靠服务,高可靠性的TCP用于一次传输要交换大量报文的情况(如文件传输、电子信箱、远程登录等)。21UDP用户数据协议(UDP,UserDatagramprotocol)建立在IP上,同IP协议一样提供无连接数据报传输。不提供可靠性通信服务,而是提供高效及时的用户数据报服务。相当于IP,唯一增加的能力是提供协议端口,以保证进程通信。UDP是无连接的,提供高效率的服务,高效率的UDP用于一次交换少量报文或实时性要求较高的信息(如:IP,会议系统,交易型应用及一些管理和控制信息)22RTP和RTCP实时传送协议(RTP,RealTimeProtocol)提供具有实时特征的、端到端的数据传送服务,可以用来传送声音和运动图像数据。在这项数据传送服务中包含了装载数据的标识符、序列计数、时戳和传送监视。通常RTP的协议元是用UDP的协议元来装载的,利用UDP的复用、校验来实现RTP的复用。RTCP的基本做法是周期性地向会话的所有参加者进行通信,采用和数据分组分配传送的相同机制来发送控制分组。23RSVPRSVP是一个资源预约协议,提供一种有效的资源预约方式,可以有效地描述应用程序对资源的需求。RSVP建立在IP之上,可以利用IP数据报传输RSVP消息。RSVP是一个单工协议,只在一个方向上预订资源。RSVP主要是一个面向用户端协议,由信宿负责资源预约,可满足点到多点群通信中客户端异构的需求,每个客户端可以预订不同数量的资源,接收不同的数据流。RSVP还提供了动态适应成员关系的变化和动态适应路由变化的能力。RSVP可以满足大型点到多点通信群的资源预订需求。24宽带IP网络管理

宽带IP多媒体通信网作为通信网,必须具备电信网络所共有的特点、可管理性并且要保证服务质量。在因特网中的计费功能有多种实现方案。第一种方案是电子身份技术。第二种方案是主叫IP计费技术。第三种方案是各节点增加专用计费设备,该设备由软件和硬件组成。25第六章多媒体通信技术多媒体信息与网络多媒体通信系统组成多媒体通信协议及标准流媒体技术多媒体通信应用262多媒体通信系统组成

多媒体通信系统就是能够完成多媒体通信业务的系统。在物理结构上,若干个多媒体通信终端、多媒体服务器和网关,经过通信网络连接在一起就构成了多媒体通信系统。多媒体通信终端是处理多种媒体信息并将它们同步地显示出来,具有交互功能的通信终端,是集计算机终端技术、声像技术和通信技术于一体的高技术产物,是整个多媒体通信系统中一个重要的组成部分。多媒体通信终端一般要实现人机交互接口、视音频编解码以及相关通信协议等。网关是一台提供特殊功能的计算机或工作站,它连接线路交换网络和IP包交换网络,保证了异种网络之间的连同,负责异种网络之间的实时全双工通信。网关一般要实现协议转换、数据格式转换和异种网络之间的数据传输等。多媒体服务器随多媒体业务及所采用的协议不同而有不同的形态,一般负责执行地址转换、准入控制、带宽管理、呼叫控制和管理、用户的授权和验证等功能。对于视频会议系统,多媒体服务器由关守和多点控制单元MCU组成。27第六章多媒体通信技术多媒体信息与网络多媒体通信系统组成多媒体通信协议及标准流媒体技术多媒体通信应用283多媒体通信协议及标准多媒体通信协议体系结构

协议

SIP协议

协议

RTP协议

29多媒体通信协议体系结构多媒体通信协议是多媒体系统的基础。多媒体通信协议由三方面的协议组成:一是多媒体信令协议,主要有系列协议和SIP协议;二是网关控制协议,主要有MGCP协议,协议;三是媒体编码和传输协议,媒体编码协议主要包括音视频压缩编码协议标准媒体传输协议主要有RTP/RTCP和RTSP协议30多媒体通信协议体系结构31协议

制定了无QoS保证的分组网络上的多媒体通信系统标准。是ITU多媒体通信系列标准的一部分,该系列标准使得在现有通信网络上进行视频会议成为可能。是在N-ISDN上进行多媒体通信的标准;是在B-ISDN上进行多媒体通信的标准;是在有服务质量保证的LAN上进行多媒体通信的标准;是在PSTN和无线网络上进行多媒体通信的标准。为现有的分组网络(如IP网络)提供多媒体通信的标准。由于能提供设备与设备、应用与应用、供应商与供应商之间的互操作能力,因此,能够保证所有兼容设备的互操作性。32协议

的作用范围包括取和数据网络连接的终端、网关、关守和多点控制单元(MCU)。H.323的目标就是在这些H.323端点之间实现多媒体信息流的相互交换。33终端

终端是一个能够和其他端点(包括终端、网关、多点控制单元MCU)进行实时通信的终端设备至少支持一种音频编码。在绝大多数情况下,应该支持多种音频编码,甚至视频编码。34网关网关是一种能够在网络和其它网络(如ISDN、PSTN)之间实现服务转换的端点设备,它由两部分功能构件组成:连接网络的一端支持信令协议,发送并接收以分组方式传输的多媒体信息流,另一端连接电路交换网络,支持电路交换网络所要求的信令协议(或SS7)和传输特性。网关连接网络的一端等同于终端,而连接电路交换网络的一端等同于电路交换网络中的某个节点。网关在其内部实现两个网络不同信令协议及多媒体信息流格式之间的转换,而且这种转换对两个不同网络中的其他节点都是透明的。当两个终端分属于不同的网络,而且这两个网络通过其他类型的外部网络(如PSTN)互联时,只有通过网关提供的服务才能实现这两个终端间的相互通信。35关守关守是一个可选的设备,如果网络中存在关守,由它控制多个终端、网关及多点控制单元。这种控制功能主要包括:地址转换、带宽控制和接入认证。地址转换服务允许对网络中的各个端点设备分配便于记忆的别名,而不仅仅是IP地址带宽控制服务和带宽或资源管理技术相结合,可以保证通信的服务质量接入认证服务对由某个端点发起的呼叫进行认证,确定是否允许该呼叫过程继续进行36关守单个关守及由该关守控制的一系列终端、网关及多点控制单元(MCU)构成一个区域。一个区域可以跨越多个子网,而且区域内的端点不必邻接在一起图一个区域实例37多点控制器多点控制器(MC)用于管理由3个或3个以上端点(终端或网关)参与的多点会议,在这样的多点会话中,多点控制器通过向参与会话的所有端点发送功能集合来证明这些端点所共享的多媒体数据格式。当有新的端点加入会议,或者有H.323端点离开会议时,多点控制器可以改变功能集合。多点控制器可以作为独立的多点控制单元设备,也可和网关、关守及终端集成在某个相同的设备中。每一个多点控制器至少包含一个多点处理器(MP),它在MC的控制下对多媒体信息流进行处理。通过对M个输入多媒体信息流进行处理,创建并输出N个多媒体信息流。MP对输入多媒体信息流进行的处理包括切换、混合等。38多点控制器MC可以支持两种类型的多点会议:集中式和分布式。在集中式配置中,每个H.323端点都和MC进行通信,MC和H.323端点构成一个星形拓扑结构;在分布式配中,MC和所有参与多点会议的端点以点对点方式交换控制信令,但以组播方式向所有参与多点会议的端点传输共享的多媒体信息流。集中式多点会议分布式多点会议39H.323

信令协议概述音频/袖、视频应用终端/应用控制音频/袖、视频编码RTCPH.225.0RAS信令协议H.225.0呼叫信令协议H.245控制信令协议RTPUDPTCPIP链路层物理层协议堆栈40H.323

信令协议概述

和概述

编址

多媒体信息流编码方式

41和概述实际完成端点之间信令消息传送的协议是和。由两部分内容组成,一部分是ISDN第三层规范,它的主要用于在端点之间建立或撤消连接,因此通常称这一部分内容为信令协议或直接称之为信令协议;另一部分称为注册、认可、状态(RAS)信令协议。RAS信令协议主要用于在端点和关守之间传输信令消息,关守通过RAS信令协议许可或拒绝某个端点访问网络资源。是一种作用于两个或多个端点之间的控制协议。通过在端点之间建立逻辑信道,在参与会话的端点之间协商多媒体信息流的类型、格式、传输速率等特征,最终以共同认可的多媒体信息流的格式、传输速率在参与会话的端点之间传输多媒体信息流。42和概述RAS、及这3种协议相互合作,建立、维持并最后撤消某个呼叫。假定某个端点希望和另一个端点建立一个呼叫,首先,该端点用RAS信令协议从关守那里获得许可,随后用信令协议和另一个端点建立呼叫连接。在建立呼叫连接之后,用信令协议商多媒体流的格式及传输速率,建立用于传输多媒体信息流的逻辑信道。不同类型的信令消息经过不同的信道进行传输。在IP环境中,一个信道只涉及一个插口地址(IP+地址+端口号),如果某个端点用特定的IP地址及端口号接收RAS信令消息,那么,所有通过该特定插口号接收到的信令消息都被当作是经过该H.323端点的RAS信道接收到的。43编址

网络中的每一个实体(网关、网守、终端、MCU)都有一个惟一标识该实体的网络地址,在IP环境中,该网络地址就是IP地址。如果网络提供域名服务(DNS)的话,标识实体的IP地址允许以统一资源定位符(URL)的形式给出。例如,RAS://GKI@somedomain可以是用于正确标识某个关守的URL。对于任URL,必须再附加一个端号,如果没有指定端口号,就用缺省端口号。如RAS的缺省端口号为1719。44编址为方便起见,终端、网关、MCU通常和控制它们的关守有着共同域名。对应于每一个网络地址,实体有一个或多个传输服务接入点(TSAP)标识符。通常情况下,每一个传输服务接入点(TSAP)标识符用于在指定的实体内标识特定的逻辑信道。在IP环境中,TSAP标识符等同于插口地址(IP地址+端口号)。在通常情况下,用于信令消息和多媒体信息流传输的端口号是动态分配的,但有些交换信令消息时所使用的端口号是事先规定的,被称为著名端口号。它们包括:关守发现消息所使用的UDP端口号:1718RAS信令消息所使用的UDP端口号:1719呼叫信令消息所使用的TCP端口号:1720这些端口已经在IANA注册,不允许作为其他用途45编址除了网络地址和TSAP标识符,H.323还允许网关或终端设备拥有一个或多个别名。由于消息通过IP网络传输时必须使用IP地址,因此,允许使用别名的H.323网络必须具有将别名转换成相应的IP地址的能力,这种转换功能由关守完成。终端设备希望获悉某个别名所对应的IP地址,通过RAS信令消息别名告知关守。关守完成IP地址和别名之间的转换后,将别名和对应的IP地址通过RAS信令消息通知终端设备。H.323对别名的分配是非常灵话的,对任何指定的H.323端点,可以分配任意数码形式的别名,甚至可以分配多个别名。在H.323网络中,惟一的限制是分配给特定H.323端点的别名在区域内必须是惟一的。46多媒体信息流编码方式

在H.323协议中,支持音频编码是必须的,但对视频编码的支持是可选的。如果支持视频编码,则至少支持四分之一公共中间格式(QCIF)。对于音频编码,H.323协议要求至少要支持音频编码格式,在实际应用中,H.323端点通常支持多种更有效的音频编码格式。47SIP协议SIP协议的背景和功能

SIP网络元素

SIP协议的实现机制

SIP消息的组成

会话描述协议(SDP)

48SIP协议的背景和功能

SIP(会话初始协议)的开发目的是用来帮助提供跨越因特网的高级业务。

SIP是IETF标准进程的一部分,它是在诸如SMTP(简单邮件传送协议)和HTTP(超文本传送协议)基础之上建立起来的。它用来建立,改变和终止基于IP网络的用户间的呼叫。为了提供业务它还需要结合不同的标准和协议:特别是需要确保传输(RTP),与当前网络的信令互连,能够确保语音质量(RSVP),能够提供目录(LDAP),能够鉴权用户(RADIUS)等等。

SIP被描述为用来生成、修改和终结一个或多个参与者之间的会话,这些会话包括因特网多媒体会议,因特网(或任何IP网络)呼叫和多媒体发布。会话中的成员能够通过多播或单播联系的网络来通信。SIP支持会话描述,它允许参与者在一组兼容媒体类型上达成一致。它同时通过代理和重定向请求到用户当前位置来支持用户移动性。SIP不与任何特定的会议控制协议捆绑。49SIP协议的背景和功能

SIP提供以下功能:名字翻译和用户定位:无论被呼叫方在哪里都确保呼叫达到被叫方,执行任何描述信息到定位信息的映射,确保呼叫(会话)的本质细节被支持。特征协商:它允许与呼叫有关的组(这可以是多方呼叫)在支持的特征上达成一致(注意:不是所有方都能够支持相同级别的特征)。例如视频可以或不可以被支持。

呼叫参与者管理:呼叫中参与者能够引入其它用户加入呼叫或取消到其它用户的连接。此外,用户可以被转移或置为呼叫保持。呼叫特征改变:用户应该能够改变呼叫过程中的呼叫特征。例如,一呼叫可以被设置为“voice-only”,但是在呼叫过程中,用户可以需要开启视频功能。也就是说一个加入呼叫的第三方为了加入该呼叫可以开启不同的特征。50SIP网络元素

SIP中有两个要素。SIP用户代理和SIP网络服务器。用户代理是呼叫的终端系统元素SIP服务器是处理与多个呼叫相关联信令的网络设备用户代理本身具有一客户机元素(用户代理客户机UAC)和一服务器元素(用户代理服务器UAS)。客户机元素初始呼叫而服务器元素应答呼叫。这允许点到点的呼叫通过客户机-服务器协议来完成。51SIP网络元素SIP服务器元素提供多种类型的服务器。有三种服务器形式存在于网络中:SIP有状态代理服务器SIP无状态代理服务器SIP重定向服务器有状态和无状态代理服务器的区别:有状态代理服务器记住它接收的入请求,以及回送的响应和它转送的出请求。有状态代理服务器可能是离用户代理最近的本地设备,它控制用户域并且是应用服务的主要平台。无状态代理服务器一旦转送请求后就忘记所有的信息。无状态代理服务器可能是最快的,并且是SIP结构的骨干。

重定向服务器接收请求,但不是将这些请求传递给下一服务器而是向呼叫者发送响应以指示被呼叫用户的地址。这使得呼叫者可以直接联系在下一服务器上被呼叫方的地址。52SIP协议的实现机制SIP是一个分层结构的协议,这意味着它的行为根据一组平等独立的处理阶段来描述,每一阶段之间只是松耦合。协议分层描述是为了表达,从而允许功能的描述可在一个部分跨越几个元素。它不指定任何方式的实现。当我们说某元素包含某层,我们是指它顺从该层定义的规则集。不是协议规定的每个元素都包含各层。而且,由SIP规定的元素是逻辑元素,不是物理元素。一个物理实现可以选择作为不同的逻辑元素,甚至可能在一个个事务的基础上。53SIP协议的实现机制SIP的最底层是语法和编码。它的编码使用增强Backus-Nayr形式语法(BNF)来规定。第二层是传输层。它定义了网络上一个客户机如何发送请求和接收响应以及一个服务器如何接收请求和发送响应。所有的SIP元素包含传输层。第三层是事务层。事务是SIP的基本元素。一个事务是由客户机事务发送给服务器事务的请求(使用传输层),以及对应该请求的从服务器事务发送回客户机的所有响应组成。事务层处理应用层重传,匹配响应到请求,以及应用层超时。任何用户代理客户机(UAC)完成的任务使用一组事务产生。用户代理包含一个事务层,有状态的代理也有。无状态的代理不包含事务层。事务层具有客户机组成部分(称为客户机事务)和服务器组成部分(称为服务器事务),每个代表有限的状态机,它被构造来处理特定的请求。54SIP协议的实现机制事务层之上的层称为事务用户(TU)。每个SIP实体,除了无状态代理,都是事务用户。当一个TU希望发送请求,它生成一个客户机事务实例并且向它传递请求和IP地址、端口,和用来发送请求的传输机制。一个TU生成客户机事务也能够删除它。当客户机取消一个事务时,它请求服务器停止进一步的处理,将状态恢复到事务初始化之前,并且生成特定的错误响应到该事务。这由CANCEL请求完成,它构成自己的事务,但涉及要取消的事务。

55SIP协议的实现机制SIP通过EMAIL形式的地址来标明用户地址。每一用户通过一等级化的URL来标识,它通过诸如用户号码或主机名等元素来构造(例如:)。因为它与EMAIL地址的相似性,SIPURLs容易于用户的EMAIL地址关联。SIP提供它自己的可靠性机制从而独立于分组层,并且只需不可靠的数据包服务即可。SIP可典型地用于UDP或TCP之上。56SIP协议的实现机制SIP提供必要的协议机制以保证终端系统和代理服务器提供以下业务:用户定位用户能力用户可用性呼叫建立呼叫处理呼叫前转呼叫号码传递个人移动性终端类型的协商和选择。终端能力协商呼叫者和被呼叫者鉴权不知情和指导式的呼叫转移多播会议的邀请57SIP协议的实现机制当一用户希望呼叫另一用户呼叫者用INVITE请求初始呼叫,请求包含足够的信息用以被呼叫方参与会话。如果客户机知道另一方的位置它能够直接将请求发送到另一方的IP地址。如果不知道,客户机将请求发送到本地配置的SIP网络服务器。如果服务器是代理服务器它将解析被呼叫用户的位置并且将请求发送给它们。服务器也可以是重定向服务器,它可以返回被呼叫用户的位置到呼叫客户机用以直接与用户联系。在定位用户的过程中,SIP网络服务器当然能够代理或重定向呼叫到其它的服务器,直到到达一个明确地知道被呼叫用户IP地址的服务器。一旦发现用户地址,请求就发送给该用户。58SIP协议的实现机制SIP还具有另外两个有重要意义的特征第一个是有状态SIP代理服务器具有分割入呼叫或复制入呼叫的能力,从而可以同时运行几个扩展分支。第一个应答的分支接受呼叫。该特征在用户工作在两位置之间(例如实验室和办公室)或者同时对经理和其秘书振铃时是非常便利的。

第二个特征是SIP独特的返回不同媒体类型的能力。例子:当SIP服务器接收到客户机的连接请求,它能够通过WEB交互式语音响应页面来返回到顾客的客户机,该页面具有可获得的部门分支或提供在列表上的用户。点击适当的链接后将发送一请求到所点击选择的用户从而建立起呼叫。59SIP消息的组成

无论是用户代理客户(UAC)发送的请求消息,还是用户代理服务器(UAS)发送的响应消息的SIP消息格式:起始行消息头<空行>[消息体]SIP消息分成两类:请求消息和响应消息。请求消息的起始行指定消息类型而响应消息起始行指定请求是否成功。如果指定请求失败的话,响应消息起始行还给出失败类型及原因。60SIP消息的组成消息头给出与特定请求消息或响应消息有关的其他信息,这些信息包括:SIP消息的发送者和接收者(源SIP网络终端和目的SIP网络终端标识符)及其他有关信息。消息体描述即将建立的通信会话的类型,包括双方交换的多媒体信息流的特性(如编码格式等)。SIP本身并不对消息体结构和内容作出定义,目前最常用于定义消息体的协议是会话描述协议(SDP)。消息体也可包括根据其他标准进行编码的消息类型。事实上,为了网关之间传送PSTN或ISDN信令消息,常以二进制格式将ISDN用户部分消息(ISUP)装入消息体,这样,就可以通过SIP消息,在网关之立传输信令消息。SIP网络中的中间节点,如代理服务器,并不对消息体作任何处理,消息体只对源和目的SIP网络终端有效。对于SIP网络而言,消息体相当于封装在SIP消息中的净荷。61SIP消息的组成SIP请求消息类型

SIP响应消息类型消息头

62SIP请求消息类型SIP请求消息由起始行开始。起始行由请求消息类型、请求URI、SIP版本号等组成,它们之间用空格隔开。在起始末尾用回车换行(CRLF)符作为起始行的结束字符:请求消息起始行=请求消息类型请求URI

SIP版本号目前已经定义了6种类型的消息,它们分别是:INVITEACKOPTIONSBYECANCELREGISTER63SIP请求消息类型INVITE消息用于启动一个会话,在INVITE消息中,必须包含主叫、被叫信息和双方交换的我多媒体信息流类型。ACK消息作为成功接收到最终响应消息的确认消息。。BYE消息用于终止某个会话,主叫或被叫SIP网络终端都可以发送该消息。

OPTIONS消息用于查询用户代理服务器(UAS)的能力。CANCEL消息用于终止一个未完成的请求过程。每个SIP网络终端必须将其SIP网络标识符和对应的IP地址信息注册到注册服务器,这个注册过程就通过REGISTER消息实现。64SIP响应消息类型SIP响应消息也由起始行开始。起始行包括SIP版本号、3位十进制数的状态码和理由,它们分别用空格符分隔。起始行最后以回车换行(CRLF)符结束:

响应消息起始行=SIP版本号状态码理由3位十进制的状态码指明请求消息处理结果,理由字段以文本方式描述请求消息的处理结果,源SIP网络终端通常只能对状态码作出反应,根据响应消息给出的状态码确定会话建立过程。理由字段可以直接提供给用户(如显示在显示屏上),帮助用户理解当前的响应消息。65SIP响应消息类型SIP定义的状态码范围为100~699,状态码的第一位数字指明响应消息类型,因此,100~199状态码就属于同一类型的响应消息,依此类推。响应消息分类如下:1XX:临时响应消息;2XX:成功响应消息;3XX:重定位响应消息;4XX:请求失败响应消息5XX:服务器失败响应消息;6XX:整体失败响应消息。除1XX为临时响应消息外,其余的全部为最终响应消息。如果源SIP网络终端发送的SIP请求消息为INVITE消息,它必须为接收到的最终响应消息回送ACK消息。66消息头消息头的作用是进一步提供有关消息的其他信息,使得代理服务器或客户代理服务器(UAS)能够更好地对消息进行处理。SIP消息中的消息头非常类似于中的信息单元。如消息头To就等于中的CalledPartyNumber信息单元,消息头Frim就等于中的CallingPartyNumber信息单元。消息头大致可以分为4类:通用头、请求头、响应头和实体头。对于不同的请求消息或响应消息,有些消息头是必需的,有些消息头是可选的,而有些消息是不允许出现的。67会话描述协议SDP只是提供一种用于描述需要向对方通告的有关会话特征信息的格式。图

SDP会话描述结构68协议MGCP协议与H.323和SIP不同,和SIP提出两套IP体系结构,二者完全独立,不能互相兼容,只能互通。MGCP不涉及IP的体系结构,只涉及网关分解问题,因而不仅可用于H.323IP系统,也可用于SIPIP系统。网关可分解成媒体网关(MG)和媒体网关控制器(MGC),MG在MGC(或软交换)的控制下,实现跨网媒体业务。MGCP协议是1999年由Internet工程任务组(IETF)制定的媒体网关控制协议,MGCP协议定义的连接模型包括端点(endpoint)和连接(connection)两个主要概念。69协议MGCP采用用户数据报协议(UDP)传送。协议命令包括:(l)端点配置命令(EndpointConfiguration),从呼叫代理到网关;(2)通知请求命令(NotificationRequest),从呼叫代理到网关;(3)通知命令(Notify),从网关到呼叫代理;(4)创建连接命令(CreateConnection),从呼叫代理到网关,呼叫代理用该命令将某端点与指定的IP地址和UDP端口关联,另外还向远端端点发送创建连接命令,建立两个端点间的连接;(5)修改连接命令(ModifyConnection),从呼叫代理到网关,修改以前建立连接的参数;(6)删除连接命令(DeleteConnection),从呼叫代理到网关(也可从网关到呼叫代理),删除以前建立的连接;(7)审计端点命令(AuditEndpoint),从呼叫代理到网关;(8)审计连接命令(AuditConnection),从呼叫代理到网关;(9)重启动进行中命令(RestartInprogress),从网关到呼叫代理70协议H.248协议是2000年由ITU-T第16工作组提出的媒体网关控制协议,它是在MGCP协议基础上改进而成。协议是由MGC控制MG的协议,也称MeGaCo。中引入了context概念,增加了许多package的定义,从而将MGCP大大推进一步。可以说建议已取代MGCP,成为MGC与MG之间的协议标准。71协议将网关分解成MG和MGC是研制大型电信级IP网关的需要。MGC的功能是:(l)处理与网守间的H.225RAS消息;(2)处理信令(可选);(3)处理信令(可选)。MG的功能是:(l)IP网的终结点接口;(2)电路交换网终结点接口;(3)处理信令(在某类分解中);(4)处理带有RAS(registerationadmissionstatus)功能的电路交换信令(在某类分解中);(5)处理媒体流。72协议协议消息是协议发送的信息单元,一个消息包含一个消息头和版本号,消息头包含发送者的ID。消息中的事务彼此无关,可以独立处理。协议消息的编码格式为文本格式和二进制格式。MGC必须支持这两种格式,MG可以支持其中任一种格式。当MG发起呼叫时,MGC建立一个新的上下文,并使用Add命令将RTP流和模拟线这两个终端分别添加到上下文中,当MG结束呼叫后,MGC使用Subtract命令将终端从上下文中删除,释放资源。用Modify命令可以修改终端的属性和信号参数。73协议还定义了:(l)Move命令,将一个终端从一个上下文移到另一个上下文;(2)AuditValue命令,返回终端特性的当前状态;(3)AuditCapabilities命令,返回终端特性的能力集;(4)Notify命令,允许MG将检测到的事件通知MGC;(5)ServiceChange命令,允许MG通知MGC一个或多个终端将要脱离或加入业务,也可以用于MG注册到MGC表示可用性,以及MGC的挂起和MGC的主、备转换通知等。74RTP协议应用层RTPUDPIP链路层物理层应用层RTPUDPIP链路层物理层插口RTP在协议结构中的位置

RTP作为应用层的一部分75RTP协议RTP分组格式

RTP控制协议(RTCP)

76RTP分组格式

RTP分组由分组首部和净荷两部分组成净荷通常为数字化的语音数据,它通过采样语音信号、量化采样信号,并对量化后的采样数据进行编码得到。RTP首部如图所示。经过编码的数字化语音数据加上RTP首部后,发送给UDP层。VPXCCMPT序号时间戳同步源标识符(SSRC)提供源标识符列表(0~15)项特定描述信息长度首部扩展(a)固定的RTP首部(b)RTP首部扩展77RTP首部各元素的含义版本字段(V):2位长度,指明RTP的版本号,当前RTP的版本号为2。填充位(P):指明净荷未端是否包含一个或多个填充字节。扩展位(X):指明RTP首部扩展。RTP首部由固定部分和扩展部分组成中。首部扩展部分是可选的,如果扩展位X置1,表明在固定首部之后,紧跟着一个首部扩展。提供源计数器(CC):4位长度,给出RTP首部中提供源标识符列表中的项数(0~15)。信标位(M):该位的解释取决于携带的净荷类型,RTP(RFC1889)并没有规定该位的用途,但音频/视频描述文件(RFC1890)规定,如果某个应用在静音阶段不发送分组,那么静音阶段后发送的第一个分组必须置位该信标位。78RTP首部各元素的含义净荷类型(PT):7位长度,指明RTP净荷的格式,通常情况下,单个RTP分组所包含的净荷只能用一种净荷格式对多媒体数据进行编码。序号:16位长度。在会话开始时,发送端产生一个随机数作为该字段的初值,在传送RTP分组过程中,每传送一个分组,该字段值就增1。接收端可以用序号来检测是否有分组丢失或错序。时间戳:32位长度,用来指明净荷中第一个采样数据的采样时间,每一个采样数据的采样时间通过一个单调且线性递增的时钟获得。79RTP首部各元素的含义同步源标识符(SSRC):32位长度,用于标明同步源,同步源是一个负责发送RTP分组并在RTP分组中设置序号和时间戳的实体,同步源标识符字段是一个惟一标识该实体的32位长度的随机数。当RTP分组来自混合器时,同步源标识符字段给出的是混合器的标识符,而不是信息源的标识符。标识符必须是会话中全局惟一的。提供源标识符列表(CSRC):每一个提供源标识符字段为32位长度,提供源标识符列表最多允许在16个提供源标识符。当RTP分组来自混合器时,同步源标识符字段给出标识混合器的标识符,而用提供源标识符列表(CSRC)给出进入混合器的各个信号的信号标识符。80RTP首部各元素的含义RTP首部扩展:RTP首部的设计目标是为了满足绝大多数媒体信息流的一般要求,但不会是所有媒体信息流的所有要求。一些特殊的净荷格式可能要求一些额外的信息,这些信息可以作为净荷自身的一部分。例如可以指定净荷的前个字节为特殊用途的字节,用于提供这种净荷格式所需要的额外信息。当然,也可以用RTP首部扩展提供特定净荷格式要求提供的额外信息。通过将RTP首部的X位置1,来指明RTP首部扩展的存在,RTP首部扩展位于提供源标识符列表和实际净荷数据之间,RTP只要求在首部扩展的规定位置给出首部扩展长度,以便在处理过程中能够找到RTP分组净荷区域。RTP并未对首部扩展的长度及包含的信息类型作出规定。81RTP控制协议RFC1889在定义实时传输协议(RTP)的同时,也定义了RTP的伴侣──RTP控制协议(RTCP)。RTCP通过周期性交换会话两端实体的控制信息,这会话两端实体提供质量反馈信息,这种反馈信息可以用于检测并纠正实时传输中存在的问题。通过RTCP和IP组播这些信息,可以让第三方监测会话质量和网络中发生的问题82RTP控制协议RTCP定义了下列5种不同类型的RTCP分组:发送者报告(SR):会话参与者用它转发有关传输和接收的统计信息。接收者报告(RR):只接收媒体数据流的会话参与者用它发送有关接收的统计信息。源描述(SDES):包含一个或多个某个特定会话参与者相关的描述信息,通常情况下,SDES必须包含用于标识会话参与者的规范名字(CNAME),这个名字有别于同步源描述符,同步源描述符每当主机复位时,将重新设定,而且在某个特定会话内,如果某个实体生成多个RTP数据流,这些RTP数据流可以有不同的同步源描述符。但规范名字是不变的,而且同一实体生成的多个RTP数据流具有相同的规范名字(CNME)。在接收端,规范名字可以用于关联这些RTP数据流,以此支持多个RTP数据流的同步播放。在特定会话内,规范名字(CNAME)必须是惟一的。在SDES分组内,也可能存在其他信息,如会话参与者具有的正规名字、E-mail或号码等。BYE:表明会话参与者退出某个会话。APP:应用相关功能,RTCP通过APP传送有关选定媒体或应用的信息,但对APP分组的内容不作规定。83RTP控制协议RTCP规定,每个RTCP复合分组必须包含SR或RR和SDES分组,而且报告分组(SR或RR)作为复合分组的开始。根据规定,当某个媒体数据流发送源需要发送SDES分组时,它必须一起发送一个报告分组,即使没有相关信息需要报告,也须如此。这种情况下,复合分组可以包含一个空RR分组。如图所示为一个复合分组的实例。发送该复合分组的会话参与者,已经表明将退出该会话,复合分组末端的BYE分组就用于表明这点。84第六章多媒体通信技术多媒体信息与网络多媒体通信系统组成多媒体通信协议及标准流媒体技术多媒体通信应用854流媒体技术流媒体是指需要在发送端和接收端之间以独立于网络负载的以给定速率传输的音、视频信息的一种传输技术。流媒体具有隐含的时间、传输的实时性、等时性和高吞吐量等特点。因特网是流媒体实时应用的普遍环境,但目前因特网由于存在带宽不足、服务质量控制机制较弱等局限性,因此难以满足流媒体实时性要求,为此因特网工程任务组IETF制定了专门支持流媒体实时传输的协议—实时流协议RTSP。864流媒体技术流媒体基本概念流媒体技术原理

RTSP协议

流媒体编码格式流媒体系统组成87流媒体基本概念流媒体指在internet/intranet中使用流式传输技术的连续时基媒体,它在播放前并不下载整个文件,只将开始部分内容存入内存,其他的数据流随时传送随时播放,只是在开始时有一些延迟,其关键技术就是流式传输。与传统的单纯的下载相比较,流媒体具有明显的优点。(1)由于不需要将全部数据下载,因此等待时间可以大大缩短;(2)由于流文件往往小于原始文件的数据量,并且用户也不需要将全部流文件下载到硬盘,从而节省了大量的磁盘空间;(3)由于采用了RSTP等实时传输协议,更加适合动画、视音频在网上的实时传输。88流媒体基本概念实现流传输主要有两种方法:实时流(realtimestreaming)传输和顺序流(progressivestreaming)传输。如视频为实时广播,或使用流传输媒体服务器,或应用如RTSP的实时协议,即为实时流传输。如使用HTTP服务器,文件即通过顺序流发送,即为顺序流传输。当然,流文件也支持在播放前完全下载到硬盘。89流媒体技术原理

流传输的实现需要缓存在流传输的实现方案中,一般采用HTTP/TCP来传输控制信息,而用RTP/UDP来传输实时声音数据。流媒体传输过程如图:Web服务器Web服务器A/V播放器A/V播放器流媒体文件http/Tcp控制信息RTSP/TCP(UDP)90流媒体技术原理

智能流技术流媒体的服务质量参数流媒体技术的应用91智能流技术智能流技术通过两种途径克服带宽协调和流瘦化。首先,确立一个编码框架,允许不同速率的多个流同时编码,合并到同一个文件中;第二,采用一种复杂客户/服务器机制探测带宽变化。92智能流技术针对软件、设备和数据传输速度上的差别,用户以不同带宽浏览音视频内容。为满足客户要求,编码、记录不同速率下媒体数据,并保存在单一文件中,此文件称为智能流文件,即创建可扩展流文件。当客户端发出请求,它将其带宽容量传给服务器,媒体服务器根据客户带宽将智能流文件相应部分传送给用户。智能流通过描述现实世界因特网上变化的带宽特点来发送高质量媒体并保证可靠性,并对混合连接环境的内容授权提供了解决方法。93智能流技术智能流是对所谓自适应流管理(ASM)API的实现ASM描述流媒体数据的类型,辅助智能决策,确定发送哪种类型数据分组。文件格式和广播插件定义了ASM规则。用最简单的形式分配预定义属性和平均带宽给数据分组。对高级形式,ASM规则允许插件根据网络条件变化改变数据分组发送。每个ASM规则可有一定条件的演示式,如演示式定义客户带宽是5000到15000kbit/s,分组损失小于2.5%。如此条件描述了客户当前网络连接,客户就订阅此规则。定义在规则中的属性有助于媒体服务器有效传送数据分组,如网络条件变化,客户就订阅一个不同规则。94流媒体的服务质量参数

连接建立延时/释放延时:建立延时是指从传输服务用户要求建立连接到收到连接确认之间所经历的时间,它包括了远端传输实体的处理延时。释放延时是指传输服务用户发出释放连接请求到连接完全释放所经历的时间。与所有衡量延时的参数一样,这两个延时越短,服务质量越好。连接建立失败概率:指在最大连接建立延迟时间内未能建立连接的可能性。网络拥塞或应用程序的许可控制(admissioncontrol)机制常常造成连接建立失败。吞吐率(throughput):指每秒传输的用户字节数。它是在某个时间间隔内测得的。每个传输方向由各自的吞吐率来衡量。吞吐率越大越好。95流媒体的服务质量参数

传输时延(transitdelay):指从源端机器的传输用户发送报文开始到目的地机器的传输用户接收到报文为止所经历的时间。传输延时在每个传输方向上也应单独处理。残余误码率(residualerrorratio):用于测量丢失或错乱报文数占整个发送报文数的百分比。该值越小越好。(安全)保护(protection):该参数反映传输层为防止未经授权的第三方(窃取情报者)读取或修改传输用户数据而提供保护的程序。优先级(priority):该参数提供了一种方法用以表明哪些连接更为重要。当拥塞发生时,应确保优先级较高的连接先获得服务。恢复功能(resilience):当出现内部问题或拥塞时,该参数指出了传输层本身自发终止连接的可能性。96流媒体技术的应用

带图片的广播(illustratedaudio)流视频播出(streamingvideo)远程教学(remoteseminar)提供收费电视(paybyview)提供音频压缩技术,可以为普通拨号上网的用户提供调频收音的效果97RTSP协议RTSP简介

RTSP状态机

RTSP系统实现原理

98RTSP简介实时流协议(RTSP,RealTimeStreamingProtocol)定义了一对多应用程序如何有效地通过IP网络传送多媒体数据。RTSP在体系结构上位于RTP和RTCP之上,它使用TCP或RTP完成数据传输。HTTP与RTSP相比HTTP传送HTML,而RTP传送的是多媒体数据HTTP请求由客户机发出,服务器作出响应;使用RTSP时,客户机和服务器都可以发出请求,即RTSP可以是双向的。99RTSP简介RTSP是一个流媒体表示控制协议,用于控制具有实时特性的数据发送,但RTSP本身并不传输数据,而必须利用底层传输协议提供的服务。它提供对媒体流的类似于VCR的控制功能,如播放、暂停、快进等。也就是说,RTSP对多媒体服务器实施网络远程控制。RTSP中定义了控制中所用的消息、操作方法、状态码以及头域等,此外还描述了与RTP的交互操作。RTSP制定时较多地参考了,其中的很多描述与完全相同。RTSP之所以特意使用与类似的语法和操作,是为了兼容现有的Web基础结构,并使HTTP的扩展机制在大多数情况下可以加到RTSP上。100RTSP简介RTSP控制的媒体流的集合由表示描述(presentationdescription)来定义。所谓表示(presentation)是指作为一个完整的媒体服务提供给客户机的一个或多个媒体流的集合。表示描述包含了一个表示中各个媒体流的多种信息,例如数据编码/解码集、网络地址、媒体流的内容等。RTSP服务器使用标识符来标识每一流连接会话(session),但与RTP一样,RTSP并没有类似于TCP连接的“RTSP连接”的概念。一个RTSP连接会话可以打开和关闭多条通向服务器的可靠传输连接以发送RTSP请求,还可以同时选择使用无连接传输协议如UDP。101RTSP简介RTSP协议目前支持以下操作:从媒体服务器回取数据客户机可以通过HTTP或其他方法请求一个表示描述。如果表示是多播的,则表示描述包含用于该媒体流的多播地址和端口。如果表示是单播(unicast)的,客户机将由于安全原因而提供目的地址。邀请媒体服务器加入会议(conference)。一个媒体服务器可以被邀请加入一个已存在的会议,或者在表示中回放媒体,或者在表示中录制全部媒体或其子集。这种模式对于分布式教学非常适合,参加会议的几方可以轮流“按下远程控制按钮”。在一个已存在的表示中加入新的媒体流。特别对于现场表示而言。服务器应可以通知客户机新加入的可利用媒体流。102RTSP状态机

客户机状态机服务器状态机103客户机状态机客户机存在以下状态:Init:初始化状态,发出了SETUP命令,等待应答。Ready:准备状态,接收到SETUP命令的应答或在Playing状态下接收到PAUSE命令的应答。Playing:播放状态,接收到PLAY命令的应答。Recording:录制状态,接收到RECORD命令的应答。通常,客户机在收到请求应答后改变状态。注意有些请求在将来的某一时刻或位置才有效(例如PAUSE),因而状态也随之改变。如果没有向对象显式地发出SETUP请求,状态将从Ready开始;在这种情况下,只有Ready和Playing两种状态。104服务器状态机服务器存在以下状态:Init:初始化状态,还没有收到有效的SETUP命令。Ready:准备状态,正确收到上一个SETUP命令,送出应答;或者开始播放后,正确收到上一个PAUSE命令,送出应答。Playing:播放状态,正确收到上一个PLAY命令,送出应答,开始发送数据。Recording:录制状态,服务器开始录制媒体数据。服务器在收到请求后改变状态。服务器在Playing或Recording状态下且工作于点对点模式时,如果它在一段规定的时间内(默认为1min),没有收到从客户机通过RTCP报告或RTSP命令送来的“满意(wellness)”消息,它将回复到Init状态然后拆除RTSP连接会话。服务器处于Ready状态时,如果在1min内没有收到RTSP请求,它将回复到Init状态。105RTSP系统实现原理

RTSP的实现采用客户机/服务器体系结构,主要包括编码器(encoders)、播放器(players)和服务器(servers)三个组成部分,它们之间的互操作性(interoperability)是一个非常重要的问题。三者的互锁关系如图所示。编码器播放器服务器兼容编码器兼容协议兼容文件格式106服务器系统RTSP服务器与HTTP服务器有很多共同之处,如对并发和URL请求的支持。RTSP服务器的结构框图如图所示。数据源音频/视频捕获设备或磁盘文件音频/视频数据流分离音频编码器G.723.1/G.729视频编码器G.723.1/G.729RTP/RTCP分组封装和控制及流媒体处理网络接口系统控制(并发控制、同步调度、QoS管理等)107客户机系统客户机的数据流向与服务器相反,其结构框图如图所示。缓冲区音频/视频数据流分离音频编码器G.723.1/G.729视频编码器G.723.1/G.729RTP/RTCP分组封装和控制及流媒体处理网络接口系统控制(并发控制、同步调度、QoS管理等)播放和显示同步处理108RTSP系统实现原理在RTSP的实现中还应采用下面的流媒体技术:基于速率的流控技术即发送端以接收端播放帧的速率来发送帧。在客户机与服务器建立连接后,客户机和服务器协商所需服务的带宽。服务器根据协商的带宽决定发送的数据分组的大小。在系统运行过程中,网络和终端负载是动态变化的,因此服务器和客户机之间还必须通过RTCP动态交换信息。客户机应在RTCP分组中通知服务器目前所需的播放速度,并反馈分组丢失率、播放时延等服务质量信息。数据缓冲技术为了使客户端连续播放媒体流,必须采用数据缓冲技术。在服务器端,应根据RTCP反馈的传播延时和延时抖动等参数,将数据分割成适合网络带宽的大小合适的分组。在客户机端必须足够快地接收这些分组,以一个速率稳定的流传送给播放程序实时播放出来。对于来不及处理的分组,则存入缓冲区中。客户机实现中采用了多线程处理方式,播放、解压缩、接收各用一个线程,使客户机可以播放一个分组,解压缩另一个分组,同时接收第三个分组。缓冲区的大小由接收端的处理能力和网络带宽综合决定。一般来说,缓冲区至少应能存放大约3s以上的数据量。为了使缓冲区的大小匹配接收端的处理能力和网络带宽,最好是动态分配缓冲区109流媒体编码格式压缩媒体文件格式流文件格式媒体发布格式110压缩媒体文件格式

图6.19文件压缩过程压缩格式有时被称为压缩媒体格式,包含了描述一段声音和图像的同样信息。很明显,压缩过程改变了数据比特的编排。在压缩媒体文件再次成为媒体格式前,其中数据需要解压缩。111常用视频、音频压缩

文件类型

文件格式扩展名(Video/Audio)媒体类型与名称压缩情况MovQuickTimeVideoV2.0可以MpgMPEG1Video有MP3MPEGLayer3Audio有WavWaveAudio没有AifAudioInterchangeFormat没有SndSoundAudioFileFormat没有AuAudioFileFormat(SunOS)没有AviAudioVideoInterleavedV1.0(MicrosoftWin)没有112流文件格式

流文件格式经过特殊编码,使其适合在网络上边下载边播放,而不是等到下载完整个文件才能播放。可以在网上以流的方式播放标准媒体文件,但效率不高。将压缩媒体文件编码成流文件,必须假如一些附加信息,如计时、压缩和版权信息。图6.20流式文件编码过程113常用流文件格式

文件格式扩展名(Video/Audio)媒体类型与名称AsfAdvancedStreamingFormat.(Microsoft).RmRealVideo/Audio文件(ProgressiveNetworks).RaRealAudio文件(ProgressiveNetworks).RpRealPix文件(ProgressiveNetworks).RtRealText文件(ProgressiveNetworks).SwfShockWaveFlash(Macromedia).VivVivoMovie文件(VivoSoftware).114媒体发布格式

媒体发布格式不是压缩格式,也不是传输协议,其本身并不描述视听数据,也不提供编码方法。媒体发布格式是视听数据安排的唯一途径,物理数据无关紧要,用户仅需要知道数据类型和安排方式。以特定方式安排数据有助于流媒体的发展,因为用户希望有一个开放媒体发布格式为所有商业流产品应用,为应用不同压缩标准和媒体文件格式的媒体发布提供一个事实上的标准方法。用户也可以从相同格式同步不同类型流中获益。在不久的将来,单个媒体发布格式能包含不同类型媒体的所有信息,如计时、多个流同步、版权和所有人信息。实际视听数据可位于多个文件中,而由媒体发布文件包含的信息控制流的播放。115常用媒体发布格式

媒体发布格式媒体类型和名称AsfAdvancedStreamingFormat.SmilSynchronisedMultimediaIntegrationLanguage.RamRAMFile.RpmEmbeddedRAMFile.AsxXml116流媒体系统组成

流媒体系统示意图117流媒体系统组成一个完整的流媒体系统应包括以下几个组成部分。编码工具

:用于创建、捕捉和编辑多媒体数据,形成流媒体格式,这可以由带视音频硬件接口的计算机和运行其上的制作软件共同完成。流媒体数据。服务器:存放和控制流媒体的数据。网络:适合多媒体传输协议或实时传输协议的网络。播放器:供客户端浏览流媒体文件。

118流媒体系统组成媒体服务器硬件平台媒体服务器软件平台目前典型流媒体系统主要有以下两种类型:RealSystemWindowsMediaTechnology119第六章多媒体通信技术多媒体信息与网络多媒体通信系统组成多媒体通信协议及标准流媒体技术多媒体通信应用1205多媒体通信应用

VoIP系统视频会议系统

视频点播系统IPTV系统3G/NGN多媒体子系统IMS简介121VoIP系统VoIP(VoiceoverInternetProtoco1)是一种建立在IP网络上的分组化、数字化传输技术。与传统通讯技术不同的是,它是通过数字网络来传输声音数据。122VoIP系统VoIP发展现状VoIP存在的问题VoIP前景展望123VoIP发展现状VoIP实现体系VoIP的应用现状网关成为瓶颈及其软交换解决方案124VoIP实现体系VoIP的基本实现原理是通过语音压缩算法对话音进行压缩编码,然后把这些语音数据按照TCP/IP等相关协议进行打包,经过IP网络把数据包传输到目的地后,接收方再把这些语音数据包重新组合,经过解码处理后,就可以恢复成原来的语音信号,从而达到由IP网络传送话音的目的。125VoIP实现体系VoIP网络采用了一系列的协议协同工作,为实时语音或者其它多媒体数据提供性能保障。如图所示:126VoIP实现体系VoIP网络目前存在着两大体系:由ITU-T提出的基于协议的IP网络协议的IP网络由网守、网关、多点控制单元、应用服务器和后台管理等主要模块组成。主要是从电信的角度出发建议的,它具有与传统电信网接近的呼叫流程和处理机制,采用多层组网、集中式管理方式,技术已经成熟,能比较容易地与现有的PSTN网络互通。不仅是电信运营商,国内的各大企业网络的VoIP部分基本上也都采用了技术的组网方案。由IETF提出的基于SIP协议的IP网络。SIP系统由用户代理、代理服务器、定位服务器、注册服务器和重定向服务器等组成。SIP基本上是基于动态Internet模式来建网的,较少考虑与PSTN的互联互通问题,呼叫流程也与PSTN网有所不同,SIP协议是新兴起来的协议,其发展并不成熟,但是由于SIP类似于其他IP网的协议,采用缝补式的呼叫控制与管理模式,比更加灵活简单,而且易于实现,更适合开发与Internet结合的多媒体业务。127VoIP应用现状软件VoIP电信级VoIP企业级VoIP128软件VoIP应用通信软件或语音聊天室实现PCtoPC的语音通话是VoIP最早的实现形式。目前这部分服务绝大多数是免费的,但是这种模式不可能扩展到普通大众,仅限于熟悉计算机的用户,而且这种通话方式的通话质量不太好,因而没有应用于商用市场。网络软件有VocalTec的InternetPhone、微软的NetMeeting、NetSpeak的WebPhone、IDT的Net2Phone等,最值得一提的是P2P和VoIP技术结合产生的Skype,它可以根据网络的流量和速度,动态的调节语音的质量,从而保持较高质量的语音通话,给语音通信创造了一片广阔的天空129电信级VoIPIP业务在此特指由网络和IP网络共同提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论