版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 通信业务由NordriDesign提供模拟与数字视音频业务3视音频信息基本概念音频信息自然界各音源发出的可闻声和由计算机通过专门设备合成的语音或音乐,包括语音、音乐声和效果声。随时间变化的连续媒体,处理要求有较小的延时和时延抖动。处理涉及音频信号的获取、编解码、传输、语音的识别与理解、语音与音乐的合成等。视频信息一系列周期呈现的画面所组成,帧是构成视频信息的基本单元。具有准确、直观、具体生动、高效、应用广泛、信息容量大等。4听觉特性与音频信号人的听觉特性强弱感觉的对数特性:声强取对数后才与人对声音的强弱感对应。频率感觉的指数规律:声音频率指数上升时,音调感觉线性升高。频响的不平坦特性:
2、 人的听觉频带为20Hz20kHz,在此频率范围内的声音为可闻声。 人对35kHz频率的声音最敏感。掩蔽效应:一个声音的存在会影响人对其他声音的听觉能力。 使用有用的声音信号掩蔽掉那些不需要的声音信号。音频信号特性不同类型的发声体,频谱分布各不相同。 话音主要能量分布在话音主要能量分布在100Hz-5kHz100Hz-5kHz,电话通信的频带限制在,电话通信的频带限制在300Hz-3.4kHz300Hz-3.4kHz。 歌唱声的频谱宽的多,乐器发声的频谱范围更广,低于20Hz,高于20kHz。实际声音信号的强度也在一个范围内随时随刻发生改变。5人眼的视觉特性客观景物图像对于人眼来说,可以被看成
3、是由很多有限大小的像素组成的,每一个像素都有它的光学特性和空间位置,并且随时间变化。人眼的视觉惰性当有光脉冲刺激人眼时,视觉的建立和消失都需要一定的过程,即具有一定的惰性。光源消失以后,景物影响会在视觉中保留一段时间,称为视觉暂留或视觉惰性现象。视觉暂留时间在0.050.2秒。若景物以间歇性光亮重复呈现,只要重复频率大于20赫兹,视觉上始终保留有景物存在地印象,该重复频率可称为融合频率。人眼的闪烁感觉如果周期性重复的脉冲光源作用到视网膜上,当脉冲光的重复频率不够高时,人眼会对之产生一明一暗交替变化的闪烁感觉。这是因为光源在有光和无光间变化时,人眼在亮度感觉上能辨识出它们的差异所致。6视频信号和
4、视频技术在荧光屏上,电视图像是几十万个象素按一定顺序轮流发光形成,然而人们看到的是每幅完整的画面在整体的发光,获得一幅幅连续画面印象的感觉,正是视觉暂留效应的结果。扫描:利用人眼的视觉惰性,在发送端将代表图像中像素的物理量按一定顺序一个一个的传送,而在接收端再按同样的规律重现原像素。只要这个顺序进行的足够快,人眼就会感觉图像上的所有像素在同时发亮。镜头成像-光图像-电图像-扫描-视频信号现有各种制式的电视系统均采用隔行扫描方式:将一帧电视图像分为两场:第一场传送奇数行,第二场传送偶数行。较好的解决图像连续感、闪烁感和电视信号带宽的矛盾。7彩色电视系统8视音频信息数字化视音频信息数字化,包括两方
5、面内容,涉及信号的采样、量化和编码等。音频信息时间离散化和图像信息空间位置离散化。音频信息电平值和图像灰度电平值的离散化。抽样频率满足奈奎斯特准则,原图像的频谱是有限带宽时,抽样后图像的频谱就不会出现混叠。采样音频信号的采样就是使音频信号在时间轴上离散化。对于视频信号,采样就是使图像信号在空间位置上离散化。采样定理:只要采样频率等于或大于音频信号中最高频率成分的两倍,信息量就不会丢失。在允许失真条件下,尽可能选择较低的采样频率,以免数据速率过高。9视音频信息数字化量化抽样后的离散样值从连续的取值转化为有限个离散值,这个过程为量化。均匀量化与非均匀量化:样值是否等间隔分层量化误差或量化失真:模拟
6、值与量化值之间的误差。量化误差会造成图像信号的颗粒噪声和伪轮廓现象。视频信号通常采用610bit量化编码数字化的本质:在保证一定图像或声音质量下,以最小比特数来表示视音频信号。10视音频压缩编码目的:为提高信道利用率及在有限信道容量下传输更多信息。视音频信号数字化后产生的数据速率相当大。数据压缩的理论依据:Shannon的信息论给出了数据压缩的理论极限,指明了数据压缩的技术途径。离散无记忆信源只要概率分布不均匀就存在信息冗余,就存在着数据压缩的可能性。信源压缩编码的两个基本途径:尽可能使编码平均码长接近于信源的熵,减少冗余信息。去除信源中各信源符号间的相关性。 相关性越大冗余越大。11限失真压
7、缩编码概念:允许解码后信号有一定失真,通过去除信源的自相关来达到压缩数据的目的。在允许失真不超过某一限度时,压缩编码的比特率是受限的,存在着一个下限,这个下限由率失真函数来定义。率失真函数:在传输中信号的失真度小于或等于某一值D所必须的信道容量的最小值R(D)。率失真函数表明:在给定信号允许失真度条件下,为减少信号传输比特率,应尽量减小信号的方差。在图像与声音编码中,通常用均方误差作为失真的度量标准。预测编码和变换编码:对原始视音频信号适当处理,使处理后信号的方差减小,达到压缩编码的目的。12无失真压缩编码即使各样值间已经没有相关性或相关性很小,只要各事件出现的概率不相等,该信源就仍然有冗余度
8、存在。基本原则:去除信源的概率分布不均匀性,使编码后的数据接近其信息熵而不产生失真,又叫熵编码,也叫统计编码。Huffman编码根据可变长度最佳编码定理,应用Huffman算法而得对出现概率大的信息符号编以短字长的码,对概率小的符号编以长字长的码。给定符号集和概率模型时的最优码如果信源的实际概率模型与构码时假设的概率模型有差异,实际码长将大于预期值,编码效率下降。算术编码:利用信源概率分布特性、能够趋近熵极限的编码方法和Huffman编码的区别仅在于不是使用整数码。在信源概率比较均匀的情况下,其编码效率高于Huffman编码。游程编码在某个特定方向将相同的样本值用一个游程长度和一个样本值来表示
9、。对误码较为敏感,应采用行、列同步的方法进行差错控制。13音频信号压缩编码技术对于不同类型的音频信号,信号带宽是不同的;随着对信号音质要求的增加,信号的频率范围逐渐增加,信号的数据量也随之增加。波形编码在信号采样和量化过程中,考虑到人的听觉特性,使编码信号尽可能与原输入信号匹配,又能适应人的应用要求,如全频带编码、子带编码、矢量量化等。高码率条件下获得高质量的音频信号,适于高保真要求。参数编码以某种模型表示,再抽出合适的模型参数和参考激励信号进行编码,即声码器。压缩比很高,计算量大,不适合高保真要求。混合编码吸取波形和参数编码的优点进行综合的编码方法。多脉冲线性预测MP-LPC、矢量和激励线性
10、预测VSELP、码本激励线性预测CELP、短延时码本激励线性预测LD-CELP、长时延线性预测规则码激励RPE-LTP。14不同质量要求时的音频编码技术选择电话质量的音频压缩编码信号频率范围:300Hz-3.4kHz采用标准的脉冲编码调制PCM,当采样频率为8kHz,8bit量化时,所得数据速率为64kbps,即一个数字话路。G.711:采用PCM编码调制,非线性量化,速率为64kbit/s,相当于12bit线性量化。G.721:速率为32kbit/s,对信号和它的预测值的差分进行量化,根据邻近差分信号的特性自适应改变量化参数,提高压缩比,保持一定信号质量。低速率语音通信:采用参数编码或混合编
11、码,如LPC、VQ等。G.728:速率16kbit/s,质量与32kbit/s的G.721标准基本相当。GSM:采用长时延线性预测,速率为13kbps。调幅广播质量的音频压缩编码频率范围:50Hz-7kHz。G.722:16kHz采样,14bit量化,信号速率224kbit/s。高保真环绕立体声音频压缩编码频率范围:50Hz-20kHz。采用44.1kHz采样,16bit量化,信号速率每声道达705kbit/s。MEPG标准是国际上公认的高保真环绕立体声音频压缩标准。15视频压缩编码视频信息的冗余图像内部和图像之间有大量的冗余:空间冗余和时间冗余。静止图像的压缩:在保持重建图像的质量的同时,尽
12、量去除空间冗余。活动视频的压缩:在去掉空间冗余的同时去除时间冗余。信息熵冗余:编码冗余,对每个像素采用相同的比特数表示,不能按其信息熵的大小分配比特数必然存在冗余。结构冗余:某部分存在非常强的纹理结构,或各部分存在某种关系,如自相似性。知识冗余:图像中包含的信息与先验基础知识有关,如人脸图像。视觉冗余:利用人类视觉系统的特点,人类视觉对图像的注意是非均匀和非线性的,并不是对图像任何变化都能感知。16视频压缩编码预测编码:方式:帧内预测和帧间预测。原理:基于时间和空间冗余,用相邻已知像素或图像块来预测当前的像素或图像块的取值,然后再对预测误差进行量化编码。用同行、前几行或前几帧来作预测称为一维、
13、二维或三维预测。帧内预测:采用像素预测形式的DPCM优点:算法简单,易于硬件实现。缺点:对信道噪声及误码很敏感,会产生误码扩散,压缩比不高,很少独立使用。帧间预测:利用活动图像序列相邻帧间的相关性,即时间冗余达到压缩的目的消除图像序列的相关性,比帧内预测的压缩比更高。一般针对图像块,有帧重复法、阈值法、帧内插法、运动补偿法和自适应交替帧内/帧间编码法等。缺点:图像序列不同的区域预测性能不一样,快运动区预测效率较差。预测算法的选取与图像信号的概率分布有关。自适应预测器:较好刻画图像的局部特性,提高预测效率。17视频压缩编码变换编码:原理:将空间域相关的像素点通过正交变换映射到另一个频域上,使变换
14、后的系数之间的相关性降低。变换后满足:所有系数相互独立,能量集中于少数几个系数,这些系数集中于一个最小的区域。变换后采用适当的量化和熵编码可以有效地压缩图像的数据量。此外,图像经某些变换后,系数的空间分布和频率特性可能与人眼的视觉特性更匹配。18视频压缩编码具有运动补偿的帧间预测编码:活动图像在时间上比空间上更具相关性。消除序列图像的时间相关性也可以采用预测编码,传送当前帧与其前一帧或后一帧的差值。根据物体的运动方向和速度来作预测,比简单预测要准确,可以达到更高的压缩比。步骤: 将图像分解成背景和若干运动物体,各物体可能位移不同但每物体所有像素位移相同,通过运动估值得到每个物体位移矢量; 利用
15、位移矢量计算经运动补偿后的预测值; 对预测误差进行量化、编码、传输,将位移矢量和图像分解方式等信息送到接收端。具有运动补偿的帧间内插编码:在发端每隔一段时间丢弃一帧或几帧图像,在收端根据帧间相关性将丢弃的帧通过内插恢复出来。适用场合:可视电话、会议电视等。其它编码方法:矢量量化编码、子带编码、小波变换、分层编码、分形编码、模型编码等。19视音频业务种类:普通电话业务普通电话业务基于电路交换,主要提供点到点的语音通信。分为市话业务、国内长途业务、国际长途业务。其他业务:来电显示、三方通话、转移呼叫、互联网拨号等。智能网业务:现有电话网上设置的一种附加网络。传统的新业务提供方法成本高、可靠性差、需
16、要的时间长。智能网思想:控制与交换相分离,智能业务从普通的网络节点上分离出来。提供业务:单端点、单点控制的业务,多端点、多点控制的业务。业务种类自动电话记账卡业务(300)被叫集中付费业务(800)企业直线业务(400)虚拟专用网业务(600)20视音频业务种类:IP电话原理Internet采用分组交换技术,所有业务共享带宽,提高了带宽的利用率,但通常不保证语音传输的质量。IP电话:利用Internet进行语音传输。将语音信号进行模数转换、编码、压缩和打包,然后通过Internet网络传输,到接收端相应进行拆包、解压、译码和数模转换,恢复出语音信号。由于语音进行高比例压缩,占用带宽仅为810k
17、bit/s,且计费方式与距离无关,节省长途通信费用。IP电话的通话方式:PC到PC、PC到PHONE、PHONE到PHONE以太网电话机:基于H.323协议格式,占用独立IP地址,能直接接入网络。PC到PC:纯IP网的语音业务,通信双方的终端均直接连接在IP网络上。PC到PHONE:普通电话的一方要通过网关接入IP网,实现IP通话功能。可能经过本地PSTN网络。PHONE到PHONE:通信双方均要通过网关接入IP网以实现IP通话,均可能经过本地PSTN网络。IP网络的连接是以IP地址为基础的,实质是以IP地址为电话号码建立起通信。21IP电话的关键技术语音压缩技术:标准G.723.1:速率为5
18、.3/6.3kbit/s。静噪抑制技术语音激活技术:检测到通话过程中的安静时段即停止发送语音包。全双工交谈中,只有36%40%的信号是活动或有效的,可以大大节省网络带宽。回声抵消技术回声:在交换机侧,有少量电能未被充分转换而沿原路返回。当回声返回时间超过10ms,人耳就听得很明显。IP电话延时一般达到4050ms,因此回声抵消技术很重要。语音抖动处理技术网络延时与网络抖动(IP包传输时间的长短变化),导致IP通话质量下降。采用抖动缓冲技术,设置缓冲池,再以稳定平滑的速率播放出来。话音优先技术:在IP网络路由器中设置语音包的优先级最高。IP包分割技术:限制IP包的大小不超过2556字节。VoIP
19、前向纠错技术:采用信道编码以及交织,减少传输过程中的错码积累。22视音频业务种类:广播电视模拟广播电视图像信号采用残留边带调幅,伴音采用调频,一路电视节目所占频带为8MHz,划分为68个频道,目前广播电视使用的只有148频道,第5频道为调频广播,占用48958MHz的频率范围。各频段间均留有一定间隔,可作为有线电视的增补频道。数字视频广播采用先进的数字视频压缩技术和信道调制技术,可实现一路模拟电视带宽内传送4-6路数字压缩电视节目。提高了信道利用率,降低了每路节目的传输费用,图像质量可到达广播级。在传输上采用了对各传输媒体均适用的通用技术。视频点播业务受用户控制的视频分配和检索业务。主动性、选
20、择性。数据通信业务24数据通信的基本概念数据通信网络分广域网、城域网和局域网,采用各自的技术和通信协议,在拓扑结构、传输速率和网络功能等方面均有差异,机器与机器之间的数据交换。概念:数据:某种方式编码的数字、字母和符号。数据传输:利用电信号或光信号把数据从一端传送到另一端。数据通信:按照一定的规程或协议完成数据的传输、交换、存储和处理的整个通信过程。特点:拥有更为复杂、严格的通信规程或协议。实时性要求较低,可采用存储转发方式。差错率要求较高,必须有严格的差错控制措施。进程间通信,没有人参与情况下自动完成。25数据通信主要业务DDN业务数字数据网:利用数字信道传输数据信号的数据传输网络。DDN业
21、务:永久性和半永久性连接的数据传输业务。永久性连接:用户间建立固定连接、传输速率不变的独占带宽电路。半永久性连接:非交换性的,但可申请由管理人员修改传输速率、传输数据的目的地和传输路由。主要应用于金融、证券、海关、外贸等集团用户。传输速率高、质量好、网络时延小、全透明、高流量的数据传输基础网络。帧中继完成物理层和链路核心层功能,吞吐量高、时延低、适合突发业务。应用于广域网,支持多种数据型业务,如LAN互连、文件传送、图像监视、会议电视等。ISDN业务提供端到端的数字连接,用来承载包括话音和非话在内的多种电信业务。用户能通过有限的一组标准多用途用户/网络接口接入网络。N-ISDN(2B+D):1
22、28kbit/s,可以同时进行数据传输和语音通信。B-ISDN (30B+D) :155.52Mbit/s。26数据通信主要业务宽带IP业务高速、稳定接入互联网的业务。用户数据以IP数据包的形式通过IP网络传输,有光纤接入、数字用户线接入、无线接入等多种接入方式。虚拟专用网业务利用公共网络(公共分组交换网、帧中继网、 Internet 或ISDN)的一部分来发送专用信息,形成逻辑上的专用网络。结合了传统数据网络的性能优点(安全和QoS)和共享数据网络结构的优点(简单和低成本),能够提供远程访问,外部网和内部网的连接。电子数据交换通过计算机网络将贸易、运输、保险、银行和海关等行业信息,用一种国际
23、公信的标准格式,实现各部门或公司与企业之间的数据交换和处理,并完成以贸易为中心的全部过程。多媒体通信业务28业务类型和特点多媒体:多种媒体间在时间上和空间上都存在着紧密的联系,文字、数据、声音、图像具有同步性和协调性的有机整体。业务特点:信息载体的多样性、交互性和集成性一种业务由视频、图像、音频、数据等多种媒体组成,不同媒体有不同的统计特性,对网络的要求也相差很大。了解不同媒体的统计特性和服务质量要求,可在保证业务服务质量的前提下,通过合理分配资源,实现较高的统计复用增益。业务分类分配型业务单向传送信息流,分为由用户控制的和不由用户控制的。提供从中央源向网络中数量不限的有权接收器分配的连续信息流。交互型业务会话型业务:实时端到端信息传送方式,双向对称或双向
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度体育场馆消防给水施工合同3篇
- 2024年度物业管理服务合同中的服务费用
- 2024年度委托合同标的及受托人职责详细描述
- 《S企业培训教材》课件
- 2024年度股权转让合同标的为互联网公司股权
- 《齿轮加工机床》课件
- 2024年度玛雅租房合同范例下载
- 2024年度茶山管理委托服务合同
- 2024年度企业融资借款合同范本编纂
- 2024年度租赁合同中的维修责任界定
- 厂家方案比较
- 单值-移动极差控制图(自动版)
- 幼儿园大班古诗《游子吟》课件
- 机械职业生涯规划书
- 国内部分基金项目名称的中英文对照翻译(供参考2015-11-24)
- DB32/T 2283-2024 公路工程水泥搅拌桩成桩质量检测规程
- 生物医药技术与创新培训资料
- 人工智能在教育行业中的应用
- 《含水层系统识》课件
- 《房地产销售》课件
- 矿山生态修复施工组织设计
评论
0/150
提交评论