版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二篇应用层技术
第2章通信业务
-模拟与数字视音频业务
二数据通信业务
三多媒体通信业务
第3章通信终端技术
-视音频通信终端
二数据通信终端
三多媒体通信终端
第2章通信业务
-模拟与数字视音频业务
1.视音频信息基本概念
1)音频信息
(1)定义
自然界中各种音源发出的可闻声和由计算机通过专门设备合成的语音
或音乐-语言、音乐声和效果声三大类
(2)特性
频率:语言(0.1〜5kHz)电话(0.3〜3.4kHz)电声设备(20Hz〜20kHz
动态范围:语言(20〜40dB)电声设备(60〜80dB)
(3)处理
音频信号获取、编解码、语音识别与理解、语音合成等,音频信号视
随时间连续变化的,因此要求实时性
武族人字
2)视频信息
(1)定义
活动或者运动的图像信息,由一系列周期呈现的画面组成,每
幅画面称为一帧,帧是构成视频信息的最基本单元
(2)特性
带宽:PAL制式(6.5MHz)NTSC制式(4.5MHz)
动态范围:图像的最亮和最暗部分之间的相对比值(60dB)
(3)处理
摄像系统视通过行、场扫描来完成图像的分解与合成,尽管图
像内容是随机的,但行、场或帧具有准周期性。实时性要求不高,
每秒25帧和每秒30帧两种帧频制式
武族*
2.视音频信息的数字化
1)采样
音频信息在时间上的离散化和图像信息在时间和空间位置的离散化
(1)采样定理
自然采样定理:fc22fH
窄带采样定理:fc>2B
一般采样定理:fc22B(l+k/n)fH=nB+kB,O<K<1,n是小于储/B的
最大整数
(2)音频信号的采样
根据自然采样定理采样频率等于或大于音频信号最高频率的2倍:
8kHz、11.025kHz,16kHz、22.05kHz、32kHz、44.1kHz(CD)和
48kHz(DAT数字音带)
武族人字
⑶视频信号的采样
根据自然采样定理采样频率等于或大于已知图像的最大空间频率
的2倍:设图像的最大空间频率为每毫米40线,则采样频率应大于
或等于每毫米80线,对应的采样尺寸为l/80mm=12.5师。
图像在时间上有变化,还应在时间上对图像的采样频率给予保证
大于或等于2倍的图像最高截止频率:带宽6.5MHz的视频信号采样
频率为13MHz
为了防止混叠失真的出现,通常在采样前要对图像信号进行抗混
叠滤波
2)量化
采样是对视音频信号进行时间或空间的离散化,其每个样值的
取值仍是连续的,必须将它们转化成有限个离散值,这就是量化
均匀量化非均匀量化武族*
3)编码
量化后的信号其每个量化电平最终被赋予一个二进制的码字,这称为
编码。在保证一定质量前提下,以最少比特数来表示信号
3.视音频压缩编码无记忆信源和有记忆信源:信源的输出
视音频信号数字化后数据可用符号序列X=(X1、X2、…Xj...、XJ表
量大:CD(700Kbit/s)、示,其中X是第i时刻产生的符号,它是一
个随机变量,其取值范围为以有限的字符
数字视频(216Mbit/s)
集{X/=1、2...哈如果符号序列中各X相
1)数据压缩的理论依寸互统计独立,相应的信源就称为无记忆信
源;如果符号序列中各X相互统计关联,相
(1)离散无记忆信源应的信源就称为有记忆信源
此时,只要概率分布不均匀就存在信息的冗余,因而就有数据压缩
的可能。在一定信源概率分布条件下,尽可能使编码的平均码长接近于
嫡,以减少冗余信息
⑵离散有记忆信源
其前后出现的信源符号常常具有一定的相关性,相关性越大冗余
也越大,压缩可能性就越大
2)信源编码的方法
⑴无失真压缩编码
改变信源概率分布的不均匀,使编码后的数据接近其信息嫡而不
产生失真一也叫嫡编码,由于基于信源的统计特性因而也叫统计编码
哈夫曼编码矢量量化编码
⑵限失真压缩编码
在允许解码后信号有一定失真的情况下,去除信源的自相关以达
到压缩数据目的
预测编码-时域上去除相关性变换编码一空域7
或揍
3)哈夫曼Huffman编码
是一种统计压缩可变字长编码,它依据可变长度最佳编码定理而得
到的一种最优码
⑴可变字长编码的最佳编码定理
在变字长编码中,对于出现概率大的信息符号编以短字长的码,对
于概率小的符号编以长字长的码。如果字长严格按所对应符号出现概率
大小逆顺序排列,则平均码字长度一定小于其它任何符号顺序排列方式
(2)Huffman编码算法
①将符号按出现概率排序,概率大的在前面,小的在后面;给最后的两
个符号各赋予一个二进制码(概率大的为0,小的为1,可反之);
②把最后两个符号的概率加起来合成一个概率,其值是对应的两个概率
之和,再按大小重新排序,重复步骤①;
武族*
③重复步骤②,直到只
剩下两个概率为止;
④为剩下的两个输出符
号安排。和1码;
⑤将每个符号所对应的
各0、1码反向逆序排列,
即得到各个符号的编码。
停止
压缩比=压缩前平均码长/压缩后平均码长=3/1.
4)音频压缩编码技术
⑴音频压缩编码方法
波形编码-是在信号采样和量化过程中考虑到人的听觉特性,使编
码信号尽可能与原输入信号匹配,又能适应人的应用要求。如:全频
带编码(PCM、自适应差分ADPCM)、子带编码(自适应变换编码ATC)、
矢量量化编码
波形编码的特点-在高码率条件下可以获得高质量的音频信号,
适用于高保真语音和音乐信号的压缩
参数编码-以语音信号产生的数学模型为基础,根据语音信号求出
数学模型中的相关参数(如激励源参数、声道响应参数等),然后按照
这些参数来合成语音信号。如:线性预测(LPC)声码器、通道(Channel
Vocoder)声码器、共振峰声码器(FormatVocoder)
武族*
参数编码的特点-语音合成时考虑合成信号的可懂性,而不要求
合成波形与原信号一致,因此压缩比大,但计算量也大,语音质量较
差,而且对环境噪声敏感,不适合高保真度要求的场合
混合编码-结合波形编码与参数编码的优点,在4〜16Kbit/s速率
上能够得到高质量的合成语音。如:多脉冲激励线性预测编码
(MPLPC)、规则脉冲激励线性预测编码(RPELPC)、码本激励线性预测
编码(CELP)、矢量和激励线性预测(VSELP)、长时延线性预测规划码
本激励(RPE-LTP)
混合编码的特点-吸收了波形编码与参数编码的优点
武族*
(2)语音信号产生的数字模型
常用的模型是无损声管离散时间模型,该模型包括三个部分:激
励源、声道模型和辐射模型
(3)低速语音编码策略
低速语音编码主要策略--提取能表示语音特征的参数,而
尽量去除冗余或者人不敏感的信息
减少语音信号中的冗余度
语音信号存在两方面的冗余度:一是语音信号幅度分布的非
均匀性;二是样本之间的相关性
非均匀性一表现为小幅度语音信号出现的概率大,而大幅度语
音信号出现的概率小,非均匀量化技术就是针对这一特点提出的O
PCM、ADPCM
相关性一语音中存在两种类型的相关性:样本点之间的短时相
关性和相邻基音周期之间的长时相关性,线性预测编码就是根据
这一特点提出的
充分利用人耳的听觉特性减少编码信息
人耳对语音信号的听觉特性表现在三个方面:一是人对语音信号
的分辨率有限;二是人耳对语音信号某些失真不敏感;三是人耳的掩
蔽效应
静音压缩一测试表明人在正常谈话时50%左右时静音,而静音特征
信息只需要很少几个参数来表示,静音编码主要由两个算法组成:语
音检测(VAD-VoiceActivityDetection)和柔和噪声再生(CNG-
ComfortNoiseGenerator)
VAD是用来检测输入信号是语音还是背景噪声,如果是语音则对其进
行固定速率的编码,如果是背景噪声,编码器则对其进行低速率编码
CNG是在语音信号的接收端重构背景噪声
在G.723.1编码器中引入静音压缩技术后,实际的平均编码速率要
5.3Kbit/s武族*
敏感性
去掉语音信号所携带的相对于人耳来说无法感觉或感觉不敏感
的信息,相位线性预测声码器就是利用人耳对语音信号相位不敏感
的特点,在编码时就可以忽略语音的相位信息
掩蔽效应
语音频谱中能量较高的频段处的噪声相对于能量较低频段的噪
声而言不易被感知,因此在计算机合成语音信号与原始信号之间的
误差时可以不考虑这一特点,在语音能量高的频段允许两者误差大,
而在能量较低的频段则小一些。G.723.1编码器使用的感觉加权滤波
器就是利用这一原理
武族*
(4)不同质量要求时的音频编码技术选择
电话质量的音频压缩编码
电话质量语音信号频率为300HZ〜3.4KHz
CSTT制定的G.7U标准采用PCM,采样频率为8KHz,非线性
量化位数为8位,数据速率为64Kbit/s
G.721标准采用自适应差分脉冲编码ADPCM数据速率为
32Kbit/s
G.728标准采用短时延码本线性预测编码LD-CELP数据速率为
16Kb计/s其质量与G.721基本相当
长时延预测规划码本激励RPE-LTP标准GSM,数据速率为
13Kbit/s
武族*
调频广播质量的音频压缩编码
调频广播质量的音频范围50Hz〜7KHz
G.722标准采用16KHz采样,14位量化,数据速率为224Kbit/s
采用子带编码方法将输入音频信号经滤波器分成高子带和低子带
两部分,分别进行ADPCM编码,再混合成输出码流,224Kbit/s可
以被压缩成64Kbi十/S,最后进行数据插入,因此可以在窄带综合业
务数据网N-工SDN中的一个B通道上传送调幅广播信号
高保真环绕立体声音频压缩编码
高保真环绕立体声音频范围为50Hz〜20KHzf
工SO和CCFTT联合制定的MPEG标准采用44.1KHZ采样,16位量I
化,数据率每声道为705Kbit/s,经MPEG音频压缩技术后的数据速\
率为每声道32〜448Kbit/s,适合于CD-DA光盘应用J
MPEG的全名为[MovingPicturesExpertsGroup]
中文译名是动态图像专家组
MPEG标准主要有五个:MPEG-l、MPEG-2、MPEG-4、MPEG-7及
M陀G-21等
MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编
码技术以减小时间冗余度,利用DCT-DiscreteCosineTransform离
散余弦变换技术以减小空间冗余度,利用埼编码则在信息表示方面减
小统计冗余度。几种技术的综合运用,大大增强了压缩性能
7
(5)几种音频编码标准简介
标准编码类型比特率(kbps)MOS复杂性时延(ms)
G.711PCM644.310.125
G.721ADPCM324.0100.125
G.728LD-CELP164.0500.625
GSMRPE-LPT133.7520
G.729CSA-CELP84.03015
G.729A15
G.723.1ACPLP6.33.82537.5
G.723.1MP-MLQ5.3
USDodLPC-1O2.4合成语音1022.5
MOS(长话质量的语音平均意见得分)
5)视频压缩编码
⑴视频信息的冗余
空间冗余一一帧之间存在大量的相同信息
时间冗余一前后帧之间存在大量相同的信息
信息赠冗余一编码冗余:为表示图像数据的一个象素,只要按其信息
嫡的大小分配相应的比特数即可,而实际图像数据是对每一个象素都
以相同的比特数来表示,这就存在着冗余
结构冗余一有些图像的部分区域存在着非常强的纹理结构或是图像的
各部分之间存在有某些关系,例如自相关性等,这就是结构冗余
知识冗余一有些图像中包含的信息于某些先验知识有关,如人脸上的
眼睛、鼻子和嘴巴的相互位置关系就是一些常识,这就是知识冗余
视觉冗余一利用人的视觉系统的特点得到高压缩比。如图像的量化误
差引起的图像变化在一定范围内不为人眼所视察
(2)压缩编码
①预测编码
预测编码是根据离散信号之间存在着一定关联性的特点,利用前
面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差
(预测误差)进行编码。预测编码中典型的压缩方法有脉冲编码调制
(PCM,PulseCodeModulation).差分脉冲编码调制(DPCM,
DifferentialPulseCodeModulation)、自适应差分脉冲编码调制
(ADPCM,AdaptiveDifferentialPulseCodeModulation)等
图像的预测编码
就是基于图像数据的空间和时间冗余特性,用相邻的已知象素(或
图像块)来预测当前图像(或图像块)的取值,然后再对预测误差进行量
化和编码。有两种主要方式:
帧内预测编码——幅图像内进行;一般采用象素预测形式的DPCM
帧间预测编码一多幅图像之间进行;一般采用针对图像块的预测编
码,主要技术有:帧重复法、阈值法、帧内插法、运动补偿法、自适
应交替帧内/帧间编码法
②变换编码
通常在空间域相关的象素点通过正交变换映射到另一个频域,使
变换后的系数之间的相关性降低。在变换后的频域上应满足:所有的
系数相互独立,能量集中于少数几个系数上,这些系数集中于一个很
小的区域内。OCT-DiscreteCosineTransform离散余弦变换
矢量量化编码子带编码小波变换
言编码分形编码模型编演
⑶具有运动补偿的帧间预测编码
活动图像是以帧周期为间隔的连续图像帧组成的,在时间上比在
空间上具有更大的相关性,消除时间冗余是图像压缩编码的重要途径
基本原理一预测编码是不直接传送当前帧的象素值,而是当前帧的
象素值X和其前一帧或后一帧的对应象素X'之间的差值H二X-X',进行
编码和传送,这称为帧间预测
具有运动补偿的帧间预测步骤:
首先将图像分解成相对静止的背景和若干运动的物体,各个物体
可能有不同的位移,但构成每个物体的所有象素的位移相同,通过运
动估值到每个物体的位移矢量;
其次利用位移矢量计算运动补偿后的预测值;
最后对预测进行量化、编码和传输,同时将位移矢量和图像分解
方式等信息传送到接收端
1)分析
K帧和K-1帧的背景完全一样,只是绿球移动了一个位置,如果简
单的以K-1帧象素作为K帧的预测值,则在白球和绿球的圆内的预测误
差都不为零。如果已经知道了小球的运动方向和速度,可以从小球在
K-1帧的位置,算出它在K帧中的位置,而背景图像仍以上可K-1帧的
背景代替,将这种考虑了小球位移的K-1帧图像作为K帧的预测值,就
准确得多,可以达到更高得数据压缩比
2)编码步骤
将图像分解成相对静止得背景和运动的绿球,通过运动估值得到
绿球的位移矢量;
利用位移矢量计算运动补偿后的预测值;
对预测误差进行量化、编码;
一同时将位移矢量和图像分解方式等信息送到接收端武族人字
原理框图
甚小敢抱
-去接收机年码礼
|RTC||DES/30ES/芯
Flash/SDRAMClock.WDTVIC
/SRAM
校福翻
口口R控制相
ARM926EJ-S
加速
c10/W0MJavaH
MACx2
DMA自制器
so成
组
ITU-RBT656
32位DSP
图被加输出接口
框
ITU-RBT656H.264/263/261V
视频殖出篌口视如码加速ai
算
法
框
图
3)注意事项
(1)预测误差准则的选取一决定预测质量的标准
最小均方误差(MMSE)准则一常用
预测系数不变性(PC工V)准则一预测系数与输入信号的统计特性无关,适
合于多种类型信号同时预测,如多媒体信号预测
最大误差(ME)准则一主要用于遥测数据
(2)预测函数的选择一工程中常用线性预测函数,这时预测精度与
预测阶数n有直接关系,n越大越精确,但设备越复杂。所以n值的大小最
终要根据设计要求和实际效果来权衡
(3)预测器输入数据的选取一从何处选取原始数据作预测的依据
A.从信源输出处选取第I位的前N位数据作为预测器输入的原始数据
B.将系统输出的第I位的前N位数据反馈至预测器输入端。如DPCM
两类的结合武族人字
寻4.视音频业务种类
1)普通电话与智能网业务
(1)普通电话业务
语音通信、来电显示、三方通话、呼叫转移、会议电话、传真、互
联网接入…
(2)智能网业务
单端点才空制业务一任何一个时候一个呼叫的同一方受一个且仅受一
个业务控制功能的影响
多端点控制业务一在一个单独的呼叫中有多个业务逻辑实例进行交
互的能力
A自动电话记帐卡业务ACCS(300)
ACCS允许用户持卡在任何一部电话机上拨打长途电话和国际电话,
费记在自己的卡上,与所用的话机无关武族人字
B.被叫集中付费AFP(800)
C.虚拟业务专用网VPN(600)
利用公用电信网的资源,通过程控网络节点中的软件控制,向大型
企业的用户提供非永久的专用网络业务
D.通用个人通信UPT(700)
让用户使用一个唯一的个人通信号码,可以接入任何一个网络并能
跨越多个网络进行通信
E.广域集中用户交换机WAC
把分布于不同交换局的集中用户交换机和单机用户组成一个虚拟的
专用网络,适用于地理位置分散的单位用户
F.电子投票VOT(181)
G.大众呼叫MAS
武族*
2)广播电视业务
(1)广播电视
(2)数字电视--从演播室到发射、传输、接收的所有环节都是使用数字信号
传播的电视类型。低清晰度数字电视(LDTV大于250线/VCD)、标准清晰度数字电视
(5DTV大于500线/DVD)、高清晰度数字电视(HDTV大于800线--720PQ280义720
逐行)、1080i(1440x1080,隔行)和1080P(1920xi080,逐行)三种标准)
(3)IPTV--交互式网络电视,是一种集互联网、多媒体、通讯等多种技术于
一体,向家庭用户提供包括数字电视在内的多种交互式服务的技术
(4)图文电视
(5)移动电视--一般采用无线数字广播电视网(DMB)、蜂窝移动通信网、
Wi-Fi、WiMax等。我国还采用自主研发的数字移动电视技术(CMMB)
武族*
应用层技术
声
媒
体
音
:
、
音
图
频
频
形
视
数据
表
文
端
端
终
端
终
终
象
图
示
字
、
、
端
终
传
图
EVFAIFD
输
DPATSRD形
INXMD帧N
、
、
虚
电
异
N数
电
通
普
话(
中
综
存
S图
拟
子
步
R字
话
电
字
继
合
数F
储
象
专
数
转
)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版IC卡智慧农业信息采集与处理合同3篇
- 2025年度住宅室内装饰装修施工与材料供应一体化合同
- 二零二五年度智能停车场个人车位租赁管理合同
- 二零二五年度2025年度人合伙经营汽车销售与租赁及驾驶培训服务合同
- 二零二五年度塑料模具制造与新材料应用研究合同
- 2025年度农民工社会保障权益维护与法律援助协议
- 2024年水处理设施运营与管理服务合同3篇
- 2025年度人合伙城市更新改造项目合作协议
- 二零二五年度2025年度人合伙经营汽车销售与保险代理及租赁服务合同
- 2024年版权许可及再授权合同
- 期末测试卷(一)2024-2025学年 人教版PEP英语五年级上册(含答案含听力原文无听力音频)
- 汉服娃衣创意设计与制作智慧树知到期末考试答案章节答案2024年四川文化产业职业学院
- (高清版)通风管道技术规程JGJ_T 141-2017
- 机制砂检测报告
- 省教育厅检查组接待方案
- 变压器停、送电操作步骤与注意事项
- 气动潜孔锤施工方案
- 风电项目监理大纲附录风电工程设备监理项目表
- 云南省教育科学规划课题开题报告 - 云南省教育科学研究院
- 二年级上,数学,3个两位数加减,80题,(竖式计算)
- 人民法院涉诉信访案件终结办法
评论
0/150
提交评论