(光学工程专业论文)网络语音信箱技术的研究.pdf_第1页
(光学工程专业论文)网络语音信箱技术的研究.pdf_第2页
(光学工程专业论文)网络语音信箱技术的研究.pdf_第3页
(光学工程专业论文)网络语音信箱技术的研究.pdf_第4页
(光学工程专业论文)网络语音信箱技术的研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学硕士学位论文 摘要声3 ; 9 6 8 。摘要, 0 网络语音信箱的设想就是通过i n t e m e t 这一媒介来实现原本在程 控电话系统中才具有的,包括用户留言、语音信息的提取和多点发布 等功能。 1 本论文在分析了传统的语音信箱系统的结构和特点的基础上,针 对它的一些弱点和不足,提出了基于i n t e m e t 技术的网络语音信箱的 概念,并分析了它的结构特点和应用优势。然后根据这一设想,进行 了系统的分析、方案选择和课题的具体实现。本课题以w i n d o w sn t 为平台,使用m i c r o s o f ti n t e r n e ti n f o r m a t i o ns e r v e r 为w e b 服务器,采 用d e l p h i 开发了基于a c t i v e x 技术的w e b 应用程序,实现了语音信 息在浏览器里的录制、编码压缩、网络传输以及解码播放等功能。从 而验证了网络语音信箱的可行性及其在技术上的先进性和良好的扩 展性。文中详细讨论了以上相关技术的特点、机制,并解释了如何应 用它们实现系统中遇到的关键问题。 a b s t r a c t t h ea i mo fv o i c em a i l s y s t e mb a s e do ni n t e r n e t i st or e a l i z et h e r e c o r d 、p l a y b a c ka n dd i s t r i b u t i o n o fv o i c ei n f o r m a t i o nu s i n gi n t e m e t t e c h n o l o g y , w h i c ho r i g i n a l l ya c h i e v e a t t e l e p h o n en e t w o r k f i r s t ,t h es t r u c t u r ef e a t u r eo f t r a d i t i o n a lv o i c em a i ls y s t e mi si n t r o d u c e d , i na l l u s i o nt oi t sw e a k n e s s ,w e p u tf o r w a r d t h ec o n c e p to fv o i c em a i ls y s t e m a n di t sp e c u l i a r i t ya n d a d v a n t a g e t h e n ,m a k es y s t e ma n a i y s i sa n dd e s i g nf o r v o i c em a i ls y s t e m t h ep r o j e c ta p p l ym i c r o s o f ti n t e m e ts e r v e ra sw e b s e r v e rb a s e do nn tn e t w o r k o p e r a t i o ns y s t e m ,r a d t o o ld e l p h it od e v e l o p a c t i v e xc o n t r o lf o re a c hm o d u l eo ft h ev o i c em a i ls y s t e m ,s u c ha sr e c o r d 、 c o m p r e s sa n dd e c o m p r e s so f v o i c e s ow ec a nc o n c l u d et h a tt h ev o i c em a i l s y s t e m h a si t s f e a s i b i l i t y , e x p a n s i b i l i t y a n da d v a n c e d t e c h n o l o g y t h e p e r f o r m a n c ea n dm e c h a n i s mo ft h et e c h n o l o g ya p p l i e da r ed i s c u s s e da n d e x p l a i ni nd e t a i lh o w t oa p p l yt h e mt os o l v et h ek e y p r o b l e m s o f t h es y s t e m 第一章序论 第一节语音信箱的概念 语音信箱,简单地讲就是为用户提供留言及信息发布服务的通讯工 具,与电话等实时通讯工具相比,语音信箱不但能为在现场的用户提供 信息,而且能为不在现场的用户存储消息,并供其随时听取。与普通的 信件相比,它具有情感信息和表达方式的丰富性的优点,而且比较而言 更方便与快速。 目前最通用的是基于电话的语音信箱系统,这种服务通常是由一个 强大的共享计算机系统在组织层上集中提供。在现场或不在现场的用户 通过私人电话系统发送和听取消息,从而实现对中央语音邮件服务器的 信息存取,从功能上看,类似一台中央多用户答录机。 第二节语音信箱的现状 语音信箱作为一种人们相互之间交流与通讯的一种方式并不是一 种新的事物,它是随着我国通讯产业的发展而随之发展起来的。现有的 语音信箱根据其所采用的关键技术的不同,主要分为两种不同的类型: a c d ( a u t o c a l l i n gd i s t r i b u t i o n 自动电话分配) 方案和微机加语音板 卡方案。a c d 方案和微机方案的根本分歧点就在于其c t i ( 计算机语音 集成技术) 技术的实现机制。 提供a c d 方案的厂商传统上是生产程控交换机的厂商。8 0 年代以 来,交换机厂家采取了以下发展策略:在增强路由能力的基础上开放交 换机的控制接口,以标准的软、硬件格式提供c t i - l i n k ,集成成熟的语 音产品作为语音服务平台。因此,a c d 方案走的是一条基于c t i l i n k 浙江大学硕士学位论文 标准、专业通讯和计算机厂商利用各自优势分工合作的路。 与此同时,微机平台上的语音板卡以超乎寻常的速度发展起来。由 于微机的价格优势和微机平台软件开发人员的数量优势,在不到十年的 时间里,语音板卡发展了语音、传真、信令、总线等全系统产品,并形 成几个语音总线标准,在一些需求巨大的自动语音市场完成了一些成功 的应用,如自动总机、传真回复、自动声讯等。这种c t i 技术的发展是 有板卡生产厂商( 如d i a l o g i c ,n m s ) 和应用软件开发商共同推动的。 a c d 方案 这种方案主要由l u c e n t 、l i p 等国际大公司提出,其核心思想是在 专用交换机+ a c d 的基础上扩展路由和统计的功能,开发c t i - l i n k 接 口,用c t i 技术实现通讯和计算机的功能结合,再配以必要的语音和数 据库系统,以强大的通讯和计算机功能满足客户服务中心的要求。 这种方案可以在结构上清晰的区分开计算机系统和通讯系统,c t i 服务器是协调控制两者的连接设备,保证坐席和i v r ( i n t e r a c t i v ev o i c e r e s p o n s e ,交互语音应答) 可以充分利用数据资源和呼叫处理资源。 蟹里互塞具有以下一些优点:室堡璧i 亟迅系统邱盐算机系统的 墼墼蝗同毂综合了两者的功能e 备至菱箜堕垫鳇堕确l 褒成熟缒凰 际标准,如c s t a l 7 9 及c s t a l 8 0 标准。由于有明确的技术分工,有利 于各子系统的生产厂商形成规模_ 产业 丛面降低系统的综合成本。对于 各子系统,生产厂商一般都有较长的技术积累期,因而具有可靠性较高 的技术指标。但同时,a c d 方案也存在着以下一些主要问题:系统牵扯 的厂商可能较多,接口多而复杂,这对集成商的经验和组织协调能力是 一个考验。由于有众多的著名厂商参与,提供的方案和产品的功能都很 浙江大学硕士学位论文 强,同时造价也较贵。如果不能加以妥善选取,毒统蹩整堕笪鉴楚妻。 微机加语音板卡方案 这种方案以近几年发展迅速的微机语音处理技术为基础,其基本思 想是在微塾平龟蝗虞墨赞麴熊的透童熊堡卡i 完成道信接口、语音丝 一一一_ 一一一一“一 一- “ 理! 佳真处理一坐席转接篝功能,再缝金处酆的计算机网络实现各种应 理丕筮啦越 以微机网络为基础平台的呼叫处理系统的主要技术组成如下: c l i e n t s e r v e r 结构的微机网络技术 在这种系统中,呼叫处理和语音处理和语音处理的功能集中在语音 工作站中,系统的资源控制、数据库系统在服务器中实现,业务生成、 改动则由专门的应用处理工作站完成。整个系统是一个c l i e n t s e r v e r 结 构的微机网络。 语音板卡技术 语音板卡的种类包括:通信线路接1 3 卡( 数据中继卡、模拟线接i = 1 卡等) 、信令处理卡( 如七号信令卡) 、语音资源卡、传真资源卡,坐席 卡以及通用语音处理平台。 语音总线技术 语音总线使各种功能专一的语音卡连接成一个功能复杂的系统,同 时也是微机语音平台实现交换的基础。 机间扩展总线技术 限于微机的处理能力,一个语音工作站只能处理部分呼叫或实现 某项功能。要将独立的语音工作站互联成个大系统,就需要机间扩 展总线技术。 浙江大学硕士学位论文 微机方案主要由国内的开发商提出,其有如下优点:对于规模不大 的系统,系统的投资较少,建设周期相对于a c d 方案来说要短的多。 由于系统自复大部分功能是由软件控制来实现的,功能的扩展相对容易。 但同时微机方案也存在如下问题: 首先,是该系统采用专用的电话语音卡和专用的前台监控和后台 管理软件,开放性和可移植性较差。 其次,由于受电话语音卡接入数目的限制,该系统的同时接入数 目不可能很高。 再有,该系统的功能比较单一,应用范围不是很广。而且,由于 系统的大部分功能是由软件控制实现的,所以对软件开发的要求 较高。 第四,该系统使用的灵活性较差,使用上很多地方受制于程控电 话网的功能限制。 由上面两种方案的佥缉生丕整蚕出a c d 方案具有较高的技术性 、二= 二:二二0 = :一= ! 誓:二、 墅,堑型适盒星王坐蹙数庞太的太歪鱼一醋塑趣焦堡n ,堡堕n ,基孽鲶 的昂贵就成了致佥盟丛盛。亘丝熟方案则显示出了其开发快、造价低的 一二,。一。 特点。固面颦缜摆壤剖二堕,_ 。丝熟查塞墨褒堡本垡塑的? 第三节网络语音信箱的构想及所要解决的问题 网络语音信箱的设想是要通过i n t e m e t 这一媒介来实现原本在电话 系统中才有的语音信箱的功能。 基本功能 哩! 墨算音信箱的基本功能是与电话语音信箱相同的,主要包括用户 一一 的留言功能和服务器的语音信息发布功能。在电话语音信箱系统中,这 浙江大学硕士学位论文 些功能都是通过电话语音卡来实现的。那么在网络中又是通过什么方式 实现这些功能的呢? 对于用户留言功能的实现,是本方案的一个很关键 的地方,即如何利用浏览器程序来截取用户的语音信息,并将之通过一 定的协议传送到服务器。至于语音邮箱信件的通知及收取和语音信息的 发布,则有多种方案可选,一种是采取w e b 在线收听得分式,如 r e a l a u d i o 、n e t s h o w 、m p 3 a u d i o 等都是这样的;还有一种方法便是采 用语音邮件的方式来实现语音信息的发布。至于哪种方式更为合适,可 以综合考虑网络速度、带宽、以及实施成本等各方面因素来决定。 附加功能 在实现了语音信箱的基本功能的基础上,我们可以利用i n t e m e t 的 优势开发一系列的附加功能,实现许多i n t e m e t 增值服务。例如新闻传 送,信息传播,广告发布等,以实现语音信箱功能的多样化。 渐江大学硕士学位论文 第二章概念与原理 在对网络语音信箱系统进行深入谈论之前,我们先对在论文中将要 涉及的一些技术的概念及其原理作一下介绍。 第一节a c t i v e x 技术 由微软公司在1 9 9 6 年正式命名的a c t i v e x 是一项广泛的技术概念。 a c t i v e x 是以微软c o m 模型( c o m p o n e n to b j e c tm o d e l ) 为理论基础建立 起来的技术,它的前身是微软的o l e 技术,但a c t i v e x 并不能完全代表 c o m 。a c t i v e x 是一种编码( c o d i n g ) 和a p i ( a p p l i c a t i o np r o g r a mi n t e r f a c e l 的协议。今天,a c t i v e x 已成为微软公司的应用软件与工具软件的一个 重要组成部分。 a c t i v e x 和c o m a c t i v e x 和c o m 的关系可以简单地解释如下:a c t i v e x 乃是建立在 c o m 的基础上的,以精简后的o l e ,加上重要的网络支持,然后让o l e 控件随时保持动态( a c t i v e ) 以处理信息。这个方式与o l e 链接嵌入文 档有所不同,因为链接嵌入文档仍得要得到一定的事件触发后才可启 动。 o l e 开发于1 9 9 0 年初,其发展的重点在于提供复合文档的处理, 也就是说文字处理器可以方便地将电子表格嵌入( e m b e d ) 或者链接 ( l i n k ) 在文字处理器的文档里做编辑工作,o l e ( o b j e c tl i n k i n ga n d e m b e d d i n g ) 的名称是由此而来,其所有的发展都是根植于c o m ( c o m p o n e n to b j e c tm o d e l ) 技术的。c o m ,o l e 和a c t i v e x 的关系如 浙江大学硕士学位论文 下图所示: c o m ,o l e 和a c t i v e x 的关系 简单地来谚量酸奏羞丝盟叁塑楚! 坠的元鲑熬仕技术。通常,c o m 一 和d i s t r i b u t e dc o m 常被混着使用,c o m 对象特别的地方在于它使用界 面( i n t e r f a c e ) 的方式把对象要提供的方法( m e t h o d ) 依照功能的不同, 集群起来分门别类。i n t e r f a c e 在对象里提供专门的几种服务( m e t h o d ) , 界面不属于对象也不是类,但它可提供类似多重继承( m u l t i p l e i n h e r i t a n c e ) 的使用方式,一个c o m 对象可以提供多种界面做不同的服 务,所有的界面都继承自鼻祖界面i u n k n o w n 。 c o m 对象的界面使用如下图所示。i u n k n o w n 为最根本的界面,每 一个c o m 对象都要有此界面或延伸的界砸以便其它对象可以询问和要 求服务,它必须要包含三个简单的方法,q u e r y i n t e r f a c e ( ) ,a d d r e f ( ) 和r e l e a s e ( ) 。 浙江大学硕士学位论文 c o m 对象的界面使用 q u e r y i n t e r f a c e 的功能有如问询处或查号台,如果你想知道c o m 对 象到底可以做哪些服务,你可以通过其i u n k n o w n 界面里的 q u e r y i n t e r f a c e ( ) 来询问它是否提供某项服务,根据服务的项目,进而 取得该界面,通过该界面你可以做不同的工作。如果o l e 对象分属不 同的执行过程( p r o c e s s ) 时,由于不同的过程可能会跨越平台机型,传 递数据就得费点周折了,包装和拆封数据的处理过程就叫m a r s h a l l i n g 和u n - m a r s h a l l i n g 。 所以,对于c o m 、o l e 和a c t i v e x 的关系,我们可以总结如下: c o m 制定对象的存储表示( r e p r e s e n t a t i o n ) 和操作( o p e r a t i o n ) 的方式:它们是a c t i v e x 技术的基本结构,其设计目的在于解决不同系 统、语言之间对象交互操作的问题。o l e 提供对象间交互的主从 ( c l i e n t - s e r v e r ) 结构:自动化、交互操作及控制元件,所有的功能都 建立在c o m 的基础上。a c t i v e x 提供网络层次的三项支持:加强自动 化的脚本撰写、轻巧的控件、以及复合文档。当然,它的根基是深植在 c o m 和o l e 的基础上的。 a c t i v e x 的优点 a c t i v e x 不但能够在互联网的网页上使用,更可以应用在各种各样 的程序语言里,当然,这些程序都是在微软的视窗之下运行的。a c t i v e x 的控件就像音响的组件( c o m p o n e n t ) ,可以依用户的需要和偏好拼装而 成,图表、电子表格、动画等元件,都可轻易地应用在网页上,a c t i v e x 就是要让你的网页“动”起来,a e t i v e x 让元件软件( c o m p o n e n t w a r e ) 的梦想在网络时代成为现实。 元件软件让设计师以组装元件的方式来开发应用程序,而这些在开 放式的网络环境中操作的a c t i v e x 元件,不会局限于特定的语言和工具, 而且容易组装、扩展,并可重复使用。a c t i v e x 元件又可以分为两种: 专用性元件和通用性元件。专用性元件( d o m a i nc o m p o n e n t ) ,主要是 结合各领域的专业元件,如金融、制造、旅游业等。通用性元件( c o m m o n c o m p o n e n t ) ,主要是技术方面、环境方面的功能元件,如数据库 ( d a m b a s e ) 、用户界面( u s e ri n t e r f a c e ) 、电子表格( s p r e a d s h e e t ) 、i n t e r n e t 、 工作流程( w o r k f l o w ) 等元件。 未来的互联网将与个人电脑的运行将完全结合成体,网络信息与 本机的信息将可以畅通无阻,而网页元件的内容更是包容万象,便捷多 样的开发工具也逐渐成熟,目前的v i s u a lb a s i c 、d e l p h i 等开发工具,都 已略具有元件组装工具的雏形。a c t i v e x 与相关的语言和工具的关系可 以用下图来表示: 浙江大学硕士学位论文 a c t i v e x 与相关的语言和工具的关系 第二节i n t e m e t 与w e b 技术 i n t e m e t 最初是针对美国国防目的而建立的,承建者是美国国防部的 “高级研究项目机构”( 即a r p a ) ,建设时间从6 0 年代末到7 0 年代初。 a r p a n e t ( 即阿帕网) 最开始的用途是连接国防建设承包商、军队机关以 及各科研机构,从而方便科学研究与信息交换。到了8 0 年代,美国“国 家科学基金会”f n s f ) 对阿帕网进行了扩展,并建了一个网络( n f s n e t ) , 用以连接各个超级计算中心、大学以及研究中心。就在这段时间里面, 世界上的许多大学、研究中心以及其他许多机构都纷纷连入n s f n e t 。这 时,我们后来所知的i n t e r n e t 也就初具规模了。在i n t e r n e t 发展的这个阶 段,i n t e m e t 主要用于信息交换、教育和科学研究。所有信息是用通信 协议交换的,比如t e l n e t ,f t p 和n n t p 等等。这些协议对于文本或二进 浙江大学硕士学位论文 制文件的传输以及命令行输入来说无疑是比较适合的。 n s f n e t 最初使用的是5 6 k b p s 的专用电话线。1 9 8 8 年,他们对网络 主干线进行改造,将其升级成t 1 线( 1 5 m b p s ) 。到了1 9 9 2 年,网络已升 级成了t 3 线( 4 5 m b p s ) 。 w e b 的诞生 w o r l dw i d ew e b 的基础结构是在9 0 年代初期开发成功的,开发者 是瑞士日内瓦“欧洲粒子物理实验室”( c e r n ) 的t i mb e r n e r s l e e 以及 他的同事们。刚开始的时候,w e b 只是作为向超文本文档提供服务的一 种途径,并在基于t c p f l p 的客户机服务器网络内提供资源共享服务。 文档最初是用一个基于文本的命令行浏览器进行观察的。h t m l 是一种 页面描述语言,用于显示信息和创建超文本链接;而h t t p 则是用于连 接电脑与w o r l dw i d ew e b 的种通信协议。 1 9 9 3 年2 月,美国“国家超级计算应用中心”( n c s a ) 针对u n i x 系 统发行了一个免费的图形浏览器,叫做m o s a i c 。m o s a i c 是集成了图形 用户界面( g u i ,例如m a c i n t o s h 电脑和x w i n d o w s 界面) 部分标准元 素的第一例w e b 浏览器。除此以外,m o s a i c 还提供了在w e b 页内直接 观察图形的功能。它同时还通过客户端电脑内的应用程序( 即“助手应 用程序”) 提供了对其他媒体类型的支持,比如数字声音文件和动画等 等。刚开始发行m o s a i c 的时候,整个w o r l dw i d ew 曲内大约只有5 0 台w e b 服务器可供浏览游历完所有服务器仅需几个小时。 到1 9 9 3 年后期,m o s a i c 已经有了自己的m a c i n t o s h 和w i n d o w s 版 本。就在那一年会要结束的时候,世界上的w 曲服务器总数已达到了几 百台。图形化浏览器( 比如m o s a i c ) 的多媒体能力是让w e b 逐渐流行 浙江大学硕士学位论文 起来的重要因素之一。 i n t e m e t 进人高速发展阶段 19 9 5 年,n e t s c a p e 公司的w 曲浏览器_ n a v i g a t o r 一成为w e b 上最 流行的一种浏览器。n e t s c a p e 对h t m l 这种基本的w e b 页面描述语言 进行了大量扩展工作。n e t s c a p en a v i g a t o r 的最新版本对多媒体数据类型 提供了非常完美的支持,如下所示: 嵌入a p p l eq u i c k t i m e 电影和数字影像的内建支持。 数字声音。 三维的虚拟现实环境。 n e t s c a p e 可扩展的插入式结构允许针对其他多媒体数据类型( 比如 m a c r o m e d i ad i r e c t o r 文件和a d o b ea c r o b a t 数字化文档) 创建嵌入式播 放器。 1 9 9 6 年,微软用i n t e m e te x p l o r e r 这块敲门砖打开了浏览器市场。 微软同时还发布了它自己的多媒体插件技术,命名为a c t i v e x 。该技术 以微软的o l e ( 对象链接与嵌入) 为基础。时至今日,i n t e r n e te x p l o r e r 已 经发展到5 0 版本,同时凭借其优秀的性能及与w i n d o w s 平台的完美结 合,市场份额已经超过n e t s c a p en a v i g a t o r 成为浏览器市场的领头羊。 最近,各大企业、机构和组织逐渐开始将w e b 浏览器当作自己单位 范围内信息系统的一种前端使用。这些信息系统由单位内部以t c p i p 为基础的局域网w e b 服务器进行控制。我们把这种类型的网络叫做“内 部网”或“内联网”,也就是我们常说的“i n t r a n e t ”。在内部网里面,带 宽要比i n t e m e t 高得多。因此,以w e b 为基础的多媒体应用程序在内部 网中有着良好的发展前途。 浙江大学硕士学位论文 第三节多媒体电子邮件技术 多媒体电子邮件 多媒体电子邮件,简称为多媒体邮件,是电子邮件的最为综合的形 式。电子邮件是一种工具,通过这种工具,用户可以对计算机信息进行 合并、交换、阅读、存储、检索和处理。这些信息均被表示为数字形式 并能被计算机处理。因此。电子邮件恰好类似于邮政邮件,其中的信息 可以看成为邮政中的书信等邮件。电子邮件信箱类似于住户的信筒,以 电子邮件信箱为基础的电子邮件网络等同于由邮局、分拣中心、公路、 铁路、飞行航线等构成的邮政网络。但是,由于其中传送的信息是电子 信息,因此,还有许多额外的功能可以使用。 多媒体电子邮件是由最初文本形式的电子邮件发展而来的,电子文 本邮件是一种工具,通过它,用户可以交换计算机普通文本。普通文本 是基本的未格式化的计算机格式,丰富文本( r i c h t e x t ) 是类似于印刷 出来的报纸那样的更为复杂的格式。电子文本邮件是7 0 年代中期出现 的,并且在1 0 多年内,普通文本一直是电子邮件的唯一可以使用的格 式。而多媒体信息是包括音频或和视频在内的任何一种复合信息类型。 也就是说,多媒体信息至少包含音频或视频的一部分。并混合有任何的 其他信息类型。由于被称为m i m e 的i n t e m e t 多媒体邮件标准的迅速采 用,多媒体邮件已在1 9 9 2 年出现了。但是受制于网络带宽的限制,多 媒体邮件的发展一直处于缓慢发展的状态。 当然我们在这里要讨论的主要是语音信息形式的多媒体电子邮件, 由于网络条件的限制,视频形式的邮件在现阶段还不能大面积普及。我 们知道,数字化语音比数字化文本需要占用更多的存储空间,一个声音 邮件所需要的存储容量是等容量的同类型文本消息的所需存储容量的 。一一v - 一一一4 一。一一一“ , 浙江大学硕士学位论文 ! q q 垒堡! 所以,用户的语音信箱一般存储在本地的服务器系统中,这 些服务器系统能为若干台式计算机或者一个节点上的所有计算机提供 服务。 当然,声音与文本比较起来,其主要优点就是情感信息和表达方式 的丰富性。另外一个显著的优点是可以为那些发送消息的人节省时间一 一大部分人说话比敲键盘要快。 当然,电子语音邮件也有它的缺陷。首先,一个文本邮件可以被打 印出来或合并成一个只有正文的文档。其次,读比听的速度要快。正常 情况下,成人的阅读速度大约为每分钟2 5 0 个单词,而且通过快速阅读 训i 练,这个速度可以很容易地翻倍。相比之下,英语正常说话速度仅为 每分钟1 8 0 个单词。 总而言之,作为对于文本形式的信息的一种额外补充,语音信息无 疑是一种有效而可行的办法。 第四节数据压缩技术 文章前面已经提到,语音信息相对于文本信息要大的多,所以我们 就必须想办法来对语音信息进行压缩,以适合在网络上的传输。数据压 缩技术主要分为两大类:平均信息量编码和源编码。 王均信息量编码 垩塑焦息量编码是一种泛指那些不考虑被压缩信息的性质的编码 一_ 二一一 和压缩技术( 如下图所示) 。 浙江大学硕士学位论文 黼一黼h 一卜黼 i 。一【,一 平均信息量编码和解码 它是基于平均信息量的技术把所有的数据当作比特序列,而不根据 压缩信息的类型优化压缩。也就是说,平均信息量编码忽略被压缩信息 的语义。 举一个简单的例子,例如将一组全为0 的1 0 个连续的8 位字节用 一个特殊的字符后跟数字l o 取代,这就是平均信息量编码技术。这样 做时,并没有对这一组。值的含义作假设。毛均信息量编码媳= 企重要 的挂蛙星;垩均信息量编码是玉摁耗压缩。平均信息量编码技术分两大 类:迫圭重复度夏4 三一堡过绫璺 源编码 相反地,在源编码中,所做的变换取决于初始信号的类型。例如, 一个音频信号有某种特性可在压缩中加以利用。在语言中,消去沉默声 就是严格根据信号的语义进行变换的范例。类似地,查找一个视频流的 两个连续帧之间的公用块也是一个依赖信号本身特性的操作。 源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主 要取决于数据的语义,比起用平均信息量编码,它的比例变化更大。同 时:源编码既可在无损模式下也可在有损模式下操作。 源编码技术大致分为3 类:转换编码、差分编码、向量量化。 垩塑建璺墨缔曼和源编码著非是互卮。的捷术! 一塞际j ;i 褒声壹、图 像彗垦动迥题的压缩中,常将这两个技术结合起来以达到最高可能的压 缩率, 颧江大学硕士学位论文 逍圭重复度到 消去重复序列是我们讨论的平均信息量编码方法的一种。它是计算 中使用的最简单、最古老的压缩技术之一( 如下图所示) 。它包括检测重 复的比特或8 位字节的序列,并用它们的出现次数取而代之。事实上该 方法有两大格式:消0 或空白和行程编码。 零( 藏空白) 消除 i , lz lw n s i 假设只有一个字符频繁出现 行程编码 任何重复出现四次或四次 i 一1 1 - 1 i :】1 1i i 1 i 1 1 1 曩 以上的字符由。该字符+ 记号( h ) + 重复次数” 代替l ! - :l l u 上j 重复序列压缩实例 雹彗窒自笪道险 该格式算法假设事先只知道一个字符或8 位字节多次重复出现。该 字符常常是数字中的0 或文本数据中的空白。因此,将用一个称作标 识符的特殊符号来代替这一系列连续的几个空白或0 ,后跟数n 。 征垄绚碍 在此格式中,任何重复的字符序列可被个短格式取代。因此,该 算法适用于任何重复的字符。一组n 个连续的字符c 将被c 和一个特 殊的字符取代。当然,若给定字符仅重复两次就不要用此方法。实际上, 仅在重复次数大于等于4 次时才进行取代。行程编码有多种方式,这 里所讲的是最简单的一种。 统计编码 _ _ _ _ _ - 一 统计编码也是一种平均信息量编码技术。虽然它不如序列消除法用 的多,但也是计算机中常用的一项技术。 统计编码是识别一个给定的流中出现频率最高的比特或字节模式。 并用比原始比特更少的比特来对其编码。即就是,频率越低的模式其 编码的位数越多,频率越高的模式编码位数越少。其思想是:统计编 塑主:型些堑墓! 垡圭芷堡墓堡童绁堂垫盟塑奎堂踅重编码t 高频模式 - - _ - - _ _ _ - - _ _ _ _ - _ - _ _ 。_ - _ _ - _ _ _ _ _ _ - - _ - - l _ - - - _ _ - 4 4 一 。 使用短编码。 当然,该方法暗示了模式的重编码,在编码和译码端都可得到初始 模式和新码的对应表。称作代码簿。依据采用的技术和编码的数据类型 进行相应的程序化的动态统计。在某些情况下,模式频率和编码分配的 标志值为先验值。因此,对模式出现的频率不必每编码一个新信息条就 计算一次。 莫尔斯字母表就是使用预定义代码簿进行统计编码的例子。 统计编码方法可分为两大类:模式替换和哈夫曼编码。 模式替换 该方法用于文本信息的编码。对多次出现的字符,即常见词用一个 单字替代。例如,我们可以用模式替换的方法:将出现“m u l t i m e d i a , 的地方用“m ”替代,“n e t w o r k ”用“n ”替换。 浙江大学硕士学位论文 睑塞星麴銎 该编码是常见的一种统计编码。对给定的数据流,计算其每个字节 的出现频率。根据频率表,运用哈夫曼算法可确定分配各字符的最小位 数,然后给出一个最优的编码。代码字存入代码簿。 哈夫曼编码适用于压缩静态和动态图像。根据参数,可对几个或一 组图像构造出一个新的代码簿。在运动图像中。可重新计算一个或一系 列帧的代码簿。在所有情况下,都必须将代码簿从源端传到目标端才能 进行译码。 变换编码 变换编码是一种源编码方法。源编码要考虑被压缩信号的性质,特 别是它有赖于音频、静态图像和动态图像的特征( 如下图所示) 。 空问或时间域 频率域 变换编码的原理 变换编码的原理如下: 在变换编码时,初始数据要从初始空间或时间域进行数学变换,变 换为一个更适于压缩的抽象域。该过程是可逆的,即使用反变换可恢复 原始数据。 也就是说,任何函数都通过数学变换形成另一个域的变量和数值。 著名的傅里叶变换就是这种变换的一个范例。例如,一个随时间变化的 量f 【t ) 可通过傅里叶变换形成一个函数g ( y ) 。新函数中有一个含有原函 渐江大学硕士学位论文 数的频率人的振幅g ( 我们称为系数) ,g ( 人) 是聃的光谱分布。关键一点 是:在图像的光谱表示中,频率描述了颜色和亮度变换的快慢。 数学家们已构造了多种数学变换。除了傅里叶变换外,还有余弦、 h a d a m a r 、h a a r 、k a r h u n c nl o e v e 变换。 变换编码法中要选择一个最佳的变换,以便对特定数据实现最优的 压缩。此处就要考虑数据的性质。其思想是:经过变换后,信息中最重 要的部分( 换句话,就是包含最大“能量”的最重要的系数) 易于识别, 并可能成组出现。当成组时,我们也说信息能量被封装了。标识最重要 的系数有什么意义呢? 最重要的系数在变换成频率域后,其编码的精确 度比次重要的系数要高。某些系数也可能被忽略。 上述变换本身是可逆的,因而其也是一种无损技术。然而,为了取 得更满意的结果,某些系数的编码位数较其他的要多,某些系数干脆就 忽略掉了。这样,该过程就成了有损的了。变换编码特别适合于图像的 压缩。常用的数学变换是离散余弦变换( d c t ) 。 差分或预测编码 差分编码( 也称预测编码) 也是属于源编码的范畴。 其原理如下( 如下图所示) : 韧始信号差分蝙码的信号 馘tl-ll-iiiil 时问 差分编码的原理 浙江大学硕士学位论文 仅对样本的实际值和预测值的差值进行编码。预测值和实际值的差 值称为预测误差或误差项。实际中由于预测值的确定方法不同,各种预 测技术也就有所差别。差分编码特别适于其连续值与零值差别很大而彼 此之间差异不大的信号。因此,差分编码非常适于运动图像信号( 它仅传 送图像的差异) 或音频信号。 差分编码技术有3 大类:d p c m 、6 调制和a d p c m ,分别如下图 所示: 1 简单o p c h 预测值= 最后的采样值 2 6 调制 用i 比特进行差分编码 3 自适应编码( d p c m ) 预测值由前面的值外推 所得,有预测函数 信号 差分犏码信号 三种类型的差分编码技术 简单的差分脉码调制 差分脉码调制( d p c m ) 是一种用函数来确定其预测值、预测过程与 时间无关的方案。其最简单的情况是在时刻t 传送样本在此刻的值( 真实 值) 和样本在时刻t 十1 ( 预测值) 问的差值。即就是,该技术将前面的样 l 。l 。畦 一ll上一il上 j|士1上 一山 一山 i | i 兰址虹缸缸 浙江大学硕士学位论文 本值做为预测值。 6 调制 6 调制是d p c m 编码的一种特殊形式。关键是它采用一种特殊的方 法对样本实际值与预测值的差值进行编码。在8 调制中,样本的预测值 和当前值的差量用一个比特进行编码。因此,差分信号是二进制数,它 或者是指“信号值增加了一个量程”或者指“减少一个量程。” 6 调制适于编码信号值在给定采样率变化不大的信号的编码。我们 也可以说它适于低频信号。 自适应差分脉码调制 自适应差分脉码调目6 1 ( a d p c m ) 是d p c m 的一种高级版本。 在a d p c m 中,预测函数随样本的信号短期特征而变化,而非个 固定的预测函数。因此,要用到一个自适应外推法。就象d p c m 一样, 传送的是预测值与真实值的差值。我们将会看到在实际传送或存储前, 要先进行量化。 向量量化 向量量化可能是最有前景的一种方法( 如下面两个图所示) 。 原始鼓据藏代码慧压缩的数据流 卜百葡赢鬲f 、卜赫寻一 一e 三主三 向量量化编码的原理 浙江大学硕士学位论文 带误差项传送的向量量化编码的原理 向量量化是模式变换的个特例。其原理大致如下: 将实际流分成向量块。例如,对一个图像进行向量量化时,向量 常常是一个小长方形或正方形的象素。假设所有的向量的大小相 同,都为v 个字节。 在编码和译码端都有个称为代码簿的表,它是模式的集合,每 个模式为8 位字节。该代码簿可预定义也可动态构造。 各向量可参考代码簿选择最佳匹配模式。 一旦找到最佳匹配模式就将代码簿中的对应条目进行传送。 因此,向量量化的原理可归结如下: 比特流被划分为向量。它不传送实际数据,而是传送代码簿中查到 的最佳匹配模式对应的索引。如果出现实际值与模式根本不匹配那样的 话,在接收端就会出现失真现象。为了对此进行补救,该技术要计算一 下实际值和模式的差分。然后将该差分与模式的参数一起传送。参数编 码可自身进行量化。因此,根据传送是否有差分以及差分为多大,向量 量化可能是无损的或是有损的压缩模式。 向量量化特别适合于对那些数据类型已知的且可构造出与实际值 浙江大学硕士学位论文 t 坌堡垄箜垡茎塞墼绝跫:回量量垡垄茎垩王亟童缔啦忿垄錾垫塾垄 - _ _ _ _ _ i _ _ _ o 。- o _ _ _ - 。_ _ _ _ - - _ ,- - _ _ _ - - 。o 。一一_ - 。、j , 向量量化的一个特例。 分形压缩 分形几何是b m a n d e l b r o t 发明的,在其著名的自然界的分形几 何一书中,他对该原理做了阐述。其思想是:传统的绘制直线和圆的 几何与自然界的几何形状不相象。可用一种称为分形的几何来描述自然 界,它在不同地点,不同范围和不同角度下重复出现各种不规则的变化。 可用所谓的分形的变换对同一分形的不同出现分别进行刻画。 寻找分形 在成像过程中,很早就运用分形变换来生成图像。相应地,分形编 码包括在现有的数字化图像中寻找分形。图像被分成小方形区域,每个 方块与同一图像的其他部分相比较。由于一个方块与另一方块完全匹配 的可能性极小,因此,实际上它是与另一部分( 即翻译、收缩、倾斜、旋 转或镜象部分) 的修改版相比较。最佳匹配图像部分是我们初始方块的分 形。对每个方形区域都重复进行该过程。 编码分形变换 找到的分形只有进行变换才能与初始方块匹配,该变换可用编码后 的公式表示,称为分形变换码。这些公式在译码阶段用来重构图像,编 码后的公式集合比原图像更紧凑。该技术常称为分形变换。 浙江大学硕士学位论文 虚拟代码簿 虽然数学背景不同,但本质上它与向量量化的原理相似。实际中, 在分形变换中,变换码存储在所谓的虚拟代码簿中,它与在向量量化不 同,其图像是相互独立的。尽管对每个图像都是专门性的,但是代码簿 不需要从编码端向译码端进行传送。代码簿之所以称为虚拟的是因为它 在迭代过程中在译码端产生。 分形变换的实现 分形几何专家声称对图像应用迭代分形系统能获得1 0 0 0 :1 的压缩 率。另外一些专家对此提出异议,因为它还尚未得到证明。但有一点是 无争议的:在坌翌兰鳖i 啦缠塑逝堑笪塑登些堡塑奎箜垒: 事实上,对多数压缩方案来说,压缩过程远比解压缩过程要复杂。 因此,压缩通常要求更高的功率。压缩过程需要比解压缩过程更高功率 的算法,即非对称的算法,它们非常适合于异步应用。信息在访问或传 送之前已就绪,因此,非对称压缩特别适合于要求视频的应用中运动图 像的存储或诸如c d - - r o m 等一些离散存储设备上生成多媒体。 向量量化是一个典型的非对称方法:解压缩极快,它包括对表的直 接寻址以及利用向量差找到正确的值。其中最不对称的压缩方法实际上 就是我们已用过的量化的特殊形式,也就是所谓的分形变换。 真实信息( 如声音或运动图像流) 的传送要求较对称的压缩方法。 并且,所有交互式应用中都不能容忍过多的压缩延迟。因此现场传送, 诸如视频会议中,一般比重放传送的压缩流要少。 综上所述,我们曼坚知道,共有两种可能的压缩模式:无损耗压缩 -_。一一一“一1_-_-_-”,柙,一” 浙江大学硕士学位论文 ( 基里缉塑堡里缩塾堡鐾堡复匾绉塑塑! 塑查塑堑匡缝l 墓匿绾麴运董 _ _ _ _ _ - - _ - - ,- _ _ - _ _ - _ - _ - _ _ - _ h - _ 一 原始数据不完全相同) 。而压缩方法可分为两大耋;垩均信息量编码( 它 :至耋虑垦缰塑塑盟耋型2 j 翌i 匾编塑! 宣垫鉴塑塑堡笪蚤竖丛丝匿缉玉 大多数算法的压缩比解压缩阶段所耗的功率要高。这是由于压缩的声音 - 、,- 一 或图像的塾主要重旦笪垦丕型整篡法。但是理场焦遂剪銮互式应且则 ,- _ _ h 一 一 垂塞焦过整笪笺法,县签型士适童焦星塑廷缝壅递:星墨簦型壹堕量盟 回放效果就可以了,所以无论述有损压缩还是无损压缩都是可以接受 的。 浙江大学硕士学位论文 第三章系统的总体设计方案 在对文章中涉及的概念及原理作了介绍后,接下来我们就要开始对 网络语音信箱系统进行平台的搭建和系统的设计。 第节服务器平台的选择 目前可以选择的服务器操作系统有0 s 2 、u n i x 、l i n u x 以及w i n d o w s n t 等。作为w e b 服务器的平台,我们需要综合考虑操作系统的可靠性, 易用性,可维护性以及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论