（光学工程专业论文）网络语音信箱技术的研究.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-09 格式：PDF 页数：65 大小：1.70MB 积分：0 举报 版权申诉

已阅读5页，还剩60页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

浙江大学硕士学位论文摘要声3 ； 9 6 8 。摘要， 0 网络语音信箱的设想就是通过i n t e m e t 这一媒介来实现原本在程控电话系统中才具有的，包括用户留言、语音信息的提取和多点发布等功能。 1 本论文在分析了传统的语音信箱系统的结构和特点的基础上，针对它的一些弱点和不足，提出了基于i n t e m e t 技术的网络语音信箱的概念，并分析了它的结构特点和应用优势。然后根据这一设想，进行了系统的分析、方案选择和课题的具体实现。本课题以w i n d o w sn t 为平台，使用m i c r o s o f ti n t e r n e ti n f o r m a t i o ns e r v e r 为w e b 服务器，采用d e l p h i 开发了基于a c t i v e x 技术的w e b 应用程序，实现了语音信息在浏览器里的录制、编码压缩、网络传输以及解码播放等功能。从而验证了网络语音信箱的可行性及其在技术上的先进性和良好的扩展性。文中详细讨论了以上相关技术的特点、机制，并解释了如何应用它们实现系统中遇到的关键问题。 a b s t r a c t t h ea i mo fv o i c em a i l s y s t e mb a s e do ni n t e r n e t i st or e a l i z et h e r e c o r d 、p l a y b a c ka n dd i s t r i b u t i o n o fv o i c ei n f o r m a t i o nu s i n gi n t e m e t t e c h n o l o g y , w h i c ho r i g i n a l l ya c h i e v e a t t e l e p h o n en e t w o r k f i r s t ，t h es t r u c t u r ef e a t u r eo f t r a d i t i o n a lv o i c em a i ls y s t e mi si n t r o d u c e d , i na l l u s i o nt oi t sw e a k n e s s ，w e p u tf o r w a r d t h ec o n c e p to fv o i c em a i ls y s t e m a n di t sp e c u l i a r i t ya n d a d v a n t a g e t h e n ，m a k es y s t e ma n a i y s i sa n dd e s i g nf o r v o i c em a i ls y s t e m t h ep r o j e c ta p p l ym i c r o s o f ti n t e m e ts e r v e ra sw e b s e r v e rb a s e do nn tn e t w o r k o p e r a t i o ns y s t e m ，r a d t o o ld e l p h it od e v e l o p a c t i v e xc o n t r o lf o re a c hm o d u l eo ft h ev o i c em a i ls y s t e m ，s u c ha sr e c o r d 、 c o m p r e s sa n dd e c o m p r e s so f v o i c e s ow ec a nc o n c l u d et h a tt h ev o i c em a i l s y s t e m h a si t s f e a s i b i l i t y , e x p a n s i b i l i t y a n da d v a n c e d t e c h n o l o g y t h e p e r f o r m a n c ea n dm e c h a n i s mo ft h et e c h n o l o g ya p p l i e da r ed i s c u s s e da n d e x p l a i ni nd e t a i lh o w t oa p p l yt h e mt os o l v et h ek e y p r o b l e m s o f t h es y s t e m 第一章序论第一节语音信箱的概念语音信箱，简单地讲就是为用户提供留言及信息发布服务的通讯工具，与电话等实时通讯工具相比，语音信箱不但能为在现场的用户提供信息，而且能为不在现场的用户存储消息，并供其随时听取。与普通的信件相比，它具有情感信息和表达方式的丰富性的优点，而且比较而言更方便与快速。目前最通用的是基于电话的语音信箱系统，这种服务通常是由一个强大的共享计算机系统在组织层上集中提供。在现场或不在现场的用户通过私人电话系统发送和听取消息，从而实现对中央语音邮件服务器的信息存取，从功能上看，类似一台中央多用户答录机。第二节语音信箱的现状语音信箱作为一种人们相互之间交流与通讯的一种方式并不是一种新的事物，它是随着我国通讯产业的发展而随之发展起来的。现有的语音信箱根据其所采用的关键技术的不同，主要分为两种不同的类型： a c d ( a u t o c a l l i n gd i s t r i b u t i o n 自动电话分配) 方案和微机加语音板卡方案。a c d 方案和微机方案的根本分歧点就在于其c t i ( 计算机语音集成技术) 技术的实现机制。提供a c d 方案的厂商传统上是生产程控交换机的厂商。8 0 年代以来，交换机厂家采取了以下发展策略：在增强路由能力的基础上开放交换机的控制接口，以标准的软、硬件格式提供c t i - l i n k ，集成成熟的语音产品作为语音服务平台。因此，a c d 方案走的是一条基于c t i l i n k 浙江大学硕士学位论文标准、专业通讯和计算机厂商利用各自优势分工合作的路。与此同时，微机平台上的语音板卡以超乎寻常的速度发展起来。由于微机的价格优势和微机平台软件开发人员的数量优势，在不到十年的时间里，语音板卡发展了语音、传真、信令、总线等全系统产品，并形成几个语音总线标准，在一些需求巨大的自动语音市场完成了一些成功的应用，如自动总机、传真回复、自动声讯等。这种c t i 技术的发展是有板卡生产厂商( 如d i a l o g i c ，n m s ) 和应用软件开发商共同推动的。 a c d 方案这种方案主要由l u c e n t 、l i p 等国际大公司提出，其核心思想是在专用交换机+ a c d 的基础上扩展路由和统计的功能，开发c t i - l i n k 接口，用c t i 技术实现通讯和计算机的功能结合，再配以必要的语音和数据库系统，以强大的通讯和计算机功能满足客户服务中心的要求。这种方案可以在结构上清晰的区分开计算机系统和通讯系统，c t i 服务器是协调控制两者的连接设备，保证坐席和i v r ( i n t e r a c t i v ev o i c e r e s p o n s e ，交互语音应答) 可以充分利用数据资源和呼叫处理资源。蟹里互塞具有以下一些优点：室堡璧i 亟迅系统邱盐算机系统的墼墼蝗同毂综合了两者的功能e 备至菱箜堕垫鳇堕确l 褒成熟缒凰际标准，如c s t a l 7 9 及c s t a l 8 0 标准。由于有明确的技术分工，有利于各子系统的生产厂商形成规模_ 产业丛面降低系统的综合成本。对于各子系统，生产厂商一般都有较长的技术积累期，因而具有可靠性较高的技术指标。但同时，a c d 方案也存在着以下一些主要问题：系统牵扯的厂商可能较多，接口多而复杂，这对集成商的经验和组织协调能力是一个考验。由于有众多的著名厂商参与，提供的方案和产品的功能都很浙江大学硕士学位论文强，同时造价也较贵。如果不能加以妥善选取，毒统蹩整堕笪鉴楚妻。微机加语音板卡方案这种方案以近几年发展迅速的微机语音处理技术为基础，其基本思想是在微塾平龟蝗虞墨赞麴熊的透童熊堡卡i 完成道信接口、语音丝一一一_ 一一一一“一一- “ 理! 佳真处理一坐席转接篝功能，再缝金处酆的计算机网络实现各种应理丕筮啦越以微机网络为基础平台的呼叫处理系统的主要技术组成如下： c l i e n t s e r v e r 结构的微机网络技术在这种系统中，呼叫处理和语音处理和语音处理的功能集中在语音工作站中，系统的资源控制、数据库系统在服务器中实现，业务生成、改动则由专门的应用处理工作站完成。整个系统是一个c l i e n t s e r v e r 结构的微机网络。语音板卡技术语音板卡的种类包括：通信线路接1 3 卡( 数据中继卡、模拟线接i = 1 卡等) 、信令处理卡( 如七号信令卡) 、语音资源卡、传真资源卡，坐席卡以及通用语音处理平台。语音总线技术语音总线使各种功能专一的语音卡连接成一个功能复杂的系统，同时也是微机语音平台实现交换的基础。机间扩展总线技术限于微机的处理能力，一个语音工作站只能处理部分呼叫或实现某项功能。要将独立的语音工作站互联成个大系统，就需要机间扩展总线技术。浙江大学硕士学位论文微机方案主要由国内的开发商提出，其有如下优点：对于规模不大的系统，系统的投资较少，建设周期相对于a c d 方案来说要短的多。由于系统自复大部分功能是由软件控制来实现的，功能的扩展相对容易。但同时微机方案也存在如下问题：首先，是该系统采用专用的电话语音卡和专用的前台监控和后台管理软件，开放性和可移植性较差。其次，由于受电话语音卡接入数目的限制，该系统的同时接入数目不可能很高。再有，该系统的功能比较单一，应用范围不是很广。而且，由于系统的大部分功能是由软件控制实现的，所以对软件开发的要求较高。第四，该系统使用的灵活性较差，使用上很多地方受制于程控电话网的功能限制。由上面两种方案的佥缉生丕整蚕出a c d 方案具有较高的技术性、二= 二：二二0 = ：一= ! 誓：二、墅，堑型适盒星王坐蹙数庞太的太歪鱼一醋塑趣焦堡n ，堡堕n ，基孽鲶的昂贵就成了致佥盟丛盛。亘丝熟方案则显示出了其开发快、造价低的一二，。一。特点。固面颦缜摆壤剖二堕，_ 。丝熟查塞墨褒堡本垡塑的? 第三节网络语音信箱的构想及所要解决的问题网络语音信箱的设想是要通过i n t e m e t 这一媒介来实现原本在电话系统中才有的语音信箱的功能。基本功能哩! 墨算音信箱的基本功能是与电话语音信箱相同的，主要包括用户一一的留言功能和服务器的语音信息发布功能。在电话语音信箱系统中，这浙江大学硕士学位论文些功能都是通过电话语音卡来实现的。那么在网络中又是通过什么方式实现这些功能的呢? 对于用户留言功能的实现，是本方案的一个很关键的地方，即如何利用浏览器程序来截取用户的语音信息，并将之通过一定的协议传送到服务器。至于语音邮箱信件的通知及收取和语音信息的发布，则有多种方案可选，一种是采取w e b 在线收听得分式，如 r e a l a u d i o 、n e t s h o w 、m p 3 a u d i o 等都是这样的；还有一种方法便是采用语音邮件的方式来实现语音信息的发布。至于哪种方式更为合适，可以综合考虑网络速度、带宽、以及实施成本等各方面因素来决定。附加功能在实现了语音信箱的基本功能的基础上，我们可以利用i n t e m e t 的优势开发一系列的附加功能，实现许多i n t e m e t 增值服务。例如新闻传送，信息传播，广告发布等，以实现语音信箱功能的多样化。渐江大学硕士学位论文第二章概念与原理在对网络语音信箱系统进行深入谈论之前，我们先对在论文中将要涉及的一些技术的概念及其原理作一下介绍。第一节a c t i v e x 技术由微软公司在1 9 9 6 年正式命名的a c t i v e x 是一项广泛的技术概念。 a c t i v e x 是以微软c o m 模型( c o m p o n e n to b j e c tm o d e l ) 为理论基础建立起来的技术，它的前身是微软的o l e 技术，但a c t i v e x 并不能完全代表 c o m 。a c t i v e x 是一种编码( c o d i n g ) 和a p i ( a p p l i c a t i o np r o g r a mi n t e r f a c e l 的协议。今天，a c t i v e x 已成为微软公司的应用软件与工具软件的一个重要组成部分。 a c t i v e x 和c o m a c t i v e x 和c o m 的关系可以简单地解释如下：a c t i v e x 乃是建立在 c o m 的基础上的，以精简后的o l e ，加上重要的网络支持，然后让o l e 控件随时保持动态( a c t i v e ) 以处理信息。这个方式与o l e 链接嵌入文档有所不同，因为链接嵌入文档仍得要得到一定的事件触发后才可启动。 o l e 开发于1 9 9 0 年初，其发展的重点在于提供复合文档的处理，也就是说文字处理器可以方便地将电子表格嵌入( e m b e d ) 或者链接 ( l i n k ) 在文字处理器的文档里做编辑工作，o l e ( o b j e c tl i n k i n ga n d e m b e d d i n g ) 的名称是由此而来，其所有的发展都是根植于c o m ( c o m p o n e n to b j e c tm o d e l ) 技术的。c o m ，o l e 和a c t i v e x 的关系如浙江大学硕士学位论文下图所示： c o m ，o l e 和a c t i v e x 的关系简单地来谚量酸奏羞丝盟叁塑楚! 坠的元鲑熬仕技术。通常，c o m 一和d i s t r i b u t e dc o m 常被混着使用，c o m 对象特别的地方在于它使用界面( i n t e r f a c e ) 的方式把对象要提供的方法( m e t h o d ) 依照功能的不同，集群起来分门别类。i n t e r f a c e 在对象里提供专门的几种服务( m e t h o d ) ，界面不属于对象也不是类，但它可提供类似多重继承( m u l t i p l e i n h e r i t a n c e ) 的使用方式，一个c o m 对象可以提供多种界面做不同的服务，所有的界面都继承自鼻祖界面i u n k n o w n 。 c o m 对象的界面使用如下图所示。i u n k n o w n 为最根本的界面，每一个c o m 对象都要有此界面或延伸的界砸以便其它对象可以询问和要求服务，它必须要包含三个简单的方法，q u e r y i n t e r f a c e ( ) ，a d d r e f ( ) 和r e l e a s e ( ) 。浙江大学硕士学位论文 c o m 对象的界面使用 q u e r y i n t e r f a c e 的功能有如问询处或查号台，如果你想知道c o m 对象到底可以做哪些服务，你可以通过其i u n k n o w n 界面里的 q u e r y i n t e r f a c e ( ) 来询问它是否提供某项服务，根据服务的项目，进而取得该界面，通过该界面你可以做不同的工作。如果o l e 对象分属不同的执行过程( p r o c e s s ) 时，由于不同的过程可能会跨越平台机型，传递数据就得费点周折了，包装和拆封数据的处理过程就叫m a r s h a l l i n g 和u n - m a r s h a l l i n g 。所以，对于c o m 、o l e 和a c t i v e x 的关系，我们可以总结如下： c o m 制定对象的存储表示( r e p r e s e n t a t i o n ) 和操作( o p e r a t i o n ) 的方式：它们是a c t i v e x 技术的基本结构，其设计目的在于解决不同系统、语言之间对象交互操作的问题。o l e 提供对象间交互的主从 ( c l i e n t - s e r v e r ) 结构：自动化、交互操作及控制元件，所有的功能都建立在c o m 的基础上。a c t i v e x 提供网络层次的三项支持：加强自动化的脚本撰写、轻巧的控件、以及复合文档。当然，它的根基是深植在 c o m 和o l e 的基础上的。 a c t i v e x 的优点 a c t i v e x 不但能够在互联网的网页上使用，更可以应用在各种各样的程序语言里，当然，这些程序都是在微软的视窗之下运行的。a c t i v e x 的控件就像音响的组件( c o m p o n e n t ) ，可以依用户的需要和偏好拼装而成，图表、电子表格、动画等元件，都可轻易地应用在网页上，a c t i v e x 就是要让你的网页“动”起来，a e t i v e x 让元件软件( c o m p o n e n t w a r e ) 的梦想在网络时代成为现实。元件软件让设计师以组装元件的方式来开发应用程序，而这些在开放式的网络环境中操作的a c t i v e x 元件，不会局限于特定的语言和工具，而且容易组装、扩展，并可重复使用。a c t i v e x 元件又可以分为两种：专用性元件和通用性元件。专用性元件( d o m a i nc o m p o n e n t ) ，主要是结合各领域的专业元件，如金融、制造、旅游业等。通用性元件( c o m m o n c o m p o n e n t ) ，主要是技术方面、环境方面的功能元件，如数据库 ( d a m b a s e ) 、用户界面( u s e ri n t e r f a c e ) 、电子表格( s p r e a d s h e e t ) 、i n t e r n e t 、工作流程( w o r k f l o w ) 等元件。未来的互联网将与个人电脑的运行将完全结合成体，网络信息与本机的信息将可以畅通无阻，而网页元件的内容更是包容万象，便捷多样的开发工具也逐渐成熟，目前的v i s u a lb a s i c 、d e l p h i 等开发工具，都已略具有元件组装工具的雏形。a c t i v e x 与相关的语言和工具的关系可以用下图来表示：浙江大学硕士学位论文 a c t i v e x 与相关的语言和工具的关系第二节i n t e m e t 与w e b 技术 i n t e m e t 最初是针对美国国防目的而建立的，承建者是美国国防部的 “高级研究项目机构”( 即a r p a ) ，建设时间从6 0 年代末到7 0 年代初。 a r p a n e t ( 即阿帕网) 最开始的用途是连接国防建设承包商、军队机关以及各科研机构，从而方便科学研究与信息交换。到了8 0 年代，美国“国家科学基金会”f n s f ) 对阿帕网进行了扩展，并建了一个网络( n f s n e t ) ，用以连接各个超级计算中心、大学以及研究中心。就在这段时间里面，世界上的许多大学、研究中心以及其他许多机构都纷纷连入n s f n e t 。这时，我们后来所知的i n t e r n e t 也就初具规模了。在i n t e r n e t 发展的这个阶段，i n t e m e t 主要用于信息交换、教育和科学研究。所有信息是用通信协议交换的，比如t e l n e t ，f t p 和n n t p 等等。这些协议对于文本或二进浙江大学硕士学位论文制文件的传输以及命令行输入来说无疑是比较适合的。 n s f n e t 最初使用的是5 6 k b p s 的专用电话线。1 9 8 8 年，他们对网络主干线进行改造，将其升级成t 1 线( 1 5 m b p s ) 。到了1 9 9 2 年，网络已升级成了t 3 线( 4 5 m b p s ) 。 w e b 的诞生 w o r l dw i d ew e b 的基础结构是在9 0 年代初期开发成功的，开发者是瑞士日内瓦“欧洲粒子物理实验室”( c e r n ) 的t i mb e r n e r s l e e 以及他的同事们。刚开始的时候，w e b 只是作为向超文本文档提供服务的一种途径，并在基于t c p f l p 的客户机服务器网络内提供资源共享服务。文档最初是用一个基于文本的命令行浏览器进行观察的。h t m l 是一种页面描述语言，用于显示信息和创建超文本链接；而h t t p 则是用于连接电脑与w o r l dw i d ew e b 的种通信协议。 1 9 9 3 年2 月，美国“国家超级计算应用中心”( n c s a ) 针对u n i x 系统发行了一个免费的图形浏览器，叫做m o s a i c 。m o s a i c 是集成了图形用户界面( g u i ，例如m a c i n t o s h 电脑和x w i n d o w s 界面) 部分标准元素的第一例w e b 浏览器。除此以外，m o s a i c 还提供了在w e b 页内直接观察图形的功能。它同时还通过客户端电脑内的应用程序( 即“助手应用程序”) 提供了对其他媒体类型的支持，比如数字声音文件和动画等等。刚开始发行m o s a i c 的时候，整个w o r l dw i d ew 曲内大约只有5 0 台w e b 服务器可供浏览游历完所有服务器仅需几个小时。到1 9 9 3 年后期，m o s a i c 已经有了自己的m a c i n t o s h 和w i n d o w s 版本。就在那一年会要结束的时候，世界上的w 曲服务器总数已达到了几百台。图形化浏览器( 比如m o s a i c ) 的多媒体能力是让w e b 逐渐流行浙江大学硕士学位论文起来的重要因素之一。 i n t e m e t 进人高速发展阶段 19 9 5 年，n e t s c a p e 公司的w 曲浏览器_ n a v i g a t o r 一成为w e b 上最流行的一种浏览器。n e t s c a p e 对h t m l 这种基本的w e b 页面描述语言进行了大量扩展工作。n e t s c a p en a v i g a t o r 的最新版本对多媒体数据类型提供了非常完美的支持，如下所示：嵌入a p p l eq u i c k t i m e 电影和数字影像的内建支持。数字声音。三维的虚拟现实环境。 n e t s c a p e 可扩展的插入式结构允许针对其他多媒体数据类型( 比如 m a c r o m e d i ad i r e c t o r 文件和a d o b ea c r o b a t 数字化文档) 创建嵌入式播放器。 1 9 9 6 年，微软用i n t e m e te x p l o r e r 这块敲门砖打开了浏览器市场。微软同时还发布了它自己的多媒体插件技术，命名为a c t i v e x 。该技术以微软的o l e ( 对象链接与嵌入) 为基础。时至今日，i n t e r n e te x p l o r e r 已经发展到5 0 版本，同时凭借其优秀的性能及与w i n d o w s 平台的完美结合，市场份额已经超过n e t s c a p en a v i g a t o r 成为浏览器市场的领头羊。最近，各大企业、机构和组织逐渐开始将w e b 浏览器当作自己单位范围内信息系统的一种前端使用。这些信息系统由单位内部以t c p i p 为基础的局域网w e b 服务器进行控制。我们把这种类型的网络叫做“内部网”或“内联网”，也就是我们常说的“i n t r a n e t ”。在内部网里面，带宽要比i n t e m e t 高得多。因此，以w e b 为基础的多媒体应用程序在内部网中有着良好的发展前途。浙江大学硕士学位论文第三节多媒体电子邮件技术多媒体电子邮件多媒体电子邮件，简称为多媒体邮件，是电子邮件的最为综合的形式。电子邮件是一种工具，通过这种工具，用户可以对计算机信息进行合并、交换、阅读、存储、检索和处理。这些信息均被表示为数字形式并能被计算机处理。因此。电子邮件恰好类似于邮政邮件，其中的信息可以看成为邮政中的书信等邮件。电子邮件信箱类似于住户的信筒，以电子邮件信箱为基础的电子邮件网络等同于由邮局、分拣中心、公路、铁路、飞行航线等构成的邮政网络。但是，由于其中传送的信息是电子信息，因此，还有许多额外的功能可以使用。多媒体电子邮件是由最初文本形式的电子邮件发展而来的，电子文本邮件是一种工具，通过它，用户可以交换计算机普通文本。普通文本是基本的未格式化的计算机格式，丰富文本( r i c h t e x t ) 是类似于印刷出来的报纸那样的更为复杂的格式。电子文本邮件是7 0 年代中期出现的，并且在1 0 多年内，普通文本一直是电子邮件的唯一可以使用的格式。而多媒体信息是包括音频或和视频在内的任何一种复合信息类型。也就是说，多媒体信息至少包含音频或视频的一部分。并混合有任何的其他信息类型。由于被称为m i m e 的i n t e m e t 多媒体邮件标准的迅速采用，多媒体邮件已在1 9 9 2 年出现了。但是受制于网络带宽的限制，多媒体邮件的发展一直处于缓慢发展的状态。当然我们在这里要讨论的主要是语音信息形式的多媒体电子邮件，由于网络条件的限制，视频形式的邮件在现阶段还不能大面积普及。我们知道，数字化语音比数字化文本需要占用更多的存储空间，一个声音邮件所需要的存储容量是等容量的同类型文本消息的所需存储容量的。一一v - 一一一4 一。一一一“ ，浙江大学硕士学位论文 ! q q 垒堡! 所以，用户的语音信箱一般存储在本地的服务器系统中，这些服务器系统能为若干台式计算机或者一个节点上的所有计算机提供服务。当然，声音与文本比较起来，其主要优点就是情感信息和表达方式的丰富性。另外一个显著的优点是可以为那些发送消息的人节省时间一一大部分人说话比敲键盘要快。当然，电子语音邮件也有它的缺陷。首先，一个文本邮件可以被打印出来或合并成一个只有正文的文档。其次，读比听的速度要快。正常情况下，成人的阅读速度大约为每分钟2 5 0 个单词，而且通过快速阅读训i 练，这个速度可以很容易地翻倍。相比之下，英语正常说话速度仅为每分钟1 8 0 个单词。总而言之，作为对于文本形式的信息的一种额外补充，语音信息无疑是一种有效而可行的办法。第四节数据压缩技术文章前面已经提到，语音信息相对于文本信息要大的多，所以我们就必须想办法来对语音信息进行压缩，以适合在网络上的传输。数据压缩技术主要分为两大类：平均信息量编码和源编码。王均信息量编码垩塑焦息量编码是一种泛指那些不考虑被压缩信息的性质的编码一_ 二一一和压缩技术( 如下图所示) 。浙江大学硕士学位论文黼一黼h 一卜黼 i 。一【，一平均信息量编码和解码它是基于平均信息量的技术把所有的数据当作比特序列，而不根据压缩信息的类型优化压缩。也就是说，平均信息量编码忽略被压缩信息的语义。举一个简单的例子，例如将一组全为0 的1 0 个连续的8 位字节用一个特殊的字符后跟数字l o 取代，这就是平均信息量编码技术。这样做时，并没有对这一组。值的含义作假设。毛均信息量编码媳= 企重要的挂蛙星；垩均信息量编码是玉摁耗压缩。平均信息量编码技术分两大类：迫圭重复度夏4 三一堡过绫璺源编码相反地，在源编码中，所做的变换取决于初始信号的类型。例如，一个音频信号有某种特性可在压缩中加以利用。在语言中，消去沉默声就是严格根据信号的语义进行变换的范例。类似地，查找一个视频流的两个连续帧之间的公用块也是一个依赖信号本身特性的操作。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主要取决于数据的语义，比起用平均信息量编码，它的比例变化更大。同时：源编码既可在无损模式下也可在有损模式下操作。源编码技术大致分为3 类：转换编码、差分编码、向量量化。垩塑建璺墨缔曼和源编码著非是互卮。的捷术! 一塞际j ；i 褒声壹、图像彗垦动迥题的压缩中，常将这两个技术结合起来以达到最高可能的压缩率，颧江大学硕士学位论文逍圭重复度到消去重复序列是我们讨论的平均信息量编码方法的一种。它是计算中使用的最简单、最古老的压缩技术之一( 如下图所示) 。它包括检测重复的比特或8 位字节的序列，并用它们的出现次数取而代之。事实上该方法有两大格式：消0 或空白和行程编码。零( 藏空白) 消除 i ， lz lw n s i 假设只有一个字符频繁出现行程编码任何重复出现四次或四次 i 一1 1 - 1 i ：】1 1i i 1 i 1 1 1 曩以上的字符由。该字符+ 记号( h ) + 重复次数” 代替l ! - ：l l u 上j 重复序列压缩实例雹彗窒自笪道险该格式算法假设事先只知道一个字符或8 位字节多次重复出现。该字符常常是数字中的0 或文本数据中的空白。因此，将用一个称作标识符的特殊符号来代替这一系列连续的几个空白或0 ，后跟数n 。征垄绚碍在此格式中，任何重复的字符序列可被个短格式取代。因此，该算法适用于任何重复的字符。一组n 个连续的字符c 将被c 和一个特殊的字符取代。当然，若给定字符仅重复两次就不要用此方法。实际上，仅在重复次数大于等于4 次时才进行取代。行程编码有多种方式，这里所讲的是最简单的一种。统计编码 _ _ _ _ _ - 一统计编码也是一种平均信息量编码技术。虽然它不如序列消除法用的多，但也是计算机中常用的一项技术。统计编码是识别一个给定的流中出现频率最高的比特或字节模式。并用比原始比特更少的比特来对其编码。即就是，频率越低的模式其编码的位数越多，频率越高的模式编码位数越少。其思想是：统计编塑主：型些堑墓! 垡圭芷堡墓堡童绁堂垫盟塑奎堂踅重编码t 高频模式 - - _ - - _ _ _ - - _ _ _ _ - _ - _ _ 。_ - _ _ - _ _ _ _ _ _ - - _ - - l _ - - - _ _ - 4 4 一。使用短编码。当然，该方法暗示了模式的重编码，在编码和译码端都可得到初始模式和新码的对应表。称作代码簿。依据采用的技术和编码的数据类型进行相应的程序化的动态统计。在某些情况下，模式频率和编码分配的标志值为先验值。因此，对模式出现的频率不必每编码一个新信息条就计算一次。莫尔斯字母表就是使用预定义代码簿进行统计编码的例子。统计编码方法可分为两大类：模式替换和哈夫曼编码。模式替换该方法用于文本信息的编码。对多次出现的字符，即常见词用一个单字替代。例如，我们可以用模式替换的方法：将出现“m u l t i m e d i a ，的地方用“m ”替代，“n e t w o r k ”用“n ”替换。浙江大学硕士学位论文睑塞星麴銎该编码是常见的一种统计编码。对给定的数据流，计算其每个字节的出现频率。根据频率表，运用哈夫曼算法可确定分配各字符的最小位数，然后给出一个最优的编码。代码字存入代码簿。哈夫曼编码适用于压缩静态和动态图像。根据参数，可对几个或一组图像构造出一个新的代码簿。在运动图像中。可重新计算一个或一系列帧的代码簿。在所有情况下，都必须将代码簿从源端传到目标端才能进行译码。变换编码变换编码是一种源编码方法。源编码要考虑被压缩信号的性质，特别是它有赖于音频、静态图像和动态图像的特征( 如下图所示) 。空问或时间域频率域变换编码的原理变换编码的原理如下：在变换编码时，初始数据要从初始空间或时间域进行数学变换，变换为一个更适于压缩的抽象域。该过程是可逆的，即使用反变换可恢复原始数据。也就是说，任何函数都通过数学变换形成另一个域的变量和数值。著名的傅里叶变换就是这种变换的一个范例。例如，一个随时间变化的量f 【t ) 可通过傅里叶变换形成一个函数g ( y ) 。新函数中有一个含有原函渐江大学硕士学位论文数的频率人的振幅g ( 我们称为系数) ，g ( 人) 是聃的光谱分布。关键一点是：在图像的光谱表示中，频率描述了颜色和亮度变换的快慢。数学家们已构造了多种数学变换。除了傅里叶变换外，还有余弦、 h a d a m a r 、h a a r 、k a r h u n c nl o e v e 变换。变换编码法中要选择一个最佳的变换，以便对特定数据实现最优的压缩。此处就要考虑数据的性质。其思想是：经过变换后，信息中最重要的部分( 换句话，就是包含最大“能量”的最重要的系数) 易于识别，并可能成组出现。当成组时，我们也说信息能量被封装了。标识最重要的系数有什么意义呢? 最重要的系数在变换成频率域后，其编码的精确度比次重要的系数要高。某些系数也可能被忽略。上述变换本身是可逆的，因而其也是一种无损技术。然而，为了取得更满意的结果，某些系数的编码位数较其他的要多，某些系数干脆就忽略掉了。这样，该过程就成了有损的了。变换编码特别适合于图像的压缩。常用的数学变换是离散余弦变换( d c t ) 。差分或预测编码差分编码( 也称预测编码) 也是属于源编码的范畴。其原理如下( 如下图所示) ：韧始信号差分蝙码的信号馘tl-ll-iiiil 时问差分编码的原理浙江大学硕士学位论文仅对样本的实际值和预测值的差值进行编码。预测值和实际值的差值称为预测误差或误差项。实际中由于预测值的确定方法不同，各种预测技术也就有所差别。差分编码特别适于其连续值与零值差别很大而彼此之间差异不大的信号。因此，差分编码非常适于运动图像信号( 它仅传送图像的差异) 或音频信号。差分编码技术有3 大类：d p c m 、6 调制和a d p c m ，分别如下图所示： 1 简单o p c h 预测值= 最后的采样值 2 6 调制用i 比特进行差分编码 3 自适应编码( d p c m ) 预测值由前面的值外推所得，有预测函数信号差分犏码信号三种类型的差分编码技术简单的差分脉码调制差分脉码调制( d p c m ) 是一种用函数来确定其预测值、预测过程与时间无关的方案。其最简单的情况是在时刻t 传送样本在此刻的值( 真实值) 和样本在时刻t 十1 ( 预测值) 问的差值。即就是，该技术将前面的样 l 。l 。畦一ll上一il上 j|士1上一山一山 i | i 兰址虹缸缸浙江大学硕士学位论文本值做为预测值。 6 调制 6 调制是d p c m 编码的一种特殊形式。关键是它采用一种特殊的方法对样本实际值与预测值的差值进行编码。在8 调制中，样本的预测值和当前值的差量用一个比特进行编码。因此，差分信号是二进制数，它或者是指“信号值增加了一个量程”或者指“减少一个量程。” 6 调制适于编码信号值在给定采样率变化不大的信号的编码。我们也可以说它适于低频信号。自适应差分脉码调制自适应差分脉码调目6 1 ( a d p c m ) 是d p c m 的一种高级版本。在a d p c m 中，预测函数随样本的信号短期特征而变化，而非个固定的预测函数。因此，要用到一个自适应外推法。就象d p c m 一样，传送的是预测值与真实值的差值。我们将会看到在实际传送或存储前，要先进行量化。向量量化向量量化可能是最有前景的一种方法( 如下面两个图所示) 。原始鼓据藏代码慧压缩的数据流卜百葡赢鬲f 、卜赫寻一一e 三主三向量量化编码的原理浙江大学硕士学位论文带误差项传送的向量量化编码的原理向量量化是模式变换的个特例。其原理大致如下：将实际流分成向量块。例如，对一个图像进行向量量化时，向量常常是一个小长方形或正方形的象素。假设所有的向量的大小相同，都为v 个字节。在编码和译码端都有个称为代码簿的表，它是模式的集合，每个模式为8 位字节。该代码簿可预定义也可动态构造。各向量可参考代码簿选择最佳匹配模式。一旦找到最佳匹配模式就将代码簿中的对应条目进行传送。因此，向量量化的原理可归结如下：比特流被划分为向量。它不传送实际数据，而是传送代码簿中查到的最佳匹配模式对应的索引。如果出现实际值与模式根本不匹配那样的话，在接收端就会出现失真现象。为了对此进行补救，该技术要计算一下实际值和模式的差分。然后将该差分与模式的参数一起传送。参数编码可自身进行量化。因此，根据传送是否有差分以及差分为多大，向量量化可能是无损的或是有损的压缩模式。向量量化特别适合于对那些数据类型已知的且可构造出与实际值浙江大学硕士学位论文 t 坌堡垄箜垡茎塞墼绝跫：回量量垡垄茎垩王亟童缔啦忿垄錾垫塾垄 - _ _ _ _ _ i _ _ _ o 。- o _ _ _ - 。_ _ _ _ - - _ ，- - _ _ _ - - 。o 。一一_ - 。、j ，向量量化的一个特例。分形压缩分形几何是b m a n d e l b r o t 发明的，在其著名的自然界的分形几何一书中，他对该原理做了阐述。其思想是：传统的绘制直线和圆的几何与自然界的几何形状不相象。可用一种称为分形的几何来描述自然界，它在不同地点，不同范围和不同角度下重复出现各种不规则的变化。可用所谓的分形的变换对同一分形的不同出现分别进行刻画。寻找分形在成像过程中，很早就运用分形变换来生成图像。相应地，分形编码包括在现有的数字化图像中寻找分形。图像被分成小方形区域，每个方块与同一图像的其他部分相比较。由于一个方块与另一方块完全匹配的可能性极小，因此，实际上它是与另一部分( 即翻译、收缩、倾斜、旋转或镜象部分) 的修改版相比较。最佳匹配图像部分是我们初始方块的分形。对每个方形区域都重复进行该过程。编码分形变换找到的分形只有进行变换才能与初始方块匹配，该变换可用编码后的公式表示，称为分形变换码。这些公式在译码阶段用来重构图像，编码后的公式集合比原图像更紧凑。该技术常称为分形变换。浙江大学硕士学位论文虚拟代码簿虽然数学背景不同，但本质上它与向量量化的原理相似。实际中，在分形变换中，变换码存储在所谓的虚拟代码簿中，它与在向量量化不同，其图像是相互独立的。尽管对每个图像都是专门性的，但是代码簿不需要从编码端向译码端进行传送。代码簿之所以称为虚拟的是因为它在迭代过程中在译码端产生。分形变换的实现分形几何专家声称对图像应用迭代分形系统能获得1 0 0 0 ：1 的压缩率。另外一些专家对此提出异议，因为它还尚未得到证明。但有一点是无争议的：在坌翌兰鳖i 啦缠塑逝堑笪塑登些堡塑奎箜垒：事实上，对多数压缩方案来说，压缩过程远比解压缩过程要复杂。因此，压缩通常要求更高的功率。压缩过程需要比解压缩过程更高功率的算法，即非对称的算法，它们非常适合于异步应用。信息在访问或传送之前已就绪，因此，非对称压缩特别适合于要求视频的应用中运动图像的存储或诸如c d - - r o m 等一些离散存储设备上生成多媒体。向量量化是一个典型的非对称方法：解压缩极快，它包括对表的直接寻址以及利用向量差找到正确的值。其中最不对称的压缩方法实际上就是我们已用过的量化的特殊形式，也就是所谓的分形变换。真实信息( 如声音或运动图像流) 的传送要求较对称的压缩方法。并且，所有交互式应用中都不能容忍过多的压缩延迟。因此现场传送，诸如视频会议中，一般比重放传送的压缩流要少。综上所述，我们曼坚知道，共有两种可能的压缩模式：无损耗压缩 -_。一一一“一1_-_-_-”，柙，一” 浙江大学硕士学位论文 ( 基里缉塑堡里缩塾堡鐾堡复匾绉塑塑! 塑查塑堑匡缝l 墓匿绾麴运董 _ _ _ _ _ - - _ - - ，- _ _ - _ _ - _ - _ - _ _ - _ h - _ 一原始数据不完全相同) 。而压缩方法可分为两大耋；垩均信息量编码( 它：至耋虑垦缰塑塑盟耋型2 j 翌i 匾编塑! 宣垫鉴塑塑堡笪蚤竖丛丝匿缉玉大多数算法的压缩比解压缩阶段所耗的功率要高。这是由于压缩的声音 - 、，- 一或图像的塾主要重旦笪垦丕型整篡法。但是理场焦遂剪銮互式应且则，- _ _ h 一一垂塞焦过整笪笺法，县签型士适童焦星塑廷缝壅递：星墨簦型壹堕量盟回放效果就可以了，所以无论述有损压缩还是无损压缩都是可以接受的。浙江大学硕士学位论文第三章系统的总体设计方案在对文章中涉及的概念及原理作了介绍后，接下来我们就要开始对网络语音信箱系统进行平台的搭建和系统的设计。第节服务器平台的选择目前可以选择的服务器操作系统有0 s 2 、u n i x 、l i n u x 以及w i n d o w s n t 等。作为w e b 服务器的平台，我们需要综合考虑操作系统的可靠性，易用性，可维护性以及

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（光学工程专业论文）网络语音信箱技术的研究.pdf

文档简介

温馨提示

最新文档

评论

（光学工程专业论文）网络语音信箱技术的研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档