（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-15 格式：PDF 页数：53 大小：1.81MB 积分：0 举报 版权申诉

（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf_第2页

（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf_第3页

（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf_第4页

（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf_第5页

已阅读5页，还剩48页未读，继续免费阅读

（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

ab s tract 铂ththe n e v e r-en d i n g d e v e l o p m e ntand i m p r o v m ent o f c o m p uter s c i e n ce ， n e 。刀 o rk te c hoo l o gy h as al re a d yb e c o me th em ai n t r e amo fm o d e m e d u c a t i o nin the wo r l d . f u rtherm o re ， the a p p l i cati o n o f th e d i gi tal r a d l o 一 te ac h i n g s y s l e mh astakenfo n d 印旧 ental c h ang e s toth er a d i o 一 t e ach i n gs y stemt hr o u gh i t s c o ni ent ， m e ans ande v e nth e c o nce pts m e anw h l l e ， th ed e v el opm e nto f n e 幻内 o rk， co n r n uni c atio n and m u lti m edi a te c hoo l o g yh as o pen u p ex p ans 1 v e sp ac e fo r th e a p p 1 i c at i o n o f e n 1 be dde d s y s t e m， w h i chm a d e e m be d d ed s y st e mbe com e an o t h e r techn0 1 o gyfo c usinth e i ti n d u s 1 rya fi e r p can d i nt e m e t . i n s u c h p r e m i se ，而s th e s i sin t r 0 d uc e s the re s e archand d e s i gn o f th e 压91 因 a u d i o 一 te ac h i ng s y s t e m b ase d o n e mbed ded s y 引 e m and al s o m ake sd e i a i 1 ed d i s c ussi o n o fthe s to d ent 一 macll j l e b ase d o n e mbed d e d s y stem. to meet the nee d o f the d i gi tal r a d io-te ach i n gs y s t e m， we c o n st ructarc hi t e c 奴叮 e o f th e s y 以 e mb as ed o n the e m bed d ed s y s l e min而s th e s i s . w 七 c h oosethe p e r s o nal c o m p ul e r for t eac h ers ， t e rmi nal and d esi gn the e m bed d e d sys t e masstud e ni st e n ” in alb y o urse l ves . due tothe c h a ra c t e ri 州co f this sy 引 e m ， we hav e the 1 n t e rr e l at e dp r o t o c o l cut d o wn and sc h em e o uta n ew o ne c a l l e d my p rol o 0 1 . w七 acc o m p l i s h the fi i l 1 otio n o f th e m anage m ent fo r t e a c hi n g t e n n i nal andd i sc uss th e 引刀 d e n t s ，抚 n 刀 i nal b ase do nthe em bed d e ds y s t e mi n d e t a l l . wei m p l e m e n t c onc e r n e ddriv e rso f t he s tu d e nts， t e n n i nal b ase do ns u c c e ss fu l l y t r ansp l an t i ng the p c /o5 一 i l toth e i m be d d e ds y st e m . to s u p portthe ap p l i c at i on o f the 就 u d e nts ， t e rm1 nal we c o m p l et e the n e two r kp r ot oco l s p r o gram. i n th e e n d ， we p ro v i d e the res u it. k e y w o r d s : e m b e d d e d s y s t e m ，成/o5 一 1 1 ， 5 3 c 4 4 b 0 ， 1 1 5 声明本学位论文是我在导师的指导下取得的研究成果，尽我所知，在本学位论文中，除了加以标注和致谢的部分外，不包含其他人已经发表或公布过的研究成果，也不包含我为获得任何教育机构的学位或学历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文中作了明确的说明。研究生签名 : 尊袅一州却月、学位论文使用授权声明南京理工大学有权保存本学位论文的电子和纸质文档，可以借阅或上网公布本学位论文的全部或部分内容，可以向有关部门或机构送交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对于保密论文，按保密的有关规定和程序处理。研究生签名 :.遗鼻一 -知夕年沙日绪论本章简单介绍了课题研究的背景、课题的提出，并给出本课题的主要工作及文章的组织结构。课题研究的背景近年来，随着网络的普及以及校园网资源的广泛应用，模拟语音教学系统愈来愈不能满足教学应用的需求，怎样发挥语音教学系统的教学作用，怎样使网络教学资源在语音教学上得以应用，怎样使语音教学系统与校园网相连，做到无缝连接?答案只有一个，就是实现语音教学系统的数字化和网络化。由于技术的发展，尤其是网络技术的发展使这一要求成为现实，数字语音教学系统应运而生。我们以前接触的语音教学系统都是基于模拟信号的，就像我们以前应用的卡式录音机、模拟手机等等。长期以来，模拟信号的产品为我们的生活提供着服务，但随着时代的发展，模拟产品的功能已经不能满足社会多变的需求。模拟语音教学系统的稳定性较差，音质不理想，大多数为单声道，系统功能单一，教学交互性差，所有的模拟语音教学系统在上课后只能闲置，没有任何利用的空间。下面将从两个方面阐述数字语音教学系统与模拟语音教学系统的异同川。 ( 1)结构设计模拟语音教学系统的核心设备是录音机机芯，结构设计就是以录音机机芯为主体，通过各厂家自行定义的电缆将所有学生录音机与教师主录音机相连，然后再将音源设备 ( 如录像机， v c d 等设备)的音源信号接入，构成整个系统。由于机芯本身就是机械结构，即使是电控机芯，机械部分也占整个结构的9 0%以上的比例，由于机芯的机械运动，震动、磨损所造成的故障是模拟系统中最常见的问题。又由于产品连接线缆及连接方式均为厂商自定义，因此产品连接复杂，故障率高，用户无法进行维护和维修。数字化语音教学系统的核心是基于计算机传输协议的网络技术，整个系统几乎没有机械部件，故不存在机械故障。多媒体网络语音室的数字化系统中，所有设备都是由标准的网络系统与计算机设备组成，与我们常见的计算机局域网设备一样，它们的高效稳定己被我们所熟知，从而确保了产品的稳定性。 (2) 应用效果传统语音教学系统长期以来一直在语音教学上为我们提供着服务。语音教学体统作为教师进行外语教学的辅助设备，其对锻炼学生的听说能力起到一定的作用。但由于技术实现方式的落后，大多数系统至今还停留在单声道。同样由于相关实现方式技 i 硕卜论文摹十嵌入式的数宇语音教学系统研究j 设计术的落后，模拟语音教学系统在课余时间大部分闲置，成为学校中利用率较差的一种资源。数字化语音教学系统与模拟有着明显的区别。数字化语音教学系统不仅消除了噪声干扰，而且音质也可达到专业的立体声音质效果。从教师应用上看，教师对教材的准备只需点击鼠标即可完成，整个过程简单方便。从教材的选择上，丰富的教学资源相当于几十所学校所有资料的总和，教师不再为资料的收集和保存而烦恼。基于磁带的变调和绞带现象都不再出现。从学生的应用上来看，学习的范围不再局限于教师所带的磁带，每个学生都可以通过自由点播，阅读或自习的方式使用校园网上提供的海量资料。多语种、多年级都可以在同一时间内共享语音教室。甚至可以利用终端边听音乐边看参考书。从学校语音室的建设上来看，语音教室将成为一种真正的语言教学系统，其利用率将成倍提高。从另一角度看，数字化语音教学系统相当于语音教室，电子阅览室，模拟考场，电子听音室等各种系统的综合。另外，整个系统的稳定性、易用性、易维护等都是模拟语音教室所无法比拟的 2 . 数字化语音教学系统是建立在网络资料交换的基础上的，将经过a /d转换后的语音资料或音频的数据文件，通过标准的网络协议，传送给用户终端。网络及终端之间的传递符合标准网络协议，可以达到语言学习的良好音质，从而满足教学在形式上多样性的需求，是一种组建合理和资源利用充分的全新的语音教学系统15 。现在有些学校利用已有的机房，在 pc 机上安装语音教学软件，从而实现语音教学的数字化，虽然这样可以在已有资源的基础上花费较小的成本实现语音教学系统的数字化，但由于 pc 机可用资源的丰富性，学生容易迷恋电影、游戏等娱乐项目，造成上课开小差，影响学习效率。另一方面，机房与语音室两者合一，造成学生上机时间和学生上语音课容易冲突，学生课下没有机会自主进行听力练习。鉴于以上情况，本课题设计了用于普通教室的基于嵌入式的数字语音教学系统。 1 . 2课题的提出 “ 数字式音频技术的进步导致了计算机和网络的革命，并为计算机系统和应用开拓了新的设计空间” 们，这是美国计算机学会 1 9 9 3 年多媒体技术国际会议程序委员会主席p . v enk at r ang an ( 加利福尼亚大学) 在论文集前言中的第一句话。这充分说明了数字化技术和多媒体技术的优势及其发展趋势。目前大、中、小学校的语音教室大多数是模拟信号的语音教学系统。这种语音教学系统不能满足如今教学方式多元化，学生学习自主化的要求。为了更好的满足教学增长和多数用户的需要，我们将否定在机房上实现语音教学系统数字化的方案，提出基于嵌入式的数字语音教学系统，设计了数字语音教学系统的整体方案。该语音系统是采用数字音频、编解码、存储、液晶显示、网络通信等高新技术的多媒体语音教学系统，教师机采用pc机，学生机采用本课题自行设计的嵌入式终端。在教师机上运行服务程序，实现双方高质量的数字化通信，并且可以对学生机之间的通信加以控制。教师机和学生机不同的配置，实现了高效的智能组合。 1 . 3本文的主要工作本课题的目标是建立一个整合了硬件、软件、网络及音频资源的嵌入式数字语音教学系统，论文的主要研究内容为: ( 1)提出基于嵌入式数字语音教学系统的体系结构，并针对个性化的需求，对学生机划分功能独立的应用模块; (2) 设计学生机的硬件平台并构架其软件平台，实现有关驱动程序的编写; ( 3)设计并实现适合本系统的音频实时传输的网络协议; (4) 设计教师机的教学管理软件功能，实现教师机服务程序的编写。 4本文的结构第一章，绪论。介绍了课题研究的背景及课题的提出，并给出本课题的工作内容及文章的组织结构。第二章，相关技术介绍及本系统协议设计。简单介绍了即3 文件格式、解码的实现方法、网络协议的选择和适应本系统的实时音频协议 m y p rot ocol的设计。第三章，嵌入式数字语音教学系统的体系结构。构建语音教学的总体结构和运行模式，完成学生机的硬件平台设计，构架学生机的软件平台。第四章，系统的软件实现。鉴于教师机和学生机开发工作量的差异，重点介绍了学生机设备驱动程序，网络传输协议及音频播放程序的实现。最后，给出系统实现的结果。 2 相关技术介绍及本系统协议设计在绪论的基础上，本章首先介绍系统实现涉及到的数字音频的格式，针对学生机应用的特点，对 t c p / ip 协议进行选择和裁减，根据系统实现的特点，设计适合本系统的实时传输协议和数据包的封装方法。 2 . 1即eg 音频技术 m p e g 是运动图像专家组( m o v i n g p i c t u r e e x p e r t s g r o u p ) 英文缩写【 5 ，，代表m p e g 运动图像压缩标准，这里的音频文件格式指的是 m p eg 标准中的音频部分，即 m p eg 音频层，具有很高的压缩率，是一种有损压缩。根据压缩质量和编码复杂程度的不同，划分为三层即l ayer 一 1 、 l ayer一 2 、 l ayer一 3 。 m p eg音频编码的层次越高，编码器越复杂，压缩率也越高。本系统选择最常见且压缩率比较高的珊3 文件格式，下面将对其格式进行简单的说明。 2 . 1 . imp3 音频压缩标准 m p 3是即eg a udio l aye r3 的简写，是 20 世纪 90 年代开发成功并得到 fraunhofer hs大力支持的一种常用于播放器的有损压缩编码格式。它是利用人耳的掩蔽效应对声音进行压缩，使文件在较低的比特率下，尽可能地保持了原有的音质，是目前最为流行的压缩方式，也是现在网上收集音乐的最主要的方式，大多数播放器都支持这一文件格式。 m p3格式的声音文件的压缩比10 二 1 一12:1，在不小于1 2 8 k b p s 传输率下，基本保持了原有音质，正是这一特性，使得淤3 相关产品保持着长盛不衰 6 一、 m p3 的文件结构即3 文件大体可以分为三部分，即t a g es v z ( i d 3 v z ) 、帧( f r 二e ) 、 t a g _ v l ( i d 3 v i ) 。其结构如表 2 . 1 . 1 所示，三部分是按照前后顺序排列的: 表 2 . 1 ， 1 即3 文件结构表项目描述 i d 3 v z 包含了作者、作曲、专辑等信息，长度不固定，扩展了 i d 3 vl 的信息址 f r s l幻 e 一系列的帧. 个数由文件大小和帧长决定 ; 每个 fr胡e的长度可能不固定，也可能固定，由位率 ( b itr ate) 决定; 每个 fr胡e又分为帧头和数据实体部分: 帧头记录了。 p3的位率、采样率、版本等信息，每个帧之间相互独立 i d 3 v i 包含了作者、作曲、专辑等信息，长度为1 2 8 b y t e 硕卜论义篆十联入式的数字语音教学系统研究，设计二、 m p 3 文件中的帧格式经过压缩后的m p3 文件数据由多个帧组成，帧是 m p3 文件最小组成单位。帧的格式如图2 . 1 . 1 所示。每个帧又由帧头、附加信息和声音数据组成。每个帧播放时间是 0 . 0 2 6秒，其长度随着位率的不同而不等，有些 m p3 文件末尾有些额外字节存放非声音数据的说明信息。 h e 耐 e r ( 4 b y tel cr c ( o o rzb y 比 ) s id ein fo ( 1 7 o r32 b 州e ) ma in ，山. an c il l a ry.山t a 图2 . 1 . 1帧的格式帧头( header) 包含同步码和状态信息。错误检查( crc)部分包含错误检测信息，这部分依据帧头信息中保护位( p r o t e c t i o n 一 b i t ) 的状态可选。侧信息( s i d e 一 i n f o )中包含解码所需的辅助信息，其长度依声道不定，单声道为 17 字节，双声道为32 字节。主数据 ( 枷in一 d ata)是真正的抽样值编码数据，它的长度可变。辅助数据 ( a n c i l l a r y 一 d a t a ) 由用户自己定义。 ( 1)帧头格式帧头长4字节，对于固定位率的m p3 文件，所有帧的帧头格式一样，其数据结构如下: t y p e d e ff r ajne h e a d e r u n s i g n e di n t s y n: 1 1;刀同步信息 u n s i g n e di n t v e r s i o n: 2:/ 版本 u n s i g n e di n tl a y e r: 2;/层 u n s i g n e di n t p r o t e c t i o n: 1;/ c r c校验 u n s i g n e di n t b i t r a t e: 4:刀位率 u n s i g n e di n t f r e q u e n c y: 2;/ 频率 u n s i g n e di n t p a d d i n g: 1:刀帧长调节 u n s i g n e di n t p r i v a t e: 1;/ 保留字 u n s i g n e di n t m o d e: 2;刀声道模式 u n s i g n e di n t m o d ee x t e n s i o n: 2:/ 扩充模式 u n s i g n e di n t c o p y r i g h t: 1;/ 版权 u n s i g n e di n t o r i g i n a l: 1;刀原版标志 u n s i g n e di n t e m p h a s i s: 2;/ 强调模式 h e a d e r，l p h e a d e r : 帧头4 字节使用说明见表 2 . 1 . 2 。硕1 一论文基士丛立感的数宇语音教学系统研究与设计表2 ， 1 . 2即3帧头使用说明名称长度 ( 位) 说明同步信息 l l 第1 ， 2 字节所有位均为1 ，第 1 字节恒为ff 0 0 一 m p 比2 . 50 1 一为定义 1 0 一m p egzl l 一p e g i 版本2 0 0 一为定义 0 1 一 l a y e r 3l o 一l a y e r zl l 一 l a y e r l 层 2 0 一校验 1 一不校验c r c校验 l 位率4 第3字节取样率，单位k b ps，采样频率，对于m r 那1 :0 0 一 44. i k hz 0 1 一 4 8 khz l o 一 3 2 khzl l 一为定义频率2 用来调格文件头长度.0 一无需调整，卜调招帧长调竹1 保留字 l 没有使用声道模式 2 第4 字节表示声道， 0 0 一立体声， 0 1 一 j o i n t s t e r eo，1 0 - 双声道，1 1 一单声道当声道模式为01 时才使用扩充模式 2 文件合法性 0 一不合法，1 一合法版权l 是否原版，0 一非，1 一是原版标志曰声音压缩后的再补偿分类，0 0 一为定义， 0 1 一 5 0 / 1 5 m s ，1 0 一保留，1 1 一c i tt. 1 7 强调方式 2 ( 2 ) c r c 校验可选，占用2 个字节。使用的错误检测方法 “ c rc一 16” ，其发生多项式为g ( x ) 二驴+x15+ 扩 +1。 ( 3)帧侧信息帧的侧信息包含了解码所需的一切信息，如主数据开始指针、主数据位数、与 h u f f 阳n 解码相关的信息、与逆量化相关的信息等。具体内容见表2 . 1 . 3 。三、i d 3标准 m p 3 帧头中除了存储一些像p r i v a t e 、 c o p y r i g h t 、 o r i g i n a l 的简单音乐说明信息以外，没有考虑存放歌名、作者、专辑名、年份等复杂信息，而这些信息在m p3 应用中非常必要。 1 9 9 6 年，f r i c k e o p 在 “ s t u d i o 3 ” 项目中提出 t 在 m p 3文件尾部增加一块用于存放歌曲的说明信息，形成了i d 3 标准，至今已制定出i d3 vll0 ，v l l l ， vz10， vz13和v z1 4标准。版本越高，记录的相关信息就越丰富详尽。 i d 3vllo 标准并不周全，存放的信息少，无法存放歌词，无法录入专辑封面、图片等。 v z 10 是一个相当完备的标准，但给编写软件带来困难，虽然赞成此格式的人很多，在软件中真正实现的却极少。绝大多数m p 3仍使用id 3 vllo 标准。此标准是将淤3文件尾的最后 1 28 字节用来存放 i d3 信息，这 12 8字节使用说明见表 2 . 1 . 4 7 。表2 . 1 . 3帧的侧信息描述比特数/ bit 单声道 c h 二 0 双声道 c h = 1 主数据开始指针 ( m a i n _ d a t a-b e g i n ) 9 9 私有位 ( p r i v a t e _ b i t s ) 53 两个粒度共有选择信息 ( s c r s i c h l s c f s i _ b and ) 吸 * 1 2 * 4 * 1 粒度组 l 的边信息且 p gr 二 o 主数据位数 ( p a r t z 一 3 一 l e n g t h g r c h ) 1 2 2 * 1 2 大值 b i g _ v a l u e s 【 g r c h 9 2 * 9 全局增益 ( g l o b a l _ g a j n g r 【 c h ) 82 * 8 比例因子压缩 ( s c a l e f a c _ c o m p r e s s g r c h )l 4 2 * 4 窗tjj换标志 ( w i n d o ， _ 5 ， l t c h i n g _ r l a g g r c h ) l 2 * 1 窗切换标志为 “ 1 ” 时块类型 ( b l o c k _ t y p e 【 g r l c h l ) 22 * 2 混合块标占 ( . i x e d _ b l o c k _ f l a g )l 1 2 * 1 表选择 ( t a b l e _ s e l e c t g r r e g i o n ) r e g i o n : 0 ， 12*5 一 1 2 * 2 * 5 子块增益 ( s u b b l o c k _ g a i n g r c h ， i n d 姗 ) w i n d o ，: 0 ， 1 ， 2 3 * 32 * 3 今 3 窗切换标志为 “ 0 ，时表选择 ( t a b l e _ s e l e c t 【 g r 【 r e g i o n r e g i o n : 0 ， 1 ，2a * 5 一1 2 * 3 * 5 区域0 一1 ! 数 ( r e g i o 二0 一o u n t g r l c h ) 42 申 4 区域 1 一1 卜数 ( r e g i 伽 1 _ c o u n t 汇 g r c h ) 32 * 3 预标志 ( p r e f l a g g r 【 c h l ) l2 * 1 比例因子压缩 ( s c a l e f a c _ c o m p r e s s g r l c h ) 1 2 * 1 计数1 表选择 ( c o u n t _ t a b l e 一 s e l e c t gr c h ) 1 2 水 1 粒度组2的边信息即，gr=1 同粒度组 l 同粒度组 1 总占用的字节数1 7字节 3 2字节表 2 . 1 . 4i d 3v l l o文件尾说明字节长度/ 字节说明 1 33 存放卜以c ”字符，表示i d3 vl. 0标准，紧接其后的是歌曲信息 4 3 33 0歌名 3 4 6 33 0作者 6 4 一 9 3 3 0 专辑名 9 4 一 9 74 年份 9 8 1 2 7 3 0 附注 1 2 81 m p3音乐类别，共14 7 种 2 . 1 . 2姗3 解码原理在m p e g 一 1 规范中没有对编码器做明确的规定，但规定了解码器。淤eg数据是按照帧传送的，每一帧可以独立解码，在m p e g 一 1 中，层 2 和层 3 的帧长度是一样的，但层3 中的比特数是可以改变的，可以根据音频信号的编码要求进行灵活分配。 mp3 解码器首先要对输入比特流同步，读出标题。在读取了帧头之后，开始读取侧信息。然后再对主数据进行解码。解码流程如图2 . 1 . 2 所示。 7 图2 . 1 . 2 淤3 解码流程图在解码的过程中，输入的主数据都要驻留在输入缓冲区中。主数据的起始用目前的“ 主数据开始指针” 定位。当下一帧的标题到达传输缓冲区时，所有主数据都驻留在输入缓冲区中。解码主数据时，解码器必须跳过标题和侧信息。他们的位置可以从比特率标记和填充位知道。主数据能够跨越于一个块的标题和侧信息。接下来，进行主数据解码，根据比例因子和霍夫曼码字进行霍夫曼解码。霍夫曼解码输出的数据再进行非均匀反量化，反量化之后，重构值再进入合成滤波器组之前，要对邓或强度立体声模式或者两种模式进行处理。对于混合块和长块在做 imoct 之前要进行混叠信号的消除，即对数据进行重排ia: . 2 ， 2 网络传输协议的选择和设计教师机采用的w indows 操作系统集成了几乎所有的网络协议，而基于嵌入式的学生机，鉴于本身资源的限制，必须对网络协议进行选择和必要的裁减，必要时还需要自行设计符合自身的协议19 。 2 . 2 . 1学生机tcp / ip协议的选择网络接口层主要作用是为其上层协议发送和接收数据包提供服务，其有多种接入网络的方法，本系统学生机采用 r t l 8 019 as 以太网芯片方式接入 i nternet 方式，所以此层我们实现以太网协议. 网络层主要负责处理数据包在网络中的协议封装工作。由于底层实现以太网协议，而以太网上数据的传输是采用网络的撇c 地址来进行识别的，这就要求系统有实现 ip 地址到以c 地址的转换的功能，即a r p ( 地址解析)协议.ip协议是 t c p / ip族的核心协议，需要跨越不同的网络进行通信就必须要实现ip协议。在t c p / ip协议组中， t cp 协议是一种面向连接的协议【 10 。为保证数据传输的可靠性做了大量工作，实现的复杂，网络开销很大，给数据的传输带来很大的时延，对实时音频传输来说这个时延大大超过了人耳所能容忍的程度。相对于t c p 协议， u d p 协议减少了确认、同步等操作，节省了很大的网络开销，它能够提供高传输速率的数 8 据报服务，在数据的实时传输中应用广泛【， ” 。因此在本系统的研究中，采用u dp协议进行音颇数据的传输。 2 . 2 . 2 实时音频流协议的设计对于有三四十台终端的小型局域网，网络传输的q os 不是问题。针对多媒体的实时传输要求，i etf 提出了实时传输协议 r t p 。r tp 为数据提供了具有实时特征的端对端传送服务，如在组播或单播网络服务下的交互式视频音频或模拟数据。r t p 协议的结构如图2 . 2 . 1 所示: 3 里 3 0292 82 724232 2 61 5一0 v 留 2pxc cm曰 5 闪峋 ccn um 加1 s n ) t ill l“1. i lp 5 扣d 厄佣吐川沁 . 女胆州 s s r c )l 山，吸 1幻口 c o 川州园1 昭5 山盯 “( csr c ” 山，石止址 . 图2 . 2 . i r t p 包头的结构 rtp 包头的编码格式中: cc占4 bit s ，c s r c ( 贡献源) 计数。指明固定头后有多少个c src标志符。 c s r c ( c o n t r i b u t i n gs o u r c el d e n t i f i e r s ) 0 一1 5项、每项占 4 b y t e ，贡献源表。用以识别与r tp 包中负荷相关( 提供负荷) 的源ij2。然而，在实现教师机向学生机发送数据包的过程中，信息的类型仅为音频文件，资源贡献源仅为教师机，从而 rtp 中的c s rc和 cc 字段将产生冗余。作为传输音频，视频等多媒体信息的 r tp 协议在仅传输音频文件的系统上，其通用性特征将降低数据包的解包和封装的效率。为了实现整个系统在实现语音教学过程的专用性，提高系统资源的使用效率，我们将借鉴r t p 协议总体框架，重新设定相关字段，裁减原有协议的冗余，以达到学生机精简，高效，专用的要求，自行设计适合本系统的实时传输协议，称为m y p rot ocol，以保证教师机和学生机音频播放的同步性。 2 . 2 . 2 . 1 协议设计的关键点 ( 1 ) 帧设计帧的设计是实现协议的核心之一，协议运行时，以设计好的帧格式形成分组，并在不同的工作点之间交换一个设计良好的帧应该在尽可能简洁的前途下满足所有的需求，并且应有一定的可扩展性。本文根据具体的应用环境设计适合本系统的帧。 (2) 分组序号与时间戳每一个分组都具有序号与时间戳。为了保证接收点按采集时的时序播放，发送点将采集时的时间计入分组的时间戳域。在某些情况下，不同发送顺序的分组可能具有相同的时间戳 ( 比如立体声的左右声道) ，所以又需要序号域来表示分组的发送顺序以便接收方按发送顺序组织分组。 ( 3)分组的丢失对于基于一个小型的局域网，分组丢失的概率很低，而对于实时性要求很强的音频流，重传机制的实现会加大系统运行的负荷，本系统在实现时没有考虑重传机制。 ( 4)对抖动的补偿此协议是基于分组交换的网络。这样，不同的数据包从同一个发送点到达同一个接收点的时延也会有所不同 lal 。时延的变化 ( 称为抖动) 会对接收端正确播放实时音频流带来一定的困难。为此，本文以链表的形式在学生机建立并维护抖动缓存，并设定了一个播放门限k ，只有当到达的音频数据包的数量到达k 值时，才允许解码播放。 2 . 2 . 2 . 2脚p r o t o c o l 协议的设计该协议位于u dp协议之上，它们共同完成传输层的功能。对于脚protocol协议，其本身并不提供任何确保及时传送的机制或者其它的服务质量( q os) 保证，也没有规定恢复丢失数据报的任何机制，而是依赖低层所提供的服务来完成这些功能。 m y p r o t o c o l 协议是由u d p 报文来传递 m y p r o t o c o l 数据。 m y p r o t o c o l 协议数据没有长度字节和其他边界，由下层网络协议来提供一个长度指示。采用u d p 作为下层协议的数据封装如图2 . 2 . 2 所示: my pro ，l p ay l i p卜 e a d 盯 my p r o 加 c o l h e a d 盯 m) p r0 1 oc0 l p ay1 0 目 u d phead cr my p r o t o c o l he 耐er my p r0 1 oco 1 pay t o 叻【】d ph ead 口 my p 1 0 l ocol h e a d e r my 竹o i oco i p ay】 0 司图2 . 2 . z m y p r o t o c o l 数据的封装过程一、 m y p r o t o c o l 协议每个m y p rot ocol的数据包都由一个头部和不定长的媒体数据组成， m y p rot oc ol 包头结构如图 2 . 2 . 3 所示。 3 1 3 0加2 吕2 7 2 42322l 5 5 o q u 翩“ n o m比叫 s n ) s y n 曲r ” 11 乙翻伙川5 川叮 ss r c)l 山川 1爪 r 湘沁 ” 仍:表示未用图 2 . 2 . 3m y pro t o c o l 协议报头表 2 . 2 . 1报头 t ag 与叮字段的涵义 tagv a l u em e s s a g e 0 不用，如果收到这种类型的消息，认为是无效消息。 l 音频数据，其编码类刑杏看pt选项 2 传送文件诸求，请求传输的文件名杳看叩t ion 选项 3l 网络的状态反馈，反馈信息卉看。 p t i o n 选项 4 传输文件请求应答 5 终卜文件请求 6 终止文件请求应答 m y p r otocol报头的编码格式如下: v e r s i o n占z b i t s ，版本号，为1 t a g 占 4 位，描述包的具体类型。 t ag值表示的含义见表2 . 2 . 1 所示。当t ag二1 时，盯表示的声音有效载荷的类型，具体表示含义见表2 . 2 . 2 所示。虽然本系统只实现了 m p 3 音频文件的传输，为了系统以后的扩展定义了其他的编码格式。表2 . 2 . zpt有效载荷号 pi有效载荷号声音类型采样率 ( khz )数据率 ( k b / 5 ) 0p c m m u 一 l a w 86 4 l一11 0 1 61814 . 8 2一 ig . 了 2 11 8 3 2 3一 1o s mi8113 2 6一id v ll11 6 6 4 7 l p cl8 2 . 4 9g . 7 2 2 8 4 8 “ 6 4 l 4 m p 所l a y e 亡1 1 1 9 0 巧g . 7 2 88l 6 s n ( s e q u e n c e n u m b e r ) 占 z b y t e ，包序列号。接收端可以通过序列号检测数据包传输过程中的丢包情况以及失序情况。序列号的初始值是随机分配的。 t i m e s t 胡p 占 4 b y t e ，时间戳。描述 m y p r o t o c o l 包中数据的采样时刻，主要用于同步和计算时延。时钟频率和数据格式有关，不能使用系统时钟。对固定速率的音频来说，每次取样时间戳时钟增1 。与包序列号一样，时间戳的初始值也是一随机数。如果多个连续的 m y p rot ocol包在逻辑上是同时产生的，那么它们的时间戳相同. l l s s r c :同步源标识符， 32位，标识了不同的流。同样应该随机选取。接收方以发送方的ssrc与发送方ip， p ort 相结合的方式来判别一个流。只有在上述三者均与接收队列中的记录一致时，才判定收到的包是属于同一个流的，否则就应该丢弃或作别的处理。即t io n : 可选择项，其是否存在和本字段表示的意义及长度由 t ag定义，具体见表2 . 2 . 1 所示. 当m y p r o t o c ol数据分组发生失序时，其中所包括的顺序编号使得接收方能够复原发送方的分组顺序。但若发送的 m y p rot ocol分组丢失时， h y p rot ocol自身无法解决恢复丢包的问题。这就需要将一些协议或方法与m y p rot ocol集成，协同应用。对于分组丢失问题，m y p rot ocol可以采用编码的方法来恢复丢失的分组。 2 . 2 . 2 . 3 m y p r o t o c o l 协议数据封装方法 m p 3 帧并不是一个真正的应用数据单元，用于解码的帧的主数据的起始位置并不一定在该帧的侧信息后，而是根据帧的侧信息中主数据开始的值来决定主数据起始位置的前移字节数。典型的m p3 的位流组织如图2 . 2 . 4 所示. 图2 . 2 . 4mp3比特流一个 m p3 帧中包含了一个指向前面帧数据的指针，所以不能和前面的帧分开来单独解码，m p3帧的丢失会致使之前帧的数据没有作用，即使之前的帧接收时没有发生丢失。为了改变这种现象，我们定义一种新的帧类型的应用数据单元，简称姗 u 帧，其文件结构的定义同 m p3 文件结构，只是 mdu 主数据是从这个 mp3帧的 “ 。 a i 几 d a t 几b e g i n ” 指针的开始到下一个” p 3 帧的 “ m a i n _ d a t 屯b e g i n ” 指针的开始. 在一个m y p rot ocol包的负载中，每一个m du 帧前面有2 字节的m du 描述符，它给出了姗u的大小并指明这个包是否是上一个包数据包的继续，这种情况只会在一个脚protoc ol包中放不下一帧的m p3数据时发生。其定义如下:( l) c : 继续标志1 位，如果包中数据是上个包中数据的继续置为 1 ;否则为 0 ;( 2 ) m du size:巧位，是以字节为单位， m du帧的大小，不包括m du 描述符本身的大小。 m du描述符的格式如图 i 2 2 . 2 . 5 所示。图2 . 2 . 5即u 描述符的格式一个m y p rot ocol数据包由一个m du描述符开始，然后是mdu 帧数据。这个m du 描述符和 m du 帧在 m y p rot o c ol 包中会完全合适。然而如果一个单独的m du 描述符和初 u 帧对于一个m y p rot ocol 数据包来说太大了，那么即u 帧被断开为两个或者更多个连续的m y pr otocol包。每一个这样的包开始于一个朋u 描述符。第一个包的描述符的“ c ” 为0 ; 剩下的包的描述符都为1 。每一个描述符在这种情况下有同样的姗u s i z e 值，即m du完整帧的大小。由于在从一串 mp3帧到一串 m d u帧的转换过程中没有信息丢失，所以接受 m y p r o t o c ol 的操作可以选择把 m du 帧直接送到改变过的 m p3 解码器，或者把它们再转变为m p3帧，为了学生机播放软件的通用型，我们选择第二种方法实现m p3 文件的播放。对一串 m p

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf

文档简介

温馨提示

最新文档

评论

（计算机系统结构专业论文）基于嵌入式的数字语音教学系统研究与设计.pdf

文档简介

温馨提示

最新文档

评论

相关文档