




已阅读5页,还剩48页未读, 继续免费阅读
(计算机系统结构专业论文)基于嵌入式的数字语音教学系统研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ab s tract 铂ththe n e v e r-en d i n g d e v e l o p m e ntand i m p r o v m ent o f c o m p uter s c i e n ce , n e 。 刀 o rk te c hoo l o gy h as al re a d yb e c o me th em ai n t r e amo fm o d e m e d u c a t i o nin the wo r l d . f u rtherm o re , the a p p l i cati o n o f th e d i gi tal r a d l o 一 te ac h i n g s y s l e mh astakenfo n d 印 旧 ental c h ang e s toth er a d i o 一 t e ach i n gs y stemt hr o u gh i t s c o ni ent , m e ans ande v e nth e c o nce pts m e anw h l l e , th ed e v el opm e nto f n e 幻 内 o rk, co n r n uni c atio n and m u lti m edi a te c hoo l o g yh as o pen u p ex p ans 1 v e sp ac e fo r th e a p p 1 i c at i o n o f e n 1 be dde d s y s t e m, w h i chm a d e e m be d d ed s y st e mbe com e an o t h e r techn0 1 o gyfo c usinth e i ti n d u s 1 rya fi e r p can d i nt e m e t . i n s u c h p r e m i se , 而s th e s i sin t r 0 d uc e s the re s e archand d e s i gn o f th e 压91 因 a u d i o 一 te ac h i ng s y s t e m b ase d o n e mbed ded s y 引 e m and al s o m ake sd e i a i 1 ed d i s c ussi o n o fthe s to d ent 一 macll j l e b ase d o n e mbed d e d s y stem. to meet the nee d o f the d i gi tal r a d io-te ach i n gs y s t e m, we c o n st ructarc hi t e c 奴 叮 e o f th e s y 以 e mb as ed o n the e m bed d ed s y s l e min而s th e s i s . w 七 c h oosethe p e r s o nal c o m p ul e r for t eac h ers , t e rmi nal and d esi gn the e m bed d e d sys t e masstud e ni st e n ” in alb y o urse l ves . due tothe c h a ra c t e ri 州co f this sy 引 e m , we hav e the 1 n t e rr e l at e dp r o t o c o l cut d o wn and sc h em e o uta n ew o ne c a l l e d my p rol o 0 1 . w七 acc o m p l i s h the fi i l 1 otio n o f th e m anage m ent fo r t e a c hi n g t e n n i nal andd i sc uss th e 引 刀 d e n t s , 抚 n 刀 i nal b ase do nthe em bed d e ds y s t e mi n d e t a l l . wei m p l e m e n t c onc e r n e ddriv e rso f t he s tu d e nts, t e n n i nal b ase do ns u c c e ss fu l l y t r ansp l an t i ng the p c /o5 一 i l toth e i m be d d e ds y st e m . to s u p portthe ap p l i c at i on o f the 就 u d e nts , t e rm1 nal we c o m p l et e the n e two r kp r ot oco l s p r o gram. i n th e e n d , we p ro v i d e the res u it. k e y w o r d s : e m b e d d e d s y s t e m , 成/o5 一 1 1 , 5 3 c 4 4 b 0 , 1 1 5 声明 本学位论文是我在导师的指导下取得的研究成果, 尽我所知,在本 学位论文中,除了加以 标注和致谢的部分外, 不包含其他人已 经发表或 公 布过的 研究成果, 也不包含我为获得任何教育机构的学位或学历而使 用 过的材料。与我一同工作的同事对本学位论文做出的贡献均已 在论文 中 作了明 确的说明。 研 究 生 签 名 : 尊 袅 一州 却月 、 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或 上网公 布本学位论文的 全部或部分内容,可以向 有关部门 或机构送交并 授权其保存、 借阅或上网公布本学位论文的 全部或部分内 容。对于保密 论文,按保密的有关规定和程序处理。 研 究 生 签 名 :.遗 鼻 一 -知 夕 年 沙日 绪论 本章简单介绍了课题研究的背景、 课题的提出, 并给出本课题的主要工作及文章 的组织结构。 课题研究的背景 近年来, 随着网络的普及以及校园网资源的广泛应用, 模拟语音教学系统愈来愈 不能满足教学应用的需求, 怎样发挥语音教学系统的教学作用, 怎样使网络教学资源 在语音教学上得以应用, 怎样使语音教学系统与校园网相连, 做到无缝连接?答案只 有一个, 就是实现语音教学系统的数字化和网络化。由于技术的发展, 尤其是网络技 术的发展使这一要求成为现实,数字语音教学系统应运而生。 我们以前接触的语音教学系统都是基于模拟信号的, 就像我们以前应用的卡式录 音机、 模拟手机等 等。 长期以 来, 模 拟信号的产品为 我们的 生活提供着服务, 但随 着 时代的发展, 模拟产品的功能已经不能满足社会多变的需求。 模拟语音教学系统的稳 定性较差, 音质不理想, 大多数为单声道, 系统功能单一,教学交互性差,所有的模 拟语音教学系统在上课后只能闲置, 没有任何利用的空间。 下面将从两个方面阐述数 字语音教学系统与 模拟语 音教学系统的异同 川 。 ( 1)结构设计 模拟语音教学系统的核心设备是录音机机芯,结构设计就是以录音机机芯为主 体, 通过各厂家自 行定义的电缆将所有学生录音机与教师主录音机相连, 然后再将音 源设备 ( 如录像机, v c d 等设备)的音源信号接入,构成整个系统。由于机芯本身就 是 机械结 构, 即使 是电 控机芯, 机械部分也占整 个结构的9 0%以 上的比例,由 于 机芯 的机械运动, 震动、 磨损所造成的故障是模拟系统中最常见的问题。 又由于产品连接 线缆及 连接方式均为 厂商自 定义, 因此产品 连接复杂, 故障率高, 用户无法进行维 护 和维修。 数字化语音教学系统的核心是基于计算机传输协议的网络技术, 整个系统几乎没 有机械部 件, 故不存 在机械故障。 多媒体网 络语音室的 数字化系统中, 所有设备都 是 由 标准的网 络系 统与计 算机设备 组成, 与我们常见的 计算 机局域网 设备一样, 它们的 高效稳定己被我们所熟知,从而确保了产品的稳定性。 (2) 应用效果 传统语音教学系统长期以来一直在语音教学上为我们提供着服务。 语音教学体统 作为教师进行外语教学的辅助设备, 其对锻炼学生的听说能力起到一定的作用。 但由 于技术实现方式 的落后, 大多 数系 统至今 还停留 在 单声道。 同样由 于 相关实 现方式 技 i 硕卜 论文摹十嵌 入式的数宇 语音 教学系统研究j 设 计 术的落后, 模拟语音教学系统在课余时间大部分闲置, 成为学校中利用率较差的一种 资源。 数字化语音教 学系统 与模拟有着明 显的区别。 数字 化语音教学系 统不仅消除了噪 声干扰, 而且音质也可达到专业的立体声音质效果。从教师应用上看, 教师对教材的 准备只需点击鼠标即可完成, 整个过程简单方便。 从教材的选择上, 丰富的教学资源 相当于几十所学校所有资料的总和, 教师不再为资料的收集和保存而烦恼。 基于磁带 的变调和绞带现象都不再出现。 从学生的应用上来看, 学习的范围不再局限于教师所 带的磁带, 每个学生都可以通过自由点播, 阅读或自习的方式使用校园网上提供的海 量资料。 多语种、 多年级都可以在同一时间内共享语音教室。 甚至可以利用终端边听 音乐边看参考书。 从学校语音室的建设上来看, 语音教室将成为一种真正的语言教学 系统,其利用率将成倍提高。从另一角度看,数字化语音教学系统相当于语音教室, 电 子阅览室,模拟考场,电子听音室等各种系统的综合。另外,整个系统的稳定性、 易 用性、 易维护 等都是模 拟语音教室 所无法比 拟的 2 . 数字化语 音教学系统 是建立在网 络资料交换 的基础上的, 将经过a /d转换后的语 音资料或音频的数据文件, 通过标准的网络协议, 传送给用户终端。网络及终端之间 的传递符合标准网络协议, 可以达到语言学习的良 好音质, 从而满足教学在形式上多 样性的 需求, 是一 种组建 合理和资 源利用充分的 全新的语 音教学系统15 。 现在有些学校利用已 有的机房,在 pc 机上安装语音教学软件,从而实现语音教 学的数字化, 虽然这样可以在已有资源的基础上花费较小的成本实现语音教学系统的 数字化,但由于 pc 机可用资源的丰富性,学生容易迷恋电影、游戏等娱乐项 目,造 成上课开小差,影响学习效率。另一方面, 机房与语音室两者合一,造成学生上机时 间和学生上语音课容易冲突,学生课下没有机会自 主进行听力练习。鉴于以上情况, 本课题设计了用于普通教室的基于嵌入式的数字语音教学系统。 1 . 2课题的提出 “ 数字 式音频技 术的 进步导 致了计 算机和网 络的 革命, 并为 计算机系 统和应用开 拓了 新的设 计空间” 们 , 这是美国计算 机学会 1 9 9 3 年多媒 体技术国际会议 程序委员 会主席p . v enk at r ang an ( 加 利福尼亚大 学) 在论 文集前言中的 第一句话。 这充分说 明了数字化技术和多媒体技术的优势及其发展趋势。目前大、中、小学校的语音教室 大多数是模拟信号的语音教学系统。这种语音教学系统不能满足如今教学方式多元 化, 学生学习自主化的要求。为了更好的满足教学增长和多数用户的需要, 我们将否 定 在机房上实 现语音教 学系统数字化的方 案, 提出 基于嵌入式的 数字语音教学系 统, 设计了数字语音教学系统的整体方案。该语音系统是采用数字音频、编解码、存储、 液晶 显示、网 络通信 等高 新技术的多 媒体语音 教学系统,教师 机采用pc机,学生 机 采用本课题自 行设 计的嵌 入式终 端。 在教 师机上 运行服务 程序, 实 现双方 高质量的数 字化通信, 并且可以 对学生机之间的 通信加以 控制。 教师 机和学生机不同 的配置, 实 现了高效的智能组合。 1 . 3本文的主要工作 本课 题的目 标 是建立一个整 合了 硬件、 软 件、 网 络及音 频资源的 嵌入式数字 语音 教学系统, 论文的主 要研究内 容为: ( 1)提出基于嵌入式数字语音教学系统的体系结构,并针对个性化的需求,对学 生机划分功能独立的应用模块; (2) 设计学生机的硬件平台并构架其软件平台,实现有关驱动程序的编写; ( 3)设计并实现适合本系统的音频实时传输的网络协议; (4) 设计教师机的教学管理软件功能,实现教师机服务程序的编写。 4本文的结 构 第一章, 绪论。 介绍了课题研究的背景及课题的提出, 并给出本课题的工作内容 及文章的组织结构。 第二章,相关技术介绍及本系统协议设计。简单介绍了即3 文件格式、解码的实 现方 法、网 络协议的 选择和适应 本系统的实时 音频协议 m y p rot ocol的设 计。 第三章, 嵌 入式数字语 音教 学系统的 体系结 构。 构建语 音教 学的总 体结构和 运行 模式,完成学生机的硬件平台设计,构架学生机的软件平台。 第四 章, 系统的 软件实现。 鉴 于教师机 和学生 机开发 工作量的差异, 重点介绍了 学生机设备驱动程序,网络传输协议及音频播放程序的实现。 最后, 给出系统实现的 结果。 2 相关技术介绍 及本系统协议设计 在绪论的基础上, 本章首先介绍系统实现涉及到的数字音频的格式, 针对学生机 应用的特点,对 t c p / ip 协议进行选择和裁减,根据系统实现的特点,设计适合本系 统的实时传输协议和数据包的封装方法。 2 . 1即eg 音频技术 m p e g 是运动图 像专家组( m o v i n g p i c t u r e e x p e r t s g r o u p ) 英 文缩写【 5 , ,代表m p e g 运动图 像压缩标准,这里的 音频文 件格 式指的 是 m p eg 标准中的音 频部分,即 m p eg 音频层, 具有很高的压缩率,是一种有损压缩。 根据压缩质量和编码复杂程度的不同, 划分为 三层即l ayer 一 1 、 l ayer一 2 、 l ayer一 3 。 m p eg音 频编码的层次 越高, 编码器越复 杂, 压缩率也越高。本系统选择最常见且压缩率比较高的珊3 文件格式, 下面将对其 格式进行简单的说明。 2 . 1 . imp3 音频压缩标准 m p 3是 即eg a udio l aye r3 的简写,是 20 世纪 90 年代开发成功并得到 fraunhofer hs大力支持的一种常用于播放器的有损压缩编码格式。它是利用人耳 的掩蔽效应对声音进行压缩, 使文件在较低的比特率下,尽可能地保持了原有的音质, 是目前最为流行的压缩方式, 也是现在网上收集音乐的最主要的方式, 大多数播放器 都支持 这一文件格式。 m p3格式的 声音文 件的 压缩比10 二 1 一12:1, 在不 小于1 2 8 k b p s 传输率下, 基本保持了原有音质, 正是这一特性, 使得淤3 相关产品保持着长盛不衰 6 一、 m p3 的 文件结构 即3 文 件大体可以分为 三部分, 即t a g es v z ( i d 3 v z ) 、 帧( f r 二e ) 、 t a g _ v l ( i d 3 v i ) 。 其结构如表 2 . 1 . 1 所示,三部分是按照前后顺序排列的: 表 2 . 1 , 1 即3 文件结构表 项目描述 i d 3 v z 包含了作者、 作曲、专辑等信息,长度不固定, 扩展了 i d 3 vl 的信息址 f r s l幻 e 一系列的帧. 个数由文 件大小和 帧长 决定 ; 每个 fr胡e的长度可能不固定,也可能固定,由位率 ( b itr ate) 决定; 每个 fr胡e又分为帧头和数据实体部分: 帧头记录了。 p3的位率、 采样率、版 本等信息, 每个帧之间相 互独立 i d 3 v i 包含了 作者、 作曲 、专 辑等信息,长 度为1 2 8 b y t e 硕卜 论 义篆十联入式的数字 语音 教学系 统研究 , 设计 二、 m p 3 文 件中 的 帧格式 经过压缩后的m p3 文件数据由多个帧组成, 帧是 m p3 文件最小组成单位。 帧的格 式 如图2 . 1 . 1 所示。 每 个帧又由 帧头、 附加 信息和声 音数据组成。 每个帧播放时间 是 0 . 0 2 6秒,其长度随着位率的不同而不等,有些 m p3 文件末尾有些额外字节存放非 声音数据的说明信息。 h e 耐 e r ( 4 b y tel cr c ( o o rzb y 比 ) s id ein fo ( 1 7 o r32 b 州e ) ma in ,山. an c il l a ry.山t a 图2 . 1 . 1帧的 格式 帧头( header) 包含同步码和状态信息。错误检查( crc)部分包含错误检测信息, 这部分依据帧头信息中保护位( p r o t e c t i o n 一 b i t ) 的状态可选。 侧信息( s i d e 一 i n f o )中 包 含解码所需的 辅助 信息,其长度依声道不 定, 单声 道为 17 字节, 双声 道为32 字 节。主数据 ( 枷in一 d ata)是真 正的抽样值编码数据 ,它的长度可变 。辅助数据 ( a n c i l l a r y 一 d a t a ) 由 用户自己 定义。 ( 1)帧头 格式 帧头长4字节, 对于固定位率的m p3 文件, 所有帧的帧头 格式一样, 其数据结 构如下: t y p e d e ff r ajne h e a d e r u n s i g n e di n t s y n: 1 1;刀 同步 信息 u n s i g n e di n t v e r s i o n: 2:/ 版本 u n s i g n e di n tl a y e r: 2;/层 u n s i g n e di n t p r o t e c t i o n: 1;/ c r c校验 u n s i g n e di n t b i t r a t e: 4:刀 位率 u n s i g n e di n t f r e q u e n c y: 2;/ 频率 u n s i g n e di n t p a d d i n g: 1:刀 帧长 调节 u n s i g n e di n t p r i v a t e: 1;/ 保留 字 u n s i g n e di n t m o d e: 2;刀 声 道 模 式 u n s i g n e di n t m o d ee x t e n s i o n: 2:/ 扩充 模式 u n s i g n e di n t c o p y r i g h t: 1;/ 版权 u n s i g n e di n t o r i g i n a l: 1;刀 原版 标志 u n s i g n e di n t e m p h a s i s: 2;/ 强调 模式 h e a d e r,l p h e a d e r : 帧头4 字节使用说明见表 2 . 1 . 2 。 硕1 一论文基士 丛 立感的 数宇语音 教 学系 统研究与 设计 表2 , 1 . 2即3帧头使用说明 名称长度 ( 位) 说明 同步信息 l l 第1 , 2 字 节 所有位均为1 ,第 1 字节恒为ff 0 0 一 m p 比2 . 50 1 一 为定义 1 0 一m p egzl l 一p e g i 版本2 0 0 一 为定义 0 1 一 l a y e r 3l o 一l a y e r zl l 一 l a y e r l 层 2 0 一校验 1 一不校验c r c校验 l 位率4 第3字 节 取 样率, 单位k b ps, 采样频率,对于m r 那1 :0 0 一 44. i k hz 0 1 一 4 8 khz l o 一 3 2 khzl l 一 为定义 频率2 用来调格文件头长度.0 一 无需调整,卜调招 帧长调竹1 保留字 l 没有使用 声道模式 2 第4 字 节 表示声道, 0 0 一 立体声, 0 1 一 j o i n t s t e r eo,1 0 - 双声道,1 1 一 单声道 当声道模式为01 时才使用扩充模式 2 文件合法性 0 一 不合法,1 一 合法 版权l 是否原版,0 一 非,1 一 是 原版标志 曰 声音压缩后的再补偿分类,0 0 一 为定义, 0 1 一 5 0 / 1 5 m s ,1 0 一 保留,1 1 一c i tt. 1 7 强调方式 2 ( 2 ) c r c 校验 可选,占用2 个字节。 使用的错误检 测方法 “ c rc一 16” , 其发生多 项式为g ( x ) 二 驴+x15+ 扩 +1。 ( 3)帧侧信息 帧的侧信息包含了解码所需的一切信息,如主数据开始指针、主数据位数、与 h u f f 阳n 解码相关的信息、与逆量化相关的信息等。具体内容见表2 . 1 . 3 。 三、i d 3标准 m p 3 帧头中除了 存储一 些像p r i v a t e 、 c o p y r i g h t 、 o r i g i n a l 的 简单音乐说明 信 息以 外, 没有考虑 存放歌名、 作者、 专辑名、 年份等复杂信 息, 而这 些信息在m p3 应 用中非常 必要。 1 9 9 6 年,f r i c k e o p 在 “ s t u d i o 3 ” 项目 中 提出 t 在 m p 3文件尾部 增 加一块 用于存放歌曲的 说明信 息,形 成了i d 3 标准, 至 今已 制定出i d3 vll0 ,v l l l , vz10, vz13和v z1 4标准。版 本越高, 记录的 相关信息就越 丰富详尽。 i d 3vllo 标准并 不周全, 存放的 信息少,无法 存放歌词, 无法录入专辑封面、 图 片等。 v z 10 是一 个相当 完备的 标准, 但给编写软 件带来困难, 虽然赞成此格式的 人很多, 在软 件中 真正实 现的 却极 少。 绝大多数m p 3仍使用id 3 vllo 标准。 此 标准 是将 淤3文 件尾的 最后 1 28 字节 用来 存放 i d3 信息,这 12 8字节使用说明见 表 2 . 1 . 4 7 。 表2 . 1 . 3帧的侧信息 描述 比特数/ bit 单声道 c h 二 0 双声 道 c h = 1 主数据开始指针 ( m a i n _ d a t a-b e g i n ) 9 9 私有位 ( p r i v a t e _ b i t s ) 53 两个粒度共有选择信息 ( s c r s i c h l s c f s i _ b and ) 吸 * 1 2 * 4 * 1 粒 度 组 l 的 边 信 息 且 p gr 二 o 主数据位数 ( p a r t z 一 3 一 l e n g t h g r c h ) 1 2 2 * 1 2 大值 b i g _ v a l u e s 【 g r c h 9 2 * 9 全局增益 ( g l o b a l _ g a j n g r 【 c h ) 82 * 8 比例因子压缩 ( s c a l e f a c _ c o m p r e s s g r c h )l 4 2 * 4 窗tjj换标志 ( w i n d o , _ 5 , l t c h i n g _ r l a g g r c h ) l 2 * 1 窗切换 标志为 “ 1 ” 时 块类型 ( b l o c k _ t y p e 【 g r l c h l ) 22 * 2 混合块标占 ( . i x e d _ b l o c k _ f l a g )l 1 2 * 1 表选择 ( t a b l e _ s e l e c t g r r e g i o n ) r e g i o n : 0 , 12*5 一 1 2 * 2 * 5 子块增益 ( s u b b l o c k _ g a i n g r c h , i n d 姗 ) w i n d o ,: 0 , 1 , 2 3 * 32 * 3 今 3 窗切换 标志为 “ 0 , 时 表选择 ( t a b l e _ s e l e c t 【 g r 【 r e g i o n r e g i o n : 0 , 1 ,2a * 5 一1 2 * 3 * 5 区域0 一1 ! 数 ( r e g i o 二0 一o u n t g r l c h ) 42 申 4 区域 1 一1 卜 数 ( r e g i 伽 1 _ c o u n t 汇 g r c h ) 32 * 3 预标志 ( p r e f l a g g r 【 c h l ) l2 * 1 比例因子压缩 ( s c a l e f a c _ c o m p r e s s g r l c h ) 1 2 * 1 计数1 表选择 ( c o u n t _ t a b l e 一 s e l e c t gr c h ) 1 2 水 1 粒度组2的边信息即,gr=1 同粒度 组 l 同粒 度组 1 总 占用的字节数1 7字节 3 2字 节 表 2 . 1 . 4i d 3v l l o文件尾说明 字节 长度/ 字 节 说明 1 33 存放 卜 以c ”字符,表示i d3 vl. 0标准,紧接其后的是歌曲信息 4 3 33 0歌名 3 4 6 33 0作者 6 4 一 9 3 3 0 专辑名 9 4 一 9 74 年份 9 8 1 2 7 3 0 附注 1 2 81 m p3音乐 类别, 共14 7 种 2 . 1 . 2姗3 解码原理 在m p e g 一 1 规范中 没有对 编码器做明 确的 规定, 但规定了 解码器。 淤eg数 据是按 照帧传送的,每一帧可以 独立解码,在m p e g 一 1 中,层 2 和层 3 的帧长度是一样的, 但层3 中的比 特数 是可以 改 变的, 可以 根 据音频 信号的编码要求 进行灵活分配。 mp3 解码器首先 要对输 入比 特流同步, 读出 标题。 在读取了帧头之 后, 开 始读取 侧信息。 然后再对主 数据进行 解码。解码 流程如图2 . 1 . 2 所示。 7 图2 . 1 . 2 淤3 解码流 程图 在解码的过程中, 输入的主数据都要驻留在输入缓冲区中。 主数据的起始用目前 的“ 主数据开始指针” 定位。当下一帧的标题到达传输缓冲区时,所有主数据都驻留 在输入缓冲区中。 解码主数据时, 解码器必须跳过标题和侧信息。 他们的位置可以从 比特率标记和填充位知道。 主数据能够跨越于一个块的标题和侧信息。 接下来,进行 主数据解码, 根据比例因子和霍夫曼码字进行霍夫曼解码。 霍夫曼解码输出的数据再 进行非均匀反量化,反量化之后,重构值再进入合成滤波器组之前,要对 邓 或强度 立体声模式或者两种模式进行处理。 对于混合块和长块在做 imoct 之前要进行混叠信 号的 消除,即 对数据进行 重排ia: . 2 , 2 网络传输协议的选择和设计 教师机采用的w indows 操作系统集成了几乎所有的网络协议, 而基于嵌入式的学 生机,鉴于本身资源的限制, 必须对网络协议进行选择和必要的裁减, 必要时还需要 自 行设计符合 自 身的协议19 。 2 . 2 . 1学生 机tcp / ip协议的 选择 网络接口层主要作用是为其上层协议发送和接收数据包提供服务, 其有多种接入 网 络的方法,本系统学生机采用 r t l 8 019 as 以太网芯片方式接入 i nternet 方式, 所 以 此层我们实现以太网协议. 网络层主要负责处理数据包在网络中的协议封装工作。由于底层实现以太网协 议, 而以 太网上数据的 传输是采用网 络的撇c 地址来进 行识别的, 这 就要求系统有实 现 ip 地址到以c 地址的转换的功能,即a r p ( 地址解析)协议.ip协议是 t c p / ip族 的核 心协议,需要 跨越不同的网 络进行 通信就必须 要实现ip协议。 在t c p / ip协议组中, t cp 协议是 一种面向连 接的协议【 10 。 为保 证数据传输的 可 靠性 做了 大量工 作, 实现的复杂, 网 络开销很大, 给数据的 传输带 来很大的时 延, 对 实 时 音频传输来说 这个时延大大 超过了人 耳所能容 忍的 程度。 相对于t c p 协议, u d p 协议减 少了确认、 同 步等操作, 节省了 很大的网络开 销, 它能 够提供高 传输速率的数 8 据 报服务 , 在数 据的实时 传输中应用广泛【 , ” 。 因 此在 本系 统的研究中, 采用u dp协 议 进行音颇数据的传输。 2 . 2 . 2 实时音频流协 议的设 计 对于有三四十台终端的小型局域网, 网络传输的q os 不是问题。 针对多媒体的实 时传输要求,i etf 提出了实时传输协议 r t p 。r tp 为数据提供了具有实时特征的端对 端传送服务,如在组播或单播网络服务下的交互式视频音频或模拟数据。r t p 协议的 结构如图2 . 2 . 1 所示: 3 里 3 0292 82 724232 2 61 5一0 v 留 2pxc cm曰 5 闪 峋 ccn um 加1 s n ) t ill l“1. i lp 5 扣d 厄 佣 吐 川 沁 . 女胆州 s s r c )l 山 , 吸 1幻 口 c o 川 州园1 昭5 山 盯 “( csr c ” 山 , 石 止 址 . 图2 . 2 . i r t p 包头的 结构 rtp 包头的编码格式中: cc占4 bit s ,c s r c ( 贡献源) 计数。指明固定头后有多少个c src标志符。 c s r c ( c o n t r i b u t i n gs o u r c el d e n t i f i e r s ) 0 一1 5项、 每项占 4 b y t e , 贡献源表。 用以 识别与r tp 包中 负 荷相关( 提供负荷) 的源ij2。 然而,在实现教师机向学生机发送数据包的过程中,信息的类型仅为音频文件, 资源贡献源仅为教师机,从而 rtp 中的c s rc和 cc 字段将产生冗余。作为传输音频, 视频等多媒体信息的 r tp 协议在仅传输音频文件的系统上, 其通用性特征将降低数据 包的解包和封装的效率。 为了实现整个系统在实现语音教学过程的专用性, 提高系统 资源的 使用效率, 我们 将借鉴r t p 协议总 体框架, 重新设定 相关字段, 裁减原有协 议 的 冗余, 以 达到学生 机精简, 高效, 专用的 要求, 自 行设计 适合本系 统的 实时传输 协 议,称为m y p rot ocol,以 保证教师机和学生机 音频播放的同 步性。 2 . 2 . 2 . 1 协 议设计的 关键点 ( 1 ) 帧设计 帧的设计是实现协议的核心之一, 协议运行时, 以设计好的帧格式形成分组,并 在不同 的 工作点之间 交换一 个设计良 好的 帧应该 在尽可能 简洁的 前途下 满足所有的 需求,并且应有一定的可扩展性。本文根据具体的应用环境设计适合本系统的帧。 (2) 分组序号与时间戳 每一个分组都具有序号与时间戳。 为了保证接收点按采集时的时序播放, 发送点 将采集时的时间计入分组的时间戳域。 在某些情况下, 不同发送顺序的分组可能具有 相同的时间戳 ( 比如立体声的左右声道) ,所以又需要序号域来表示分组的发送顺序 以 便接收方按发送顺序组织分组。 ( 3)分组的丢失 对于基于一个小型的局域网, 分组丢失的概率很低, 而对于实时性要求很强的音 频流,重传机制的实现会加大系统运行的负荷,本系统在实现时没有考虑重传机制。 ( 4)对抖动的补偿 此协议是基于分组交换的网络。 这样, 不同的数据包从同一个发送点到达同一个 接 收点的时延也 会有所不同 lal 。 时 延的 变化 ( 称为抖动) 会对接收 端正 确播放实时音 频流带来一定的困难。 为此, 本文以链表的形式在学生机建立并维护抖动缓存, 并设 定了一个播放门限k , 只有当到达的音频数据包的数量到达k 值时, 才允许解码播放。 2 . 2 . 2 . 2脚p r o t o c o l 协议的设计 该协议位于u dp协议之上,它 们共同完成 传输层的 功能。对于 脚protocol协议, 其本身并不提供任何确保及时传送的机制或者其它的服务质量( q os) 保证,也没有规 定恢复丢失数据报的任何机制,而是依赖低层所提供的服务来完成这些功能。 m y p r o t o c o l 协议是由u d p 报文来传递 m y p r o t o c o l 数据。 m y p r o t o c o l 协议数据没 有 长度字节和其他 边界, 由 下层网 络协议来提供一 个长度指示。 采用u d p 作为下层协 议的 数据封装如图2 . 2 . 2 所示: my pro ,l p ay l i p卜 e a d 盯 my p r o 加 c o l h e a d 盯 m) p r0 1 oc0 l p ay1 0 目 u d phead cr my p r o t o c o l he 耐er my p r0 1 oco 1 pay t o 叻 【 】d ph ead 口 my p 1 0 l ocol h e a d e r my 竹o i oco i p ay】 0 司 图2 . 2 . z m y p r o t o c o l 数据的封装过程 一、 m y p r o t o c o l 协 议 每 个m y p rot ocol的数据包都由 一个头部和不定长的媒体数据组成, m y p rot oc ol 包头结构 如图 2 . 2 . 3 所 示。 3 1 3 0加2 吕2 7 2 42322l 5 5 o q u 翩“ n o m比 叫 s n ) s y n 曲r ” 11 乙 翻 伙 川5 川 叮 ss r c)l 山川 1爪 r 湘 沁 ” 仍:表示未用 图 2 . 2 . 3m y pro t o c o l 协议报头 表 2 . 2 . 1报头 t ag 与叮 字段的涵义 tagv a l u em e s s a g e 0 不用,如果收到这种类型的消息,认为是无效消息。 l 音频数据, 其编码类刑杏看pt选项 2 传送文件诸求,请求传输的文件名杳看 叩t ion 选项 3l 网 络 的 状态 反 馈 , 反 馈 信 息 卉 看。 p t i o n 选 项 4 传输文件请求应答 5 终 卜 文 件请 求 6 终止文件请求应答 m y p r otocol报头的 编码格式如 下: v e r s i o n占z b i t s ,版本号,为1 t a g 占 4 位, 描 述包的具体 类型。 t ag值表 示的含 义见表2 . 2 . 1 所示。 当t ag二1 时, 盯表示的声音有效载荷的类型,具体表示含义见表2 . 2 . 2 所示。虽然本系统只实现了 m p 3 音 频文件的传输, 为了 系统以后 的扩展定 义了 其 他的 编码 格式。 表2 . 2 . zpt有 效载荷号 pi有效载荷号 声音类型 采样率 ( khz )数据率 ( k b / 5 ) 0p c m m u 一 l a w 86 4 l一11 0 1 61814 . 8 2一 ig . 了 2 11 8 3 2 3一 1o s mi8113 2 6一id v ll11 6 6 4 7 l p cl8 2 . 4 9g . 7 2 2 8 4 8 “ 6 4 l 4 m p 所l a y e 亡1 1 1 9 0 巧g . 7 2 88l 6 s n ( s e q u e n c e n u m b e r ) 占 z b y t e , 包序列号。 接收 端可以 通过序列号检测 数据包 传 输过程中的丢包情况以及失序情况。序列号的初始值是随机分配的。 t i m e s t 胡p 占 4 b y t e , 时间 戳。 描述 m y p r o t o c o l 包中数 据的 采样时刻, 主 要用于同 步和计算 时延。 时 钟频率和数 据格式有关, 不能使 用系统时 钟。 对固定 速率 的音频 来 说,每次 取样时间 戳时 钟增1 。与 包序列号一 样, 时间 戳的 初始值也是 一随机数。 如 果 多个连 续的 m y p rot ocol包在逻 辑上是同时 产生的, 那么 它们的 时间戳 相同. l l s s r c :同 步源 标识 符, 32位, 标识了不同的 流。 同样应该 随机 选取。 接收方以 发 送方 的ssrc与发 送方ip, p ort 相结 合的方式来判别 一个流。 只有 在上述三者 均与接收 队 列中的记 录一 致时, 才判定收到的 包是属于同一 个流的, 否则 就应该丢弃 或作别的 处理 。 即t io n : 可选择项, 其是否 存在和本字段 表示的意义 及长 度由 t ag定义, 具体见 表2 . 2 . 1 所示. 当m y p r o t o c ol数据分组发生失序时, 其中所包括的顺序编号使得接收方能够复原 发 送方的分 组顺序。 但若发送的 m y p rot ocol分 组丢失时, h y p rot ocol自 身 无法解决 恢 复丢包的问题。 这就需要将一些协议或方法与m y p rot ocol集成, 协同应用。 对于分组 丢失问题,m y p rot ocol可以采用编码的方法来恢复丢失的分组。 2 . 2 . 2 . 3 m y p r o t o c o l 协议数据 封装方法 m p 3 帧并 不是一 个真正 的应用数 据单元, 用 于解码的 帧的 主数据的 起始位置并 不 一定在该帧的侧信息后, 而是根据帧的侧信息中主数据开始的值来决定主数据起始位 置的前移字节数。典型的m p3 的位流组织如图2 . 2 . 4 所示. 图2 . 2 . 4mp3比特流 一个 m p3 帧中包含了一个指向前面帧数据的指针, 所以不能和前面的帧分开来单 独解码,m p3帧的丢失会致使之前帧的数据没有作用,即使之前的帧接收时没有发生 丢失 。为了改 变这种现象, 我们定 义一种新的帧 类型的应 用数据单 元, 简称姗 u 帧, 其文件结构的定义 同 m p3 文件结构 ,只是 mdu 主数据 是从这个 mp3帧的 “ 。 a i 几 d a t 几b e g i n ” 指 针的 开始到 下一个” p 3 帧的 “ m a i n _ d a t 屯b e g i n ” 指针的 开始. 在一 个m y p rot ocol包的 负载中, 每一个m du 帧前 面有2 字 节的m du 描 述符, 它 给出了姗u的大小并指明这个包是否是上一个包数据包的继续, 这种情况只会在一个 脚protoc ol包中 放不下 一帧的m p3数据时发生。 其定 义如下:( l) c : 继续 标志1 位, 如果 包中数 据是 上个包中 数据的继 续置为 1 ;否则 为 0 ;( 2 ) m du size:巧位, 是以 字节 为单位, m du帧的大小, 不包括m du 描 述符本身的 大小。 m du描述符的格 式如图 i 2 2 . 2 . 5 所示。 图2 . 2 . 5即u 描述符的 格式 一 个m y p rot ocol数据包由 一个m du描述符开始, 然后是mdu 帧数据。这 个m du 描述符和 m du 帧在 m y p rot o c ol 包中会完全合适。然而如果一个单独的m du 描述符和 初 u 帧对于 一个m y p rot ocol 数据包来说 太大了 ,那 么 即u 帧被断开为两 个或者 更多 个 连续的m y pr otocol包。每一 个这样的 包开始于 一个朋u 描述符。 第一 个包的 描述 符的“ c ” 为0 ; 剩下的 包的 描述符都为1 。 每一 个描述符在这种情况下 有同 样的姗u s i z e 值, 即m du完整 帧的大小。 由于在从一串 mp3帧到一串 m d u帧的转换过程中没有信息丢失, 所以接受 m y p r o t o c ol 的操作可以选择把 m du 帧直接送到改变过的 m p3 解码器,或者把它们再 转变为m p3帧, 为了学生机播放软件的通用型, 我们选择第二种方法实现m p3 文件的 播放。 对一串 m p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45487-2025船舶与海上技术海上环境保护船舶燃油消耗数据收集规范
- GB/T 38205.2-2025液压传动16 MPa系列单出杆缸的安装尺寸第2部分:缸径25 mm~220 mm紧凑型系列
- 考试过程中情绪管理的重要性与实践试题及答案
- 软件开发合作协议
- 项目管理考试的前瞻性分析试题及答案
- 2024新教材高中政治 第四课 只有坚持和发展中国特色社会主义才能实现中华民族伟大复兴 4.3 习近平新时代中国特色社会主义思想教学设计 部编版必修1
- 2025年金融理财师考试伦理决策思维训练及试题答案
- 提高项目管理考试自信的有效途径与试题答案
- 财务报表分析与特许金融分析师考试试题及答案
- 2025年金融市场法规和监管试题及答案
- (三诊)绵阳市高中2022级高三第三次诊断性考试 历史试卷A卷(含答案)
- 麻醉专业考试试题及答案
- 湖南省长沙市长郡教育集团2024-2025学年七年级下学期期中生物试题
- 山东省高中名校2025届高三4月校际联合检测大联考生物试题及答案
- 汽车漆面保护膜安装协议
- 直肠癌护理新进展
- 2024北京八中高一(下)期中英语试题及答案
- 2024-2025学年接力版小学英语五年级下册(全册)知识点归纳
- 浅谈南京市区地形地貌和工程地质层构成
- 【模型与方法】2025届高考物理二轮复习热点题型归类计算4 电磁感应综合计算问题(原卷版)
- 功率因数及功率因数的提高电工基础课件
评论
0/150
提交评论