(信号与信息处理专业论文)广播音频编辑与制作软件的设计与实现.pdf_第1页
(信号与信息处理专业论文)广播音频编辑与制作软件的设计与实现.pdf_第2页
(信号与信息处理专业论文)广播音频编辑与制作软件的设计与实现.pdf_第3页
(信号与信息处理专业论文)广播音频编辑与制作软件的设计与实现.pdf_第4页
(信号与信息处理专业论文)广播音频编辑与制作软件的设计与实现.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(信号与信息处理专业论文)广播音频编辑与制作软件的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着广播电台数字化和数字音频技术的不断发展,将数字音频技术与i t 计算 机技术相结合的专业音频编辑与制作软件,作为广播电台重要的音频节目制作工 具,已得到了广泛的应用,并成为数字化广播电台节目生产流程的重要组成部分。 其功能、效率以及稳定性和准确性是专业音频编辑与制作软件优劣的重要指标。 本论文详细探讨了专业音频编辑与制作软件的设计与开发过程。以c 、c + + 语言为工具,设计并实现了一套基于p c 音频工作站的稳定性好、可用性高的音 频编辑软件。论文首先介绍了相关数字音频技术的知识和现代音频编辑技术的优 势,其次分析了广播电台行业的应用环境,及该环境对音频编辑与制作软件工具 提出的要求。为满足软件的稳定性要求,本文设计和实现了各种数据结构,统称 为编辑决策列表。为了保证音频编辑的准确性和可视性,本文还设计了产生能量 文件的方法来实现音频波形的准确快速显示,并且设计和采用缓存技术,提高了 节目编辑制作效率。文中详细介绍了此软件的设计及实现过程,包括功能需求分 析、模块划分、模块结构、功能实现流程等。 通常用户在进行节目制作时如果使用了不同格式的素材,需要对素材进行格 式转换,耗时地解码和编码,不仅效率低,而且反复的压缩编解码也影响音频质 量。本课题所研究的广播音频编辑与制作软件的特色之处在于它能够实时地跨格 式、跨采样率和跨比特率进行播放、录音和编辑。该特点借助了能量文件,采用 编辑决策列表的方式,避免了直接对素材进行二次压缩解码,并支持多轨编辑, 同时本软件设计了方便性强的可视化音量声相曲线调节功能,完全达到了“所见 即所得”的效果。这些特色功能的实现能够更好地满足广播电台的需求。 关键词:音频编辑与制作,能量文件,编辑决策列表 a bs t r a c t w i t ht h ea c c e l e r a t i v ed e v e l o p m e n to fd i g i t a lb r o a d c a s ts t a t i o n sa n dd i g i t a la u d i o t e c h n o l o g y , t h ep r o f e s s i o n a la u d i oe d i t i n ga n dm a k i n gs o f t w a r e ,w h i c hi st h em o s t i m p o r t a n tt o o lo fm a k i n ga u d i op r o g r a m s ,h a sb e e na p p l i e dw i d e l ya n db e e na n i m p o r t a n tc o m p o n e n to fp r o d u c i n gp r o g r a m si nd i g i t a lb r o a d c a s ts t a t i o n s f u n c t i o n s , e f f i c i e n c y , s t a b i l i t ya n da c c u r a c ya r ei m p o r t a n tc r i t e r i o no ft h ep r o f e s s i o n a la u d i o e d i t i n ga n dm a k i n gs o f t w a r e t h ed e s i g np r o c e s so fp r o f e s s i o n a la u d i oe d i t i n ga n dm a k i n gs o r w a r ei s d i s c u s s e di n t h i sp a p e r w i t hc ,c hl a n g u a g e , w er e a l i z eg o o ds t a b l ea n dh i g h u s e f u l n e s sp r o f e s s i o n a la u d i oe d i t i n gs o f t w a r ew h i c hi sb a s e do nw i n d o w so so np c f i r s t l y , k n o w l e d g eo fr e l a t e dd i g i t a la u d i ot e c h n o l o g ya n dt h ea d v a n t a g e so fm o d e m a u d i oe d i t i n gt e c h n o l o g ya r ei n t r o d u c e di np a p e r , a n dw ed i s c u s s e dt h eb r o a d c a s t s t a t i o n sa p p l i c a t i o ne n v i r o n m e n ta n di t sr e q u i r e m e n tt oa u d i oe d i t i n ga n dm a k i n gt 0 0 1 k i n d so fd a t as t r u c t u r e s ,w h i c ha r ec a l l e de d i t i n gd e c i s i o nl i s t ( e d l ) ,a r ed e s i g n e d a n dr e a l i z e dt os a t i s f yt h es t a b i l i t yo fs o f t w a r e t og u a r a n t e et h ea c c u r a c ya n dv i s i b i l i t y o fe d i t i n ga u d i o ,am e t h o d ,w h i c hi sg e n e r a t i n ge n e r g yf i l e ,i sd e s i g n e di np a p e r m s m e t h o dr e a l i z e dt h a ta u d i ow a v ei sd i s p l a y e da c c u r a t e l ya n dr a p i d l y , a n di td e s i g n sa n d u s e sb u f f e r st or a i s ea u d i oe d i t i n ga n dm a k i n ge f f i c i e n c y t h ed e s i g na n dr e a l i z e p r o c e s so ft h i ss o f t w a r ei si n t r o d u c e di n t h i sp a p e r , i n c l u d i n gf u n c t i o nr e q u i r e m e n t , m o d u l ed i v i s i o n ,m o d u l es t r u c t u r e ,r e a l i z i n gf o wa n ds oo n w h e nu s e ru s ed i f f e r e n tf o r m a tf i l e st om a k ep r o g r a mi no n ep r o j e c t ,i tn e e d s c o n v e r tt h ef i l ef o r m a ta n ds p e n dm u c ht i m eo nd e c o d i n ga n dc o d i n g ,i tn o to n l y d e c r e a s e se f f i c i e n c y ,b u ta l s oi n f l u e n t st h ea u d i oq u a l i t yb e c a u s eo fc o d i n go rd e c o d i n g r e p e a t e d l y s u p p o r t i n gr e a l t i m ec r o s s f o r m a t ,c r o s s s a m p l er a t ea n dc r o s s b i t er a t et o p l a y , r e c o r da n de d i ti st h em o s ts p e c i a lp a r to fa u d i oe d i t i n ga n dm a k i n gs o f t w a r e w i t ht h ea i do fe n e r g yf i l ea n de d i t i n gd e c i s i o nl i s t ,i tc o u l da v o i dd o i n gs e c o n dc o d i n g o rd e c o d i n gt os o u i c cf i l e ,a n di ts u p p o r t sm u l t i t r a c ke d i t i n g i na d d i t i o n ,c o n v e n i e n t a n dv i s i b l ev o l u m ea n dp h a s ec u r v ea d j u s t i n ga r ed e s i g n e di ns o r w a r e ,i ta c h i e v e d c o m p l e t e l y “w h a ty o u s e ei sw h a ty o uw a n tg e t ”t h er e a l i z a t i o no ft h e s ef u n c t i o n sc a n i i a b s t r a c t m e e tb r o a d c a s ts t a t i o n sn e e dw e l l k e y w o r d s :a u d i oe d i t i n ga n dm a k i n g , e n e r g yf i l e ,e d i t i n gd e c i s i o nl i s t i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明 确的说明并表示谢意。 签名: 蕉弛盔日期:2 唧年牛月2 8 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:签狃盎 导师签名: 日期:2 卿 一 日 一 坫 垃恁f 月 进一争 交年 第一章绪论 1 1 研究背景与意义 第一章绪论 自从本世纪二十年代广播开始普及以来,作为大众传媒,广播对近代的社会 进步和经济发展起到了巨大的推动作用。同时,作为电子传媒,广播亦与社会发 展、科技进步息息相关。当今世界已进入一个崭新的数字化时代,数字化技术正 在深刻地改变着人们的传统观念、生活方式和工作方式【l 刀。 在广播行业,广播制播网是广播电台网络中的主导网,其以数字音频工作站 为主体。广播节目的制播流程为:首先信源通过采访机、多轨录音机等采集设备 获得,其次使用音频编辑软件对广播素材进行剪辑、特效、合成等操作,然后把 制作成的节目提交播出申请,经栏目监制对节目进行内容和质量审核后,编入播 出节目单或即点即播单,以便节目播出时调用。概括起来,制播流程包括素材采 集、节目制作、播出申请、质量审核、节目编排、节目播出和资料管理等步骤。 音频编辑制作软件与主机、音频接口卡组成了数字音频工作埘3 4 】,它是数字 音频工作站的核心,承担了广播节目生产的主要任务。一方面,它可以对音频信 号进行直观的编辑和处理,并且它所带来的无损编辑、可视化操作和数据及时共 享是磁带等传统录音技术所无法达到的。另一方面,它又可以利用数字信号处理 技术,对输入音频信号在保证音质的同时进行压缩处理,降低了存储空间,提高 了传输率,还可以实现各种诸如:适时混合、数字去噪、时间轴伸缩等效果处理。 广播音频编辑与制作软件给广播电台带来了数字技术的应用,对广播事业发 展和服务业发展都有很大的意义。第一,变革了广播节目的制作方式和工艺,进 一步优化了节目生产流程和完善了生产方式。第二,加强了广播节目资源的整合 和利用,提高了各类资源的使用效率和效益。第三,提高了广播节目制作效率, 完善了广播电台制播系统的安全体系。第四,节目多样化提升了广播电台在多媒 体行业的竞争能力,拓展传统媒体的发展空间,为广播事业的发展带来了新的契 机。第五,使广播电台具备多媒体、多格式、多渠道的内容编辑制作能力,是广 播适应现代服务业多元化的一个关键技术支撑。这些丰富、多元化的节目才能满 足素质越来越高的听众。 广播业界正在向全面数字化、全面自动化的方向发展,其对音频编辑与制作 电子科技大学硕士学位论文 软件有很大需求。基于上述的背景,研究具有自主知识产权的广播音频编辑与制 作软件势在必行,并且有很大的市场价值和发展前景。 1 2 音频编辑与制作的发展 随着现代数字音频处理技术和计算机技术的发展,音频编辑与制作技术也得 到了长足发展,由模拟音频编辑方式向数字音频编辑方式发展,由单一功能向多 功能化发展。 二十世纪七十年代之前,音频制作条件简陋,自制节目几乎全是现场直播形 式的,对话筒拾取的信号几乎没有任何加工,声音质量和效果维持在极低水平。 随着开盘磁带录音机出现,其录音质量得到了提高。七十年代末到八十年代中期, 磁带多轨录音机和配备各种音响处理手段的调音台的出现,声音的录制、加工等 一系列工作都在录音机上进行,广播节目编辑制作方式是磁带到磁带的编辑方式, 编辑的时候,搜索素材和录制音源都必须按时间顺序进行,先编前一段,再编下 一段,直到将素材连接成新的连续声音。如果要想删除、缩短、加长中间的某一 段就不可能了,除非将那一段以后的信息抹去重录。 八十年代后期,九十年代初,随着数字录音机和计算机技术的发展,音频编 辑制作方式已经发生了很大的变化,原来的手工操作已被计算机代替,原来的“绝 活 现已无用武之地,原来不可体验的音乐效果,现已能通过不断创新的设备得 到体现。在编辑时工作流程灵活,可以不按照时间顺序进行编辑,利用了计算机 快速数据传递、数据处理和管理的功能,因而大大缩短了编辑时间,提高了节目 制作效率。 国外在音频编辑与制作技术的发展上做了很多工作,先进的编辑技术体现在 强大的编辑功能上:无限虚拟轨的剪切、分割、复制等编辑操作;完善的自动控 制曲线,可以自动控制音量、相位等参数,实现高精度非破坏性的音频处理;支 持a s i o 驱动,支持多种音频插件:录放同步编辑功能,快速的多轨缩混等。代 表性的产品有:美国a d o b es y s t e m 公司的a d o b e a u d i t i o n ,德国s e k d 公司( 现 已经被m a g i x 公司收购) 的s a m p l i t u d ep r o f e s s i o n a l ,德国s t e i n b e r g 公司的n u e n d o 等优秀的音频编辑软件。这些音频编辑软件的功能强大,具有很好的音频录制和 处理功能t s , 6 1 。在国内,只有北京英夫美迪数字技术、杭州联汇科技几家为数不多 的公司在研发专业音频编辑软件。 各国都有自己的国情,尤其在广播电视行业,外国的软件产品并不能适用于 2 第一章绪论 我国电台的实际情况,主要有以下不足之处: ( 1 ) 在电台节目生产流程的制作环节中,不能与符合我国电台特点的管理数 据库有机的结合。而且音频格式上,也不支持我国广播电台普遍使用的$ 4 8 格式 文件。 ( 2 ) 添加不同采样率不同格式的文件时,载入速度缓慢。 ( 3 ) 音量或声相编辑过程中,音频波形达不到即时变化的效果。 ( 4 ) 价格较高,售后服务困难。 1 3 论文的主要工作 本课题的目标是设计和实现一套支持多格式、稳定、高效的广播音频编辑与 制作软件,操作设计上充分照顾其他音频编辑软件用户的使用习惯,功能上满足 广播电台对音频节目制作的要求。论文所完成的主要工作如下: ( 1 ) 利用面向对象思想,对软件架构进行整体设计,然后设计与实现了各功 能模块,具体实现的主要功能如下: 针对编辑操作的稳定性和功能性,本文设计了音频块、音轨、项目信息等 数据结构和各种操作实现,实现了无限虚拟轨的各种编辑操作,其功能包括复制、 剪切、分割、合并、删除、粘贴等,这些功能都是针对多轨的编辑操作。 实现了透明、实时的跨格式录音、放音和编辑功能,实现高精度非破坏性 的音频处理。 设计了方便的曲线式电平及声相调节,可以自动控制音量、相位等参数。 支持物理多通道输入输出声卡,支持a s i o 、d i m c t s o u n d 驱动,可实时物 理多轨录音及放音。 设计与实现了多轨合并功能,可缩混输出各种格式、采样率和码率的文件。 ( 2 ) 针对载入文件速度缓慢,以及每次向某一项目载入不同采样率的文件时 都要生成副本的问题,本文提出了产生能量文件的方法,该方法为每一音频文件 生成一一对应的能量文件,波形就是由能量文件中的数据绘制而成。解决了重复 生成副本的问题,避免了直接对素材进行二次压缩解码,提高了音频波形的显示 效率,也就提高了节目编辑制作的效率。 ( 3 ) 针对编辑时音频波形实时变化问题,本文设计和采用缓存技术,并且结 合能量文件,通过计算显示范围内的音频数据,实现了编辑音频时波形的实时变 化,完全达到了“所见即所得”的效果。解决了调整音量线或声相线时,音频波 电子科技大学硕士学位论文 形不发生相应变化或者波形变化迟钝的问题。 1 4 论文的组织结构 本论文的组织结构安排如下: 第一章即本章,讲述课题的研发背景,现状以及研发价值,并对本论文的内 容安排进行了介绍。 第二章介绍了相关的数字音频知识和音频编辑制作技术,这部分内容是完成 本课题的基础和前提。 第三章分析了专业音频编辑与制作软件的特殊应用环境,并且根据广播电台 的功能需求,设计了一套音频编辑制作软件,详细论述了其软件模块和功能特点。 第四章先简单讲解了软件开发平台和程序设计思想,然后详细探讨了能量文 件的设计,提高了音频波形的显示效率,实现了波形在编辑过程中能够发生实时 变化。 第五章详细设计和实现了广播音频编辑与制作软件的基石e d l ,包括其软 件结构、各种重要的数据结构以及编辑功能。并详细阐述了音频控制模块的程序 设计流程和实现过程。 第六章是总结,主要总结了本课题一年的具体工作与成果,并对以后要进行 的工作提出了具体的建议和展望。 4 第二章音频编辑的基础 第二章音频编辑的基础 数字技术的出现与应用为人类带来了深远的影响,人们如今已生活在一个几 乎数字化的世界之中,而数字音频技术则称得上是应用最为广泛的数字技术之一。 数字音频技术包括把模拟信号转变成数字信号的技术,还包括对数字音频信号进 行电平控制( 增加或减小) 、音频修饰( 混响、延时、添加效果) 、频率调整( 均 衡、滤波) 等加工处理技术,以及实现数字音频信号传输、记录、回放的技术, 还应包括数字音频信号在各个方面的应用技术【邛】。数字音频技术不仅涵盖了模拟 音频技术的全部内容,而且与视频、计算机技术日益紧密地结合在一起,形成互 相融合的发展趋势。 2 1 音频信号的数字化 音频信号的数字化,是通过将声波波形转换成一连串的二进制的数据来保存 声音的。实现这个步骤主要依靠模数转换器( a d c ,a n a l o g t od i g i t a lc o n v e r t e r ) , 它每隔一个时间间隔不停地在模拟音频的波形上采取一个幅度值,这一过程我们 称之为采样。而每个采样所获得的数据与该时间点的声波信号相对应,它称之为 采样样本。将一连串样本连接起来,就可以描述一段声波了,而每秒钟对声波采 样的次数我们称之为采样频率,单位是h z ( 赫兹) ,采样频率必须符合奈奎斯特 ( n y q u i s t ) 采样定理。对于每一个采样,系统会分配一定的储存位数( b i t 数) 来 表达声波的振幅状态,称之为采样精度,这一过程也可称之为量化。采样精度越 高,声音被还原的就越细腻。数字音频是经过采样和量化后得到的。时间上的离 散叫采样,幅度上的离散叫量化。随后按一定的格式将离散的数字信号记录下来, 并在数据的前、后加上同步和纠错等控制信号,即完成了由模拟音频到数字音频 的转化工作【4 一。上述数字化过程又称为脉冲编码调制( p u l s ec o d em o d u l a t i o n , p c m ) ,音频信号的数字化过程如图2 1 所示: 模拟音频信号 图2 - 1 音频信号的数字化 数字码流 电子科技大学硕士学位论文 由此可知,音频信号的数字化一般要完成采样、量化和编码三个步骤。数字 音频信号经过处理、记录或传输后,当需要重现声音时,还必须还原为连续变化 的模拟信号。 2 2 数字音频编码 到目前已有多种编码方法被提出,归纳起来有:( 1 ) 基于语音数据的统计特 性进行编码,其典型技术是波形编码。( 2 ) 基于语音的声学参数进行参数编码。 ( 3 ) 基于人的听觉特性进行编码,从人的听觉系统出发,利用掩蔽效应,设计心 理声学模型。 感知编码得到广泛应用,感知编码根据压缩技术的不同可分为子带压缩技术 和变换压缩技术。子带压缩技术是以子带编码理论为基础的编码方法。其基本思 想是将信号分解为若干子频带内的分量之和,然后对各子带分量根据其分布特性 采取不同的压缩策略以降低码率。一般来讲,子带编码的复杂度要略低于变换编 码,编码延时也相对较短。典型代表有著名的m _ p e g 1 层i 和层i i 等。变换压缩 技术则是对一段音频数据进行线性变换,对所获得的变换域参数进行量化、传输, 通常使用的变换有d f t 、d c t 和m d c t 等。根据信号的短时功率谱对变换域参 数进行合理的动态比特分配,可以使音频质量获得显著改善,而相应付出的代价 则是计算复杂度的提耐1 0 】。具有代表性的变换压缩编码技术有d o l b y a c 2 。 m p e g 1 的压缩技术方案是子带压缩,子带分割的实现是通过时频映射,采 用多相正交分解滤波器组将数字化的宽带音频信号分成3 2 个子带;同时,信号通 过f f t 运算,对信号进行频谱分析;子带信号与频谱同步计算,得出对各子带的 掩蔽特性,由于掩蔽特性的存在,减少了对量化比特率的要求,不同子带分配不 同的量化比特数,但对于各子带而言,是线性量化【l 。加上c r c 校验码,得到 标准的m p e g 码流。其原理框图如图2 2 。 数字音频输入 3 2 子带滤波器组 f f t 运算卜_ - 4 心理声学模型 信号掩蔽比例 图2 - 2 编码器框图 6 第二章音频编辑的基础 2 3 数字音频文件格式 数字音频文件的格式有很多,通常分为两大类:波形音频文件和m i d i 文件。 波形文件指的是直接记录了原始真实声音信息的数据文件,它又进一步分为压缩 格式与非压缩格式两类。常见的非压缩格式音频文件有w a v e 文件( w a v ) ,常 见的压缩格式音频文件有m p 2 、m p 3 文件等。而m i d i 文件是一种乐器演奏指令 序列,相当于乐谱,因此又称之为非波形音频文件。下面将简略介绍下w a v e 文 件和m p e g 1 文件的格式。 1 、w a v e 文件 w a v e 是m i c r o s o f cw i n d o w s 本身提供的音频格式,由于w m d o w s 本身的影响 力,这个格式已经成为了事实上的通用音频格式【1 2 , 1 3 , 1 4 。它是以r i f f 格式为标准 的,r i f f 是英文r e s o u r c ei n t e r c h a n g ef i l ef o r m a t 的缩写,r i f f 可以看作是一种 树状结构,其基本构成单位为“块 ( c h u n k ) ,犹如树状结构中的节点,每个 c h u n k 由“标志符 、“数据大小及“数据 所组成。c h u n k 的结构如表2 1 。 表2 1c h u n k 的结构示意图 文件结构:w a v e 文件是由若干个c h u n k 单元组成的,其中有两个c h u n k 是不 可缺少的,分别是“f m t ”c h u n k 和“d a t a c h u n k ,t i n tc h u n k 装载的是w a v e 文件的 各项参数,如采样率,声道数等。d a t ac h u n k 装载的是音频数据。其他的c h u n k 则是可选的。所有音频应用程序必须能读取这两个主要的c h u n k ,所有音频复制 程序必须能复制所有c h u n k 。一个最简单的w a v e 文件结构如表2 2 所示。 表2 - 2 w a v e 文件结构 标志符( 刚f f ) 数据大小 格式类型( “w a v e ”) i d = “t i n t ” s i z e = 格式块大小 p c i ( a :、慢f o i j l j 、,【a t d = “d a t a ” s i z e = 声音数据大小 声音数据 7 电子科技大学硕士学位论文 由表2 2 可知,每个c h u n k 有各自的d ,位于c h u n k 最开始位置,作为标志, 而且均为4 个字节。并且紧跟在d 后面的是c h u n k 大小( 去除i d 和s i z e 所占的 字节数后剩下的字节数) ,用4 个字节表示,低字节表示数值低位,高字节表示 数值高位。下面具体介绍各个c h u n k 内容。 ( 1 ) i 心f w a c h u n k r i f fw a v ec h u n k 的结构如表2 3 所示。它以“r i f f 作为标示,然后紧跟 着为s i z e 字段,该s i z e 是整个w a v e 文件大小减去d 和s i z e 所占用的字节数, 即s i z e 等于文件大小减8 。然后是t y p e 字段,为“w a v e ,表示是w a v e 文件。 表2 3r i f fw a v ec h u n k 字段 所占字节数 具体内容 i d4“r i f f ” s i z e 4 文件大小减8 t y p e 4“( a :但” r i f fw a v ec h u n k 的结构可以定义如下: s t r u c tr i f f h e a d e r c h a rs z r i f f l d 4 ;r ,t ,f ,f d w o r d d w r i f f s i z e ; c h a rs z r i f f f o r m a t 4 ;w ,a ,v ,e t ) ; ( 2 ) f o r m a tc h u n k 表2 - 4f o r m a tc h u n k 字段所占字节数具体内容 i d4“t i n t ” s i z e4 1 6 或1 8 f o r m a t t a g 2 编码方式 c h a n n e l s2声道数目 s a m p l e s p e r s e c 4 采样频率 a v g b y t e s p e r s e e 4 每秒的字节数 b l o c k a l i g n 2 块对齐位 b i t s p e r s a m p l e 2 每个样本的b i t 数 无 2 附加信息 f o r m a tc h u n k 的结构如表2 4 所示,以“t i n t 作为标示。一般情况下s i z e 第二章音频编辑的基础 为1 6 ,此时没有最后的附加信息;如果为1 8 ,则最后多了2 个字节的附加信息。 f o r m a tc h u n k 的结构定义如下: s t r u c tw a v e f o r m a t w o r dw f o r m a t t a g ; w o r dw c h a n n e l s ; d w o r d d w s a m p l e s p e r s e c ; d w o r d d w a v g b y t e s p e r s e c ; w o r dw b l o e k a l i g n ; w o r d w b i t s p e r s a m p l e ; ) ; ( 3 ) d a t ac h u n k 表2 5d a t a c h u n k 字段所占字节数具体内容 i d4 “d a t e ” s i z e4 数据长度 d a m4 音频数据 d a t ac h u n k 是真正保存w a v e 数据的地方,以“d a t a ”作为该c h u n k 的标示。 然后是数据的大小,紧接着就是音频数据。 图2 - 31 6 位数据采样格式( 单声道) - “。 左声道右声道 低字节高字节低字节 高字节 图2 - 41 6 位数据采样格式( 双声道) “d a t a 子块包含w a v e 文件的数字化波形声音数据,其存放格式依赖于“f m t 子块中w f o r m a t t a g 成员指定的格式种类,在多声道w a v e 文件中,样本是交替出 现的。图2 3 和图2 4 分别描绘了1 6 b i t 的单声道w a v e 文件和双声道w a v e 文件 9 电子科技大学硕士学位论文 的数据采样格式。 2 、m p e g 1 文件 m p e g 1 音频支持采样率为3 2 k h z ,4 4 1 k h z ,4 8 k h z 的单声道及双声道等编 码模式,并利用心理声学模型来控制音频信号的量化编码。m p e g 1 共有三个不 同层次的音频压缩算法:l a y e ri ,l a y e ri i ,l a y e ri i i ,它们对应不同的要求,具 有不同的复杂度和不同的压缩效率【1 5 , 1 6 】。 一个m p e g 音频文件是由许多称为帧的部分组成,通常,帧是相互独立的, 每一帧都拥有自己的头和音频信息。没有文件头,所以,我们可以剪切m p e g 文 件的任何部分并且能够正常播放。但在l a y e ri i i 中就并不是百分之百正确的,这 是因为在m p e g 1l a y e ri i i 文件的数据组织中,帧常常是互相关联的。 当你想读取m p e g 文件的信息时,通常只找到第一帧就足够了,读取它的头 信息,然后假设其它帧是相同的就可以。但这也有不同的情况,变比特率的m p e g 文件使用比特变换,也就是说每一帧的比特率依照具体内容变化。这样就拥有更 好的压缩效率的同时又保证了高质量的音质。 帧头由每一帧的前4 个字节( 3 2 位) 组成。帧头的前1 1 比特( 或前1 2 个位) 总是固定的称作“帧同步。因此,可以在整个文件中查找第一个帧同步,然后 读取整个头,检查值是否正确。关于头中每一个比特的具体含义应该根据帧头的 格式来验证其有效性,如果存在被定义为保留,无效,损坏或不允许的值,表明 该帧头已经被损坏。光有这些是不够的,帧同步在许多二进制文件里面的应用是 很广的。而且,m p e g 文件可能在开头包含有错误同步信息的垃圾,所以我们必 须检查两个或者更多帧来确定我们现在读取的文件是一个m p e g 文件。 表2 - 6 是m p e g 1 三层音频编码效率的比较【1 6 】。 l a y e ri 即m p l 音频,文件形式扩展名一般为m p l ,是m u s i c a m 算法的简 化方案,复杂度最低,压缩效率也最低。压缩数据流的预设位率为3 2 4 4 8k b i t s , 主要用于编码速率为1 9 2k b i t s 的应用场合。 l a y e ri i 即m p 2 音频,文件形式扩展名一般为m p 2 ,它的编码较为复杂,能 去掉更多的冗余信息,压缩效率较m p l 有所提高。压缩数据流的预设位率为3 2 3 8 4k b i t s ,目标编码速率为1 2 8k b i t s ,已被应用于d a b 的伴音编码。 l a y e ri i i 即m p 3 音频,文件形式扩展名为m p 3 。算法最为复杂,压缩性能也 最好。压缩数据流的预设位率为3 2 3 2 0k b i t s ,目标编码速率为6 4k b i t s ,压缩 比在l :1 0 1 :1 2 时,接近c d 音质,它主要针对于低位率音频传输的应用,特别 适合应用于i s d n 网络传输和存储。 1 0 第二章音频编辑的基础 表2 - 6m p e g 1 音频的编码效率 编码层次码率( k b i t s )压缩比延龇 l a y e r i 1 9 24 :11 9 l a y e r i i 1 2 86 :l3 5 l a y e r i n 6 41 2 :l5 9 除了r a p 2 和m p 3 音频格式外,我国广播电台在普遍使用$ 4 8 音频格式,它 是指比特率为2 5 6 k b s ,采样频率为4 8 k h z 的m p 2 格式【l 丌。s 4 8 格式已经成为广 播音频工作站和自动化播出工作站的标准格式,它具有优秀的声音质量又满足了 广播音频编辑的精度要求,合成速度一流,为主持人制作音频节目节省了大量时 间。$ 4 8 格式比w a y 格式节省了近6 倍的存储空间,增加了音频文件的存储容量, 提高了在网络中的拷贝( 传播) 速度,也就降低了网络流量,为播出网络的安全 和维护提供了方便【l 引。国家广电总局正式颁布的标准g y t1 6 8 - - 2 0 0 1 中制定的 b w f 格式标准以m u s i c a m 格式为基础,完全支持当前使用的$ 4 8 格式【1 9 1 。 大多数音频编辑软件支持w a v e 和m p 3 文件,但是不支持或不能直接支持 r a p 2 或$ 4 8 文件。在我国,m p 2 或$ 4 8 文件在各广播电台使用得很普遍,因此, 本文设计的音频编辑与制作软件要支持这里介绍的几种音频文件。 2 4 数字音频的编辑与制作 随着当今音频技术的进步、声音制作人员素质和听众欣赏水平的提高,现代 广播节目制作越来越专业化。高质量的广播节目意在满足听众对于听觉审美的要 求,而其根本的推动力便是声音制作技术的进步。声音制作技术的进步主要表现 为数字音频技术的广泛应用。毫无疑问,在广播电视的数字化改造中,计算机数 字音频处理技术将会取代传统制作设备,成为媒体声音制作的主要手段。 广播制作分为录音制作和合成制作。录音制作是录制人员通过技术设备,把 各个音源混合起来使其成为作品,合成制作是把半成品合成一档完整的节目。 现在的数字化音频编辑与制作技术打破了传统的工作格局,节目制作将向桌 面化、家庭化发展,在家里制作节目将成为现实。编辑甚至可以在家里把素材进 行文件格式传输至制作部门进行合成,便可完成一套高质量节目的制作。编辑人 员可以参与简单的技术化的运作,制作人员也可以参与简单的节目编辑。现代的 音频编辑与制作技术有以下优 2 0 l : ( 1 ) 素材采集时能获得高质量的信号。音频编辑的素材是以数字信号的形式 电子科技大学硕士学位论文 存入到计算机硬盘中的,采集的时候信号基本上没有衰减,节目制作处理过程全 部是数字化的,不受干扰,不会增加噪声,存储的音频信号能高质量地长期保存 和多次重放。 ( 2 ) 强大的编辑功能。一套完整的音频编辑的功能往往有录制、编辑、特效 等多种功能。它可以非常方便地对素材进行查找、定位,编辑节目的精度高,可 以做到不漏一帧;它具有丰富的音频处理功能,可以充分发挥编导的创造力和想 象力,同时还可以随时看到编辑的结果,能直观地浏览所有音频组合的效果。 尤其集声音、音效等工作于一个环境之中,不需要像传统的节目制作那样有 多道复杂工序,轻轻松松就完成了常规剪辑、播放、淡入淡出、高品质音效编辑 与合成等【2 1 1 。 ( 3 ) 现代的音频编辑与制作系统的投入资金比较少,设备成本和维修费用大 大降低。 随着社会的发展、科学的进步、信息时代的革命,老的制作观念必然被淘汰, 广播节目制作将进入一个全新的制作时代。 2 5 本章小结 本章主要介绍了数字音频的一些基础知识。首先介绍了音频的数字化以及音 频编码技术,然后介绍了几种音频文件格式和现代音频编辑与制作技术的优点。 对于一个大型软件产品的完成,不仅要有很强的编程能力,而且要了解软件工程 的思想。而对于专业音频编辑软件的设计,就要熟知数字音频的原理和数字音频 信号的处理技术。本章所介绍的基础知识是完成本课题的基础和前提。 1 2 第三章音频编辑与制作软件的设计 第三章音频编辑与制作软件的设计 随着广播电台的数字化发展,电台的节目制作技术获得了很大的进步。对于 这个特殊的领域,安全优质播出是广播电台一切工作的出发点和归宿,而优质节 目的制作离不开音频编辑与制作软件,音频编辑与制作软件在编辑出优质音频节 目的同时,应该尽量提高编辑效率。因此,如何实现高效稳定地编辑制作优质的 音频是本文要考虑和解决的一大问题。 3 1 需求分析 3 1 1 应用环境分析 音频编辑与制作软件在广播电台工作流程中所处的环节如图3 1 所示。 不需要审听的节目 素材输入 节目播出 图3 - i 电台工作流程中的音频编辑器 在广播电台领域,节目编辑制作是播出前的重要环节,用户一般利用各种音 频工作站上的编辑软件对节目素材进行剪辑,也可使用特效进行处理,最终合成 为节目音频文件,完成广播节目的编辑制作。广播制播有以下特点: ( 1 ) 安全播出是广播电台的生命线,音频编辑与制作软件承担了广播电台节 目制作的重要任务,要有极高的稳定性和可靠性。 ( 2 ) 实时高效是广播节目制作的特点,尤其是新闻类节目。为了保证一天 2 4 小时不间断的节目播出,一套音频编辑制作软件一天要工作十几个小时,因此, 音频编辑软件的效率要高,这才符合广播节目制作的高效性特点。 ( 3 ) 每个电台可以同时播出几个频率的节目,因此,编辑软件要能够支持多 电子科技大学硕士学位论文 通道节目录音、制作和播出。 目前,随着计算机技术在广播电台的普及应用,各种硬件配置都很好,专业 声卡的优劣与节目质量是紧密相关的。目前我国电台大都使用法国d i g i g r a m 公司 的专业声卡,这些声卡支持d i r e c t s o u n d 和a s i o 驱动,这两种驱动方式对音频流 的延迟时间也不同,支持a s i o 播放和录音的声卡具有更低的延迟效应,提高了 录音和放音效率,降低了节目播出延迟。音频编辑与制作软件是一套基于p c 的 编辑软件,它与多媒体电脑构成了一个简单的数字音频工作站。图3 2 说明了音 频编辑与制作软件在多媒体电脑上的应用结构刚2 2 1 。 3 1 2 设计要求 图3 2 音频编辑器应用结构图 广播音频编辑制作系统的开发是建立在简单、方便、稳定和高效的前提下的。 简单和方便是指所设计的软件操作起来方便,使用户易懂,易学,软件的操作界 面干净,美观;稳定是我们追求的目标,在广播这一特殊行业中需要稳定高效的 产品,实现长时间的录播和编辑操作,避免死机和造成系统崩溃;在稳定的前提 下,要尽量提高音频编辑的效率和准确性,这能减少人力,物力,节省成本。 在简单、方便、稳定和高效的前提下,音频编辑与制作软件的设计从以下几 方面加以考虑: ( 1 ) 从整体产品的稳定性来看,要重点考虑整体架构和数据结构的设计,它 是一个软件产品的基石。 ( 2 ) 从音频编辑软件的编辑准确性来看,要设计出最佳算法来读取音频文件 的数据,对音频数据进行处理。 1 4 第三章音频编辑与制作软件的设计 ( 3 ) 从音频编辑软件的效率来看,使用优越的编解码算法和新颖有效的方法 解决音频波形显示问题以及多轨混音问题。 ( 4 ) 从软件的操作方面来看,设计的软件要美观和实用,要考虑新老客户的 操作习惯,使得软件简单易懂,易于用户学习和掌握。 ( 5 ) 从音频编辑软件的功能来看,要包括通用的编辑功能,如:音频的剪切、 复制、分割、合并和粘贴等。设计多种播放和录音方式,在效果器的使用上也可 以有多种添加方式。 ( 6 ) 便于软件的日常维护。 3 2 模块划分 借鉴现有的音频编辑软件的优点和兼顾广播电台和个人用户的需求,本文设 计了一套功能强大的音频编辑制作软件。考虑到不同用户的需求,本文设计了功 能配置文件,用户可以修改配置文件获得自己想要的功能。在整体设计上,不仅 满足了现有的功能要求,而且要根据音频技术的发展,为以后新技术的应用作考 虑,使软件有较大的升级空间。 从功能和软件设计层次上分析,本文设计的广播音频编辑与制作软件划分的 模块主要有主程序模块、功能控制模块、音频显示模块、音频控制模块和音频编 辑模块( e d l ) 。各模块分工协作,高层模块使用函数调用方式访问底层模块, 底层模块又通过一些参数或结构返回给高层模块,最终完成某一功能的实现。音 频编辑制作软件的软件模块结构如图3 3 所示。 ( 1 ) 主程序模块 图3 3 音频编辑器的软件模块结构图 电子科技大学硕士学位论文 该模块主要实现与用户交互界面设计、文档数据保存和声卡设备的初始化等。 在界面设计上,风格要求既美观,又方便用户操作。美观方面,v c + + 自带的控 件和窗口一般不能满足要求,因此要继承这些控件类,编写自己的控件类。本文 设计了列表框、工具栏以及各种按钮控件。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论