多媒体技术基础课件

上传人：子*** IP属地：未知上传时间：2023-12-17 格式：PPTX 页数：594 大小：19.14MB 积分：15 举报 版权申诉

已阅读5页，还剩589页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第1章多媒体技术概论1.1

多媒体技术的基本概念

1.2多媒体技术的发展

1.3多媒体技术的研究内容

1.4多媒体技术的应用领域

1.5多媒体技术的发展趋势

1.6

本章小结

1.1多媒体概述1.1.1媒体（Medium）

●媒体：存储信息的实体；（多媒体）信息的载体。●感觉媒体：直接作用于人的感官，使人直接产生感觉●表示媒体：是为了加工、处理和传输感觉媒体而人为构造出来的一种媒体，即各种编码。●显示媒体：是指感觉媒体与用于通信传输的电信号之间转换的一类媒体，即感觉媒体与计算机的界面。又可分为两种：输入显示媒体和输出显示媒体。●存储媒体：又称存储介质，保存表示媒体的介质。●传输媒体：传输的物理载体，即用来将媒体从一处传送到另一处的物理载体1．媒体的类型1.1.2多媒体概念●

多媒体技术的定义

多媒体技术是利用计算机技术对多种信息进行综合处理、建立逻辑关系，集成为一个系统并具有交互性。●“多媒体”一词源自“Multimedia”，由Multiple和media复合而成，指融合两种以上的媒体，并具有交互性。

多媒体的特征1.1.31.多维化

——指计算机处理媒体信息的多样化，它使人与计算机之间的交互不再局限于顺序的、单调的、狭小的范围，而有充分自由的余地。2.集成性——媒体种类一体化。包括两方面：一方面是指多媒体技术能将各种不同的媒体信息有机地进行同步组合，形成一个完整的多媒体信息；另一方面是指把不同的媒体设备集成在一起，形成多媒体系统。3.交互性——人、机对话，是多媒体技术的关键特征。在多媒体系统中，除了操作上控制自如之外，在媒体的综合处理上也可以随心所欲，4.数字化——媒体以数字形式存在5.实时性——声音、动态图像(视频)随时间变化。各类文字和符号文字和符号多媒体多媒体多媒体1.1.4多媒体技术所涉及的对象如何从事多媒体教学通过计算而描述的矢量图形文字图形矢量图形对象●用像素点描述的自然影像文字图形图像位图图像对象●单画面矢量动画和多画面帧动画文字图形图像动画多画面帧动画单画面矢量动画FRAME01FRAME02FRAME03FRAME04FRAME05FRAME06FRAME07动画对象●音频数字信号、压缩音频信号文字图形图像动画音频●midi音频●

wav音频●

mp3压缩音频音频对象●视频数字信号AVI、压缩视频信号MPG文字图形图像动画音频视频音频+视频AudioVedioInformation视频对象●END多媒体信息系统

1.1.51．开发系统：具有多媒体应用的开发能力，系统配有功能强大的计算机，齐全的外部设备和多媒体演示著作工具，主要应用是多媒体应用制作、非线性编辑等。

指利用计算机技术和数字通信网技术来处理和控制多媒体信息的系统。

2．演示系统：可完成多种媒体的应用，并与网络连接。主要应用于产品展示和会议演示等。

3．培训系统：以个人计算机为基础，配有CD-ROM驱动器、音响和图像接口控制卡连同相应的外设和网络。

家庭系统：即家庭多媒体播放系统，就是通常的高档多媒体PC，常用于家庭学习,娱乐等。1.2多媒体技术的发展及对其它技术的影响

多媒体技术的发展

1.2.11.2.2多媒体技术促进了通信与娱乐和计算机的融合

1984年，美国Apple公司在Macintosh上为了改善人机之间界面，首先大胆地引入位映射（Bitmap）的概念对图进行描述，并使用了窗口和图符作为用户接口。

1986年3月，荷兰Philips公司和日本Sony公司联合研制并推出了交互式紧凑光盘系统CD-I(CompactDiscInteractive)，同时它们还公布了CD-ROM文件格式，得到了同行的承认，并成为ISO国际标准。1990年11月，Microsoft和Philips等十多家厂商召开了多媒体开发者会议，会议成立了多媒体计算机市场协会，并制定了多媒体计算机MPC1.0标准。

1.计算机的多媒体化的过程。2.广播、电视、录像、高清晰度电视/（数字电视）-多媒体化的过程。3.邮政、电报电话，一直到多媒体计算机通信网络-多媒体化的过程1.3多媒体技术的研究内容

1.3.1数据压缩与编码技术

1.数据压缩的必要性2.数据压缩的可能性1.3.2多媒体专用芯片技术

专用芯片可分为两类：一类是固定功能的芯片，另一类是可编程数字信号处理器DSP芯片。1.3.3多媒体数据存储技术

VCD、DVD、网络网络技术●1.3.4媒体输入/输出技术媒体变换技术、识别技术、媒体理解技术和综合技术

●

1.3.5多媒体系统软件技术多媒体操作系统、多媒体编辑系统、多媒体数据库管理技术

●1.3.6超文本和Web技术超文本是一种有效的多媒体信息管理技术，其基本的要素是结点、链和网络；Web系统是运行在Internet

上的超文本系统，●

1.3.7多媒体应用开发和编著工具

●

1.3.8多媒体通信技术

●

1.3.9.虚拟现实技术主要有三方面的含义:

有3个基本特征：沉浸、交互和构想。

1.4多媒体技术应用领域1.教育（形象教学、模拟展示）●

形象教学●

仿真工艺过程●

模拟交互过程●

电子教案、教学●

网络多媒体教学2.商业广告（特技合成、大型演示）●影视商业广告●

公共招贴广告●

大型显示屏广告●

平面印刷广告3.影视娱乐业（电影特技、变形效果）●

电视/电影/卡通混编特技●

三维成像模拟特技●

演艺界MTV特技制作●仿真游戏、赌博游戏Internet国际互联网4.医疗（远程诊断、远程手术）●

网络多媒体技术●

网络远程诊断●

网络远程操作(手术)5.旅游（景点介绍）●

风光重现●

风土人情介绍●

服务项目6.人工智能模拟（生物、人类智能模拟）●

生物形态模拟●

生物智能模拟●

人类行为智能模拟1．多媒体通信网络环境的研究和建立，将使多媒体从单机单点向分布、协同多媒体环境发展，对该网络及其设备的研究和网上分布应用与信息服务的研究将是热点，

2．利用已较成熟的图像理解、语音识别，全文检索等技术研究多媒体基于内容的处理。开发能进行基于内容的处理系统（包括编码、创作、表现及应用。2．利用已较成熟的图像理解、语音识别，全文检索等技术研究多媒体基于内容的处理。开发能进行基于内容的处理系统（包括编码、创作、表现及应用。1.5多媒体技术的发展趋势4．多媒体技术将与相邻技术结合以提供完善的人—机交互环境。5．虚拟现实技术的研究将继续取得进展，虚拟现实与可视化技术相互补充，并与语音、图像识别、智能接口等技术相结合，建立高层次虚拟现实系统。

3．多媒体标准仍是研究的重点。

1.5多媒体技术的发展趋势1.5多媒体技术的发展趋势

总的发展趋势是具有更好、更自然的交互性，更大范围的信息存取服务，为未来人类生活创造出一个在功能、空间、时间及人与人交互方面更完美的崭新世界

1.基本概念

●媒体

●多媒体及特性●多媒体信息系统2.多媒体技术的发展●多媒体促进了通信与娱乐和计算机的融合

3.多媒体技术的研究内容●数据压缩与编码技术●多媒体专用芯片技术●多媒体数据存储技术

●媒体输入/输出技术●多媒体系统软件技术●超文本和Web技术

●多媒体应用开发和编著工具●多媒体通信技术●虚拟现实技术4.多媒体技术的应用领域5.多媒体技术的发展趋势本章小结(1)多媒体的媒体种类有哪些？(2)试归纳叙述多媒体关键特性以及这些特性之间的关系。

(3)简述多媒体技术的主要应用领域。(4)列举两个制作多媒体的软件。(5)有人说，多媒体技术是界面技术，即人一机接口技术，同意吗?为什么?(6)选择适当的参考书，为深入学习多媒体技术做准备。课外作业课内习题一、选择题1-1．媒体中的_____是为了加工、处理和传输感觉媒体而人为构造出来的一种媒体，如文字、音频、图像和视频等的数字化编码表示等。

(A)感觉媒体(B)表示媒体

(C)显示媒体(D)存储媒体1-2．多媒体技术的主要特性有________。(1)多样性(2)集成性(3)交互性(4)实时性(A)仅(1)(B)(1)+(2)(C)(1)+(2)+(3)(D)全部

参考答案:1-1.B

1-2.C1-3.请根据多媒体的特性判断以下哪些属于计算机多媒体的范畴？（1）交互式视频游戏（2）有声图书（3）彩色画报（4）彩色电视（A）仅（1）(B)(1)+(2)(C)(1)+(2)+(3)（D）全部1-4．一般认为，多媒体技术研究的兴起，从___________开始。(A)1972年，Philips展示播放电视节目的激光视盘。(B)1984年，美国Apple公司推出Macintosh系列机。(C)1986年,Philips和Sony公司宣布发明了交互式光盘系统CD-I(D)1987年,美国RCA公司展示了交互式数字影像系统DVI。

参考答案:1-3.B

1-4.B1-5．多媒体技术未来发展的方向是：（1）高分辨率,提高显示质量;(2）高速度化，缩短处理时间；（3）简单化，便于操作；（4）智能化，提高信息识别能力。(A)(1)+(2)+(3)(B)(1)+(2)+(4)(C)(1)+(3)+(4)（D）全部1-6．下列哪些说法正确?(1)多媒体技术促进了通信、娱乐和计算机的融合。(2)多媒体技术可用来制作V-CD及影视音响、卡拉OK机。(3)多媒体技术极大地改善了人一机界面。(4)利用多媒体是计算机产业发展的必然趋势。

(A)(1)+(2)+(3)(B)(1)+(2)+(4)(C)(2)+(3)+(4)(D)全部参考答案:1-5.D

1-6.D2.1

MPC系统的组成结构多媒体应用软件第八层软件系统多媒体创作软件第七层多媒体数据处理软件第六层多媒体操作系统第五层多媒体驱动软件第四层多媒体I/O控制卡及接口第三层硬件系统多媒体计算机硬件第二层多媒体外围设备第一层2.1.1MPC硬件系统

多媒体计算机1.

个人计算机外设声卡●

声卡配置

Mic麦克输入

Linein线路输入

Aux辅助输入

Lineout线路输出

Speak低阻输出CD-ROM●

激光驱动器

CD-ROMCD-RW声音重放设备●模拟声音设备有源音箱、耳机音响设备2．MPC技术标准

1）MPC-11990年MPC-l标准诞生；得到了许多硬件商的支持；发展了多媒体系统的标准操作平台；软件开发商也克服了以往无硬件标准而造成的软件的困境2）MPC-21993年5月MPC联盟又制定了第二代多媒体计算机标准MPC-2；主要是提高了基本部件的性能指标。3）MPC-31995年6月制定；在进一步提高对基本部件的要求的基础上，MPC-3增加了全屏幕、全动态(30帧／秒，fps)视频及增强版的CD音质的视频和音频硬件标准。

随着计算机硬件技术和多媒体技术的飞速发展，MPC的标准规范还会继续升级。所以，我们不必去拘泥于它的具体条件，而只要去理解、把握MPC的基本特征。这些基本特征有：带有采用光学原理的数字光盘存储设备(如CD-ROM驱动器等)；高质量的数字音响(处理数字音频、视频的声音卡)；高分辨率的图形、图像显示(TV接收卡、视频捕捉卡、视频压缩与解压卡)；带有管理多媒体的软件；3.MPC的特征2.1.2MPC软件系统

1．驱动软件

2．多媒体操作系统

3．多媒体数据处理软件

4．多媒体创作软件

5．多媒体应用系统

2.2.1音频卡的功能音频卡处理音频信号的PC插卡是音频卡（AudioCard），又称声音卡，声音卡处理的音频媒体有数字化声音（Wave）、合成音乐（MIDI）、CD音频。音频卡的功能

音频的录制与播放编辑与合成MIDI接口文–语转换CD-ROM接口游戏接口支持全双工功能2.2音频接口

2.2.2音频卡的工作原理1.声音输入到计算机的过程从模拟到数字声源声波传声器模拟电信号数字声音2.声音的处理过程音频卡由下列部件组成：MIDI输入/输出电路；MIDI合成器芯片；用来把CD音频输入与线输入相混合电路；带有脉冲编码调制电路的模数转换器，用于把模拟信号转换为数字信号以生成波形文件；用来压缩和解压音频文件的压缩芯片；用来合成语音输出的语音合成器；用来识别语音输入的语音识别电路；输出立体声的音频输出或线输出的输出电路等。3.音频卡的体系结构4.MIDI接口规范（1）MIDI1）MIDI（MusicalInstrumentDigitalInterface）是指乐器数字接口，是数字音乐的国际标准。2）MIDI的音乐符号化过程实际上就是产生MIDI协议信息的过程。3）音乐合成器是电脑音乐系统中最重要的设备之一。（2）MIDI接口1）MIDIIn（输入口）：接收从其他MIDI装置传来的消息。2）MIDIOut（输出口）：发送某装置生成的原始MIDI消息。向其他设备发送MIDI消息。3）MIDIThru（转发口）：传送从输人口接收的消息到其他MIDI装置。向其他设备发送MIDI消息。5.声卡的声道数

（1）单声道与立体声

（2）四声道环绕

（3）5.1声道

2.2.3声卡的选择及应用

声卡的技术指标

（1）采样频率和量化位数

（2）MIDI合成方式

（3）DSP数字信号处理器

（4）音频压缩

2.声卡与外部设备的连接

音箱2、Microphone（麦克风输入）3、Speaker（扬声器输出）4、MIDI/GamePort（MIDI/操纵杆端口）7、CD-ROM音频信号接口6、CD-ROM的接口8、跳接器音频输出IDE接口CD-ROM外部音频设备麦克风操纵杆MIDI声音装置1、Linein（线性输入）5、VolumeControl（音量调节旋钮）电源跳接线2.3视频接口

2.3.1显示卡

1．显示卡的种类

（1）一般显示卡。完成显示的基本功能，其性能优劣与缓存容量、工艺质量等有关。（2）图形加速卡。目前以AGP显示卡为主，带有图形加速器，显示复杂图像时速度较快。（3）3D图形卡。专为带有3D图形的高档游戏开发的显示卡，三维坐标变换速度快、图形动态显示反映灵敏、清晰。（4）显示/视频输出集成卡。在显卡上集成视频输出电路，在把信号送至显示器正常显示信号的同时，可将信号转换成视频信号，送到视频输出端子，共电视机或录像机接收。（5）显示/TV集成卡。在显示卡上集成TV高频头和视频处理电路，使用该卡既可显示多媒体信息，还可收看电视节目。

2．显示卡的结构

显示卡

I/O端口显示缓存数字/模拟

转换器图形处理器芯片RGB

输出端口板卡总线视频加速器视频输出端(1)电视卡（TVTurner）：将标准的NTSC、PAL、SECAM电视信号转换成VGA信号在计算机屏幕上显示，是一块能接收全频道、全制式彩色电视节目的视频信号的转换卡，它的输出与电脑的CRT制式匹配。(2)TV编码器（TVCoder）：把VGA信号转为PAL、NTSC、SECAM制式的视频信号，供电视播放或录像制作使用，多用于广告电视片的后期处理。(3)视频捕获卡：捕捉和编辑静态视频图像，完成视频数字化、编辑以及处理等工作。(4)动态视频捕获和播放卡：用于实时动态视频和声音的同时获取及压缩处理，该卡还具有储存和播放功能。常用于视觉传达系统中的现场监控、办公自动化和多媒体节目创作等场合。3.各种功能的视频卡2.3.2视频采集卡1.视频采集卡将视频信号连续转换成计算机存储的数字视频信号（离散）保存在计算机中或在VGA显示器上显示，完成这种功能的视频卡称之为视频采集卡，或称为视频转换卡。如果能够实时完成压缩，则称实时压缩卡。通常可将外部视频输入信号叠加在显示器上，并将视频输入信号变换成计算机可存储的信息保存在硬盘中。只能单帧捕获的，称为图像卡。

2.视频采集卡的连接视音频信号线视音频信号线视音频信号线电视录象机摄象机VGA输入VGA输出S视频端子视频捕获卡VGA显示卡显示器VGA回路线VGA数据线3.视频卡的主要功能全活动数字图像的显示、抓取、录制、支持MicrosoftVideoforWindows；可以从录像机（VCR）、摄像机、ID、IV等视频源中抓取定格，存储输出图像；近似真彩色YUV格式图像缓冲区，并可将缓冲区映射到高端内存；可按比例缩放、剪切、移动、扫描视频图像；色度、饱和度、亮度、对比度及R、G、B三色比例可调；可用软件选端口地址和IRQ；具有若干个可用软件相互切换的视频输入源，以其中一个做活动显示。

视频信号源、摄像机、录像机或激光视盘的信号首先经过A/D变换，送到多制式数字解码器进行解码得到YUV数据，然后由视频窗口控制器对其进行剪裁，改变比例后存入帧存储器。帧存储器的内容在窗口控制器的控制下，与VGA同步信号或视频编码器的同步信号同步，再送到D/A变换器变成模拟的RGB信号，同时送到数字式视频编辑器进行视频编码，最后输出到VGA监视器及电视机或录像机。4.视频采集卡的工作原理视频采集卡的结构原理图窗口控制器PC总线接口部分窗口控制器视频输入剪裁、变比例部分(1)激光驱动器

(2)激光盘片●CD-ROM的构成2.4.1什么是CD-ROM●CD-ROM的性质●

只读属性(用户不能写入，只能读出)●

光学存储原理(激光烧结)●CD-RW

(ReWritable)的性质

●

可读写属性(CD-R盘片：追加写/读CD-RW盘片：可读/擦写)●

光学存储原理(激光烧结)2.4光存储设备

2.4.2CD-ROM工作原理激光头聚碳酸酯片基铝反射层标签表面聚焦透镜激光源数字信号电信号光电转换译码数据凹坑激光盘●CD-DA标准(CompactDisc-DigitalAudio)PHILIPS&SONY共同提出容量——74min(44.1kHz/16bit/Stereo)传输——176400Byte/s(172.3KB/s)●CD-ROM标准(CompactDisc-ReadOnlyMemory)PHILIPS&SONY共同制定,1988年正式公布,命名为ISO9660标准容量——650MB／74min基本传输速率——150KB/s(75扇区×2048字节=153600Byte/s)激光驱动器——CD-ROM2x……2倍于基本传输速率

CD-ROM4x……4倍于基本传输速率

CD-ROM52x……52倍于基本传输速率2.4.3激光存储器标准●

CD-I标准(CD-Interactive)——CD交互式标准，用于家用音响电器●

CD-ROMXA标准(CD-ROMExtendedArchitecture)——CD-ROM扩展结构标准，用于计算机，把声音、图像、文字等不同信息记录在一条轨道上●

VedioCD标准

——图像数据压缩标准，简称VCD，采用

MPEG-1压缩技术●

PhotoCD标准

——Kodak公司制定的数字化照片存放标准，简称PCD标准●

DVD标准(DigitalVersatileDisk)——采用MPEG-2压缩技术的标准，可存放488分钟影片、4.7GB～17GB的数据CD-ROM标准●显示适配器显示器主机箱主板显示电缆2.4.4显示适配器●

显示缓冲存储器容量与芯片

64MB~128MBDDRSGRAM/DDRSDRAM●

显示存储器频率620MHz●

显示芯片型号Radeon9700Pro●图形加速功能三维效果增速●￥650～3600元

AG-411技嘉GV-R9700PRO显示信号输出显示处理器2.5多媒体I/O设备数码照相机彩色扫描仪语音识别设备光盘存储介质半导体存储介质数码摄像机彩色投影机彩色打印机常见I/O设备2.5.12.5.2触摸屏●触摸屏—输入设备，坐标定位装置●触摸屏组成显示器触摸检测装置触摸屏控制卡驱动程序●作用—将坐标信息送入计算机●

触摸检测装置特点：高透明度，可触摸作用：获得触摸坐标信息●

触摸屏控制卡作用：分析触摸坐标信息坐标信息数字化经电缆传送至主机电缆●

驱动程序作用：提供数据分析方法规范信号传送格式控制硬件动作●电阻触摸屏●+5V+5V+5V0V0VX方向Y方向第1层ITO第2层ITO第1层ITO第2层ITOR触摸屏种类及其技术特点——将检测到的电阻值转换成坐标数字信息●表面声波触摸屏●发射X方向Y方向第1层第2层发射接收接收第1层ITO第2层ITO●

矢量压力触摸屏——将触摸压力点的位置和压力转换成坐标信息——将阻挡声波的位置转换成坐标数字信息触摸屏种类及其技术特点●扫描仪种类台式扫描仪平板式扫描仪底片扫描仪(透射式)2.5.3图像扫描仪手持扫描仪滚筒扫描仪●

按结构分：●

按原理分：反射式手持式、平板式、滚筒式、台式、透射式、多用机●

透射式扫描原理扫描样张光电转换器光源底片扫描仪●扫描样张光电转换器导轨光源数字信号输出扫描基本工作原理●

反射式扫描原理数字信号输出识别反射光线识别穿透光线平板式扫描仪●扫描仪的技术指标●

光学扫描分辨率

——扫描仪的固有分辨率，由光学系统决定1200dpi●

差值扫描分辨率

——通过软件计算，以补充像点的形式提高分辨率7200dpi●

彩色还原数量

——用二进制数表示颜色，8bit/16bit/24bit/36bit/48bit●

扫描次数

——分色系统的分色模式，有多次扫描和一次扫描之分●

接口形式

——扫描仪与计算机的连接形式，IDE/USB/SCSI中档数码照相机2.5.4数码照相机与摄像机1.发展及种类高级数码照相机影楼专用数码照相机家用数码摄像机(数字成像设备)专业数码摄像机家用数码摄像机2.数码照相机的工作原理镜头影像数字信号译码器存储介质数据接口●软盘●微型硬盘●压缩闪存卡(存储卡)●CD-RW激光盘●译码器作用——将电信号转换成数字信息●CCD(ChargedCoupledDevice)(光电偶合器件)

基本光敏单元——像素作用——将可见光转换成电信号●技术指标●

LCD显示屏

(彩色/单色/像素数量)数字信号译码器存储介质数据接口●

像素数量(200万~1200万)●

光敏元件排列方式直排列交错排列●CF卡(CompactFlash)

内置ATA/IDE控制最大容量1GB●SM卡(SmartMedia)

最大容量128MB●MS卡(MemoryStick)SONY专用、高速最大容量1GB●XD卡(XD-Picture)

最大容量8GB●

数据接口

USB/Video输出接口

IEEE1394高速接口●光学镜头与快门1.各种类型的打印机喷墨打印机彩色激光打印机2.5.5彩色打印机喷墨打印机照片打印机2.打印机重要参数●

打印分辨率720~2880dpi●打印速度ppm(页/分钟)●打印介质普通纸、专用纸、照片纸、胶片、转印纸等●耗材成本墨盒、颜料等3.激光打印原理激光彩色打印机使用4个鼓，处理过程极其复杂。主要由着色装置、有机光导带、打印机控制器、激光器、传送鼓、传送滚筒及熔合固化装置构成。工作时，有机光导带内的预充电装置先在光导带上充电，产生一层均匀电荷，激光器产生的激光束射到光导带上时，使光导带相应点放电。由于光导带不停的运动，所以不同强度的激光束就在光导带上形成放电程度不一的放电区，这些放电区就组成了与该图像相对应的潜像。当光导带上的潜像从着色装置下方通过时，与光导带接触的着色装置打开，着色剂附着在光导带放电区（充电区对着色剂起排斥作用，所以着色剂不能附着其上）。光导带不停的旋转，以上着色过程多次进行，从而使四种颜色都按原图像色彩附着其上，这样就得到一个完整的彩色图像。3.1音频信息处理基础

音频信息在多媒体中的应用极为广泛：视频图像配以娓娓动听的音乐和语音；静态或动态图像配以解说和背景音乐；立体声音乐可增加空间感；游戏中的音响效果等。音频处理技术主要包括电声转换、音频信号的存储、重放技术、加工处理技术以及数字化音频信号的编码、压缩、传输、存取、纠错等。

3.1.1音频信号的特点

1.音频信号的分类音频信号可分为两类：语音信号和非语音信号。语音是语言的物质载体，是社会交际工具的符号,它包含了丰富的语言内涵，是人类进行信息交流所特有的形式。非语音信号主要包括音乐和自然界存在的其他声音形式。非语音信号的特点是不具有复杂的语义和语法信息，信息量低、识别简单。

规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示，称为声波。因声波是在时间和幅度上都连续变化的量，我们称之为模拟量。用声音录制软件记录的英文单词“Hello”的语音实际波形

2.模拟音频信号的两个重要参数

模拟音频信号有两个重要参数：频率和幅度。声音的频率体现音调的高低，声波幅度的大小体现声音的强弱。

一个声源每秒钟可产生成百上千个波，我们把每秒钟波峰所发生的数目称之为信号的频率，单位用赫兹(Hz)或千赫兹(kHz)表示。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大，声音越强。对音频信号，声音的强度用分贝(dB)表示，分贝的幅度就是音量。

幅度限周期基线3.声音的A/D与D/A转换

A/D转换就是把模拟信号转换成数字信号的过程，模拟电信号变为了由“0”和“1”组成的Bit信号。这样做的好处是显而易见的，声音存储质量得到了加强，数字化的声音信息使计算机能够进行识别、处理和压缩。A/D转换的一个关键步骤是声音的采样和量化，得到数字音频信号，它在时间上是不连续的离散信号。

借助于A/D或D/A转换器，模拟信号和数字信号可以互相转换。

4.声音的三要素

1）音调：代表了声音的高低。音调与频率有关，频率越高，音调越高，反之亦然。读者也许有这样的经验，当提高磁带录音机的转速时，其旋转加快，声音信号的频率提高，其喇叭放出来声音的音调提高了。同样，在使用音频处理软件对声音的频率进行调整时，也可明显感到音调随之而产生的变化。各种不同的声源具有自己特定的音调，如果改变了某种声源的音调，则声音会发生质的转变，使人们无法辨别声源本来的面目。

2）音色：即特色的声音。声音分纯音和复音两种类型。所谓纯音，是指振幅和周期均为常数的声音；复音则是具有不同频率和不同振幅的混合声音。大自然中的声音绝大部分是复音。在复音中，最低频率的声音是“基音”，它是声音的基调。其他频率的声音称为“谐音”，也叫泛音。基音和谐音是构成声音音色的重要因素。各种声源都具有自己独特的音色，例如各种乐器的声音、每个人的声音、各种生物的声音等，人们就是依据音色来辨别声源种类的。

3）音强：声音的强度，也被称为声音的响度，常说的“音量”也是指音强。音强与声波的振幅成正比，振幅越大，强度越大。唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的，通过播放设备的音量控制，可改变聆听时的响度。

声音的频谱有线性频谱和连续频谱之分。线性频谱是具有周期性的单一频率声波；连续频谱是具有非周期性的带有一定频带所有频率分量的声波。纯粹的单一频率的声波只能在专门的设备中创造出来，声音效果单调而乏味。自然界中的声音几乎全部属于非周期性声波，该声波具有广泛的频率分量，听起来声音饱满、音色多样且具有生气。

5.声音的频谱3.1.2模拟音频的数字化过程

数字化的声音易于用计算机软件处理，现在几乎所有的专业化声音录制、编辑器都是数字方式。对模拟音频数字化过程涉及到音频的采样、量化和编码。

采样和量化的过程可由A/D转换器实现。A/D转换器以固定的频率去采样，即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号，可以将其以文件形式保存在计算机的存储介质中，这样的文件一般称为数字声波文件。

信息论的奠基者香农（Shannon）指出：在一定条件下，用离散的序列可以完全代表一个连续函数，这是采样定理的基本内容。

为实现A/D转换，需要把模拟音频信号波形进行分割，这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值，把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期，其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。

1.采样

采样频率与声音频率之间有一定的关系，根据奈奎斯特（Nyquist）理论，只有采样频率高于声音信号最高频率的两倍时，才能把数字信号表示的声音还原成为原来的声音。

采样只解决了音频波形信号在时间坐标(即横轴)上把一个波形切成若干个等分的数字化问题，但是还需要用某种数字化的方法来反映某一瞬间声波幅度的电压值大小。该值的大小影响音量的高低。我们把对声波波形幅度的数字化表示称之为“量化”。

量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合，把落入某个区段内的样值归为一类，并赋于相同的量化值。如何分割采样信号的幅度呢?我们还是采取二进制的方式，以８位(bit)或16位(bit)的方式来划分纵轴。也就是说在一个以8位为记录模式的音效中，其纵轴将会被划分为个量化等级，用以记录其幅度大小。2.量化

以下图所示的原始模拟波形为例进行采样和量化。假设采样频率为1000次/秒，即每1/1000秒A/D转换器采样一次，其幅度被划分成0到9共10个量化等级，并将其采样的幅度值取最接近0~9之间的一个数来表示，如下图所示。图中每个正方形表示一次采样。

D/A转换器从上图得到的数值中重构原来信号时，得到下图中蓝色(直线段)线段所示的波形。从图中可以看出，蓝色线与原波形(红色线)相比，其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。

失真在采样过程中是不可避免的，如何减少失真呢？可以直观地看出，我们可以把上图中的波形划分成更为细小的区间，即采用更高的采样频率。同时，增加量化精度，以得到更高的量化等级，即可减少失真的程度。在下图（左）中，采样率和量化等级均提高了一倍，分别为2000次/秒和20个量化等级。在下图（右）中，采样率和量化等级再提高了一倍，分别达到4000次/秒和40个量化等级。从图中可以看出，当用D/A转换器重构原来信号时（图中的轮廓线），信号的失真明显减少，信号质量得到了提高。3.编码

模拟信号量经过采样和量化以后，形成一系列的离散信号——脉冲数字信号。这种脉冲数字信号可以一定的方式进行编码，形成计算机内部运行的数据。所谓编码，就是按照一定的格式把经过采样和量化得到的离散数据记录下来，并在有用的数据中加入一些用于纠错、同步和控制的数据。在数据回放时，可以根据所记录的纠错数据判别读出的声音数据是否有错，如在一定范围内有错，可加以纠正。

编码的形式比较多，常用的编码方式是PCM——脉冲调制。脉冲编码调制（PCM）是把模拟信号变换为数字信号的一种调制方式，即把连续输入的模拟信号变换为在时域和振幅上都离散的量，然后将其转化为代码形式传输或存储。3.1.3数字音频的文件格式

在多媒体技术中，存储音频信息的文件格式主要有：WAV文件、VOC文件和MP3文件等。

WAV文件

WAV文件又称波形文件，来源于对声音模拟波形的采样，并以不同的量化位数把这些采样点的值轮换成二进制数，然后存入磁盘，这就产生了波形文件。WAV文件用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持。

WAV声音文件是使用RIFF（ResourceInterchangeFileFormat资源交换文件）的格式描述的，它由文件头和波形音频文件数据块组成。文件头包括标志符、语音特征值、声道特征以及PCM格式类型标志等。WAV数据块是由数据子块标记、数据子块长度和波形音频数据3个数据子块组成。

Wave格式支持多种压缩算法，支持多种音频位数、采样频率和声道，是PC机上最为流行的声音文件格式，但其文件尺寸较大，多用于存储简短的声音片断。

未压缩的声音文件的存储量可用下式计算：

存储量（KB）=（采样频率KHZ×采样位数bit×声道数×时间秒）/8

2.VOC文件

VOC文件是Creative公司所使用的标准音频文件格式，多用于保存CreativeSoundBlaster(创新声霸)系列声卡所采集的声音数据，被Windows平台和DOS平台所支持。与WAV格式类似，VOC文件由文件头块和音频数据块组成。文件头包含一个标识、版本号和一个指向数据块起始地址的指针，这个指针帮助数据块定位以便顺利找到第一个数据块。数据块分成各种类型的子块，如声音数据、静音、标记、ASCII码文件、重复、重复的结束及终止标记等。

3.MPEG音频文件——.MP1/.MP2/.MP3

这里的音频文件格式指的是MPEG标准中的音频部分，即MPEG音频层(MPEGAudioLayer)。MPEG音频文件的压缩是一种有损压缩，根据压缩质量和编码复杂程度的不同可分为三层(MPEGAudioLayer1/2/3)，分别对应MP1、MP2和MP3这三种声音文件；

MPEG音频编码具有很高的压缩率，MP1和MP2的压缩率分别为4∶1和6∶1～8∶1，而MP3的压缩率则高达10∶1～12∶1，也就是说一分钟CD音质的音乐，未经压缩需要10MB存储空间，而经过MP3压缩编码后只有1MB左右，同时其音质基本保持不失真。

4.RealAudio文件——.RA/.RM/.RAM

RealAudio文件是RealNetworks公司开发的一种新型流式音频(StreamingAudio)文件格式；它包含在RealNetworks所制定的音频、视频压缩规范RealMedia中，主要用于在低速率的广域网上实时传输音频信息；网络连接速率不同，客户端所获得的声音质量也不尽相同：对于28.8kb/s的连接，可以达到广播级的声音质量；如果拥有ISDN或更快的线路连接，则可获得CD音质的声音。

5.AIFF文件——.AIF/.AIFF

AIFF是音频交换文件格式(AudioInterchangeFileFormat)的英文缩写，是苹果计算机公司开发的一种声音文件格式；被Macintosh平台及其应用程序所支持，其他专业音频软件包也同样支持这种格式。3.1.4声音质量的评价

目前有三种方法可以衡量声音的质量。一是用声音信号的带宽来衡量声音的质量，等级由高到低依次是DAT，CD，FM，AM和数字电话。此外，声音质量的度量还有两种基本的方法：一种是客观质量度量，另一种是主观质量度量。评价语音质量时，有时同时采取两种方法评估，有时以主观质量度量为主。

1．以声音的带宽衡量声音的质量

2、声音客观质量的度量声音客观质量的度量主要用信噪比(signaltonioseratio，SNR)来度量。它指音源产生最大不失真声音信号强度与同时发出噪音强度之间的比率，通常以S/N表示。一般用分贝（dB）为单位，信噪比越高表示音频质量越好。信噪比(SNR)用下式计算：SNR＝10log[(Vsignal)2/(Vnoise)2]＝20log(Vsignal

/Vnoise)其中，Vsignal表示信号电压，Vnoise表示噪声电压；SNR的单位为分贝(db)。

3、声音主观质量的度量与用SNR客观质量度量相比较，应该可以说人的感觉(如听觉、视觉等)更具有决定意义，感觉上的、主观上的测试应该成为评价声音质量和图像质量不可缺少的部分。而有的学者则认为，在语音和图像信号编码中使用主观质量度量比使用客观质量度量更加恰当，更有意义。可是一般来说，可靠的主观度量值也是比较难获得的，所获得的值也是一个相对值。对声音主观质量度量比较通用的标准是5分制：优(Excellent)、良(Good)、中(Fair)、差(Poor)、劣(Bad)。3.2音频信号压缩技术

音频信号压缩编码的主要依据是人耳的听觉特性，主要有两点：

1.人的听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号人耳听不到.2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时，强声使弱声难以听到，并且两者之间的关系与其相对频率的大小有关.

声音编码算法就是通过这些特性来去掉更多的冗余数据，来达到压缩数据的目的。3.2.1脉冲编码调制

1．编码的原理

它的原理框图下图所示

3.2.1脉冲编码调制

1．编码的原理

它的原理框图下图所示

模拟信号数字化一般有三个步骤：第一步是采样，就是每隔一段时间间隔读一次声音的幅度；第二步是量化，就是把采样得到的声音信号幅度转换成数字值。但那时并没有涉及如何进行量化。量化有好几种方法，但可归纳成两类：一类称为均匀量化，另一类称为非均匀量化。采用的量化方法不同，量化后的数据量也就不同。因此，可以说量化也是一种压缩数据的方法；第三步是编码，就是按一定格式记录采样和量化后的数据。

2．均匀量化

采用相同的“等分尺”来度量采样得到的幅度，也称为线性量化，如图3-4所示。量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声。

3．非均匀量化

对输入信号进行量化时，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔，如图3-5所示。

一个CD—DA采用脉冲编码调制PCM编码的实例

首先用一组脉冲采样时钟信号与输入的模拟音频信号相乘，相乘的结果即输入信号在时间轴上的数字化。然后对采样以后的信号幅值进行量化。最简单的量化方法是均衡量化，这个量化的过程由量化器来完成。对经量化器A/D变换后的信号再进行编码，即把量化的信号电平转换成二进制码组，就得到了离散的二进制输出数据序列x(n)，n表示量化的时间序列，x(n)的值就是n时刻量化后的幅值，以二进制的形式表示和记录。

3.2.2增量调制

它是一种预测编码技术，是PCM编码的一种变形。DM是对实际的采样信号与预测的采样信号之差的极性进行编码，将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”，则用“1”表示；相反则用“0”表示，或者相反。图3-7DM波形示意图从上图中可以看到，在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化，这种现象称为增量调制器的“斜率过载”(slopeoverload)。在输入信号缓慢变化部分，即输入信号与预测信号的差值接近零的区域，增量调制器的输出出现随机交变的“0”和“1”。这种现象称为增量调制器的粒状噪声(granularnoise)，这种噪声是不可能消除的。在输入信号变化快的区域，斜率过载是关心的焦点，而在输入信号变化慢的区域，关心的焦点是粒状噪声。

3.2.3自适应脉冲编码调制是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应，即量化阶的大小每隔几个样本就改变，也可以是非瞬时自适应，即量化阶的大小在较长时间才发生变化。改变量化阶大小的方法有两种：一种称为前向自适应，后向自适应。前者是根据未量化的样本值的均方根值来估算输入信号的电平，以此来确定量化阶的大小，并对其电平进行编码作为边信息(sideinformation)传送到接收端。后者是从量化器刚输出的过去样本中来提取量化阶信息。

(a)前向自适应

(b)后向自适应

3.2.4差分脉冲编码调制

是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。差分脉冲编码调制的思想是，根据过去的样本去估算(estimate)下一个样本信号的幅度大小，这个值称为预测值，然后对实际信号值与预测值之差进行量化编码，从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是，PCM是直接对采样信号进行量化编码，而DPCM是对实际信号值与预测值之差进行量化编码，存储或者传送的是差值而不是幅度绝对值。

差分脉冲编码调制的概念示于图3-9。图中的差分信号d(k)是离散输入信号s(k)和预测器输出的估算值se(k-1)之差。注意，se(k-1)是对s(k)的预测值，

3.2.5自适应差分脉冲编码调制

综合了APCM的自适应特性和DPCM系统的差分特性，是一种性能比较好的波形编码。它的核心想法是：①利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值,②使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。它的编码简化框图如图3-10所示。

3.3音频编码标准

3.3.1CCITTG系列声音压缩标准CCITT和ISO先后提出了一系列有关语音数据编译码标准,下面简要介绍几种音频编码技术标准。1．电话质量的音频压缩编码技术标准信号频率规定在300Hz～3.4kHz，采用标准的脉冲编码调制(PCM)，当采样频率为8kHz，进行8bit量化时，所得数据速率为64kb/s，即一个数字电话。1972年CCITT为电话质量和语音压缩制定了PCM标准G.711，其速率为64Kb／s，使用非线性量化技术，主要用于公共电话网中。

2．调幅广播质量的音频压缩编码技术标准

频率在50Hz一7kHz范围。G.722标准是采用16kHz采样，14bit量化，信号数据速率为224kbit／s，采用子带编码方法，将输入音频信号经滤波器分成高子带和低子带两个部分，分别进行ADPCM编码，再混合形成输出码流，224kbit／s可以被压缩成64kbit／s，最后进行数据插入(最高插入速率达16kbit／s)，因此利用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号。

3．高保真度立体声音频压缩编码技术标准高保真立体声音频信号频率范围是50Hz～20kHz，采用44．1kHz采样频率，16bit量化进行数字化转换，其数据速率每声道达705kbit／s。1991年国际标准化组织ISO和CCITT开始联合制定MPEG标准，其中ISOCDlll72-3作为“MPEG音频”标准，成为国际上公认的高保真立体声音频压缩标准。MPEG音频第一和第二层次编码是将输入音频信号进行采样频率为48kHz，44.1kHz，32kHz的采样，经滤波器组将其分为32个子带，同时利用人耳屏蔽效应，根据音频信号的性质计算各频率分量的人耳屏蔽门限，选择各子带的量化参数，获得高的压缩比。MPEG第三层次是在上述处理后再引入辅助子带，非均匀量化和熵编码技术，再进一步提高压缩比。MPEG音频压缩技术的数据速率为每声道32～448kbit／s，适合于CD－DA光盘应用。3.3.2MP3压缩技术

MP3的全名是MPEGAudioLayer-3，简单地说就是一种声音文件的压缩格式。ISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案

，按照压缩质量(每Bit的声音效果)和编码方案的复杂程度分别是Layer1、Layer2、Layer3。所有这三层的编码采用的基本结构是相同的。它们在采用传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论。也就是通过研究人耳和大脑听觉神经对音频失真的敏感度，在编码时先分析声音文件的波形，利用滤波器找出噪音电平(NoiseLevel)，然后滤去人耳不敏感的信号，通过矩阵量化的方式将余下的数据每一位打散排列，最后编码形成MPEG的文件。而音质听起来与CD相差不大。

MPEG的层次与压缩比率

Layer1(相当于384kbps立体声信号)4:1Layer2(相当于192~256kbps立体声信号)6:1~8:1Layer3(相当于112~154kbps立体声信号)10:1~12:13.3.3MP4压缩技术MP4并不是MPEG-4或者MPEG-1Layer4，它的出现是针对MP3的大众化、无版权的一种保护格式，由美国网络技术公司开发，美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。MP4使用的是MPEG-2AAC技术也就是俗称的a2b或AAC。其中，MPEG-2是MPEG于1994年11月针对数码电视(数码影像)提出的。它的特点就是，音质更加完美而压缩比更加大(1:15)。MPEG-2AAC(ISO/IEC13818-7)在采样率为8～96KHz下提供了1～48个声道可选范围的高质量音频编码。AAC就是AdvancedAudioCoding(先进音频编码)的意思，适用于从比特率在8kbit/s单声道的电话音质到160kbit/s多声道的超高质量音频范围内的编码，并且允许对多媒体进行编码/解码。

AAC与MP3相比，增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性，使得在音频压缩后仍能完美的再现CD音质。

AAC技术主要由以下三个部分组成。第一，AT&T的音频压缩技术专利。它可以将AAC压缩比提高到20:1而不损失音质。这样，一首3分钟的歌仅仅需要2.25MB，这在互联网上的下载速度是很惊人的。第二、安全数据库。它可以为你的AACMusic创建一个特定的密钥，将此密钥存于其数据库中。同时，只有AAC的播放器才能播放含有这种密钥第三、协议认证。这个认证包含了复制许可、允许复制副本数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。MP4技术的优越性要远远高于MP3，因为它更适合多媒体技术的发展以及视听欣赏的需求。但是，MP4是一种商品，它利用改良后的MPEG-2AAC技术并强加上由出版公司直接授权的知识产权协议作为新的标准；而MP3是一种自由音乐格式，任何人都可以自由使用。此外，MP4实际上是由音乐出版界联合授意的官方标准；MP3则是广为流传的民间标准。相比之下，MP3的灵活和自由度要远远大于MP4，这使得音乐发烧友们更倾向于使用MP3。更重要的一点是，MP3是目前最为流行的一种音乐格式，它占据着大量的网络资源，这使得MP4的推广普及难上加难。

3.3.4乐器数字接口MIDI

产生MIDI乐音的方法很多，现在用得较多的方法有两种：一种是频率调制(frequencymodulation，FM)合成法，另一种是乐音样本合成法，也称为波形表(Wavetable)合成法。这两种方法目前主要用来生成音乐。FM合成器生成乐音的工作原理主要是把几种乐音的波形用数字来表达，并且用数字计算机而不是用模拟电子器件把它们组合起来，通过数模转换器(digitaltoanalogconvertor，DAC)来生成乐音。但是使用FM合成法来产生各种逼真的乐音是相当困难的，有些乐音几乎不能产生。乐音样本合成法就是把真实乐器发出的声音以数字的形式记录下来，播放时改变播放速度，从而改变音调周期，生成各种音阶的音符。乐音样本的采集相对比较直观。

MIDI协议提供了一种标准的和有效的方法，用来把演奏信息转换成电子数据。

MIDI信息是以“MIDImessages”传输的，它可以被认为是告诉音乐合成器(musicsynthesizer)如何演奏一小段音乐的一种指令，而合成器把接收到的MIDI数据转换成声音。国际MIDI协会(InternationalMIDIAssociation)出版的MIDI1.0规范对MIDI协议作了完整的说明。MIDI数据流是单向异步的数据位流(bitstream)，其速率为31.25kbps，每个字节为10位(1位开始位，8位数据位和1位停止位)。MIDI乐器上的MIDI接口通常包含3种不同的MIDI连接器，用IN(输入),OUT(输出)和THRU(穿越)。MIDI数据流通常由MIDI控制器(MIDIcontroller)产生，如乐器键盘(musicalinstrumentkeyboard)，或者由MIDI音序器(MIDIsequencer)产生。MIDI控制器是当作乐器使用的一种设备，在播放时把演奏转换成实时的MIDI数据流，MIDI音序器是一种装置，允许MIDI数据被捕获、存储、编辑、组合和重奏。来自MIDI控制器或者音序器的MIDI数据输出通过该装置的MIDIOUT连接器传输。3.4常用音频处理软件简介3.4.1CoolEditPro

CoolEditPro是著名的Syntrillium公司开发的数字音频处理软件，其运行环境为Windows启动后其界面如右图所示。CoolEditPro的主要特色有：

(1).支持的音频格式十分丰富，多达十余种，还提供了对5种不同类型WAV文件的支持。(2).提供丰富的特殊效果。包括3D混响、降噪、滤波、音频缩/放、合声、延迟、变形、反转、静音等。(3).提供了强大的DSP（数字信号处理）能力。能够同时处理64条音轨。支持录音、回放、混音、音频编辑。借助它，能够方便地制作出自己想要的任何特殊音效，并添加到各种类型的多媒体作品中去。

(4).操作界面设计简捷方便。在工具栏中，提供了56个图形化按钮。几乎所有的编辑操作都能够方便地进行操作。3.4.2GoldWaveGoldWave的窗口界面如图下图所示。

GoldWave是一款相当不错的数码录音及编辑软件，除了附有许多的效果处理功能外，它还能将编辑好的文件存为WAV、AU、SND、RAW和AFC等格式，而且它可以不经由声卡直接抽取SCSI形式的CDROM中的音乐来录制编辑。作为Wave文件编辑处理工具，支持从MP3、MPG、AVI、ASF、MOV等文件中提取音频进行编辑，所以除了它强大的编辑功能外，用作把以上格式的音频转换成WAV文件也是很方便的。

GoldWave同时是较新的、适合于一般进行音频素材采集与制作的软件，它集音频录制和编辑于一体，不仅是一个录音程序，可以很方便地制作CAI课件的背景音乐、音效、录制CD、转换音乐格式等，而且还具有各种复杂的音乐编辑和特效处理功能。该软件不需要安装，只要运行程序文件夹中的可执行程序即可。GoldWave小巧玲珑，只有600K左右，可从下载。

3.4.3CakeWalk（音乐大师）

作为一种图形化的音乐编辑软件，CakeWalk的主要工作界面就是各种工作窗口，我们对MIDI事件和音频事件的所有编辑和操作都是在工作窗口中完成的。如下图所示，音轨窗既是CakeWalk主界面的主要组成部分，也是重要的工作窗口。类似的还有钢琴窗帘、事件列表窗、调音台窗等，每个窗口各有所长，分别适用于不同的编辑对象和编辑特征。1.Cakewalk的调音台可以自动混音，可以一边播放乐曲，一边记录控制键（滑键）的调整动作，而且多个控制键可以编组控制，这为制作渐强减弱效果提供了最为简单的操作手段。2.对于所有连续变化的数据，例如弯音、调制、控制器、键速和速度等，Cakewalk都提供了手工划线的编辑方式，用鼠标划一条斜线或曲线便可随意改变数值。因此，对于像弯音轮的细微变化过程、速度的自由变化等之类较难处理的数据，在Cakewalk中都变得异常简单。3.Cakewalk可以将其所有菜单操作命令赋予MIDI键盘，也就是说，可以用合成器的键盘来控制软件的各种操作，其功能是所有音序软件中最全面的。4.Cakewalk可以将音符的位置、控制器的变化等MIDI信息图形化地显示出来，因此看起来更加接近总谱。

CakewalkProAudio的一些特色功能3.5波形音频文件的采集与制作

3.5.1利用“录音机”生成和编辑波形文件

Windows录音机的主要功能是录音和放音，使用“录音机”可以录制、混合、播放和编辑声音，也可以将声音链接或插入到另一文档中。其主要功能操作如下所述：（1）波形文件的录制：确保音频输入设备已经连接到计算机。录音机常用的输入设备是麦克风和CD-ROM播放机。（2）波形文件的存储：存储的文件格式为波形（.wav）文件。（3）声音的编辑：复制、粘贴、插入、删除等操作。（4）音频变换与特殊效果：更改声音的大小、速度、回音等。

CoolEditPro是一种非常出色的声音编辑器，其主要功能操作如下所述。（1）波形文件的录制：录制及录制参数（采样率、量化位数、单双声道等）的设定。（2）波形文件的存储：存储的文件格式（.wav、.au、.smp、.asf、.wma等）的选择，文件格式与参数（采样率、量化位数、单双声道）的变换。（3）波形文件选定范围播放，记录播放时间。（4）声音的编辑：剪切、拷贝、混合粘贴、插入多轨工程、插入多轨播放列表、删除静音、零点定位、确定节拍等。（5）声音的变换与特殊效果：降噪、扩音、剪接、添加立体环绕、淡入淡出、3D回响等音效。3.5.2用CoolEditPro编辑制作波形文件

3.6声音文件格式的互换

1．选择声音文件格式的部分原则

1）Wav文件：不仅所有的Windows的音效处理应用程序都可以播放WAVE文件，而且常见的各种多媒体编辑制作软件的音效播放都能直接使用WAV文件。再者，WAV格式的音质效果也不错。

2）MP3文件

：如果通过适当的工具来截取CD上的数字音频并保存为CD音质的WAVE文件，然后进行MPEGLayer3的压缩编码形成MP3文件，再用合适的解码软件对MP3解码。那么可以形成一个节约大量存储空间，保持CD音质的整体解决方案。

3）MIDI文件：是多媒体计算机产生音频（特别是音乐）的另一种主要方式，可以满足需要长时间音乐的场合。4）SWA文件：SWA格式的音乐文件，是Authorware4.0以上版本支持的特殊音乐格式，它的容量类似于流行的MP3，也非常小。在Authorware4.0或4.0以上版本中，自带WAV→SWA转换器，

3.6.2转换CD音轨

下面以比较常用的CDCopy为例来说明一下如何转换CD音轨。CDCopy是一个常用的抓音轨工具，它对烂盘的纠错性能非常好，还可以把CD音轨转换为WAV、AU、RA、YamahaVQF、AAC、MP3等多种声音格式，而且CDCopy是一个共享软件，我们可以从下载到它的最新版本。抓取及转换音轨步骤分以下3步：1．选择文件格式

2．设置文件保存路径

3．转换音轨3.7.1语音识别的发展历史

可以将语音识别近六十年的发展历史划分为4个时期：（1）初始发展期

（2）基础突破期

（3）综合发展期

（4）成熟期

3.7语音识别技术及应用

3.7.2语音识别技术语音识别以语音为研究对象，是语音信号处理的一个重要研究方向，是模式识别的一个分支，其目的就是要让机

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多媒体技术基础课件

文档简介

温馨提示

最新文档

评论

多媒体技术基础课件

文档简介

温馨提示

最新文档

评论

相关文档