AdobeAudition音频制作教案_第1页
AdobeAudition音频制作教案_第2页
AdobeAudition音频制作教案_第3页
AdobeAudition音频制作教案_第4页
AdobeAudition音频制作教案_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学院标准教案纸

课堂教学题目音频信息处理与数字音频编辑1

授课时间地点

了解声音信号的特点、存储格式及质量的度量方法

教学目标了解声音的特性。

了解声音的分类

声音的三要素、声音的频谱

教学重点

教学难点

教学内容方法与手段

音频概述

音频(Audio)是人们用来传递信息最便利、最生疏的方式,是多媒体系统使用

最多的信息载体。

音频是通过确定介质(如空气、水等)传播的一种连续的波,在物理学中称为声

波。声音的强弱表达在声波压力的大小上(和振幅相关),音调的凹凸表达在声

波的频率上(和周期相关),如以以下图。

声波的振幅就是通常所说的音量。在声学中用来定量争辩空气受到压力的大

小。

周期

以规章的时间间隔重复消灭,这个时间间隔称为声音信号的周期,用秒表示。

频率

声音信号的频率是指信号每秒钟变化的次数,用赫兹(Hz)表示。人们把

频率小于20Hz的信号称为亚音信号;频率范围为20Hz〜20kHz的信号称为音

频(Audio〕信号;高于20kHz的信号称为超音频信号,或称超声波信号。

带宽

带宽是指频率掩盖的范围。

音频信息处理根底

音频信息在多媒体中的应用极为广泛:视频图像配以娓娓动听的音乐和语音;

静态或动态图像配以讲解和背景音乐;立体声音乐可增加空间感;玩耍中的音

响效果等。

音频处理技术主要包括电声转换、音频信号的存储、重放技术、加工处理技

术以及数字化音频信号的编码、压缩、传输、存取、纠错等。

音频文件的分类

一.,多媒体音频可按用途、来源、文件格式及压缩方法等多种途径进展分类。

音频信号可分为两类:语音信号和非语音信号。

语音是语言的物质载体,是社会交际工具的符号,它包含了丰富的语言内涵,是

人类进展信息沟通所特有的形式。

非语音信号主要包括音乐和自然界存在的其他声音形式。非语音信号的特点是不

具有简洁的语义和语法信息,信息量低、识别简洁。

1.规章音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。

因声波是在时间和幅度上都连续变化的量,我们称之为模拟量。

2.模拟音频信号的两个重要参数

模拟音频信号有两个重要参数:频率和幅度。声音的频率表达音调的凹凸,声波

幅度的大小表达声音的强弱。

一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之

为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。信号的幅度是从信号的基

线到当前波峰的距离。幅度打算了信号音量的强弱程度。幅度越大,声音越强。

对音频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量。

3.声音的A/D与D/A转换

A/D转换就是把模拟信号转换成数字信号的过程,模拟电信号变为了由“0”和

“1”组成的Bit信号。这样做的好处是显而易见的,声音存储质量得到了加强,

数字化的声音信息使计算机能够进展识别、处理和压缩。

A/D转换的一个关键步骤是声音的采样和量化,得到数字音频信号,它在时间上

是不连续的离散信号。

借助于A/D或D/A转换器,模拟信号和数字信号可以相互转换。

4.声音的三要素1)

音调:代表了声音的凹凸。音调与频率有关,频率越高,音调越高,反之亦然。

在使用音频处理软件对声音的频率进展调整时,也可明显感到音调随之而产

生的变化。各种不同的声源具有自己特定的音调,假设转变了某种声源的音调,

则声音会发生质的转变,使人们无法区分声源原来的面目。2

音色:即特色的声音。声音分纯音和复音两种类型。所谓纯音,是指振幅和周期

均为常数的声音;复音则是具有不同频率和不同振幅的混合声音。大自然中的声音

绝大局部是复音。在复音中,最低频率的声音是“基音”,它是声音的基调。其

他频率的声音称为“谐音”,也叫泛音。基音和谐音是构成声音音色的重要因素。

各种声源都具有自己独特的音色,例如各种乐器的声音、每个人的声音、各种生物的

声音等,人们就是依据音色来区分声源种类的。3)音强:声

音的强度,也被称为声音的响度,常说的“音量”也是指音强。音强与声波的振

幅成正比,振幅越大,强度越大。唱盘、CD激光盘以及其他形式声音载体中的

声音强度是确定的,通过播放设备的音量把握,可转变倾听时的响度。

5.声音的频谱

声音的频谱有线性频谱和连续频谱之分。线性频谱是具有周期性的单一频率声

波;连续频谱是具有非周期性的带有确定频带全部频率重量的声波。纯粹的单一频

率的声波只能在特地的设备中制造出来,声音效果单调而乏味。自然界中的声音

几乎全部属于非周期性声波,该声波具有广泛的频率重量,听起来声音饱满、音

色多样且具有生气。

二、按用途分类

音频可分为语音(如讲解词)、音乐(如配乐〕和声效(如掌声)等。

按声音来源分类

数字化声波,即利用声卡等专用设备将语音、音乐等波形信息转换成数字方式,

并将编码保存起来,使用时再解码和转换成原来的波形。

MIDI合成,即通过电子乐器的弹奏形成数字指令驱动音乐合成器,并借助于合

成器产生的数字声音信号复原成相应的音乐或音效。

利用声音素材库猎取音频文件。

三、按文件存储格式分类WAV:

微软的标准声音文件格式。

MIDI:乐器数字接口(MusicalInstrumentDigitalInterface)的缩写,实质是一个

通过电缆将电子音乐设备连接起来的协议。-

RMI:这是另一种MIDI格式,它也分为RIFFMIDIFormat0和RIFFMIDIFormat

1两种。

MP3:MP3是目前最热门的音乐文件格式。这是一种间频压缩技术,承受MPEG

Layer3标准对WAV音频文件进展压缩而成。

MP2:承受MPEGLayer2标准对WAVE音频文件进展压缩后生成的音乐文件。

AU、RA、VQF、CD-DA、CD-XA等

作业

教学反思或

反响记录

课堂教学题目音频信息处理与数字音频编辑2

授课时间地点

理解数字化音频的方法,为后期的音频编辑工作奠定好根底。

教学目标

数字音频的常见格式

教学重点

教学难点模拟音频的数字化过程

教学内容方法与手段

数字化音频技术

音频的数字化

代表声音的模拟信息是个连续的量,不能由计算机直接处理,必需将其数字

化方可被计算机接收。

影响数字化声音质量的因素主要有三个,即采样频率、采样精度和通道个数。

MIDI乐器数字化接口

MIDI为乐器数字化接口,是为了把电子乐器与计算机相连而制定的一个标

准,是数字音乐的国际标准。用来将乐器的音乐转化为数字化音乐存储在计算机

中,然后进展编辑播放。

模拟音频的数字化过程

数字化的声音易于用计算机软件处理,现在几乎全部的专业化声音录制、编辑器

都是数字方式。对模拟音频数字化过程涉及到音频的采样、量化和编码。

采样和量化的过程可由A/D转换器实现。A/D转换器以固定的频率去采样,

即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字

音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称

为数字声波文件。

1.采样

信息论的奠基者香农(Shannon)指出:在确定条件下,用离散的序列可以完全

代表一个连续函数,这是采样定理的根本内容。

为实现A/D转换,需要把模拟音频信号波形进展分割,这种方法称为采样

(Sampling)o采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,

把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数

为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。

采样频率与声音频率之间有确定的关系,依据奈奎斯特(Nyquist)理论,只有

采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音复原成为

原来的声音。

f2f

s

2.量化

采样只解决了音频波形信号在时间坐标(即横轴)上把一个波形切成假设干个等

分的数字化问题,但是还需要用某种数字化的方法来反映某一瞬间声波幅度的电

压值大小c该值的大小影响音量的凹凸c我们把对声波波形幅度的数字化表示称

为“量化”。

量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的

集合,把落入某个区段内的样值归为一类,并赋于一样的量化值。如何分割采样

信号的幅度呢?我们还是实行二进制的方式,以8位(bit)或16位(bit)的方式来划

分纵轴。也就是说在一个以8位为记录模式的音效中,其纵轴将会被划分为个量

化等级,用以记录其幅度大小。

3.编码

模拟信号量经过采样和量化以后,形成一系列的离散信号一一脉冲数字信号。这

种脉冲数字信号可以确定的方式进展编码,形成计算机内部运行的数据。所谓编

码,就是依据确定的格式把经过采样和量化得到的离散数据记录下来,并在有用的

数据中参与一些用于纠错、同步和把握的数据。在数据回放时,可以依据所记录

的纠错数据判别读出的声音数据是否有错,如在确定范围内有错,可加以订正。

编码的形式比较多,常用的编码方式是PCM——脉冲调制。脉冲编码调制

[PCM)是把模拟信号变换为数字信号的一种调制方式,即把连续输入的模拟

信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。

数字音频的文件格式

在多媒体技术中,存储音频信息的文件格式主要有:WAV文件、VOC文件和

MP3文件等。

1.WAV文件

WAV文件又称波形文件,来源于对声音模拟波形的采样,并以不同的量化位

数把这些采样点的值轮换成二进制数,然后存入磁盘,这就产生了波形文件。

WAV文件用于保存Windows平台的音频信息资源,被Windows平台及其应

用程序所广泛支持。

WAV声音文件是使用RIFF(ResourceInterchangeFileFormat资源交换文件〕的

格式描述的,它由文件头和波形音频文件数据块组成。文件头包括标志符、语音

特征值、声道特征以及PCM格式类型标志等。WAV数据块是由数据子块标记、

数据子块长度和波形音频数据3个数据子块组成。

Wave格式支持多种压缩算法,支持多种音频位数、采样频率和声道,是PC

机上最为流行的声音文件格式,但其文件尺寸较大,多用于存储简短的声音片断。未

压缩的声音文件的存储量可用下式计算:

存储量(KB)=(采样频率KHZX采样位数bitX声道数X时间秒)/8

2.VOC文件

VOC文件是Creative公司所使用的标准音频文件格式,多用于保存Creative

SoundBlaster(创声霸)系列声卡所采集的声音数据,被Windows平台和DOS平

台所支持。

与WAV格式类似,VOC文件由文件头块和音频数据块组成。文件头包含一

个标识、版本号和一个指向数据块起始地址的指针,这个指针帮助数据块定位以便

顺当找到第一个数据块。数据块分成各种类型的子块,如声音数据、静音、标记

ASCII码文件、重复、重复的完毕及终止标记等。

3.MPEG音频文件——.MP1/.MP2/.MP3

这里的音频文件格式指的是MPEG标准中的音频局部,即MPEG音频层

(MPEGAudioLayer)oMPEG音频文件的压缩是一种有损压缩,依据压缩质量和

编码简洁程度的不同可分为三层(MPEGAudioLayer1/2/3),分别对应MP1、MP2

和MP3这三种声音文件।

MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和

6:1~8:1,而MP3的压缩率则高达10:1〜12:1,也就是说一分钟CD音质

的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,

同时其音质根本保持不失真。

4.RealAudio文件——.RA/.RM/.RAM

RealAudio文件是RealNetworks公司开发的一种型流式音频

(StreamingAudio)文件格式;它包含在RealNetworks所制定的音频、视频压缩标

准RealMedia中,主要用于在低速率的广域网上实时传输音频信息;网络连接速

率不同,客户端所获得的声音质量也不尽一样:对于28.8kb/s的连接,可以到达

播送级的声音质量;假设拥有ISDN或更快的线路连接,则可获得CD音质的声

音。

5.AIFF文件——.AIF/.AIFF

AIFF是音频交换文件格式(AudioInterchangeFileFormat)的英文缩写,是苹

果计算机公司开发的一种声音文件格式;被Macintosh平台及其应用程序所支持,

其他专业音频软件包也同样支持这种格式。

声音质量的评价

目前有三种方法可以衡量声音的质量。一是用声音信号的带宽来衡量声音的质

量,等级由高到低依次是DAT,CD,FM,AM和数字。此外,声音质量的

度量还有两种根本的方法:一种是客观质量度量,另一种是主观质量度量。评价

语音质量时,有时同时实行两种方法评估,有时以主观质量度量为主。

1.以声音的带宽衡量声音的质量

CD-DA

FM广播

AM厂播

电话

1020502003.4K7K13K22K)

2、声音客观质量的度量

声音客观质量的度量主要用信噪比(signaltonioseratio,SNR)来度量。它指音源

产生最大不失真声音信号强度与同时发出噪音强度之间的比率,通常以S/N表

示。一般用分贝(dB)为单位,信噪比越高表示音频质量越好。信噪比(SNR)

用下式计算:SNR=10log[(Vsignal)2/(Vnoise)2]=20log(Vsignal/Vnoise)

其中,Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(db)。

3、声音主观质量的度量

与用SNR客观质量度量相比较,应当可以说人的感觉(如听觉、视觉等)更具

有打算意义,感觉上的、主观上的测试应当成为评价声音质量和图像质量不行缺

少的局部。而有的学者则认为,在语音和图像信号编码中使用主观质量度量比使用

客观质量度量更加恰当,更有意义。可是一般来说,牢靠的主观度量值也是比较

难获得的,所获得的值也是一个相对值。

对声音主观质量度量比较通用的标准是5分制:优(Excellent)、良(Good)、中

(Fair)“差(Poor),,劣(Bad)

作业

教学反思或反

馈记录

课堂教学题目音频信息处理与数字音频编辑3

授课时间地点

理解音频信号压缩方法及音频编码标准,,为后期的音频编辑工

教学目标作奠定好根底。

脉冲编码调制、声音压缩标准

教学重点

教学难点脉冲编码调制

教学内容方法与手段

音频文件的压缩技术

音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点:

1.人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不

到.

2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时,强声使弱声难以

听到,并且两者之间的关系与其相对频率的大小有关.

声音编码算法就是通过这些特性来去掉更多的冗余数据,来到达压缩数

据的目的。

一、脉冲编码调制

模拟信号数字化一般有三个步骤:第一步是采样,就是每隔一段时间间隔读一次

声音的幅度;其次步是量化,就是把采样得到的声音信号幅度转换成数字值。但

那时并没有涉及如何进展量化。量化有好几种方法,但可归纳成两类:一类称为

均匀量化,另一类称为非均匀量化。承受的量化方法不同,量化后的数据量也就

不同。因此,可以说量化也是一种压缩数据的方法;第三步是编码,就是按确定

格式记录采样和量化后的数据。

非均匀量化

对输入信号进展量化时,大的输入信号承受大的量化间隔,小的输入信号承受小

的量化间隔

增量调制

它是一种推想编码技术,是PCM编码的一种变形。DM是对实际的采样

信号与推想的采样信号之差的极性进展编码,将极性变成“0”和“1”这两种可

能的取值之一。假照实际的采样信号与推想的采样信号之差的极性为“正”,则

用“1”表示;相反则用“0”表示,或者相反。

自适应脉冲编码调制

是依据输入信号幅度大小来转变量化阶大小的一种波形编码技术。这种自适应可

以是瞬时自适应,即量化阶的大小每隔几个样本就转变,也可以是非瞬时自适应,即

量化阶的大小在较长时间才发生变化。

转变量化阶大小的方法有两种:一种称为前向自适应,后向自适应。前者是依

据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大

小,并对其电平进展编码作为边信息(sideinformation)传送到接收端。后者是从

量化器刚输出的过去样本中来提取量化阶信息

是利用样本与样本之间存在的信息冗余度来进展编码的一种数据压缩技术。差分

脉冲编码调制的思想是,依据过去的样本去估算(estimate)下一个样本信号的幅度

大小,这个值称为推想值,然后对实际信号值与推想值之差进展量化编码,从而就

削减了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直

接对采样信号进展量化编码,而DPCM是对实际信号值与推想值之差进展量化编

码,存储或者传送的是差值而不是幅度确定值。

自适应差分脉冲编码调制

综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波

形编码。它的核心想法是:①利用自适应的思想转变量化阶的大小,即使用小的

量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,②使用过去

的样本值估算下一个输入样本的推想值,使实际样本值和推想值之间的差值总是

最小。

二、CCITTG系列声音压缩标准

CCITT和ISO先后提出了一系列有关语音数据编译码标准,下面简要介绍几种音

频编码技术标准。

1.质量的音频压缩编码技术标准

信号频率规定在300Hz〜3.4kHz,承受标准的脉冲编码调制(PCM),当采样频率

为8kHz,进展8bit量化时,所得数据速率为64kb/s,即一个数字。:1972年

CCITT为质量和语音压缩制定了PCM标准G.711,其速率为64Kb/s,使

用非线性量化技术,主要用于公共网中。

2.调幅播送质量的音频压缩编码技术标准

频率在50Hz—7kHz范围。G.722标准是承受16kHz采样,14bit量化,信号数

据速率为224kbit/s,承受子带编码方法,将输入音频信号经滤波器分成高子带

和低子带两个局部,分别进展ADPCM编码,再混合形成输出码流,224kbit/s

可以被压缩成64kbit/s,最终进展数据插入(最高插入速率达16kbit/s),因此利

用G.722标准可以在窄带综合效劳数据网N-ISDN中的一个B信道上传送调幅播

送质量的音频信号。

3.高保真度立体声音频压缩编码技术标准

高保真立体声音频信号频率范围是50Hz〜20kHz,承受44.1kHz采样频率,16bit

量化进展数字化转换,其数据速率每声道达705kbit/s。1991年国际标准化组织

ISO和CCITT开头联合制定MPEG标准,其中ISOCDU172-3作为“MPEG音频”

标准,成为国际上公认的高保真立体声音频压缩标准。MPEG音频第一和其次层

次编码是将输入音频信号进展采样频率为48kHz,44.1kHz,32kHz的采样,经

滤波器组将其分为32个子带,同时利用人耳屏蔽效应,依据音频信号的性质计

算各频率重量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。MPEG第

三层次是在上述处理后再引入关心子带,非均匀量化和牖编码技术,再进一步提

高压缩比。MPEG音频压缩技术的数据速率为每声道32〜448kbit/s,适合于CD

—DA光盘应用。

数字音频的压缩

承受数字音频猎取声音文件的方法最突出的问题是信息量大,音频信息文件

所需的存储空间的计算公式为:存储容量(字节)=采样频率X承受精度/8X声

道数X时间

音频压缩编码的根本方法

——音频信号的压缩方、法有•多种°根木上分为两大类।有损压缩和无损压缩口无

损压缩法包括不引入任何数据失真的各种墙编码;有损压缩又可分为波形编码、

模型编码和同时利用这两种技术的混合编码方法。

有损压缩

波形编码利用采样和量化过程来表示音频信号的波形,使编码后的音频信号与原

始信号的波形尽可能匹配。它主要依据人耳的听觉特性进展量化,以到达压缩数

据的目的。

参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模

型参数和鼓舞信号的信息,并对这些信息编码,最终在输出端合成原始信号。

混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可以在较低

的误码率上得到较高的音质。

作业

教学反思或反

馈记录

课堂教学题目音频信息处理与数字音频编辑4

授课时间地点

了解语音识别技术及其应用,为后续相应软件开发奠定好根底。

教学目标

音频文件的格式转化

教学重点

教学难点

教学内容方法与手段

音频文件的格式转化与语音识别技术

声音文件格式的互换

1.选择声音文件格式的局部原则

1)Wav文件:不仅全部的Windows的音效处理应用程序都可以播放WAVE

文件,而且常见的各种多媒体编辑制作软件的音效播放都能直接使用WAV文件。

再者,WAV格式的音质效果也不错。

2)MP3文件:假设通过适当的工具来截取CD上的数字音频并保存为CD音

质的WAVE文件,然后进展MPEGLayer3的压缩编码形成MP3文件,再用适

宜的解码软件对MP3解码。那么可以形成一个节约大量存储空间,保持CD音

质的整体解决方案。

3)MIDI文件:是多媒体计算机产生音频(特别是音乐〕的另一种主要方式,

可以满足需要长时间音乐的场合。

4)SWA文件:SWA格式的音乐文件,是Authorware4.0以上版本支持的特别音

乐格式,它的容量类似于流行的MP3,也格外小。在Authorware4.0或4.0以上

版本中,自带WAV-SWA转换器

转换CD音轨

下面以CDCopy为例来说明一下如何转换CD音轨。CDCopy是一个常用的抓音轨

工具,它对烂盘的纠错性能格外好,还可以把CD音轨转换为WAV、AU、RA、

YamahaVQF,AAC、MP3等多种声音格式,而且CDCopy是一个共享软件。抓

取及转换音轨步骤分以下3步:

1.选择文件格式

2.设置文件保存路径

3.转换音轨

语音识别技术及应用

语音识别的进展历史

可以将语音识别近六十年的进展历史划分为4个时期:

(1)初始进展期

(2)根底突破期

(3)综合进展期

(4)成熟期

语音识别以语音为争辩对象,是语音信号处理的一个重要争辩方向,是模式识别的

一个分支,其目的就是要让机器具有人的听觉功能,在人机语音通讯中“听懂”——

人类口述的语言。依据不同的需求,语音识别的识别内容可分为狭义的语音识别

和说话人语音识别。

1.语音识别技术的根底

一个完整的语音识别系统可大致分为三局部:

(1)语音特征提取:其目的是从语音波形中提取出随时间变化的语音特征序列。

(2)声学模型与模式匹配(识别算法〕:声学模型通常将猎取的语音特征通过学

习算法产生。在识别时将输入的语音特征同声学模型(模式)进展匹配与比较,

得到最正确的识别结果。

⑶语言模型与语言处理:语言模型包括由识别语音命令构成的语法网络或由

统计方法构成的语言模型,语言处理可以进展语法、语义分析。对小词表语音识

别系统,往往不需要语言处理局部。

声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一局部。声学

模型的目的是供给一种有效的方法计算语音的特征矢量序列和每个发音模板之

间的距离。声学模型的设计和语言发音特点亲热相关。声学模型单元大小(字发

音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及机

敏性有较大的影响。必需依据不同语言的特点、识别系统词汇量的大小打算识别单

元的大小。

语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以依据语

言学模型、语法构造、语义学进展推断订正,特别是一些同音字则必需通过上下

文构造才能确定词义。语言学理论包括语义构造、语法规章、语言的数学描述模

型等有关方面。目前比较成功的语言模型通常是承受统计语法的语言模型与基于规

章语法构造命令语言模型。语法构造可以限定不同词之间的相互连接关系,削减

了识别系统的搜寻空间,这有利于提高系统的识别。

2.语音识别的根本原理

预处理包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引

起的噪声影响等,并涉及到语音识别基元的选取和端点检测问题:

特征提取局部用于提取语音中反映本质特征的声学参数,如平均能量、平均

跨零率、共振峰等;

训练在识别之前进展,通过让讲话者屡次重复语音,从原始语音样本中去除

冗余信息,保存关键数据,再依据确定规章对数据加以聚类,形成模式库;

模式匹配局部是整个语音识别系统的核心,它是依据确定的准则(如某种距

离测度)以及专家学问(如构词规章、语法规章、语义规章等),计算输入特征

与库存模式之间的相像度,推断出输入语音的语意信息。

3.处理的方法:

(1)连续语音流的预处理

波形硬件采样率确实定、分帧大小与帧移策略确实定;

剔除噪声的带通滤波、高频预加重处理、各种变换策略;

波形的自动切分(依靠于识别基元的选择方案)。

(2)特征参数提取

识别语音的过程,实际上是对语音特征参数模式的比较和匹配的过程。语音特征

参数的选取对系统识别结果起着重要的作用。因此,必需查找一个既能充分表达

语音特征又能彼此区分的特征参数,这是语音识别中的一个最重要根本问题。语

音识别系统常用的特征参数有线性推想系数、倒频谱系数、平均过零率、能量、短

时频谱,共振峰频率及带宽等,

(3)参数模板存储。在建立识别系统时,首先进展特征参数提取,然后对系统

进展训练和聚类。通过训练,系统建立并存储一个该系统需识别字(或音节)的

参数模板库。

(4)识别判决。识别时,待识语音信号经过与训练时一样的特征参数提取后,

与模式模板存储器中的模式进展匹配计算和比较,并依据确定的规章进展识别判

决,最终输出识别结果。

语音识别系统的类型

1.按可识别的词汇量多少

2.依据语音的输入方式

3.按发音者为特定/非特定人

4.按发音者的声纹

语音识别的应用

1.在信息处理领域的应用

(1)给计算机发送指令。

(2)听写系统。

(3)信息查询。

(4)网上交谈。

2.教育与商务应用

(1)语音教学软件。

(2)查询。

(3)电子商务。

3.消费电子产品应用

作业

教学反思或反

响记录

课堂教学题目音频信息处理与数字音频编辑5

授课时间地点

使学生了解音频与数字音频的根底学问,为后期的音频编辑工作

教学目标奠定好根底。

后期音频编辑的流程

教学重点

教学难点后期音频编辑的流程

教学内容方法与手段

影视动漫后期音乐编辑

一、影视动漫声音的由来

玩耍音乐的进展

玩耍形式,很早就有。但是,现在我们提到动漫和玩耍,根本上是指计算机玩耍。这

种形式是在20世纪末进展起来的,近来,随着计算机应用的普及,计算机玩耍已

经成为当今消遣的主流。

动画音乐的进展

动画音乐制作的进展比玩耍音乐的进展特别一些,由于有很多大型的电影公司生

产和制作动画片,他们在制作上质量格外高。但是,目前比较流行的小型动漫作

品,照旧是由简洁的制作队伍来完成。因此,动画音乐也具有与玩耍相像的进呈

现状。

二、影视动漫声音的分类

语言

奈:是由口腔发出的声音,是将角色立体化的重要元素。

配音演员的素养

录音

效果声

效果声是伴随着一些自然界现象而发出的声音,如雷雨声、脚步声、爆炸声等。

1、双木尸H'J切目匕展才以H'J诜头囚系与口工孙说空也求目

2、效果声与动漫玩耍

3、玩耍音效的分类

音乐

动漫作品是一种综合的艺术作品。其中有震撼迫人的火爆场面,有细腻缠绵的对

白,然而,由始至终伴随的是扣人心弦、感人肺腑的主题音乐。

1、音乐在动漫剧作品或玩耍中的作用

2、少儿玩耍的音乐

三、动漫声音的常见格式

一般的数字音频格式

1.波形音频文件WAV

2.MPEG音频文件Lmpl/.mp2/.mp3〕

3“MP3pro

4.OggVorbis

流媒体音频格式

1.RealAudio音频文件[.RA/.RM/.RMX)

2.WindowsMedia:WMA(*.wma)

MIDI音频

MIDI(MusicalInstrumentDigitalInterface)音乐是一种合成音乐。

四、后期音频编辑的硬件环境

声卡

声卡,也叫音频卡,是多媒体电脑中用来处理声音的接口卡。

声卡的接口一般包括:线型输入接口、线型输出端口、话筒输入端口、扬声器输

出端口、MIDI及玩耍摇杆接口等。

耳机和音箱

耳机和音箱都可以称为扬声器,是一种电声换能器件,能够将音频信号变换为声

音。

麦克风

麦克风,学名为传声器,由Microphone翻译而来,它是将声音信号转换为电信

号的能量转换器件。

按工作原理,话筒可以分为电动式话筒和电容式话筒。

按信号的传递方式分为有线话筒和无线话筒。

MIDI键盘

MIDI键盘外观上与电子琴很相像,本身不能发声,一般与电脑相连接使用。

调音台

调音台又称调音把握台,它将多路输入信号进展放大、混合、安排、音质修饰和

音响效果加工。

录音室

5、后期音频编辑的常用软件

播放软件:千千静听、Winamp、酷我等

编辑软件:AdobeAudition音频编辑大师、GoldWave等

格式转换软件:EaseAudioConverter、SuperVideotoAudioConverter等

6、后期音频编辑的流程

教学反思或反

响记录

课堂教学题目AdobeAudition软件与根本操作1

授课时间地点

了解Audition简介

把握Audition的工作界面

教学目标

把握Audition的界面布局

了解保藏夹的使用

Audition的工作界面

教学重点Audition的界面布局

教学难点Audition的工作界面

教学内容方法与手段

初识Audition

争辩问题:1、AuditionCS6的工作界面分为哪几种?分别为?

2、保藏夹是否可以将自己创立的内容进展保藏?

初识Audition工作区

Audition的工作区与Adobe公司其他视频、图形应用程序一样,由多个窗口构成,

所以你不需要学习使用多种不同的用户界面。用户可以选择由哪些窗口构成工作

区,也可以在任何时候增加或删除窗口。

面板

1.翻开AdobeAuditiono在Lesson02文件夹中翻开文件start02.wav0

2.选择“窗口>工作区〉传统”。选择“窗口>工作区〉重置‘传统'",即可确保

使用的工作区为已存储的版本。

3.消灭对话框显示是否期望重置“传统”作为原始布局,单击“是”按钮

4.单击波形编辑器面板中的波形,在单击面板时,会消灭蓝色线条勾画出面板

的轮廓。

5.面板的上、下、左、右都有分割线,当光标置于分割线上时会消灭分割符号,

单击鼠标左键选中并拖动可以调整面板尺寸。例如,选中波形编辑器左侧蓝色线

条向左拖拽,即可转变该面板大小。

6.每个面板在顶部都有一个标签。标签右侧有下拉栏,通常至少包含如下几个

选项:

•关闭面板

•浮动面板

・关闭组中的其他面板

・面板组设置(其中包含关闭面板组、取消面板组停靠、最大化面板组〕

“工具”面板

默认状况下,工具栏会停靠在菜单栏下方。但同样可以取消停靠工具栏,把它转

化成像其他面板那样操作的“工具”面板。

要显示或隐蔽工具栏,选择“窗口”>“工具”。“工具”命令旁的复选标记表示

其是否显示O

要将工具栏取消停靠在其默认位置,单击左上角即可使之浮动。

“保藏夹”面板

“保藏夹”用于存储一些常用的、只需要一两次鼠标单击就可以完成的编辑操作.—

你不仅可以运行这些保藏,还可以创立的保藏,删除、组织、编辑这些保藏。

1.选择“窗口>工作区〉重置‘传统'”。

2.单击“保藏夹”标签,“保藏夹”面板显示出当前的保藏列表。(假设工作区

里没有“保藏夹”面板,可以通过选择“窗口>保藏夹”或者“保藏夹/编辑保

藏夹”命令来翻开“保藏夹”面板。)

自定义工作区

除了Audition自带的工作区,你还可以创立自定义工作区

1,选择“窗口>工作区〉工作区”。

2.在“工作区”对话框中输入名称即可为工作区命名,单击''确定”按钮。的n

作区就会参与到当前工作区列表中3.假设

要删除一个工作区,选择“窗口〉工作区”,选中一个你想删除的工作区之外的工

作区。

4.选择“窗口>工作区〉删除工作区”。

作业

教学反思或反

响记录

课堂教学题目AdobeAudition软件与根本操作2

授课时间地点

通过讲授AdobeAudition软件的翻开与导入文件、保存与输出文

教学目标件等对软件的根底操作学问有较为全面的把握,为连续更深入地

学习奠定根底。

dobeAudition单轨编辑根底和多轨编辑根底

教学重点

教学难点根本操作

教学内容方法与手段

Audition软件的根本操作

导航

导航到文件和工程

1.启动Audition,选择“文件>翻开”,导航到Lesson02文件夹,选中文件

“start02.wav”,并在对话框中选择“翻开”。

2.选择“文件〉翻开并附加〉到当前文件”。

3,导航至Lesson02文件夹,选择music.wav,单击"翻开”。

4.选择的文件被添加到“波形编辑器”中当前波形的末尾

5.选择“文件>翻开并附加〉到建文件”。

编辑器内部导航

1.导航至Lesson02文件夹,翻开文件WaveformWorkspace.aif。

2.选择“窗口>工作区>默认”。

3.选择“窗口>工作区〉默认〉重置‘默认'”,单击“确定”按钮。

4.单击波形的三分之一处,按住鼠标左键拖动到波形的三分之二处,选择一段

波形。

5.单击波形的任意位置,即可取消选择。

“媒体编辑器”导航

1.选择“窗口>工作区〉默认”。

2.选择“窗口>工作区〉重置‘默认'”。然后单击“确定”按钮。

3.“媒体扫瞄器”的左栏显示全部连接到计算机的磁盘驱动器。单击任意一个

驱动器,右栏中会显示其包含的内容。也可以单击驱动器的折叠开放三角来显示

其内容。

通过缩放导航

缩放导航的工作方式其实很简洁:缩小可以看到更多的目标物体,放大可以看到

目标物体的更多细节。“缩放”面板中包含9个按钮,这9个按钮在波形编辑器和

多轨编辑器中同样存在。

用键盘快捷键导航

用户可以依据自己的需要对各种命令创立键盘快捷键。选择“编辑>键盘快捷键”

或按“Alt+K”组合键,然后依据屏幕向导添加或删除快捷键。

目的快捷建

在噬般'和‘多软洞辑番'之间进fl划换8

启动和侮止播放空格建

将当前附诩旨示然移动到时间轴起始点Home键

格当前时潮曾示告移动到时同轴终止点EndS

将当前时间指示罟移动至前一个标记、更辑或选杼项边糜Ctrl,向左箭头键

格当前时间指示器移动至下一个标记、剪辑或选挣顶边线Ct"向右箭头键

切侦〃返回CTI到停止的起动位景,的首选项Shift+X

水平放大=

垂直放大Alt+=

水平缩小-

垂直缩小A.,骑号

添如标记M或*(星号)

移到上一个标记Crtl+AM向左箭头建

移到下一个标记凝处+向右箭头键

以下键盘快捷键仅在波形编辑器中适用:

口的快捷键

重复前个命令(打开其对话框,然后单击“确

Shift+R

定”)

我复前一个命令(打开其对话框,但未单击“确

Ctrl+R

定”)

打开“转换采样类型”对话框Shift+T

捕捉“降噪效果”的降噪配置文件Shift+P

激活要编辑的立体声文件的左声道向上箭头键

激活要编辑的立体声文n的右声道向下箭头键

以更加对数或线性形式显小软谱Ctrl+Alt+向上箭头键或向卜箭头键

以完整的对数或线性形式显示频谱CtrkAlt+PageUp或PageDown

增加或降低频谱分辨率Shift+Ctrl+向上箭头健或向卜箭头键

以下键盘快捷键仅在多轨编辑器中适用

目的Windows快捷键

为所有音频轨道选择相同的输入或输出Ctrl+Shift+选择

激活或停用“静音”、“独奏”、“录音用的

Ctrl+Shift+单击

ARM”或所有轨道的“监视器输入“

以较大的量调整旋钮按住Shift键拖动跳标

以较小的出调整旋钮按住Ctrl键拖动鼠标

将所选剪辑向左轻移Alt+逗号

将所选剪辑向右轻移Alt+句点

保持关键帧时间位置或参数值按住Shi代键拖动鼠标

在没有创建关键帧的情况卜的重新定位包络段按住Ctrl键拖动鼠标

使用标记导航

可以在波形编辑器与多轨编辑器中放置标记(也称为提示〕,标明你期望快速找

到的位置。

1.导航至Lesson02文件夹,翻开文件start02.wav。

2.选择“窗口>工作区〉默认”。

3.选择“窗口>工作区〉重置‘默认'”。单击“确定”按钮。

4.选择“窗口>标记”,翻开“标记”面板。

根本操作

播放停顿空格键

暂停Ctrl+Shift+Space

到首帧Ctrl+-

到尾帧Ctrl+-

录制Shift+Space

循环播放Ctrl+L

编组Ctrl+G

复制Ctrl+C粘贴Ctrl+V剪贴Ctrl+X

纵向:放大Alt+=

缩小Alt+-

横向:放大=

缩小-

全部缩小Ctrl+\

放大入点Alt+home

放大出点Alt+end

缩放选区shift+s

音频右下角,大括号拖动调整长度

右上角,伸缩速率调整

音量、声相线、关键帧,音频上右键,音量线变曲线

标记M,吸附功能

复制粘贴剪切生成静音区

鼠标滚轮使用:Ctrl+滚轮多轨视图左右放大缩小

滚轮多轨:纵向放大缩小波形和滚动轨道

编辑:不见图左右放大缩/,、

书上课后实训内容

作业

教学反思或反

响记录

课堂教学题目试验工程一、AdobeAudition软件的安装与配置

授课时间地点

教学目标

教学重点

教学难点

教学内容方法与手段

试验内容:

AdobeAudition软件的安装与配置。

试验目的和要求:

生疏AdobeAudition软件的安装方法;把握AdobeAudition软件的根本操作。

安装步骤:

1.安装时断开网络,先安装英文版程序,不要选择试用,选择试用将会导致

Encore组件无法使用,输入序列号:

1325-0949-2080-9819-3777-3230或者1325-0160-5283-9851-2671-8951

2.软件安装后先运行一次软件,否则软件不是Extended版。

3.依据破解补丁文件夹内说明文档要求安装破解文件

4.依据汉化补丁文件夹内说明文档要求安装汉化补丁

5.依据书上实训内容完成相关根本操作

试验仪器设备:

多媒体计算机

考核方法和要求:

随堂检查学生是否按要求进展操作,针对存在的问题准时进展答疑。

作业

教学反思或反

响记录

课堂教学题目录音技术

授课时间地点

通过讲授AdobeAudition软华二的录音技术,可以便利的录制来自

教学目标外接设备的声音、话筒的声三多和计算机声卡本身的声音。

人声录制、模拟音效、录制声音

教学重点

教学难点模拟音效

教学内容方法与手段

动漫、影视作品中的音频收集

1、猎取音频素材的方法

下载音频素材

购置音频素材

录音拾取

2、录音前的硬件预备

使用话筒录制声音

将话筒与电脑声卡的Micphone输入接口相连接。

使用音频线录制来自外接设备的声音

当您需要录制来自录音机、CD机、DVD机、电子琴等设备的声音时,就需要预

备一条声源输入线,又常叫做音频线。

录音环境(立体声录音的话筒摆放〕

AB制

XY制

MS制

吸音与隔音

要把握过多的声音反射,可以在墙壁上悬挂吸音板。

为了和外界隔开,不让外界的声音进入棚内,录进来纯粹的“干声”,录音室里

往往要实行必要的隔音措施。

3、录音选项的设置

为了避开录入“噗噗”的爆破声,要在话筒与声源之间加上防风装置

4、人声录制

进展人声录制时,要留意调整电平,由于人声的电平凹凸是动态变化的,因此可

以使用压缩器。压缩器是一种自动把握信号电平的工具,当信号超过你设定的阀

值时,压缩器自动拉下电平,拉下多少打算于压缩比。

5、模拟音效

例如:

碎石:制造脚步声。

芹菜:怪兽咬嚼和破坏东西的声音。

瓜:敲击人头或裂开的得意声音。

带肉的骨头:折断骨头的惊奇声音。

管子“锤子和斧法;帮肋发出上面几种声音

6、音频的录制

“采样频率”,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组

成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期

或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每

秒钟采集多少个信号样本。

小于22050Hz的采样率保真度过低,通常适用于讲话、听写、玩具等;

22050Hz:玩耍和低解析度数字音频的常用选择;

32022Hz:通常用于播送和卫星传输;

44100Hz:与CD所使用的采样率全都,是应用最普遍的音频采样率;

48000Hz:视频工程的标准选择;

大于48000Hz采样率的应用更加普遍,工作室使用88200Hz或96000Hz采样率

以获得可能的音质提升或高保真度。然而在高频率的采样率之间并没有太大的区

分,而且会占用更大的存储空间,一个1分钟时长、96kHz文件占用的存储空间

是48kHz文件所占空间的两倍。

“声道”,Audition在录制音频时可以选择需要的声道数。

单声道:麦克风或电吉他的声音录制;

立体声:便携式音乐播放器或其他立体声信号源;5.1:

用于围绕立体声的录制。“位深

度”即量化精度,它打算数字音频的动态范围。动态范围就是音频系数记录与

重放时最大不失真信号与系统本底噪声之比的对数值,单位是分贝。当进展频率

采样时,较高的量化精度可以供给更多可能性的振幅值,从而产生更为大的振动

范围,更高的信噪比,提高保真度。

8位为低解析度,不用于专业音频,通常用于玩耍和消费电子设备;

16位是用于CD和供给工业标准音频质量的解析度;

24位是大多数音响工程师的首选,由于它有更高的可调整范围,但是电平的

设定不必过于慎重,由于可用的动态调整范围更宽。24位文件比16位文件多占

用50%的空间,尽管在硬盘及其他形式存储空间有限的前提下,这种选择也是可

以承受的;

321浮点)可获得最高解析度,不过除了存档外,相对于24位文件,这种格

式并没有明显优势,又由于很多程序不支持32位浮点文件,且这种格式的文件

占用的存储空间大,所以并不常用。

在单轨编辑界面下录制声音

①)将话筒与电脑声卡的Microphone接口相连接,将录音来源设置为

Microphoneo翻开AdobeAudition软件,显示出单轨编辑界面。

0建一个文件。

0此时,单击【Record(录音)]按钮,就可以开头录制了。

要尽量大的电平,又要不超过最高限度

【录音把握】对话框中上下调整录音工程的滑块。

在多轨界面下录制声音

(1)切换到多轨界面。

(2)单击某音轨的【R】按钮,使其处于预备录音的状态。

(3)设置好录音点评后,单击【Record(录音)]按钮,就可以开头录制了。

留意:“模板”:用来指定默认模板或者自定义的模板。本节选择默认的模板“24

TrackMusicSession”,在后续的学习中将介绍怎样自定义模板°”采样率”i确定

会话的频率范围。“位深度”:确定会话的振幅范围,包括通过“多轨”>“缩混为

文件”命令创立的录制内容和文件。应留神选择位深度,由于在创立会话后便无

法更改。“主控”:确定哪些音轨缩混为单声道、立体声或5.1主音轨。“采样

率”、“位深度”、“主控”参数都保存在模板中,所以一旦选择一个模板后,这

些选项将变灰,即不能再被修改。假设想自行编辑这些设置,“模板”应选择

书上课后实训内容

作业

教学反思或反

馈记录

课堂教学题目试验工程二、音频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论