第5章5.3数字声音及应用_第1页
第5章5.3数字声音及应用_第2页
第5章5.3数字声音及应用_第3页
第5章5.3数字声音及应用_第4页
第5章5.3数字声音及应用_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 5.3 数字声音及应用数字声音及应用5.3.1 波形声音的获取与播放波形声音的获取与播放5.3.2 波形声音的表示与应用波形声音的表示与应用5.3.3 波形声音的编辑波形声音的编辑5.3.4 计算机合成声音计算机合成声音25.3.1 波形声音的获取与播放波形声音的获取与播放3声音的特性声音的特性和类型和类型n声音由振动产生,通过空气进行传播声音由振动产生,通过空气进行传播n声音是一种波,它由许多不同频率的声音是一种波,它由许多不同频率的谐波组成谐波组成n谐波的频率范围称为声音的谐波的频率范围称为声音的“带宽带宽”n计算机处理的声音类型:计算机处理的声音类型:n话音或语音话音或语音(speec

2、h),专指人的说话声音,带宽仅为,专指人的说话声音,带宽仅为3003400Hzn全频带声音全频带声音(如音乐声、风雨声、汽车声等如音乐声、风雨声、汽车声等),其带宽可达到,其带宽可达到20Hz20kHz n人耳可听到的声音统称人耳可听到的声音统称“可听声可听声”(audio) ,20Hz20kHz4数字波形声音的获取数字波形声音的获取步骤:步骤:2. 量化(量化(quantization,模数转换,模数转换 )3. 编码(编码(encoding)1. 取样(取样(sampling)取取 样样模拟声音信号模拟声音信号取样的目的是把时间上连取样的目的是把时间上连续的信号转换成时间上离续的信号转换成

3、时间上离散的信号散的信号量量 化化量化是把每个样本从模拟量化是把每个样本从模拟量转换成为数字量量转换成为数字量(8位或位或16位整数表示位整数表示)数字数字声音声音01100011001编编 码码将所有样本的二进制将所有样本的二进制代码组织在一起,并代码组织在一起,并进行数据压缩进行数据压缩5数字波形声音的获取设备数字波形声音的获取设备n声音的联机获取设备声音的联机获取设备(声卡声卡)声波转换声波转换为电信号为电信号n声音的脱机获取设备:数码录音笔声音的脱机获取设备:数码录音笔麦克风麦克风(microphone)声音卡声音卡(sound card)模拟声音模拟声音数字声音数字声音取样、量取样、

4、量化和编码化和编码6声音的重建与播放声音的重建与播放n计算机输出声音分为两步:计算机输出声音分为两步:1 声音的重建:把声音从数字形式转换成模拟信号形式,由声声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成卡完成2 声音播放:将模拟声音信号经处理和放大后送到音箱声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器扬声器)n关于音箱:关于音箱:n普通音箱普通音箱接收的是重建的模拟声音信号接收的是重建的模拟声音信号n数字音箱数字音箱直接接收数字声音信号,失真更小直接接收数字声音信号,失真更小 数字数字声音声音011010011101插插 值值数模转换数模转换解解 码码把压缩编码的数字把

5、压缩编码的数字声音恢复为压缩编声音恢复为压缩编码前的状态码前的状态把声音样本从把声音样本从数字量转换为数字量转换为模拟量模拟量把时间上离散的一组把时间上离散的一组样本转换成在时间上样本转换成在时间上连续的模拟声音信号连续的模拟声音信号重建的模拟重建的模拟 声音信号声音信号7声卡的功能与逻辑组成声卡的功能与逻辑组成波形声音的获取与编码波形声音的获取与编码波形声音的重建与播放波形声音的重建与播放MIDI消息的输入消息的输入MIDI音乐的合成音乐的合成DSPDMA接口接口PC总线总线取样,量化取样,量化D/A重建,滤波重建,滤波声音输出声音输出声音输入声音输入音乐合成器音乐合成器mixerMIDI接

6、口接口声卡的主要功能声卡的主要功能85.3.2 波形声音的波形声音的 表示与应用表示与应用9数字波形声音的表示及其参数数字波形声音的表示及其参数n数字波形声音是使用二进位表示的一种串行比特流,其数数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为据按时间顺序进行组织,文件扩展名为“.wav”n数字波形声音的主要参数有:数字波形声音的主要参数有:n取样频率:取样频率:n语音的取样频率低,一般为语音的取样频率低,一般为8k 16k Hzn全频带声音全频带声音(如音乐如音乐)取样频率高,一般为取样频率高,一般为44.1k 48k Hzn量化位数:通常为量化位数:通常

7、为8位、位、12位或位或16位位n声道数目:单声道为声道数目:单声道为1,双声道为,双声道为2n码率码率(比特率比特率),每秒钟的数据量,每秒钟的数据量10数字波形声音码率的计算数字波形声音码率的计算n未压缩时数字波形声音的码率计算公式未压缩时数字波形声音的码率计算公式 码率码率 = 取样频率取样频率 量化位数量化位数 声道数声道数 n例:例:声音类型声音类型声音信号带宽声音信号带宽(Hz)取样频率取样频率(kHz)量化位数量化位数(bits)声道声道数数未压缩时的未压缩时的码率码率数字语音数字语音3003 40088164 kb/sCD立体声立体声2020 00044.11621411.2

8、kb/sn压缩编码之后数字波形声音的码率为:压缩编码之后数字波形声音的码率为: 压缩后的码率压缩后的码率 = 未压缩时的码率未压缩时的码率/ /压缩比压缩比n例:上面例:上面CDCD唱片的立体声音乐压缩为唱片的立体声音乐压缩为MP3MP3后,若压缩比是后,若压缩比是1212,则该则该MP3MP3音乐的码率是:音乐的码率是:1411.2 1411.2 /12/12118 kb/s118 kb/s左右左右11数字波形声音的数据压缩数字波形声音的数据压缩n数据压缩的必要性:数据压缩的必要性:n为了降低存储成本和提高在网络上的传输效率为了降低存储成本和提高在网络上的传输效率n数据压缩的可能性:数据压缩

9、的可能性:n声音中包含有大量冗余信息;声音中包含有大量冗余信息;n人耳灵敏度有限,允许有一定失真而不易察觉人耳灵敏度有限,允许有一定失真而不易察觉n数字波形声音压缩编码的方法:数字波形声音压缩编码的方法:n全频带声音:国际标准全频带声音:国际标准MPEG;工业标准;工业标准Dolby AC-3 n数字语音:固定电话使用数字语音:固定电话使用ADPCM编码编码 手机使用高效率的混合编码技术手机使用高效率的混合编码技术所谓所谓“MP3音乐音乐”,它是一种采用,它是一种采用MPEG-1层层3编码的高编码的高质量数字声音质量数字声音, 压缩比大约压缩比大约1012倍,使一张普通倍,使一张普通CD光盘光

10、盘上可以存储大约上可以存储大约100首首MP3歌曲,可连续播放歌曲,可连续播放10小时。小时。 12波形声音的文件类型及其应用波形声音的文件类型及其应用 音频音频格式格式文件文件扩展名扩展名编码编码类型类型效果效果主要应用主要应用开发者开发者WAV.wav未压缩未压缩声音达到声音达到CD品质品质支持多种采样频率和量支持多种采样频率和量化位数,获得广泛支持化位数,获得广泛支持微软公司微软公司FLAC.flac无损压缩无损压缩压缩比为压缩比为2:1左右左右高品质数字音乐高品质数字音乐Xiph.Org基金会基金会APE.ape无损压缩无损压缩压缩比为压缩比为2:1左右左右高品质数字音乐高品质数字音乐

11、Matthew T. AshlandM4A.m4a无损压缩无损压缩压缩比为压缩比为2:1左右左右QuickTime, iTunes, iPod,Real Player苹果公司苹果公司MP3.mp3有损压缩有损压缩MPEG-1 audio层层3压缩比为压缩比为8:112:1因特网,因特网,MP3音乐音乐ISOWMA.wma有损压缩有损压缩压缩比高于压缩比高于MP3使用数字版权保护使用数字版权保护因特网,音乐因特网,音乐微软公司微软公司AC3.ac3有损压缩有损压缩压缩比可调,压缩比可调,支持支持5.1、7.1声道声道DVD, 数字电视,数字电视,家庭影院等家庭影院等美国美国Dolby公司公司AA

12、C.aac有损压缩有损压缩压缩比可调,压缩比可调,支持支持5.1、7.1声道声道DVD, 数字电视,数字电视,家庭影院等家庭影院等ISO MPEG-2/MPEG-4 13什么是流媒体?什么是流媒体?n在因特网上收听在因特网上收听(看看)音音(视视)频节目的频节目的2种方式:种方式:i下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点:下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点:需要等待较长时间,并需要较大的存储容量)需要等待较长时间,并需要较大的存储容量)i流式传输方式:边下载、边播放(优点:只需要下载一部分数据之流式传输方式:边下载、边播放(优点:只需要下载一部分数据

13、之后后, 就可以开始一边播放一边下载,等待时间短、存储需求小)就可以开始一边播放一边下载,等待时间短、存储需求小)n流媒体流媒体就是一种允许在网络上让用户一边下载一边收看就是一种允许在网络上让用户一边下载一边收看(听听)音视频媒体的音视频媒体的媒体分发媒体分发(delivery)技术技术n目前流行的主要有目前流行的主要有3个公司的流媒体技术:个公司的流媒体技术:nReal Networks公司的公司的 Real Media (RealAudio和和RealVideo)n微软公司的微软公司的 Windows Media Services (WMA、WMV和和ASF)1.苹果公司的苹果公司的 Qu

14、ick Time145.3.3 波形声音的编辑波形声音的编辑15波形声音编辑软件的功能波形声音编辑软件的功能主要功能:主要功能:1 编辑声音:如声音剪编辑声音:如声音剪辑、复制、调节音量辑、复制、调节音量2 声音的效果处理:如声音的效果处理:如混响、回声、淡入、混响、回声、淡入、淡出等淡出等3 录音录音4 声音的格式转换声音的格式转换5 播放声音播放声音数字声音数字声音的参数的参数左声道左声道信号波形信号波形右声道右声道信号波形信号波形淡入淡入淡出淡出时间刻度时间刻度播放标尺播放标尺声音编辑软件的声音编辑软件的典型用户界面典型用户界面165.3.4 计算机合成声音计算机合成声音17什么是计算机

15、合成声音?什么是计算机合成声音?n计算机合成声音就是计算机模仿人说话或演奏音乐计算机合成声音就是计算机模仿人说话或演奏音乐n计算机合成声音有两类:计算机合成声音有两类:n计算机合成话音(语音):计算机合成话音(语音):n计算机模仿人把一段文字朗读出来,即把文字转换为说话声计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为音(简称为 TTS)n应用:有声查询、文稿校对、语言学习、语音秘书、自动报应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等警、残疾人服务等n计算机合成音乐(计算机合成音乐(MIDI):):n计算机模拟各种乐器发声并按照乐谱演奏音乐计算机模拟各种乐

16、器发声并按照乐谱演奏音乐n应用:计算机作曲、配器等应用:计算机作曲、配器等18例:计算机合成的语音例:计算机合成的语音nHello,everybody (1)n你好,我是贝尔实验室的中文语音合成系统你好,我是贝尔实验室的中文语音合成系统(BellTTS1)n南京大学计算机系南京大学计算机系2002年招收了年招收了202名本科生,名本科生,22名博士名博士生,生,130多名硕士生。多名硕士生。(中科大讯飞公司)(中科大讯飞公司) (Bell)n安徽中科大讯飞信息科技有限公司是专门从事中文语音及安徽中科大讯飞信息科技有限公司是专门从事中文语音及语言技术软件语言技术软件 (讯飞)(讯飞)n我们都是同

17、行,我们一路同行,去参加人参培植研讨会我们都是同行,我们一路同行,去参加人参培植研讨会 (讯飞)(讯飞) (Bell)需要进一步提高之处:发音和断句要正确,提高自然度,丰富表现力需要进一步提高之处:发音和断句要正确,提高自然度,丰富表现力19计算机合成音乐(计算机合成音乐(MIDI)音乐音乐合成器合成器音乐音乐MIDI文件文件媒体媒体播放器播放器MIDI消息消息n计算机合成音乐需要三个要素:乐器、乐谱和计算机合成音乐需要三个要素:乐器、乐谱和 “演奏员演奏员” 声卡上的音乐合成声卡上的音乐合成器能像电子琴一样器能像电子琴一样模仿几十种不同的模仿几十种不同的乐器发出声音,它乐器发出声音,它按照按

18、照MIDI消息合成消息合成出不同音色和音调出不同音色和音调的音符,通过扬声的音符,通过扬声器播放出音乐来器播放出音乐来 乐谱在计算机中使用乐谱在计算机中使用一种叫做一种叫做MIDI的音乐的音乐描述语言来表示。使描述语言来表示。使用用MIDI描述的音乐称描述的音乐称为为MIDI音乐。一首乐音乐。一首乐曲对应一个曲对应一个MIDI文件,文件,其文件扩展名其文件扩展名为为 .MID或或 .MIDI媒体播放器软件相当媒体播放器软件相当于于“演奏员演奏员”。播放。播放MIDI音乐时,它先从音乐时,它先从磁盘上读入磁盘上读入.MID文件,文件,解释其内容,然后以解释其内容,然后以MIDI消息的形式向声消息的形式向声卡上的音乐合成器发卡上的音乐合成器发出各种指令出各种指令20例:计算机合成的例:计算机合成的MIDI音乐音乐nMIDI的优点:的优点:n数据量极小(比数据量极小(比CD立体声少立体声少3个数量级,比个数量级,比MP3少少3个数量级)个数量级)n易于制作和编辑修改易于制作和编辑修改n可以与波形声音同时播放可以与波形声音同时播放nMIDI的不足:的不足:n只能合成音乐,不能合成歌曲和语言只能合成音乐,不能合成歌曲和语言n音质与硬件设备相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论