版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多媒体技术教程(林福宗)第 2 章 数字声音及 MIDI 简介 声音是携带信息的极其重要的媒体,是多媒体技术研究 中的一个重要内容。 声音的种类繁多, 如人的话音、 乐器声、 动物发出的声音、 机器产生的声音以及自然界的雷声、 风声、 雨声、闪电声等。这些声音有许多共同的特性,也有它们各 自的特性。在用计算机处理这些声音时,既要考虑它们的共 性,又要利用它们的各自的特性。本章将介绍声音的基础知 识,重点掌握声音数字化的两个最基本的概念。此外,还介 绍在上网浏览或者脱机工作时你会经常遇到的声音文件存 储格式和声音工具。 2.1 声音与听觉器官 声音是通过空气传播的一种连续的波,叫声波。声音的 强
2、弱体现在声波压力的大小上,音调的高低体现在声音的频 率上。声音用电表示时,声音信号在时间和幅度上都是连续 的模拟信号,如图 2 01 所示。声波具有普通波所具有的特 性,例如反射 (reflection) 、折射 (refraction) 和衍射 (diffraction) 等。 图 2 01 声音是一种连续的波 对声音信号的分析表明,声音信号由许多频率不同的信 号组成,这类信号称为复合信号,而单一频率的信号称为分 量信号。声音信号的一个重要参数就是带宽,它用来描述组 成复合信号的频率范围。 如高保真音信号 (high-fidelity audio) 的频率范围为 10 Hz20 000 Hz
3、,它的带宽约为 20 kHz , 而视频信号的带宽是 6 MHz 。 声音信号的两个基本参数是频率和幅度。信号的频率是 指信号每秒钟变化的次数,用 Hz 表示。例如,大气压的变 化周期很长,以小时或天数计算,一般人不容易感到这种气 压信号的变化,更听不到这种变化。对于频率为几 Hz 到 20 Hz 的空气压力信号, 人们也听不到, 如果它的强度足够大, 也许可以感觉到。 人们把频率小于 20 Hz 的信号称为亚音信 号,或称为次音信号 (subsonic) ;频率范围为 20 Hz 20 kHz 的信号称为音频 (Audio) 信号;虽然人的发音器官发出的声音 频率大约是 803400 Hz
4、,但人说话的信号频率通常为 3003000 Hz ,人们把在这种频率范围的信号称为话音 (speech) 信号;高于 20 kHz 的信号称为超音频信号,或称 超声波 (ultrasonic) 信号。超音频信号具有很强的方向性,而 且可以形成波束,在工业上得到广泛的应用,如超声波探测 仪,超声波焊接设备等就是利用这种信号。 在多媒体技术中, 处理的信号主要是音频信号,它包括音乐、话音、风声、雨 声、鸟叫声、机器声等。 人们是否都能听到音频信号,这主要取决于各个人的年 龄和耳朵的特性。一般来说,人的听觉器官能感知的声音频 率大约在2020000 Hz之间,在这种频率范围里感知的声 音幅度大约在0
5、120 dB之间。除此之外,人的听觉器官对 声音的感知还有一些重要特性, 这些特性将在第 9 章中介绍, 它们在声音数据压缩中已经得到广泛的应用。 2.2 声音信号数字化 2.2.1 从模拟过渡到数字 回顾历史, 大多数电信号的处理一直是用模拟元部件(如 晶体管、变压器、电阻、电容等 )对模拟信号进行处理。 但是, 开发一个具有相当精度、且几乎不受环境变化影响的模拟信 号处理元部件是相当困难的,而且成本也很高。 如果把模拟信号转变成数字信号,用数字来表示模拟量, 对数字信号做计算,那末难点就发生了转移,把开发模拟运 算部件的问题转变成开发数字运算部件的问题,这就出现了 数字信号处理器 (dig
6、ital signal processor , DSP) 。 DSP 与通 用微处理器相比,除了它们的结构不同外,其基本差别是, DSP 有能力响应和处理采样模拟信号得到的数据流, 如做乘 法和累加求和运算。 在数字域而不在模拟域中做信号处理的主要优点是:首 先,数字信号计算是一种精确的运算方法,它不受时间和环 境变化的影响;其次,表示部件功能的数学运算不是物理上 实现的功能部件,而是仅用数学运算去模拟,其中的数学运 算也相对容易实现;此外,可以对数字运算部件进行编程, 如欲改变算法或改变某些功能,还可对数字部件进行再编程。 2.2.2 模拟信号与数字信号 话音信号是典型的连续信号,不仅在时间
7、上是连续的, 而且在幅度上也是连续的。在时间上“连续”是指在一个指定 的时间范围里声音信号的幅值有无穷多个,在幅度上“连续” 是指幅度的数值有无穷多个。我们把在时间和幅度上都是连 续的信号称为模拟信号。 在某些特定的时刻对这种模拟信号进行测量叫做采样 (sampling) ,由这些特定时刻采样得到的信号称为离散时间 信号。采样得到的幅值是无穷多个实数值中的一个,因此幅 度还是连续的。如果把信号幅度取值的数目加以限定,这种 由有限个数值组成的信号就称为离散幅度信号。例如,假设 输入电压的范围是0.0V0.7V ,并假设它的取值只限定在 0、 0.1、0.2,0.7共8个值。如果采样得到的幅度值是
8、0.123V , 它的取值就应算作 0.1V,如果采样得到的幅度值是0.26V, 它的取值就算作 0.3,这种数值就称为离散数值。我们把时 间和幅度都用离散的数字表示的信号就称为数字信号。 2.2.3 声音信号数字化 声音进入计算机的第一步就是数字化,数字化实际上 就是采样和量化。如前所述,连续时间的离散化通过采样来 实现,就是每隔相等的一小段时间采样一次,这种采样称为 均匀采样 (uniform sampling) ;连续幅度的离散化通过量化 (quantization) 来实现,就是把信号的强度划分成一小段一小 段,如果幅度的划分是等间隔的,就称为线性量化,否则就 称为非线性量化。图 2
9、-02表示了声音数字化的概念。 图 202 声音的采样和量化 声音数字化需要回答两个问题:每秒钟需要采集多少 个声音样本,也就是采样频率(fs)是多少,每个声音样本的 位数 (bit per sample , bps) 应该是多少,也就是量化精度。 2.2.4 采样频率 采样频率的高低是根据奈奎斯特理论 (Nyquist theory) 和声音信号本身的最高频率决定的。奈奎斯特理论指出,采 样频率不应低于声音信号最高频率的两倍,这样就能把以数 字表达的声音还原成原来的声音,这叫做无损数字化 (lossless digitization) 。采样定律用公式表示为 fs 3 2f 或者 Ts T/
10、2 其中 f 为被采样信号的最高频率。 你可以这样来理解奈奎斯特理论:声音信号可以看成 由许许多多正弦波组成的,一个振幅为 A、频率为f的正弦 波至少需要两个采样样本表示,因此,如果一个信号中的最 高频率为 fmax, 采样频率最低要选择 2。例如,电话话音的 信号频率约为 3.4 kHz ,采样频率就选为 8 kHz 。 2.2.5 采样精度 样本大小是用每个声音样本的位数bit/s (即 bps )表示 的,它反映度量声音波形幅度的精度。例如,每个声音样本 用16位(2字节)表示,测得的声音样本值是在065536 的范围里,它的精度就是输入信号的 1/65536 。样本位数的 大小影响到声
11、音的质量,位数越多,声音的质量越高,而需 要的存储空间也越多;位数越少,声音的质量越低,需要的 存储空间越少。 采样精度的另一种表示方法是信号噪声比,简称为信噪 比(signal-to-noise ratio , SNR),并用下式计算: SNR = 10log(Vsignal)2/(Vnoise)2= 20log(Vsignal/Vnoise) 其中, Vsignal 表示信号电压, Vnoise 表示噪声电压; SNR 的单位为分贝 (db) 例1 :假设 Vnoise = 1,米样精度为 1位表示 Vsignal =21,它的信噪比SNR = 6分贝。 例 2:假设 Vnoise = 1
12、 ,采样精度为 16位表示 Vsignal =216,它的信噪比 SNR=96 分贝。 2.2.6 声音质量与数据率 根据声音的频带,通常把声音的质量分成 5 个等级,由 低到高分别是电话 ( telephone )、调幅( amplitude modulation AM )广播、调频( frequency modulation , FM )广播、激 光唱盘(CD-Audio )和数字录音带(digital audio tape , DAT ) 的声音。在这 5 个等级中,使用的采样频率、样本精度、通 道数和数据率列于表2 -01 o 表2 -01声音质量和数据率质量 采样频率 (kHz) 样本精度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中小企业融资新模式以知识产权为抵押的贷款
- 从儿童心理发展看家庭教育的价值与挑战
- 全民健体战略下校园食品健康规划迈向标准化和国际化的探求之路
- 企业风险管理与金融安全的关联性分析
- 健身餐家庭制作全攻略
- 创新教育模式下的学校招生策略
- 学校用电安全管理制度10篇
- 企业培训中的学员心理分析
- 从传统到现代少儿教育的创新教学转变
- 以实践为导向的家庭劳动教育策略研究
- 江西宏柏新材料股份有限公司功能性气凝胶生产基地建设项目环评报告书
- 北京大学简介介绍PPT模板
- 日本隧道与地下工程新技术(PPT142页)
- 国家开放大学《思想道德与法治》社会实践参考答案
- 可爱的嘉兴三年级教材分析与教案(共23页)
- 小学语文五年级下册期末综合练习试题含答案(共2套)
- 玩具风险评估报告
- 二年级上册认识时间练习题
- 【双人相声剧本搞笑校园】有关2人校园搞笑相声剧本
- 电视监控系统招标评分表
- 国有企业采购管理制度
评论
0/150
提交评论