SRS 3D音频处理技术_第1页
SRS 3D音频处理技术_第2页
SRS 3D音频处理技术_第3页
SRS 3D音频处理技术_第4页
SRS 3D音频处理技术_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SRS 3D音频处理技术:声音可以更动听SRS是一个由美国SRS Labs公司根据人类听觉系统的动力学(Dynamics of Human Hearing System)原理及心理声学(Psychoacoustics)而研究出来的专利音响技术。SRS的特点是可以用二只音箱来营造出一个逼真的立体声场,而且这系统适用于所有双声道的音源,包括所有立体声,环绕声,以至包含有其它系统编码的音源。而对于单声道的音源,SRS Labs公司也有一个名为3D Mono的模拟立体重播技术。人类的听觉系统之所以能够辨别声源的空间及方向,是由于人类耳朵的构造对由不同方向到达的声音有不同的频率响应,这种由声音以不同方向

2、到达时跟人类听觉系统所产生的变化可以用一种名为“与头部相关的传递函数(Head Related Transfer Function,简称HRTF)”来作数学描述。而人的脑部就以这些不同的频率响应来断定所听到的声音来自空间中的哪一个位置。传统的录音技术采用与人耳结构不同的麦克风进行录音。虽然来自空间各个方向的声音信息也一同被记录下来,但由于麦克风没有类似人类对空间及方向的识别能力,因此传统双声道系统在重播时没法真实地重现录音中原有的音场。SRS技术的核心在于补偿麦克风录音方式与人类听觉系统间的差异。SRS Labs公司从多年的研究中掌握了人类听觉系统辨别空间中各方向位置的方法,从而发展出以HRT

3、F为基础的SRS系统。SRS在传统的双声道重播系统上加上了麦克风和人类听觉系统上差异的补偿,把原有的声场信息从录音中提取出来,用专利技术处理、还原。声场中应有的阔度及深度得到重现,更使一般双声道系统中音箱为“点音源(Point Source)”的问题得以解决,营造出一个既宽阔又连贯的声场。这亦是SRS(Sound Retrieval System,声场还原系统)名称的来由。使用SRS系统除了可以得到真实广阔的声场外还有其它优点。由于经SRS处理后的声音本身已带有方向性,SRS并不依赖音箱左右声道声音到达聆听者双耳的时差或相位差来营造立体效果。所以可听到立体声场效果的位置非常广阔,没有一般系统局

4、限在一个狭小聆听位置的弊端。亦因为同样的理由,SRS对音箱的摆放位置及聆听环境的要求宽松,即使在不甚对称的摆放下仍有理想的效果。此外,由于SRS完全没有使用一般所谓“声场处理系统”所惯用的延时、相位差处理、或其它人工的模拟效果,SRS所营造出来的声场稳定,聆听者不会因为稍微移动或转动头部而感觉到声场改变,更没有一般上述模拟系统所带来的严重音染及清晰度降底等问题。在音质方面,因为SRS是以人类本身的听觉特性为基础,没有加上任何不自然的处理,录音本身的传真度可以得到保存。同时因为SRS在重播时把原音中应有的声场还原出来,所得的效果可以说是一种更自然的声音。SRS系统因为是利用录音中本身已存在着的声

5、场信息来还原成为一种可以透过二只音箱重播的立体声音,所以适用于各种双声道的音源。这包括各种双声道的录音及广播,完全不需要任何的编码。即使是用已含编码音源的环绕声系统,在同时使用SRS系统的情况下也不会有矛盾,还可以得到更良好的空间感及更连贯的声场较果。除了双声道的音源以外,SRS Labs还兼顾到单声道音源的重播。SRS Labs的3D Mono(单声道三维或单声道立体)系统是针对单声道音源在双声道系统重播而开发的。一些旧的录音,一部份的电台广播,或设有双语选择的电影及设有原唱及卡啦OK选择的VCD光盘都是常见的单声道音源。SRS Labs的3DMono系统,用独有的技术去将单声道模拟成一种双

6、声道的效果,再用SRS技术去把录音中的声场信息抽出处理,营造出富真实感的立体声场。除了立体声场效果外,3DMono的另一特点是可以在模拟立体声中保持到聚焦及结实的低频重播,没有一般单至双声道模拟系统中常见的低频松散情况。目前,SRS Labs的SRS及3D Mono技术已被多个国家的主要影音器材生产厂家广泛接受,并被普遍的应用在专业音响、家庭影音、及汽车音响器材上。迄今,全球应用了SRS Labs技术的产品总数已超过一千五百万台。OKI成功开发世界最小封装尺寸的手机用3D环绕音效芯片ML2601 (内置SRS 公司的3D环绕音效技术)天机电子   05/10/14 09:49

7、0;   2005年9月27日,东京 - 冲电气工业株式会社(总裁兼首席执行官:筱冢胜正、总部所在地:东京都港区、以下简称OKI)宣布,开发成功了内置3D环绕音效(注1)及内置立体声扬声器放大器的芯片 - ML2601。即日起OKI开始样片的供应,2006年2月开始批量交货。采用这款芯片,可以减低成本,非常简单地在手机中实现3D环绕立体声音效。     近年在日本市场不仅出现了可以播放音乐的手机,而且用内置立体声扬声器实现环绕音效的手机也受到了消费者的青睐。在海外手机市场音乐铃声迅速普

8、及的今天,弊公司结合市场的需求推出了实现软硬件兼容并具有各种音效组合的一系列手机铃声芯片,以供各地区的用户进行选择。最近海外手机市场也表现出与日本市场同样的倾向,即对音乐播放及其3D环绕立体声的需求越来越强烈。使用高性能的手机系统集成电路,采用软件方式实现铃声及音乐播放等丰富功能的廉价手机越来越普及。     但是,用软件在播放铃声或者音乐的同时要实现3D环绕立体声音效是非常困难的。而且,铃声实现3D环绕立体声必须使用立体声扬声器。为此,OKI全面采用数字,模拟混合集成电路技术,开发出了单芯片的集成电路产品ML2601。该产品使用数字信号处理技术实现3D

9、环绕立体声,并在同一块芯片上采用模拟技术集成了立体声扬声器放大器。     ML2601中采用了SRS Labs,Inc.(首席执行官: 袁志坤, 公司位于美国加州圣安娜市,以下简称SRS公司)的3D环绕立体声技术。SRS公司的3D环绕立体声技术在手持设备中得到了广泛的使用。使用者通常习惯在手机中使用耳机来长时间播放带3D环绕音效的音乐,或者使用3D环绕音效来改善扬声器播放的铃声音质。OKI为了最大限度地减少手机电池的消耗,采用硬件方式(注2)实现了3D环绕音效,使功耗比DSP方式减少了80%,成功地将耗电量限制到了7mW以

10、下,这样就使设定了3D环绕音效的手机音乐播放时间大幅度延长。另外芯片中除了内置耳机用的3D环绕音效技术之外,还采用了可以使相邻两个内置扬声器的环绕立体声效果增强,提升铃声及音乐播放质量的技术。     该芯片采用了OKI的超小型W-CSP封装技术,以3.2mm x 2.5mm的尺寸实现了世界最小的3D环绕立体声芯片。     采用OKI数字模拟混合集成电路技术实现的ML2601,能非常简单并且低成本地在手机上实现3D环绕立体声效果,提升产品的竞争力。 3D音效深度探究随着电脑的家用市场和游戏市场

11、逐渐为人们所重视,“多媒体”这个词几乎在一夜间传遍了大街小巷,这时的PC已经不再只有简单的主机、显示器、鼠标键盘三大件了,音箱也成了它最显著的标志。一、音效技术的发展早期,出于对电子乐器彼此交换信息的需要,MIDI生产商协会(MIDI Manufacturers Association)制订了音色及打击乐器排列表的电子乐器数字化接口,简称为MIDI。从80年代开始许多计算机就已经拥有了这些接口,不过那时计算机所扮演的角色只是音序器而已,声卡的最主要用途便基于此了。幸运的是,在电脑游戏的刺激下,声音产生的技术得到了进一步的发展。到了九十年代, Yamaha公司开始让频率调制(FM)技术出现在当时

12、的电脑上,虽然其效果无法和今天的三维音效相比,但同PC小喇叭提供的效果相较不知要好多少倍。不过人们并没有就此满足,90年代中期,波表合成的方式开始崭露头角。它的原理是预先对乐器声音进行取样,并将之保存下来,重放时靠声卡上的微处理器或PC系统内的CPU经过处理来发声。根据处理方式的不同主要又分为软波表和硬波表两种。这时的声卡已经开始走向成熟。FM合成和波表合成技术;内建可控制外部的电子乐器、甚至还身兼二职提供游戏操纵杆功能的MIDI接口、CD音频连接线、线路输入、话筒输入等等都成为比较固定的模式。不过为了建立临场的真实感人们开始了更深层次的寻求。最初大家的注意力都集中在如何更好地再现音场的方向上

13、,下面我们就来看看这些现在已经普遍使用的方法。1单声道(Mono)所谓的单声道就是声音由一只音箱产生的效果,听众可以很明显地听出声音的来源就是音箱所摆放的位置,其本身的表现力较为平淡。(图1)2立体声(Stereo)立体声系统需要一对音箱来完成任务,它通过调整系统中两只音箱发出声音的大小,让我们误认为声源来自两只音箱之间直线段中的任意位置。特别是当使用耳机的时候,由于左右两边的声音串音情况很少发生,所以声音的定位比较准确;再加上比较真实的音场感觉,使它能够带给我们比单声道真实许多的表现力。(图2)3增强立体声(Extended stereo)这种技术是对传统立体声的一种延续,通过某种算法对两只

14、音箱系统中的声音进行处理后,过去只能反映两只音箱连线间的声源位置被扩展到了其延长线上。这对于当两支音箱放置相距较近的情况有很大帮助。(图3)4四声道(Quadraphonics)实际上这也是对基本的立体声概念进行的扩展,它需要的音箱数目是四只。这样的安排可以表达在四个音箱摆布所构成的矩形边上的声源位置。虽然这已经很类似我们需要的定位音场的需要,不过实际上这和真正的3D声音效果是有区别的。(图4)5环绕立体声(SurroundSound)还是基于立体声的概念,它在标准的四声道系统中在听众正面增加一只音箱来覆盖四只卫星音箱所包围的范围内的声音定位。这就是5声道系统,甚至为了有更好的低音域表现力,还

15、有人单独再放置一个低音单元,也就是俗称的5.1系统。(图5)如果需要更加精确定位声音的通路,你甚至可以在听众的上方、下方来放置音箱,得到从上面和下面传来声音的效果。这些所有的效果很大程度上都是通过实际音箱的摆放位置来实现的。不过以上的音箱设置方式只让我们觉得置身其中,却没有办法找出准确方位来。于是3D音效闪亮登场了。二、 3D音效的理论1进入双声道技术(binaural)在单个音箱系统中,声音的来源总是一个位置,我们一下子就能确定它的位置,而过去的多音箱系统,则靠同时从不同位置产生声音,欺骗大脑对声音位置的辨识。现在双声道系统则通过两个不同的信号来处理声音,让两只耳朵分别接受,并误当作它就是从

16、同一个位置发来的到达两个耳朵的不同信号,从而确定出声音的位置。显然这和立体声是有本质区别的。(图6)和立体声不同,当两个外部音箱被用来传送双声道效果的时候,声音必须分别传送到特定的耳朵里,而不是像立体声那样让两只音箱的声音都同时到两个耳朵。这之间的差异就是两者间声音定位准确与否的关键因素。(图7)由两只音箱来产生一个真3D音效是非常困难的。首先,这样的位置效果容易因听众位置的不同而大打折扣;其次,听众探明两支音箱的准确位置后,会对两股声音流所产生的位置识别感产生抵触情绪。最成功的从外部声源传送能够准确表达声音方位的系统是采用4只音箱的配置,但很不幸即使采用了4只音箱,也很少有系统是真的在用4路

17、3D声音,并且采用4路串音消除技术。绝大多数系统都是使用两路独立的双声道设计,然后用立体声来混合前置和后置音箱的发声状况。更有甚者是只在前置音箱采用了真3D音效,而其他部分都用传统4声道或环绕立体声加以混合。2我们的大脑是如何判断声源方位的呢?当一个声音位于听众身体一侧的时候,距离更近这一边的耳朵能够听到更大的声音,而且可以提前一点听到。这种差别在声学方面有两个术语IAD(Interaural Amplitude Difference)和ITD(Interaural Time Difference)来加以说明。大脑就是依靠这两个细微的差别来确定声音的位置。(图8)耳朵的固有形状实际上会增强或削

18、弱不同的声音频率。依靠声音位置的不同,外耳首先负责解决前后方向的不同,因为耳朵都是朝前的,自然前面的声音会大些,而后面的就会小些了。而且由于外耳的形状上下也不对称,还可以借此来确定声音的高度。(图9)声音在环境方面的效果不但对我们确定所处环境类型有很重要的提示,而且反射效果也帮助我们的大脑来判断声音的距离。另外,声音被环境中建筑物等的反射和吸收,比如像墙、门等等也提供给大脑一个重要的位置信息,所有这些因素都需要被考虑,如果我们要完整地再现一个3D Audio 效果。不过要明白,这些效果有的是由人自己的结构所产生而另外的则由外部结构和环境所产生呢。(1)由人体自身结构产生的效果在1927年,一个

19、叫做W·Bartlett Jones的人利用一个带有麦克风以及内耳通道的人头部模型来录音。当这个头被使用的时候,它的结构影响到了声音,用这种简单的方法,人自身的结构对声音的影响被纪录了下来。靠这种方法,当声音后来回放时,经由耳机让听众体验到非常逼真的3D声效。虽然现在已经看不到这种技术的使用,但用人造头部模型来从事人对声音的反应方面的研究却依然在延续。除去了前面我们所说的IAD和ITD,我们要接触到的最核心的判断声音方位的技术是HRTF,简单说这就是个头部反应传送函数(HeadResponse Transfer Function)。要具体点呢,可以分成几个主要的步骤来描述其功用。第一

20、步:制作一个头部模型并安装一支麦克风到耳膜的位置;第二步:从固定的位置发出一些声音;第三步:分析从麦克风中得到声音并得出被模型所改变的具体数据;第四步:设计一个音频过滤器来模仿那个效果;第五步:当你需要模仿某个位置所发出的声音的时候就使用上述过滤器来模仿即可。HRTF这个概念确实为我们实现对声音的定位带来了无限的好处,但实际生活中这个数据是变化多端的,毕竟每个人的头部和耳朵的大小形状都不完全相同。事实上,目前成功地设置HRTF都是一种提供给大多数人的近似值。这也就是为什么这里有这么多不同的技术来实现它的原因了。(2)靠外部环境产生的效果当一个声音被产生,听众首先听到直接传送过来的声波,很短的时

21、间间隔以后,一些经过折射或反射的声波会又传入听众的耳膜。根据时间两者之间的响度差别等等数据给了我们关于声源距离的线索。当反射次数过多,大脑会把后到的信号和前面的处理信号当成两个不同的信号,这就是我们常遇到的回声效果了。(图10)这里有4种不同的方法可以混合回响成双声道效果。第一种方法是对每一个反射声源位置单独使用HRTF技术。比较不幸,这种效果的实现需要相当大的代价。第二种是平均多个位置的反射,然后得出一个相对位置,从这里应用HRTF技术。第三种方法是把反射放在一边不处理转而使用标准立体声或四声道混合技术来处理。第四种方法和前面的做法差不多,但只使用一个被平均的反射声源。现在应用最多的方法是第

22、二种,这时候只使用在在两支音箱或耳机的系统中,而第三种则配合4声道或环绕立体声的状况。3总结3D音效定位的核心技术是HRTF,而ITD以及IAD等现象是我们能体会出声音方位感产生的原因。而环境效果比如反射、阻塞等也有重要的作用。在实际处理中,我们都需要在HRTF的基础上加入各种各样的环境处理过程来更真实体现实际效果。三、 主流3D音效API就像3D图形技术一样,任何上述过程被执行都需要硬件和软件或软件和软件配合来共同完成任务。这就需要一些约定俗成的语言用于执行相应的功能,也就是应用程序接口:API。世人皆知的API是DirectX,从3.0开始DirectX加入了3D音效方面的效果。不过真正的硬件加速方面的功能是从5.0才开始的。我们也可以把他叫做DirectSound3D,这不单是一种已经标准化的接口技术,而且还整合了软件仿真等技术。虽然DirectSound3D已经被开发者广泛采用,但到目前为止他并不是我们的唯一选择。Aureal也提供了他们自己的API,名字叫做A3D。另一个标准的环境是I3DL

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论