信息技术 三维声技术 编码、分发与呈现 编制说明_第1页
信息技术 三维声技术 编码、分发与呈现 编制说明_第2页
信息技术 三维声技术 编码、分发与呈现 编制说明_第3页
信息技术 三维声技术 编码、分发与呈现 编制说明_第4页
信息技术 三维声技术 编码、分发与呈现 编制说明_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《信息技术三维声技术编码、分发与呈现》(征求意见稿)编制说明根据国家标准化管理委员会2024年标准制修订计划的安排,由中国电子技该标准的制定工作起始于2021年,由世界超高清产业联盟联合中关村视听产业技术创新联盟共同制定自主三维声技术方案,2022年4月,世界超高清产业联盟发布了T/UWA009.1-2022《三维声音技术规范第1部分:编码分发和呈现》标准第一版;2023年,中关村视听产业技术创新联盟发布了T/AI109.3《信息技术智能媒体编码第3部分:音频》标准。两个联盟标准的差异在于T/AI109.3中包含了通用高码率编码工具和通用全码率编码工具两部分,而T/UWA009.1只包含通用全码率编码工具。T/UWA009.1-2022标准在产业实际应用落地中,对标准的技术内容提出了一些新的需求,因此为了更好适应产业应用需求,提出对T/UWA009.1-2022标准的修订计划,完善元数据编码工具、增加比特分配方案和低复杂度方案,于2023年发布T/UWA009.1-2022024年由中国电子技术标准化研究院牵头组织提交了国家标准立项工作,标准立项后成立标准起草组共同起草编制,旨在整合前期国内相关自主三维声技术标准,形成统一的三维声技术方案,为产业应用提供便利,促进我国三维征求意见稿主要起草单位:中国电子技术标准化研究院、清华大学、华为技术有限公司、北京理工大学、中关村视听产业技术创新联盟、国家广播电视总局广播电视规划院、中央广播电视总台、北京字跳网络技术有限公司、赛因有限公司、小米通讯技术有限公司、北京大学、博华超高清创新中心、杭州当虹科技股份有限公司、咪咕文化科技有限公司、中国移动集团有限公司、中国联合网络通信集团有限公司、中国电信集团有限公司、中移动(杭州)信息有项目码率版本置信区间得分(有效均值)单声道音频测试32kbpsAVS2P3(73.239-80.036)76.638AVS3baseline(82.796-87.766)85.28144kbpsAVS2P3(84.074-88.964)86.519AVS3baseline(89.321-93.129)91.22572kbpsAVS2P3(91.228-94.010)92.619AVS3baseline(93.503-95.909)94.706双声道立体声音频测试48kbpsAVS2P3(77.984-82.840)80.412AVS3baseline(91.868-93.841)92.85464kbpsAVS2P3(84.581-88.219)86.400AVS3baseline(92.935-94.847)93.89196kbpsAVS2P3(94.044-95.725)94.884AVS3baseline(95.571-96.938)96.2257.1.4声道音频测试kbpsAVS2P3(85.759-88.863)87.311AVS3baseline(92.246-94.144)93.195kbpsAVS2P3(92.860-94.839)93.850AVS3baseline(92.450-94.350)93.400kbpsAVS2P3(93.327-94.869)94.098AVS3baseline(93.774-95.421)94.597表2总体主观音质测试结果打分均值95%置信区间参照渲染器85.25(86.78-83.71)扬声器渲染系统86.28(87.74-84.82)T-TEST结果P值结论0.1769P>0.05不存在显著性差异属性评价场景深度平略平略深深12345环绕感略轻略强12345吞噬感略轻略强12345定位准确性不清楚稍微清楚大致准确精确12345亮度略轻略强12345略轻略强54321表5属性评价主观测试结果打分均值95%置信区间场景深度参照渲染器(3.58-3.90)扬声器渲染系统(3.56-3.88)环绕感参照渲染器(3.53-3.87)扬声器渲染系统(3.47-3.81)吞噬感参照渲染器(3.43-3.76)扬声器渲染系统(3.41-3.74)定位准确性参照渲染器4.15(4.02-4.28)扬声器渲染系统4.23(4.10-4.36)亮度参照渲染器(3.83-4.11)扬声器渲染系统4.08(3.94-4.21)参照渲染器4.24(4.11-4.37)扬声器渲染系统(4.24-4.29)表6属性得分显著性检验结果属性T-TEST结果P值结论场景深度0.8348P>0.05不存在显著性差异环绕感0.6321P>0.05不存在显著性差异吞噬感0.8646P>0.05不存在显著性差异定位准确性0.4111P>0.05不存在显著性差异亮度0.2901P>0.05不存在显著性差异0.1769P>0.05不存在显著性差异测试序列得分均值置信区间隐藏参考93.25(91.91-94.59)3.5kHz47.13(42.00-52.25)7kHz65.26(60.54-69.99)hw_9692.49(90.82-94.15)hw_19292.86(91.67-94.06)avs_9683.04(79.08-87.00)avs_19290.64(89.09-92.19)测试序列得分均值置信区间隐藏参考93.03(91.35-94.70)3.5kHz50.38(45.40-55.35)7kHz69.97(65.29-74.68)hw_19291.24(89.39-93.08)hw_32092.00(90.31-93.69)avs_19278.13(73.16-83.09)avs_32090.08(88.02-92.15)测试序列得分均值置信区间隐藏参考92.91(91.78-94.03)3.5kHz43.18(39.04-47.32)7kHz66.90(62.74-71.06)hw_32087.14(84.40-89.87)hw_51289.23(87.25-91.21)avs_32065.50(60.95-70.45)avs_51287.14(84.75-89.52)ODGM6728AVS2P31阶HOA(96kbps)-2.95-3.911阶HOA(192kbps)-1.40-2.542阶HOA(192kbps)-2.37-3.692阶HOA(320kbps)-1.32-2.813阶HOA(320kbps)-1.96-3.903阶HOA(512kbps)-1.33-2.26观测试中,编解码前后元数据差异均小于量化步长主要目的为评估ILD码书和量化公式计算两种方法的一致性。测试结果见云听、咪咕等音频平台已经支持本标准规定的技术方案。为更好地满足网络媒体、数字电影、广播电视、广播流媒体、实时通信、虚拟现实和增强现实、视频监控、数字存储媒体等应用需求,基于团体标准内容,提出本次国标立项计本标准为为三维声音全流程中音频制作、元数据、渲染、控制、终端设备最为广泛的三维沉浸式音效之一。其中,电影音效制作里面使用得最多,而且在电影制作之外,音乐制作、电子游戏以及电视广播节目都开始使用Dolby来发展为蓝光音频标准的重要厂家,并在电影数字传输和互联网消费电子平台上获得了广泛的应用。2012年DTS公司收购了SRS公司,获得了SRS公司的Multi解码标准,同时也是基于声音对象的多维空间音频技术。与现有的环绕声系统音频体验,使用者在水平和垂直平面上定位声音对象,并感知声音对象随用户在音频对象周围移动而发生的响度变化,感知真实空间中的声音混响以及感知定了虚拟现实音频应用场景涉及的制作、传输和渲染回放,但不涉及编码和传本标准引用了国际标准ISO/IEC14496-12:2020信息技术音视频对象编码第12部分:ISO基本媒

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论