GBT 33475.5-2024 信息技术 高效多媒体编码 第5部分:参考软件_第1页
GBT 33475.5-2024 信息技术 高效多媒体编码 第5部分:参考软件_第2页
GBT 33475.5-2024 信息技术 高效多媒体编码 第5部分:参考软件_第3页
GBT 33475.5-2024 信息技术 高效多媒体编码 第5部分:参考软件_第4页
GBT 33475.5-2024 信息技术 高效多媒体编码 第5部分:参考软件_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.040信息技术高效多媒体编码国家市场监督管理总局国家标准化管理委员会IGB/T33475.5—2024 Ⅲ 12规范性引用文件 1 1 1 16视频参考软件 17音频参考软件 2附录A(资料性)编码软件 3附录B(资料性)视频参考软件使用详细说明 4附录C(资料性)音频参考软件使用详细说明 8ⅢGB/T33475.5—2024本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。本文件是GB/T33475《信息技术高效多媒体编码》的第5部分。GB/T33475已经发布了以下部分:——第1部分:系统; ——第3部分:音频; ——第7部分;图片文件格式。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。GB/T33475.5—2024GB/T33475旨在确立数字音视频媒体高效压缩的方 第1部分:系统。目的在于确立数字音视频媒体系统层编码方法。——第2部分:视频。目的在于确立高效视频压缩方法。——第3部分:音频。目的在于确立高效音频压缩方法。——第4部分:符合性测试。目的在于确定如何测试验证编码位流和解码器。——第5部分:参考软件。目的在于定义满足GB/T33475.2—2024和GB/T33475.3—2018规定要求的参考软件。——第6部分:智能媒体传输。目的在于规定用于异构包交换网络下多媒体数据传输的智能媒体——第7部分:图片文件格式。目的在于规定高效多媒体编码图片文件格式语法描述、语义描述、本文件包含了GB/T33475.2—2024、GB/T33475.3—2018所定义的工具集的模拟软件。该软件由在标准的制定过程中的一系列验证模型演变而来。因为一个工具被接受与加入到参考软件中会存在延迟,因此GB/T33475的其他部分所定义的工具可能未包含在该参考软件中。当编码软件存在时,需要说明的是这些编码器仅仅支持规定性语法元素所产生的码流。这些编码器的性能并不能作为衡量质量和计算复杂度优化程度的标准。同时,编码端的工具并没有在本文件给本文件目前仅针对GB/T33475.2—2024和GB/T33475.3—2018定义了满足GB/T33475.2—2024和GB/T33475.3—2018规定要求的参考软件。本文件参考软件包括以下六个类别。a)视频基本流解码软件在第6章中给出定义,视频参考软件接收符合GB/T33475.2—2024的编是GB/T33475的规定性部分,但是本软件中所采用的实现技术并不认为是规定性的,因为不正确地实现GB/T33475.2—2024中所描述的解码过程。b)基本流编码软件在附录A中给出定义。该软件根据相应的媒体格式(视频)产生基本流,即视频基本流。该软件编码器提供了一种方法,用以获得符合GB/T34753.2—2024规定语法的基本流。本文件没有规定编码技术,同时本文件提供的这些编码软件的质量和复杂度也是未c)参考软件的详细使用说明在附录B中给出定义。软件可以根据附录指明的配置方式产生符合不同编码条件的码流。d)音频基本流解码软件在第7章中给出定义,音频参考软件接收符合GB/T33475.3—2018的以正确地实现GB/T33475.3—2018中所描述的解码过程。e)音频基本流编码软件在附录A中给出定义。该软件根据相应的媒体格式(音频)产生基本VGB/T33475.5—2024语法的基本流。本文件没有规定编码技术,同时本文件提供的这些编码软件的质量和复杂度f)音频参考软件的详细使用说明在附录C中给出定义。软件可以根据附录指明的配置方式产生符合不同编码条件的码流。1信息技术高效多媒体编码第5部分:参考软件本文件定义了满足GB/T33475.2—2024和GB/T33475.3—2018规定要求的参考软件。下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T33475.2—2024信息技术高效多媒体编码第2部分:视频3术语和定义GB/T33475.2—2024和GB/T33475.3—2018界定的术语和定义适用于本文件。下列缩略语适用于本文件。AASF音频存储格式(AVS2AudioStorageFormat)AATF音频传输格式(AVS2Audi符合GB/T33475.2—2024和GB/T33475.3—2018的实现不一定严格遵循参考软件的算法或者编程技术。解码软件不能超出GB/T33475.2—2024和GB/T33475.3—2018的技术描述文本。编码软件的位置和说明见附录A,视频参考软件使用的详细说明见附录B,音频参考软件使用的详细说明见附录C。6视频参考软件本文件给出的视频参考软件是按照GB/T33475.2—2024的要求而编制的。本文件所给出的文件位置是相对于参考软件根目录而言。视频参考软件位置及说明情况见表1。2GB/T33475.5—2024表1视频参考软件说明位置说明source\lcommon本软件使用C语言source\ldecod本软件使用C语言source\lencod本软件使用C语言7音频参考软件本文件给出的音频参考软件是按照GB/T33475.3—2018的要求而编制的。本文件所给出的文件位置是相对于参考软件根目录而言。音频参考软件位置及说明情况见表2。表2音频参考软件说明位置说明refavs2p3dec\source本软件使用C语言refavs2p3dec\general本软件使用C语言3GB/T33475.5—2024(资料性)编码软件A.1视频编码器视频编码器位置及说明见表A.1。位置说明本软件使用C语言音频编码器位置及说明见表A.2。表A.2音频编码器说明位置说明refavs2p3enc\src本软件使用C语言refavs2p3enc\general本软件使用C语言4(资料性)视频参考软件使用详细说明B.1.1在Windows环境下使用VisualStudio编译软件包中提供VS2008工作区文件及cmake编译工具链编译脚本。cmake工具链可以使用build目录下对应的make-solutions.bat脚本生成相应版本的VS工程,或直接执行build-all.bat脚本编译生成相应的二进制最新文件。VS2008工作区文件为source目录下的RD_vc9.sIn,其中包含如下三个工程:可以选择所需要的工程在Debug或Release模式下进行编译,生成的二进制执行文件位于“bin”目录下。如需更高版本的IDE(integrateddevelopmentenvironment,集成软件开发环境)集成解决方案,需要安装开源CMake工具且要求版本号不低于2.8.8,工程根目录下文件夹build目录下有支持VisualIDE的32位和64位编译文件目录。选择用户需要的文件目录,运行build-all.bat便可生成解决方案。双击RFD.sIn文件,打开VisualStudio工程。在VisualStudio中编译RFD工程。生成的可执行文件和静态库分别位于工程根目录下的bin和lib目录下。运行vc12-x86_64目录下的clean.bat将清空vc12-x86_64的VisualStudio的工程相关文件和bin目录下的二进制可执行文件。回到执行build-all.bat前的整洁状态。生成的二进制执行文件位于“source/bin”目录下。B.2编码器使用说明B.2.1编码器语法格式lencod-f[cfgfilename]-pInputFile=[infilename]-pOutputFIle=[outfilename][options]使用cfgfilename中的配置参数设置编码工具对应的参数。-pInputFile=[infilename]使用infilename作为视频信号的输入文件。-pOutputFile=[outfilename]使用outfilename作为AVS2通用视频编码位流的输出文件。5GB/T33475.5—2024B.2.2编码器的输出信息码器输出结果如下:HadamardtransformImage(Encoding)formFastMotionEstimationNumofref.framesusedinPpredNumofref.framesusedinBpred------------------Averagedataallframes:115242080(I57353296,P48036560,B9852224)DuplicatedGBbitsBitrate(no-dup-GB)@30.00B.2.3编码器配置参数B.2.3.1概述配置参数可以在配置参数输入文件中给定,也可以由-p命令指定,主要的配置参数及其含义如下所述。B.2.3.2文件输入输出参数6GB/T33475.5—2024设置输入视频的高度为[height]像素。-pInputSampleBitDepth=[inputbitdepth]设置输入视频的比特精度为[inputbitdepth]。-pOutputFile=[outputfile]设置输出AVS2视频码流的文件路径为[outputfile]。-pReconFile=[reconfile]设置输出重构视频信号的文件路径为[reconfile]。B.2.3.3编码器控制参数设置最大编码单元的大小为[loglcusize]。-pIntraPeriod=[ip]设置I帧编码间隔为[ip]。-pQPIFrame=[qpi]设置I帧的量化参数为[qpi]。-pQPPFrame=[qpp]设置P帧的量化参数为[qpp]。-pQPBFrame=[qpb]设置B帧的量化参数为[qpb]。-pSearchRange=[sr]设置运动估计搜索范围为[sr]。-pFFRAMEEnable=[ff]如[ff]为1,则使用F帧代替P帧;如[ff]为0,则不使用F帧代替P帧。B.2.3.4隔行逐行扫描处理参数[icp]值为0或1。如[icp]为1,则将输入序列按场进行编码;如[icp]为0,则输入视频序列按帧进行编码。-pProgressive_sequence=[ps][ps]值为0或1。如[ps]为1,则输入视频序列只包含逐行扫描的帧图像;如[ps]为0,则输入视频B.3解码器使用说明B.3.1解码器语法格式使用cfgfilename中的参数作为解码器的配置文件,该配置文件中的参数如B3.3所述。7GB/T33475.5—2024--------------------------------------AverageSNRallframes-----------===========Checkvalue_s_bound:254maxvalue_s:42bound=================value_d)参考重构视频的YUV文件格式;g)是否计算重构视频MD5;8GB/T33475.5—2024(资料性)音频参考软件使用详细说明C.1软件的编译C.1.1在Windows环境下使用VisualStudio2013编译软件包中提供VS2013工作区文件:avs2enc.sln和avs2dec.sln,其中包含如下两个工程。a)refavs2p3enc参考软件编码器。b)refavs2p3dec参考软件解码器。包含参考软件的使用说明readme.txt。包含参考软件的使用示例refavs2p3codec.bat。可以选择所需要的工程在Debug或Release模式下进行编译,生成的二进制执行文件位于C.1.2在Unix环境下使用gcc编译生成的二进制执行文件位于“bin”目录下。C.2通用音频编码器使用说明C.2.1编码器语法格式avs2enc-if[infilename]-of[outfilename][options]-if[infilename]使用infilename作为音频信号输入文件。使用outfilename作为AVS2通用音频编码位流的输出文件。C.2.2编码器的输出信息Frameprocessed:500C.2.3编码器配置参数9GB/T33475.5—2024指定AVS2编码比特率,X是编码比特率数值。AVS2无损音频编码工具,-codec_id参数缺省时使用AVS2通用音频编码工具。明使用三维声(包含对象)编码。元数据。-h/-help显示AVS2音频编码帮助信息。在-coding_profile1时,编码文件路径下需包含以下2个文本文件:object.txt文件中包含编码对象文件的路径信息,每个对象文件的路径以空格隔开,如D:\usr\obj1.wavD:\usr\obj2.wavD:\usr\obj3.wavposition.txt文件中包含编码对象轨迹的路径信息,每个对象轨迹文件的路径以空格隔开,如D:\usr\objl.txtD:\usr\obj2.txtD:\usr\obj3.txtC.3通用音频解码器使用说明C.3.1解码器语法格式-ifinfile.avs使用infile.avsa作为AVS2通用音频编码位流的输入文件。-ofoutfile.wav使用outfile.wav作为音频信号的输出文件。C.3.2解码器的输出信息解码器运行时,会向标准输出流(默认为屏幕)上打印已经完成解码帧的统计信息。一个典型的解码器输出结果如下:GB/T33475.5—2024C.3.3解码器配置参数指定AVS2对象解码生成对象文件路径,若无,则使用默认路径,该路径下必须包含一个object_dec.txt文件。object_dec.txt文件中存储的是解码后的对象文件输出,每个对象文件的路径以空格隔C.4无损音频编码器使用说明C.4.1编码器语法格式avsavs2enc[-w<十,->][-of[outfilename]][-f<0,1,2>][-lpc<0...127>][-e<0,1,2>][-if[infilename]]-if[infilename]使用infilename作为音频信号输入文件。-of[outfilename]使用outfilename作为无损编码的输出文件。-f<0,1,2>-lpc<0...,X...127>使用算术编码和Golomb-rice编码的混合编码。AV

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论