T-CTSA 0015-2023 虚拟数字人能力技术要求第1部分：通用技术要求

上传人：馒*** IP属地：河北上传时间：2023-07-21 格式：DOCX 页数：14 大小：87.45KB 积分：6 举报 版权申诉

T-CTSA 0015-2023 虚拟数字人能力技术要求第1部分：通用技术要求_第2页

T-CTSA 0015-2023 虚拟数字人能力技术要求第1部分：通用技术要求_第3页

T-CTSA 0015-2023 虚拟数字人能力技术要求第1部分：通用技术要求_第4页

T-CTSA 0015-2023 虚拟数字人能力技术要求第1部分：通用技术要求_第5页

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

ICS

03.080.01A10 T/CTSA

0015-2023

Technical

Requirements

for

Capabilities

Technical

Requirements2023-03-31

2023-03-31

0015-2023

3.1

3.2

3.3

5.1 5.2 5.3 5.4 7.1 7.2 7.3 7.4 8.1 8.2 8.3 8.4 8.5 8.6 8.7 0015-2023

本文件由中关村中恒文化科技创新服务联盟和中国公共关系协会文化大数据产业委员会共同本文件起草单位：中央戏剧学院、快手科技有限公司、北京理工大学、中科院自动化所、北京蓝色光标数据科技股份有限公司、海信视像科技股份有限公司、北京素鳞科技产业有限公司、广州玖的数码科技有限公司、广州龙联科技文化发展有限公司、伏羲云（北京）文化科技有限公海南大学、中关村中恒文化科技融合创新中心、清研千讯（北京）科技有限公司、厦门理工学院影视与传播学院、厦门理工学院设计艺术学院、福建网龙计算机网络信息技术有限公司、上海东本文件主要起草人：宋震、徐梦露、郑屹、刘文超、翁冬冬、包仪华、刘杰、刘复昌、潘志庚、郭晓喆、杨善松、刘德建、吴立素、高楠、蒋耀琳、付爱国、葛岩、许经捷、庞博、闫喆、朴经纬、苏彦聪、李建勋、张勇、谢生文、黄梦醒、刘兵、高凯、亓峰、何雪萍、王竞然、薛晓II0015-2023

部分:

通用技术要求范围本文件规定了虚拟数字人基础术语、虚拟数字人分类、虚拟数字人系统、虚拟数字人资产和规范性引用文件下列文件中内容通过文中的规范性引用而构成本文件必不可少的条款。其中，注日期的引用文件，仅该日期对应的版本适用于本文件；不注日期的引用文件，其最新版本（包含所有的修改

human

术语和定义3.1

通用术语3.1.1 虚拟数字人

是指集成了计算机图形学、计算机视觉、智能语音、自然语言处理技术的计算机应用程序，

3.1.2虚拟数字人系统

是指利用人机界面、通信设施和数据管理系统等资源提供的服务来实现虚拟数字人能力的应3.1.3虚拟数字人资产

digital

human

assets是指虚拟数字人开发过程中所涉及到的数字资源，通常以可存储的数据、文本等信息为载体和表现形式，能够持续用于支持虚拟数字人应用系统运行并能够带来一定的经济效益，主要包括0015-20233.1.4虚拟数字人角色

character是指基于虚拟数字人系统，以虚拟数字人资产为支撑、以人形外貌为表征、以人机交互为主要方式、具有多重人类特征的数字孪生产物，其对外可呈现出相应的服务能力，主要表现为形象3.2

技术术语3.2.1纹理

是指经过正射纠正和统一匀光处理，用于表示物体色调、饱和度、明度等特征来反应模型表

3.2.2 材质

是指赋予模型表面色彩、纹理、光滑度、透明度、反射率、折射率、发光度等可视属性的过

3.2.3 渲染

本文件中特指经由虚拟数字人模型数据生成一张或多张二维图像的技术，可具体分为实时渲GB/T3.2.4 骨骼节点

是指为了实现虚拟数字人表情、动作变化所创建的一系列与虚拟数字人模型相互关联的可控3.2.5蒙皮

是指把虚拟数字人模型上的三维顶点关联到骨骼节点上的技术，使虚拟数字人模型可以通过3.2.6 绑定

本文件中特指为模型添加骨骼和控制器的制作过程，使模型物体有层次地被相关联的骨骼控3.2.7模型

0015-2023本文件中特指利用三维建模和重建技术，仿照实际人体外形或设计图样（不局限于平面与立

3.2.8模型数据

3.2.9 三维建模和重建

3.2.10 图像分辨率

image

3.2.11交互

3.2.12文本驱动

text

3.2.13音频驱动

3.2.14视频驱动

3.2.15 动作捕捉驱动

3.2.16 完备度

描述虚拟数字人的模型组件、纹理贴图等构成要素是否能够充分支撑渲染需求，是否用分离0015-20233.2.17精细度

3.2.18 风格贴合度

3.3

应用术语3.3.1数字人美术风格

art

是指虚拟数字人渲染的美术风格，可根据与真人的相似程度可分为卡通、半写实、写实等

3.3.2 形象呈现能力

image

3.3.3语音生成能力

3.3.4 动作驱动能力

3.3.5交互表达能力

interactive

3.3.6 内容供给能力

是指虚拟数字人能够实现知识表达的服务技能，具有用语言、面部表情和肢体动作等多模态3.3.7整体表现能力

缩略语

Dimension)虚拟数字人分类0015-20235.1

概述

5.2

按照图像资产分类

——

虚拟数字人是指所构建的虚拟数字人兼具高度、宽度和深度三个层次信息的立体形——卡通虚拟数字人是指以夸张变形为主要特点，依据生产者的创造力和想象力，通过造型手段使虚拟数字人视觉特征更加鲜明，有意识地将虚拟数字人的脸型、五官形状与位置、躯干造——半写实虚拟数字人是指虚拟数字人的脸型、五官形状与位置、躯干造型及比例等参数参照真人的生理解剖结构，但是会在一定程度上运用恰当的概括、提炼等手法对现实中的人进行再5.3

按照互动形式分类——实时交互虚拟数字人是指以三维实时引擎为技术途径进行构建，可利用不同的驱动方式

——非实时交互虚拟数字人是指以传统影视技术为基础进行构建，其运作流程主要依据目标文本对应生成虚拟数字人语音和动画，并合成呈现给用户，但无法进行实时驱动，主要驱动方式

与实时交互虚拟数字人相比，非实时交互虚拟数字人更加关注资产质量的维度，如生成的图像质量、——智能驱动虚拟数字人是指通过前置性对声音、动作等内容数据进行标样、整理和学习，使虚拟数字人智能系统对外界输入的多模态信息能够进行自动读取、解析及识别，实现虚拟数字人智能化信息处理与传输，从而决策后续的输出文本、驱动模型生成相应的语音与动作，完成与0015-2023——真人驱动虚拟数字人是指在实现虚拟数字人从静态到动态的转变过程中，需要通过视频监控、动作捕捉等系统提取真人的关键数据信息，将真人的表情、动作实时呈现在虚拟数字人形5.4

按照应用模式分类——替身类虚拟数字人是指可代替真人从事一种或多种服务型工作，以提供标准化服务的数——分身型虚拟数字人是指其在真实世界中有客观实在的对应用户，是基于真实用户数据信——偶像型虚拟数字人是指其在真实世界中没有客观实在的对应用户，是基于创作者对现代虚拟数字人系统

个模块与虚拟数字人角色本身密切相关，

个模块用以支撑虚拟数字人驱动与合成显示，如

虚拟数字人系统框架0015-2023——交互模块：可使虚拟数字人能够感知、识别、理解和决策的模块，即基于智能感知与识别、智能分析与决策等技术识别用户输入的信息，同时通过理解其意图做出后续决策，以驱动虚

虚拟数字人资产7.1

概述虚拟数字人资产主要包括图形图像资产、驱动数据资产、系统技术资产等

个类别，支撑虚7.2

图形图像资产图形图像资产用于支撑虚拟数字人模型的视觉化呈现，可按照空间维度分为二维图形图像资

7.2.1二维图形图像资产

位图图像以数字化的形式描述和存储图像上每一点的颜色、亮度等相关视觉信息，一般指代由数码相

7.2.2 三维图形图像资产

纹理和图像能够在虚拟数字人交互和应用中提供颜色和可视化细节。纹理连同形状的表示形式（通常是三维模型）来呈现整个对象或场景，而图像通常是对象或场景的独立表示形式。常见的纹理包括纹理图、法线0015-2023

三维模型能够在虚拟数字人创建和应用中提供空间、形状等信息，一般将三维空间中点的位置（称为

7.3

动态数据资产动态数据资产用于支撑虚拟数字人肢体动作、面部神情等动态效果呈现，可按照数据模态的

7.3.1 动作数据资产动作数据资产用于驱动虚拟数字人肢体动作和面部表情，包括但不限于面部表情数据、肢体

面部表情数据用于驱动虚拟数字人面部表情，包括但不限于面部表情采集和捕捉数据、面部图像处理

肢体动作数据用于驱动虚拟数字人的肢体动作，包括但不限于动作采集和捕捉数据、动作处理和驱动7.3.2 语音数据资产语音数据资产用于合成虚拟数字人的语音，以支撑实现语音播放、交互等听觉效果，包括但

7.4系统技术资产系统技术资产用于支持虚拟数字人底层功能的开发实现。通常以整合的技术路径及方法为内容，通过一定的技术载体进行表现，不具有独立实体，可按照技术路径的整合性形式进行拆分，包括但不限于形象技术资产、语音技术资产、动画生成技术资产、音视频合成技术资产、交互技0015-20237.4.1形象技术资产形象技术资产用于支持虚拟数字人角色的性格、外观等视觉特征的生成、装扮等功能，应具7.4.2 语音技术资产语音技术资产用于支持虚拟数字人语音合成、编辑、转换、定制等功能，应具备但不限于如7.4.3动画生成技术资产动画生成技术资产用于支持虚拟数字人在图形图像数据等信息文本的基础上实现动画呈现功7.4.4 音视频合成技术资产0015-20237.4.5交互技术资产交互技术资产用于支持虚拟数字人通过即时传递反馈信息实现与用户互动等功能，应具备但

该类型的技术资产是扩展项，不同类型的虚拟数字人会设置有不同技术方法和路径，需根据现实使用虚拟数字人角色的能力8.1

概述虚拟数字人的能力包括但不限于形象呈现能力、语音生成能力、动作驱动能力、交互表达能

8.2

形象呈现能力形象是虚拟数字人进行视觉表达的载

人人文库> 全部分类> 行业资料 > 各类标准

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

T-CTSA 0015-2023 虚拟数字人能力技术要求第1部分：通用技术要求

文档简介

温馨提示

最新文档

评论

T-CTSA 0015-2023 虚拟数字人能力技术要求 第1部分：通用技术要求

文档简介

温馨提示

最新文档

评论

相关文档

T-CTSA 0015-2023 虚拟数字人能力技术要求第1部分：通用技术要求