标准解读
《GB/T 40035-2021 双语平行语料加工服务基本要求》是针对双语平行语料处理服务制定的一项国家标准。该标准主要规定了提供双语平行语料加工服务时应遵循的基本原则、技术要求以及质量保证措施等,旨在提高双语平行语料的质量和可用性,促进语言资源的有效利用。
根据此标准,双语平行语料加工服务涵盖了从原始文本到最终可用于翻译记忆库、机器翻译训练或其他自然语言处理任务的高质量双语文本数据整个过程。它强调了对于源语言与目标语言之间对应关系准确性的重要性,并且对参与人员的专业技能提出了具体要求,比如需要具备良好的双语能力以及相关领域的专业知识。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
- 现行
- 正在执行有效
- 2021-04-30 颁布
- 2021-11-01 实施





文档简介
ICS03080993524030
;
CCSA.10...
中华人民共和国国家标准
GB/T40035—2021
双语平行语料加工服务基本要求
Basicrequirementsforbilingualparallelcorpusprocessingservice
2021-04-30发布2021-11-01实施
国家市场监督管理总局发布
国家标准化管理委员会
GB/T40035—2021
目次
前言
…………………………Ⅲ
范围
1………………………1
规范性引用文件
2…………………………1
术语和定义
3………………1
总则
4………………………2
基本要求
5…………………3
服务提供方
5.1…………………………3
语料加工人员
5.2………………………3
服务环境
5.3……………3
加工内容
5.4……………3
加工结果
5.5……………3
完整性
5.5.1…………………………3
准确性
5.5.2…………………………3
可用性
5.5.3…………………………4
规范性
5.5.4…………………………4
语料加工工具
5.6………………………4
可靠性
5.6.1…………………………4
易用性
5.6.2…………………………4
本地化界面
5.6.2.1…………………4
操作功能
5.6.2.2……………………4
帮助系统
5.6.2.3……………………5
效率
5.6.2.4…………………………5
兼容性
5.6.3…………………………5
加工流程
6…………………5
预处理
6.1………………5
语料准备
6.1.1………………………5
清洗
6.1.2……………5
去重
6.1.3……………5
脱敏
6.1.4……………5
语料对齐
6.2……………6
语料审核
6.3……………6
服务内容
7…………………6
需求沟通
7.1……………6
客户协议
7.2……………6
项目管理
7.3……………6
加工环节
7.4……………6
Ⅰ
GB/T40035—2021
交付内容
7.5……………7
质量保证期
7.6…………………………7
服务评价与改进
7.7……………………7
数据安全
8…………………7
数据备份
8.1……………7
文档管理与日志
8.2……………………7
数据存储
8.3……………7
附录资料性双语平行语料加工人员的培训
A()………8
附录资料性双语语料加工的元数据
B()………………9
附录资料性文件常见编码格式
C()TXT……………11
附录资料性格式规范
D()TMX………………………12
附录资料性文件的命名规则编码格式及文件格式
E()、……………14
参考文献
……………………15
Ⅱ
GB/T40035—2021
前言
本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定
GB/T1.1—2020《1:》
起草
。
请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任
。。
本文件由全国语言与术语标准化技术委员会提出并归口
(SAC/TC62)。
本文件起草单位中国标准化研究院中国翻译协会上海一者信息科技有限公司上海佑译信息科
:、、、
技有限公司中译语通科技股份有限公司北京悦尔信息技术有限公司苏州联跃科技有限公司四川语
、、、、
言桥信息技术有限公司北京百度网讯科技有限公司沈阳雅译网络技术有限公司上海智膳合网络科
、、、
技有限公司北京语言大学北京邮电大学
、、。
本文件主要起草人刘智洋张井叶剑柴瑛黄宝荣罗慧芳蒙永业朱励张雪涛王海涛朱宪超
:、、、、、、、、、、、
韩林涛郑春萍何中军于立梅张春良甘克勤张宝林
、、、、、、。
Ⅲ
GB/T40035—2021
双语平行语料加工服务基本要求
1范围
本文件规定了双语平行语料加工服务的基本要求加工流程服务内容和数据安全等内容
、、。
本文件适用于以原文和译文为对象的以文字为表达形式的数字化双语语料加工服务其他数字化
、,
文本的语料加工也可参照使用也适用于对语料对齐工具的评价
,。
2规范性引用文件
本文件没有规范性引用文件
。
3术语和定义
下列术语和定义适用于本文件
。
31
.
文本text
以字符符号词短语段落句子表格或其他字符排列形成的数据用于表达意义其解释基本上
、、、、、、,,
取决于读者对于某种自然语言或人工语言的知识
。
来源
[:GB/T4894—2009,4.1.1.2.4]
32
.
语料corpus
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 工业4.0背景下的车间生产流程优化
- 展会场地材料选择及施工工艺研究
- 文献综述-工业固体废物回转焚烧炉窑装置设计
- 临牌打印管理制度
- 临高餐饮管理制度
- 主播家族管理制度
- 乌龟兔子管理制度
- 书画院项目管理制度
- 2025年历史文化街区保护与开发中的文化遗产保护与城市形象提升策略报告
- 2025年历史文化街区保护与开发在城市更新中的社区参与模式研究
- 心衰的中西医结合治疗
- 公路技术状况检测与评定-公路技术状况评定
- 酒店服务礼仪培训课件
- 乡村医生从业管理条例
- 北京第八十中学英语新初一分班试卷
- 酒店OTA学习三部曲(侧重携程)
- 潮汕方言语音的内部差异及其成因
- 人教版小学语文一年级到六年级课本古诗
- 分包工程验收报告
- 《汽车维修业开业条件》
- 2023年小学教科版科学毕业精准复习综合练习课件(共36张PPT) 实验探究专题二
评论
0/150
提交评论