标准解读

《GB/T 34798-2017 核酸数据库序列格式规范》是中国国家标准之一,主要针对核酸序列信息的存储、交换与处理过程中所涉及的数据格式进行了详细规定。该标准适用于生物信息学领域内各种类型的核酸序列数据管理活动,包括但不限于基因组测序项目、遗传多样性研究以及医学诊断等应用场景。

根据标准内容,它首先定义了一系列基本概念和术语,为后续章节中具体条款的理解奠定了基础。接着,《GB/T 34798-2017》对核酸序列文件的基本结构做了明确要求,指出每个序列记录应当包含但不限于序列标识符、描述性注释、来源信息及实际的核苷酸或氨基酸序列本身。此外,还特别强调了对于不同类型的序列(如DNA、RNA)及其衍生物,在表示方法上应遵循的具体规则。

在编码方面,此标准推荐使用ASCII字符集来表示序列数据,并且给出了详细的字符映射表,以确保不同系统间能够准确无误地交换信息。同时,《GB/T 34798-2017》也考虑到了未来可能出现的新类型序列或者特殊需求,为此预留了一定灵活性,允许通过扩展字段的方式添加额外的信息。

最后,该标准还提供了一些示例文件,帮助读者更好地理解和应用上述各项规定。这些例子不仅涵盖了常见的情况,还包括了一些较为复杂的情形,旨在全面展示如何按照标准格式正确组织和呈现核酸序列数据。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 2017-11-01 颁布
  • 2018-05-01 实施
©正版授权
GB/T 34798-2017核酸数据库序列格式规范_第1页
GB/T 34798-2017核酸数据库序列格式规范_第2页
GB/T 34798-2017核酸数据库序列格式规范_第3页
GB/T 34798-2017核酸数据库序列格式规范_第4页
免费预览已结束,剩余20页可下载查看

下载本文档

免费下载试读页

文档简介

ICS07080

A40.

中华人民共和国国家标准

GB/T34798—2017

核酸数据库序列格式规范

Formatsspecificationsofnucleotidesequencedatabase

2017-11-01发布2018-05-01实施

中华人民共和国国家质量监督检验检疫总局发布

中国国家标准化管理委员会

GB/T34798—2017

目次

前言

…………………………Ⅲ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

缩略语

4……………………2

核酸序列格式规范制定的总则

5…………2

核酸序列描述规范

6………………………2

核酸序列特征描述规范

7…………………3

核酸序列格式规范

8………………………5

核酸序列文件整体格式规范

9……………5

附录资料性附录核苷酸含义表

A()……………………6

附录资料性附录与核酸相关的特征关键词表

B()……………………7

附录资料性附录密码子表

C()…………10

附录资料性附录修饰碱基表

D()………………………11

附录资料性附录限定词中英文对照表

E()……………13

附录资料性附录核酸序列文件样例

F()………………14

附录资料性附录行首大写字母含义表

G()……………15

参考文献

……………………16

GB/T34798—2017

前言

本标准按照给出的规则起草

GB/T1.1—2009。

本标准由全国生化检测标准化技术委员会提出并归口

(SAC/TC387)。

本标准起草单位深圳华大基因研究院深圳华大基因科技有限公司广东省标准化研究院广东产

:、、、

品质量监督检验研究院

本标准主要起草人魏晓锋陈凤珍刘克杜佳婷李倩一沈维燕李启沅谢强王娟谭嘉力

:、、、、、、、、、、

宋祚锟黄江勇

、。

GB/T34798—2017

核酸数据库序列格式规范

1范围

本标准规定了核酸数据库的序列格式包括生物体基因组核酸序列特征规范制定的总则序列描述

,、

格式规范序列特征描述规范和序列格式规范等

、。

本标准适用于生物体基因组核酸数据库序列文件的编写

2规范性引用文件

下列文件对于本文件的应用是必不可少的凡是注日期的引用文件仅注日期的版本适用于本文

。,

件凡是不注日期的引用文件其最新版本包括所有的修改单适用于本文件

。,()。

生物信息学术语

GB/T29859

核苷酸和或氨基酸序列表和序列表电子文件标准

ZC0003/

3术语和定义

界定的以及下列术语和定义适用于本文件

GB/T29859。

31

.

核酸数据库nucleicaciddatabase

以核酸序列为基本内容并附有核酸序列注释信息的数据库

,。

32

.

编码序列codingsequence

编码一段蛋白产物的序列始于起始密码子终于终止密码子

,,。

33

.

序列组装sequenceassembly

基因组长序列打断之后形成较短的序列通过算法和计算机的帮助把这些短的序列组装起来成为

,,

一条完整有序的序列的过程

34

.

甲基化methylation

蛋白质和核酸的一种重要的修饰调节基因的表达和关闭

,。

35

.

识别码identifier

某个体系中相对唯一的编码

36

.

位置location

一个或一

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论