生物信息数据库挖掘-kegg和david-生物学_第1页
生物信息数据库挖掘-kegg和david-生物学_第2页
生物信息数据库挖掘-kegg和david-生物学_第3页
生物信息数据库挖掘-kegg和david-生物学_第4页
生物信息数据库挖掘-kegg和david-生物学_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容提要KEGG数据库简介KEGG-pathway查询KEGG-Brite查询KEGG-module

查询KEGG-disease

查询数据库产生背景如何借助计算机全面地展示细胞和生物所包含的生物学信息是后的重要组时代科学家期望能够根据

组中的信息,用计算机计算或者

出比较复杂的细胞中的通路或者生物的复杂行为出于上述目的,

大学生物信息学中心的Kanahisa

于1995年建立了生物信息学数据库KEGGKEGG

数据库简介全称Kyoto

Encyclopedia

of

Genes

and

Genomes与

组百科全书:FTP:

ftp://ftp.genome.jp/pub/kegg/数据库首页特点KEGG是一个整合了组、化学和系统功能信息的数据库。把从已经完整的组中得到的与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。人工创建了一个知识库,这个知识库是基于使用一种可计算的形式捕捉和组织实验得到的知识而形成的系统功能知识库。它是一个生物系统的计算机模拟。与其他数据库相比,KEGG的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其所要研究的代谢途径有一个直观全面的了解。用途各个数据库中包含了大量的有用信息。组信息

在GENES数据库里,包括完整和部分

组序列;更高级的功能信息

在PATHWAY数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息;KEGG的另一个数据库LIGAND,包含关于化学物质、酶分子、酶反应等信息。通过与世界上其它一些大型生物信息学数据库的连接,KEGG可以为研究者提供更为丰富的生物学信息(LinkDB)。组图谱和操作表达图谱,以及其它序列比KEGG提供了Java的图形工具来

组图谱,比较较、图形比较和通路计算的工具,可以免费获取。影响及发展KEGG建立了KEGG直系同源系统(theKEGGOrthologySystem,KO),这个系统通过把分子网络的相关信息连接到 组中,从而发展和促进了跨物种注释流程。结果表明,KEGG被当做一个参考知识库,被广泛的用于

组和其他高通量实验技术得到的大规模数据集的整合和解释中。除了保持对基础研究的支持,随着KEGG分子网络的一些小变化,KEGG正在朝着更加偏向于实际应用的方向发展,这些应用主要集中在整合人类疾病、药物和其他与健康相关的物质。KEGG数据库组成KEGG是一个综合数据库,它们大致分为系统信息、

组信息和化学信息三大类。进一步可细分为17个主要的数据库。可以通过不同的颜色编码来区分。KEGG-LIGANDKEGG-MEDICUS三类数据库的关系KEGerview:数据库容量KEGG对象标识符DatabaseObjectPrefixExampleKEGG

PATHWAYPathway

mapmap,ko,

ec,

rn,(org)hsa04930KEGG

BRITEFunctional

hierarchybr,

jp,

ko,

(org)ko01003KEGG

MODULEKEGG

moduleM,

(org)_MM00010KEGG

DISEASEHuman

diseaseHH00004KEGG

DRUGDrugDD01441KEGG

ENVIRONCrude

drug,

etc.EE00048KEGG

ORTHOLOGYKO

groupKK04527KEGG

GENOMEKEGG

organismTT01001

(hsa)KEGG

GENESGene

/

proteinhsa:3643KEGG

COMPOUNDSmall

moleculeCC00031KEGG

GLYCANGlycanGG00109KEGG

REACTIONReactionRR00259KEGG

RPAIRReactant

pairRPRP04458KEGG

RCLASSReaction

classRCRC00046KEGG

ENZYMEEnzymeec:数据库中包含各种各样的数据对象,这些数据对象是为了用来对生物系统进行计算机模拟的。因此,各个数据库中的数据记录都被称为KEGG对象。这些对象可以通过KEGG对象标识符来识别,标识符由一个与数据库相关的前缀加五个数字构成。(org)

represents

three-,

four-,

or

five-letter

organism

code内容提要KEGG数据库简介KEGG-pathway查询KEGG-Brite查询KEGG-module

查询KEGG-disease

查询KEGG

PATHWAY

DatabaseKEGG

PATHWAY数据库是一个手工画的代谢通路的集合,包含以下几方面的分子间相互作用和反应网络:1.新陈代谢:碳水化合物,能量,脂类,核酸,氨基酸,多聚糖,维生素,萜类化合物….2.遗传信息加工3.环境信息加工4.细胞内过程5.生物体系统6.人类疾病7.药物开发PATHWAY的类型(Map

number

Prefix)pathway中的每一个框(或线)都对应一个或多个K

、EC

及R

。map-Reference

pathway(唯一人工画的图)对于代谢相关的通路,在reference

pathway中,一个点同时表示一个

、这个

编码的酶及这个酶参加的反应ko

-

Reference

pathway

(KO)ko通路中的点只表示

.

KO:

KEGG

ortholog

groupec

-

Reference

pathway

(EC)ec通路中的点只表示相关的酶.EnzymePATHWAY的五种类型rn

-

Reference

pathway

(Reaction)Reaction通路中的点只表示该点参与的某个反应、反应物对及反应类型org

-

Organism-specific

pathway

map对于所有的代谢和非代谢通路,K

都被认为是

的标识符,这个标识符在每一个物种中对应该物种中的某个

,从而得到物种特异性的pathway。map00010(

)ko00010ec00010点:反应rn00010hsa00010点:点:酶点:人类特异性coloringindicates

thatmap

objectsexist

and

arelinked

tocorrespondingentriesPathway

的检索-以三为例Pathway

的检索-以三为例Pathway

的检索-以三为例Pathway

的检索-以三为例Pathway

的检索-以三为例Pathway

的检索-以三为例Pathway

的检索-以三为例简介网络通路图相关信息为例Pathway

的检索-以三通路名称酶化合物其他代谢通路化学反应与其他通路的关系在图中可以搜索是否存在特定的或者酶同时可以显示该通路相关的疾病及疾病相关药物信息内容提要KEGG数据库简介KEGG-pathway查询KEGG-Brite查询KEGG-module

查询KEGG-disease

查询KEGG

BRITE

Functional

HierarchiesKEGG

BRITE是一个层级分类的数据库,包含生物系统各个方面的知识。相对于KEGG

PATHWAY仅限于分子间相互作用和反应,KEGGBRITE包含了许多不同的关系类型。例如,可以查询酶和底物之间的关系,也可以查询某种酶的同源

。BRITE

hierarchy

files的来源:是通过计算分析扩展出来的。人工添加的KEGG

BRITE

Database查询-TP53为例KEGG

BRITE

Database查询-TP53为例KEGG

BRITE

Database查询-TP53为例获得该的K所有相关信息KEGG

BRITE

Database查询-TP53为例重新精准查询该 的层次信息KEGG

BRITE

Database查询-TP53为例内容提要KEGG数据库简介KEGG-pathway查询KEGG-Brite查询KEGG-module

查询KEGG-disease

查询KEGG

MODULE

Database组和对这KEGGMODULE是一个人工定义的功能单元的集合。用于注释已些 组进行生物学上的解释。各个模块使用M开头的 及与其对应的一系列K开头的 来表示。四种主要的KEGG模块1.通路模块

(pathway

module):代表在KEGG代谢通路图中的复杂功能单元,例如M00002(糖酵解,与三碳化合物相关的 模块)2.结构复合物(structural

complexes):通常形成分子机械,例如M00072(寡糖转移酶)3.功能集(functionalsets):基本单元的其他形式,例如M00360(氨酰基-tRNA

合酶,原核生物)4.特征模块

(signature

modules):作为某种表型的标记,例如M00363(肠

性大肠杆菌致病性特征,

毒素)KEGG

MODULE查询特定模块:通过点击下拉列表可查看已有模块;可以 所有模块列表内容提要KEGG数据库简介KEGG-pathway查询KEGG-Brite查询KEGG-module

查询KEGG-disease

查询KEGG

DISEASE

Database在DISEASE数据库中,

对疾病的认知体现在疾病相关的信号通路中(KEGG-PATHWAY

MAP,前面有提到)。DISEASE数据库就是对和疾病相关的

、环境扰动信息的收集。每项疾病记录:

以H+数字

。记录包含:疾病相关

,环境因素,分子

标记,治疗药物等。KEGG

REACTION

Database谷胱甘肽:insulin

氧化还原酶KEGG

ORTHOLOGY

(KO)

DatabaseKEGG参考通路图,BRITE功能层次以及KEGG模块都是以一种广泛的方式来表示,都可以用于所有物种。而KEGG直系同源系统(KO

System)是这一表示方式的基础。包含手动定义的直系同源组,这些直系同源组就相当于KEGG通路中的点,BRITE层级中的点以及KEGG模块中的点。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论