教你使用NCBI,PDB数据库 ppt课件_第1页
教你使用NCBI,PDB数据库 ppt课件_第2页
教你使用NCBI,PDB数据库 ppt课件_第3页
教你使用NCBI,PDB数据库 ppt课件_第4页
教你使用NCBI,PDB数据库 ppt课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochow第三讲:序列的采集、存储第三讲:序列的采集、存储和查询和查询 Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1,

2、Soochowr 1. DNA测序测序r 2. 序列数据的存储序列数据的存储r 3. 序列数据的文件格式序列数据的文件格式r 4. 序列数据的查询序列数据的查询Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 1. DNA一次测序的长度为一次测序的长度为500bp。r 2.基因组的测序方案:将大的染色体打断成基因组的测序方案:将大的染色体打断成100kbp的片断,的片断,插入到插入到BAC (Bacterial Artificial Chromosome)中

3、。再随机打中。再随机打断,克隆,然后再组装成长的序列断,克隆,然后再组装成长的序列(contig)。r 3. EST (Expressed sequence tag) 测序:细胞中测序:细胞中mRNA反转录反转录成成cDNA,方向不定,测序。,方向不定,测序。r 4. UniGene: 为每一个基因创造一个唯一的条目,收集这个为每一个基因创造一个唯一的条目,收集这个基因所有的基因所有的ESTs.r 5. GSS (基因组测序序列基因组测序序列):类似于:类似于ESTs,来源基因组。,来源基因组。r 6. HTG (高通量基因组序列高通量基因组序列):高通量、尚未完工的:高通量、尚未完工的DNA

4、序列。序列。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 1. DNA片段在染色体上的位置、方向已知。片段在染色体上的位置、方向已知。首先染色体被打断成首先染色体被打断成150kbp左右的片段,左右的片段,然后克隆到然后克隆到BACs中,再进一步打碎,克隆,中,再进一步打碎,克隆,测序,组装。测序,组装。r 2. “鸟枪法鸟枪法”,shotgun,随机将,随机将DNA片段打片段打碎,克隆,测序,组装。碎,克隆,测序,组装。DNA片段在染色片段在染色体上的

5、位置和方向未知。体上的位置和方向未知。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 1. 核酸三大数据库:核酸三大数据库:GenBank, EBI, DDBJ.r 2. Ensembl数据库:基因组注释。数据库:基因组注释。r 3. ESTs数据库;数据库;r 4. Uni

6、Gene数据库数据库r 5. Refseq数据库;数据库;r 6. NCBI的的Gene信息数据库信息数据库;r 7. 蛋白质序列:蛋白质序列:Swissprot/TrEMBL/UniProt数据库。数据库。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr161.0版,2019

7、.08Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochow2019.08,总序列,总序列45,660,524条,最多的条,最多的20个物种如下个物种如下Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009

8、-2010, Semester 1, Soochowr 1. 提供高质量的,无冗余的,完整的序列提供高质量的,无冗余的,完整的序列信息;信息;r 2. 包括基因组的包括基因组的DNA,转录成的转录成的RNA以及蛋以及蛋白质序列信息。白质序列信息。r 3. 序列文件的标识符:序列文件的标识符:r DNA/RNA序列,序列,NM_XXXXXX;r 蛋白质序列:蛋白质序列:NP_XXXXXXBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics

9、, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 1. /sites/entrez?db=gener 2. 序列从序列从Refseq数据库中得到数据库中得到;r 3. 详尽的注释信息,包括基因在基因组的定位,基因详尽的注释信息,包括基因在基因组的定位,基因名称、蛋白质名称,基因结构,等等。名称、蛋白质名称,基因结构,等等。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-

10、2010, Semester 1, Soochowr 1. 专家审核的蛋白质序列数据与知识库;专家审核的蛋白质序列数据与知识库;r 2. UniProt Knowledgebase:Release 12.1,2019.08r 3. 包括:包括:r Swiss-Prot Release 54.1 of 21-Aug-2019: 277883 entries;r TrEMBL Release 37.1 of 21-Aug-2019: 4754787 entriesBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2

11、010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 1. DNA/RNA/氨基酸代码的标识氨基酸代码的标识r 2. GenBank数据格式数据格式r 3. UniProtr 4. FASTABioinformatics, 2009-

12、2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowDefinition: 标题标题序列长度序列长度数据类型数据类型Accession number版本号版本号GI numberBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, S

13、emester 1, SoochowAccession numberBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 某天,某天,Prof. Gene发现人的发现人的Hela细胞中,有丝分裂细胞中,有丝分裂期间有异常情况:细胞不再分裂,而是开始凋亡期间有异常情况:细胞不再分裂,

14、而是开始凋亡(表表型,型,phenotype),通过实验的方法,通过实验的方法(例如,酵母双杂例如,酵母双杂交交),发现了与有丝分裂期间某个蛋白可能相互作用,发现了与有丝分裂期间某个蛋白可能相互作用的一个基因,测序结果如下的一个基因,测序结果如下(genotype):CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAA

15、GGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGCBioinformatics, 2009-2010, Semester 1, Soochow

16、Bioinformatics, 2009-2010, Semester 1, Soochowr 1. 这是哪个基因?这是哪个基因?r 2. 编码的蛋白质序列是怎样的?编码的蛋白质序列是怎样的?r 3. 有没有保守的功能结构域有没有保守的功能结构域 (domain)?r 4. 它的功能是怎样的?它的功能是怎样的?r 5. 它在真核生物中保守吗?它在真核生物中保守吗?r 6. 有没有三级结构信息?有没有三级结构信息?Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochow

17、/Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochow输入序列输入序列Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soocho

18、wBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowUniGeneGeo: 基因表达信息基因表达信息Gene info:基因信息:基因信息Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010,

19、 Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 1. 该基因为人的该基因为人的Survivin基因,染色体定基因,染色体定位:位:17号染色体,号染色体,73721872-73733311;基;基因标识符:因标识符:NM_001168.

20、2;r 2. 初步的功能分析:细胞周期,初步的功能分析:细胞周期,caspase酶酶的抑制因子,等等。的抑制因子,等等。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinforma

21、tics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 人的人的Survivin蛋白质包含蛋白质包含142个氨基酸,序个氨基酸,序列标识符为:列标识符为:NP_001159.2Bioinformatics, 20

22、09-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soo

23、chowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr Survivin具有保守的功能结构域具有保守的功能结构域BIRBioinformatics, 2009-2010, Semest

24、er 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformat

25、ics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 1. 在瘤形成过程中可能起一定作用;在瘤形成过程中可能起一定作用;r 2. 阻碍阻碍G2/M期的细胞编程性凋亡;期的细胞编程性凋亡;r 3. Chromoso

26、mal passenger complex (CPC)的成员之一。的成员之一。r r 细胞亚定位:胞质,核。细胞亚定位:胞质,核。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioin

27、formatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Se

28、mester 1, Soochowr 人的人的Survivin在酵母中的同源物可能是在酵母中的同源物可能是BIR1。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformati

29、cs, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 如今,如今,Prof. Gene知道了:知道了:r 1. 该基因为人的该基因为人的Survivin基因,染色体定位:基因,染色体定位:17号染色体,号染色体,73721872-73733311;基因标识符:;基因标识符:NM_001168.2;r 2. 人的人的Survivin蛋白质包含蛋白质包含142个氨基酸,序列标识符为:个氨基酸,序列标

30、识符为:NP_001159.2r 3. Survivin具有保守的功能结构域具有保守的功能结构域BIRr 4. Survivin的细胞亚定位:胞质,核,其功能有:的细胞亚定位:胞质,核,其功能有:r (1) 在瘤形成过程中可能起一定作用;在瘤形成过程中可能起一定作用;r (2) 阻碍阻碍G2/M期的细胞编程性凋亡;期的细胞编程性凋亡;r (3) Chromosomal passenger complex (CPC)的成员之一。等等。的成员之一。等等。r 5. 人的人的Survivin在酵母中的同源物可能是在酵母中的同源物可能是BIR1。r 6. Survivin的三级结构已知,在的三级结构已知,在PDB中的标识符为中的标识符为1E31。Bioinformatics, 2009-2010, Semester 1, SoochowBioinformatics, 2009-2010, Semester 1, Soochowr 某天,某天,Prof. Gene在小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论