义-数据库检索-生物医学.ppt_第1页
义-数据库检索-生物医学.ppt_第2页
义-数据库检索-生物医学.ppt_第3页
义-数据库检索-生物医学.ppt_第4页
义-数据库检索-生物医学.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 数据库检索,任间 ,The CUCKOO Workgroup,NCBI数据资源,Nucleotide: 核酸序列数据库 PubMed: 生物医学科学文摘数据库 GEO:基因表达谱数据库。收集存储微阵列基因表达数据 Protein: 蛋白质序列数据库 SNP: 单核苷酸多态性数据库 Taxonomy: 物种分类学数据库 Gene: 基因数据库。提供序列及基因描述信息 Structure: 大分子三维结构数据库 3D Domains: 特定功能域的三维结构数据库 UniGene: GenBank分离的非冗余基因簇。包含已确定基因和EST。每个簇包含唯一的非冗余的基因序列、表达的组织类型和基因图谱位点。 UniSTS: 序列标签位点数据库,用于作图位点 PopSet: 人口研究数据库 Books: 在线生物医学图书数据库 OMIM: 在线人类孟德尔遗传目录数据库 Conserved Domains: 保守结构域数据库 Cancer Chromosomes: 癌症染色体数据库 Homologene: 基因同源物数据库 Journals: 杂志及出版社信息数据库 Genome: 基因组数据库,提供完成的基因组/染色体图形 GDS: GEO的基因表达实验与生物芯片数值结果数据库,Entrez,检索规则,逻辑运算符(大写): AND ,OR,NOT 运算过程由左至右,()部分优先 空格分隔默认逻辑关系为 AND 多个单词短语加双引号 模糊检索使用 * 用 限定字段,如限定基因名称为ATG1的检索 :ATG1GENE,数据库使用实例,序列数据查询实例,某天,Prof. Gene发现人的Hela细胞中,有丝分裂期间有异常情况:细胞不再分裂,而是开始凋亡(表型,phenotype),通过实验的方法(例如,酵母双杂交),发现了与有丝分裂期间某个蛋白可能相互作用的一个基因,测序结果如下(genotype):,CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC,问题一:这是哪个基因?,NCBI: BLAST,nucleotide blast,Megablast: 找基因序列,输入序列,提交序列,NM_001168.2,Gene info:基因信息,BIRC5(survivin),Gene info: 17号染色体,功能注释:Gene Ontology,结论一,1. 该基因为人的BIRC5(survivin)基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2; 2. 初步的功能分析:细胞周期,caspase酶的抑制因子,等等。,问题二:编码的蛋白质序列是怎样的?,NM_001168.2,获取蛋白质的序列信息,NP_001159.2:142aa,结论二,人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.2,问题三: 有没有保守的功能结构域 (domain)?,获取FASTA序列,FASTA格式的序列,find conserved domains,填入蛋白质的FASTA序列,BIR domain,结论三,Survivin具有保守的功能结构域BIR,问题四:它的功能是怎样的?,UniProt: 蛋白质数据库,在人中做BLAST搜索,O15392,BIRC5的蛋白质信息,功能注释,结论四:功能分析,1. 在瘤形成过程中可能起一定作用; 2. 阻碍G2/M期的细胞编程性凋亡; 3. Chromosomal passenger complex (CPC)的成员之一。 细胞亚定位:胞质,核。 ,问题五:它在真核生物中保守吗?,ExPASy Blast,在酵母中进行序列比对,酵母BIR1: P47134,酵母BIR1的信息,结论五:,人的Survivin在酵母中的同源物可能是BIR1。,问题六:有没有三级结构信息?,PDB:三级结构数据库,PDB的三级结构信息,用Jmol显示三级结构,PDB的三级结构信息,Raswin: 三级结构显示,总结,现在,Prof. Gene知道了: 1. 该基因为人的Survivin基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2; 2. 人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.2 3. Survivin具有保守的功能结构域BIR 4. Survivin的细胞亚定位:胞质,核,其功能有: (1) 在瘤形成过程中可能起一定作用; (2) 阻碍G2/M期的细胞编程性凋亡; (3) Chromosomal passenger complex (CPC)的成员之一。等等。 5. 人的Survivin在酵母中的同源物可能是BIR1。 6. Survivin的三级结构已知,在PDB中的标识符为1E31。,作业,某天,Prof. Gene在小鼠(Mus musculus)中又发现了一个与有丝分裂相关的基因,通过DNA测序,得到部分序列:,GATGAGCTGCTTATCCTACAACGAGAAGTCGGACATCTGGTCCTTGGGCTGCCTGCTGTATGAGCTGTGTGCACTAATGCCTCCCTTTACAGCTTTCAACCAAAAAGAGCTAGCTGGGAAAATCAGGGAAGGGAGGTTCAGGCGCATCCCCTACCGCTACTCTGATGGCTTGAATGACCTCATCACTCGGATGCTGAATTTAAAGGACTACCATCGACCTTCAGTGGAAGAAATTCTGGAGAGCCCTTTGATAGCAGACTTGGTTGCAGAAGAGCAAAGGAGAAATCTGGAGAGGAGAGGACGGCGCTCAGGCGAGCCTTCGAAGCTGCCGGACTCCAGCCCTGTGCTGAGCGAGCTCAAGTTGAAGGAAAGGCAACTGCAGGATCGAGAGCAAGCACTCAGAGCTCGGGAGGACATCCT,问题:,1. 这个基因在小鼠中是哪个基因?基因的标识符是什么?这个基因的在基因组上的定位是怎样的? 2. 这个基因在人中的同源物是哪一个?标识符是什么? 3. 在人中,这个基因编码的蛋白质是什么?具有什么样的功能?细胞亚定位在何处?这个基因是一个酶吗,什么酶?具有什么样的功能结构域? 4. 这个基因在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论