




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章数据库检索第二章2.1综合性数据库NCBI美国参议员ClaudePepper率先意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了在1988年11月4日建立国立生物技术信息中心的立法.(NationalCenterforBiotechnologyInformation,NCBI).
NCBI隶属于国立医学图书馆(NationalLibraryofMedicing,
NLM)。NLM在创立和维护生物医学数据库方面有丰富的经验。/2.1.1NCBI简介2.1综合性数据库NCBI美国参议员Clancbi数据库检索解读课件NCBI的任务开发新的信息技术,来帮助理解控制健康和疾病的基本分子和遗传过程1建立自动化系统用于储存和分析分子生物学,生物化学和遗传学方面的知识2为研究人员和医学团体使用这些数据库和软件提供便利3在国家和国际范围内搜集先进的生物技术信息,为分析生物重要分子的结构和功能提供先进的基于计算机的信息分析处理方案NCBI的任务开发新的信息技术,来帮助理解控制健2.1.2NCBI数据库介绍1全核苷酸数据库2蛋白质数据库3基因组数据库4结构数据库Expressionsequencetag,EST,genomesurveysequence,GSS,orenucleotide翻译DNA所得PIR,SWISS-PROTPDB已测序物种的基因组视图,染色体完整序列图,遗传图和物理图又称为分子模型数据库MMDB,包含从晶体结构和核磁共振实验中确定下来的蛋白质等大分子结构信息,主要来源于PDB,使用软件浏览结构2.1.2NCBI数据库介绍1全核苷酸数据库2蛋白质5三维结构域数据库6保守域数据库7uniSTS数据库8基因数据库包含来自Entrez结构数据库的蛋白质结构域蛋白质结构域数据库,从Pfam,SMART,COG数据库中获得数据.是一个整合的,非冗余的STS数据库可通过基因名称,同义词,编号,出版物,染色体号等属性寻找基因9UniGene数据库GenBank中基因序列的集合5三维结构域数据库6保守域数据库7uniSTS数据库810SNP数据库11PopSet用于存储包括单核苷酸替换,一两个碱基的插入或缺失等多态性信息包含用于群体进化或变异研究的比对序列12GEO数据库准确的基因表达谱数据和大规模的分子实验数据13PubMedCentral数据库14MesH
数据库15Bookshelf数据库公众医学信息中心,是NLM在生命科学领域期刊文献的数字存档医学主题词数据库生物医学方面的书箱16OMIM数据库主要着眼于可遗传或遗传性的基因疾病,包括文献,序列记录,染色体定位图谱及相关的数据库的链接10SNP数据库11PopSet用于存储包括单核苷酸替2.1.3Entrez简介是一个全局的生物医学搜索引擎,它可以检查的数据库主要包括3类:文献数据库:PubMed,PubMedCentral,Journals,Books,OMIM,OMIA.序列数据库:Nucleotide,Protein,Genome,Structure,SNP其它数据库:Taxonomy,Gene,UniGene,HomoloGene,ConservedDomains,3DDomains,UniSTS,PopSet,GEOProfiles,GEODatasets,PubChemBioAssay,PubChemCompound,PubChemSubstance,CancerChromosomes,Probe,MeSH,Journals,NLMCatalog2.1.3Entrez简介是一个全局的生物ncbi数据库检索解读课件2.1.4Entrez检索实例已知菜豆斑驳病毒(beanpodmottlevirus,BPMV)的名字,查询BPMV的基因组信息,核酸序列信息,蛋白序列信息和结构信息2.1.4Entrez检索实例已知菜豆斑驳病毒BPMVBPMVncbi数据库检索解读课件ncbi数据库检索解读课件1Genome数据库查询结果1Genome数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件2核酸数据库查询结果2核酸数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件ncbi数据库检索解读课件3蛋白质数据库查询结果3蛋白质数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件4结构数据库查询结果4结构数据库查询结果ncbi数据库检索解读课件5序列的下载5序列的下载ncbi数据库检索解读课件ncbi数据库检索解读课件ncbi数据库检索解读课件2.2综合性数据库EMBL-EBI2.2.1EBI简介EBI(欧洲生物信息学中心)全称是EuropeanBioinformaticsInstitute,是一个非盈利性的学术机构,是欧洲分子生物学实验室(EMBL,全称是EuropeanMolecularBiologyLaboratory)的一部分。它的主要任务是建立、维护和提供生物学数据库以及信息学服务,从而支持生物学数据的存放和进一步挖掘,位于德国海德尔堡,是世界上著名的生命科学研究机构。提供免费数据和生物信息学服务生物信息学研究提供生物信息学培训将技术应用于产业2.2综合性数据库EMBL-EBI2.2.1EBI简2.2.2EBI数据库简介1核酸序列数据库2UniProtKnowledgebase3大分子结构数据库与GenBankDDBJ同步通用蛋白质资源数据库,最全面的储存蛋白质信息的数据库收集并储存大分子结构信息,部分来源于PDB4Ensembl提供并及时更新后生生物的全基因组序列以及最为精确的注释.5UniProtKB\Swiss-prot是一个蛋白质信息最为准确的蛋白质数据库,它所提供的蛋白质信息有着最详尽的注释和最少的冗余..2.2.2EBI数据库简介1核酸序列数据库2UniP2.2.4SRS检索实例已知BPMV的名字,查询其基因组的信息,核酸序列信息,蛋白质序列信息和结构信息2.2.4SRS检索实例已知BPMV的名字,查SRS系统每次只能查询一个数据库SRS系统每次只能查询一个数据库Genome数据库查询结果Genome数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件
数据库格式简介历史原因:没有完全统一的数据库格式;了解所用数据库格式的重要性一般由两部分组成:文字注释内容(序列,……)数据库格式简介
EMBL和GenBank数据库的主要内容和格式
序列名称、长度、日期序列说明、编号、版本号物种来源、学名、分类学位置相关文献作者、题目、刊物、日期序列特征表碱基组成序列(每行60个碱基)
GenBank采用GBFF格式
实例:
E.colik-12全基因组序列文件例子:EMBL和GenBank数据库的格式实例:E.colik-12全基因组序列文件例子:EMB描述符描述符ncbi数据库检索解读课件长度长度生物分子类型生物分子类型形状形状分类码分类码数据第一次被公开的日期数据第一次被公开的日期简单的描述简单的描述检索号检索号版本号,序列改变,版本加1版本号,序列改变,版本加1Geninfoidentifier基因信息号Geninfoidentifier基因信息号ncbi数据库检索解读课件序列来源的生物名称序列来源的生物名称ncbi数据库检索解读课件参考文献参考文献作者及参考文献题目作者及参考文献题目期刊,及发表年份,卷及期、页码期刊,及发表年份,卷及期、页码ncbi数据库检索解读课件评注评注特征表特征表关键字关键字BASECOUNT??A??C??G??TORIGIN1agcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtc61tgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgacttagg121tcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtac181acaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattaccacaggt241aacggtgcgggctgacgcgtacaggaaacacagaaaaaagcccgcacctgacagtgcggg301ctttttttttcgaccaaaggtaacgaggtaacaaccatgcgagtgttgaagttcggcggt361acatcagtggcaaatgcagaacgttttctgcgtgttgccgatattctggaaagcaatgcc421aggcaggggcaggtggccaccgtcctctctgcccccgccaaaatcaccaaccacctggtg……4639021caacatcaactgcaagctttacgcgaacgagccatgacattgctgacgactctggcagtg4639081gcagatgacataaaactggtcgactggttacaacaacgcctggggcttttagagcaacga4639141gacacggcaatgttgcaccgtttgctgcatgatattgaaaaaaatatcaccaaataaaaa4639201acgccttagtaagtatttttc//序列部分BASECOUNT??A??C??G??T序EMBL标识字GenBank标识字含义IDLOCUS序列名称DEDEFINITION序列简单说明ACACCESSION唯一的序列编号SVVERSION序列版本号KWKEYWORDS与序列相关的关键词OSSOURCE序列来源的物种名OCORGANISM序列来源的物种学名和分类学位置DT建立日期RNREFERENCE相关文献编号或提交注册信息RAAUTHORS相关文献作者或提交序列作者RTTITLE相关文献题目RLJOURNAL相关文献刊物名或作者单位RXMEDLINE相关文献Medline引文代码RCREMARK相关文献注释RP相关文献其它注释CCCOMMENT关于序列的注释信息DR相关数据库交叉引用号FHFEATURES序列特征表起始FT序列特征表子项SQBASECONTENT序列长度、碱基数目统计数空格ORIGIN序列////序列结束标志、空行EMBL和GenBank数据库的行识别标志比较EMBL标识字GenBank标识字含义IDLOCUS序列名称IDU00096standard;circulargenomicDNA;CON;4639221BP.ACU00096;SVU00096.1DT24-JUL-2003(Rel.76,Lastupdated,Version3)DEEscherichiacoliK-12MG1655completegenome.KW.OSEscherichiacoliK12OCBacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;OCEnterobacteriaceae;Escherichia;Escherichiacoli.RN[1]RP1-4639221RXMEDLINE;97426617.RXPUBMED;9278503.RABlattnerF.R.,PlunkettG.III,BlochC.A.,PernaN.T.,BurlandV.,…RT"ThecompletegenomesequenceofEscherichiacoliK-12";RLScience277(5331):1453-1474(1997).DRGOA;O32528.DRREMTREMBL;AAC74436;AAC74436.DRSPTREMBL;O32530;O32530.DRSWISS-PROT;O32528;YPDI_ECOLI.…IDU00096standard;circCCThissequencewasdeterminedbytheE.coliGenomeProjectattheCCUniversityofWisconsin-Madison(FrederickR.Blattner,director).CCSupportedbyNIHgrantsHG00301andHG01428(fromtheHumanGenomeCCProjectandNCHGR).TheentiresequencewasindependentlyCCdeterminedfromE.coliK-12strainMG1655.PredictedopenreadingCCframesweredeterminedusingGeneMarksoftware,kindlysuppliedby…FHKeyLocation/QualifiersFTsource1..4639221FT/db_xref="taxon:83333"FT/mol_type="genomicDNA"FT/organism="EscherichiacoliK12"FT/strain="K12"FT/sub_strain="MG1655"FTpromoter71..99FT/note="factorSigma70;predicted+1startat106"…FTCDS190..255FT/codon_start=1FT/db_xref="GOA:P03059"FT/db_xref="SWISS-PROT:P03059"FT/note="o21;100pctidenticaltoLPT_ECOLISW:P03059"FT/transl_table=11FT/gene="thrL"FT/function="leader;Aminoacidbiosynthesis:Threonine"FT/product="throperonleaderpeptide"FT/protein_id="AAC73112.1"FT/translation="MKRISTTITTTITITTGNGAG“…CCThissequencewasdetermiSQSequence4639221BP;1142136A;1179433C;1176775G;1140877T;0other;agcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtc60tgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgacttagg120tcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtac180acaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattaccacaggt240aacggtgcgggctgacgcgtacaggaaacacagaaaaaagcccgcacctgacagtgcggg300ctttttttttcgaccaaaggtaacgaggtaacaaccatgcgagtgttgaagttcggcggt360acatcagtggcaaatgcagaacgttttctgcgtgttgccgatattctggaaagcaatgcc420aggcaggggcaggtggccaccgtcctctctgcccccgccaaaatcaccaaccacctggtg480gcgatgattgaaaaaaccattagcggccaggatgctttacccaatatcagcgatgccgaa540…tattgctatcaattagcaacattaatacaacaaccggcgaaaagtgatgcaacggcagac4639020caacatcaactgcaagctttacgcgaacgagccatgacattgctgacgactctggcagtg4639080gcagatgacataaaactggtcgactggttacaacaacgcctggggcttttagagcaacga4639140gacacggcaatgttgcaccgtttgctgcatgatattgaaaaaaatatcaccaaataaaaa4639200acgccttagtaagtatttttc4639221//SQSequence4639221BP;1142PubMed概述PubMed是美国国家医学图书馆(NLM)所属的国家生物技术信息中心(NCBI)开发的因特网生物医学信息检索系统,位于美国国立卫生研究院(NIH)的平台上。PubMed覆盖了全世界70多个国家4300多种主要生物医学期刊的摘要和部分全文。其覆盖的时间段也非常长,早的可以追溯到20世纪60年代,通常而言,这已经足够早了,很少有人会需要查阅在此之前的文献。当然,研究生物医学史的工作者可能是个例外。而最新的文献几乎就在此时此刻。PubMed概述PubMed是美国国家医学图与PubMed挂钩的出版商会自动向PubMed提供最新的文献摘要,而往往在这个时候文献还没有正式出版。所以尽管生物医学的文章从被期刊接受到出版往往要好几个月的时间,但借助于PubMed,我们仍旧可以随时掌握最新的动向,从而大大有利于自己的临床和研究工作。还有些出版商通过PubMed提供文献的全文,有时甚至是免费的,这样,我们就可以在PubMed上真正享受"坐拥书城"的感觉了
与PubMed挂钩的出版商会自动向Puncbi数据库检索解读课件PubMedcomprisesmorethan23millioncitationsforbiomedicalliteraturefromMEDLINE,lifesciencejournals,andonlinebooks.Citationsmayincludelinkstofull-textcontentfromPubMedCentralandpublisherwebsites.PubMedcomprisesmorethancbi数据库检索解读课件"维生素C对于普通感冒的防治作用"维生素C对于普通感冒的防治作用ncbi数据库检索解读课件ncbi数据库检索解读课件ncbi数据库检索解读课件ncbi数据库检索解读课件课后练习1.用PDB数据库搜索SARS病毒2OP9蛋白质的结构并保存课后练习1.用PDB数据库搜索SARS病毒2OP9蛋白质的结第二章数据库检索第二章2.1综合性数据库NCBI美国参议员ClaudePepper率先意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了在1988年11月4日建立国立生物技术信息中心的立法.(NationalCenterforBiotechnologyInformation,NCBI).
NCBI隶属于国立医学图书馆(NationalLibraryofMedicing,
NLM)。NLM在创立和维护生物医学数据库方面有丰富的经验。/2.1.1NCBI简介2.1综合性数据库NCBI美国参议员Clancbi数据库检索解读课件NCBI的任务开发新的信息技术,来帮助理解控制健康和疾病的基本分子和遗传过程1建立自动化系统用于储存和分析分子生物学,生物化学和遗传学方面的知识2为研究人员和医学团体使用这些数据库和软件提供便利3在国家和国际范围内搜集先进的生物技术信息,为分析生物重要分子的结构和功能提供先进的基于计算机的信息分析处理方案NCBI的任务开发新的信息技术,来帮助理解控制健2.1.2NCBI数据库介绍1全核苷酸数据库2蛋白质数据库3基因组数据库4结构数据库Expressionsequencetag,EST,genomesurveysequence,GSS,orenucleotide翻译DNA所得PIR,SWISS-PROTPDB已测序物种的基因组视图,染色体完整序列图,遗传图和物理图又称为分子模型数据库MMDB,包含从晶体结构和核磁共振实验中确定下来的蛋白质等大分子结构信息,主要来源于PDB,使用软件浏览结构2.1.2NCBI数据库介绍1全核苷酸数据库2蛋白质5三维结构域数据库6保守域数据库7uniSTS数据库8基因数据库包含来自Entrez结构数据库的蛋白质结构域蛋白质结构域数据库,从Pfam,SMART,COG数据库中获得数据.是一个整合的,非冗余的STS数据库可通过基因名称,同义词,编号,出版物,染色体号等属性寻找基因9UniGene数据库GenBank中基因序列的集合5三维结构域数据库6保守域数据库7uniSTS数据库810SNP数据库11PopSet用于存储包括单核苷酸替换,一两个碱基的插入或缺失等多态性信息包含用于群体进化或变异研究的比对序列12GEO数据库准确的基因表达谱数据和大规模的分子实验数据13PubMedCentral数据库14MesH
数据库15Bookshelf数据库公众医学信息中心,是NLM在生命科学领域期刊文献的数字存档医学主题词数据库生物医学方面的书箱16OMIM数据库主要着眼于可遗传或遗传性的基因疾病,包括文献,序列记录,染色体定位图谱及相关的数据库的链接10SNP数据库11PopSet用于存储包括单核苷酸替2.1.3Entrez简介是一个全局的生物医学搜索引擎,它可以检查的数据库主要包括3类:文献数据库:PubMed,PubMedCentral,Journals,Books,OMIM,OMIA.序列数据库:Nucleotide,Protein,Genome,Structure,SNP其它数据库:Taxonomy,Gene,UniGene,HomoloGene,ConservedDomains,3DDomains,UniSTS,PopSet,GEOProfiles,GEODatasets,PubChemBioAssay,PubChemCompound,PubChemSubstance,CancerChromosomes,Probe,MeSH,Journals,NLMCatalog2.1.3Entrez简介是一个全局的生物ncbi数据库检索解读课件2.1.4Entrez检索实例已知菜豆斑驳病毒(beanpodmottlevirus,BPMV)的名字,查询BPMV的基因组信息,核酸序列信息,蛋白序列信息和结构信息2.1.4Entrez检索实例已知菜豆斑驳病毒BPMVBPMVncbi数据库检索解读课件ncbi数据库检索解读课件1Genome数据库查询结果1Genome数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件2核酸数据库查询结果2核酸数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件ncbi数据库检索解读课件3蛋白质数据库查询结果3蛋白质数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件4结构数据库查询结果4结构数据库查询结果ncbi数据库检索解读课件5序列的下载5序列的下载ncbi数据库检索解读课件ncbi数据库检索解读课件ncbi数据库检索解读课件2.2综合性数据库EMBL-EBI2.2.1EBI简介EBI(欧洲生物信息学中心)全称是EuropeanBioinformaticsInstitute,是一个非盈利性的学术机构,是欧洲分子生物学实验室(EMBL,全称是EuropeanMolecularBiologyLaboratory)的一部分。它的主要任务是建立、维护和提供生物学数据库以及信息学服务,从而支持生物学数据的存放和进一步挖掘,位于德国海德尔堡,是世界上著名的生命科学研究机构。提供免费数据和生物信息学服务生物信息学研究提供生物信息学培训将技术应用于产业2.2综合性数据库EMBL-EBI2.2.1EBI简2.2.2EBI数据库简介1核酸序列数据库2UniProtKnowledgebase3大分子结构数据库与GenBankDDBJ同步通用蛋白质资源数据库,最全面的储存蛋白质信息的数据库收集并储存大分子结构信息,部分来源于PDB4Ensembl提供并及时更新后生生物的全基因组序列以及最为精确的注释.5UniProtKB\Swiss-prot是一个蛋白质信息最为准确的蛋白质数据库,它所提供的蛋白质信息有着最详尽的注释和最少的冗余..2.2.2EBI数据库简介1核酸序列数据库2UniP2.2.4SRS检索实例已知BPMV的名字,查询其基因组的信息,核酸序列信息,蛋白质序列信息和结构信息2.2.4SRS检索实例已知BPMV的名字,查SRS系统每次只能查询一个数据库SRS系统每次只能查询一个数据库Genome数据库查询结果Genome数据库查询结果ncbi数据库检索解读课件ncbi数据库检索解读课件
数据库格式简介历史原因:没有完全统一的数据库格式;了解所用数据库格式的重要性一般由两部分组成:文字注释内容(序列,……)数据库格式简介
EMBL和GenBank数据库的主要内容和格式
序列名称、长度、日期序列说明、编号、版本号物种来源、学名、分类学位置相关文献作者、题目、刊物、日期序列特征表碱基组成序列(每行60个碱基)
GenBank采用GBFF格式
实例:
E.colik-12全基因组序列文件例子:EMBL和GenBank数据库的格式实例:E.colik-12全基因组序列文件例子:EMB描述符描述符ncbi数据库检索解读课件长度长度生物分子类型生物分子类型形状形状分类码分类码数据第一次被公开的日期数据第一次被公开的日期简单的描述简单的描述检索号检索号版本号,序列改变,版本加1版本号,序列改变,版本加1Geninfoidentifier基因信息号Geninfoidentifier基因信息号ncbi数据库检索解读课件序列来源的生物名称序列来源的生物名称ncbi数据库检索解读课件参考文献参考文献作者及参考文献题目作者及参考文献题目期刊,及发表年份,卷及期、页码期刊,及发表年份,卷及期、页码ncbi数据库检索解读课件评注评注特征表特征表关键字关键字BASECOUNT??A??C??G??TORIGIN1agcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtc61tgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgacttagg121tcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtac181acaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattaccacaggt241aacggtgcgggctgacgcgtacaggaaacacagaaaaaagcccgcacctgacagtgcggg301ctttttttttcgaccaaaggtaacgaggtaacaaccatgcgagtgttgaagttcggcggt361acatcagtggcaaatgcagaacgttttctgcgtgttgccgatattctggaaagcaatgcc421aggcaggggcaggtggccaccgtcctctctgcccccgccaaaatcaccaaccacctggtg……4639021caacatcaactgcaagctttacgcgaacgagccatgacattgctgacgactctggcagtg4639081gcagatgacataaaactggtcgactggttacaacaacgcctggggcttttagagcaacga4639141gacacggcaatgttgcaccgtttgctgcatgatattgaaaaaaatatcaccaaataaaaa4639201acgccttagtaagtatttttc//序列部分BASECOUNT??A??C??G??T序EMBL标识字GenBank标识字含义IDLOCUS序列名称DEDEFINITION序列简单说明ACACCESSION唯一的序列编号SVVERSION序列版本号KWKEYWORDS与序列相关的关键词OSSOURCE序列来源的物种名OCORGANISM序列来源的物种学名和分类学位置DT建立日期RNREFERENCE相关文献编号或提交注册信息RAAUTHORS相关文献作者或提交序列作者RTTITLE相关文献题目RLJOURNAL相关文献刊物名或作者单位RXMEDLINE相关文献Medline引文代码RCREMARK相关文献注释RP相关文献其它注释CCCOMMENT关于序列的注释信息DR相关数据库交叉引用号FHFEATURES序列特征表起始FT序列特征表子项SQBASECONTENT序列长度、碱基数目统计数空格ORIGIN序列////序列结束标志、空行EMBL和GenBank数据库的行识别标志比较EMBL标识字GenBank标识字含义IDLOCUS序列名称IDU00096standard;circulargenomicDNA;CON;4639221BP.ACU00096;SVU00096.1DT24-JUL-2003(Rel.76,Lastupdated,Version3)DEEscherichiacoliK-12MG1655completegenome.KW.OSEscherichiacoliK12OCBacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;OCEnterobacteriaceae;Escherichia;Escherichiacoli.RN[1]RP1-4639221RXMEDLINE;97426617.RXPUBMED;9278503.RABlattnerF.R.,PlunkettG.III,BlochC.A.,PernaN.T.,BurlandV.,…RT"ThecompletegenomesequenceofEscherichiacoliK-12";RLScience277(5331):1453-1474(1997).DRGOA;O32528.DRREMTREMBL;AAC74436;AAC74436.DRSPTREMBL;O32530;O32530.DRSWISS-PROT;O32528;YPDI_ECOLI.…IDU00096standard;circCCThissequencewasdeterminedbytheE.coliGenomeProjectattheCCUniversityofWisconsin-Madison(FrederickR.Blattner,director).CCSupportedbyNIHgrantsHG00301andHG01428(fromtheHumanGenomeCCProjectandNCHGR).TheentiresequencewasindependentlyCCdeterminedfromE.coliK-12strainMG1655.PredictedopenreadingCCframesweredeterminedusingGeneMarksoftware,kindlysuppliedby…FHKeyLocation/QualifiersFTsource1..4639221FT/db_xref="taxon:83333"FT/mol_type="genomicDNA"FT/organism="EscherichiacoliK12"FT/strain="K12"FT/sub_strain="MG1655"FTpromoter71..99FT/note="factorSigma70;predicted+1startat106"…FTCDS190..255FT/codon_start=1FT/db_xref="GOA:P03059"FT/db_xref="SWISS-PROT:P03059"FT/note="o21;100pctidenticaltoLPT_ECOLISW:P03059"FT/transl_table=11FT/gene="thrL"FT/function="leader;Aminoacidbiosynthesis:Threonine"FT/product="throperonleaderpeptide"FT/protein_id="AAC73112.1"FT/translation="MKRISTTITTTITITTGNGAG“…CCThissequencewasdetermiSQSequence4639221BP;1142136A;1179433C;1176775G;1140877T;0other;agcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtc60tgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgacttagg120tcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtac180acaacatccatgaaacgcattagcaccaccattaccaccaccatcaccat
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 征占用林地采伐施工方案
- 智能制造项目可行性研究报告范文
- 旅客安全感知与行为研究-全面剖析
- 代码安全与漏洞挖掘-全面剖析
- 秋岭南版艺术教育年度计划
- 剧本分析与拍摄技术-全面剖析
- 复选框交互一致性研究-全面剖析
- 仙游遮阳网施工方案
- 施工项目成本控制总结与后续计划
- 山地景观规划实习总结范文
- 2025年辽宁生态工程职业学院单招职业技能考试题库及答案1套
- 留置导尿管常见问题及相关的护理措施课件
- 电工技能进阶教程:2024年让你从初级到高级飞跃
- 中国威海房地产行业市场前景预测及投资价值评估分析报告
- JJF 2207-2025医用空气系统校准规范
- 语文-湖南省长郡二十校联盟2025届新高考教学教研联盟高三第一次联考(长郡二十校一联)试题和答案
- 2025年康复科多学科协作计划
- 医学临床“三基”训练护士分册(第五版)考试题(附答案)
- 数据结构:第2章-线性表
- 《焊接知识培训》课件
- 安全生产风险防控“六项机制”做法及经验分享
评论
0/150
提交评论