




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
提纲核酸数据库核酸序列数据库检索入口核酸序列数据库序列检索ENTREZ的使用本文档共105页;当前第1页;编辑于星期三\10点14分分子生物学数据库的应用可以分为两个主要方面数据库查询(databasequery)数据库搜索(databasesearch)。本文档共105页;当前第2页;编辑于星期三\10点14分数据库查询定义:是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。如:在蛋白质序列数据库SwissProt中输入关键词insulin(胰岛素),即可找出该数据库所有胰岛素或与胰岛素有关的序列条目(Entry)本文档共105页;当前第3页;编辑于星期三\10点14分数据库检索它和互联网上通过搜索引擎(Searchengine)查找需要的信息是一个概念。是数据库查询的一种本文档共105页;当前第4页;编辑于星期三\10点14分数据库搜索定义:在分子生物信息学中有特定含义,它是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。通过数据库搜索,可以在序列数据库中找出与该检测序列(querysequence)具有一定相似性的序列。本文档共105页;当前第5页;编辑于星期三\10点14分数据库查询、检索和搜索在生物信息学中,数据库搜索是专门针对核酸和蛋白质序列数据库而言,搜索的对象,不是数据库的注释信息,而是序列信息数据库查询和数据库搜索在生物信息学中是两个完全不同的概念,所要解决的问题、所采用的方法和得到的结果均不相同本文档共105页;当前第6页;编辑于星期三\10点14分核酸数据库序列查询系统GenBank
查询检索通过因特网上的序列查询系统(Entrez)服务完成。NCBI的网址是:http://EMBL核酸序列数据库
查询检索通过因特网上的序列提取系统(SRS)服务完成。
数据库网址是:http:///。
SRS的网址是:http:///。DDBJ数据库
使用主页上提供的SRS工具进行数据检索和序列分析,DDBJ的网址是:http:///。本文档共105页;当前第7页;编辑于星期三\10点14分序列数据库检索EMBL:(SequenceRetrievalSystem,SRS)NCBI:(Entrez)是NCBI为用户提供整合的访问序列、定位、分类、和结构数据的搜索和检索系统。本文档共105页;当前第8页;编辑于星期三\10点14分本文档共105页;当前第9页;编辑于星期三\10点14分NCBI本文档共105页;当前第10页;编辑于星期三\10点14分本文档共105页;当前第11页;编辑于星期三\10点14分GenBank本文档共105页;当前第12页;编辑于星期三\10点14分NCBI网站网址:本文档共105页;当前第13页;编辑于星期三\10点14分GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。GenBank数据库的数据来源有三种:1、直接来源于测序工作者提交的序列;2、与其它数据机构协作交换的数据;3、美国专利局提供的专利数据。简介本文档共105页;当前第14页;编辑于星期三\10点14分检索界面简介1、基本检索界面本文档共105页;当前第15页;编辑于星期三\10点14分本文档共105页;当前第16页;编辑于星期三\10点14分本文档共105页;当前第17页;编辑于星期三\10点14分Nucleotide数据库分为三个子数据库:EST:表达序列标记数据库GSS:基因组测序序列数据库CoreNucleotide:包含所有未被以上两个子数据库收录的核苷酸序列本文档共105页;当前第18页;编辑于星期三\10点14分检索界面简介1、基本检索界面2、跨库检索界面本文档共105页;当前第19页;编辑于星期三\10点14分本文档共105页;当前第20页;编辑于星期三\10点14分本文档共105页;当前第21页;编辑于星期三\10点14分简介检索界面基本检索功能(一)字段限制检索、强制短语检索(二)特殊标志符检索(四)范围检索(三)序列长度检索本文档共105页;当前第22页;编辑于星期三\10点14分简介检索界面基本检索功能(一)字段限制检索、强制短语检索本文档共105页;当前第23页;编辑于星期三\10点14分本文档共105页;当前第24页;编辑于星期三\10点14分本文档共105页;当前第25页;编辑于星期三\10点14分ras本文档共105页;当前第26页;编辑于星期三\10点14分本文档共105页;当前第27页;编辑于星期三\10点14分ras[GENE]本文档共105页;当前第28页;编辑于星期三\10点14分本文档共105页;当前第29页;编辑于星期三\10点14分本文档共105页;当前第30页;编辑于星期三\10点14分本文档共105页;当前第31页;编辑于星期三\10点14分检索限定词:1、基因名称的检索限定词:[GENE]or[GENENAME]2、生物体名称的检索限定词:[ORGN]or[ORGANISM]3、作者姓名的检索限定词:[AUTH]or[AUTHOR]本文档共105页;当前第32页;编辑于星期三\10点14分简介检索界面基本检索功能(二)特殊标志符检索(一)字段限制检索、强制短语检索本文档共105页;当前第33页;编辑于星期三\10点14分特殊标志符的格式(核酸序列)
:1、序列辨认号(GI):一串阿拉伯数字
e.g.:19440733本文档共105页;当前第34页;编辑于星期三\10点14分本文档共105页;当前第35页;编辑于星期三\10点14分特殊标志符的格式(核酸序列)
:2、GenBank/EMBL/DDBJ序列接受号:
(1)1个字母+5个阿拉伯数字
e.g.:U12345(2)2个字母+6个阿拉伯数字
e.g.:AY123456,Af1234561、序列辨认号(GI):一串阿拉伯数字
e.g.:19440733本文档共105页;当前第36页;编辑于星期三\10点14分本文档共105页;当前第37页;编辑于星期三\10点14分(1)mRNA记录(NM_*):e.g.:NM_000492(2)基因组的DNA重叠群(NT_*):e.g.:NT_000347(3)完整的基因组或染色体(NC_*):e.g.:NC_000907(4)基因组的局部区域(NG_*):e.g.:NG_000019(5)从人类基因组注释、加工得到的序列模型(XM,XP,orXR_*):
e.g.:XM_000483特殊标志符的格式(核酸序列):3、RefSeq(ReferenceSequence)序列接受号:本文档共105页;当前第38页;编辑于星期三\10点14分本文档共105页;当前第39页;编辑于星期三\10点14分特殊标志符的格式(核酸序列):4、PDB序列接受号:1个阿拉伯数字+3个字母
e.g.:1TUP序列接受号的检索限定词为[ACCN]or[ACCESSION]本文档共105页;当前第40页;编辑于星期三\10点14分简介检索界面基本检索功能(一)字段限制检索、强制短语检索(二)特殊标志符检索(三)序列长度检索本文档共105页;当前第41页;编辑于星期三\10点14分序列长度的检索限定词:[SLEN]1510[SLEN]本文档共105页;当前第42页;编辑于星期三\10点14分本文档共105页;当前第43页;编辑于星期三\10点14分简介检索界面基本检索功能(一)字段限制检索、强制短语检索(二)特殊标志符检索(四)范围检索(三)序列长度检索本文档共105页;当前第44页;编辑于星期三\10点14分范围检索:中间用冒号连接1、序列接受号范围检索:
AF114696:AF114714[ACCN]2、序列长度范围检索:
3000:4000[SLEN]3、日期范围检索:
2005/01:2006/09/26[MDAT]or[PDAT]本文档共105页;当前第45页;编辑于星期三\10点14分简介检索界面基本检索功能特征栏辅助检索限制检索(Limits)索引检索(Preview/Index)检索史管理(History)剪贴板管理(Clipboard)详细匹配过程(Details)本文档共105页;当前第46页;编辑于星期三\10点14分本文档共105页;当前第47页;编辑于星期三\10点14分本文档共105页;当前第48页;编辑于星期三\10点14分限制检索检索史管理预检索/索引检索剪贴板管理详细匹配过程本文档共105页;当前第49页;编辑于星期三\10点14分本文档共105页;当前第50页;编辑于星期三\10点14分限制检索包含其余四种检索本文档共105页;当前第51页;编辑于星期三\10点14分本文档共105页;当前第52页;编辑于星期三\10点14分简介检索界面基本检索功能特征栏辅助检索限制检索(Limits)本文档共105页;当前第53页;编辑于星期三\10点14分本文档共105页;当前第54页;编辑于星期三\10点14分限制检索范围本文档共105页;当前第55页;编辑于星期三\10点14分限制检索范围本文档共105页;当前第56页;编辑于星期三\10点14分排除某种类型的序列限制分子类型本文档共105页;当前第57页;编辑于星期三\10点14分限制分子类型本文档共105页;当前第58页;编辑于星期三\10点14分
限制基因位点本文档共105页;当前第59页;编辑于星期三\10点14分
限制基因位点本文档共105页;当前第60页;编辑于星期三\10点14分限制序列片段的显示本文档共105页;当前第61页;编辑于星期三\10点14分限制序列片段的显示本文档共105页;当前第62页;编辑于星期三\10点14分限制数据来源本文档共105页;当前第63页;编辑于星期三\10点14分限制数据来源本文档共105页;当前第64页;编辑于星期三\10点14分限制数据发布日期本文档共105页;当前第65页;编辑于星期三\10点14分限制数据发布日期本文档共105页;当前第66页;编辑于星期三\10点14分限制数据修订日期本文档共105页;当前第67页;编辑于星期三\10点14分限制数据修订日期本文档共105页;当前第68页;编辑于星期三\10点14分简介检索界面基本检索功能特征栏辅助检索限制检索(Limits)索引检索(Preview/Index)本文档共105页;当前第69页;编辑于星期三\10点14分本文档共105页;当前第70页;编辑于星期三\10点14分本文档共105页;当前第71页;编辑于星期三\10点14分索引检索输入框本文档共105页;当前第72页;编辑于星期三\10点14分本文档共105页;当前第73页;编辑于星期三\10点14分本文档共105页;当前第74页;编辑于星期三\10点14分本文档共105页;当前第75页;编辑于星期三\10点14分序列特性关键词索引本文档共105页;当前第76页;编辑于星期三\10点14分本文档共105页;当前第77页;编辑于星期三\10点14分简介检索界面基本检索功能特征栏辅助检索限制检索(Limits)索引检索(Preview/Index)检索史管理(History)本文档共105页;当前第78页;编辑于星期三\10点14分本文档共105页;当前第79页;编辑于星期三\10点14分简介检索界面基本检索功能特征栏辅助检索限制检索(Limits)索引检索(Preview/Index)检索史管理(History)剪贴板管理(Clipboard)本文档共105页;当前第80页;编辑于星期三\10点14分本文档共105页;当前第81页;编辑于星期三\10点14分本文档共105页;当前第82页;编辑于星期三\10点14分本文档共105页;当前第83页;编辑于星期三\10点14分简介检索界面基本检索功能特征栏辅助检索限制检索(Limits)预检索/索引检索(Preview/Index)检索史管理(History)详细匹配过程(Details)剪贴板管理(Clipboard)本文档共105页;当前第84页;编辑于星期三\10点14分本文档共105页;当前第85页;编辑于星期三\10点14分本文档共105页;当前第86页;编辑于星期三\10点14分简介检索入口基本检索功能特征栏辅助检索检索结果的显示本文档共105页;当前第87页;编辑于星期三\10点14分本文档共105页;当前第88页;编辑于星期三\10点14分本文档共105页;当前第89页;编辑于星期三\10点14分本文档共105页;当前第90页;编辑于星期三\10点14分本文档共105页;当前第91页;编辑于星期三\10点14分GenBank记录中特性表中的主要关键词:关键词解释关键词解释misc_feature生物学特性无法用特性表关键词描述的序列promoter转录起始区misc_difference序列特性无法用特性表关键词描述的序列CAAT_signal真核启动子上游的CAAT盒,与RNA结合相关conflict同一序列在不同的研究中在位点或区域上有差异TATA_signal真核启动子的TATA盒unsure序列不能确定的区域-35_signal原核启动子中的-35框old_sequence该序列对以前的版本做过修订-10_signal原核启动子的Pribow盒variation包含稳定突变的序列GC_signal真核启动子的GC盒modified_base修饰过的核苷酸RBS核糖体结合位点gene已识别为基因或已命名的序列区域polyA_signalRNA转录本的剪切识别位点misc_signal无法用信号特性关键词描述的信号序列enhancer增强子本文档共105页;当前第92页;编辑于星期三\10点14分关键词解释关键词解释attenuator与转录终止有关的序列CDS蛋白质编码序列terminator转录终止序列sig_peptide编码信号肽的序列rep_origin双链DNA复制起始区transit_peptide转运蛋白编码序列misc_RNA无法用RNA关键词描述的转录物或RNA产物mat_peptide编码成熟肽的序列prim_transcript初始转录本intron内含子precursor_RNA前体RNApolyA_siteRNA转录本的多聚腺苷酸化位点mRNA信使RNArRNA核糖体RNA5’clip前体转录本中被剪切掉的5’端序列tRNA转运RNA3’clip前体转录本中被剪切掉的3’端序列scRNA小细胞质RNA5’UTR5’非翻译区snRNA小核RNA3’UTRexon3’非翻译区外显子snoRNA加工和修饰rRNA的小核RNA本文档共105页;当前第93页;编辑于星期三\10点14分关键词解释关键词解释immunoglobulin_relatedrepeat_unit单个的重复元件C_region免疫相关蛋白上的不变区LTR长末端重复序列D_segment免疫球蛋白重链的可变区,T细胞受体β链Satellite卫星重复序列J_segment免疫球蛋白重链、轻链以及T细胞α、β、γ的结合链misc_binding无法描述的核酸序列结合位点N_region插入重排免疫球蛋白片段间的核苷酸primer_bind复制、转录的引物结合位点S_region免疫球蛋白重链的开关区protein_bind蛋白质结合区V_region编码免疫球蛋白的可变区N末端的序列STS测序标签位点V_segment编码免疫球蛋白的可变区的序列misc_recomb无法用重组特性关键词描述的重组事件repeat_region基因组中所包含的重复序列iDNA通过重组所消除的DNA本文档共105页;当前第94页;编辑于星期三\10点14分关键词解释关键词解释misc_structure无法用结构关键词描述的核酸序列高级结构或构型stem_loop发夹结构D_loop线粒体中DNA中的取代环GenBank记录中特性表中的限定词:限定词含义限定词含义/allele=给定基因的等位基因/codon_start=相对于序列第一个碱基,编码序列密码子的偏移量/bound_moiety=嵌合范围/country=DNA样本的来源国/cell_type=获得序列的细胞类型/db_xref=其他数据库信息的交叉索引号/citation=已被引用的参考文献数/direction=DNA复制方向/clone_lib=获得序列的克隆文库/environmental_sample=序列直接从环境材料中获得而没有指明来源物种本文档共105页;当前第95页;编辑于星期三\10点14分限定词含义限定词含义/exception=指明DNA序列未按通常的生物学规律翻译,如RNA编辑/PCR_conditi-ons=描述PCR的反应条件/frequency=在种群中发生变异的频率/pop_variant=获得序列的群体变异种名称/germline如果序列是DNA并来源于免疫球蛋白家族,则表示该序列来源于未重排DNA/product=序列编码产物的名称/insertion_seq=序列来源于某种插入元件/anticodon=tRNA反义密码子的位置及它所编码的氨基酸/isolate=序列来源的生物个体/cell_line=获得序列的细胞系/lab_host=为扩增序列来源物种所用的实验室宿主/chromosome=获得序列的染色体/macronuclear指明DNA来源于染色体分化的大核期/clone=获得序列的克隆子/note=评论及附加信息/codon=指出与参考密码子不同的密码子/organelle=获得序列的细胞器/EC_number=序列产物的酶学编号本文档共105页;当前第96页;编辑于星期三\10点14分限定词含义限定词含义/cons_splice=区分内含子剪切位点和“5‘-GT.AG-3'”剪切位点/map=相关特性在基因图谱上的位置/cultivar=所获序列植物的栽培变种/mod_base=被修饰碱基的简写/dev_stage=序列来源于某种生物的特定发育阶段/number=从5’→3’注明遗传元件的顺序/evidence=序列特性来源于实验还是推理/organism=提供测序用遗传物质的物种的科学名称/focus指出在记录中的来源特性在其他物种中还有不同的来源特性/phenotype=序列特性所导致的表型/function=序列所代表的功能/plasmid=获得序列的质粒名称/haplotype=序列来源于某种物种的单倍体/protein_id=蛋白质的检索号/isolation_sou-rce=描述序列来源物种的生理、环境和地理信息/proviral整合在基因组中的前病毒/label=序列特性的俗名/rearranged如果序列是DNA并来源于免疫球蛋白家族,则表示该序列来源于重排DNA本文档共105页;当前第97页;编辑于星期三\10点14分限定词含义限定词含义/rpt_family=重复序列/transposon=转座子/rpt_unit=指明重复区域的重复元件构成/variety=获得序列的生物变种/serotype=同一物种的不同血清学特征/pseudo假基因/sex=获得序列的物种性别/replace=表明特性间的间隔序列已被替换/specimen_vou-cher=指明来源物种保存于什么地方/rpt_type=重复序列的组织方式/strain=获得序列的菌珠/sequenced_m-ol=获得序列的分子类型/sub_species=获得序列的来源物种的亚种/serovar=同一原核生物的血清学特征/tissue_lib=获得序列组织库/specific_host=获得序列的天然宿主/transgenic指明物种的来源特性是否是转基因受体/standard-name=特性的通用名称/transl_except=标明序列中未按指定密码子表翻译的氨基酸的位置/sub_clone=获
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江鸭2025版高考生物二轮复习第4讲细胞呼吸和光合作用练习含解析
- 2025届高考地理考点一本通考点28工业区位因素练习含解析新人教版
- 买卖茶叶合同范本
- 如何将教学目标落实到小学数学教学
- 公司电脑租用合同范例
- 散水施工方案台阶
- 中天劳务合同范本
- 钢管桩简易施工方案
- 专项工程合同范例
- 保理服务合同范例
- 消除三病母婴传播培训
- 中医护理查房课件模板
- 《现代家政导论》电子教案 5.1模块五项目一现代家政产业认知
- DB32T-县级(区域)医疗资源集中化运行规范 第1部分:集中审方中心
- 2024年4月 上海市中考数学二模题型 分类汇编4- 相似证明(23题)
- 金川集团股份有限公司招聘笔试题库2024
- 2024年吉林省高职高专单独招生考试数学试卷真题(含答案)
- 油气勘探行业技术趋势分析
- 技术研发主管岗位招聘笔试题及解答(某大型国企)
- 2024年全国职业院校技能大赛高职组(中药传统技能赛项)考试题库(含答案)
- 浙江省金华市2024年初中毕业升学适应性检测 科学试题卷
评论
0/150
提交评论