文献检索与数据收集_第1页
文献检索与数据收集_第2页
文献检索与数据收集_第3页
文献检索与数据收集_第4页
文献检索与数据收集_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

EST信息检索及常用数据库石河子大学动物科技学院贾斌功能分类及代谢途径分析目标基因的分析及应用cDNA文库的构建随机挑取克隆进行5’或3’端测序序列前处理聚类和拼接EST数据注释分析平台的构建文献检索与数据收集数据公布,形成文章主要内容文献检索常用的文献检索数据库文献管理常用的EST数据库实践EST信息检索与常用数据库一、文献检索EST信息检索与常用数据库1.1文献检索方法检索工具法追溯法分段法文献检索1.2检索途径文献检索途径是指通过何种特征来进行检索。如著者、出版年份、关键词等。检索工具中对文献不同特征进行标识而编制的各种索引,给检索者提供了各种检索途径。例如,在PubMed中,就有著者途径,文献名称途径、主题途径等等;文献检索1.3文献检索步骤(参考)分析课题,明确检索目标和范围;选择检索工具;选择检索手段和检索方法;选择检索途径,确定检索标识;查找文献,获取原始文献。文献检索二、一些常用的文献检索数据库EST信息检索与常用数据库2.1中文文献全文数据库数据库文献年限网址浏览器中国期刊网全文数据库(CJFD)1994http:///index.htmCajViewer,AcrobatReader维普全文期刊数据库1989/index.asp维普浏览器AcrobatReader万方数据资源系统依各期刊而定http://AcrobatReader常用文献数据库2.2外文文献检索PubMed(http:///entrez/query.fcgi?db=PubMed

)MEDLINE(/

)ScholarGoogle(/

)ISIwebofknowledge()常用文献数据库PubMedPubMed是美国国家医学图书馆(NLM)开发的基于网络服务的查询系统,可以免费查询MEDLINE、OLDMEDLINE、PREMEDLINE以及其他相关的数据库,截至到2013年11月,PubMed中共收录了23,772本期刊杂志,包括了二千七百多万的生物学和医学文献,最早的文献可以追溯到上世纪50年代。PubMed中包括了这些文献的一些全文链接或者其他的一些信息。

主页外文文献检索PubMedservicesJournalsDatabase

MeshDatabaseSingleCitationMatcher

BatchCitationMacherClinicalQueries

LinkOutMyNCBI(Cubby)外文文献检索PubMed附加菜单栏LimitsPreview/IndexHistoryClipboardDetails外文文献检索【实例1】

检索最新的关于人类EST应用的综述性文献。外文文献检索PubMed显示方式(Display)Summary(go)BriefAbstractCitationMEDLINE外文文献检索三、文献管理EST信息检索与常用数据库ReferenceManager

(以此软件为例简单讲解实际使用方法,它将使论文写作中参考文献的使用和插入十分方便。)

EndNote/EndNoteWeb

(也将以此软件为例讲解实际使用方法,它将使论文写作中参考文献的使用和插入十分方便。)ProCite

http://www.adeptscience.co.uk/index.html文献管理四、常用的EST数据库EST信息检索与常用数据库DatabaseURL备注dbESThttp:///dbEST/index.html综合UniGenehttp:///entrez/query.fcgi?db=unigene综合TigrGeneIndiceshttp:///tdb/tgi/综合AllGeneshttp://人和老鼠dbCFC

http://cytokine.medic.kumamoto-u.ac.jp/脊椎动物信号转导相关KazusaDNAresearchinstitutehttp://www.kazusa.or.jp/ja2003/english/index.html藻类及拟南芥

MAGEST

http://www.genome.jp/magest/海鞘类NEMBASE

http://nema.cap.ed.ac.uk/nematodeESTs/nembase.html寄生虫Mendel-ESTs

http://www.mendel.ac.uk/植物ApiDots

http:///apidots/顶复门(Apicomplexan

)EASED

http://eased.bioinf.mdc-berlin.de/选择性剪切相关PEDEhttp://pede.dna.affrc.go.jp/猪常用的EST数据库其他相关数据库DatabaseURL备注核酸数据库NCBI(nt,nr)ftp:///blast/db/FASTA/综合性数据库EMBL-EBIhttp://www.ebi.ac.uk/databases/index.html综合性数据库DDBJhttp://www.ddbj.nig.ac.jp/综合性数据库TIGRhttp:///综合性数据库基因组GDBhttp://人类基因组相关蛋白质InterPro

http://www.ebi.ac.uk/interpro/蛋白质家族、结构域和功能位点KEGGhttp://www.genome.jp/kegg/代谢途径GOhttp://分子功能、生物过程、细胞组分常用的EST数据库4.1dbESTdbEST是目前最大的一个公共功能性序列数据库,是由NCBI于1992年开发的专门用于收集各个研究组织递交的EST数据。直到2010年11月,该数据库中已有1976个物种的EST数据231,275,705条,其中人的EST约有1700万条,小鼠的EST1200多万条。下面我们以一个具体的例子来说明如何从dbEST数据库中收集我们想要的数据。常用的EST数据库【实例2】在dbEST数据库中搜索并保存有关人的EST序列步骤如下:

1、搜索人类的EST序列(图示):

2、保存我们所需要的信息(图片)常用的EST数据库4.2EST序列的递交向dbEST中递交EST数据

E-mail递交(需要一定的格式)实验证实具有生物学功能的EST序列

BankIt、Sequin更多介绍参考网页:/Genbank/submit.html

常用的EST数据库4.2.1EST序列的E-mail递交序列数据的递交必须包括4个文件:Publication、Library、Contact以及EST。图谱数据的递交也包括4个文件:Publication、Contact、Method和MapData。文件组织好以后,发送邮件到batch-sub@就可以完成递交。

常用的EST数据库EST数据的更新EST数据的更新与数据的递交类似,只要修改数据文件中的信息(除了EST#和CONT_NAME),然后把STATUS内容改为“Update”而不是“New”。对Publication、Contact、源数据、EST#或者CONT_NAME所做的修改必须发送邮件到batch-sub@并阐明原因。最后把修改后的文件发送到batch-sub@就可以完成更新。

常用的EST数据库4.2.2具有生物学功能的EST序列的递交BankIt http:///BankIt/Sequin

/sequin/ http:///Sequin/download/seq_download.html

常用的EST数据库4.3UniGene为了解决冗余和重叠的问题,NCBI的科学家们开发了UniGene数据库。UniGene自动地把GenBank中的序列分类,变成一个非冗余的序列集,而这样的一个序列集就代表了一个基因。已有66个物种的927,817条记录存在于UniGene中,其中最多的三个物种是人、水稻和小鼠,分别为:54,576,44,394和43,104。常用的EST数据库UniGene的查询UniGene的查询方式与PubMed类似可以采用关键词、基因名称、物种名称、核酸及蛋白的accession号、组织等进行查询;可以在查询框中直接输入这些检索式,也可以采用“Preview/Index”进行高级检索。

常用的EST数据库【实例3】查询在人的脑组织中表达的UniGene

步骤如下:(图示)点击附加菜单栏中的“Preview/Index”按钮,在下拉框中选择“Tissue”,在随后的文本框中输入“brain”,点击“AND”;继续在下拉框中选择“Organism”,在随后的文本框中输入“human”,点击“AND”;点击查询框后面的“Go”递交查询条件就得到我们所需要的UniGene的多条记录。常用的EST数据库一条完整的UniGene记录包括:URL

类似的序列(与UniGene中的其他具有表达产物的序列进行比较得出);

基因表达情况(包括组织表达情况、表达水平(Profile)、GEO水平、NLAIII标签、SAU3A标签等);

图谱信息(即该基因在染色体上的定位信息以及STS的信息等);

序列(包括mRNA序列和EST序列)。

您可以把这些序列下载到本地,但是需要选择您的操作环境:Unix、PC或者Mac,然后点击“Downloadsequences”按钮,就可以得到全部的序列。常用的EST数据库 在UniGene的一条记录中还有一些特殊的标识,其代表的意义如下:

P

经过翻译后,与已知蛋白有相似性

A

具有PolyA信号

S

该序列在这个基因簇中的匹配不是很理想

M

该克隆是一个推测的全长CDS常用的EST数据库【实例1】检索最新的关于人类EST应用的综述性文献。

/entrez/query.fcgi?db=PubMed【实例2】在dbEST数据库中搜索并保存有关鸡(gallus

gallus)的EST序列。

【实例3】查询在人的脑组织中表达的UniGene http:///entrez/query.fcgi?db=unigene

EST信息检索与常用数据库实践回顾Theend!Publication文件

【实例】:

TYPE:Pub MEDUID:92347897 TITLE: ExpressedsequencetagsandchromosomallocalizationofcDNAclonesfromasubtractedretinalpigmentepitheliumlibrary AUTHORS:

Gieser,L.;Swaroop,A. JOURNAL:Genomics VOLUME:13 ISSUE:2 PAGES:873-6 YEAR:1992 STATUS:4 ||Publication文件项目名称大写,后面跟上“:”1表示文章没有发表;2表示文章已被接收;3表示文章正在印刷中;4表示文章已经发表

Library文件

【实例】:

TYPE:Lib NAME:RatLambdaZapExpressLibrary ORGANISM:Rattus

norvegicus STRAIN:Sprague-Dawley SEX:male STAGE:embryonicday17post-fertilization TISSUE:aorta CELL_TYPE:vascularsmoothmuscle DESCR: ||不能多于48个字符

Contact文件

【实例】:

TYPE:Cont NAME:SikelaJM FAX:3032707097 TEL:303270 EMAIL:tjs@ LAB:DepartmentofPharmacology INST:UniversityofColoradoHealthSciencesCenter ADDR:BoxC236,4200E.9thAve.,Denver,CO80262- 0236,USA ||EST文件【实例】:TYPE:ESTSTATUS:NewCONT_NAME:KerlavageAREST#:EST00001CLONE:HHC189SOURCE:ATCCSOURCE_INHOST:65128OTHER_EST:EST00093,EST000101CITATION:ComplementaryDNAsequencing:expressedsequencetagsandhumangenomeprojectSEQ_PRIMER:M13ForwardP_END:5'HIQUAL_START:1HIQUAL_STOP:285DNA_TYPE:cDNALIBRARY:Hippocampus,Stratagene(cat.#936205)PUBLIC:PUT_ID:Actin,gamma,skeletalCOMMENT:Thisisacommentaboutthesequence.Itmayspanseverallines.SEQUENCE:AATCAGCCTGCAAGCAAAAGATAGGAATATTCACCTACAGTGGGCACCTCCTTAAGAAGCTGATAGCTTGTTACACAGTAATTAGATTGAAGATAATGGACACGAAACATATTCCGGGATTAAACATTCTTGTCAAGAAAGGGGGAGAGAAGTCTGTTGTGCAAGTTTCAAAGAAAAAGGGTACCAGCAAAAGTGATAATGATTTGAGGATTTCTGTCTCTAATTGGAGGATGATTCTCATGTAAGGTTGTTAGGAAATGGCAAAGTATTGATGATTGTGTGCTATGTGATTGGTGCTAGATACTTTAACTGAGTATACGAGTGAAATACTTGAGACTCGTGTCACTT||EST序列的递交“new”(表示是新的序列)或者“update”(表示对原有序列记录的修改)

默认为cDNA,可省略序列每行不能多于60个字符在更新EST记录的时候,只有EST文件可以修改。与Publication文件中的TITLE内容一致与Library文件中的NAME内容一致与Contact文件中的NAME内容一致Method文件【实例】 TYPE:Meth NAME:YAC/CEPHJMS ORGANISM:Homosapiens ABSOLUTE:n L1:plate L2:row L3:column L4:comment L5:comment L6:comment L7:comment DESCR: PCR-basedmappingof3'UT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论