版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、、NCBI上下载基因序列、mRNA、CDS序列的方法1.打开NCBI网站,第一个框选择Gene,第二个框输入基因名称,如ALK基因,点击Search。2.进入第二页面后,会看到如下一系列跟ALK基因相关的信息,根据description和location的信息,找到自己需要的基因。空色框中表示的是物种,我需要的是人类的基因,故选择第一个。点击八1(进入下一个页面。SearchresultsIteMS:1to20Of2651FirstLastOSee3信口73discontinuHd酬rgHaceditems.Name/GeneIDDescriptionLocationAliasesMIMALK
2、wnmpEsticIvmphoFniareceptortyrosineChromosome2,NC_DDQ002.1I2CD246,NBLST3105590ID:238kin召sjHome电加(huimar)|(29192774.2992161kcomplementmanaplasticlymphomiakinaseMusChromosome17:NC_OOD083.6CD246,TcrzID:11632mtssculus(housemouse)(71B6898a.7260648,complennentAikArapIasticlymphomakinaseChromosome2RNT_0337
3、78.4Dmel_CGS250:ALK,CG825C:DAIk,ID;53425Drasophiarneanogaster(fruitfly)(16625291.16640011complement)DAlk53:DmelCG8250,alk,dALK,mili3.进入后,会看到以下关于ALK基因的详细信息:修NCBIResourcesHowitt叵Gene修NCBIResourcesHowitt叵GeneGeneSearchAdvancedOfficialSymbolOfficialFullNamePriiriiarysourceSeerehtBdGenetypeRefSeqstatusOr
4、ganismLineageAis口knownasSummarySendio.Sendio.ALKanaplasticlymphomareceptortyrosinekinaseHomosapiens(huinan)GeneID:238,updatedan6-Dec-2016上SummaryALKLyTGHEanaplasticlymphomareceptortyrosinekinasepuxidcdbj卜RM/laerublENSG口口口了门4MIMR555。,延即OTTHUMGUOODDISSDWproteincodingREVIEWEDHono5/pien:5Eukaryota;Metaz
5、oa;Chordata:Crianiata;Vertebrata;Euteleostomi;Mammalia;Eutheria:Euarchortoglires;Primates;Haplorrhini;Catarrhini:Hominidae:HomoCD246;NBLST3ThisgenesncodGareceptartyrosinekinass,whichtslDingstotheinsulinreceptorsuperfamily.ThisprotsincomprisesanieKiracellulardomain,anhydrophobicstretchcorrespondingto
6、a&inglpasstransmembraneregion,andanintracsluiarkinasedomain.Itplar/samimportailrolsinthedlevslopimientofthebrainandexertsits-affectsnrcncij%rtfiirrusiiimncinFhan口mv四uicleTinicmonoIn口ciKaonfriiinrihnh口arnroninaHmi+s+odnramrihfiicirlineorinc.n.ftiimdniiremr-liudlinnnFifanl口lornordI这些信息可以略过,往下查看,点击下图红色
7、框中的SeeALKinGenomeDataViewer,进入下个页面。GenomeDataViewertPkk砧阳丽卡SefertanagserriXytocrangelleoaramViewQO-,二-WIHUnlHomosapiens:GRCh33.p(GCFJOT0004406.3S)Chr2NC_ODJOOZ12|:29.12M-2999MGenomeDataViewertPkk砧阳丽卡SefertanagserriXytocrangelleoaramViewQO-,二-WIHUnlHomosapiens:GRCh33.p(GCFJOT0004406.3S)Chr2NC_ODJOOZ1
8、2|:29.12M-2999M15ORBrunr-.-rrrm,-TTTTTHfiMoglaInL目Js.ln=1Js.mn-n-SWHUyaRMEHR4GenomiccontextLocatian:2p232-p2S.1Exoncount:29.AjinotatiorireteaseStatusAs-&embllyChrLocalignwscuiTentG.RCh3S,p7(GCF_00Q00H33)2NC_a0ODO2.12(29192774.29921611,cdhpigmentW5previousassemblyGiRCh37,pl3fGCFJQ0OM405沏2NC_Q00002.11
9、(29J1S64O,30144477.cornplememt)4.进入后会看到如下页面,:4NCBlResourcesHwTo将鼠标箭头放在图中红色框中的绿色线上2-5秒,不用点击。会看到下面的界面:(有些基因会出现好几个,根据自己的要求选择)云子产uhkkDownload:NP。0429。,MM。04304.。云子产uhkkDownload:NP。0429。,MM。04304.。MF04295.ZHIIINFOCHZ95,ZandNMO043m.4Liniks&Tools|VIEW8口工95331721髭wGsD:238(ALK)一ViewHGHC:4Z7ViewHIM:10.55901*-
10、1A.111二1J.Titte:ansplasoclymplhomarecefitartymsinekinaseLocation:conpleiment(291.192J7741.29j921611)Length:728.BSE_IP4IIIIIlliIINP,001274457.1iiiiii11iinIIIIII11IIIIIIIIH11IIIIiiIii11IIiiIII口1IIIllllllllllIIIIIIIUIIIIIIIII11IIIIIIIIIIIXP_0052GG19.LXP_01153112.1XPjffi7l2l67.1MPJ305266201BLASTGenomic:
11、NC0gCON(2丸152774,,23r92L611)FASTRViH:口仁000002.12f困j,西,921,611)IGEnEankVievM:NC0QQ32.12129:19乙774.29:9216后第一个红色框中:NP004295.2表示蛋白质序列,NP代表蛋白质,004295是编号,后面的.2代表更新状态,数值越大,版本越新。NM004304.4表示mRNA序列,NM表示mRNA,004304是编号,后面的.4代表更新状态,数值越大,版本越新。第二个红色框中:CCDS33172.1表示CDS序列,CCDS表示CDS,命名规则同上。第三个红色框中:NC000002.12(29,19
12、2,774.29,921,611)表示完整的基因序列,NC表示基因组。括号中的数字表示这个基因的碱基长度,从29,192,774bp到29,921,611bp。要下载蛋白序列、mRNA序列、CDS序列、基因序列,直接点击红色框中的链接即可。5.这里下载基因序列,点击后出现如下界面:点击右边的Sendcompleterecordfileformat(有好几种格式)CreateFile。常用的是FASTA格式和GenBank格式。GenBank格式保存的信息更全面。彳NCB【ResouncesHowToNucleotideNucleotidemACCESSIONVERSIONDELINKKEYWO
13、RDSSOURCEDownload1items.Send:tCompleteRecordACCESSIONVERSIONDELINKKEYWORDSSOURCEDownload1items.Send:tCompleteRecordOCodingSequences(jCliptxjard(.)CollectionsAnalysisToolGenBankShowGlAdvancedGenBankHomosapienschromosome2,GRCh38.p7PrimaryAssemblyNICBlReferenceSequence:NC_000002.12FASTAGmphicsLOCUSNC_D
14、00Q02LOCUSNC_D00Q02DEFINITIONHomosapienschromosonie2,GRCh.39.p7Primary国匚00口002REGION:29192774.29921611GPC_000001294NC_OOOQ02.12BioProject:PRJNAZEEAssembly:GCF00口口口14Q5.33ef5eq.Homosapiens(human)CHIGAHISMjlciin口mapimrimZukaxyota;Metazoa;Chorddta;Cranidta;Verzebrata;EuteLeostomi;至此就把ALK基因的序列下载了。几种代号的意
15、思ACCESSION是NCBI序列数据中我们常用到编号(另一个是GI).ACCE羽ION形式为C1其中CC为两字母,其不同组合又可以区分为蛋白序列.核酸序列或基因组序列,而题位数不等的数字;ACCESSION后面又会加版本号,以CC_#济形式表示,最后的尾数递增表示序列信息较之前的版本有所修改,这样ACCEE5I。N+版本号就是一个唯一的表示.代表一个唯一的序列,而且这个编号不会改变口ACCESSIONMOLECULEMETHODNOTEAC.123456GenomicMixed一些可供选择的注释毒和原核生物。)基因组序列主要用来标记病AP123456NC_123456ProteinMixed
16、AC_标记序列对应的蛋白产物。AP123456NC_123456GenomicMixed完整的基因组分子序列,标记的类别包活基因组、染色体、细胞器、质粒。NG.123456GenomicMixed不篮整的基因组区域,提供NCBI基因组注释途径。比较有代表性有不转录的假基因或者那些源难自行化注释的基因组簇。NMJ23456mRNAMixed转录产物序列;成熟mRN侬录本序列)NM_123456789、七微信号:HelULire一般来说,mRHa和基因组序列是我们主要的寻找对如果想找标准序列的话rmRNA就采用NM_开头的,基因组用NC_或者AC_开头的口soeasy1NP_123456NP_1234567S9ProteinMixed磨白声
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院房屋租赁合同
- 夫妻婚内约定协议书
- 场地承包经营合同
- 2025版新型能源设备买卖及购销合同范本3篇
- 2025年全球及中国硬面耐磨板行业头部企业市场占有率及排名调研报告
- 2025-2030全球超高速电主轴行业调研及趋势分析报告
- 2025年全球及中国蒸发光散射检测器用氮气发生器行业头部企业市场占有率及排名调研报告
- 2025-2030全球摩托车涂料行业调研及趋势分析报告
- 二零二四年度研学旅行课程资源采购合同3篇
- 二零二四年度员工开除后的离职补偿及社会保险合同3篇
- 寺院消防安全培训课件
- 比摩阻-管径-流量计算公式
- 专题23平抛运动临界问题相遇问题类平抛运和斜抛运动
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
- 五年级数学应用题100道
- 西方经济学(第二版)完整整套课件(马工程)
- 高三开学收心班会课件
- GB/T 33688-2017选煤磁选设备工艺效果评定方法
- 科技计划项目申报培训
- 591食堂不合格食品处置制度
- 黑布林绘本 Dad-for-Sale 出售爸爸课件
评论
0/150
提交评论