收藏级资源肿瘤数据库汇总_第1页
收藏级资源肿瘤数据库汇总_第2页
收藏级资源肿瘤数据库汇总_第3页
收藏级资源肿瘤数据库汇总_第4页
收藏级资源肿瘤数据库汇总_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

收藏级资源肿瘤数据库汇总现如今,随着人们生活方式和环境的改变,恶性肿瘤已经成为疾病死亡病因之一。肿瘤在全球呈现发病率增高,以及发病年龄年轻化的趋势。2019年,ACancerJournalForClinicians杂志发布了最新的数据。该报告估计,2019年美国将有1,762,450例新的癌症病例和606,888例与癌症相关的死亡。传统化疗是对抗癌症的常见方法,但它会攻击全身,造成不必要的副作用,如脱发,恶心和疲劳。靶向治疗选择性地杀死癌细胞而不影响健康组织。靶向药物开发将成为治疗癌症的重要手段。图1肿瘤靶向治疗高通量检测技术迅速发展,使得与肿瘤相关的组学数据迅速积累。这些数据对于研究肿瘤的发生发展机制具有重要意义。对数据的挖掘能够确定许多与疾病有关的基因,为治疗和发病机制的研究提供新的思路。如何有效利用和存储这些信息就显得尤为重要。肿瘤的生物信息学数据库的建立提供了有效的解决方案,对肿瘤基础研究的发展、临床治疗水平的提高具有极大的推动作用。以下是一些肿瘤相关的数据库分类和大致的信息。.综合性肿瘤数据库.肿瘤基因组数据库.肿瘤DNA甲基化数据库.肿瘤转录组数据库.肿瘤蛋白组数据库.肿瘤相关基因的数据库.肿瘤与药物数据库.综合性肿瘤数据库综合肿瘤数据库汇总如表1所示。表1综合性肿瘤数据库DatebaseDescriptioncanEvolveWebportalforintegrativeoncogenomicscBioPortalcBioPortalforCancerGenomicsCGAPCancerGenomeAnatomyProjectCGHubCancerGenomicsHubCGWBCancerGenomeWorkBenchCOSMICCatalogueOfSomaticMutationsInCancerICGCInternationalCancerGenomeConsortiumTCGATheCancerGenomeAtlasUCSCGenomeBrowserUCSCCancerGenomicsBrowser以下是对数据库的简要概述canEvolve[1]canEvolve存储的信息包括:基因、microRNA(miRNA)和蛋白质表达谱、多种癌症类型的拷贝数变化(CNAs)以及蛋白质-蛋白质相互作用信息。cBioPortalforCancerGenomics(cBioPortal)[2]cBioPortalforCancerGenomics是一个癌症基因组数据探索、可视化及分析平台,可用于多个癌症基因组学数据集的交互式探索。该数据库可提供CNA、基因突变信息。针对每个基因,它可给出多个信息,主要包括:基因的CAN信息、基因突变在样本中的分布、突变位点和频率、共表达基因以及生存曲线等。对于用户提供的基因列表,还可生成互作网络并提供已知的相互作用的药物。cBioPortal在发现肿瘤相关突变、分析基因的生物学功能以及药物选择等方面的研究中具有重要推进作用。

出bPcrtwlHhpiOAI 脚HMhTLAB 由QFirn CLAMw.4出bPcrtwlHhpi□wiHD**ClSlu通hi'依J山15£Ari孙k髀卡修巾,触1!”OMHU.d:na>.PwEmi.EE»g"白唱出『I力■"明f•髀卡修巾,触1!”5|>■]沂噌.“mUdt^r□fi.k^rQ00failNif刈WftM^WSMGC.H*5|>■]沂噌.“mUdt^r□fi.k^rQ00failNif刈WftM^WSMGC.H*岭]券E□知—ki|UkgWUriMJhi匆・|□.■,hrPar~uiTrmEicij.GHEKriZIW:i口。•一・■土・・¥■*w『m口Ei4MeMMaf口'ZaruiC■ILn-bv^d^Hfcii.hKmdmdritauilll^iEi4MeMMafk*i□maCMLillFCI.GMMHHZ31Hk*iAJiWlJ<3bndR-riitliiM却ekxnMbR-riitliiM却ekxnMb14an3官□ |TW.口鼻h»a*uC_BE>niiifTC*FirfBK«n;i-:3iTf4C■:・f卡EpilvdEMEW¥*"qmMWEMEW¥*"qm口 UE+ttwIE・*itofl『dU«d>74C,l/giaMIN1W噂H❷Ktd^rITMl1W噂H❷Ktd^rITMliingChOUgCC山力l-lCK*H|«UEirKnil|iK&KCriClKMRELMlIj口C>niMEvuimrg■ Cvirvd3rf■Kn.l,MG«Frf511Tl口C*nlMEVCiHaiKm 靖靖,rfns.岫I-3112)□6WH*njriMWi|m二MP业即:享网Ml口Crctiaseesown■iTCGa.Pit^eib•i.CancekGenomlCGAP如。;*QnrsnKEDtnirtMsSAUtglCancekGenomlCGAP如。;*QnrsnKEDtnirtMsSAUtgl证RH*IPddiva^育典CGCICamof•口5t3■PuUkxbns+R9IDLr=«E■RmOiHtr AikalairiyPwfiect(CMP)Tbsr+ers己w*Ga汴mmSamfipPi。枢£Mugncu m4•立dapiBiinnprs&tEaFrHnrul.prKJinoa^4ndnrcisr«li8!trfngfl«rfrjalpE<rp<w4d匈qCbo%gpn口库EDrumKrK匕皿2哈1匚附*11底心gu-rtnalD'dbrths匚GAPinti独七口jr«刖,蚓偃tothebradcjiwsrODmuirtv.[riCTConfiM&dmoAjiesprcMdeavxag却匚01P由g.UHmorn敏and^Eb='<ib..n-dbic4c-pcjilnmirm.Bowrqgtafnd-h3"F*«T?EbhlogkaibfIominenM(*iMthednahme白M4khrhelatacraterv.Reftd Muc<69 gitieMdiMt4ar««MjrcK.Caiic£rGaicimeCh4rACT«rizatiM(C-GCI)rtKi二『31MrrtHAc^r^siugM[iZGCjInfiLrhiia:±ti*Ein^H~・■,»»Ter9W«nH3rEinotogjwE由激切抽卜tlmcbanzqm 4tcrigfiuncdiaigurwohMlunM-i.Grc<pih*tmwdHTShth«CCSIntistiwmafceaH口Ithe*dais国枢diEughu心Qr«c«it>ledht3b«4iCarrdr>5tinonaCJiamwzxian<CGC)Iniidhmirmrpcr^nEmmeSharartrnEjtMn ENg口Wnem寸tuniKripcane占pEeusing-Mcnrrign犷斓on(MOLMmr>jintartaru'd^-iUfri6二式的由小。。・由位dnangBi tbinmLmadrvuidmfaiu:Ue□□(:mci4,andhwHivprajKtii«n^kngHibrartpwiwrtm/diwflverv由Muflhia>d奴;国3*4皿giifrhsrng图2cBioPortal数据库的主页CancerGenomeAnatomyProject(CGAP)[3]CGAP网站主要提供了cDNA克隆、文库、基因表达、SNP以及基因组变异等信息。CGAP收集的数据包括正常组织、前癌组织以及癌细胞的基因表达水平。NationalCancerInstitu:ECanclflGlnome

FrARACTERIZATIONINlTIATiVfVimCGCFVeilCGAPOVimCGCF图3CGAP的主页CancerGenomicsHub(CGHub)[4]CGHub是美国国家癌症研究所。^)测序项目的在线存储库,其数据来源包括癌症基因组图谱(TCGA)、癌症细胞系百科全书(CCLE)和产生有效治疗(目标)项目的治疗应用研究(1人区6£1)3个国家癌症协会项目,数据来自25种不同类型的癌症。

CancerGenomeWorkBench(CGWB)[5]CGWB提供了一系列工具来挖掘、整合以及可视化TCGA等数据库中的基因组和临床数据,它是第一个将临床肿瘤突变谱与参考人类基因组整合在一起的计算平台。用户可快速地比较患者临床信息与基因组的变异及甲基化等。CatalogueofSomaticMutationsinCancer(COSMIC)[6]COSMIC是世界上最大最全面的有关肿瘤的体细胞突变以及其影响的资源库。它主要提供多种肿瘤细胞基因组中的CNA、甲基化、基因融合、SNP及基因表达等信息。这些突变信息是从科学文献中手工整理的。U-flhlta图4COSMIC的主页I'DUT aliU因表达等信息。这些突变信息是从科学文献中手工整理的。U-flhlta图4COSMIC的主页I'DUT aliUInternationalCancerGenomeConsortium(ICGC)[7]ICGC的目标是获取包括胆道癌、膀胱癌、血癌等多达50种肿瘤及其亚型的基因组、转录组和表观遗传的全部信息。这些数据可促进癌症的机理和治疗研究。

世kmW Pi由ri CmimiEd42匹或冈*«国再向剧中3加IIei NPb世kmW Pi由ri CmimiEd42匹或冈*«国再向剧中3加IIei NPbcsnc&rtherapyisdBwlDpedtoday卬片小川网加通gpnnmrc知1砒时时知/加iCiSCprav^rfedIdrheWDrfd-RTmiMC.5力M?, no由1鹏Bd第注#3ofM.DM可■■VuiirulM士父“ri।in*JSklhlilkthr*iTnagc31HdBirnKWEbia的圉alUHAidko9ukJicnauiHM7!力胆■目3第homasthanngiFor工次而卬“2.mtrd^nul^Mul 同由学UHM口心tarmaf^cinmTntiCGC euP』n&MiEr4iu业s&M'VhMQcrbfeg禺帆”0由1・nqfnH」riaii柒忙meWswicpirerIjper.CeawleEirrtwrEE.F啤1."Mfdipn*Intllwwwvii?scnwd|wMEEUupsZ制0muiCQCinaT*<wePape-虫力置iherwncuiM0mtEmn:tCOC 9^*1*也口)《9inQvnvnw 晌—ksrElnc^qumtoii«idptfwnldhk-sirWegQItw EriEErgencinuFA>^4rl蛇南:上lnl^r-naGunalGHUArQqgmPublurHniUM5IC^SMi*尽曲n|如,lHdUi□hsMekTn唐i:*ark*WMC«rt*T4W[WoIiDkbPffial■附加W■皿a图5ICGC的主页TheCancerGenomeAtlas(TCGA)[8]TCGA是由美国国立癌症研究所(NCI)和国家人类基因组研究所资助,关注与癌症的发生和发展相关的分子突变图谱。该数据库主要对样本进行外显子组和基因组测序分析,所提供的数据包括:基因组拷贝数变化、表观遗传、基因表达谱、miRNA等。AB(XrTNCITheCancerGenomeAHasProgramNATIONALCANCERINSTITUTE>AJxhiLNClxHiCi >CCG>Rawreh>5£的第累Undmius硝rAB(XrTNCITheCancerGenomeAHasProgramNATIONALCANCERINSTITUTE>AJxhiLNClxHiCi >CCG>Rawreh>5£的第累Undmius硝rB!fH口ProgramHi5a修TCG*CanceriraStudyPubJlcrtwnsbyTCC*UsingTCC4CoMartTheCaiKflrGenomeAJdms(TCGA).alan^marlccatKergenomicspnogrrn,molecularlycharacterized-avEc20r0DOprimaryCMoeraMmatchednormalsamplesspamning33cancerrypes.ThlsjDlmelfDrtberrieenilieNatiar^ilCancerInstituteandtheNsignalHumanGenomeftewarch[restitutebegenIn2006.bringmgroqetherrMearcherEfromdn/ersi?disciplinesandmultipleinstiitutior^Owrtiienes?tdozenyea「丸TC骷gemfiratedover23peistrytK时gencHnkjepigenon»c.trsnscriptomic,mndproLeomlcdau.Hiedaca^whktihasalre9leadwimpravemencsInour^illiycddiagtfiose,creauandprevenicanc&r,will,电public^forar^oneIndiereseardicwwnuniiyTou*.1政。出<]朋KER LiveChatPublication&rtic<iaryABOUTCAMCER CANCERTYPES RE:占日S亡H CHAWTS&TRAINlMC NEWS息EVENTSiwdi图6TCGA的主页UCSCCancerGenomicsBrowser[9]UCSCCancerGenomicsBrowser是一个可以对癌症基因组学和临床数据进行整合、可视化、分析的网络分析工具。它保存癌症基因组及临床数据并收集了样本的多种信息,包括基因表达水平、CNA、通路信息等。在UCSC的癌症

基因组浏览器中,可实现不同样本以及癌症类型之间的比较,分析基因组变异与表型之间的相关性。.:...NkFR.=n-^FCAJIFCFHA等解m删1Genomicsistitute/ XGenomeBrowserOurtools■GenomeBrowserinteraHiviMYvisualizegenDRiicdata■BLATrapidlyHignsequencestoih?Berom&■TittleBrower.:...NkFR.=n-^FCAJIFCFHA等解m删1Genomicsistitute/ XGenomeBrowserOurtools■GenomeBrowserinteraHiviMYvisualizegenDRiicdata■BLATrapidlyHignsequencestoih?Berom&■TittleBrowerdo^TiloaddatafromtineGeianieBravs・「database■VariantAnnGtatiwIntegratorgetfunrtmalefiiectpredictiorsForrails■DataIntegratorcombinedataKwrcesfromtheGeromeBewse「database■GerwSorterfindgenESthataresimilarbyeMpressionandothermetrics・GenomeBrowserinaBox(GBiB)runiheGeromEBrw^erenivourlaptoporssrver■In-SilkjQPC«rapidlyalfsnPCRprimerpairstoIhe^eTOrne■LiftOvercnnvprtgenonecoordinatesbehveenessemblies■TrackHubsmpwLandviewexternaldatatracks-Moretoo-MfiTorsDmnloadsMyDitaAboutIPsGEnQFTIEB「OWS€TTools图7UCSC癌症基因组浏览器主页.肿瘤基因组数据库肿瘤细胞的基因组中都存在着大量的变异,主要包括染色体结构的变异、CNA、基因融合以及SNP等。拷贝数改变(CNAs)在很大程度上有助于癌症发病机制和进展。肿瘤基因组数据库汇总如表2所示。表2肿瘤基因组数据库DatebaseDescriptionarrayMapReferenceresourceforgenomiccopynumberimbalancesBioMutaIntegratedsequencefeaturedatabaseCanGEMCancerGEnomeMineCasSNPCopynumberalterationsofcancergenomefromSNParraydataCGPCancerGenomeProjectArrayMap[10]ArrayMap提供预处理过的肿瘤基因组芯片数据以及CNA图谱。在ArrayMap

数据库中,用户可搜索自己感兴趣的样本,并在此基础上分析感兴趣的基因或基因组片段上的CNA;用户还可以比较两个样本之间的CNA的差异。visualizingcancergenomearraydata@SearchEamphKSeerthPuUiGaticns:Urilvierslly^f;Zurich"4Thecurrentdatareflects;U强visualizingcancergenomearraydata@SearchEamphKSeerthPuUiGaticns:Urilvierslly^f;Zurich"4Thecurrentdatareflects;U强『Gui设Re-nplc72724oenamlcarray国85S到的ri聃yitMsedei5fFS^MapgacuratesreferenceifetBbaseandbioinFarniBticsnetrltceTurgetinguipynimberpr-DiiingijaiwInhuman5n⑻.丁卜已3T/叫3P由tEbasepras/ide&3nentrypointiormei+w0学强ar<l tveidal-dintgynliQriDfhigh-r^soluTiDnonoaganuTdcCNAdatA.Z57arraypiarftinnrisICDD5diICD-0esneefeniiiies795pub(cations.(PwbmedICDD5diICD-0esneefeniiiies795pub(cations.(Pwbmed产值⑷GwcrriccapynumlMrimbjlancw口「dEgsniEgi口

Glicbli3tc>ni0i'65M+?1153Xindwbng.irnong口由空:hGEiyqiHB

ddtiiiangDlMhg匚件露2Al日.forihemajerilyEthesamples,(zobeipmeIvisualizalicflasweJlaswstornimdslarepRSHlalicfl4a由gt?geoelevel5ndgoncvriawidedflarnvinw.RwultEfrommuili-casBsnlBclianscanbo-cannatiDd1adawnstm-arndd1daid^ENidvisiuixatuntools.;aspros!dethrcijgholfPragcrieto:':prqect.■arrg/Mapisdfr^dapedby1he^aup'ThecrffljcalCytogeneticardOncDqencrna-aattheIratrluleoFMolecularLife5aencetof1he-Un^ersiity4Zurich.图8ArrayMap的主页BioMuta[ii]BioMuta数据库存储了癌症细胞中基因的非同义单核甘酸变异,这些突变会影响基因的正常功能。BioMuta中的数据来源于COSMIC、ClinVar、UniProtKB以及一些文献中。用户可搜索感兴趣的基因,获得该基因在癌细胞中的突变位点及其分布频率。GWufMedicGW&tiodltii.$diraMiTheHIVELab=B-cMju- i^M|In图9BioMuta的主页CancerGEnomeMine(CanGEM)[12]CanGEM是一个公共的数据库,用于存储定量微阵列数据和临床肿瘤样本数据。它主要利用ArrayCGH芯片来发掘基因的拷贝数变异。

WekametoCanGEM-111ni^JiaClh*山值43.hJnii^>^JU4WekametoCanGEM-111ni^JiaClh*山值43.hJnii^>^JU4曲qfu^Tj,hnn日GorwHnalnhornMll££UjiIe■B¥0rncrikufflHrlilnm就M+Ff'/WWW^lHrUI:旭心3A+DWirtM^frtlTptfKiBl.dKfr.T»f-lirqutfwtkinctK|i-«(■■vwfUntHw*IM 21alMm 闻0*»^―11| (LiLLjIcwMwimawd|图10CanGEM的主页CancerGenomeProject(CGP)[14]CGP提供了肿瘤中的CNA及基因型信息,该数据库的主要目标是利用人类基因组序列和高通量的突变检测技术识别体细胞突变,进而发现人类肿瘤发生过程中重要的基因。该数据库还提供了一些识别突变、CNA的软件,如BioView、GRAFT等。Groups®FacultyGroupsI飘*呻柳/5岭里”I咽^ FMMlpfrfl/蛔印切切N特不「lwsta$£f仍曲的睥h1电力MXi牙战网(2中门淅中机梆仇纸如中.骊地6WIE0E3EblDmcdlMlqm则ltrsFjqjB31ndAbmkIbccFacuiymemberalaid由13rnwigroups时pascdKiDrai1日足■、PTDsudefiisrd叫叩3可soIT.AAarKfis^riG'DupAndaranCroup幅科由HF3y国口中占%Tid■慌囱相3他Cl刖¥Di汨神kE■四।憎iiigCaricei值结[百Geh&mKSgHn帕⑴ 的MiMuMyBjitchoGroupBjp'TDKarEi陋p日函suDmin碗M冷gE期收gpCWliC#Cm*1QWF增修百闻日谢liHiffiii&ri]inifctSaanuteCiioupeSemmElifimpBra业,eEypGoneerGenomePlacet9外「静H 注加涮Meg,曲Mm@htrmeii&iiW制[4gvrifWrtOmpSbP^wtGe叩山病Hi口RnokrdlGtmnl孑阳&inwliHwiw^TMipTim4用IcnACarmiCdtiarnicaQuanciuiiKmodtknf9arddipiGrsskfigiKoilc"wiaikDfldnd^efwUcdaw:图11CGP主页.肿瘤DNA甲基化数据库DNA甲基化修饰是表观遗传学的一种重要形式,它调节基因的转录水平,对维持细胞的正常功能起着重要作用。DNA甲基化模式的改变可能导致癌症。肿瘤DNA甲基化数据库汇总如表3所示。

表3肿瘤DNA甲基化数据库DatebaseDescriptionDiseaseMethHumandiseasemethylationdatabaseMENTMethylationandexpressiondatabaseofnormalandtumortissuesMethDBCommonresourceforepigeneticphenomenonMethHCDNAmethylationandgeneexpressioninhumancancerMethyCancerHumanDNAMethylationandCancerNGSmethDBNext-generationsequencingsingle-cytosine-resolutionDNAmethylatio3.1DiseaseMeth[15]DiseaseMeth是一个人类疾病甲基化数据库,其重点是对各种疾病的DNA甲基化数据集进行有效的存储和统计分析。它涉及的疾病包括癌症、神经发育和退行性疾病、自身免疫疾病等。在DiseaseMeth中可以比较疾病与疾病之间、基因与基因之间以及疾病与基因之间的甲基化关系。TheSGarchEngirwiwxrQdfisqnsdntatliraQquani1cntranco:GggSjrdn,DiEQasaSajirdiinndAd^jnc4B4jrili.DiseaseMethversion2,0hehumandiseasemethylationdatabaseHome加的haSi[Mar21-att161IntroductionThehtrand«TheSGarchEngirwiwxrQdfisqnsdntatliraQquani1cntranco:GggSjrdn,DiEQasaSajirdiinndAd^jnc4B4jrili.DiseaseMethversion2,0hehumandiseasemethylationdatabaseHome加的haSi[Mar21-att161IntroductionThehtrand«s将瞄后methyiadondBtabas«r口5己seMetth^ar&Qn2.0isa■肋r&soLrcefocusddantha^barr^ntmathylamfi^ofhum^ndii&qxi_Untilracant^bulcsoflarqQ-Ecaladatsarc:Jivabtaandarenizreasingfygrn'An,fnmwhictimETcm'formatun匚=nUrnncdtDgjinfurtharntarmatKintDWjrctihum^ndsEascs.DIseaseMethverslQn2.0d己tmsummaryEggh打制icardnix询E5匚即:11/Breastinvasivec^rcinorinaCBftCiM1274GaaretiVl5U9lkzeAnalyzeDataDiseaseM^thVersionIKldnevrtnalpapllariicell&arcii(yfta[KlRP]-?liMtceHaloidLeukemia[b!uviL]:767Over「macdeejIUarcarcWomalLJK]:960BidderUrahellalCartinoma[0LCA]-2511Gliobiaacniamum『0E@G@町507SkinCutaneouHMdancrnatS^CMJ-267BranLowerSr-3deGhama[LGG]:1L0Dicldne'ii <c且Ic-arciitfiftaCKlRC]!75Lun-aAJenccarcirwmapLU^D];514O-ananserouscvata^nocar-cinomaCO^]-1622UterirwCcrpuaErdofl^tnaiCmrdnom却RE口T172Llnqsquamouacemaxhcfn=i[LUSC]-1147ThyroidcarcinomBCTHCA]:57MeadandN«ksqLJ-smwjsMllcBrononr3[i-IMgiC]-3098ColonadenowrcimmaCOT^JOJ-963P'r口5t3l:”MrWEETiEM:PCM];780ThelabelsindicatethenumberofdifferentialmethylatedseriescompetedbyDise^&eWethmr加口2.0.图12DiseaseMeth的主页MENT[16]MENT数据库收集和整合了来自GeneExpressionOmnibus(GEO)和TCGA的DNA甲基化、基因表达水平数据,同时将DNA甲基化和基因表达水平关联起来。MENT

MeihylaLi训andExpressiondatabaseofNomnalandiIlimortissuesispro'-ddrigintDntuiicnabculCfdA.rnclkrljUDnaidgemejpre-iiionIntimDiIjjljuDatasetSearch■CancerMeMornial■Subtype■CdrrEl^tiQnOverview-Inlja'3j'di<]n-EEDdscnplan-DatasetSearch■CancerMeMornial■Subtype■CdrrEl^tiQnOverview-Inlja'3j'di<]n-EEDdscnplan-C^taFniiws^ng-LSr皿■黛Information■□alasEllnram-ulan■Sa-nplG-Inrarm3lan-EdnahluacomFarc>JIdnDimdIkssik^Th«D^ianl:ixlIllis>ldayisqd«rT^stnmSQlodix!dahrramtii4CECiR&mE叩的iionEhTTirsusijrtdTOGAnh&CanbariZwiomaAlk|.GeneSearch->Zwal-CsnErvsNormal-qumpG-COEl51MLflg■POHK4dix.OBS>T111'Zwahanana'r-usQanQ-^uDagjBanKar«aTEL+睚-42日如4114FAX例TITdLUMCap^Tight2D11的KaraRh『artFiInattitqMEidrcwnM5日日KbauhmiilnEfffffdE日;由Irlgnlsrts&hiad.图图13MENT的主页MethHCMethHC是一个集成数据库,包含大量DNA甲基化数据和mRNA/microRNA在人类癌症中的表达谱。这些数据可以帮助研究人员确定表观遗传模式。DauProcessAnnotationmicroRPJAExpre-uiondwtaImlRMA5MliUCSCGenomeOBDefinegeneiregian:Promoter曰。出DauProcessAnnotationmicroRPJAExpre-uiondwtaImlRMA5MliUCSCGenomeOBDefinegeneiregian:Promoter曰。出T&S15OO.巧52的.55&lneKon.genebody,andS'lfTRDefineCpG14,<*dr^iqn:CpGIsland,CpGihore,andCpGshelfbeZvBlue2n^vriean>median,.血刷(RNAScq)图14MethHC的数据生成流程[17]MethyCancer[18]该数据库拥有来自公共资源的高度整合的DNA甲基化数据、癌症相关基因、突变和癌症信息,以及我们大规模测序得到的CpGIsland(CGI)克隆。MethyCancer可用于研究DNA甲基化、基因表达与癌症的相互作用。

CrickladtwrrMlh^taLMnrlimn#i*ranAvaxclFiii&ngn*oam**LhyC・白Ifil/Odii曲CrickladtwrrMlh^taLMnrlimn#i*ranAvaxclFiii&ngn*oam*3M七4-3S'HfIIi”WlWlflLS11国1丽酬・闻 WbMJ44网El“rq6打弧UWgpuUIOfl*0皿itW5织LUWH帕「必「曲科45¥1|Ui迎4hii2auigrgnirud【gm*flEiSlaoii£,canuiirdtta^Ep#4^1mrrtwiiirroicMdn^u.K".lipg|nFV|加*s«(qiiqEAn[rtlrneHcihfneaiinMnanhH1明Ndli网1,■f*fflifr.hOMW^gamtrf-Hrn^hgrco^na*de心wmi的吃Hur承“EiknEina・力UvurtgJtui值加i.f."Thtnidiidiric^aiheicAuHEPiUait»riL3*sbtuldTanaHTMTh?jij^lMgtEhipn*nnil.M>rtyiMl.Mij|HiHtTjrt:Mrt>1"4F¥!f4cv?drri由用nhwtfai,'rl[tJAnpihji'NKngtm欧呻“E3fdGBicerIIheIiMlH的Irle^ilHdfiaDH.*.nwii^rlmEBn»r-iEkMssne1.rmlvicnandcwm,EmtmImtwpi^i:的“由4c■.n・d(hikl”d同5clomEMzdsnjf划加 。1代的南r"Thtnidiidiric^aiheicAuHEPiUait»riL3*sbtuldTanaHTMMCvMflatWWK£kul,pM>IW^BS”口地闻SSIFEiK»lM闻finjptKJl *。国海吓闻IIHl^pUMTS>融国qaiUUOUHi!OUUVYiKUili・MCftVilYaMr4tiUidii3gl工1到靖血5lidHf直g(UUMMl^Cinoai 3EMHdfl*加。嗣 皿iVU^±r:0BrtonrElih。CGIdSJlbUKfl力hd>4,>}»»卧府的■口ID1tAim刈615/iWiMYUiiCdKgLiULi”ilrMClliJjiqif—gWCryD■通信■IHmAiJIH流口ncainmiMmwh^wiikcmlaiird3k口vir)alrd■■呷arr山工La^<>AjpwldgCdiic«rEpgpTrinTiicsPraj*dHCDImMvitF^lwiMiwrilariHhkijijiid^tarTTbyMTm»MiidIfc#Id■!"■+工=naidaratytiEillaudrEhamlk»CamrQ.■即7r!? hC*ehVti 鼻s理I iki^*Tr^l,用hN*■>!!crniai^nj!.Fff^ri!i■■时皿好tolitgatEwt8Mit/huffwiheMifc.C<fl|fafTl>.IM0FIJH?hwigJJ.Zhpr.q:apBp.rt£pillr^i|.JZOWiWefT/Cpicijith? ijlkmsiDWig(姆闻iji,dcwK*rMk**c9油叼.M ERaxi图15MethyCancer的主页除了上述针对癌症基因组甲基化的数据库外,还有一些数据库搜集和整理更为广泛的甲基化数据,如MethDB和NGSmethDB。MethDB是较早的DNA甲基化数据库,主要集中于环境因子对甲基化的影响;NGSmethDB叫基于高通量测序数据,最近更新中还包含了SNP信息,以便后续分析。.肿瘤转录组数据库肿瘤细胞具有较强的生长和繁殖能力,生命活动旺盛,因此与正常细胞相比,基因的转录水平和模式也存在较大的差异。表4肿瘤转录组数据库DatebaseDescriptionArrayExpressMicroarraygeneexpressiondataChiTaRSChimerictranscriptsandRNA-sequencingdataGEOGeneExpressionOmnibusmiRCancerMicroRNAcancerassociationdatabaseOncomineCancermicroarraydatabaseOncomiRDBExperimentallyverifiedoncogenicandtumor-suppressivemicroRNAs

SomamiRSomaticmutationsimpactingmicroRNAfunctionincancerSomamiRArrayExpress[19]ArrayExpress是基于微阵列和高通量测序(HTS)的功能基因组实验的主要知识库之一。ArrayExpress中的所有数据都以MAGE-TAB格式提供。LoginLoginIiiilDataContentUpdaladlodayal03:00・IiiilDataContentUpdaladlodayal03:00・72012eKp&nrnents.23&54Qi第SW■M41TBofarchived-dalaigLinks%ToohandAccess"RelatedProjectsArrayExpress—functionalgenomicsdataAiFgyExpressAndhi*®erfFundionalGenomicsData510rssdatafromlugh-itiraughputfunclionai1experirngnte,andprovidesItiesa:恻矽fur『日图由1otheresi&ancticonwnunHy.rowseArrayExpress僚LatestNews11February2tl19-即注盛几加电电由■u㈤电弛网煦fpublishe-d!An的pubicsUDH口&^bingIhedewlDpnienljndfature-planstorliieArray&cpressartlilveanddalakaseservice rec日m*beenpublrshednNucleicAodsRe&earcJi:AjrayEMprasa山岫帕-5mbu*to到mle-cal]电距倘alcndaiaRgi]il.dodrsccwr面日breadlhoiIheda1acorrtariedwilfinthearchiveandhoMril愉刍developsaverIheyears靶ren&a1h&lal&stlechnol闻/snhjrKlimaloenDfinlcs.inpfuliculersinglecell网ue«Kln口8间tolearnatoJtheimprowdMncton司UtesBItslinkedsubmissonlool.Ann%旧pleaseatethispapermyourpubl&Hc^MemirerferenangArrayExpress图16ArrayExpress的主页ChiTaRS[20]ChiTaRS数据库包含嵌合转录本和RNA-Seq数据。ChiTaRS嵌合转录本和RNA-Seq数据数据库是由GenBank、ChimerDB、dbCRID、TICdb和其他用于人类、小鼠和苍蝇的数据库的表达序列标记(ESTs)和mRNA识别的嵌合转录本集合。

THEIMPROVEDDATABASEOFCHIMERICTRANSCRIPTSANDRNA=SEQDATA.CHITARS-2/1Mtyigci试E0GMOESBi即。mRjjAsmniGera5rik超Wt»enusedto"n帅[hrnenc印排耳or冲。ormoregengs国涧的mgv™Mn(feorthrnsncESBby中舞sequencingwefoLTdIhaflIhtEiprE55»nlevel口『cNmertESTSisgeneral^kiwandIhe^hghtyEesuespeciDcinnormalcel&Herewepeewrtweiinp,^eJMmcnorIheCN-RjRS由Mbase(Chli^H3-21](X20.75fl+^224*2.1511-4*4*-8+1chlmencIranwnp&mEmdr&.me.MilnieszebrpsshH.cowsras□也ana坦能iInIrecunrenlMencriwe曰娓。皿ire白磔山口⑻#却口―eMdence^&^i垩 nw日 ofTie睡「衣-云3区白位cntnia-iciraniunpbdinesanw特h?cdrr向国刈meM通&byFTF-PCR<|PCR.Rhl4咫的坨旭顺力/ndMks&g-BfKK畤*姚^feneddion.#ecolfetedgbouM.JOOhgaitime时 曲IheeiprKxcfilereterfchmencRFlAscomUnwedhyIhtpared-endRFiA-sequericingeipenmentaindnenenlbssuesiihLm;an&metaidtillflieson•旧i Etnnennw5gHi»*■PUBLISHED*C川/日由1由均曲其岸巾・KiULriiSmH匕11ud・忖此历[1^『+ 0匕曰桔白U母中,『勺0中1励5七』耳守防制4*31■曰卜口”4:弋1131一串;1QdQ9^ziWW041■pg&M■日Ibflk酬口liM看BJbH♦MAR: BMAm*亡中|人日旧dwHrv,umb・r15・3byCMjvbgiiti号*rV飙串客口恰・闻时工SNC&DCgf*力tM图17ChiTaRS的主页GeneExpressionOmnibus(GEO)[21]GEO是由美国国家生物技术信息中心(NCBI)建立的,其最初的目标是作为一个公共存储库,存储主要由微阵列技术生成的高通量基因表达数据。止匕外,该数据库还包括比较基因组分析、描述基因组蛋白相互作用的染色质免疫沉淀分析、非编码RNA分析、SNP基因分型和基因组甲基化状态分析。GeneExpressionOmnibusGEO油a叩&加fvrKfiDnaigprwmkschfcarepa^fcaryisuppEnngM^ME-ccnipfiarit而IdEubmhsianiAiray-andBfquwce-tHseddataarenceptedIndsarapridedIpheSusmquerfanddmwil™iwp«im«Tfc!aiEcuratedsen*AKpf«5diOlpi篦岫3KA^ardatGEOi^cc&skin54AMl1GettingStartedToolsbrowseContentOwimSoldifcrSludies趾GEODSbaSrtsReiMsHaryE*wse*FMSaardiItfGerriE&前日&i«iJiSDPraffai口二号团片4邱fttwinGEC*OsliSfflBSoldiGEO[iHXEFrt3iiE口naa&厘MUIGEQF陋晒匐RlyW33ludy耐1GEQ2RPUitowia:19W0AbolilGEERM叫StsSoidri^Nih EuuYriWtif『「口匚卜土3010290MdwmConslrurt3口jeryP'ragiair-alKArc<«HwrtaOmwikKadDialaFTP诉InForrnAtioriMrSubrtii岷rsL妁ifigL妁ifig与uhmH国 GudalnA^FdMEgig*UpdateGu曲$nEClingMdLiUpdateGu曲$nEGuidflinpsftirGEOFuHicjimg图18GEO的主页miRCancer[22]

miRCancer基于从文献中提取的结果,提供了较为全面的miRNA集合以及它们在多种肿瘤中的表达情况。所有miRNA的癌变关联都是在自动提取后手动确认的。SearchmiRCaaK^r0「口知永niiRCaiic£rS£queiiceAiialy€r5DuiNilllOdidAboutU写Searcii/Re;fcreniceLatestCountsmiRHA;5793^Cancer!195miR-Cancer:7325Paper;5723UpdaS;February16r2019ThelatestniiRCsnciardataSearchSearchformiRNAandcdncarassociationsrriiRN4namn愈。OfindcancflrnameSearchmiRCaaK^r0「口知永niiRCaiic£rS£queiiceAiialy€r5DuiNilllOdidAboutU写Searcii/Re;fcreniceLatestCountsmiRHA;5793^Cancer!195miR-Cancer:7325Paper;5723UpdaS;February16r2019ThelatestniiRCsnciardataSearchSearchformiRNAandcdncarassociationsrriiRN4namn愈。OfindcancflrnamemiRCancer:microRNACancerAssociationDatabaseUsercanse-BrchthedatabasebymiRfJAanchorcancernamesinthgrmiR匚刃口化行『下花制nch口日g曰Our■曲sit日alsoprovidBEE。xqujnce句/口卬/括山口国:clu&teingandchi-squareanal/sif-^vhichcanperformanalysisonallorseleccedpoolofmlkNAsequ^ncELG.Newsqurjournal口己口H「hasbeencited242times.Xkccardnqg^halar,FqbruarVrt06口叫他Ely201gmiRCancarprouidascompraharsivacalkctianafmicmHNA(miRNA]eicpregsionprofilesinvarioushumancancerswhichareautumaticallyextractedFronipublishedhtarjtur«inPuMlnd.[tutihzast4xtminingcechniquasforinformationcollection,Manualrevisionisappliedafteraulx-extractiontoprovide口口口贴procisian.Example:mir-145rhsa-mir-2irlet-7Example:iung涓breast匚口nuqirmiRCancermlcroRluflBncerAssociationDatabase图19miRCancer的主页Oncomine[23]Oncomine主要提供癌症转录组数据。它可提供基因在肿瘤样本和正常样本间、肿瘤样本和肿瘤样本间、正常样本和正常样本间的差异表达、基因表达谱、共表达基因等信息。Pftpv*wpubtiih<uw.Pftpv*wpubtiih<uw.„.ValidawynurmsuLK^car.vIujUzadau。闻4randmahaconn4crioriscadlnidd^nincancfi.Designbetterexpenments.Gainmoreinsights.Preparetopublishfasterb*EEAftxM^irfiAi'iu...AnsvwrrktaquasdofiswithQ^parlmants,MlaciEh,VK&tprnMNnq附值wailllna,.arideaseyoirhipctchasis.IheOficomine''Platfoim-frumwpbvpHeHu卅LoIranslabon-1NoinfnmiabcBseMoM--prowidrsacUiforind^idudrwMrctiera--andmiAtinjd?naiocfnpsii«-,i川也Ebu,心pcrr-reMewedin*旬3methodsand-apow*ertjikrt3anAysisfunctinnsthatEmpoWEwewsprss-sonaianaLurrssdjua-tenandarnc-MtrmdulriidutQffwtiaiJy轩tradjnybioLogicAinBighi:!fnimthedata.Ith»becnmeanIndustryMandardtoddiedInm^rethanifiOOprrrrtMc*wMl TheOiwminePutfcnnh-asbrenuseda>afoundatiDnforprund-brraMnEdKO*erie!3thuniquefMturwtii-aitindud^-的iab而y—wlth7M+Ind«p4nd«nedatKAts万卜qualiiY—/由4>Ap6niycurjCAddauCaAaliEAhe>-MlUijirich,wtonsl府wid±ofe«hiuSevri*rdi2#dAhiht>3l3一/曲d,£chai:jssur4d#wMidoaid&E«iitIni:4rpr«ijt1on5ofrasili^图20Oncomine的主页OncomiRDB[24]OncomiRDB主要收集和注释通过实验验证的对癌症具有促进或抑制作用的miRNA信息。该数据库的所有数据是通过人工收集和整理。SomamiR[25]SomamiR数据库集成了多种类型的数据,用于研究体细胞和种系突变对癌症中miRNA功能的影响。该数据库主要收集miRNA及其靶序列上的突变。另外,数据库还提供了存在miRNA靶序列体细胞突变且肿瘤相关的基因及其参与的通路。SomamiRDB2.0SomaticmutationsalteringmicrnRNA-ceRNAinteractionsinrmiRfJAseque;niCB$EdmmtiwEutHtiiQn£inrxperimEntiallYidnatifimdrriR阳苴tmngetq佗肆写;CLA5HSinrmiRfJAseque;niCB$EdmmtiwEutHtiiQn£inrxperimEntiallYidnatifimdrriR阳苴tmngetq佗肆写;CLA5HS口rnatitEUtdtiQnEIn>Kp自rim电nt任llyidentifieclmiRN姓ta『得酬site%;PAR--LIPfHlfTMUPpathways;impactedby501mdticmutatioTKEuehH匚「nuldtiairi与imprgdict/dmi:RN也t-r碧etrite二图21SomamiR的主页.肿瘤蛋白组数据库蛋白是生命活动的主要承担者,蛋白结构变异、蛋白修饰的改变以及蛋白含量的变化等导致细胞的生长和代谢变化是肿瘤发生的重要因素。表5肿瘤蛋白组数据库DatebaseDescriptionCancer3DCancermutationsandproteinstructuresCancerPPDAnticancerpeptidesandproteinsCanProVarCancerProteomeVariationDatabaseCPTACClinicalProteomicTumorAnalysisConsortiumdbDEPCDifferentiallyexpressedproteinsinhumancancers5.1Cancer3D[26]Cancer3D数据库整合了来自TCGA和CCLE的体细胞错义突变信息,在蛋白结构水平上分析其对蛋白功能的影响。该数据库通过e-Driver和e-Drug两种算法,帮助用户分析突变的分布模式及其与药物活性变化的关系。CancerPPD[27]CancerPPD是一个抗癌肽(ACPs)和抗癌蛋白的储存库,在设计基于肽的抗癌

疗法中非常有用。在CancerPPD中,针对每个条目,都有其详细的注释信息,如肽的来源、肽的性质、抗癌活性、N-和C-末端修饰、构象等。除了天然肽,CancerPPD还含有非天然的、经过化学修饰的残基肽和D-氨基酸。CancerPPD还整合了一些基于web的工具,包括关键字搜索、数据浏览、序列和结构相似性搜索。CcauLtliXialBLritielBS十patentsas钟ellasfromo^herr^poEitones.SinceEtiuetoresplaArunportantrolesintheanticancerhavepredictedtertijiiystructures口fauticancerpeptidesiisinf;iULe-oi^EutmethodPEPstrandsecondarystructuresiatesareassignedusingDSSPTheLtnportanlfeatureofcan^rPPDIsdialitalsoprovidesinformaitiomrelatedtovm-oustJiemicalinodlificatwnsliketuon-natural,D-amirwacids,m◎由tiedCcauLtliXialBLritielBS十patentsas钟ellasfromo^herr^poEitones.SinceEtiuetoresplaArunportantrolesintheanticancerhavepredictedtertijiiystructures口fauticancerpeptidesiisinf;iULe-oi^EutmethodPEPstrandsecondarystructuresiatesareassignedusingDSSPTheLtnportanlfeatureofcan^rPPDIsdialitalsoprovidesinformaitiomrelatedtovm-oustJiemicalinodlificatwnsliketuon-natural,D-amirwacids,m◎由tied中miiwacidlikeoinithine.Hiedatabaseiscross-linkedwithvariousothernelatedrfsourcesinordertopimideoaniprehensiveSMILESTiiiUAhtse■Slidih-lVcteJILiEMeinbiaiiiolyucnwdc口FiiUionstriKtureAlig.nzniuitDownloadPtolninumibnjiimlviicmedeoifji-cticbTiMippinfS&QueneeStnKiiire.虹切医AckrKxifciEdg.Emsnt(i)DataRetrieval:Toolsfordatafetchinglikeslmpleh黄ndach'ancedsearchwreintegrated!,Inaddidon,iosearchpeptides,peptidesearchandSMILESsearchopiwnsarealsoprovided,[覃)DataAttah'sU:BLAST3Smjtli-watermali.sequ&Eiceandstmcluiemappingtoolsarein^oi.'porated!.whichfiaciljtatethesimiLaTiti1,,-ba3edmuBrch.(3)Browsing:Variauisbrows-ingfieldsharebeenpra^ded,wtuchfaciUtalrethedatabrowHinuinaveiiyEuvenienfi:wa”(4)SMILESmidStructures:AnimportantfeatufeofCancerPPDisthatitcontainsinformationofACPsinSMILESforniatinaddidoriipr^iietedterttarv1structuresofaUACPsawavailablewMchmakesitcempreliensiveresource,图22CancerPPD的主页CancerProteomeVariationDatabase(CanProVar)[28]CanProVar数据库整合了来自各种公共资源的蛋白质序列变异信息,重点是癌症相关的变异,CanProVar中的数据主要来源于TCGA、COSMIC、

OMIM、HPI等数据库以及一些文献研究。在该数据库中,用户可在网站中搜索特定蛋白或者某种肿瘤,获取蛋白的突变情况,在结果页面会给出蛋白的基本信息、GO注释以及相关的研究文献。ClinicalProteomicTumorAnalysisConsortium(CPTAC)[29]CPTAC整合了基因组和蛋白组的数据,旨在识别和描述肿瘤组织和正常组织中的全部蛋白,发掘可作为肿瘤生物标记的候选蛋白。DbDEPC[30]DbDEPC是一个专门收集肿瘤样本中出现的差异表达蛋白的数据库。在该数据库中,你可以了解你所感兴趣的蛋白质是否在某些癌症中发生了变化。.肿瘤相关基因的数据库表6肿瘤相关基因的数据库DatebaseDescriptionDriverDBExomesequencingdatabaseforcancerdrivergeneNCGNetworkofCancerGenesTP53MULTLoadTP53mutationdatabaseUMDTP53TP53database6.1DriverDBDriverDB收集了来自TCGA、ICGC、TARGET等数据库的大量exome-seq数据,并根据不同方面提供突变信息的可视化。这些可视化结果将有助于用户快速了解驱动基因之间的关系。DriverDB;Addubdseforcancerdrivergene/mutation(MvertJBincwpwate'shuge-amountofexcme-ieq]data,snrwtationdatsbasM{suchwdb'CTR1000GennmeandC-wnicX.andpubiqhcdfaininfcrmaticsaignrithmsckdiutfidtodnvcrgfinfi,>mutatKTiidantiticaban.WapmudatwoporitsofDriverDB;Addubdseforcancerdrivergene/mutation(MvertJBincwpwate'shuge-amountofexcme-ieq]data,snrwtationdatsbasM{suchwdb'CTR1000GennmeandC-wnicX.andpubiqhcdfaininfcrmaticsaignrithmsckdiutfidtodnvcrgfinfi,>mutatKTiidantiticaban.Wa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论