第十二章非编码RNA与复杂疾病_第1页
第十二章非编码RNA与复杂疾病_第2页
第十二章非编码RNA与复杂疾病_第3页
第十二章非编码RNA与复杂疾病_第4页
第十二章非编码RNA与复杂疾病_第5页
已阅读5页,还剩185页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章非编码RNA与复杂疾病第一页,共190页。人类基因组的蛋白质编码区的总和占总基因组长度为1%~2%,那么其他98%的基因组有什么功能呢(junkdna)?(1)42%的基因组是插入编码序列的内含子序列;人类基因平均每个基因有7个内含子。但这么冗长的内含子序列有什么生物学功能呢?(2)其他55%的基因组的功能是什么?【注:90%以上的基因组都是转录的!】人类基因组草图带给科学家们的困惑第二页,共190页。第三页,共190页。人类基因组绝大部分都被转录成RNA,细胞内非编码RNA的数量是编码RNA的上百倍。这促使许多科学家认为生物体复杂性被隐藏在它们所输出的非编码RNA内,而非编码序列内。第四页,共190页。第五页,共190页。non-codingRNA,ncRNA不能翻译成蛋白的功能性RNA分子Housekeepingnon-codingRNAtRNAs、rRNAs、snRNAsetc.Regulatorynon-codingRNAsmallnon-codingRNAsiRNA、miRNA、piRNA

etc.Longnon-codingRNA(lncRNA,>200nt)第六页,共190页。第七页,共190页。第一节引言

Section1Introduction第八页,共190页。随着ncRNA在复杂疾病中的研究深入,研究者发现其在疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使ncRNA可能成为疾病诊断、预后的新的生物学标记(biomark),并为更进一步理解复杂疾病的发病机理提供了新的手段。第九页,共190页。第二节

非编码RNA与其靶基因

Section2Non-codingRNAsandTargets第十页,共190页。(一)miRNA的发现一、miRNA概述

miRNAwasfirstdiscoveredin1993byVictorAmbrosatHarvard(lin-4)ThesecondmiRNALet-7wasdiscoveredin2000byFrankSlackasapostdocatHarvard

(GaryRuvkunlab)第十一页,共190页。ThediscoveryofmiRNAsVictorAmbrosGaryRuvkun第十二页,共190页。第十三页,共190页。microRNAshadbeenneglectedforsomanyyearsbecauseoftheirsmallsize.Theunderlyingreasonis:peopleneverdreamthatsmallRNAswillhaveimportantbiologicalroles.第十四页,共190页。ThenumberoftheidentifiedmiRNAsisgrowingrapidlyinrecentyears.Release21(July2014)ofthemiRBasedatabasehaveadded4196newhairpinsequencesand5441newmatureproductsRelease20contains24521entriesrepresentinghairpinprecursormiRNAs,expressing30424maturemiRNAproducts,in206species.第十五页,共190页。ThesemiRNAsarefromprimates,rodents啮齿类,birds,fish,worms,flies,plantsandviruses.Thedataarefreelyavailabletoallthroughthewebinterfaceat.第十六页,共190页。Sincearound2007,theoverwhelmingmajorityofmicroRNAsdepositedinmiRBasehavebeenpredictedfromsmallRNAdeepsequencingexperiments.第十七页,共190页。miRNA的生物合成过程maturemiRNAPrecursormiRNAPrimarymiRNAmiRNAgene转录剪切剪切miRNA(二)miRNA的生物合成第十八页,共190页。RNApolyII/IIIDroshaDicer几百~几千碱基约70~90碱基约22碱基第十九页,共190页。miRNA例子第二十页,共190页。ThemiRNAgenesandStructureofpri-miRNAsPri-miRNAsbearthe5’capand3’poly(A)tails第二十一页,共190页。(三)miRNA的特点、作用机制及分类microRNA命名规则hsa-miR-181a-2*hsa人,mus小鼠,rat大鼠let,lin,mir,miR,181:编号,按注册顺序a:与已注册的miRNA序列高度同源第二十二页,共190页。2:由不同染色体上的DNA序列转录加工而成的具有相同成熟体序列的miRNA,则在后面加上阿拉伯数字以区分*:如果一个前体的2个臂分别产生miRNA,则根据克隆实验,在表达水平较低的miRNA后加“*”;或进行如下命名hsa-miR-188-5p(或hsa-miR-188-3p)5p:表示从5‘端的臂加工而来;3p:表示从3‘端的臂加工而来第二十三页,共190页。hsa-mir-188二级结构hsa-miR-188-5phsa-miR-188-3p5’3’第二十四页,共190页。miRNA/miRNA-starVS-5p/-3pthedominantstrandcouldchangeindifferentbiologicalsettingsleadingtodifferentnamesdescribingthesamemolecule第二十五页,共190页。5parm(placenta)tothe3parm(heart,liver,andkidney)第二十六页,共190页。物理位置特点miRNA基因以单拷贝、多拷贝和基因簇等多种形式存在于基因组中。miRNA簇(miRNAclusters)是指在染色体上彼此紧密相邻的两个或者多个miRNA构成的miRNA群miRNA倾向于成簇出现在染色体上;通常定义50kb的距离为一簇同一簇中的miRNA倾向是共表达的miRNA一般特点—miRNA家族/簇第二十七页,共190页。序列(特别是种子序列)高度同源的miRNA被归为一个miRNA家族同一家族中的miRNA并不一定是成簇的。第二十八页,共190页。seed第二十九页,共190页。miRNA的一般特点序列特点非编码性成熟的miRNA5′端为单一磷酸基团,3′端为羟基,这一特点使它与大多数寡核苷酸和功能RNA的降解片段区别开来;第三十页,共190页。表达特点miRNA具有时序性以及组织特异性在特定的时间,组织中才会表达保守性特点在物种间高度保守第三十一页,共190页。miRNA的作用机制通过和靶基因3′UTR(3′非翻译区)结合导致RNA诱导的沉默复合体(RNA-inducedsilencingcomplex,简称RISC)降解其靶mRNA或阻碍其靶的翻译。第三十二页,共190页。RISC转录后层面调控基因表达第三十三页,共190页。二、基于序列的miRNA靶基因预测方法miRNA靶基因预测遵循的基本原则miRandaTargetScan第三十四页,共190页。ThreeClassesofmiRNATargetSites(Brenneckeetal.PlosBiology2005)第三十五页,共190页。(一)miRNA靶基因预测遵循的原则和基本步骤miRNA的“种子区”与mRNA的3′UTR序列碱基互补靶点在多物种间的序列保守性miRNA与mRNA形成双链结构的热力学稳定性靶基因二级结构和靶点外的序列对靶基因预测的影响遵循的原则第三十六页,共190页。miRNA靶位点预测的难点:miRNA与靶位点的不完全互不配对第三十七页,共190页。基本步骤在3′UTR上探寻和miRNA“种子区”完全互补的序列;计算miRNA和这些序列结合产生的自由能下降值,对靶点进行筛选;对靶点进行物种间序列比对,利用物种保守性进一步筛选。

第三十八页,共190页。(三)TargetScanTargetScan主要考虑物种间保守的miRNA靶基因,并且在TargetScan中首次提出了“种子匹配”(seedmatch)的概念。第三十九页,共190页。TargetScan算法的基本步骤在TargetScan算法中,“种子匹配”被定义为miRNA5′端的第2~8位碱基与mRNA3′UTR上的一段7nt(nucleotide)序列完全互补,miRNA上的这7个核苷酸被称为miRNA“种子区”。从种子区开始向miRNA两侧寻找互补碱基,允许G-U配对,直到出现碱基错配为止。在物种保守方面,TargetScan算法发现随着物种数目的增多,预测的靶基因数目逐渐减少,但预测结果的准确率得到提高。第四十页,共190页。三、基于表达信息预测miRNA靶基因Huang等人利用在88个组织中同时检测了miRNA和mRNA表达的数据,并结合贝叶斯方法开发了靶基因预测算法GenMiR++,得到了104个人类miRNA的高精度靶基因,并通过实验证实了预测的let-7b靶基因,结果表明,与基于序列的方法相比,利用相同样本中同时检测miRNA和mRNA的表达谱可以更准确的预测miRNA靶基因。(Huang,UsingexpressionprofilingdatatoidentifyhumanmicroRNAtargets.Nat.Methods.)第四十一页,共190页。第四十二页,共190页。第四十三页,共190页。四、基于高通量测序结果预测miRNA靶基因ArgonauteCLIP-SeqRIP-CLIPpSILACDegradome-Seq第四十四页,共190页。

Agobindsinaternary三元的complextobothmiRNAandmRNA,withsufficientlyclosecontactstoallowUV-crosslinkingtoeitherRNA;mRNAtagswillbeintheimmediatevicinityofmiRNAbindingsites.第四十五页,共190页。ArgonauteCLIP-Seq第四十六页,共190页。ArgonauteCLIP-SeqArgonauteCLIP-Seq,又称为HITS-CLIP(ultravioletcross-linkingandimmune-precipitationandandhigh-throughputsequencing),即紫外交联免疫共沉淀与高通量测序偶联技术。CLIP技术是研究RNA结合蛋白(或者RNA)体内结合靶标的新技术。通过紫外交联将RNA结合蛋白与体内结合的RNA分子进行固定,用Ago蛋白的抗体免疫共沉淀之后酶解未受蛋白保护的RNA,可以获得Ago蛋白直接结合的RNA序列。第四十七页,共190页。针对AGO蛋白的CLIP-seq技术能够在全基因组范围内鉴定与AGO蛋白结合的小RNA及其mRNA靶标。Chi,SW,Zang,JB,Mele,A,Darnell,RB.2009.ArgonauteHITS-CLIPdecodesmicroRNA-mRNAinteractionmaps.Nature.460:479-86。第四十八页,共190页。FurthermoreHITS-CLIPreadsdonotpreciselypinpointthepositionofcrosslinkingbetweentheRNAandprotein,andthuscanonlyidentifyatargetedregion(~100-nt)asopposedtoaspecifictargetsite.第四十九页,共190页。第五十页,共190页。2010年,GeneW.Yeo采用AGO-CLIPseq技术在线虫中鉴定了Argonaute的结合位点,发现其不仅结合mRNA的3’UTR区域,也会结合编码外显子区域,还发现Argonaute大量结合的区域对于miRNA的功能非常重要,揭示了其新的自我调控的功能。要想获得检测区域被哪个miRNA调控,还需结合预测算法第五十一页,共190页。第五十二页,共190页。五、整合已有知识预测miRNA靶基因

在当前的miRNA靶基因预测研究中,研究人员逐渐意识到单一依靠序列信息或表达信息已不能继续提高miRNA靶基因预测效能。整合功能信息、蛋白质互作信息、表达信息、序列信息以及当前实验证实的miRNA靶基因等已有资源预测miRNA靶基因十分必要。第五十三页,共190页。miRNA靶点优化算法第五十四页,共190页。第五十五页,共190页。第五十六页,共190页。六、lncRNA概述及靶基因识别lncRNA定义lncRNA特点lncRNA作用机制第五十七页,共190页。DefinitionoflncRNALongnon-codingRNAs(longncRNAs,lncRNAs)arenon-proteincodingtranscriptslongerthan200nucleotides(Perkel2013).lncRNAsaretranscriptsthatare>200nucleotidesinlengthanddonothavethepotentialtoencodeforproteinsexceedinglengthsof≥30aminoacids(MercerTR.Nat.Rev.Genet.2009,LiXMed.Res.Rev.2012

).

第五十八页,共190页。ThissomewhatarbitrarylimitdistinguisheslongncRNAsfromsmallregulatoryRNAssuchasmiRNAs,siRNAs,piRNAs,snoRNAs,andothershortRNAs.第五十九页,共190页。LargescaleRNA-seq

indicatethatlncRNAnumberintheorderoftensofthousandsinmammals.9277manuallyannotatedgenesproducing14880transcripts(GENCODEv7).Thenumberofproteincodinggenesinourgenomehasbeenreviseddownwardmultipletimeswhereasthenumberofknownnonproteincodingtranscriptshasincreasedexponentiallyoverthepastdecade.第六十页,共190页。FeaturesoflncRNAs第六十一页,共190页。第六十二页,共190页。第六十三页,共190页。FeaturesoflncRNAslncRNAsaregeneratedbythesametranscriptionalmachineryasareothermRNAslncRNAsarewithsimilarhistone-modificationprofiles,splicingsignals.H3K4me3,H3K36me3lncRNAsarepredominantlylocalizedinthechromatinandnucleus,andafractionappeartobepreferentiallyprocessedintosmallRNAs.第六十四页,共190页。lncRNAexpressionTissue-specificlncRNAsexpressedinthebrain.第六十五页,共190页。第六十六页,共190页。conservationManysmallRNAs,suchasmiRNAsorsnoRNAs,exhibitstrongconservationacrossdiversespecies(Bentwich2005).Incontrast,ingenerallncRNAslackstrongconservation,whichisoftencitedasevidenceofnon-functionality(Brosius2005;Struhl2007).DespitelowconservationoflongncRNAsingeneral,itshouldbenotedthatmanylongncRNAsstillcontainstronglyconservedelements第六十七页,共190页。生化鉴定和功能研究尚处于起步阶段,目前仅有大约100多种已知功能的lncRNAs。AsofDecember2012,~127LncRNAshavebeenfunctionallyannotatedin

LncRNAdb

(adatabaseofliteraturedescribedLncRNAs)(Amral2011).lncRNA通过表观遗传学调控、转录调控、转录后调控、蛋白活性调控等多种方式调控相关基因的作用第六十八页,共190页。第六十九页,共190页。LncRNAasScaffoldforTranscriptionRepression第七十页,共190页。HOTAIRandPRC2第七十一页,共190页。lncRNAasmiRNADecoyPolisenoetal,Nat2011第七十二页,共190页。lncRNA研究存在的问题lncRNA的定义>200nt,过于武断lncRNA的命名原则:目前根据功能、结构、作用方式等命名lncRNA相关数据库的内容不够全,注释内容不够丰富第七十三页,共190页。lncRNA生物学功能的阐明lncRNA功能预测的工具不多区分功能性和非功能性非编码转录本种类和功能复杂,使不同的lncRNA研究结果之间的借鉴意义并不高第七十四页,共190页。七、ncRNA数据资源ncRNA常用数据库第七十五页,共190页。miRBase是一个集miRNA序列、注释信息以及预测的靶基因数据为一体的数据库,是目前存储miRNA信息最主要的公共数据库之一网址:(一)miRBase数据库第七十六页,共190页。第七十七页,共190页。

TarBase是一个目前使用广泛的存储实验检测的miRNA与靶基因间关系的数据库,涵盖多种实验方法检测的超过65000个miRNA与靶基因关系对。其网址为:(二)TarBase数据库第七十八页,共190页。TarBase数据库界面介绍第七十九页,共190页。(三)microRNA.org数据库microRNA.org数据库包含miRNA靶基因以及表达谱数据网址:miRNA靶基因数据主要是利用miRanda算法预测得来miRNA表达谱数据来自一个针对人类主要器官和细胞系的小RNA库测序计划第八十页,共190页。(四)lncRNA相关数据库因为lncRNA是一个非常新的研究领域,lncRNA在疾病中的作用的研究还是起步阶段,数据量还不够大,因此,相关的数据库也是处于起步阶段,相关数据库还不多,也不够丰富。第八十一页,共190页。第三节

非编码RNA多态和复杂疾病

Section3Non-codingRNAPolymorphismsandComplexDisease第八十二页,共190页。miRNA多态(miRNApolymorphisms)是影响miRNA功能的多态,可能发生在miRNA形成和行使功能的任一个过程,以插入、删除、扩增或染色体异位的形式出现,最终导致miRNA绑定位点或者功能的缺失(获得),是人类基因组一类新的功能多态。不仅会影响miRNA的产生和表达,而且会影响miRNA与靶基因的结合从而影响靶基因的表达。介绍第八十三页,共190页。影响蛋白质参与miRNA合成与成熟,导致新的miRNA生成和靶基因的调控。第八十四页,共190页。一、位于miRNA基因内部影响miRNA生物学形成的多态在染色体基因组水平上单个核苷酸变异引起的miRNA序列多态性对miRNA的转录、形成、输出和调控具有重要影响。第八十五页,共190页。Saunders,M.A.等对人类474个miRNAs的SNPs进行系统的分析发现单核苷酸多态在miRNA序列内的密度低于其周围的侧翼序列。第八十六页,共190页。49个pre-miRNA内存在65个SNPs位点,其中3个miRNAs的种子序列存在SNPs。第八十七页,共190页。(一)位于pri/pre-miRNA基因序列内部Saunders,M.A.和Duan等人利用生物信息学的方法研究发现在pri/pre-miRNA内部存在单核苷酸多态。位于pri/pre-miRNA内部的多态会影响miRNA的表达,产生新的miRNA以及影响miRNA与靶基因的结合,甚至与疾病的风险相关。第八十八页,共190页。1.影响miRNA的表达Duan等人在研究miR-125时发现,该基因位点存在SNP,含有miR-125a-G/U两种等位,其中miR-125a-U能够显著影响DGCR8与pri-miRNA-125a的结合与剪接,使成熟的miR-125a生成减少,使miR-125a对靶基因Lin-128的翻译抑制作用减弱。第八十九页,共190页。第九十页,共190页。2.产生新的miRNAmiR-146a前体会产生miR-146a(正链)和miR-146a*(负链)两种miRNA。在miR-146a前体的茎环上存在的SNP(rs2910164)不仅会影响miR-146a的表达,而且会导致miR-146a*C和miR-146a*G两种miRNA的产生。第九十一页,共190页。(二)位于成熟的miRNA序列内部成熟的miRNA与mRNA的3′UTR区域结合对mRNA进行转录后调控。miRNA与mRNA结合的区域包括两部分:种子区域,这一部分区域要求与mRNA严格匹配;种子区域附近的3′端方向,允许一定的程度的错配位于成熟miRNA序列的这些多态会影响对靶基因的调控,消除、弱化、增强或者产生新的结合靶点。第九十二页,共190页。目前的研究发现,位于miRNA种子区域的多态不仅会影响靶结合位点,还影响miRNA的表达。例如位于miR-125a种子区域的多态显著的抑制了pri/pre-miRNA过程,导致miRNA表达的减少。第九十三页,共190页。二、miRNA靶点的多态miRNA靶点的多态性靶基因上影响miRNA与靶基结合的序列多态性。这些多态性位点可以影响miRNA对靶基因表达的调控。越来越多研究发现与多种疾病的发病风险有关。第九十四页,共190页。miRNA靶点多态可分为:miRNA结合位点上的多态性miRNA结合位点上下游的多态性第九十五页,共190页。miRNA结合位点上(或上下游)的多态性与疾病与疾病相关的miRNA结合位点上的多态性举例位于整联蛋白基因-4(IGBT-4)miRNA结合位点的SNP(rs743553)与乳腺癌发病密切相关(Brendle等)。位于GEMIN3基因miRNA结合位点的SNP(rs197414)与膀胱癌发病密切相关(Yang等)。第九十六页,共190页。位于靶点附近的多态位点可能会改变mRNA的二级结构从而影响miRNA与靶基因的结合;或影响miRNA与3′UTR上其他调控元件的协同作用(间接影响)例如,HLA-G基因3’UTR区的SNP影响miR-148a,miR-148b和miR-152与HLA-G结合,从而与哮喘的发病风险相关(Zheng等)。第九十七页,共190页。五、lncRNA多态与复杂疾病近些年,高通量技术(如GWAS,全基因组关联分析)已经确定大量和疾病相关的SNP。因此,如果该SNP是位于一个lncRNA上的话,很可能是该SNP影响了该lncRNA的功能,从而和疾病有关。第九十八页,共190页。第九十九页,共190页。乳头状甲状腺癌(papillarythyroidcarcinoma,PTC)相关的风险SNP(rs944289)位于一个lncRNA(PTCSC3)的上游3.2kb处,这个风险SNP可以影响该lncRNA的表达,并阐明了这个SNP通过影响lncRNA功能导致乳头状甲状腺癌发生的致病机制。例子第一百页,共190页。第一百零一页,共190页。第一百零二页,共190页。数据资源miRNASNPmiRNA-relatedSNPstheirpotentialtargetlossandgaininformationdbSMR数据库一个分析基因3′UTR上的SNP对miRNA与靶点结合关系影响的数据库。第一百零三页,共190页。PolymiRTS数据库

整合了序列多态性位点数据、表型数据和基因表达谱数据,来挖掘潜在的可以用于解释表达数量性状位点和表型数量性状位点效应的miRNA靶基因的结合区域上的多态性位点,并把这些多态称作PolymiRTS。第一百零四页,共190页。lincSNP数据库简介

LincSNP是一个整合的数据库,为了识别和注释人类lncRNA上疾病相关的SNP而构建的全面的综合数据库。目前该数据库中包括大约140,000疾病相关的SNP,这些SNP位于大约5000个人类的lncRNA周围。这个数据库也包含了注释的,实验证实的SNP-lncRNA-疾病的关联数据以及疾病相关的lncRNA数据,并提供了友好的界面和有效的工具获得疾病相关的SNP以及lncRNA。第一百零五页,共190页。LincSNP数据库()Ning,etal,BMCbioinformatics,2014第一百零六页,共190页。第四节

非编码RNA表达谱与复杂疾病

Section4Non-codingRNAExpressionProComplexDisease第一百零七页,共190页。癌症的本质归结为各种原因引起的基因结构和功能的异常一、ncRNA表达谱识别癌症相关ncRNA致癌基因的高表达抑癌基因的低表达miRNA和lncRNA作为两类重要的基因调控子,其表达变化将会对靶基因的活动产生深远的影响复杂疾病的诊断和治疗研究中必定会引入miRNA及lncRNA第一百零八页,共190页。(一)miRNA表达谱1.ncRNA的特征低丰度、组织特异性、发育阶段特异性、疾病状态特异性2.ncRNA表达检测技术Northern印迹、克隆(cloning)、定量PCR扩增、SAGE技术、磁珠技术和寡核苷酸芯片技术、新一代测序技术第一百零九页,共190页。miRNA表达谱microRNA芯片制作和分析流程制作芯片差异表达miRNA数据分析miRNA表达谱预处理第一百一十页,共190页。1.ncRNA表达数据来源GeneExpressionOmnibus(GEO)数据库、ArrayExpress数据库、SequenceReadArchive(SRA)2.miRNA表达谱数据标准化中值处理mRNA表达谱数据标准化方法并不能简单地应用于miRNA表达谱数据,目前仍没有统一有效的标准化方法可用于miRNA表达谱第一百一十一页,共190页。smallRNAseqlibrarypreparation(Directional)第一百一十二页,共190页。ApipelineforsmallRNAannotation(seeinGEDGalaxy)Sequencereads(fastaformat)Bowtiepre-miRNA(miRBase)UnmatchedreadsUnmatchedreadsTransposonsUnmatchedreadsGenesUnmatchedreadsUnmatchedreadsRemainingunmatchedsequencesBowtieBowtieNoncodingRNAsBowtieBowtieBowtieIntergenicregionsViruses,transgenes,etc…hierarchicalannotationofsequencedatasetsMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCount第一百一十三页,共190页。第一百一十四页,共190页。丰度数据(count)预处理数据过滤-去除低质量的或噪声数据点,去除序列标签匹配性差的表达值重复数据合并–加和,代表同一个基因的标签的tag(或完全相同读段)的表达数目相加缺失数据的处理–一般不补缺失值,因为0是有意义的,可以发现某种条件下不表达的基因数据标准化–RPM(ReadsPerMillionreads)第一百一十五页,共190页。miRNA表达谱M个miRNAN1个疾病样本、N2个正常样本第一百一十六页,共190页。利用表达谱寻找复杂疾病相关miRNA差异表达分析——寻找异常表达miRNAFoldchange、T-test、ANOVA、SAM等低通量实验证实第一百一十七页,共190页。生物学证实TargetgenesmiRNA功能1功能n功能2功能注释/功能富集表型miRNA功能预测和病理假设miRNA表达的失调和许多复杂疾病相关,比如心血管类疾病和癌症等第一百一十八页,共190页。miRNA与癌症miRNA表达谱的基因组范围研究指出原发癌中存在miRNA的表达变化特异的miRNA表达谱与特定类型的癌症有关,提示其有用于诊断的潜能第一百一十九页,共190页。癌症的本质归结为各种原因引起的基因结构和功能的异常致癌基因的高表达抑癌基因的低表达某些miRNA作用靶基因是重要的癌通路组成部分,参与了癌基因网络调控miRNA第一百二十页,共190页。miRNA表达的变化认为是发生癌症的共同特征oncogenicmiRNAs(oncomiRs)第一百二十一页,共190页。Proliferation

Invasionmetastasis

AngiogenesisApoptosisOncogenicmiRNAsTumorSuppressormiRNAsCancer表达降低表达升高第一百二十二页,共190页。mir-17-92cluster—asoncogenicmiRNAsc-MYCmir-17Promote‘stemcell’properties第一百二十三页,共190页。mir-17-92clusterislocatedataamplifiedregionDNAinB-celllymphomas.Here,wehaveshownthatonemiRNApolycistronisnotonlythesubjectoftumour-specificamplification,butthatitisalsooverexpressedintumoursandtumourcelllines,andcanactasanoncogeneinvivo.Adetailed,mechanisticunderstandingofhowthisnon-codingRNAclusteractsasanoncogeneisatpresenthamperedbythelackofavalidatedbiochemicalstrategyforidentifyingmiRNAtargets.第一百二十四页,共190页。mir-17-92cluster—astumoursuppressorc-MYC17-5p,20aE2F1mir-17ProliferationGrowth第一百二十五页,共190页。Loss-of-heterozygosityofthechromosomalregionencompassingthemir-17cluster(13q31)hasbeenobservedinhumanmalignancies.NegativeregulationofE2F1translationbymiR-17-5pandmiR-20aprovidesamechanismtodampenthisreciprocalactivation,promotingtightlycontrolledexpressionofc-MycandE2F1geneproducts.Itsuggeststhatthemir-17cluster,bydecreasingE2F1expression,tightlyregulatesc-Myc-mediatedcellularproliferation.

第一百二十六页,共190页。ItisthuslikelythatthesemiRNAsinfluencecellproliferationandtumorigenesisinacell-typespecificmanner,dependingonthemilieuoftargetmRNAsthatareexpressed.第一百二十七页,共190页。与癌症相关的miRNA第一百二十八页,共190页。JournalofThoracicOncology:December2011-Volume6第一百二十九页,共190页。癌症中的ncRNA表达ncRNA表达谱可作为特定癌症的表型标签癌症中的ncRNA表达变化是因还是果,需要对ncRNA功能的进一步研究第一百三十页,共190页。二、ncRNA表达谱分类人类癌症许多研究已经表明编码蛋白的转录本(mRNA)可以有效地区分各种癌症。这些与癌症相关的转录本作为一种可靠的生物学标记(biomark)已被广泛应用于各种癌症的分型研究。我们将采用Lu等人发表于2005年nature期刊miRNA表达谱数据来探索基于miRNA表达水平的癌症分类。第一百三十一页,共190页。首先GEO数据库GSE2564获取所有相关数据,其中包括334个样本的原始miRNA表达数据,预处理后的miRNA表达数据,探针信息,样本信息等。该表达谱数据包含用两个芯片平台检测的334个样本的miRNA表达谱。所采用的预处理过程包括基于控制探针的标准化,修正表达强度偏低的探针,删除所有控制探针,以及对表达值进行以2为底的对数转换。第一百三十二页,共190页。采用层次聚类方法平均链路算法,皮尔森相关系数可以明显看出具有共同组织发育起源的样本被聚到一起。第一百三十三页,共190页。第一百三十四页,共190页。

除了上述所用到218个样本,该数据还包括了检测自73个急性淋巴细胞白血病患者骨髓样本的miRNA表达水平。第一百三十五页,共190页。利用t检验方法对正常组织与肿瘤组织的miRNA表达水平进行比较,并使用随机扰动的方法为每个miRNA产生一个p值,最后对p值进行bonferroni校正。第一百三十六页,共190页。第一百三十七页,共190页。2012年8月28日《GenomeBiology》,斯坦福大学医学院研究人员进行首个大型的癌症lncRNA表达谱分析。对64个肿瘤样品高通量RNA-seq测序,在各种肿瘤类型之间找出差异表达的1065个lncRNA(图12-13)。因此lncRNA可以成为生物标志物。第一百三十八页,共190页。图12-13lncRNA表达谱分类人类癌症第一百三十九页,共190页。GliomageneexpressiondatausedinthisstudywereobtainedfromthepubliclyavailableGEO.AffymetrixHG-U133Plus2.0platform2448lncRNAtranscriptswithcorrespondingAffymetrixprobeIDsSignificanceAnalysisofMicroarrayswasusedtodeterminethedifferentiallyexpressedlncRNAs≥2-fold,FDR<10%第一百四十页,共190页。DifferentiallyexpressedlncRNAprobesetsbetweennormalbrainsandgliomasAtotalof129lncRNAprobesets(correspondingto102lncRNAs)identifiedassignificantlydifferentbetweennormalbraintissuesandgliomasbySAM.第一百四十一页,共190页。Blue---normalbraintissues;yellow---gliomasamples.第一百四十二页,共190页。三、ncRNA表达谱与mRNA表达谱的整合分析随着检测技术的不断发展,生物学资源的大量涌现,生物信息学研究者已经不仅仅局限于使用一种数据资源第一百四十三页,共190页。表型数据

互作网络表达数据

SNP整合整合多种类型的生物数据(如各种表达谱数据、互作网络、调控网络、SNP数据、表型数据等)来解决特定复杂的生物医学问题第一百四十四页,共190页。剖析重大疾病相关miRNA的调控机制和功能生物学证实TargetgenesmiRNA功能1功能n功能2表型背景信息???HITS-CLIP第一百四十五页,共190页。ItisclearthatmiRNAshavemanydifferenttargets—dozensinsomecases,hundredsinothers—butdependingonthecellsinvolved,itseemslikelythatonlyasmallnumberofthemhaveacrucialroleincancerpathogenesis.

naturereviewsgenetics(2009)第一百四十六页,共190页。预测疾病背景下miRNA调控的靶基因数据mRNA表达谱第一百四十七页,共190页。miRNA表达谱第一百四十八页,共190页。miRNA-mRNA靶向关系第一百四十九页,共190页。皮尔森相关系数第一百五十页,共190页。第一百五十一页,共190页。第一百五十二页,共190页。AhubmiRNAsignaturepredictssurvivalinglioma第一百五十三页,共190页。第一百五十四页,共190页。第一百五十五页,共190页。前提假设miRNAsimplicatedinaspecifictumorphenotypewillshowaberrantregulationoftheirtargetgenesAkeydifferencefromothermethodsisthatweidentifieddysregulatednetworkedges(regulations)insteadofdysregulatednodes(miRNAs)toassembledisease-relatedsignatures.第一百五十六页,共190页。miRNA

family的协同失调作用第一百五十七页,共190页。包含三个miRNA家族mir-125,mir-181和mir-145家族最小的后验概率为77.4%,表明这些miRNA和前列腺癌相关这些基因富集的功能有‘pathwaysinprostatecancer’,‘celladhesion’and‘apoptosis’等第一百五十八页,共190页。第五节

复杂疾病非编码RNA的计算识别

Section5ComputationalIdentificationofComplexDiseasesAssociatedNon-codingRNAs第一百五十九页,共190页。一、概述二、复杂疾病相关miRNA的计算识别三、复杂疾病相关lncRNA的计算识别四、复杂疾病相关非编码RNA数据资源第一百六十页,共190页。一、概述系统地识别疾病相关的ncRNA是在分子水平上理解ncRNA诱导疾病的发病机制的前体,是为疾病诊断,治疗和预防设计有关特定分子工具的关键。通过实验方法通常只局限于单一或者少量的ncRNA,难以从系统的角度研究疾病相关的ncRNA。计算生物学的方法成为解决这一问题的关键,为未来实验设计提供优先的对象。第一百六十一页,共190页。基于miRNA-靶基因预测基于miRNA调控网络预测miRNA协同与复杂疾病二、复杂疾病相关miRNA的计算识别第一百六十二页,共190页。基于miR

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论