microRNA靶基因数据库_第1页
microRNA靶基因数据库_第2页
microRNA靶基因数据库_第3页
microRNA靶基因数据库_第4页
microRNA靶基因数据库_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十六章MicroRNA与复杂疾病

CHAPTER16MICRORNAANDCOMPLEXDISEASE第一节引言Section1Introduction

microRNA简称miRNA,一类非编码的小RNA分子(约22个核苷酸),通过和靶基因3’非翻译区结合引导RNA诱导的沉默复合体(RNA-inducedsilencingcomplex,简称RISC)降解其靶mRNA或阻碍其靶的翻译。随着miRNA在复杂疾病中的研究深入,研究者发现在疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使miRNA可能成为疾病诊断、预后的新的生物学标记(biomark),并为更进一步理解复杂疾病的发病机理提供了新的手段。第二节miRNA与靶基因

Section2miRNAsandTheirTargets一、miRNA生物起源(一)

miRNA的发现

miRNA首次发现于1993年,是在对秀丽新小杆线虫发育过程的研究中发现的,命名为Lin-4,它通过与Lin-14的3’UTR相互作用,调节线虫的发育。随后,在线虫、果蝇、Hela细胞、斑马鱼、人类、拟南芥和水稻等多种真核模式生物中找到了上百个类似的小分子RNA,并将其称miRNA。(二)microRNA生物起源细胞miRNA

基因初始miRNAmiRNA前体转录细胞核剪切转运蛋白Dicer酶剪切成熟miRNA和miRNA*

RNA诱导沉默复合物成熟miRNAmiRNA*降解细胞质miRNA种子区与靶mRNA完全互补则降解靶mRMA3’端miRNA种子区与靶mRNA不完全互补则抑制翻译(三)miRNA的特点序列特点miRNA本身不具有开放阅读框ORF,不编码蛋白质成熟的miRNA5’

端由单一磷酸基团,3’端为羟基表达特点miRNA具有时序性以及组织特异性在特定的时间,组织中才会表达调控特点miRNA与其靶基因间是多对多的关系一个miRNA可能调控多个靶基因一个基因也可能受多个miRNA调控物理位置特点miRNA倾向于成簇出现在染色体上通常定义50kb的距离为一簇保守型特点在物种间高度miRNA的作用机制抑制或降解取决于miRNA与靶mRNA种子区域的互补程度种子区域通常指miRNA5’

端第二位到第八位的核苷酸序列两者完全互补降解两者不完全互补抑制翻译

二、基于序列的miRNA靶基因预测方法miRNA靶基因预测遵循的基本原则

miRanda

TargetScan

RNAhybrid

TargetBoost和miTarget

其它方法

(一)miRNA靶点类型

miRNA

的靶点通常分为两类:

5‘

端主导型(5’-dominant)3'端补充型(3'-compensatory)5‘端主导型又分为5’端主导的“标准型”(canonical)和“种子型”(seed)(二)miRNA靶基因预测遵循的原则和基本步骤

miRNA的“种子区”与mRNA的3′UTR序列碱基互补靶点在多物种间的序列保守性miRNA与mRNA形成双链结构的热力学稳定性靶基因二级结构和靶点外的序列对靶基因预测的影响遵循的原则基本步骤在3′UTR上探寻和miRNA“种子区”完全互补的序列;计算miRNA和这些序列结合产生的自由能下降值,对靶点进行筛选;对靶点进行物种间序列比对,利用物种保守性进一步筛选。

(三)miRanda

第一个利用生物信息学方法开发的基于序列的miRNA靶基因预测算法/research/sander/data/miRNA2003/miranda_new.htmlmiRanda算法的基本步骤对miRNA和mRNA的3′UTR序列进行碱基互补分析,碱基互补遵循4个规则;miRanda采用一种类似于Smith-Waterman的算法来构建打分矩阵;miRNA与靶基因形成二聚体的热力学稳定性方面,miRanda利用Vienna软件包中的RNAlib

计算miRNA与mRNA3′UTR结合的自由能;miRanda要求靶点在多物种间保守,即靶点在多物种3′UTR序列比对中相同位置具有相同的碱基。(四)TargetScanTargetScan主要考虑物种间保守的miRNA靶基因,并且在TargetScan中首次提出了“种子匹配”(seedmatch)的概念。http:///TargetScan算法的基本步骤在TargetScan算法中,“种子匹配”被定义为miRNA5′端的第2-8位碱基与mRNA3′UTR上的一段7nt(nucleotide)序列完全互补,miRNA上的这7个核苷酸被称为miRNA“种子区”。从种子区开始向miRNA两侧寻找互补碱基,允许G-U配对,直到出现碱基错配为止。在物种保守方面,TargetScan算法发现随着物种数目的增多,预测的靶基因数目逐渐减少,但预测结果的准确率得到提高。(五)RNAhybrid算法RNAhybrid考虑了靶基因结合自由能对预测结果的影响。该算法利用动态规划算法寻找一条短链RNA(miRNA)和一条长链RNA(mRNA3′UTR)杂交时的最优自由能鉴别miRNA的靶点。与其它的RNA二级结构预测软件mfold、RNAfold等相比,RNAhybrid除了具有明显的速度优势外,RNAhybrid算法还禁止miRNA

分子间和靶基因间杂交产生二聚体。RNAhybrid没有考虑靶基因的物种间保守性,允许用户自己定义自由能的阈值、P值,也允许用户自己设置miRNA“种子区”的位置和长度以及是否允许出现G-U错配等。

(六)机器学习方法通过在少量实验证实的miRNA靶基因集合内提取miRNA与靶基因的结合特征,并利用这些特征训练分类器来预测miRNA的靶基因。如TargetBoost和miTarget等miRNA靶基因预测算法都是基于机器学习方法开发的,这些算法从实验证实的miRNA靶基因集出发,评估miRNA与靶基因结合的序列特征、二聚体结构特征和热力学特征等参数,最后对预测的靶基因进行打分。(七)二级结构的影响在miRNA与靶基因结合的过程中,mRNA的3′UTR二级结构起着重要作用。miRNA靶点几乎都落入3′UTR的二级结构不稳定区域内,通过计算mRNA的3′UTR二级结构被破坏、形成或破坏碱基互补配对、形成miRNA-mRNA二聚体时获得或损失的自由能,可以鉴别miRNA靶基因;通过实验发现,提高靶点附近序列二级结构的稳定性大大降低了miRNA对靶基因的作用。(八)靶点周围序列的影响靶点外的序列也对miRNA调节靶基因起到重要作用。靶点后的一段序列对miRNA与靶基因的识别起着重要的作用,对该段序列突变后miRNA对靶基因的调控作用明显减弱,而将该段序列完全删除后miRNA对靶基因的调控作用完全消失。在miRNA调控靶基因的过程中,靶点外的其他序列甚至整个3′UTR序列都起到了关键作用,这些序列可能是RNA结合蛋白的作用位点。三、基于表达信息或实验结果预测miRNA靶基因

研究人员认为miRNA结合在mRNA的3′UTR上抑制mRNA翻译成蛋白质,降低蛋白质丰度,并不会影响到相应mRNA的表达水平。现在已经明确认为:在许多情况下,miRNA还能直接对mRNA的表达产生影响。科研人员已经开发了整合表达信息的miRNA靶基因预测算法,并证明了表达信息在miRNA靶基因预测上的重要价值。Huang等人利用在88个组织中同时检测了miRNA和mRNA表达的数据,并结合贝叶斯方法开发了靶基因预测算法GenMiR++,得到了104个人类miRNA的高精度靶基因,并通过实验证实了预测的let-7b靶基因,结果表明,与基于序列的方法相比,利用相同样本中同时检测miRNA和mRNA的表达谱可以更准确的预测miRNA靶基因。(Huang,UsingexpressionprofilingdatatoidentifyhumanmicroRNAtargets.Nat.Methods.)人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》Gennarino等人通过研究miRNA宿主基因(hostgene)的表达情况,开发了miRNA靶基因预测算法HOCTAR。HOCTAR是第一个利用miRNA宿主基因表达与mRNA表达信息进行miRNA靶基因预测的算法,它基于两者表达的逆相关(inverselycorrelated)特征对预测的miRNA靶基因进行筛选。通过对178个人类miRNA的宿主基因分析,发现预测准确性优于现存的基于序列的预测方法,HOCTAR减少了基于序列算法预测的靶基因数量。(V.A.Gennarino,MicroRNAtargetpredictionbyexpressionanalysisofhostgenes.GenomeRes.)人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》Bandyopadhyay等人利用miRNA的表达谱和mRNA表达谱构建一组阴性样本集,并利用机器学习方法开发了miRNA靶基因预测算法TargetMiner。由于当前实验证实的miRNA靶基因阴性数据较少,用机器学习方法预测miRNA靶基因常具有较高的假阳性率,作者从miRNA和mRNA的表达谱中得到了300多个组织特异的阴性样本,并结合实验证实的miRNA靶基因数据,利用支持向量机(SVM)方法开发了新的miRNA靶基因算法。

(SanghamitraBandyopadhyay,TargetMiner:microRNAtargetpredictionwithsystematicidentificationoftissue-specificnegativeexamples.Bioinformatics.)四、其它方法:整合已有知识预测miRNA靶基因

在当前的miRNA靶基因预测研究中,研究人员逐渐意识到单一依靠序列信息或表达信息已不能继续提高miRNA靶基因预测效能。整合功能信息、蛋白质互作信息、表达信息、序列信息以及当前实验证实的miRNA靶基因等已有资源预测miRNA靶基因十分必要。高通量的实验方法预测miRNA靶基因也在不断的发展中,这些研究将对最终揭示miRNA功能和参与的生物学过程、找出miRNA诱导的疾病发生机制、以及最终将miRNA用于治疗癌症等相关疾病具有重要意义。五、miRNA数据资源:靶基因与表达(一)TarBase数据库

TarBase数据库目前使用广泛的存储真实miRNA与靶基因间关系的数据库网址:http://diana.cslab.ece.ntua.gr/tarbase/数据库以Excel文件形式存储,可供用户下载本地化使用。microRNA靶基因数据库-TarBase(二)miRBase数据库miRBase集miRNA序列,注释信息以及预测的靶基因数据为一体的数据库,是目前存储miRNA信息最主要的公共数据库之一网址:http://www.ebi.ac.uk/enright-srv/microcosm/htdocs/targets/v5/主要采用miRanda算法预测靶基因microRNA靶基因数据库-miRBase(三)miRGen数据库miRGen整合了miRNA靶基因数据(Targets库),基因组注释信息(Genomics库)以及位置关系(Clusters库)的综合数据库网址:/miRGen/v3/miRGen.html靶基因库中,采用四种常用的靶基因预测算法DIANA-microT,miRanda,PicTar,TargetScanS对miRNA的靶基因进行预测microRNA靶基因数据库-miRNAMap

miRNAMap数据库存储miRNA及其靶基因信息包括四种类型的哺乳动物人类,小鼠,大鼠和犬网址:http://.tw/index.php(四)RNA22数据库RNA22数据库主要为了算法RNA22而建立该算法不要求与物种间的保守性提出miRNA靶位点可能存在于5’UTR已被实验证实与多数忽略或仅考虑少量miRNA5’UTR影响的算法相比具有其特定的生物学意义。网址:/rna22.html(五)microRNA.org数据库microRNA.org数据库包含miRNA靶基因以及表达谱数据网址:http:///microrna/home.domiRNA靶基因数据主要是利用miRanda算法预测得来miRNA表达谱数据来自一个针对人类主要器官和细胞系的小RNA库测序计划microRNA综合数据库-microRNA.org查询功能已知miRNA寻找其调控的靶基因选择导航条中的“miRNA”,选择物种,输入miRNA的部分名称已知一个基因,寻找它被哪些miRNA调控及其位点选中导航条中的“TargetedmRNA”然后输入基因名称,从匹配的基因列表中选择感兴趣的基因(具有同样名称的基因通常都是有相同3’UTR)已知一个或一个miRNA集合,寻找其在组织中的表达情况选择导航条中的“miRNA”,输入全部或部分microRNA名称,在结果列表中选择“viewexpressionprofile”,将得到排在前20位的组织已知一个或多个组织,寻找哪些microRNA在其中表达选择导航条上的“miRNAExpression”在结果中选择感兴趣的物种和组织,将得到在这个组织中排名前20的的miRNA第三节miRNA多态和复杂疾病

Section3miRNApolymorphismsandcomplexdisease介绍

miRNA多态(miRNApolymorphisms)被认为是影响miRNA功能的多态,可能发生在miRNA形成和行使功能的任一个过程,以插入、删除、扩增或染色体异位的形式出现,最终导致miRNA位点或者功能的缺失(获得),是人类基因组一类新的功能多态。位于miRNA基因内部,影响miRNA的表达以及对靶向基因的调控。影响蛋白质参与miRNA合成与成熟,导致新的miRNA生成和靶基因的调控。位于靶基因3’UTR区域,miRNA靶点或者靶点附近,影响miRNA与靶基因的结合影响miRNA的药物反应和表观遗传调控一、位于miRNA基因内部的miRNA多态——影响miRNA生物学形成在染色体基因组水平上单个核苷酸变异引起的miRNA序列多态性对miRNA的转录、形成、输出和调控具有重要影响。Saunders,M.A.等对人类474个miRNAs的SNPs进行系统的分析发现单核苷酸多态在miRNA序列内的密度低于其周围的侧翼序列。49个pre-miRNAs内存在65个SNPs位点,其中3个miRNAs的种子序列存在SNPs。(一)位于pri/pre-miRNA内部Saunders,M.A.和Duan等人利用生物信息学的方法研究发现在pri/pre-miRNA内部存在单核苷酸多态。位于pri/pre-miRNA内部的多态会影响miRNA的表达,产生新的miRNA以及影响miRNA与靶基因的结合,甚至与疾病的风险相关。1.影响miRNA的表达Duan等人在研究miR-125是发现,该基因位点存在SNP,含有miR-125a-G/U两种等位,其中miR-125a-U能够显著影响DGCR8与pri-miRNA-125a的结合与剪接,使成熟的miR-125a生成减少,使miR-125a对靶基因Lin-128的翻译抑制作用减弱。1.影响miRNA的表达Calin,G.A.和Raveche,E.S.等人在一些家族的慢性淋巴细胞白血病患者中发现miR-15a/miR-16的初级转录本(pri-miRNA)内部存在C>T改变,此多态与miR-15a/miR-16表达的减少相关,这两个miRNA在几乎70%的白血病患者中具有比较低的表达水平。这意味着位于miR-15a/miR-16初级转录本的多态与白血病的生成有关。2.产生新的miRNAmiR-146a前体会产生miR-146a(正链)和miR-146a*(负链)两种miRNA。在miR-146a前体的茎环上存在的SNP(rs2910164)不仅会影响miR-146a的表达,而且会导致miR-146a*C和miR-146a*G两种miRNA的产生。2.影响miRNA对靶基因的调控,与疾病风险有关位于miR-146a前体的多态(rs2910164)会产生两种miR-146a*,两种miRNA分别作用不同的靶基因,例如miR-146a*C调控PTC1基因,miR-146a*G调控IRAK1基因。这可以解释此多态位点CG杂合子基因型患甲状腺的风险降低,而CC和GG两种纯和的基因型患病的风险增加。(二)、位于成熟miRNA内部成熟的miRNA与mRNA的3’UTR区域结合对mRNA进行转录后调控。miRNA与mRNA结合的区域包括两部分:一部分是miRNA的5’端第2-7个碱基,称为种子区域,这一部分区域要求与mRNA完全匹配;另一部分是种子区域附近的3’端方向,允许一定的程度的错配称为3’容错区域(3’MTR)。位于成熟miRNA序列的这些多态会影响对靶基因的调控,消除、弱化、增强或者产生新的结合靶点。1.位于成熟miRNA种子区域根据Saunders,M.A.等人的研究结果发现,位于miRNA种子区域的SNP不足1%。而目前的研究发现,位于miRNA种子区域的多态会影响miRNA的表达以及与靶基因的结合。位于miRNA种子区域的多态会影响miRNA的表达以及与靶基因的结合。位于miR-125a种子区域的多态显著的抑制了pri/pre-miRNA过程,导致miRNA表达的减少。miR-206调控ERα的表达,miR-206存在两个与ERα结合的靶点。位于miR-206种子区域的多态导致两个靶点都失活,消除了与原来靶的结合。位于miRNA种子区域的多态可以增强、减弱、消除原来的结合靶点或者产生新的靶基因。由于miRNA调控成百上千的mRNA,那么理论上讲位于miRNA种子区域的多态会影响成百上千的基因的表达,但是这需要进一步的实验的证实。2.位于miRNA的3’容错区域(3’MTR)

3’MTR区域不同于种子区域,允许一定碱基的错配。然而,在这一区域存在的多个SNPs、插入、删除或者异位可能会对miRNA调控靶基因产生影响。但是,目前没有发现确切的效应还需要将来进一步的研究。3.影响蛋白质参与miRNA的形成

miRNA的生物学形成过程中,存在一些蛋白质参与其中。影响这些蛋白质参与miRNA形成的多态可能会影响miRNA的表达和调控,很可能会导致miRNA的下调。Gottwein等人研究疱疹病毒相关的miRNA时发现,位于pri-miR-K5的SNP显著地抑制了Drosha对pri-miR-K5的剪切,使得pre-miR-K5和成熟的miR-K5的表达显著降低。由于miRNA表达的降低或者升高在细胞内有严重的后果,因此影响蛋白质参与miRNA形成的多态会广泛的影响miRNA的转录、加工、输出和靶向,在细胞内具有不利的影响。二、miRNA靶点的多态

miRNA靶点的多态性指的是靶基因上影响miRNA与靶基结合事件发生的序列多态性。这些多态性位点通过影响miRNA与靶基因的结合,影响miRNA对靶基因表达的调控。从而与多种疾病的发病风险有关,并成为目前遗传药理学研究的重要内容。miRNA靶点的多态miRNA靶点多态可分为:

miRNA结合位点上的多态性miRNA结合位点上下游的多态性(一)、miRNA结合位点上的多态性与疾病对miRNA与靶基因的结合机制的研究表明,一个19~22碱基的靶结合位点可以分为种子区域和非种子区域。种子区域一般为结合位点的前2~7个碱基,miRNA结合靶位点时对此区域的序列匹配程度要求很高,SNP的出现会严重影响miRNA与靶基因的结合。非种子区域则允许有一定程度的碱基错配,因此也将其称为错配容忍区。(一)、miRNA结合位点上的多态性与疾病靶基因miRNA结合位点上的多态性位点通过影响miRNA与靶基因的结合,影响miRNA对靶基因表达的调控,从而与多种疾病的发病风险有关。与疾病相关的miRNA结合位点上的多态性举例位于整联蛋白基因-4(IGBT-4)miRNA结合位点的SNP(rs743553)与乳腺癌发病密切相关(Brendle等)。位于GEMIN3基因miRNA结合位点的SNP(rs197414)与膀胱癌发病密切相关(Yang等)。CD86基因和INSR基因上miRNA靶点SNP变异纯合子均可以显著增加结肠直肠癌的发病风险(Landi等)。(二)、miRNA结合位点上下游的多态性与疾病位于靶点附近的多态位点可能会改变mRNA的二级结构从而影响miRNA与靶基因的结合miRNA与靶mRNA的结合事件的发生除了需要miRNA与靶位点的序列匹配外,还需要一些辅助蛋白,如RISC蛋白等的参与。然而,转录出来的靶mRNA的3‘-UTR区域在细胞中不是以单链的形式存在的,它会自我折叠形成由各种茎环和柄组成的二级结构。因此它的某些部分可能是不能或不容易与蛋白质或microRNA结合的,因此mRNA和蛋白质或microRNA是否能相互作用还要依赖于靶mRNA上是否具有某些特定二级结构的元件。(二)、miRNA结合位点上下游的多态性与疾病位于结合靶点上下游的SNP会影响miRNA与3‘-UTR上其他调控元件的协同作用靶基因3’UTR上除miRNA结合位点外,还包含很多顺式作用元件和功能结构元件,例如CPEARE序列(3’UTR中的AuUUA重复序列)等。位于miRNA结合位点附近的多态性会影响miRNA与其他位于3’UTR的顺式调控元件的作用,从而影响miRNA对靶基因的调控。(二)、miRNA结合位点上下游的多态性与疾病与疾病相关的miRNA结合位点上的多态性举例与Tourette综合征发生密切相关的基因SLITRK13’UTR区的SNP可导致其与miR-189的结合增强,因而使得miR-189下调SLITRK1基因表达的作用增强(Abelson等)。HLA-G基因3’UTR区的SNP影响miR-148a,miR-148b和miR-152与HLA-G结合,从而与哮喘的发病风险相关(Zheng等)。位于二氢叶酸还原酶基因(DHFR)3’UTR区与miR-24结合序列下游14bp处的SNPC-829T可影响miR-24与DHFRmRNA的结合,该SNP使miR-24下调DHFR基因表达作用减弱,从而导致甲氨喋呤抵抗(Prasun等)。三、miRNA多态影响药物反应miRNA多态性位点作为一类新的功能多态位点,可以通过影响miRNA与药物作用蛋白的结合,从而增强药物敏感性或者导致药物抗药性。miRNA多态性影响药物反应现象有研究表明,人类基因3’UTR区域的SNPs与α-地中海贫血,人类乳头瘤病毒感染,胰岛素敏感,尿石症和5-氟尿嘧啶化疗治疗的敏感性相关。作为人类基因3’UTR区域上的调控因子,miRNA靶点上或者临近区域的SNPs能够影响miRNA-靶基因的结合,从而产生新的miRNA调控关系或者失活已有的miRNA调控关系,从而导致疾病或者抗药性的产生。miRNA多态性与氨甲叶酸的抗药性PrasunJMishra等人的研究发现,miRNA多态性位点的出现与氨甲叶酸(MTX:一种抗肿瘤药物)的抗药性有关。当DHFR基因3’UTR上miR-24靶点附近的SNP829等位基因型为T时,miR-24将不能与DHFR上的靶点结合,miR-24的功能失活导致DHER基因mRNA和蛋白的堆积,堆积的DHFR直接导致了氨甲叶酸抗药性的产生。miRNA多态性导致抗药性的机制miRNA多态性能够产生新的miRNA靶向关系当药物作用蛋白是药物靶点(drug-target)蛋白时,新产生的miRNA-药物靶点蛋白调控对下调药物靶点蛋白的表达,从而增强药物敏感性;当药物作用蛋白是药物激活(drug-effector)蛋白时,新产生的miRNA-药物激活蛋白调控对会下调药物激活蛋白的表达,从而导致药物抗药性。

miRNA多态性能够失活已有的miRNA-药物作用蛋白调控对靶向关系当药物作用蛋白是药物靶点蛋白时,失活的调控关系会导致靶点蛋白的过量表达,从而导致药物抗药性;当药物作用蛋白是药物激活蛋白时,失活的调控关系增加激活蛋白的表达,从而增强药物敏感性。图16-4miRNA多态对物反应的影响miRNA药物基因组学miRNA药物基因组学可以被定义为通过分析miRNA和影响miRNA功能的多态性,从而预测药物作用效果和提高药物作用有效性的学科。

miRNA药物基因组学应用前景miRNA药物基因组学有着很强的临床应用前景。miRNA是很诱人的药物靶点,因为它们能够调控细胞中一些关键蛋白的表达,同时其自身在癌症和正常组也差异表达。miRNA多态性能够导致miRNA对药物靶点蛋白调控的失活从而产生抗药性。因此,通过促进根据病人的基因型值来确定病人对药物的耐受程度的研究方法的发展,miRNA多态性位点能够作为临床药物作用效果的预测因子,降低药物使用过量发生的可能性。四、miRNA多态影响表观遗传调控很多miRNA由于异常的高甲基化受表观遗传沉默的影响。miRNA的表观沉默最初在乳腺癌的发展中被发现。LehmannU等人针对71例乳腺癌患者研究发现miR-9-1、miR-124a3、miR-148、miR-152和miR-663在34%-86%的患者中具有异常的高甲基化。miRNA的异常高甲基化会导致癌症的发生。引起miRNA表观遗传调控改变的多态是一个新的还没有探索的领域,由于miRNA多态导致的原癌基因或肿瘤抑制基因表观遗传调控的缺失或者获得在细胞中可能具有毁灭性的影响。因此,可以利用改变表观遗传调控的miRNA多态研究疾病发生的机制。五、数据资源数据库dbSMR

http://miracle.igib.res.in/polyreg/是一个分析基因3’UTR上的SNP对miRNA与靶点结合关系影响的数据库。

五、数据资源数据库PolymiRTS

/miRSNP/

整合了序列多态性位点数据、表型数据和基因表达谱数据,来挖掘潜在的可以用于解释表达数量性状位点和表型数量性状位点效应的microRNA靶基因的结合区域上的多态性位点,并把这些多态称作PolymiRTS。

第四节MicroRNA表达谱与人类疾病

Section4MicroRNAExpressionProfileandComplexDisease癌症的本质归结为各种原因引起的基因结构和功能的异常一、miRNA表达谱识别癌症相关miRNA

致癌基因的高表达

抑癌基因的低表达miRNA作为一类重要的基因负调控子,其表达变化将会对靶基因的活动产生深远的影响复杂疾病的诊断和治疗研究中必定会引入miRNA(一)miRNA表达谱一、

miRNA的特征片段小、低丰度、组织特异性、发育阶段特异性、疾病状态特异性二、

miRNA表达检测技术Northern印迹、克隆(cloning)、定量PCR扩增、SAGE技术、磁珠技术和寡核苷酸芯片技术一、miRNA表达数据来源:(二)利用miRNA表达谱寻找复杂疾病miRNAGeneExpressionOmnibus(GEO)数据库ArrayExpress

数据库二、miRNA表达谱数据标准化:中值处理mRNA表达谱数据标准化方法并不能简单地应用于miRNA表达谱数据,目前仍没有统一有效的标准化方法可用于miRNA表达谱三、差异表达分析—寻找异常miRNA比较癌组织和正常组织中的miRNA表达水平方法:倍数改变、T检验、

SAM算法、方差分析为了确保结果的准确性,需要对异常miRNA进行生物学证实四、靶基因功能注释靶基因预测算法:Targetscan,miRanda,PicTar

对异常miRNA的靶基因集进行GO功能注释和KEGG通路分析,得到靶基因显著富集的生物学过程五、miRNA功能预测和病理假设

基于miRNA的靶基因的功能富集来预测miRNA的功能疾病中,异常miRNA通过参与调节靶基因富集的生物学

过程,进而导致功能失调引发疾病。二、miRNA表达谱分类人类癌症许多研究已经表明编码蛋白的转录本(mRNA)可以有效地区分各种癌症。这些与癌症相关的转录本作为一种可靠的生物学标记(biomark)已被广泛应用于各种癌症的分型研究。我们将采用Lu等人发表于2005年nature期刊miRNA表达谱数据来探索基于miRNA表达水平的癌症分类。

首先GEO数据库GSE2564获取所有相关数据,其中包括334个样本的原始miRNA表达数据,预处理后的miRNA表达数据,探针信息,样本信息等。包含用两个芯片平台检测的334个样本的miRNA表达谱。该表达谱数据包含用两个芯片平台检测的334个样本的miRNA表达谱。所采用的预处理过程包括基于控制探针的标准化,修正表达强度偏低的探针,删除所有控制探针,以及对表达值进行以2为底的对数转换。

预处理过程包括基于控制探针的标准化,修正表达强度偏低的探针,删除所有控制探针,以及对表达值进行以2为底的对数转换。对miRNA表达谱进行过滤,删除那些在所有样本中不表达或表达值很低的miRNA。如果某一miRNA在某一样本中的表达值低于7.25,则认为该miRNA在该样本中不表达或者其所检测的表达值过低。随后,对每个miRNA的表达数据进行均值为0,标准差为1的标准。采用层次聚类方法:平均链路算法,皮尔森相关系数可以明显看出具有共同组织发育起源的样本被聚到一起。

除了上述所用到218个样本,该数据还包括了检测自73个急性淋巴细胞白血病患者骨髓样本的miRNA表达水平。

来自结肠,肝,胰腺以及胃部的样本被很好的聚在一块。反映出它们共同起源胚胎的内胚层,进一步表明对样本的miRNA表达谱进行聚类分析能够揭示出样本的组织发展史。数据集中还包括了来自218个样本中的89个组织的mRNA表达水平。当利用大约16000个mRNA表达谱数据对同样的样本聚类时,起源相同的组织并未被聚到一起。

利用t检验方法对正常组织与肿瘤组织的miRNA表达水平进行比较,并使用随机扰动的方法为每个miRNA产生一个p值,最后对p值进行bonferroni校正。

为了进一步的证实miRNA表达谱能否用于肿瘤的诊断,选取了68个高分化的肿瘤样本(代表11种肿瘤类型),并利用概率神经网络算法方法对这些样本的miRNA与mRNA表达谱数据分别训练产生相应的多类别分类器。随后,利用所产生的分类器来预测17个低分化的肿瘤样本的组织类型。

miRNA表达的分类器正确分类了17个低分化肿瘤样本中的12个,而利用mRNA构建的分类器只正确的分类了其中的一个样本。

利用miRNA表达谱数据能够更有效的预测出低分化肿瘤样本的组织类型。总之,miRNA表达谱数据为癌症的诊断提供了潜在的可能性。

互作网络三、

miRNA表达谱与mRNA表达谱的整合分析随着检测技术的不断发展,生物学资源的大量涌现,生物信息学研究者已经不仅仅局限于使用一种数据资源

表达数据

SNP

表型数据整合整合多种类型的生物数据(如各种表达谱数据、互作网络、调控网络、

SNP数据、表型数据等)来解决特定复杂的生物医学问题

以2005年Lu采用磁珠流式细胞式检测技术得到的89个人类多种组织样本中的miRNA和mRNA表达谱数据作为一个案例(一)整合miRNA-mRNA表达谱研究疾病第一步:数据获得与处理miRNA表达谱mRNA表达谱数据筛选151个miRNA11114个mRNA第二步:表达相关性分析(皮尔森相关系数)(一)miRNA-miRNA表达相关性(二)miRNA-mRNA表达相关性一些miRNA对之间存在着高度的表达一致性(图中红色曲线)149个miRNA-mRNA对也具有共表达的现象(皮尔森相关系数>0.4)第三步:共表达的miRNA-mRNA网络

miR-99a同时与7个基因(ACTG2,MYH11,PRUNE2,GCSH,EDNRA,ACSL1,CCDN2)具有较高的表达一致性

ACTG2,MYH11,PRUNE2,GCSH,EDNRA,ACSL1,CCDN2的GO功能注释结果显示,其中4个基因共同参与了催化活性生物学过程预测miR-99a可能参与催化活性作用第四步:差异表达miRNA和mRNA对于其中的12个前列腺组织样本,利用SAM算法,分别对其miRNA和mRNA表达进行差异表达分析60个差异表达miRNA485个差异表达mRNA靶预测算法miRNA靶向的mRNA集合GO功能注释四、

miRNA:一种新的生物标记一、生物标记特征生物标记能够潜在地应用于各种医疗条件,在临床诊断和治疗上具有显著作用和效果。生物标记组织样本容易获取。例如非侵入的组织,血液或尿液之类的体液。二、miRNA在癌症中的特征

已检测到大约1000个人类miRNA中很多与癌症有关,大部分位于染色体脆性位点区域,在癌症发生过程中趋向于导致染色体扩增、缺失或异位等异常。许多研究也进一步发现癌症相关的miRNA在癌症演化过程中具有致癌和抑癌的作用,这些miRNA可以作为一种新的“致癌基因”和“抑癌基因”用于癌症检测和研究。三、miRNA表达模式

大量的miRNA表达谱研究表明某些特定条件下miRNA能更好的分类癌症样本。例如,在丙型肝炎患者肝组中,miR-122的表达水平能够预测干扰素治疗的反应在福尔马林固定石蜡包埋的肿瘤样本中,miR-205的表达可以区分鳞状和非鳞状小细胞肺癌;通过分析乳腺癌的正常组织样本和恶性肿瘤组织样本的表达谱发现mir-125b,mir-145,mir-21和mir-155能够有效地区分恶性乳腺癌组织与正常组织。四、与其它生物标记相比较

miRNA片段小而表达量大,使得研究者获取组织样本体液样本中并利用定量的PCR技术检测miRNA的表达水平更加容易。血清中miRNA能够作为一种稳定的生物分子用于癌症的检测。因此,一些研究者开始通过检测miRNA在血液中的表达水平应用于癌症诊断。五、miRNA可以作为新的生物标记根据miRNA的特征,miRNA作为一类特异的并具有高信息量的生物分子,可以成为一种新的潜在的生物标记应用于肝癌、肺癌、肠癌、卵巢癌和白血病等各类癌症诊断的新的生物标记和治疗药物作用的靶点。第五节microRNA调控分子网络

Section5miRNARegulationofmolecularnetworks简介生物网络是生物体内各种分子通过相互作用来完成各种复杂的生物功能的一个体系。网络水平的研究,有助于我们从整体上理解生物体内各种复杂事件发生的内在机制。microRNA(miRNA)是一类重要的转录后调控因子。miRNA靶基因功能类型也很广泛,比如包括转录因子,信号蛋白,骨架蛋白,代谢中的酶等。因此miRNA的转录后调控必然与目前所研究的生物网络有着各种各样的联系。揭示这种关系对阐明miRNA的调控规律起到重要的作用。这节重点讨论了miRNA对四种分子网络的调控特征,分别为细胞信号网络、代谢网络、基因调控网络以及蛋白互作网络。此外,还总结了miRNA调控的网络模体(motif),揭示转录调控和转录后调控两个层面的联系。框架miRNA调控细胞信号网络miRNA调控代谢网络miRNA调控基因转录调控网络miRNA调控蛋白互作网络miRNA调控的网络模体框架miRNA调控细胞信号网络miRNA调控代谢网络miRNA调控基因转录调控网络miRNA调控蛋白互作网络miRNA调控的网络模体miRNA调控细胞信号网络信号网络是处理早期细胞内和细胞外信号的最重要的复杂系统,它作为高级交流系统会完成一系列的任务,比如生长,细胞存活和发育等等。通过手工注释或者高通量实验产生了大量信号通路信息,它们相互交织组成一个大的复杂的信号传递网络。信号蛋白间的关系对决定细胞行为和维持细胞稳态起到关键的作用。信号蛋白对应的基因的表达及调控子的失调都会在信号网络中表现出来,同样带来发育终点的异常,比如癌症或其他疾病。miRNA是转录后调控子,因此认为miRNA调控信号网络是合理的。待回答的问题信号蛋白作为一类特殊蛋白,其相应的mRNA是否倾向被miRNA调控?miRNA倾向调控哪种类型的信号蛋白,是细胞表面的信号蛋白还是细胞核内的信号蛋白呢?信号网络可以用图的方式表示,其中点代表信号蛋白,有向边代表蛋白间的激活或者抑制关系,无向边则代表简单的物理互作。因此可以找到信号网络的模块,miRNA又倾向调控哪种类型的模体?

2006年,Cui等把miRNA靶基因数据映射到信号网络上,揭示了人类中miRNA调控信号网络的一些策略。数据microRNA靶基因数据Targetscans和PicTar的交集部分信号网络手工注释的包含540个蛋白,1258条边的信号网络人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》(一)miRNA对不同类型信号蛋白的调控倾向性29.4%的信号蛋白是miRNA的靶基因,而人类基因组(大约两万多基因)在该数据中只有17%被miRNA调控,表明miRNA的调控在信号网络中有相对更重要的作用。连接蛋白(Adaptors)连接蛋白下游成分的多少可以将连接蛋白分成两组:高连接组(下游有多于4个的信号蛋白)低连接组(下游有不多于4个的信号蛋白)计算两组中下游信号蛋白中被miRNA靶向的比例,其中36.1%的高连接组下游的信号蛋白被miRNA调控,低连接组只有24.2%,miRNA倾向调控前者的下游信号成分。(二)miRNA对不同类型信号蛋白的调控倾向性miRNA对信号网络模体的选择性调控miRNA不倾向靶向负向调控模体中的蛋白,但是倾向调控正向调控模体中的蛋白。正向反馈环(id98),miRNA的负向控制能够增强对这些噪声或者波动放大的过滤或者缓冲作用在某种模体中,Ra=正向调控边/所有有向边的比例小结上面这些规律表明在人类中,miRNA用多种方式调控信号网络。通过选择性调控网络的大部分下游蛋白、多下游成分的连接蛋白、正向调控模体,miRNA能够终止以前存在的信息并快速促进和稳定对新信号的响应。另一方面,miRNA不倾向调控网络的上游成分,比如配体、基本细胞机器共享的蛋白和负向调控模体中的信号蛋白。框架miRNA调控细胞信号网络miRNA调控代谢网络miRNA调控基因转录调控网络miRNA调控蛋白互作网络miRNA调控的网络模体miRNA调控代谢网络许多代谢产物可以被不同的代谢通路共享,且互相交织形成复杂的代谢网络。代谢网络的控制机制是复杂的,涉及到转录水平,转录后水平和翻译水平三个水平上的调控。通常我们认为代谢网络中的酶被转录因子紧紧控制。miRNA是新发现的一类丰富的负向调控子,因此我们认为miRNA调控代谢网络也是合理的。实验也验证了miRNA调控氨基酸代谢,胆固醇的生物合成等代谢过程。miRNA对代谢网络的调控是否也存在一些类似与信号网络或者代谢网络特有的原则呢?

人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》数据准备从KEGG数据库中获取人类代谢通路数据,把代谢网络转化成以反应为节点的网络A和B分别表示两个反应对应的酶(可以是一个也可以是多个)

把TargetScan预测得到的人类整个基因组的miRNA靶点数据映射到该代谢网络上miRNA显著调控代谢反应反应只有一个酶催化,那么如果酶被miRNA调控,我们就认为该反应被miRNA调控;反应涉及多个酶(不少于2个酶),统计这些酶中是miRNA靶基因的数目,如果比随机高,且具有显著性,也认为该反应被miRNA调控。AB底物1产物1产物2ABmiRNA调控多酶反应的随机方法随机扰动miRNA与所有酶的调控关系在扰动后的网络中重新统计每个反应涉及的酶中是miRNA靶基因的数目,重复5000次然后利用经验概率P估计显著性,即统计5000次随机中,比真实情况高的比例因为多酶的反应都进行显著性检验,所以需要进行多重检验验证,可以通过R的Qvalue包进行多重检验校正校正后的显著性水平设为0.25,低于该值的都被认为是被miRNA显著调控的反应。miRNA对不同类型代谢反应的调控倾向性计算每类节点中miRNA靶基因的比例过渡节点避免被miRNA调控且和随机比较是显著的;而miRNA靶点显著富集在hub和切割点两个集合上上游节点HUB下游节点切割点过渡节点不同类型代谢反应的显著性为了计算每类节点是富集还是避免被miRNA调控的显著性,通过从整个代谢网络中随机抽取和每类节点数目相同的节点,计算被miRNA调控的比例,重复这种操作5000次,计算两种类型的经验概率,即随机情况中高于真实情况和低于真实情况,取0.05作为显著性水平。miRNA对代谢网络局部模块化结构调控倾向性局部模块化结构线性模式支化模式分叉型汇集型依据每种类型中节点被miRNA调控的数目进一步进行划分,最后检验这些更细模式在网络中的富集和缺失情况富集和缺失的显著性统计随机网络中每种更细模式的数目,共随机10000次两种经验概率随机情况中高于真实情况的比率随机情况中低于真实情况的比率。所有的线性模式都被miRNA富集靶向。不管是汇集型还是分叉型,其中不包含任何miRNA靶点的模式在网络中是显著出现的,而至少包含2个miRNA靶点的模式在网络中是显著缺失的线性模式支化模式汇集型分叉型小结在人类中,miRNA也存在多种方式调控代谢网络。通过选择性调控代谢网络的HUB、切割点及线性代谢流,而避免调控代谢网络的过渡节点及支化代谢流。许多基本的代谢通路被miRNA广泛调控,比如氨基酸合成/降解和某些脂类代谢,暗示着miRNA在细胞中心代谢活动中起作用。框架miRNA调控细胞信号网络miRNA调控代谢网络miRNA调控基因转录调控网络miRNA调控蛋白互作网络miRNA调控的网络模体miRNA调控基因转录调控网络基因转录调控网络描述转录因子及其调控的基因之间的关系。理论上,整个基因调控网络包含所有可能发生的基因调控关系和实现某种生物功能的不同调控关系的组合机制。哺乳动物的基因调控信息还是远远不够的。我们不能进行前面两种网络那样分析,现在提出一种新的研究模式。先在有限的试验获得的数据中寻找到miRNA对其的调控规律,然后再在预测的转录调控数据中进行验证和拓展分析miRNA与试验获得的转录调控数据数据2005年Boyer通过ChIP-chip测了三个转录因子在人类胚胎干细胞中的调控靶点OCT4,NANOG和SOX2miRNA的靶点数据PicTar因为转录调控和前面两种网络不同,是一般网络,所以分析转录调控的靶基因是否倾向被miRNA靶向是没有意义的。miRNA的靶点富集在被多个(大于等于2)转录因子调控的基因集合上(Fisher精确检验)即被越多转录因子调控的基因,就越可能被miRNA调控miRNA与预测的转录调控数据为了证实上面结果的鲁棒性,进一步地在基因组范围内的调控信息中进行同样的分析。计算预测的转录因子在启动子的结合位点数据----2005年Kreketal基因拥有的转录因子结合位点越多,即这个基因被越多的转录因子调控,该基因的转录后调控机制就越复杂按照miRNA的调控数目将基因分组miRNA的调控数目和转录因子结合位点的平均数是显著正相关的总之,在人类基因组中,转录后水平上miRNA的调控复杂度和转录水平上转录因子对基因的调控复杂度是正相关的对具有较多转录因子结合位点和被较多miRNA靶向的基因进行功能富集分析富集在某些特定生物过程中,特别是那些和发育相关的生物过程还没有人类或者啮齿类生物的关于基因的正向或负向转录调控关系的数据,所以现在还不能进行类似信号网络局部模块

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论