lncrna芯片分析-自己总结_第1页
lncrna芯片分析-自己总结_第2页
lncrna芯片分析-自己总结_第3页
lncrna芯片分析-自己总结_第4页
lncrna芯片分析-自己总结_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、IncRNA芯片分析IncRNA芯片分析修改时间2010/6/16 13:57:12 点击3210次.归一化IncRNA芯片采用的归一化的方法为quantile normalization 。.差异LncRNA的筛选lncRNA芯片中既有lncRNA的探针又有mRNA勺探针,分别做差异基因的筛选,筛选方法同表达谱的筛选方法是一致的,参见 表达谱的差异基因筛选。.差异lncRNA的重注释lncRNA芯片注释不完善,因此需要将筛选出来的lncRNA进行重注释。将差异lncRNA在基因组上位置上下游延伸,以寻找lncRNA附近的有功能的基因。1prcbesct idstartendsIrandIra

2、n script,.i J1 runner t pt ion ID2rhrM心骷归63值加雌oaM*SV_1SJO4Schr71WW2I2010009014T17(M7279C7orf5l,173644TCI600249rhr 1621755878.TRltOISEOJC70A.Wl_OOHfil6S33TC020097Schr2加1巢3制201羽砧9TR02OtW-r(*SPATS2LZoauoori6TCI500678chrlo盹&33带4+TR 闺 115351BE21KP3Ml_O2447J差异IncRNA 重注释示例.差异IncRNA靶基因的预测IncRNA可能通过调控相应的 mRN

3、At挥功能,因此有必要预测IncRNA的靶基因。我们提取差异IncRNA和mRNA勺序歹U,首先用bIast进行初筛,之后用 RNApIex进行进一步筛选,以预测IncRNA可能调控的mRNALac KN*THrg*taEtAmHXA_BblDGena Hane BniretGem hRNA,.Length2ICQ100006 ehr!310023 HS25制LGH丽8 7735333吊001篇册3Cl Serf) 71M4米552533318 髓 7 HHs时】ICHM46四 U5八LS微龌侬L24017439;JCOlOOOW-chrl31OO2S-11492S1LG取!1 618s 71

4、9GAKI 25214MODS47382201SICOlOQOOfr-thrJ31OO2S-31 lS2i如LGWi:S2?933ie5l_01S29PNPO551633JS2CfC01Q0O06-clirl3 1(-314825布1】LGAFI】662a1043116埼7K01OKK)6chrl310025-314B2gillLGHs- 17 28913NOG翻魄IUX1709a4541931W25-31482IgnlXGM并网的EM州6翔蟆巴Fl3CL24gTCOlOOOOft-thr1 310023-314S23职】LJCH=S176J2970上管的酒口2FPI21326259g差异In

5、cRNA靶基因预测结果示例.差异IncRNA与靶基因共表达网络预测出IncRNA的靶基因后,并可进一步在 mRNA勺数据中探寻该 mRN麋否发生表达量的变化。由此构建差异IncRNA与靶基因相互作用网络图。出” 1D4 17E 匚 Gg CLScale Independencei 10 is 20Soft Threshold poeoOL s 0 0 59门足口岂55 即区区包0_&口L rlt* F力KGNAB2NPLlincRN?HMOX1CSI-2RAPLKNC1rLTRAPCXCL2.差异IncRNA靶基因的GO analysis对IncRNA的靶基因进行 GO Ontology的生物

6、学的分类,根据 Fishers Exact Test, 得到p-value ,得到IncRNA靶基因对应的显著性功能,从而了解lncRNA的功能。.差异 lncRNA 靶基因的 pathway analysis对lncRNA靶基因按照Pathway的主要公共数据库KEG&口 Biocarta来进行分类,对Pathway中的基因进行基于离散分布的显著性分析,得到与实验目的有显著联系的Pathway分类,由这些pathway对应相应的靶基因,从而获得该分类即导致lncRNA差异的最重要Pathway o.差异lncRNA的转录因子的预测提取lncRNA TSS的上游2000bp,下游500bp,利

7、用HMM勺算法根据数据库预测其转录因子。芯片数据颈处理9差异表达IncRNAffiS 选IncRHA-mRNA共表达分析差异表达eRNA笳选装达模式聚类分析G。功能显著性富集分析IMRNA表达模式分析IncRNAtrans调控机制IncRNA-轧录因子二元关系及网络分析IncRMA功能预测IncRNAdS调控机制IncRK息-转录因子一把基因三元关系及网络分析Pathway 显著性富集分析蛋白互作网络分析常规分析内容ift级分析内容1)芯片数据预处理: 对实验数据质量评估,预处理及均一化处理。2)差异表达IncRNA及mRNA的筛选:根据客户提供样本量的大小与分布或实验目的,应用倍数法、 多重

8、假设检验等手段,对两条件或多条件下的表达差异的IncRNA和mRN粉别进行计算和筛选。派表达模式聚类分析:针对芯片结果进行本及差异表达IncRNA和mRNA勺聚类,寻找属于同一表达趋势的基因或样本。浓GO和pathway显著性富集分析:差异基因,应用数据库进行功能富集分析,挖掘具有统计学意义 的差异表达基因的功能类别。显著性 P值越小,则它随机聚集差异表达基因的概率越小,其功能相关性的 非随机性就越小,该功能模块有较大的可能与疾病(或药物作用)相关。蛋白互作网络分析:研究与指定蛋白质相互作用的其他蛋白质的信息,以使研究人员能够更加深入地认清相关蛋白质的功能,更清楚地理解其调控机制。IncRNA

9、-mRNA共表达分析:对于每一个差异表达的IncRNAs,计算得到与之共表达的编码基因。IncRNA表达模式分析: 考察差异表达 LncRNAs的表达模式,将 LncRNAs以及与该LncRNAs显著共 表达的编码基因的表达模式绘制heatmap oIncRNA功能预测:筛选出表达显著相关的IncRNA-mRNA关系对,利用成熟的 mRNA勺功能来推导 IncRNA的功能,对异常表达IncRNA显著相关的mRNA进行功能富集分析。IncRNA cis 作用机制研究: 对于感兴趣的差异表达IncRNAs,搜索其上下游100K范围内的所有编 码基因,并与该IncRNAs有显著共表达的基因取交集。这

10、些在基因组上临近、且表达模式上共表达的基因 很可能被该IncRNAs所调控。IncRNA trans作用机制研究:计算LncRNAs共表达的编码基因,集合与转录因子 /染色质调控复合 物的靶基因集合的交集,利用超几何分布计算该交集的富集程度,得到与 lncRNAs显著相关的转录因子, 从而识别可能与lncRNAs联合发挥调控作用的转录因子 /染色质调控因子。火lncRNA-转录因子二元关系及网络分析X lncRNA-转录因子-靶基因三元关系及网络分析综述长链非编码 RNA (lncRNA)来源:新药筛选中心/点击:1464lncRNA长链非编码RNA(long noncoding RNA ln

11、cRNA)是一类不编码蛋 白的RNA分子,长度在200bp以上,起初被认为是 RNA聚合酶II转 录的副产物,不具有生物学功能;近期的研究表明lncRNA具有保守的 二级结构,可以与蛋白、DNA和RNA相互作用,参与多种生物学过程 的调控,尤其在肿瘤当中发挥了重要的调控角色,如染色质修饰、转 录激活和抑制、转录后调解以及作为miRNA的诱导分子干扰基因的表达等。随着高通量测序技术的发展,越来越多的 lncRNA被注释,但是 绝大多数的lncRNA的功能仍然不清楚,因此lncRNA的研究是一片非 常广阔的未知领域,具有极大的研究价值和意义。IncRNA介绍长链非编码 RNA(long non-c

12、oding RNA , IncRNA)是一类转录本 长度超过200nt、不编码蛋白的RNA IncRNA起初被认为是基因组转录 的“噪音”,不具有生物学功能。然而,近年来的研究表明IncRNA能在表观遗传、转录及转录后水平上调控基因表达,参与了 X染色体沉 默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等 多种重要的调控过程,与人类疾病的发生、发展和防治都有着密切联 系。为何细胞不惜耗费能量对这些非编码RNA的表达和定位进行严格调控呢这些RNA分析究竟有何功能 RNAM序技术的发展使人们得以初 窥这一神秘分子,现在IncRNA的许多相关信息都可以再新数据库中查 到,例如Broad研

13、究所、哈佛大学和麻省理工共同开发的 HumarBody Map lincRNAs catalog 。虽然近年来关于IncRNA的研究进展迅猛,但是现 在人们了解到的IncRNA只是冰山一角,绝大部分的IncRNA的功能仍 然是不清楚的。随着研究的推进,各类IncRNA的大量发现,IncRNA的 研究作为RNA研究的新领域,已经成为一个非常吸引人的方向,有待 广大科学家去探寻。IncRNA研究当前面临的一个主要挑战是,研究工具还在不断开发 和改进中,而IncRNA研究中非常关键的一步就是发现与特定疾病相关 的IncRNA。现阶段,基因芯片技术发展趋于成熟稳定,在此平台上, 通过设计不同检测Inc

14、RNA探针筛选IncRNA是一种准确快捷的方法。10IncRNA特征IncRNA通常较长,具有 mRN群结构,有些具有poly(A)尾巴,有 些没有poly(A)尾巴,分化过程中有动态的表达与不同的剪接方式, 与 编码基因相比,IncRNA表达量更低。派 组织特异性:不同组织之间的IncRNA表达量不同。次 时空特异性:同一组织或器官的不同生长阶段,其中的IncRNA表达量也会变化。X IncRNA启动子同样可以结合转录因子,如Oct3/4 ,Nanog,CREB Sp1, c-myc, Sox2与p53,局部染色质组蛋白同样具有特征性的修饰 方式与结构特征。冰 大多数的lncRNA在组织分化

15、发育过程中,都具有明显的时空 表达特异性,如有人针对小鼠的1300个lncRNA进行研究,发现在脑组织中的不同部位,lncRNA具有不同的表达模式。派在肿瘤与其他疾病中有特征性的表达方式。X lncRNA的亚细胞位置上也呈多样化, 在细胞核、细胞质和细胞 器均有分布,甚至某些lncRNA具有独特的亚细胞位置,有可能是全新 的亚细胞构成。11IncRNA功能IcmnlrfiFVKHrwiwniHkHia pfopcuinpIncRNA可从染色质重塑、转录调控及转录后加工等多种层面实现 对基因表达的调控:IncRNA通过招募染色质重塑复合物至特定的基因组位点使其发 生催化活性。如 HOTAIR2J

16、Xist、RepAF口 Kcnqotl 招募 Polycomb complex 至HoxD位点,使得X染色体或Kcnq1功能域的组蛋白H3第27位赖氨 酸发生3甲基化(me3K27,诱导异染色质形成,从而抑制该区域基因 表达。lncRNA通过多种机制进行转录水平调控。lncRNA结合到基因 cyclin D1 上,招募RNA吉合蛋白TLS来调控蛋白CBPffi p300的组蛋 白乙酰转移酶活性,进而抑制 cyclin D1转录。12c)超保守增强子转录出lncRNA-Evf2 ,该IncRNA能激活转录因子DLX2进而调控基因Dlx6转录。d) DHFR次要启动子区域转录出的IncRNA与该基

17、因主要启动子区 域结合形成三聚体,抑制转录因子 TFIID结合,从而使基因DHFRg生 沉默。e)反义lncRNA能够与剪接体(splicesome )中锌指同源 mRNAeb2 的5剪切位点结合,使内含子未被剪切掉,而该内含子序列中保留有 内部核糖体进入位点(IRE位点),翻译过程中识别并结合该位点,导 致Zeb2基因表达和翻译。lncRNA分子机制随着lncRNA功能逐步显现,其与靶点的作用机制成为进一步的热 点。早期认为原位调控是LncRNA乍用的唯一机制,它通过招募形成染 色质修饰复合物而沉默邻近基因转录,例如IGF2R反义RNA(antisense of IGF2RRNAAIR)、X

18、IST等。而 Hox基因反义基因间 RNA(Hoxantisense intergenic RNA , HOTAIR讷发现提示LncRNA可能存在远程调控。同 源异型基因(homeotic genes , HOX在细胞增殖与定向分化中起关键作 用,人类Hox基因簇约含100个ncRN鹿因,其中HOTAI磔位于HOXC 基因座。HOTAIR的5端可招募结合多梳蛋白抑制复合物2(polycombrepressive complex2, PRC2借助 PRC2a个 H3K27甲基化酶 EZH2 SUZ12m EED使另一基因座HOXDt长约40kb的序列转录沉默,从而13在乳腺上皮细胞内使细胞内转录

19、倾向于胚胎成纤维细胞样表型。超过20%勺LncRNA能够通过结合PRC2或其他类似复合物发挥作用,提示LncRNA勺远程调控机制在生物体内广泛存在。其作用机制如下图所示,主要包括以下几种情况:4UCtuie till 叩gl I* MT |:ftiicinI ? Liimj.*r ciiiEKlciiiiit1凶幅ptmriTi m u,21山 111Hm ttrn.w Lnw lit h 学 u h siir ;.Spiicrnc:pfOCCiri1)在编码蛋白基因的上游启动子区(橘色)转录,从而干扰邻近蛋白编码基因(蓝色)的表达(如酵母 SER38因);2)抑制RNA聚合酶n,或介导染色质

20、重构和组蛋白修饰,而影响 基因(蓝色)表达;IncRNA (紫色)与编码蛋白基因的转录本形成互补双链,干扰 mRNA勺剪切,进而产生不同的剪切形式;IncRNA紫色)与编码蛋白基因的转录本形成互补双链, 在Dicer 酶作用下产生内源性的siRNA,调控基因的表达水平;14IncRNA (绿色)结合在特定蛋白质上调节相应蛋白的活性;作为结构组分与蛋白质形成核酸蛋白质复合体;结合在特定蛋白上从而改变该蛋白的胞质定位;可作为小分子 RNA(如 miRNA的前体分子。IncRNA芯片数据分析策略1)芯片数据预处理:对实验数据质量评估,预处理及均一化处理。2)差异表达IncRNA及mRNA勺筛选:根据

21、客户提供样本量的大小 与分布或实验目的,应用倍数法、多重假设检验等手段,对两条件或 多条件下的表达差异的IncRNA和mRN粉别进行计算和筛选。派表达模式聚类分析:针对芯片结果进行样本及差异表达 IncRNA 和mRNA勺聚类,寻找属于同一表达趋势的基因或样本。GO和pathway显著性富集分析:差异基因,应用数据库进行功 能富集分析,挖掘具有统计学意义的差异表达基因的功能类别。显著 性P值越小,则它随机聚集差异表达基因的概率越小,其功能相关性 的非随机性就越小,该功能模块有较大的可能与疾病(或药物作用)相 关。X蛋白互作网络分析:研究与指定蛋白质相互作用的其他蛋白质 的信息,以使研究人员能够更加深入地认清相关蛋白质的功能,更清 楚地理解其调控机制。lncRNA-mRNA共表达分析:对于每一个差异表达的lncRNAs,15计算得到与之共表达的编码基因Inc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论