RNA及RNA二级结构的理论知识_第1页
RNA及RNA二级结构的理论知识_第2页
RNA及RNA二级结构的理论知识_第3页
RNA及RNA二级结构的理论知识_第4页
RNA及RNA二级结构的理论知识_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

RNA及RNA二级结构的理论知识RNA及RNA二级结构的理论知识RNA及RNA二级结构的理论知识xxx公司RNA及RNA二级结构的理论知识文件编号:文件日期:修订次数:第1.0次更改批准审核制定方案设计,管理制度第2章RNA及RNA二级结构的理论知识RNA的生物知识RNA基本单位在动植物、微生物、一些病毒以及噬菌体内都有RNA分子,它是一种以磷酸二酯键连接的几十种核糖核苷酸的形式存在的核酸,核苷酸是构成RNA的基本单位。从本质上看,多个单核苷酸聚在一起形成的多聚核苷酸构成了核酸。核苷酸由核酸经大量水解得到;而核苷和磷酸由对核苷酸的水解得到;同样的,对核苷再进行水解就可得到含氮碱基和戍糖;含氮碱基包括嘌呤碱和嘧啶碱,戍糖经过分解形成核糖与脱氧核糖。RNA的化学构成RNA主链由核糖与磷酸二酯键构成,与之相连的四个碱基以一些特殊次序排成一个多核苷酸序列,从若干个数据库一直到成千上万个基地。研究表明,核苷酸的碱基的主要构成是含氮杂环化合物,这些化和物质主要有嘧啶衍生物和嘌呤衍生物两类。其中嘧啶生物包括胞嘧啶C、尿嘧啶U和胸腺嘧啶T;嘌呤生物包括鸟嘌呤G、腺嘌呤A。鸟嘌呤、腺嘌呤和胞嘧啶同样存在与DNA分子中,但胸腺嘧啶只存在与DNA中。他们相应的化学结构如图。图核苷酸各碱基的化学组成通过对上图的综合分析,我们发现RNA的化学结构并不非常复杂,都是通过氢键分别将A和U、C和G连起来,形成互补碱基配对,不同的地方是连接氢键个数的差别,即A和U之间最多形成两个氢键;G和C之间最多形成3个氢键,如图所示。图碱基配对中的氢键构成除了一些小的RNA病毒,大部分RNA的主要以单链形式存在,但这种单链形式的产生不是偶然,而是在碱基堆积作用下,使单链结构其中个别区段借助碱基的互补配对,将自身折叠并且形成一个短的双螺旋区。这种RNA短双螺旋结构和单一的未配对链结构,与DNA双链双螺旋结构进行对比,其稳定性明显差很多。但正是这一稳定的特点,使RNA能形成更复杂的三维结构。除了“A=U”和“G≡C”配对之外,还存在一些非典型的配对,如“G=U”配对等。在热力学方面,“G=U”配对有稳定性的特点,即同上面两个典型Waston-Crick配对很接近,因此“G=U”配对又称为晃动配对。那么,如果从稳定性上将上述配对放一起做比较的话,通常情况应为“G≡C”>“A=U”>“G=U”。RNA二级结构的特征生物RNA的分子结构分别有一级、二级、三级和四级四种,其中四级结构最复杂。同时,RNA分子结构具有跟蛋白质类似的种类繁多、结构复杂的特点。生物RNA分子中共有四种不同的核苷酸,它们按照不同顺序排列在一起就形成RNA的一级结构。RNA分子存在很多由互补碱基对构成的单链区结构、茎环结构,以及双链结构等各种不同的组件形成的平面结构,并通过这些结构来进行自我折叠运动,所构成的结构就是RNA二级结构。RNA二级结构的组成上文提到,RNA二级结构是RNA分子在自然条件下对自身进行各种形式的回折,在不同的碱基互补对茎区之间,以非匹配的环区形式和最顶部单链形式两者交替出现的茎环结构。这些茎环结构又能分出一些子结构,也叫做RNA二级结构的结构元件,正是这些按一定规律组合在一起的元件才构成了各种RNA完整的二级分子结构。这个复杂的形成过程里面,有三对碱基作为研究的重点,即AU碱基对、GC碱基对和GU碱基对。常见的RNA二级结构如图所示。图常见的RNA二级结构示意图(●表示碱基对,数字表示碱基的序列号)所谓的茎区结构就是我们通过RNA二级结构示意图会发现有一部分双螺旋区域是由两方面组织,一部分是碱基互补对的形式构建起来的,另一部分是其余被隔离在双螺旋区域之外且没有碱基对的单链则形成了环结构。所谓环结构,在RNA二级结构示意图中,我们根据图形与实物的比较,很容易找出几种形象的环形结构,它们有:发卡环、膨胀环、内环和多分支环等如图所示。图茎区及环的示意图RNA二级结构中还有两个重要的组成部分,一个叫做多分支环,它是连接着RNA分子结构各个区域没有实现配对的各个发卡环;另一个叫做自由单链,它是RNA分子结构排序组合最顶端没有形成配对的单链。假结,在RNA分子结构中一般包含两种假结的形式:一种叫做平面假结,是在RNA分子结构中环结构上和环结构外区域的碱基配对,能够以平面图形的表示的形式假结形式;跟前者相反的另外一种情况被称为非平面假结。RNA二级结构的模体是由RNA分子基本单元按照一定的排列组合而构成的。如图所示:二级结构模型以及其个结构单元关系目前,关于RNA二级结构的研究依然是RNA分子结构领域当中的重点和难点。其第一个原因是RNA二级结构是RNA分子从一级结构到三级结构跨越必不可少的桥梁。第二个原因是通过弄清RNA二级结构的预测结果,就可以在大范围内确定RNA三级结构的问题。并且,当研究者的意见都归于一致时,在RNA分子结构当中,对于各个组成方面所具有的生物学意义与其碱基序列的组成相比意义更大,这个对比对非编码的RNA或者DNA同样适用。此外,RNA的分子结构还有一个相似性的特点,就是在各同源RNA当中,通常它的二级结构都是不自觉接受或相像;但是相似存在这个特性几乎不会出现在一级结构上。并且,RNA的同源性和保守型特征都是建立在二级结构的基础上而不是一级结构的保守序列上的。因此,当对某种RNA基本情况有所了解后,研究者就可根据给出的RNA二级结构问题做出相对准确的预测。简单来说,就是通过用计算机手段和有关数学方法,对给定的RNA分子碱基序列按照一些方法来计算,从而最大可能地来测出该RNA分子多具备的二级结构。RNA二级结构预测方法的发展VonHeijne总结并叙述了预测RNA二级结构的各种方法.Tinocoetal第一次大概算出了有关二级结构的能量,他通过研究小分子和利用外推法来预测最稳定的大分子结构。这个预测包括了双链区里堆叠碱基对有关的稳态能量跟未配对区域不稳定的影响,帕帕和麦克马洪研发的程序能够列出tRNA序列里所有有可能的螺旋区。他们采用改良版的威士顿-克里克碱基配对原则,利用排列组合适当的螺旋得到所有可能的二级结构,且测算了任何一个可能结构的全部自由能。斯洛伐克设计出一种能够使合适的双链区相加就获得能量最适合结构的方法。马丁内斯列出了可能双链区,并利用计算波磁慢函数给出之前所指区域在它平衡常量里的比例,这里的-△G是这些区域里的自由能,r为气体常数,t是温度。用蒙特卡洛的办法折叠RNA分子,这个方法当中的每个起始区域都是经一个加权集合里任意选择的,这跟用余吉不思取样的办法是差不多的。假设每一个可能的双链区用袋子里的弹珠来表示。每种类型了弹珠用博磁慢概率给与权重,这样能量越稳定的区域对应的弹珠就越有可能被选中。另外可能区域的选择可通过权重进一步进行,一直到不能再加了。这个方法产生了一系列的通过能量加权的可能结构,但没有考虑到未配对区域不稳定的影响。博磁慢概率函数现在已经被用作找寻最有可能的二级结构了。二级结构预测基本原理分子里的碱基相互配对形成了RNA二级结构。碱基配对有三种形式:G-C、A-U、G-U,他们中间分别有3个,2个跟1个氢键。碱基之间连续不断的配对形成了螺旋区,对RNA二级结构有着稳定作用来降低整体结构的自由能,而RNA分子中没有配对的部分形成“发卡环,内部换,膨胀环跟多分支环”等环装结构,不利于稳定结构和升高结构的自由能,RNA二级机构就是在这种矛盾之间的平衡中形成的。在各种可能结构之间找最小自由能结构是预测RNA二级结构最常用的方法,而通过研究体外少核苷酸稳定性可以得到基本结构的自由能数据。最常用的自由能数据是萨尔泽跟瘤能量积分系统,但在这两组数据中没有提到多分支环的能量计算,目前一般将之作内部处理,或用公式计算:+单链碱基数+螺旋区数目.有了这些数据,就能够评价RNA二级结构的稳定性,通过这种方法可以得到近似稳定能量的结构和最可靠预测结构。在有关序列当中发现的序列变异也能用来预测可能在每个分子里都存在的碱基配对。预测一组可能形成一种特殊结构的序列是RNA二级结构预测方法的另外一种形式。从序列来预测RNA三维结构的方法还在发展当中。还有一种常见的RNA二级结构的预测方法考虑到碱基配对的保守形式,这些形式在一定的rna分子进化过程中是相对保守的。发现序列中碱基配对的区域在rna分子进化的同时发生改变,使结构的完整度能以维持。例如,如果在一个给定类型的序列中两个位置(G和C形成一个碱基对),则在相应的位置上保留了G和C、A和U或U和A的序列被认为是可能的匹配。RNA分子中这些协同变异模式是RNA二级机构的一种表现,课件预测结构。计算上遇到的挑战是如何在其他序列变化的背景中发现这些协同变量的位置。RNA二级结构的表示RNA二级结构的表示方法很多,如半圆表示、圆形表示、点阵表示。山峰表示。正多边形表示等,其中以正多边形表示最为直观形象,便于分子生物学家观察,研究RNA二级结构特征,但是利用这种方法来比较不同的结构是较为困难的,因为利用这种表示方式时,常导致许多结构的重叠,为此,人们不得不借助于旋转的办法来克服重叠现象,这样以来,即使是对同一结构,可能由于在不同的地方旋转或在同一地方旋转的角度不同而导致结构形状的变化。目前,再现结构对结构进行比较的最好方法是树状表示方法,这种方法是从图论的角度来考虑的,与上述方法不同,在RNA二级结构中,每个配对碱基用一个点表示,然后用一条有向线段将点按顺序连接起来,便可获得RNA二级结构的树状表示,在这种显示中,环区碱基等信息将被丢失。最小自由能RNA的二级结构被划分为茎区,外环,凸环,内环,发卡环以及多分枝环等。Zuker,Turner等人详细地给出了各个部分结构的能量计算方法,到目前为止,有些能量值还在不断地被修正和补充。其中较有影响的软件Mfold采用的就是最近邻能量规则,也被称为环依赖的能量规则。环依赖的能量规则在如下三个方面做了约定:二级结构中不允许讯在一个碱基和两个以上碱基同时配对的情形。发卡环的长度必须大于等于3。二级结构中不允许讯在假结,即任意两茎区之间只能是嵌套关系或顺次关系。假结和三碱基配对的情形的能量,由于目前实验手段的限制,和数据不足两方面的原因而无法给出其准确的能量计算公式。碱基i和k配对可以表示为的形式。如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论