(细胞生物学专业论文)小立碗藓(physcomitrella+patens)植物microrna结合靶位预测.pdf_第1页
(细胞生物学专业论文)小立碗藓(physcomitrella+patens)植物microrna结合靶位预测.pdf_第2页
(细胞生物学专业论文)小立碗藓(physcomitrella+patens)植物microrna结合靶位预测.pdf_第3页
(细胞生物学专业论文)小立碗藓(physcomitrella+patens)植物microrna结合靶位预测.pdf_第4页
(细胞生物学专业论文)小立碗藓(physcomitrella+patens)植物microrna结合靶位预测.pdf_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 苔藓植物由三个类群组成:苔类、角苔类和藓类。小立碗藓属于藓类中的葫芦藓科, 小立碗藓属。 由于小立碗藓( 1 ) 具有高的同源重组率;( 2 ) 在由藻类向高等植物进化过程中所处 的独特位置;以及( 3 ) 高度耐盐、耐旱等特性,使得小立碗藓成为重要的模式植物。截 止到2 0 0 7 年3 月,小立碗藓叶绿体基因组、线粒体基因组、基因组草图均已完成;小立 碗藓转录组和蛋白质组数据也在迅速增长,这标志着小立碗藓的研究进入了基因组时代。 m i c r o r n a 是真核生物中长度约为2 1 2 4 个核苷酸的非编码小型内源单链r n a ,普 遍存在于动物、植物中,具有广泛的生物学功能。目前认为,m i c r o r n a 在高等真核生物 体内对基因表达的调控作用可能和转录因子一样重要。研究m i c r o r n a 功能的一个重要方 面就是研究m i c r o r n a 所调节的靶基因的功能。由于多数m i c r o r n a 在亲缘关系近的物种 中是保守的,并且植物m i r n a 与靶基因几乎完全互补,因此可以采用生物信息学方法预 测植物中m i r n a 靶结合位点。 本研究利用8 5 7 条植物m i r n a 序列对2 7 5 4 6 条小立碗藓m r n a 序列进行搜索,预 测出1 6 2 个植物m i r n a 家族在小立碗藓中存在结合靶位。m i r n a 结合靶位数目和m i r n a 协同作用网络分析结果同时显示,m i r 4 8 2 和m i r l1 6 8 在小立碗藓中结合靶位多、协同作 用广,提示它们对于小立碗藓可能具有重要生物学功能。小立碗藓中同时存在5 2 个莱茵 衣藻特有的m i r n a 结合靶位和多种开花植物m i r n a 结合靶位,显示出小立碗藓在从藻 类向种子植物进化过程中处在独特演化位置。 下一步我们将在全基因组范围内预测小立碗藓m i r n a ,并预测它们的靶基因。本研 究为深入研究小立碗藓m i r n a 奠定了基础。 关键词:小立碗藓;m i c r o r n a ;结合靶位预测 英文摘要 p r e d i c t i o no f p l a n tm i c r o r n at a r g e t si np h y s c o m i t r e l l ap a t e n s b r y o p h y t e s i n c l u d et h r e e g r o u p s :l i v e r w o r t s ( m a r c h a n t i o p h y t a ) ,h o m w o r t s ( a n t h o c e r o t o p h y t a ) a n dm o s s e s ( b r y o p h y t a ) p h y s c o m i t r e l l ap a t e n sb e l o n g st of u n a r i a c e a e , p h y s c o m i t r e l l a p p a t e n sh a sah i g hf r e q u e n c yo fh o m o l o g o u sr e c o m b i n a t i o n i tp o s s e s s e sau n i q u ep o s i t i o n i nt h ee v o l u t i o nf r o ma l g at oh i g h e rp l a n t b e s i d e s pp a t e n sh a sa ne x t r e m ea b i l i t yt ot o l e r a t e s a l ta n dd r o u g h t t h e r e f o r e ,pp a t e n sh a sb e e nb e c o m i n ga ni m p o r t a n tm o d e lo r g a n i s m t i l l m a r c h2 0 0 7 ,丽t 1 1t h ec o m p l e t i o no fc h l o r o p l a s tg e n o m e ,m i t o c h o n d r i o ng e n o m ea n dg e n o m e d r a f ts e q u e n c i n g ,pp a t e n se n t e r st h eg e n o m i ca g e m i r n a sa r eac l a s so fn o n - c o d i n ge n d o g e n o u ss m a l lr n a 、析t l lal e n g t ho f21 2 4 n u c l e o t i d e s t h e yh a v eb e e nd i s c o v e r e db o t hi na n i m a l sa n dp l a n t s ,a n dp l a ya 丽d er a n g eo f b i o l o g i c a lf u n c t i o n s m i r n a sa r en o wb e l i e v e dt os h a r et h es a m ei m p o r t a n tr o l e si ng e n e e x p r e s s i o nr e g u l a t i o na st r a n s c r i p t i o nf a c t o r s s i n c et h es e q u e n c e so fm o s tm i r n a sa r eh i g h l y c o n s e r v e da m o n gc l o s er e l a t e ds p e c i e s ,a n dm i r n a sd i s p l a yp e r f e c to ra l m o s tp e r f e c ts e q u e n c e c o m p l e m e n tt ot h e i rt a r g e tm r n as e q u e n c e s ,i ti sf e a s i b l et op r e d i c tt h ep l a n tm i r n at a r g e t s u s m gb i o i n f o r m a t i ca p p r o a c h e s i nt h ep r e s e n tw o r k 8 5 7p l a n tm i r n a sw e r eu s e dt os e a r c h2 7 5 4 6p p a t e n sm r n a s w i n l p a t s c a nf o rc o m p l e m e n t a r yh i t s 16 2m i r n af a m i l i e sh a dp o t e n t i a lt a r g e t si np p a t e n s n l e n u m b e ro ft a r g e t sa n dt h ep o s i t i o ni nm i r n ac o - r e g u l a t i o nn e t w o r kb o mi n d i c a t e dt h a tm i r 4 8 2 a n dm i r l16 8m a yp l a yc r u c i a lr o l e si n 只p a t e n s 5 2c h l a m y d o m o n a sr e i n h a r d t i is p e c i f i c m i r n a sa n dm a n yf l o w e r i n gp l a n tm i r n a ss i m u l t a n e o u s l yh a v i n gt a r g e t si npp a t e n s s u g g e s t e dt h em o s so c c u p i e dau n i q u ep h y l o g e n e t i cp o s i t i o nf r o ma l g a et os e e d i n gp l a n t s n e x t , w ew i l lp r e d i c tpp a t e n sm i r n a st h r o u g hi t sw h o l eg e n o m es e q u e n c ea n d c o r r e s p o n d i n gm i r n at a r g e t s t h i sw o r kl a y saf o u n d a t i o nf o rt h ef u r t h e rs t u d yo fpp a t e n s m i r n a s k e yw o r d s :p h y s c o m i t r e l l ap a t e n s ;m i c r o r n a ;t a r g e tp r e d i c t i o n 图和附表清单等 序号图题页码 图1植物m i c r o r n a 生物发生过程4 图2小立碗藓植物m i c r o r n a 结合靶位预测及分析流程 1 0 图3小立碗藓植物m i r n a 协同作用网络 1 5 图4小立碗藓m i c r o r n a 生物信息学预测流程 1 6 序号表题页码 表l6 种植物的m i r n a 6 小立碗藓中存在开花植物和非开花植物m i r n a 结合 表21 1 靶位 表3小立碗藓中同时存在3 种m i r n a 结合靶位的m r n a1 2 首都师范大学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究 工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或 集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体, 均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 日期) 嘲年厂月6 e t 首都师范大学位论文授权使用声明 本人完全了解首都师范大学有关保留、使用学位论文的规定,学校有权保留 学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权将学 位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅。有权将学 位论文的内容编入有关数据库进行检索。有权将学位论文的标题和摘要汇编出 版。保密的学位论文在解密后适用本规定。 学位论文作者签名: 伟幻 , 日期溯年厂彰日 1 1 模式生物小立碗藓 1 引言 苔藓植物( b r y o p h y t e s ) 由三个类群组成:苔类( m a r c h a n t i o p h y t a l i v e r w o r t s ) 、角苔 类( a n t h o e e r o t o p h y t a h o m w o r t s ) 和藓类( b r y o p h y t a m o s s e s ) 。小立碗藓属于藓类中的葫 芦藓科( f u n a r i a c e a e ) 小立碗藓属( p h y s c o m i t r e l l a ) 。 2 0 0 7 年3 月,美国能源部联合基因组研究所( d o ej o i n tg e n o m ei n s t i t u t e ,j g i ) 公 布了小立碗藓( p h y s c o m i t r e l l ap a t e n ss s pp a t e n se c o t y p eg r a n s d e n2 0 0 4 ) 基因组测序结果 ( 照! ! p ;丛g 星n q 啦宝j g i :p 墨q g b y p 垦! 一! 塾y 乜垦! 一! :i 堕鱼:h ! 堕! ) ,2 0 0 8 年1 月4 日,德国、日本、 英国、美国、澳大利亚和比利时6 国在s c i e n c e 杂志上联合发表了小立碗藓( p h y s c o m i t r e l l a p a t e n s ) 基因组测序草图研究结果( 1 ) ,这是第一个被测序的苔藓植物的基因组,其基因组 大小为4 8 0 m b ,共有2 7 条染色体( 2 ,3 ) 。 小立碗藓之所以引起各国科学家的关注,主要有以下原因: ( 1 ) 小立碗藓是迄今发现的同源重组率最高的高等植物。 为阐明基因组中已知序列的功能,常用的方法是通过同源重组进行基因敲除,即不让 某一个基因表达。真核微生物中的常用工具是酵母,脊椎动物中的常用工具是小鼠的干细 胞。植物基因打靶频率一般在1 0 4 1 0 巧之间( 4 ) ,拟南芥的最高打靶频率为1 0 4 ( 5 ) ,而小 立碗藓的细胞核d n a 同源重组率高达1 0 。1 0 4 ( 6 ) ,是迄今发现的同源重组率最高的高 等植物,小立碗藓因此成为研究植物基因组功能的有效工具。小立碗藓的高同源重组率原 因是科学界至今没有回答的问题。 ( 2 ) 小立碗藓是研究水生植物向陆生植物进化过程的理想物种。 大约4 亿5 千万年前,地球经历了急剧的温度变化和紫外线照射,水生藻类登陆后进 化为陆生植物。苔藓植物在植物种系发生树上位于藻类之后、蕨类和种子植物之前,是早 期陆生植物进化的遗迹,独特的演化位置使得小立碗藓成为研究水生植物向陆生植物进化 过程的理想物种。 ( 3 ) 小立碗藓高度耐旱、耐盐,是识别胁迫适应基因及调控机制有价值的来源。 在从藻类向陆生植物进化的过程中,基因组组成发生着改变,主要包括:基因家簇的 复杂度增加;与水生环境相关( 如,鞭毛臂) 基因的丢失;获得耐受陆地胁迫基因( 如: 温度变化、水的可获得性) ;以及出现生长素和脱落酸信号途径,以协调多细胞生长和脱 水反应( 1 ) 。小立碗藓基因组中存在耐干旱基因、能修复因紫外线或放射线损伤的d n a 的 基因、感光基因和生物钟基因等,这些基因为适应陆地生活而存在,小立碗藓因此成为识 别胁迫适应基因及调控机制有价值的来源。 1 9 9 9 年,英国利兹大学和美国华盛顿大学启动苔藓e s t 计划( t h ep h y s c o m i t r e l l a e s t p r o g r a m ,p e p ) 。截止到2 0 0 8 年2 月2 5 日,n c b i ( h t t p :w w w n c b i n l m n i h g o v ) 收 录的小立碗藓e s t 序列已达3 2 6 0 9 3 条。 2 0 0 3 年,小立碗藓叶绿体基因组测序完成,大小为1 2 2 ,8 9 0b p ,编码8 3 种蛋白质, 3 1 个t r n a ,4 个r r n a 和1 个假基因( 7 ) 。 2 0 0 4 年在德国召开的第七届国际苔藓植物学研讨会上,正式启动了对小立碗藓全基 因测序的工作。 2 0 0 7 年,小立碗藓线粒体基因组测序完成,大小为1 0 5 ,3 4 0b p ,编码4 2 种线粒体保 守蛋白,3 个r r n a ,2 4 个t r n a ( 8 ) 。 2 0 0 8 年1 月,小立碗藓( 尸p a t e n s ) 基因组草图完成,这是第一个被测序的苔藓植物 的基因组( 1 ) 。 小立碗藓基因组草图的完成以及e s t 等相关数据的大量产出为研究小立碗藓的生物 学提供了非常重要的工具,标志着有关小立碗藓的研究进入了基因组时代( 9 ) 。 1 2m i c r o r n a m i c r o r n a 属于非编码r n a ( n o n c o d i n gr n a ) ,它们是真核生物中长度约为2 1 2 4 个核苷酸的小型内源单链r n a ( 1 0 ) 。 1 9 9 3 年,l e e 等通过遗传筛选的方法首次在线虫中发现m i c r o r n a n 4 ( 1 1 ) 。n 一4 在线虫的胚后发育中起调控作用。7 年后,2 0 0 0 年在线虫中发现了第二个m i c r o r n a e t 7 ( 1 2 ) 。l e t - 7 调控线虫由幼虫向成虫的转变。 2 0 0 2 年,在拟南芥中也发现了m i c r o r n a ( 1 3 1 5 ) 。根据m i r b a s e 数据库( 1 0 1 版本) 统计,截止到2 0 0 8 年2 月,在动物、植物,甚至病毒中发现的m i c r o r n a 分子总数已逾 2 0 0 0 种( 1 6 ) 。m i c r o r n a 存在的广泛性和多样性,提示m i c r o r n a 可能具有非常广泛多样 的生物功能,m i c r o r n a 在高等真核生物体内对基因表达的调控作用可能和转录因子一样 重要( 1 4 ,1 7 ,1 8 ) 。 植物m i c r o r n a 基因主要发现于基因组中蛋白编码区以外的区域,这表明多数植物的 m i c r o r n a 基因有他们自己的转录单元( 1 3 ) 。与植物不同,动物m i c r o r n a 基因有时出现 2 在蛋白编码基因的内含子中( 1 0 ,1 9 ) ,通常m i r n a 基因与内含子的转录方向是一致的,这 说明这些基因大多是与蛋白基因共转录,然后再从这些蛋白质基因的内含子中剪切出来 ( 2 0 ) 。植物m i c r o r n a 基因在基因组中有时串联排列,提示多个m i c r o r n a 基因共同转录 形成单一的初级转录物( 2 1 ,2 2 ) 。但这种多顺反子排列方式出现的频数在植物中少于动物 ( 2 3 ) 。 从m i r n a 基因到形成成熟m i r n a 需要经过多个步骤( 2 3 2 6 ) 。首先,m i r n a 基因转 录成初级m i r n a ( p d m i r n a ) ( 图1 ) ,长度通常为几百个核苷酸,这一步受p o li i 控制。 目前,人们对m i r n a 基因如何转录成为p n m i r n a 还知之甚少。第二步,初级m i r n a 经剪切形成含有茎环结构的中间体,被称为前体m i r n a ( m i r n ap r e c u r s o r 或 p r e - m i r n a ) 。在动物中,这一步受d r o s h ar n a s ei i i 内切酶调控;在植物中受d c l i ( d i c e r - l i k e1 ) 调控。接下来,动物中的前体m i r n a 从细胞核被转运到细胞质,形成 m i r n a :m i r n a * 双链体( d u p l e x ) ,它由成熟m i r n a 与m i r n a * 组成。m i r n a * 是 p r e m i r n a 上的一段r n a ,其位置恰好与成熟的m i r n a 相对( 1 0 ) 。m i r n a :m i r n a * 双 链体再经过被称为d i c e r 的r n a s ei i i 1 i k e 酶加工形成成熟m i r n a 。而在植物中,前体 m i r n a 仍停留在细胞核中,d c l l 将其切割形成m i r n a :m i r n a * 双链体后,再被转运 到细胞质。 在细胞质中,动物和植物的m i r n a 都在解旋酶的作用下,由双链变为单链的成熟 m i r n a 。最终,成熟m i r n a 进入被称为r i s c ( r n a i n d u c e ds i l e n c i n gc o m p l e x ,r n a 诱 导的沉默复合体) 的核蛋白复合体。 在r i s c 中,m i r n a 与靶m r n a 通过完全的或近于完全的互补结合,抑制基因的表 达,导致基因沉默。在动物中,这个过程被称为r n a 干扰( r n ai n t e r f e r e n c e ,r n 加) ; 在真菌中被称为静息( q u e l l i n g ) ,在植物中被称为转录后基因沉默( p o s t - t r a n s c r i p t i o n a lg e n e s i l e n c i n g ,p t g s ) 。 在r i s c 复合体中,m i r n a 与靶m r n a 以完全或近乎完全互补的形式结合,从而抑 制基因的表达( 2 4 ) 。动物m i r n a 通常以不完全互补的方式结合到靶m r n a 的3 - u t r , 且有多个结合位点。这种结合阻碍了核糖体沿m r n a 的移动,从而抑制了基因的表达。 在植物中,多数靶m r n a 只存在一个m i r n a 的结合位点,并且以完全互补的方式结合, 结合后靶m r n a 被切割。另外,植物中m i r n a 的结合位点可以存在于靶m r n a 的任何 地方,而不只限于y - u t r 。在植物中也发现有通过抑制核糖体移动来抑制基因表达的情 况,这表明植物m i r n a s 不仅可以通过抑制m r n a 翻译,而且可以通过直接对m r n a s 3 进行切割在转录后水平调节基因表达。在植物中还发现,m i r n a 靶基因的反馈调节可能 是一种对靶基因表达进行精细调节敏感机制( 2 7 ) 。在植物中m i r n a 控制基因表达的机 制可能比在动物中复杂( 2 4 ) 。 。n 。一卜_ p c mr - 弋 rd o _ t e 。h 。i q + 繇嚣- - u i i m i l l 一 1 l “m 4 , 2 黜“”m i _ i i - _ l l p l 兰 m a w r * m i r n a “r n ”d 。g r “a “ n 口 c o m p 4 e x 1 图1 植物m i c r o r n a 生物发生过程( 2 5 ) f i g u r el t h eb i o g e n e s i so f p l a n t m i c r o r n a ( 2 5 ) 4 一 孽 。 型 采用实验手段鉴定m i r n a 的方法主要有两种:正向遗传学法( f o r w a r dg e n e t i c s ) 和 直接克隆法( d i r e c tc l o n i n g ) ( 2 5 ) 。最先在线虫中发现的m i r n a 就是采用正向遗传学法得 到的( 1l ,1 2 ) ,直接克隆法从生物样品中分离并克隆m i r n a ( 1 0 ,2 8 ) 。 采用实验方法鉴定m i c r o r n a 在技术上存在挑战和不完整性,主要原因有:( 1 ) m i c r o r n a 的表达具有组织特异性和表达时间特异性;( 2 ) m r n a 降解物和其它内源非编 码r n a 与m i c r o r n a 共存,并且有时在细胞提取物的小r n a 分子样品中占主要成分。 因此通过测定小r n a 分子序列的方法筛选m i c r o r n a 的效率很低( 2 5 ,2 9 ) 。 多数m i c r o r n a 在亲缘关系近的物种中是保守的( 1 0 ,1 3 ,2 8 ,3 0 3 2 ) 。成熟m i c r o r n a 中 强的序列保守性和m i c r o r n a 前体中长的发卡结构使得采用生物信息学方法在全基因组 范围( 相同基因组或不同基因组) 内寻找m i c r o r n a 成为可f l 邕( 2 5 ,2 9 ) 。目前已提出一些专 门用于预测植物m i c r o r n a 的算法( 2 2 ,2 9 ,3 3 ,3 4 ) ,这些方法利用了m i c r o r n a 二级结构的 保守性作为过滤器,某些方法还利用了植物m i c r o r n a 与靶基因具有高的互补性作为判定 标准( 2 2 ,3 3 ) 。 植物m i r n a 与靶基因几乎完全互补,利用这一特点可以采用生物信息学方法预测植 物中m i r n a 靶结合位点( 1 7 ) 。对于保守的m i r n a ,在预测靶基因时可以插入空位和允许 更多的错配( 2 2 ) 。r h o a d e s 等预测了拟南芥中1 4 个m i r n a 的靶位( 1 7 ) ;w a n g 等利用计算 机方法从拟南芥中鉴定了8 3 个新m i r n a s ,并预测了它们的结合靶位( 2 9 ) 。 最近,在小立碗藓中鉴定出5 6 1 1 0 2 条s m a l lr n a 序列( 包括s i r n a 和m i r n a ) ( 3 5 ) , 去冗余后得到2 1 4 9 9 6 条非冗余序列,其中1 2 7 1 3 5 条序列在小立碗藓基因组中找到至少一 处匹配,又有4 2 的s m a l lr n a ( 5 3 4 0 0 多条) 被认为是m i r n a ( 3 5 ) 。这些结果表明,小 立碗藓表达了大量的内源s i r n a 和m i r n a 。 预测小立碗藓( p h y s c o m i t r e l l a p a t e n s ) 植物m i c r o r n a 结合靶位将为小立碗藓功能基 因组学研究提供重要的数据。本文利用m i r b a s e 数据库中收录的植物m i r n a ,对小立碗 藓m r n a 序列进行搜索,预测出小立碗藓中存在1 6 2 个植物m i r n a 家族的结合靶位。 通过分析m i r n a 结合靶位数目和m i r n a 协同作用网络,筛选出m i r 4 8 2 和m i r l1 6 8 在 小立碗藓中具有潜在重要生物学功能。5 2 个莱茵衣藻特有的m i r n a 在小立碗藓中被预测 出存在结合靶位,为研究从藻类向苔藓植物的演化提供重要参考。 2 1 数据 2 数据和方法 2 1 1 小立碗藓m r n a 帆p h y s c o b a s e 数据库() f 裁小屯碗藓m r n a 序列2 7 5 4 6 条 这些m r n a 序列 f1 4 2 1 8 2 条e s t 序列拼接而成。 2 1 2 植物m i r n a 从m i r b a s e 数据库( 1 0 1 版本) ( 1 6 ) 下载6 种植物的m i r n a 序列8 5 7 条( 表1 ) ( j ,共5 4 7 种r n i r n a ,它们分别属于2 2 个m i r n a 家族。 表16 种植物的m i r n a t a b l e1m i r n a sf r o m6p l a n t so r g a n i s m s 物种托丁名简写m i r n a 条数 拟南芥 a r a b i d o p s i st h a l i a n a a t h 1 9 9 莱菌衣藻 c h l a m y d o m o n a sr e i n h a r d t i i 7 2 水稻 ( h 憎口s a l i v a2 4 3 毛果杨 p o p u l u st r i c h o c a r p a p t c 2 1 5 小麦什e f 把l 硎a e s t i v “m3 2 玉米 z e d m a y s 9 6 2 i 3 小立碗藓蛋白序列 从d o ej o i n tg e n o m ei n s t i t u t e ( 共3 5 9 3 8 条。 2 2m i r n a 结合靶位的预测 下载小立碗藓蛋白序列( v l1 ) 利用p a t s c a n ( 3 6 ) 在2 7 5 4 6 条小立碗藓m r n a 中搜索与8 5 7 条植物m i r n a 互补的序 列( 图2 ) 。搜索条件同r h o a d e s 聚用的标准:互补序列中最多允许4 个碱基不互补,不 允许存在空位( 1 7 1 。 p a t s e a n 本地化程序“$ c 8 r lf o rm a t e h e s t a rz ”从 下载。 解压缩后得到以下文件: r e a d m e g g p u i l _ k c r u n t e s t s s h o wh i t s t e s t _ d n a _ p a t t e r n s t e s t _ o u t p u t t e s t _ p r o t _ i n p u t t e s t _ p r o t _ _ p a t t e m s t e s t i t t i l i sd o c u m e n t o n eo ft h et w os o u r c ef i l e s n l es e c o n ds o u r c ef i l e a p e r ls c r i p tt ot e s tt h i n g s a h a n d yp e r ls c r i p t t e s ts e q u e n c e sf o rd n a t e s tp a t t e r n sf o rd n as c a l a d e s i r e do m p mf r o mt e s t t e s tp r o t e i ns e q u e n c e s t e s tp a t t e r n sf o rp r o t e i n s ap e r ls c r i p tu s e df o rt e s t 其中,只有前三个文件是必需的。 采用c 语言编译器( 如:g e e 或c y g w i n ) 对文件“s c a n f o r m a t c h e s c 进行编译,生 成“s c a n f o r m a t c h e s e x e ”可执行文件。程序运行之前,还要将文件“c y g w i n l d l l ( 自 己下载) 拷贝到“c :w l n d o w s s y s t e m 目录中。c y g w i n l d l l 提供了从l i n u x 的调用到 w i n d o w s 之间的解释。 s c a nf o rm a t c h e s e x e 的命令格式为: s c a n _ f o r _ m a t c h e s e x e 保存搜索模式的文件名 结果输出文件名 如。 s c a nf o r _ m a t c h e s e x ea t h m i r l5 6 a p s _ a t h - m i r l5 6 a 其中,文件“a m m i r l 5 6 a 中的内容为: a c u g u c u u c u c u c a c u c g u g 4 ,0 ,0 】 序列“a c u g u c u u c u c u c a c u c g u g 为a t h m i r l 5 6 a 的核酸序列;中括号中的数 7 字4 、0 、0 分别代表“互补序列中最多允许4 个碱基不互补,不允许存在插入和空位”。 “m o s s c o n t i g s 文件中以f a s t a 格式保存了2 7 5 4 6 条小立碗藓m r n a 序列,如: r p p s p 6 k 2 3 a t c g g t t a c t g t g t c c g a g g t e a g a a t t a a a c a g a a t c a g t t t g g e t a c e a t a t t c a t a t a t t t g g g a g e e a a a e t g t t a a a a e a t a t t g t g t e t a g g t a t c a t g a c g a g e c c c a c m m c g t g a t c a g a a a a t a a c c c c a c t c t c a a a a a a g a a t g a a a a a t c a c c a a c c a a c c a a a c a a c c a c c a g g c a a c t a c t c t t a t a t t t t c t a t t g c t c a t g t g g a t t c a a t a t t t a e a g a t t a a g g t g a g g g a t t a g c t t g t a a e c a t t a g g e t a a c t g t g c a c t a t t g g a a t c c t t a a g a g a c a c a c t c c a a g a t a c a g a a t c t a g c t e c c g g g a g c e a g a g a a g a a t a g a g c a t c c c a 命令执行结束后,生成“p sa t h - m i r l 5 6 a ,其内容为: c o n t i 9 2 0 3 :f 7 4 ,9 3 1 a c g g t c t t c t c c c a t t c c t g c o n t i 9 2 5 6 6 : 58 2 ,6 0l1 c c t a t c t t c c c t c a c t g ( t g c o n t i 9 2 9 4 7 : 1 0 9 ,1 2 8 1 a a t g a c t t c t a t c a c t g g t g c o n t i 9 7 6 7 5 : 9 ,2 8 a a a g t c g t c t c t c a c t c g t c c o n t i g l 0 0 4 8 : 6 9 ,8 8 1 a c t g t c t t c c c t c t c t c t t c c o n t i 9 1 0 0 4 9 : 7 4 ,9 3 1 a c t g t c t t c c c t c t c t c t t c c o n t i g l1 7 1 0 : 2 6 0 ,2 7 9 1 a c t a c c t g g t c t c a c t c g t g c o n t i 9 1 3 3 4 2 : 6 6 6 ,6 8 5 1 a g t g g _ g t t c t c t c a c t t g t g r p p s p 2 0 0 9 : 1 2 1 ,1 4 0 】 a a t g t c t t c t c g c t t t c g t g 结果显示,“a t h m i r l 5 6 a 在9 条小立碗藓m r n a 中存在结合位点。中括号中的数 字表示在m r n a 中结合位点的起止位置。 对8 5 7 条植物m i r n a 在2 7 5 4 6 条小立碗藓m r n a 中搜索互补位点的工作是通过先 编写一个p e r l 脚本( p a t s c a n p 1 ) ,生成批处理文件( p a t s c a n b a t ) ,然后运行批处理文件, 一次完成全部搜索。 8 2 3m i r n a 协同作用网络的构建 如果几个m i r n a 家族在一条小立碗藓m r n a 中同时存在结台靶位,则称这组m i r n a 具柏协问作用。收集所有具有协同作用的m i r n a 数据,编辑并保存为d l 文件。格式如f : d 】 n8 4 l a b e l se m b e d d e d f o r m a r = n o d e l i s t d a t a : m 1 r 1 1 4 5m i r 3 9 9 m i r l l 4 6m i r l l 2 7 m i r l l5 9m i r 4 8 2 m l r i1 6 0m i r l l 6 8 其中“n - 9 4 ”表示,e 有8 4 组数据。 然后利用u c i n e t 软件( ) 中“n e t d m w ” 工具构建m i r n a 协同作用网络。文件类型为d l 文件数据类型为“i - m o d e n e t w o r k ( s j ”。 2 4 小立碗藓植物m i e r o r n a 结合靶位蛋白功能的注释 首先进行b l a s t 程序f 3 7 ) 的本地化安装。从n c b i1 0 2b l a s t 本地化安装程序并安装。 然后进行数据库的格式化。对小碗薛蛋门序列数据库和u n i p r o t ( s w i s s p r o t + t r e m b l ) 数据库进行格式化。 品后,计台有植物m i r n a 结合靶位的小立碗藓m r n a ,利用b l a s t x 程f # 搜索小立碗 鲆蛋白序列数据席,得到这些m r n a 编码的蛋白序列:再利用b l a s t p 程序对u n i p r o t ( s w i s s p r o t + t r e m b l ) 数据库进行攫索。b l a s t 搜索条件均为e = o0 0 l ;打分矩眸为 b i o s u m 6 2 ; 舭撕u n i p r o t 数据库中对蛋白i n t e r p r o 结构域注释信息,榆索“i n t e r p r 0 2 9 0 ”( f 载 自:,对小立碗藓m r n a 编码的蛋 白进行g o 功能注释。 小立碗藓植物m i c r o r n a 结合靶位预测及分析流程归纳见图2 。 图2 小立碗藓植物m i c r o r n a 结合靶位预测及分析流程 f i g 2 f l o w c h a r to fp r e d i c t i o na n da n a l y s i so fp l a n tm i c r o r n at a r g e t si np p a t e n s 植物m i r n a 的保守性 结果和讨论 对m i r b a s e 数据库( 1 0 1 版本) 来自6 种植物的5 4 7 种m i r n a 的保守性进行了统计。 结果显示,本研究所用m i r n a 数据中,4 0 5 种m i r n a 只出现在1 个物种中,1 4 2 种m i r n a 出现在2 种或2 种以上的物种中。 3 2 小立碗藓中植物m i r n a 结合靶位的预测 在2 7 5 4 6 条小立碗藓m r n a 中,共预测出3 9 0 种植物m i r n a 存在结合靶位( 附表1 ) , 它们分别属于1 6 2 个m i r n a 家族,占已知植物m i r n a 家族总数的7 3 3 ( 1 6 2 2 2 1 ) 。 其中1 3 1 种m i r n a 在表l 的6 种植物中出现在2 种或2 种以上的物种中( 附表1 ) 。 m i r l 5 9 a 、m i r l 5 9 b 和m i r 4 0 8 保守存在于除莱茵衣藻外的其它5 种开花植物中。 m i r l 5 9 a 和m i r l 5 9 b 的靶基因为m y b 3 3 和m y b 6 5 ( 3 8 ) 。m y b 3 3 和m y b 6 5 是两种转录因 子,它们在花粉囊的发育过程中能阻止绒毡层的过度生长。过量表达m i r l 5 9 将导致开花 时间延迟和花粉囊发育缺陷使繁殖能力丧失( 3 9 ) 。m i r 4 0 8 是一种与胁迫反应有关的 m i r n a ,它的靶基因编码水解酶和氧化还原酶,这两种酶对许多胁迫反应作出响应( 4 0 ) 。 l o 除m i r l 5 9 和m i r 4 0 8 外,一些已知与胁迫反应相关的m i r n a ,如:m i r l 5 6 、m i r l 6 5 、 m i r l 6 7 、m i r l 6 8 、m i r l 6 9 、m i r l 7 1 、m i r l 7 2 、m i i u l 9 、m i i 毽9 3 、m i r 3 9 4 、m i r 3 9 6 和 m i r 3 9 7 ( 4 0 ) 在小立碗藓中也都存在靶基因。 m i r l 5 6 、m i r l 5 9 、m i r l 6 5 、m i r l 6 9 、m i r l 7 l 、m i r l 7 2 、m i r 3 1 9 和m i r 3 9 6 的靶基 因为转录因子,这些转录因子参与进一步调节基因表达和信号转导( 2 2 ,4 1 ) 。对上述m i r n a 进行诱导将导致某些相应的转录因子受到抑制,进一步影响到一系列特殊的蛋白编码基 因,并对胁迫产生防御作用( 4 0 ) 。m i r l 6 7 、m i r l 6 8 、m i r 3 9 3 和m i r 3 9 4 与胁迫反应或外 界刺激直接相关。m i r 3 9 3 和m i r 3 9 4 的靶基因编码f b o x 蛋白,该蛋白在非生物胁迫反 应途径中起重要作用( 2 2 ,4 2 ,4 3 ) 。 莱茵衣藻是单细胞绿藻,在进化过程中占有独特的位置,是研究基体( b a s a lb o d y ) 、 叶绿体和鞭毛的重要的模式系统( 4 4 ,4 5 ) 。莱茵衣藻m i r n a 与高等植物m i r n a 在序列上 不存在相似性( 4 5 ,4 6 ) ,但在许多方面仍与高等植物具有相似性。如:m i r n a 的长度;5 端倾向出现尿嘧啶;由d i c e r 对茎环结构加工产生;可指导对靶r n a 切割( 4 5 ) 。值得注意 的是,小立碗藓中不仅存在5 2 个莱茵衣藻特有的m i r n a 的结合靶位( 表2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论