(细胞生物学专业论文)脊椎动物中线粒体基因片段向核内转移的比较分析.pdf_第1页
(细胞生物学专业论文)脊椎动物中线粒体基因片段向核内转移的比较分析.pdf_第2页
(细胞生物学专业论文)脊椎动物中线粒体基因片段向核内转移的比较分析.pdf_第3页
(细胞生物学专业论文)脊椎动物中线粒体基因片段向核内转移的比较分析.pdf_第4页
(细胞生物学专业论文)脊椎动物中线粒体基因片段向核内转移的比较分析.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(细胞生物学专业论文)脊椎动物中线粒体基因片段向核内转移的比较分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

脊椎动物中线粒体基冈片段向核内转移的比较分析 摘要 线粒体基因频繁的向细胞核中转移,产生了一些与线粒体基因同源并且没 有表达功能的序列。这种序列就被称为线粒体假基因,即n u m t s( n u c l e a r m i t o c h o n d r i a ld n a s e g m e n t s ,简称n u m t s ) 。线粒体假基因目前在植物、昆虫和 哺乳动物中研究较为广泛,但对于鸟类核基因组中的线粒体假基因研究却很少。 随着聚合酶链式反应( p c r ) 和d n a 测序技术的发展,线粒体d n a ( m t d n a ) 已成为鸟类系统学和进化研究的理想分子标记。目前公共数据库( g e n b a n k ) 中,鸟类仅有6 个目( 雁形目、鸽形目、隼形目、鹆形目、鸡形目和雀形目) 存在线粒体假基因共2 4 4 条( 包括实验室前期获得的n u m t s 序列) 。 利用g e n b a n k 上9 个物种的线粒体基因组的数据( 家鸡( g a l l u sg a l l u s , n c 一0 0 1 3 2 3 ) 、,j 、鼠( m u sm u s c u l u s ,n c 一0 0 1 6 6 5 ) 、大鼠( r a t t u sn o r v e g i c u s , n c _ 0 0 5 0 8 9 ) 、猪( s u ss c r o f a ,n c 一0 0 0 8 4 5 ) 、家牛( b o st a u r u s ,n c 一0 0 6 8 5 3 ) 、 家狗( c a n b sf a m i l i a r i s ,n c0 0 2 0 0 8 ) 、猕猴( r h e s u sm a c a q u e ,n c0 0 5 9 4 3 ) 、 黑猩猩( p a nt r o g l o d y t e s ,n c0 0 1 6 4 3 ) 、人( h o m os a p i e n s ,n c0 0 1 8 0 7 ) ) 为诱饵序列,在n c b i 中分别与其核基因组序列进行做b l a s t n 同源性序列比 对,推断同源性较高的为线粒体假基因( n u m t s ) ,对其线粒体序列和n u m t s 侧 翼序列分析。结果如下:家鸡、小鼠、大鼠、猪、牛、狗、猕猴、黑猩猩和人 类核基因组中存在的n u m t s 数量分别为1 5 、4 4 、1 7 、2 1 、3 9 、6 9 、9 2 、1 5 9 及 1 4 7 条;在猕猴、黑猩猩和人的核基因组中的线粒体假基因序列分别涵盖了其 各自线粒体基因组的全部序列;9 个物种中线粒体r r n a 基因向核内转移的次 数最多。分析n u m t s 侧翼序列的重复元件发现:家鸡核基因组序列中仅有不到5 的序列含有重复序列,并认为家鸡中的任何一条n u m t 都是独立插入到核基因 组中。n u m t s 侧翼序列g c 含量均小于4 4 。对n u m t s 侧翼序列的分析有助于 进一步了解线粒体基因向核基因组转移的机制。 关键词:脊椎动物,线粒体d n a ,线粒体假基因,插入机制,侧翼序列 a b s t r a c t c o n t e n t :m i t o c h o n d r i a ld n a s e q u e n c e sa r ef r e q u e n t l yt r a n s f e r r e dt ot h en u c l e u s g i v i n gr i s et ot h es o c a l l e dn u m t ( n u c l e a rm i t o c h o n d r i a ld n a s e g m e n t s ) w h i c hn o t o n l yh o m o l o g o u st om t d n ab u ta l s on oe x p r e s s i o nf u n c t i o n s m i t o c h o n d r i a l p s e u d o g e n e sa r eg r e a t l yr e s e a r c h e di np l a n t s ,i n s e c t sa n dm a m m a l s ,h o w e v e r ,w h i c h i na v e sh a sal e s sr e s e a r c h w i t ht h ec o n c u r r e n td e v e l o p m e n t so f p o l y m e r a s ec h a i n r e a c t i o n ( p c r ) a n dd n as e q u e n c i n gt e c h n o l o g y , t h em i t o c h o n d r i a ld n a ( m t d n a ) h a sb e c o m eav e r yu s e f u lm o l e c u l a rm a r k e rf o rs t u d y i n ga v i a ns y s t e m a t i c sa n d e v o l u t i o n a r yb i o l o g y c u r r e n t l y , t h e r ea r eo n l y2 4 4n u m t sc o n t a i n i n gg a i n e db yl a bi n s 1 x o r d e r s ( a n s e d f o r m e s , c o l u m b i f o r m e s ,f a l c o n i f o r m e s ,g a l l i f o m e s 。 c h a r a d r i i f o r m e sa n dp a s s e r i f o r m e s ) o fa v e si np u b l i cd a t a b a s e ( g e n b a n k ) n c b i - b l a s t nw a sc a r r i e do u tw i t hm i t o c h o n d r i a la n dc o r r e s p o n d i n gn u c l e a r g e n o m eo fn i n es p e c i e si nv e r t e b r a t e s ( g a l l u sg a l l u s ( n c0 0 1 3 2 3 ) ,m u sm u s c u l u s ( n c _ 0 0 1 6 6 5 ) ,r a t t u sn o r v e g i c u s ( n c _ 0 0 5 0 8 9 ) ,s u ss c r o f a ( n c0 0 0 8 4 5 ) ,b o s t a u r u s ( n c _ 0 0 6 8 5 3 ) ,c a n s f a m i l i a r i s ( n c _ 0 0 2 0 0 8 ) ,r h e s u sm a c a q m e ( n c _ 0 0 5 9 4 3 ) ,p a nt r o g l o d y t e s ( n c _ 0 0 1 6 4 3 ) ,h o m os a p i e n sm c s e q u e n c e sw i t hh i g hh o m o l o g yw e r ec o n s i d e r e da s n u m t s i no u rf i n d i n g s t h e n u m b e ro fn u m t si ng a l l u sg a l l u s ,m u s m u s c u l u s ,r a t t u sn o r v e g i c u s ,s u ss c r o f a ,b o s t a u r u s ,c 口,l 括f a m i l i a r i s ,r h e s u sm a c a q u e ,p a nt r o g l o d y t e sa n dh o m os a p i e n sw e r e 1 5 ,4 4 ,1 7 ,2 1 ,3 9 ,6 9 ,9 2 ,1 5 9a n d1 4 7 ,r e s p e c t i v e l y t h es e q u e n c e so fn u m t si nr h e s “s m a c a q u e ,p a nt r o g l o d y t e sa n dh o m os a p i e n ss p a n1 0 0 o ft h ee n t i r em a m m a l i a n m i t o c h o n d r i a lg e n o m e t h e r e c o n s t r u c t e d 行e q u e n c yo fm i t o c h o n d r i a lg e n et r a n s f e r t on u c l e u ss h o w sr r n a g e n eh a sm o r ef r e q u e n c yt h a no t h e rm i t o c h o n d r i a lg e n e u s i n gt h er e p e a t m a s k e rp r o g r a m ,w ed e t e c t e dt h et r a n s p o s a b l ee l e m e n t si nt h e f l a n k i n gr e g i o n so fe a c hn u m t t h er e s u l ts h o w sl e s st h a n5 o fn u c l e a rs e q u e n c e w e r er e p e t i t i v ee l e m e n t s f u r t h e r m o r e ,t h e s en u m t sa r ec o n s i d e r e dt oi n d e p e n d e n t i n s e r t i o nf r o mt h em i t o c h o n d r i ai n t ot h en u c l e u si ng a l l u sg a l l u s t h eg c c o n t e n to f 5 a n d3 - f l a n k i n gr e g i o no fn u m t si nn i n es p e c i e s i sl e s st h a n4 4 t h ea n a l y s i so f n u m t sf l a n k i n g s e q u e n c e sp r o v i d e sav a l u a b l eu n d e r s t a n df o rf u t u r e s t u d yi n m e c h a n i s mo fm o t i c h o n d r i a lt r a n s f e rt on u c l e u sa n dt h es i t eo fn u m t i n t e g r a t i o n n 脊椎动物中线粒体基因片段向核内转移的比较分析 k e y w o r d s :m i t o c h o n d r i a ld n a , n u m t s ,n u c l e a ri n s e r t i o n ,f l a n k i n gs e q u e n c e , v e r t e b r a t e i i i 脊椎动物中线粒体基因片段向核内转移的比较分析 学位论文独创性声明 本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。论 文中除特别加以标注和致谢的地方外,不包含他人和其他机构已经撰写或发表 过的研究成果,其他同志的研究成果对本人的启示和所提供的帮助,均已在论 文中做了明确的声明并表示谢意。 学位论文作者签名:劫彩厶彝致 e t期:砂阳富、6 、j 学位论文版权的使用授权书 本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定, 及学校有权保留并向国家有关部门或机构送交复印件或磁盘,允许论文被查阅 和借阅。本文授权辽宁师范大学,可以将学位论文的全部或部分内容编入有关 数据库并进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。保密的学位论文在解密后使用本授权书。 学位论文作者签名: 询淑缎 指导教师签名: 日期: 脊椎动物中线粒体基冈片段向核内转移的比较分析 1 1 线粒体的起源 第一章线粒体基因组的进化 1 9 2 2 年,w a l l i ni l 】提出线粒体起源于内共生,认为线粒体和它的基因组是 在真核细胞产生的早期进入细胞内与之共生形成的,即线粒体起源于一种早期 曾经自由生存的能够利用氧气的细菌。随后,m a r g u l i s 【2 】在1 9 7 0 年支持并扩展 了这一学说。他们认为线粒体是由原始的真核细胞吞噬需氧菌或被它穿透而产 生的。随着越来越多的线粒体基因组被测序,对于线粒体的起源问题已经没有 争议,内共生假说得到广泛接型3 1 。现在几乎可以确定这种能需氧菌就是一种a 蛋白细菌。但随着时间的流逝,线粒体和它的祖先_ a 蛋白细菌相比,在 编码基因数量上相差非常大( 一般相差1 3 个数量级) ,已知最小的a 蛋白细 菌基因组能编码1 6 0 0 种基因。这可能是内共生体祖先体内的功能基因从线粒体 基因组转移到核基因组的结果i j 。在大多数真核生物的线粒体中都发现了环状 的基因组,这不仅支持了内共生假说,而且还证明了在大而复杂的核基因区之 外存在着一个小且容易分离的遗传信息。然而,线粒体作为仍然还是新陈代谢 和生物化学的复合体的细胞器,其最少需要数百个蛋白来维持正常的功能。线 粒体基因被有效的分成3 类,即r r n a ,t r n a 和蛋白质编码基因。 1 2 脊椎动物的线粒体基因组 1 9 6 2 年,n a s s 等从鸡胚细胞发现了线粒体d n a ( m t d n a ) 【6 1 ,从此为细 胞信息结构的研究掀开了新的一页,线粒体基因组就迅速成为脊椎动物系统发 育研究中最活跃的领域之一。线粒体d n a 是细胞内相对独立的基因组,同时也 是细胞内较小而又较易纯化的复制转录单位。动物线粒体基因组的长度大多在 1 6k b 左右,为共价闭合环状双链d n a 。基因组结构比较简单,并具有很高的专 一性和独特性。线粒体除了易分离和基因组小以外,还有许多其他的特点。第 一,线粒体是母系遗传的。第二,目前还没有直接的证据证明线粒体可以与其 它m t d n a 分子进行整合重组。第三,在序列水平上m t d n a 比核基因组d n a 进 化快,因此,它是研究物种间及种内进化关系和遗传多样性的有效的分子标记。 脊椎动物中线粒体基因片段向核内转移的比较分析 但随着系统发育层次深度的增加,其作用越来越小。 首批被完整测序的线粒体基因组包括人、鼠、牛和蛙类。测序后发现它们 不但含有相同的基因,而且基因排列顺序也相同,在硬骨鱼中也有同样的发现, 所以推测所有脊椎动物m t d n a 基因组都是相同的。随着越来越多物种线粒体 基因组被测序,发现基因顺序特别是t r n a 基因并不是固定不变的。例如,四 足动物中的有袋类、蛙类、鳄鱼类都有关于t r n a 转座的报道。l e e 掣7 】发现在 硬骨鱼的外群七鳃鳗的调控区附近,也有几处基因的顺序发生了变化,其中有 的区段包括t r n a 基因。目前发现所有脊椎动物的m t d n a 都包括2 2 个t r n a 基因,1 3 个蛋白编码基因,2 个r r n a 基因和1 或2 个( 七鳃鳗中) 较大的非 编码区。其中t r n a 基因包括家鸡的线粒体基因组与其他脊椎动物相比虽然含 有相同的基因,但这些基因排列的顺序却是独特的( 图1 1 ) 。其他研究也表明, 在很多鸟类中都存在基因顺序的改变。虽然在其他脊椎动物中也发现过t r n a 的重排,但鸟类和七鳃鳗基因组却是唯一发生大规模基因重排的,其基因重排 包括了蛋白编码基因。 a b 图1 1 家鸡( a ) 与哺乳动物( b ) 线粒体基因组的比较 f i 9 1 1c o m p a r i s o no fm i t o c h o n d r i a lg e n o m ei nc h i c k e n ( a ) a n dm a m m a l ( b ) 1 3 线粒体和细胞核之间的基因组交流 至从1 9 8 2 年s t e r n 和l o n s d a l e 对基因组之间遗传信息的转移进行研究而来 f 8 】,目前已证明了细胞器和细胞核之问有着普遍性的遗传信息的交流【9 1 2 1 ,其中 2 脊椎动物中线粒体基因片段向核内转移的比较分析 有5 种典型的基因组之间的转移,即线粒体和细胞核之间的转移、叶绿体和线 粒体之间的转移及叶绿体向核中的转移【1 3 】。 1 3 1 线粒体基因向细胞核的转移 在大多数的真核生物中,线粒体序列向核的转移是一个持续的过程。这种 转移被分成2 种类型,一种是转移后可以正常表达具有功能,从而在进化过程 中,取代原线粒体基因组中的这部分基因使之被线粒体基因组所丢弃,造成线 粒体基因组缩小;而另一种则是产生不表达的假基因。这种假基因片段大小变 化非常大,小的仅有几十个核苷酸,大的则有可能是整个线粒体基因组的转移 ( 例如在拟南芥的2 号染色体的着丝粒处发现的几乎是全线粒体基因组的序列 片段) 【1 4 j 。一般在动物中,由于线粒体的遗传编码与核中的不刚1 5 】,导致大多 线粒体基因转移后便立即失去功能,成为线粒体假基因。此外,还有可能是因 为转移过程中出现了有害突变或者没有及时获得真核细胞基因表达所必需的原 件,造成基因失去表达能力,当然就没有达到功能性转移的目的。 1 3 2 细胞核基因向线粒体的转移 线粒体在进化的早期阶段进行了大量基因转移之后,动物线粒体与细胞核之 间的这种转移过程似乎已处于静止状态,然而在高等植物中这种转移还远未停 止,并认为高等植物线粒体与核之间遗传信息的交流是双向的。马玲薯和月见 草线粒体基因组中存在着来自细胞核的t r n a 、1 8 sr r n a 和r p s 4 基因的部分序 列;拟南芥和甜菜线粒体基因组中,核d n a 序列分别占到了4 0 和3 3 。但 是,在动物线粒体中这种线粒体基因向核中的转移则具有单向性1 1 6 】。目前仅在 软珊瑚( s a r c o p h y t o ng l a u c u m ) 的线粒体d n a 中发现与细菌核中的m u t s 基因 同源的一段序列1 1 7 j ,并认为可能是在珊瑚群进化的早期从核d n a 中获得这个 m u t s 基因。 3 脊椎动物中线粒体基冈片段向核内转移的比较分析 第二章线粒体假基因研究进展 随着分子生物学技术的快速发展,分子进化已成为近年来进化生物学研究 中的一个重要方面。自从1 9 6 3 年n a s s 夫妇首次在线粒体中发现遗传物质1 1 8 l , 关于线粒体d n a 的研究迅速展开。脊椎动物线粒体d n a ( m i t o c h o n d r i a ld n a , m t d n a ) 具有共价闭合的双链环状结构,能进行自我复制,严格母系遗传而且 拷贝数多,并且由于它是真核细胞中分子量较小而又容易纯化的复制单位,因 此是研究d n a 结构及其基因表达的良好模型,同时也为从分子水平上解决分 子进化和系统发育问题提供了理想的研究材料。2 0 世纪8 0 年代多聚酶链式反 应( p c r ) 技术的发明大大简化了过去复杂的实验流程,为m t d n a 的研究和 广泛应用提供了极为有利的条件。8 0 年代末9 0 年代初,k o c h e r 等【1 9 】设计了 大量适用于后生动物的通用引物,并提出用这些通用引物扩增线粒体基因无需 用提纯的m t d n a 做模板,用总d n a 即可。有了这样的理论基础,关于m t d n a 的各方面研究迅速开展起来,但在此过程中经常有研究者提出p c r 产物中存在 “异质性”m t d n a 片段,然而这些片段却没有受到足够的重视。后来少数人深 入研究发现这些片段并不是线粒体基因组序列,而是存在于细胞核基因组上与 m t d n a 同源的序列,而且这些m t d n a 同源序列在核基因组中一般不能行使功 能,所以被称为线粒体假基因。 2 1n u m t s 的发现 1 9 6 7 年,d ub u y 和r i l e y 曾提出核基因组中可能存在m t d n a 拷贝。他 们用提纯的小鼠m t d n a 和核d n a 进行杂交,发现结合能力很强,推断核基 因组中可能存在m t d n a 的同源序列【2 。遗憾的是,在9 0 年代以前这个问题 一直没有受到学者的关注。直到1 9 9 4 年,l o p e z 等用s o u t h e m 杂交的方法在 家猫核基因组中发现了一段与线粒体基因组同源的序列【1 2 i 。该序列长度7 9 4 6 k b ,是从m t d n a 的调控区( d 1 0 0 p ) 到c o 基因完整的大片段转移,并且 这段序列发生多次重复,在核基因组中的总长约为3 0 0 6 0 0k b ,由此推算这 段7 9k b 的序列大约重复了3 8 7 6 次。由于发现这种序列是不能表达的假 基因,因此以“n u c l e a rm i t o c h o n d r i a ld n a s e g m e n t s ”( 简称为n u m t s ) 指代这种 核基因组中存在的线粒体假基因,从此关于线粒体假基因的研究才真正开展起 4 脊椎动物中线粒体基因片段向核内转移的比较分析 来。目前已发现的n u m t 序列中多数是通过p c r 或杂交等实验的方法获得的, 除了这些实验方法获得的n u m t 序列以外,还有通过序列比对发现的m t d n a 同 源序列。自从人类基因组计划实施以来,用不同的分析软件对人类线粒体基因 组序列和核基因草图序列进行同源性序列比对分析,发现了大量的假基因 1 2 2 1 硒j 。经t o u r m e n 等【2 2 l 统计,人类核基因组中至少含有5 0 0k b 的n u m t 序列, 这个数字远远超出研究者原来的想象。目前为止,已有1 0 0 多个物种中发现了 这种序列,包括真菌、植物、节肢动物、鸟类和大量哺乳动物【2 6 1 。 2 2n u m t s 的形成 现在普遍认为线粒体基因组缩小的机制有两种:一是丢失一些非必须基因 和一些特殊基因:非必须基因比如一些t r n a 基因、氨基酸核苷酸合成基因等; 特殊基因其中包括无氧糖酵解和调控有关的基因等;另一种机制就是向核基因 组中转移一部分重要基因。在生物体内,由于细胞死亡、自体吞噬等原因造成 线粒体基因组断裂,之后被膜所包裹在膜流动作用下,进入细胞核中,这种现 象在酵母和烟草实验中证明是十分频繁的。线粒体基因向核中转移一种是产生 具有功能的基因,另一种则产生不表达的假基因。那么现在通过p c r 技术发现 的这些假基因就是这种转移后失去功能的线粒体基因。由于与m t d n a 同源, 所以在用总d n a 模板、通用引物进行m t d n a 扩增时,仍然能够被扩增出来。 到目前为止,还没有报道多细胞动物线粒体的功能基因转移到核的过程【2 7 1 。 n u m t s 的产生大致有两种方式:线粒体到细胞核的独立插入和伴随插入后核基 因组的复制【2 3 1 。1 9 9 5 年,a r c t a n d e r 2 8 】发现了几种t a p a c u l o s ( s c y t a l o p 凇s p p , 淡喉鼠鸟和m y o r n i ss e n i l i s ,灰窜鸟) 的c y tbn u m t s 序列与它们各自m t d n a 的 c y tb 序列相似度更高,因而认为它们共同的祖先发生了一次转座事件。而与 之相反,s o r c n s o n 等【2 9 】却发现潜水鸭( a y t h y i n i ) 中6 个不同的n u m t s 同它们 各自的m t d n a 控制区序列更相似,因而认为这可能是由于最近的各自独立转 座事件造成的。 1 9 9 9 年,r i c c h e t t i 等【3 0 j 已经在酵母基因组中发现了n u m t 片段的整合过 程。它们最初可能是伴随着转座元件或短散在分布重复元件插入核基因组【3 1 】, 但是进一步的研究发现,不同的n u m t s 整合位点缺乏共同特征。现已确认n u m t 序列在核基因组中的整合是在d s b ( d o u b l e s t r a n db r e a k s ) 修复过程中完成的。 5 脊椎动物中线粒体基因片段向核内转移的比较分析 线粒体假基因( n u m t s ) 主要是d n a 介导产生的【3 2 1 ,m i s h m a r 等【3 3 】在分析 人类基因组n u m t s 数据分析发现,m t d n a 序列的g c 含量以及染色体结构的不 同都影响n u m t s 的形成,同时分析n u m t s 的侧翼序列发现其相邻的转座元件可 以影响其转座进入核d n a 以及在核基因组内的复制。 2 3n u m t s 的特征 目前已发现的脊椎动物n u m t s 序列中多数是通过p c r 或杂交等实验的方 法获得的,另外还有一些是通过序列比对发现的。总的来说,n u m t s 序列具有 以下几个特征: ( 1 ) 核基因组中的n u m t s 片段已经涵盖了线粒体基因组的全部基因,包括蛋 白质编码基因、调控区( d 1 0 0 p ) 2 8 , 2 9 , 3 4 , 3 5 1 、r r n a 基因【3 渊1 、t r n a 基 因【3 引、细胞色素b 基因 2 8 , 3 4 , 3 5 ,3 9 1 、n d 41 3 8 】、n d 51 3 8 , 4 0 】基因及细胞色素 氧化酶基因c o , 4 1 】、c o 口 1 1 , 4 2 , 4 3 】等,这可能是因为这些线粒体区域是 最为常用的分子标记。 ( 2 ) n u m t s 序列长短不一,短的仅有几十个核苷酸,长的则几乎相当于整个 线粒体基因组【2 3 , 2 8 3 4 , 3 5 1 。不仅如此,n u m t s 在核基因组中的拷贝数也可能 很高【1 2 】。 ( 3 ) 核基因组中的n u m t s 序列与其m t d n a 同源序列相比,进化模式和遗传 模式完全不刚2 8 ,3 4 ,4 4 1 。由于不受选择压力的影响,n u m t s 序列的核苷酸 替代随机性更大,也就是说常发生插入或缺失,造成移框突变,甚至还 会发生倒位、易位现象【2 h 矧。对于原编码蛋白的假基因序列,经常出现 终止密码子,碱基替换没有密码子位点倾向性,几乎平均分布【4 5 1 。 ( 4 ) n u m t s 序列在核基因组中进化速率很低,所以常被认为是m t d n a 序列 的“分子化石” 1 1 , 2 8 , 盼舶, 7 9 , 8 0 l ,正是由于这个原因,n u m t s 序列极易被通用 引物优先扩增【2 8 ,3 4 ,矧。a r c t a n d e r 等对于8 种窜鸟c y tb 部分基因的真假 序列进行研究发现,m t d n a 的进化速率是n u m t s 序列的1 3 6 倍例。当 然,这个数值对于不同物种、不同基因、同一基因序列的不同部分来说 都是变化的。 ( 5 ) 有些n u m t s 序列还可以作为独立的元件在核基因组中复制、移动。 h a z k a n i c o v o 等1 2 3 j 认为在人类核基因组的n u m t s 序列中只有3 0 是线 6 脊椎动物中线粒体基冈片段向核内转移的比较分析 粒体基因片段转移到核中形成的,其余7 0 都是转移以后在核基因组中 不断复制、转座而成。而同样在家猫的核基因组中发现,三分之一的n u m t s 序列是由一个长为7 9k b 的假基因序列串联重复产生,其余则是由独立 插入或者伴随着插入后序列的部分复制产生【4 纠。t o u 册e n 纠2 2 l 还发现这 些重复的n u m t s 其侧翼区域都是长末端重复序列( u r ) ,这说明核基因 组中存在n u m t s 序列复制、转座的机制。 ( 6 ) 在多细胞动物中线粒体d n a 在核基因组中出现的数目可能与该物种基 因组的大小相关,正如其他的一些序列也是这样( 如微卫星d n a 和 r d n a ) 。而在真核生物间,n u m t s 出现的数目可能和该物种基因组的 大小及基因的密度无关,例如植物基因组比动物的多,人类比果蝇的多; 种间的数目和长度差异较大【2 5 1 。疟蚊、c a e n o r h a b d i t i s 、疟原虫、果蝇和 河豚的基因组中没有或者很少有n u m t s ,而人、水稻和拟南芥中n u m t s 的 数量则非常的大l 矧。 除此之外,n u m t s 序列最大的特点就是容易被通用引物从总d n a 模板中扩 增出来。目前绝大多数线粒体假基因都是在用总d n a 模板、通用引物进行线粒 体d n a 的p c r 扩增过程中发现的 2 4 识别和避免n u m t s 的方法 2 4 1n u m t s 的识别 由于n u m t s 序列与m t d n a 具有一定的相似性,极其容易被通用引物优先 扩增出来,以及对n u m t s 序列还没有足够的认识。因此,如果在系统发育研究 中将n u m t s 误认为是m t d n a ,就很有可能会得出不准确或错误的结论【3 6 , 5 0 , 5 1 j 。 所以,对n u m t s 序列的识别就变得非常的重要。虽然很多研究者在实际工作中 总结了一些n u m t s 序列的识别方法,但是因为对n u m t s 序列的研究还处于初级 阶段,每一种方法都不是绝对可靠的,因此在实际应用中应该对线粒体假基因 问题给予充分重视。 原则上来说,最普遍的方法就是通过检测是否具有表达功能来识在别 n u m t s 序列。由于m t d n a 序列的遗传编码与细胞核中的遗传编码不同,大多 原编码蛋白质的n u m t s 序列内部常会出现终止密码子或发生碱基的插入、缺失。 例如a r c t a n d e r1 2 8 j 等在对雀形目s c y t a l o p u s 的进化分析研究中,扩增出了长度 7 脊椎动物中线粒体基因片段向核内转移的比较分析 为3 1 9b p 的c y t b 假基因,发现该序列的内部存在终止密码子、插入、缺失。 此外,序列中如不存在上述的明显特征,则这些序列也有可能在保守位点 上发生变化。如在胸斑树鸭核中发现的c oi 假基因,该假基因内部不存在碱 基的插入、缺失,另外也不含有终止密码子,但是其翻译的氨基酸序列中有7 个 保守位点发生了变化,致使这段序列被确定为线粒体假基因( 见表1 1 ) 2 9 1 。 表2 1 胸斑树鸭c 0 ,真假基因氨基酸序列的比较 t a b l e2 1a l i g n e ds e q u e n c e so fm i t o c h o n d d a lc oip a r t i a lg e n ea n dn u m t so fd e n d r o c y g n a s p p t a x o n c oia m i n o - a c i ds e u q u e n c e d e n d r o c y g n as p p v t fin r w l f st n h k dig t l y lif g a w a g mig t a l s l lir ae l g q p g t l l g d e n d r o c y g n aa r c u a t a w s h d e n d r o c y g n as p p d i y n viv ta h a f v mif f mv m pimig g f gn w i v p l mig ap d m a f p r p k h i n d e n d r o c y g n aa r c u a t a l u j 黼 l :l o n d r o c y g n as p p i s f 札l p p s fl l l l s s t v ea g a g t g w t v d e n d r o c y g n a a r c u a t a d s 注: 表示氨基酸的保守位点( 经2 种鱼类、1 种两栖类、4 种哺乳动物和多种鸟类的 c oi 基因蛋白序列比对得到的保守位点) 。 n o t e :“”d e n o t e sc o n s t a n ta m i n oa c i d s 对于t r n a 和r r n a 基因,n u m t s 序列的识别就显得更复杂。有的学者提 出可以通过比较序列的二级结构来识别n u m t s 。由于n u m t s 在转移到核基因组 之后不受选择压力的影响,它们随机发生突变就可能会造成高级结构的变化。 但是,对于t r n a 和r r n a 基因的高级结构研究还不十分清楚,加之目前预测 高级结构的方法还不够成熟,所以这种识别n u m t s 序列的方法不是十分有效。 曾有人用二级结构比较的方法区分人类核基因组中r r n a 假基因和线粒体真基 因,但发现两种序列的一级结构虽然相差很大,但二级结构却十分相似,无法 达到区分的目的。 此外,随着生物信息学的发展,分析手段不断完善。可以利用公共数据库 8 脊椎动物中线粒体基冈片段向核内转移的比较分析 ( n c b i ,h t t p :w w w n c b i n l m n i h g o v ) 中某物种的完整的线粒体基因组序列和 核基因组序列同源性序列分析比对,发现大量的n u m t s 序列。 2 4 2n u m t s 的避免 随着在越来越多的物种中发现了n u m t s 序列,在应用m t d n a 时如何避免 这种序列就变得至关重要。目前主要有以下几种方法: 2 4 2 1 选择合适的扩增组织 采用m t d n a 核d n a 比值高的组织或器官进行扩增,或扩增前纯化线粒体, 这样就可以避免n u m t s 。由于n u m t s 在细胞核中有相当高的拷贝数【1 2 】,相同的 p c r 引物更易与n u m t s 结合【4 8 5 引。那么,当必须用总d n a 作为模板时,选择 合适的材料提取模板就变得至关重要。要尽量避免血液、精子、毛发、皮革、 骨骼等线粒体含量相对较低的材料,由于这些材料中核d n a 的含量较多,p c r 扩增时就会优先扩增n u m t s 序列。而在心脏、肝脏、肾脏、肌肉等材料中m t d n a 含量较高,选取这些材料会对避免n u m t s 序列有所帮助。 2 4 2 2 通过反转录p c r ( r t - p c r ) 方法避免n u m t s 1 5 4 j 因为目前发现的核基因组中的线粒体基因片段都没有功能,所以从组织细 胞中提取的m r n a 一定不含有假基因。但这种方法相对比较繁琐,而且有些材 料提取m r n a 很困难,另外偶尔也有n u m t s 被转剥5 5 】的现象发生。 2 4 2 3 设计特异性引物 由于n u m t s 与m r n a 相比,进化速率很低【1 0 , 2 8 , 2 9 , 5 州,同祖先序列更相近, 并在相关分类单元间更相似。因此,根据特定物种的线粒体序列设计引物就不 容易扩增出n u m t s 。相反,使用非特异p c r 引物( 通用引物和简并引物) 时, 由于引物与核序列能够更好的匹配,因而易于优先扩增n u m t s 。这是因为某些有 机体核序列比它们线粒体同源部分进化更慢,以至更为保守。这已经在啮齿目 动物【5 3 1 、灵长类动物【1 0 3 6 j 和雪鹅【5 6 】的研究中使用线粒体c y tb 、1 2 sr r n a 和 d 1 0 0 p 序列作为诊断标记得到证实。如果证实p c r 扩增产物中存在两种以上 的序列,可以根据测序结果设计m t d n a 的特异性引物重新对模板进行p c r 扩 增,这样就可以得到纯的m t d n a 产物。 2 4 2 4 以长链p c r 产物为模板进行二次p c r 扩增整个线粒体基因组或大部分m t d n a 或进行l o n g p c r ,也是避免n u m t s 9 脊椎动物中线粒体基冈片段向核内转移的比较分析 产生的一个有效的方法阳。尽管m t d n a 中也存在较大的片断转移到核基因组 中【3 0 1 ,但是大多数n u m t s 序列的长度基本都小于4k b 【4 引,如设计的引物扩增的 片段长度从5k b 到1 6k b ,则扩增出的就很可能仅仅是m t d n a 。一旦长链p c r 产 物得到后,将其作为模板进行二次p c r 扩增目的片段,就可排除那些短的、模 糊的n u m t s 条带。但是由于现在已经发现了越来越多的长的n u m t s 序列,用扩 增m t d n a 长片段的方法来避免假基因的出现也不是完全可靠的。 如果在实验的过程中同时扩增出n u m t s 和m t d n a ,也可以采取一些措施把 它们分离。首先可以采用将p c r 产物连接到载体上进行克隆,然后对不同的克 隆进行测序1 2 8 1 。另外还可以设计内部引物去区分两条不同的序y l j 2 9 , 5 6 】,尽量选 择在两条序列变异最大的地方设计引物。如果扩增时超过一条m t d n a 的序列, 可采用限制性酶切片段【了7 1 、单链构象多态( s s c p ) 、毛细管稳定变性电泳 ( c d c e ) 、异源双螺旋分析( h a ) ,变性梯度凝胶电泳( d g g e ) 或变温梯 度凝胶电泳( t g g e ) 4 s l 、克隆p c r 产物测序【加】的方法解决。 2 5n u m t s 对于应用m t d n a 的影响 自6 0 年代以来,m t d n a 广泛应用于人类线粒体病理学、后生动物系统发 育学等几个方面。在m t d n a 应用过程中,很多时候由于材料的限制不能提纯 m t d n a 做进一步分析,而n u m t s 序列在很多物种的核基因组中存在,并且与 m t d n a 序列具有很高相似性,如果研究对象的核基因组中存在目标序列的 n u m t s 片段,那么p c r 产物中就很容易出现n u m t s 污染,所以这种序列的存在 必然给m t d n a 应用带来潜在的负面影响。 2 5 1 对人类病理学方面的影响 n u m t s 序列的不断整合给真核生物基因组带来巨大的冲击,同时也对真核 生物基因组的进化产生巨大的影响。当这种n u m t s 序列插入到功能基因内部, 将诱导突变,对人类来说就可以造成一些疾病。r i c c h e t t i 等1 5 8 j 在关于人类核基 因组中的n u m t s 序列研究发现,约8 0 的n u m t s 序列整合在已知基因或预测为 功能基因的内含子或外显子中,虽不清楚这些n u m t s 序列的插入是否会影响功 能基因的表达,但已有资料证实其中两个假基因的插入与人类疾病相关。 在人类线粒体病理学方面,曾有由于核基因组n u m t s 的污染造成诊断错误 1 0 脊椎动物中线粒体基冈片段向核内转移的比较分析 的例子。1 9 9 7 年,d a v i s 等【5 9 】从进行性老年痴呆( a l z h e i m e r sd i s e a s e ,a d ) 患 者的血小板中提取了总d n a ,进行p c r 扩增后发现他们的线粒体c oi 、c o 基因中存在正常人群没有的5 个连锁的错义突变和一个同义突变。由此,d a v i s 得出结论认为这些突变与a d 疾病的发生有关。同年,w a l l a c e 等【删在研究中 发现这6 个突变同样存在于人类核基因组的n u m t s 序列上。w a l l a c e 认为血小 板中富含核d n a ,p c r 模板中m t d n a 所占的比例非常低,产物中易出现n u m t s 序列,而且已经证实在黑猩猩、大猩猩m t d n a 的c oi 、c o 口基因上也存在 这些突变,这说明异常c o1 、c o 基因在人类出现以前就存在,而不是a d 疾病患者所特有的,因此他认为d a v i s 的结论很可能是由于n u m t s 污染造成的。 不久以后,d a v i s 承认了w a l l a c e 的这种观点【4 5 1 。 2 5 2 对鸟类线粒体基因组研究的影响 n u m t s 序列的存在对以p c r 技术为基础的鸟类线粒体基因组的研究是一 个特殊的挑战,这主要是因为鸟类的血红细胞富含核d n a 而m t d n a 相对缺 乏,而这一组织又经常作为模板进行p c r 扩增。一旦核基因组中也存在目的片 段的同源序列,就很容易和m t d n a 发生共扩增现象。如果n u m t s 优先扩增, 就不能扩增出“纯净”的线粒体序列。因此,对系统发育研究来说,这些n u m t s 的存在会产生很

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论