(遗传学专业论文)insulinigf途径基因共进化分析及人类基因酵母双杂结果的共进化分析.pdf_第1页
(遗传学专业论文)insulinigf途径基因共进化分析及人类基因酵母双杂结果的共进化分析.pdf_第2页
(遗传学专业论文)insulinigf途径基因共进化分析及人类基因酵母双杂结果的共进化分析.pdf_第3页
(遗传学专业论文)insulinigf途径基因共进化分析及人类基因酵母双杂结果的共进化分析.pdf_第4页
(遗传学专业论文)insulinigf途径基因共进化分析及人类基因酵母双杂结果的共进化分析.pdf_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

复旦大学博士学位论文i n s u l i n i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 摘要 生物学上的所谓进化或者演化( e v o l u t i o n ) ,是指生物在变异、遗传与自然选 择作用下的演变发展、物种淘汰和物种产生过程,它是生物重要的基本特征。而 关系密切的生物,如花和采粉的动物、寄生虫和寄主、捕食者和被捕者等,一方 成为另一方的选择力量,因而在进化上发展了互相适应的特性。这种互相适应进 化的现象称为协同进化或共进化( c o - e v o l u t i o n ) ,是进化中的有趣的环节之一。 在分子水平,核酸与蛋白质序列的突变通常被认为是中性的,相应发生变化的基 因的功能与最终命运决定于其突变以及随机漂变的情况。不过一些功能关联基因 的进化则不同于正常的方式。为了维持较好的互作关系以行使其生理功能,它们 在特定的时间内相互影响,相互适应,协同变化,这种情况称为分子共进化。分 子共进化体现了功能关联的基因所经历的相似进化历程,具体特征可以表现在不 同的方面,比如基因组水平、序列水平和表达水平等。分析目标基因的这些共进 化特征可以促进相应的基因功能研究。基因组水平的分子共进化特征分析已经在 原核生物基因研究中得到一定的应用,而对于高等真核生物,其基因组结构与原 核生物有很大不同,相对而言,基于序列信息的量化的分子进化树比较分析显得 更为适合。 i n s u l i n i g f ( 胰岛素,类胰岛素) 信号途径存在于不同进化水平的物种中( 从 酵母到人类) ,这个进化保守的途径与许多重要的功能调节有关,比如生长发育、 代谢调控、血糖控制等等,最新的研究认为该途径还和寿命长短有关。我们采用 量化的分子进化树比较的方法对不同物种中的胰岛素,类胰岛素内分泌调节途径 的相关基因进行了共进化分析。所选择的物种包括人、黑猩猩、大小鼠、鸡和鱼 等高等真核生物,所分析的基因包括 s 、,g f - ,、尺,f g f - i r 、i r s 等各物种共 有的该途径关键基因。通过序列收集,进化距离矩阵构建以及进化相关性分析, 我们得到了该途径中不同基因间的共进化关系。结果显示一些已知的存在互作关 系的蛋白间的共进化关系比较紧密,具体表现在进化相关性很大;而不直接互作 的蛋白之间的共进化关系较为松散,具体表现在进化相关性较小;无功能关联关 系的途径基因间以及所选择的无互作关系的阴性参照基因与途径基因间的进化相 关性则显著较低。同时基于进化相关性,我们对一些功能未知的基因如鱼类中的 复制基因,鸡中的可能的尺s 基因进行了功能预测分析。 以此为基础,我们对人类d u s p l 8 、p p 2 c k 、l n x 这三个基因进行了类似的 共进化分析。这三个新基因是由本实验室克隆报道,并已经做了酵母双杂交实验 来寻找相互作用蛋白。针对d u s p l 8 、p p 2 c k 、l n x , 我们选择了十一个高等真 核物种的相关序列,计算了它们与各自的酵母双杂交筛选阳性基因间的共进化相 c ? j j ij,ji ji:。iljj=一一。jl j i i i 复旦大学博士学位论文l n s u l i n i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 关性。根据有功能关联的基因其共进化相关性较高的原则,我们将酵母双杂阳性 基因进行了排序,得到了一些相关性很高的基因,同时按一定阈值排除了一些相 关性较低的基因。结合别的已有的功能研究,我们预测了一些可能存在特别的功 能关联的基因作为进一步实验的候选目标。 关键词:分子共进化;系统发生分布;进化树;关联突变;相关性系数:胰岛素, 类胰岛素途径;蛋白磷酸酶 4 。 复旦大学博士学位论文i n s u l i n i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 a b s t r a c t e v o l u t i o n 。f r o mab i o l o g i c a ip e r s p e c t i v e m e a n st h ep r o c e s so fs p e c i e s e m e r g e n c e ,d e v e l o p m e n ta n de l i m i n a t i o nd u et o t h ec o m b i n e de f f e c to f i n h e r i t a n c e v a r i a t i o na n dn a t u r a is e l e c t i o n i ti so n eo ft h ee s s e n t i a i c h a r a c t e r i s t i c so fa l lc r e a t u r e s d u r i n ge v o l u t i o n ,c l o s e l yr e l a t e ds p e c i e s ,i i k e f l o w e r sa n dp o l l i n a t i n gi n s e c t s ,h o s t sa n dp a r a s i t e s ,p r e d a t o ra n dp r e y ,h a v e d e v e l o p e dt h et r a i t st h a ta r er e l a t e dw i t ht h eo t h e rp a r t yo ft h eg a m et h i si s d e f i n e da sc o e v o l u t i o n w h i c ha p p e a r st ob eaq u i t ei n t e r e s t i n gp h e n o m e n o ni n e v o l u t i o n a tt h em o l e c u l a ri e v e l m u t a t i o no nt h en u c l e o t i d eo ra m i n oa c i ds e q u e n c ei s b e l i e v e dt ob es e l e c t i v e l yn e u t r a l t h e r e f o r e ,t h ef u n c t i o na n d f a t e o ft h eg e n e i sd e c i d e db ym u t a t i o na n ds u b s e q u e n tr a n d o md r i f t h o w e v e r ,s o m eg e n e s r e l a t e dt oi m p o r t a n tb i o f u n c t i o na p p e a rt oe v o l v ei nad i f f e r e n tp a e e r n i no r d e r t om a i n t a i nt h e i rb i o l o g i c a lf u n c t i o no rc o o r d i n a t es m o o t h l yw i t ht h e i r u p d o w n s t r e a mf a c t o r s 。c l o s e l y r e l a t e dm o l e c u l e st e n dt oe v o l v ei na c o o r d i n a t e df a s h i o n w h i c hi sc a l l e dm o l e c u l a rc o e v o l u t i o n m o l e c u l a r c o e v o l u t i o nd e m o n s t r a t e dt h a tc l o s e l yr e l a t e dg e n e sh a v ee x p e r i e n c e ds i m i l a r e v o l u t i o np r o c e s s t h ec o e v o l v i n gc h a r a c t e r i s t i c sc a nb ea td i f f e r e n tl e v e l e g g e n o m i c s e q u e n c e o re x p r e s s i o ni e v e l t h ea n a l y s i so ft h e s ec h a r a c t e r i s t i c s c a np r o m o t et h eu n d e r s t a n d i n go fg e n ef u n c t i o n s c o e v o l u t i o na n a l y s i sh a s b e e ni m p l e m e n t e di ns o m ep r o k a r y o t i cs p e c i e s 1 ne u k a r y o t i cs p e c i e s d u et o t h e i rd i f f e r e n tg e n o m es t r u c t u r e ,m o l e c u l a rp h y l o g e n e t i ca n a l y s i sb a s e do n a m i n oa c i ds e q u e n c ea p p e a r st ob em o r es u i t a b l e i n s u l i n i g fs i g n a l i n gp a t h w a yw i d e l ye x i s t si nd i f f e r e n ts p e c i e sr a n g i n gf r o m y e a s tt oh u m a n t h i se v o l u t i o n a r i l yc o n s e r v e dp a t h w a yi sr e l a t e dw i t hd i f f e r e n t f u n c l 【i o n s s u c ha sd e v e l o p m e n t ,m e t a b o l i s m ,b l o o ds u g a rr e g u l a t i o n ,e t c r e c e n tr e s e a r c hs h o w st h a ti ti sa l s or e l a t e dw i t hi o n g e v i t y b yu s i n g q u a n t i t a t i v e m e t h o d i n c o m p a r i n gp h y l o g e n e t i ct r e e s ,w e c o n d u c t e d c o e v o l u t i o na n a l y s i su p o ni n s u l i n i g fr e l a t e dp a t h w a y si nv a r i o u se u k a r y o t i c s p e c i e s ,e g h u m a n 。c h i m p a n z e e ,m o u s e ,r a t ,c h i c k e n ,z e b r a f i s ha n df u g u t h e g e n e sc o n c e r n e dj n c l u d ei n s u l i n ,l g f - l ,i r ,i g f i r 。i r s ,c o v e r i n gt h ec o m m o n k e yg e n e si n t h ep a t h w a y t h r o u g hs e q u e n c eg a t h e r i n g ,e v o l u t i o nm a t r i x c o n s t r u c t i o n a n de v o l u t i o n a r i l yr e l a t e da n a l y s i s ,w ec o m et ou n d e r s t a n dt h e c o e v o l v i n gr e l a t i o nb e t w e e nd i f f e r e n tg e n e si nt h ep a t h w a y t h er e s u l ts h o w s t h a ts o m ep r o t e i n sw i t hk n o w nf n t e r a c t i o nh a v eh i g h e rc o r r e l a t e dc o e f f i c i e n t , w h e r e a st h a to ft h o s ew i t h o u ti n t e r a c t i o ni sc o m p a r a t i v e l yi o w e r g e n e sw i t hn o i n t e r a c t i o na n dt h e n e g a t i v ec o n t r o lg r o u ph a v ee v e ns i g n i f i c a n t l y i o w e r c o r r e l a t e dc o e f f i c i e n t m e a n w h i l e 。b a s e do nc o e v o l u t i o na n a l y s i s ,w ep r e d i c t e d t h ef u n c t i o n so fd u p l i c a t e dg e n e si nf i s h e sa sw e l ia sp o s s i b l ei r so r t h o l o g o u s g e n e si nc h i c k e n b a s e do nt h e s er e s e a r c h e s ,w ec o n d u c t e ds i m i l a rc o e v o l u t i o na n a l y s i so n t h r e eh u m a ng e n e s d u s p l8 p p 2 c ka n dl n x t h e s en e wg e n e sa r ec l o n e d 5 。 复旦大学博士学位论文 i n s u l i n 1 g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 a n dr e p o k e db yo u rl a b o r a t o r ya n da n a l y z e dv i ay e a s tt w o - h y b r i d w es e l e c t e d s e q u e n c e sf o rt h et h r e eg e n e sa n dt h e i ri n t e r a c t i n gg e n e s ( d e t e c t e db yy e a s t t w o - h y b r i d l f r o m1 1 h i g h e r a n i m a l sa n dc a l c u l a t e dt h e i rc o - e v o l u t i o n a r y c o e f f i c i e n t a c c o r d i n gt h et e n d e n c yw eh a v ef o u n di np r e v i o u ss t u d y , ( i e i n t e r a c t i n gm o l e c u l e sh a v eh i g h e rc o r r e l a t i o nc o e f f i c i e n t ) w er a n k e dt h o s e g e n e sa c c o r d i n gt ot h e i rc o e f f i c i e n t o nt h eb a s i so ft h er a n k i n g ,w ei d e n t i f i e d s o m eg e n e sw i t hh i g hl e v e lo fi n t e r a c t i o na n de x c l u d e dt h o s ew i t ht o oi o w c o e f f i c i e n t m o r e o v e lc o m b i n e dw i t ht h e i rk n o w nf u n c t i o n a ic l u e s ,w ep r e d i c t e d s o m ec a n d l d a t eg e n e sf o rf u r t h e rf u n c t i o n a ls t u d y k e yw o r d s :m o l e c u l a rc o - e v o l u t i o n ;p h y l o g e n e t i cd i s t r i b u t i o n ; p h y l o g e n e t i ct r e ec o r r e l a t e dm u t a t i o n ;c o r r e l a t e dc o e f f i c i e n t ;i n s u l i n i g f s i g n a lp a t h w a y ;p r o t e i np h o s p h a t a s e 6 里呈查堂壁主兰焦丝塞 ! ! ! ! ! ! 坚鱼! 堡堡薹里茎垄些坌堑墨耋苎里壁堡翌墨堕墨竺茎堂坐! ! 塑 缩写简表 ( 按首字母排序) b m p s :b o n em o r p h o g e n e t i cp r o t e i n s ,骨成形蛋白。 b m p r i i :b o n em o r p h o g e n e t i cp r o t e i nr e c e p t o rt y p el l ,骨成形蛋白类受体。 c d c 2 :c e l ld i v i s i o nc y c l e2 ,母细胞周期基因2 。 c d k :c y c l i n d e p e n d e n tk i n a s e ,细胞周期蛋白依赖的蛋白激酶。 c y p l 7 a 1 :c y t o c h r o m ep 4 5 0f a m i l y1 7s u b f a m i l yap o l y p e p t i d e1 ,细胞色素 p 4 5 0 家族1 7 ,亚家族a 多肽链1 ) d u s p l8 :d u a ls p e c i f i c i t yp h o s p h a t a s e18 ,双重特异性磷酸酶1 8 。 d s p s :d u a l s p e c i f i c i t yp r o t e i np h o s p h a t a s e s ,双重特异性蛋白磷酸酶。 e c r :e c d y s o n er e c e p t o r ,蜕皮激素受体。 f g f :f i b r o b l a s tg m w t hf a c t o r ,纤维母细胞生长因子。 e s t :e x p r e s s i o ns e q u e n c et a g ,表达序列标签。 g d f :d i f f e r e n t i a t i o nf a c t o r ,分化因子。 g h :g m w t hh o r m o n e ,生长激素。 g h r :g r o w t hh o r m o n er e c e p t o r ,生长激素受体。 i g f :i n s u l i nl i k eg r o w t hf a c t o r ,类胰岛素生长因子。 i g f i r :i n s u l i nl i k eg m w t hf a c t o r1r e c e p t o r , 类胰岛素生长因子1 受体。 i g f r :i n s u l i nl i k eg r o w t hf a c t o r2r e c e p t o r ,类胰岛素生长因子2 受体。 i l p s :i n s u l i nl i k ep r o t e i n s ,胰岛素类似蛋白。 i n s :i n s u l i n ,胰岛素。 i r :i n s u l i nr e e , e p t o r ,胰岛素受体。 i r s s :i n s u l i nr e c e p t o rs u b s t r a t ep r o t e i n s ,胰岛素受体底物蛋白。 l g r :l e u c i n e r i o hr e p e a t c o n t a i n i n gg p c r s ,含富亮氨酸重复的g 蛋白偶联受 体。 l n x :l i g a n do fn u m bp r o t e i n - x ,n u m b 蛋白配体。 l r r :l e u c i n e r i c hr e p e a t ,富亮氨酸重复结构域。 m a p :m i t o g e n a c t i v a t e dp r o t e i n ,丝裂原活化蛋白。 m k p 3 :m i t o g e n a c t i v a t e dp r o t e i nk i n a s ep h o s p h a t a s e3 ,丝裂原活化蛋白激酶 磷酸酶3 。 n u d c d 2 :n u d cd o m a i nc o n t a i n i n g2 ,n u d c 功能域同源蛋白2 。 n u d t 9 :n u d i x ( n u c l e o s i d ed i p h o s p h a t el i n k e dm o i e t yx ) - t y p em o t i f9 ,a d p - 核 7 。 复旦大学博士学位论文i n s u l i n i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 糖焦磷酸水解酶9 。 n u m b :n u m bh o m o l o g ( d r o s o p h i l a ) ,果蝇n u m b 类似基因。 n c b i :n a t i o n a lc e n t e ro fb i o l o g yi n f o r m a t i o n ,美国国家生物信息中心。 p a f :p l a t e l e t a c t i v a t i n gf a c t o r ,血小板激活因子。 p a f a h lb 2 :p l a t e l e t a c t i v a t i n gf a c t o ra c e t y l h y d r o l a s e ,i s o f o r mi b ,b e t as u b u n i t , 血小板激活因子乙酰水解酶异构体i b b 亚单位。 p b k :p d z - b i n d i n gk i n a s e ,p d z 功能域结合蛋白激酶。 p g k :p h o s p h o g l y c e r a t ek i n a s e ,磷酸甘油酸激酶。 p h :p l e c k s t r i n - l i k e ,类p l e c k s t r i n 蛋白功能域。 p h o x 2 s :p a i r e d 1 i k eh o m e o b o x2 ,含成对h o m e o 功能域的基因2 。 p 1 3 k :p h o s p h a 删y n o s i t o i3 一k i n a s e ,磷脂酰肌醇3 激酶。 p p 2 c k :p r o t e i np h o s p h a f a s e s 2 ck a p p a ,蛋白磷酸酶2 c k 。 p t b = p h o s p h o t y r o s i n eb i n d i n g ,蛋白酪氨酸结合功能域。 p t b i :i n s u l i nr e c e p t o rs u b s t r a t e 1 ,p t b 。类胰岛素受体底物1 的蛋白酪氨酸结 合功能域。 p t p s :p h o s p h o t y r o s i n ep h o s p h a t a s e s ,蛋白酪氨酸磷酸酶。 r x r :r e t i n o i dxr e c e p t o r ,维甲类受体。 s c a :t h es t a t i s t i c a l l yc o u p l e da n a l y s i s ,统计学结对分析法 s g t l :s u p p r e s s o ro fg 2a l l e l eo fs k p l ,s k p l 等位细胞g 2 期抑制基因。 s h 3 :s r ch o m o l o g y3 ,s r c 同源结构域3 。 s h 2 :s r ch o m o l o g y2 ,s r c 同源结构域2 。 t g f - b :t r a n s f o r m i n gg r o w t hf a c t o rb e t a ,转化生长因子b 。 注:本文中出现的基因名称缩写的格式说明: 1 ) 全部字母大写、斜体,表示这是一个基因,如: s ; 2 ) 全部字母大写、正体,表示这是一个基因表达的蛋白,如:i n s 8 复旦大学博士学位论文i n s u l l n i i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 第一章前言 研究基因功能及其之间的功能联系一直是生命科学工作者重点关注的问题。 对于目标基因,人们采用各种方法寻找其作用伙伴、相互结合的重要位点等等信 息。如分析蛋白产物之间是否具有相互作用关系通常从实验着手,采用酵母双杂 交、蛋白体外相互作用、免疫共沉淀等方法来寻找。但是通过实验手段进行筛选 的耗费较大,如果目标基因不明确,其需要的人力物力就会成倍增加。研究中发 现,蛋白间的相互作用关系不是突然出现的,它往往是在进化过程中经过基因变 化、功能分歧以及功能保留慢慢建立起来的,而一些无效或对生物体意义不大的 互作关系则可能在进化中被淘汰。也就是说,自然界己经为我们做了无数次的突 变与筛选试验,已有的蛋白间的功能联系中蕴含着许多自然选择留下的进化痕迹。 其中很重要的一个方面就是两个或多个非等位的互作或功能关联的基因在遗传上 作为一个单位来传递,即基因的共进化或一致进化。这种进化的痕迹会体现在各 种方面,比如序列的保守性、途径中的核心基因的共同出现、互作基因的共同进 化、结合位点的氨基酸的关联突变等。随着各种生物数据的增多,如基因与蛋白 质序列、低等到高等的物种基因组信息、蛋白晶体结构等,根据这些信息采用计 算的方法来寻找基因间的共进化特征,并以此来分析预测基因的功能关联关系正 逐步成为一种新的辅助提高实验效率的研究方向。 第一节基因共进化研究与基因功能推测概述( 综述) 1 1 研究背景 进化现象是生命体的一个重要特征,它与生命的发育以及遗传息息相关。自 然科学家围绕进化的现象提出了多种理论来进行解释。而最具有代表性的就是达 尔文在物种起源中提出的“自然选择”与“适者生存”。该学说的提出具有划时代 的意义,并对而后的生命科学研究产生了巨大的影响。随着分子生物学的研究进 展,分子水平的进化理论逐步建立,目前较为公认的是中性理论【1 l 。该理论认为与 生命个体的遗传以及正常生命活动紧密联系的核酸与蛋白序列在漫长历史上发生 的突变是中性的,相应发生改变的基因的功能与最终命运决定于其突变以及随机 。 复旦大学博士学位论文i n s u l i n i o f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 漂变情况。 在各种进化现象中,有一种现象与普通的进化略有不同。e h r l i c h 和r a v e n 在研究蝴蝶与其传粉的植物时发现植物产生的次生物质( s e c o n d ar yc o m p o u n d s , 植物产生的对昆虫有毒性的化合物) 决定了何种蝴蝶可以利用该植物,这意味着 植物可以通过不同的有毒的次生物质决定蝴蝶物种差异的产生。他们在1 9 6 4 年将 其研究结果发表,并将这种相关进化关系称之为共进化【2 】。这种概念认为,具有紧 密关系的物种之间,如昆虫与其授粉的植物间、捕食者与被捕食者之间,为了维 持原先已经确立的对于双方都有利的关系,在一方发生了变化时,另方也会发 生相应变化,这种协同进化的方式可以称之为共进化。例如,当被捕食者发生了 变异,防御能力提高时,捕食者也相应的要发生克服被捕者防御能力的机制,否 则就要因不能适应新的条件而被淘汰。随着共进化概念的提出,生物界中许多现 象可以采用它来进行阐述,并能用来更好地理解一些生命体的进化历史以及将其 应用于具体研究。甚至在别的学科,如信息学中,也引入了这种概念。 宏观层面( 物种层面) 存在着共进化,那微观层面( 分子层面) 是否也存在? 早在上世纪七十年代就有人提出了t r n a 与其所对应翻译的密码子之间也可能存 在共进化的模型【3 1 。不过更为贴切的分子共进化的提出还是英国分子生物学家 g a b r i e ld o v e r 所做的工作。他与同事在研究果蝇的r d n a 区域的转录过程中, 提出了转录元件与转录因子之间的分子共进化模型n5 o 根据自己所做的以及相关 的别的研究者的工作,他在1 9 9 2 年对分子共进化的概念进行了更深入的阐述【6 】。 他认为分子层面( 基因水平) 同样存在一种协同进化的方式。即进化上序列的变 化是可以容忍的,基因的功能在序列突变发生时并没有改变。原因不在于突变对 于原有功能来说属于中性或可有可无,而是对应的互作伙伴同时发生了互补的变 化以维持它们之间的原有功能,两者的关系则可以称为分子共进化。研究分子共 进化可以对紧密相关的基因之间的关系进行分析研究,如配体一受体结合,激素 受体结合,多种的细胞黏附,信号传导以及细胞内、细胞外的分子识别等等。随 着该模型的提出,各种相关的研究层出不穷,如不同激素与其各自受体之间的特 异性结合与共进化关系的研究【7 。 另一方面,基因功能研究一直是分子生物学家关注的重点。目标基因通过与 上下游的作用对象相互作用从而对不同的生命活动进行调控。比如通过细胞因子 与相应受体结合所调节的细胞信号传导,多个蛋白结合在一起组成蛋白复合物, 核受体与转录因子结合从而调节下游基因的转录。这些多种多样的相互作用关系 贯穿了生物体的整个生命过程。基因产物间可以是直接的物理结合,比如共同组 成一个大分子复合物;也可以是非直接物理作用,比如几个蛋白质共同参与一个 代谢或信号转导途径,两种不同的作用关系可以统称之为功能关联( f u n c t i o n a l 1 0 。 复旦大学博士学位论文i n s u l i n i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 l i n k a g e s ) 。得到这些功能关联的信息后,我们既可以从宏观方面寻找新的功能途 径,建立生物体基因间的关系网络,又可以从微观的角度深入研究特定目标基因 的关联伙伴,以及其发挥生物学功能的方式。 人们采用多种手段对基因问的功能关联进行探索。对于研究直接相互作用, 最为常见的就是酵母双杂交【1 ”,比如最近用酵母双杂交建立的人的基因的相互作 用网络,以及之前u e t z 等用类似方法所建立的酵母菌的基因互作网络【1 ”。另外蛋 白体外结合实验( p u l ld o w n ) 以及免疫共沉淀也都是常用的分析手段。随着实验 技术的发展,生物芯片可以用来大范围地寻找表达谱相近的基因,而表达谱相近 意味着功能可能相关联。基因突变、基因敲除等方法也都是常用来分析基因功能 关联的手段。采用实验手段分析基因功能可以直接地得到相应结果,不过往往需 要耗费大量人力与物力( 如用酵母双杂交建立蛋白互作网络或大量芯片数据的获 得) 。而且如果所分析的目标基因的功能关联伙伴不很明确,需要做的实验工作就 会成倍增加。 从进化的角度看,一个基因与其作用伙伴建立有效的功能关联关系不是一个 一蹴而就的过程。它往往是在漫长的生物进化过程中逐步形成,经历了多次的自 然选择。一些不合适的或没有意义的互作关系被淘汰,有利于生物个体的功能关 联关系被保留,而最终展现在我们面前的很可能是无数次天然实验的结果。在一 些紧密相关的基因间,如配体- 受体、代谢途径上下游基因,为了维持它们之间有 利于生物个体的互作关系,在进化过程中很可能存在分子共进化的情况。而在基 因组水平、核酸或蛋白序列水平、表达谱水平都可能表现出相应特征。研究目标 基因间是否存在共进化特征可以很好地促进我们对其功能关系的判断,进而有针 对性地指导实验的设计。随着各个物种基因组计划的推进,不断增多的基因组数 据、基因序列数据,以及晶体结构数据和基因表达谱数据都为这种研究提供了极 大的便利。 1 2 基因组水平的共进化特征分析 目前已测的原核生物与真核生物基因组超过2 8 0 多个( n c b i 统计) ,大量的 基因组数据为研究基因组结构在进化上的变化提供了数据基础。传统的基因组分 析方式主要通过同源性分析对基因组上的基因进行注释,即通过序列的相似性来 推测分析目标基因是否与已知基因具有类似功能。而比较分析基因组发现,基因 在染色体上的组织形式,尤其是在原核基因组中,具有一些可以利用的共进化特 征。 复旦大学博士学位论文i n s u l i n f g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 在对基因组进行分析之前,首先要建立直系同源与旁系同源的概念。所谓同 源序列,是指从某一共同祖先经趋异进化而形成的不同序列。当相似程度高于5 0 时,比较容易确定未知序列和己知序列是否具有同源性;而当相似性低于2 0 时, 即两个序列之间只有2 0 以下的相同残基时,就难以确定或者根本无法确定这种 相似性究竟是趋同还是趋异进化的结果。同源序列中包含直系同源物( o r t h o l o g s ) 与旁系同源物( p a r a l o g s ) 。直系同源物是指在物种形成时出现,并在两个物种的 共同祖先中都存在的基因。旁系同源指物种形成后通过基因复制而出现的基因【”】, 比如同是起源于珠蛋白的a 珠蛋白。1 3 珠蛋白和肌红蛋白。虽然在它们的功能上的 的定义比较松散,但一般认为直系同源基因在不同物种中具有相似的功能,而旁 系同源基因在同一生物体内执行不同但相关的功能。直系同源物允许对跨物种间 的关系进行研究而通过基因复制产生的旁系同源物则可能有助于研究一些基本 的进化机制,因为复制基因可以产生分离的不同进化通路,并且通过变异和适应 而进化得到新的特征。 对于两个进化上非常相近的物种,它们由一个祖先进化而来,则两者染色体 上直系同源基因的排布顺序应该非常相似。随着进化时间的延长,这种相似性会 被基因复制、基因丢失、染色体重排等事件破坏。比如两种微生物物种基因组间 的直系同源基因的排布顺序的相似性不会超过5 0 【15 】。不过参与同一功能的基因 则仍然保持在染色体的临近区域成簇排列,并且在不同物种间有着保守的基因排 列顺序( 图1a ) 。这可能是由于功能相关的基因受到相似进化压力的选择所造成 的。早期对于 噬菌体的研究发现具有保守基因顺序的基因与它们是否存在物理 上的相互作用有相关性【15 1 。而原核的操纵子也是这种保守基因顺序的实例,并在 一些低等动物中也存在,如线虫,果蝇等【1 7 】。同一操纵子中的基因往往参与同样 的功能途径。而一些表达组成蛋白复合物各组分基因的操纵子在进化上相距很远 的原核生物间,甚至在原核与古细菌间都具有一定的相似性,如表达核糖体蛋白 的操纵子【1 8 】。 这种保守的基因排列方式为调控功能相关基因的转录提供了方便,比如细菌 中的乳糖操纵子就能方便地控制它在乳糖培养基上的生长f 1 9 1 。分析这种保守的基 因排布顺序可以用来分析基因功能。比如从共进化的角度上来看,同一个操纵子 中的基因组成是相对恒定的,并且功能相互关联。如果在某个物种中用同源性比 较方法找不到操纵子内某个成员基因,那在操纵子所在的区域中很可能存在有非 同源的功能替代基因。如在肺炎链球菌的脂肪酸代谢途径基因研究中,人们未找 到常见的烯脂酰- a c p 还原酶( e n o y i - a c p r e d u c t a s e ,g e n ef a b i ) ,它是途径中 的重要基因。但参与该代谢途径的核心基因从大肠杆菌到肺炎链球菌都是非常保 守的,并在基因组上具有进化上保守的临近排列顺序的特征。根据这个特征,通 复叫人学博f 学位论文l n s u l i n i g f 途径基【】兆进化分析及人类基眯l 酵母烈杂结果的共进化分析 过对该菌的这一途径的别的成员在基因组位置附近的基因进行分析,人们发现了 一个新的烯脂 - a c p 还原酶基因,并且预测结果得到了实验验证【2 0 】。而一些直 接物理瓦作的基因会表现出更为紧密的染色体上的排布方式,即邻接或成对出现, 并在进化上保持这种排布方式,比较不同物种的基因组中基因邻接情况同样可以 用来分析基因功能 2 1 ,2 2 1 。 图1 一些典型的共进化分析方法示意图 注:a 染色体上基因排列顺序。直系同源基因在不同物种里具有保守的临近排列顺序可能 说明功能上有关联。同样颜色的基因表示属于同一组直系同源物。b 系统发生分布。 图 示表示不同的直系同源基因( 基因1 4 ) 在不同物种( 物种p - f ) 中出现或缺失状态。具有 相似的物种分布状态( p h y l o g e n e t i cd i s t r i b u t i o n ) 的基因对可能存在互作关系( 基因1 和2 ) 。 物种b 中缺少基因3 则是因为基因3 与基因4 发生了融合。物种d 中缺少基因4 则可能发 生了非同源替代。c 分子进化树相似性比较。基因分子进化树可以基于多序列联配构建并 直接比较相似性。多序列联配的结果还可以建立不同物种直系同源基因间的进化距离矩阵。 两个不同的直系同源基因的进化距离矩阵的相关性反映了这两个基因间的分子进化树的相 似性。直接比较分子进化树得到的高相似性或量化计算距离矩阵的高相关性则提示着这两 个基因存在功能关联。d 关联突变。不同物种的a 蛋白与b 蛋白的多序列联配可以得到不 同的突变位点。计算分子问的突变位点对( p a b :一个突变位点在a 蛋白中,一个突变位 点在b 蛋白中) 或分子内的突变位点对( p a a 和p b b :同属a 蛋白或b 蛋白的突变位点对) 的相关性可以得到进化上有关联的突变位点。e 不同物种间的基因保守共表达。基因a 与 o 复旦大学博士学位论文i n s u l i n i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 b 在物种1 中属于共表达,而它们的直系同源物( 基因爿和b ) 在物种2 中也共表达。这 种保守的共表达关系提示着这两个基因功能具有关联。 除了保守的染色体上基因排布顺序外,具有紧密功能关联的基因往往会在不 同物种基因组中表现出相似的系统发生分布状态( p h y l o g e n e t i cd i s t r i b u t i o n ,图1 b ) ,比如同一途径中的几个核心基因往往会在不同的基因组中同时出现或同时缺 失。这可能与它们间的功能联系有关。比如两个基因功能关联,如果一个基因在 一个基因组中出现,其功能必须另一个基因参与,则基因组中必然存在另一个基 因;反之亦然。从而在物种系统发生上表现出这种共同进化的现象。比较目标基 因问系统发生分布可以反推它们是否存在功能关联。大量的基因组信息使得从大 范围分析这种分布状态成为可能。p e l l i g r i n i 等在1 9 9 9 年最早提出了这种方法, 并对大量原核基因组进行了分析【2 3 】。他们将各个基因在不同物种中分布状态用一 个表单来表示( 图2 ) ,从而方便地大规模比较基因组中基因的系统发生分布并寻 找内在联系。 图2 系统发生分布相似性方法示意图1 2 3 】 注:蛋白p 1 一p 7 在不同物种基因组中的分布情况可以转变为一个p h1 和0 组成的表单,分 析表单间的相似性可以预测蛋白间的功能联系,如p 2 和p 7 ,p 3 与p 6 。 1 4 。 复旦大学博士学位论文l n s u l i n i g f 途径基因共进化分析及人类基因酵母双杂结果的共进化分析 结果显示参与同一代谢途径或形成蛋白复合物的基因往往具有相似的系统发 生分布。e n a u i t 等进一步改进了这种方法,引入了序列比对的计算方法,使得该 方法更为精细【2 。采用系统发生分布状态方法科学家成功地预测了一个线粒体疾 病相关蛋白f r a x i n 的功能。原有的研究认为该蛋白主要与维持铁离子的动态平衡 有关,而比较相关基因在不同物种中的分布状态显示f r a x i n 与i s c 蛋白复合物的 组分基因更相似,可能参与组成该复合物【2 5 】。这种功能推测最终被实验所证实【z ”。 除了这些较易理解的基因组水平的共进化特征,人们在研究中发现两个或更 多的基因会在进化上融合在一起。分析原核基因组中所发生的基因融合现象( 图1 b ) ,人们发现其中的一部分相互融合的基因也属于直接互作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论