第四章 分子进化_第1页
第四章 分子进化_第2页
第四章 分子进化_第3页
第四章 分子进化_第4页
第四章 分子进化_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三部分的总结第三部分的总结1.达尔文的演化理论经历了两次修订达尔文的演化理论经历了两次修订WeismannNeo-DarwinismSynthetic Evolution theory (综合进化论)综合进化论)2.达尔文演化理论的遗传基础达尔文演化理论的遗传基础基因的多态性基因的多态性Population中基因频率的变化中基因频率的变化Hardy-Weinberg平衡平衡影响影响Hardy-Weinberg平衡的一些因素平衡的一些因素3.自然选择及其结果:适应自然选择及其结果:适应自然选择的类型自然选择的类型适应是相对的适应是相对的如何研究适应现象如何研究适应现象第四部分第四部分中性演化论

2、中性演化论达尔文的演化理论错了吗?达尔文的演化理论错了吗?一一. 自然界中的基因突变自然界中的基因突变自然选择的基础:自然选择的基础: 遗传变异遗传变异遗传变异的类型:遗传变异的类型:染色体突变染色体突变基因(碱基)突变基因(碱基)突变染色体重组染色体重组不断变化的环境不断变化的环境 在自然界中基因会不会突变?其程度如何?在自然界中基因会不会突变?其程度如何?Dobzhansky 的果蝇实验的果蝇实验从野外捉一批从野外捉一批表型表型正常的果蝇正常的果蝇不断进行近亲交配不断进行近亲交配33%的染色体上有致死、或半致死的隐性基因的染色体上有致死、或半致死的隐性基因93%的染色体上有导致发育迟缓等不

3、利的隐性基因的染色体上有导致发育迟缓等不利的隐性基因如何产生的?如何产生的?二二. . 基因突变的基础基因突变的基础19531953年:年:Watson & Crick DNA双螺旋结构双螺旋结构(double helix)找到了突变的)找到了突变的“根根”50-6050-60年代初:等位酶(年代初:等位酶(allozyme)技术的发明,)技术的发明,在动植物的种群中发现大量的等位酶在动植物的种群中发现大量的等位酶豌豆天冬氨酸氨基转移酶(豌豆天冬氨酸氨基转移酶(AAT)的多态性)的多态性AAT 2AAT 3标准遗传密码(三联码)标准遗传密码(三联码)RNA上的三联码上的三联码相应的氨基

4、酸相应的氨基酸DCBA同一物种的某个同一物种的某个基因基因位点位点(locus)上含有一个以上的等上含有一个以上的等位基因(位基因(allele)由等位基因编码的酶称作等位酶(由等位基因编码的酶称作等位酶(allozyme)注:与同工酶(注:与同工酶(isozyme)的区别)的区别AAT2AAT3AAT2与与AAT3: 同工酶?等位酶?同工酶?等位酶?三三. . 中性理论的提出中性理论的提出Motoo Kimura Motoo Kimura (1924 1924 1994 1994)1. 1. 假设:假设:一个哺乳动物有一个哺乳动物有2020个独立分离的个独立分离的lociloci, 2 al

5、leles/locus2 alleles/locus;隐性基因纯合子的选择系数(隐性基因纯合子的选择系数(s s)为)为 -0.01-0.01,不利的纯,不利的纯合子将在成年前被淘汰(合子将在成年前被淘汰(选择系数选择系数s: 不同于经典定义)不同于经典定义);若要维持原来若要维持原来PopulationPopulation的大小,每个个体需生出的大小,每个个体需生出2200022000个个 babiesbabies!结论:结论:不可能!不可能!2. 2. 解释:解释: 存在很多选择上中性的等位基因,它们的频率由突存在很多选择上中性的等位基因,它们的频率由突变率和遗传漂移(变率和遗传漂移(ge

6、netic drift)genetic drift)而定。而定。19681968年年 Kimura Kimura 提出了提出了“中性理论中性理论”(neutral mutation neutral mutation random drift random drift)蛋白质的多态性是由选择上中性或接近中性的等位基因蛋白质的多态性是由选择上中性或接近中性的等位基因被遗传漂变随机固定的。被遗传漂变随机固定的。固定固定(fixation): (fixation): 种群中同一代的所有个体共享一种种群中同一代的所有个体共享一种突变的等位基因。突变的等位基因。中性的等位基因被固定的概率为该基因的频率中性

7、的等位基因被固定的概率为该基因的频率s s0, selected for;s0, select againstNeutralNeutral:s = 0s = 0Nearly neutral:|s|s|1/1/(2 N2 Ne e),或),或 |s| 1/N|s| 1/Ne e3. 3. 中性理论中中性理论中s s的定义及计算:的定义及计算:基本的公式:基本的公式:p p2 2+2pq+q+2pq+q2 2 = 1= 1N Ne e :有效种群的大小:有效种群的大小 种群中真正参与生殖的个体数种群中真正参与生殖的个体数每代的进化速率(从被固定的突变体的角度):每代的进化速率(从被固定的突变体的角

8、度): k = 2Nvuk = 2Nvuv v:每代、每个配子的突变速率每代、每个配子的突变速率N:N: population population 中的个体数中的个体数每代每代 Population Population 中新的突变中新的突变 = 2Nv= 2Nvu u:单个突变在单个突变在 Population Population 中被固定的概率中被固定的概率每代被固定在每代被固定在 Population Population 中的中性突变的中的中性突变的概率概率= 1/2N因此,当因此,当s s等于或趋于零,即中性选择时,等于或趋于零,即中性选择时, k k = =(2Nv)(1/2N

9、2Nv)(1/2N)= v= v,与,与 Population Population 大小无关大小无关当当 | s | s | 不 是不 是 等 于 或 趋 于 零 时等 于 或 趋 于 零 时 , k = 4 Nk = 4 Ne es vs v , 与 有 效, 与 有 效 Population Population 大小有关大小有关 NOTENOTE: 影响影响N Ne e的因素:的因素: 性别的比率性别的比率 性别种类少的个体对下一代的基因频率贡献大性别种类少的个体对下一代的基因频率贡献大 在性别比例失调的情况下在性别比例失调的情况下 N Ne e= 4NmNf /= 4NmNf /(N

10、m+NfNm+Nf) Nm: Nm: 雄性个体数雄性个体数, , Nf: Nf: 雌性个体数雌性个体数 种群种群大小的波动大小的波动应考虑所研究的物种的历史应考虑所研究的物种的历史麋鹿麋鹿(将圈养在英国的麋鹿重新引回国)(将圈养在英国的麋鹿重新引回国)朱缳朱缳(由仅存的少数几只重新扩大种群)(由仅存的少数几只重新扩大种群) 实际上参加生育儿女的个体数实际上参加生育儿女的个体数蜜蜂的例子蜜蜂的例子 瓶颈效应瓶颈效应麋鹿麋鹿 (Elaphurus davidianus ) “四不象四不象”原产亚洲东部,原产亚洲东部,1898年仅剩年仅剩18只,且在只,且在英国乌邦寺庄园;英国乌邦寺庄园;1900年

11、从中国绝迹年从中国绝迹1985年年20只回北京;只回北京;1986年年39只回国,只回国,现已现已2000多只,其中大部分在中国多只,其中大部分在中国(N=819/ Ne =50)种群恢复很快,种群恢复很快,2003年从国际年从国际“红皮书红皮书”中中“除名除名”: 从从“濒危濒危”级降为级降为“珍稀珍稀”(Nipponia nippon)化石广布于亚洲多国,)化石广布于亚洲多国,1964年后年后野外已无踪影野外已无踪影1981年在陕西洋县重新发现朱缳种群年在陕西洋县重新发现朱缳种群 (7只)只)朱缳朱缳现已恢复到约几百只现已恢复到约几百只四四. . 与木村同时代的中性理论进化学家与木村同时代

12、的中性理论进化学家19691969年,年,King & Jukes: Non-Darwinian Evolution当时对当时对codon的预言:的预言:第三位变化更快第三位变化更快 (KingKing,JukesJukes)兼并性兼并性 Neutral selection偏爱性偏爱性 水稻基因水稻基因GCGC含量含量60-70%60-70% Natural selection ?5 5木村中性理论的主要内容:木村中性理论的主要内容:中性突变,随机选择(固定)中性突变,随机选择(固定)承认负选择(承认负选择(negative selection)negative selection)反

13、对正选择(反对正选择(positive selectionpositive selection)强调功能约束(强调功能约束(functional constrainfunctional constrain) 功能的约束造成不同的基因突变速率不一样功能的约束造成不同的基因突变速率不一样 功能重要的部分变化会影响其功能,大多数的变功能重要的部分变化会影响其功能,大多数的变化均受负选择的作用化均受负选择的作用 功能不很重要的部分变化多,不影响功能,被随功能不很重要的部分变化多,不影响功能,被随机保留机保留NOTE:NOTE: 其观点后来略有改变其观点后来略有改变2020世纪世纪8080年代,承认正选

14、择,只不过认为其比例较小年代,承认正选择,只不过认为其比例较小六六. 分子进化的主要研究内容分子进化的主要研究内容1. 经典进化与分子进化研究的比较:经典进化与分子进化研究的比较:(1)经典进化主要以形态特征为主:)经典进化主要以形态特征为主: 颜色颜色 高矮高矮 长短长短 大小大小 等等等等(2)分子进化的特征:分子进化的特征:ATGGAGAGGCCATGGAAGTGCTGCGACAACATCGAG 42 M E R P W K C C D N I K 12DNA序列序列DNA核苷酸数目核苷酸数目氨基酸序列氨基酸序列氨基酸数目氨基酸数目 长短(核苷酸和氨基酸的数目)长短(核苷酸和氨基酸的数目

15、) 分子量分子量 序列(核苷酸和氨基酸的排列顺序)序列(核苷酸和氨基酸的排列顺序) 每个位点就是一个特征每个位点就是一个特征ATGGAGAGGCCATGGAAGTGCTGCGACAACATCGAGM E R P W K C C D N I KDNA、RNA、蛋白质分子、蛋白质分子2. 2. 分子进化的一些术语:分子进化的一些术语:一致性(一致性(identityidentity)指两个或两个以上的序列中组成完全相同的部分指两个或两个以上的序列中组成完全相同的部分相似性(相似性(SimilaritySimilarity)特征相像,来源不确定(用在分子生物学上主要是特征相像,来源不确定(用在分子生

16、物学上主要是指理化性质相似的氨基酸)指理化性质相似的氨基酸)同源性(同源性(HomologyHomology):来源于一个共同祖先):来源于一个共同祖先DNA序列的比对序列的比对Information-content63一致性一致性100%一致性一致性氨基酸的比对氨基酸的比对1CHSACKSCACTYSIPAKCFCTDIND-FCYEPC2CHSACKSCACTFSIPAECFCGDIDD-FCYKPC3CHSACKSCICTLSIPAQCVCDDIDD-FCYEPC4CHSACSSCVCTFSIPAQCVCVDMKD-FCYAPC5CHSACKSCICALSEPAQCFCVDTTD-FCY

17、KSC6CHSACKSCICALSYPAQCFCVDITD-FCYEPC7 CHSACKSCLCTLSIPPQCHCYDITD-FCYPSC8CHSACKTCLCTKSIPPQCHCADITN-FCYPKC9CHSACKSCLCTRSIPPQCRCTDITN-FCYPKC10CPAACNKCVCTRSIPPQCRCTDRTQGRCPLT8CHSACKSCLCTRSIPPQCHCADITN-FCYPKC10CPAACNKCVCTRSIPPQCRCTDRTQGRCPLT红色:红色:一致性一致性粉色粉色和和绿色:绿色:相似性相似性多多序序列列比比对对一对一对序列序列比对比对NOTE:NOTE:若两个

18、基因若两个基因 或蛋白质的序列一致性或相似性很高或蛋白质的序列一致性或相似性很高 DNA的一致性为的一致性为60以上以上氨基酸的一致性为氨基酸的一致性为30以上以上 它们具有相同或相似的生物学功能它们具有相同或相似的生物学功能 它们是同源的它们是同源的对氨基酸序列而言,每个位点可以是对氨基酸序列而言,每个位点可以是2020种选择,若种选择,若2 2个个序列中有序列中有1010个氨基酸的序列完全相同,随机的概率为个氨基酸的序列完全相同,随机的概率为1/201/201010,即约等于即约等于1010-13-13。分子钟分子钟知识知识 南山南山a2, a4, a5a2, a3, a4, a5同源性有

19、两种:同源性有两种:直系同源直系同源orthology:随着新物种产生而产生的同源基因(纵向):随着新物种产生而产生的同源基因(纵向)并系同源并系同源 paralogy:由基因的重复而产生的同源基因(横向):由基因的重复而产生的同源基因(横向)a2a2新物种产生新物种产生a4a4物种物种 4a5a5物种物种 5基因重复基因重复a1物种物种1a2物种物种2&3a3新物种产生新物种产生a2a2 基因分化基因分化直系同源基因:直系同源基因:a2, a3, a4, a5 与与a2, a4, a5互为并系同源互为并系同源n naaaa:所比较序列的氨基酸数目:所比较序列的氨基酸数目d daaaa

20、:所比较两个序列中差异的氨基酸数目:所比较两个序列中差异的氨基酸数目p pd d:两个序列氨基酸相差的程度:两个序列氨基酸相差的程度(percentage of (percentage of amino acid difference, amino acid difference, p pd d = daa / naa = daa / naaT T:两个同源序列分歧的时间:两个同源序列分歧的时间3. 3. 分子的演化速率分子的演化速率(1 1)蛋白质(氨基酸)水平的演化速率)蛋白质(氨基酸)水平的演化速率假设:假设:不同位点上的氨基酸替代速率不同位点上的氨基酸替代速率(substitution

21、 rate)(substitution rate)相同,相同,或即使不相同,平均替代速率也很小或即使不相同,平均替代速率也很小序列一:序列一:CHSACKSCACTYSIPAKCFCTDIND-FCYEPC序列二:序列二:CHSACKSCACTFSIPAECFCGDIDDGFCYKPC 必须有两个或两个以上的同源序列,氨基酸替代必须有两个或两个以上的同源序列,氨基酸替代速率是相对的速率是相对的 每个氨基酸就是一个位点,空位不算每个氨基酸就是一个位点,空位不算123456789. . 上述序列有上述序列有31个位点个位点31序列序列1 1:6 6 个氨基酸个氨基酸序列序列2 2:6 6 个氨基酸

22、个氨基酸n n6 6T(年年)pd 3/6 0.5序列中的氨基酸数:序列中的氨基酸数:n n差异的氨基酸数目差异的氨基酸数目 d daaaa6 63 33 3物种物种A1物种物种A2物种物种A每个位点的氨基酸每个位点的氨基酸平均替代率平均替代率 (substitute rate):k k aa = Kaa / (2T)Kaa:两个同源序列中每个位点氨基酸的:两个同源序列中每个位点氨基酸的平均替代数平均替代数 (substitute number):Kaa = - ln (1 - pd )例子例子: :血红蛋白血红蛋白 、 链,在鲨鱼和高等脊椎动物中为异源链,在鲨鱼和高等脊椎动物中为异源四聚体四

23、聚体 链链人人 vs 鲨鱼(鲨鱼(shark):naa = 139, daa = 74, Pd?pd = 74/139 = 0.532Kaa = - ln(1 - pd)= 0.760人人 vs 鲤鱼(鲤鱼(carp):naa = 140,daa = 68,pd = 74/139 = 0.488Kaa = - ln(1 - pd)= 0.666Pd 链链 链链 链的进化:链的进化:七腮鳗(七腮鳗(lamprey)七鳃鳗的血红蛋白为单体七鳃鳗的血红蛋白为单体在七鳃鳗物种分化后,约在七鳃鳗物种分化后,约在在5.2-4.55.2-4.5亿年前,编码血亿年前,编码血红蛋白基因重复红蛋白基因重复(dup

24、licated)(duplicated)一次,形成一次,形成 、 链链Pd总的来说,分化时间越短,总的来说,分化时间越短,积累的氨基酸的差异就越小积累的氨基酸的差异就越小基因重复形成基因重复形成 、 链链约在约在4.54.5亿年前,鲨鱼分化亿年前,鲨鱼分化出,出,4 4亿年前鲤鱼分化出,亿年前鲤鱼分化出,3.53.5亿年前蝾螈分化出,然亿年前蝾螈分化出,然后分别为鸡,针鼹,袋鼠,后分别为鸡,针鼹,袋鼠,狗,人狗,人 链链以灵长类为例:以灵长类为例:人人 vs vs 树树鼩鼩(tree shrew)(tree shrew):n naa = 146aa = 146,d daa = 26aa = 2

25、6,p pd d = 26/146 = 0.178= 26/146 = 0.178Kaa = 0.196Kaa = 0.196 链:(灵长类)链:(灵长类)树树鼩鼩(tree shrew)(tree shrew)棕狐猴棕狐猴 (brown lemur)(brown lemur)蜘蛛猴蜘蛛猴 (spider monkey)(spider monkey)日本猴日本猴 (Japanese monkey)(Japanese monkey)长臂猿长臂猿 (gibbon)(gibbon)大猩猩大猩猩 (gorilla)(gorilla)人人 ( (Homo sapiensHomo sapiens) )da

26、a树鼩树鼩现存生物中最接近灵长类动物祖先的现存生物中最接近灵长类动物祖先的物种物种食虫目到灵长目的过渡类型食虫目到灵长目的过渡类型 攀兽目攀兽目daa“From the point of view of hemoglobin structure, it appears that gorilla is just an abnormal human, or man an abnormal gorilla, and the two species form actually one continuous population” Emile Zuckerkandl,1963从血红蛋白结构的角度来说,大

27、猩猩似乎从血红蛋白结构的角度来说,大猩猩似乎就是一个异常的人或人是一个异常的大猩就是一个异常的人或人是一个异常的大猩猩。这两个物种形成了一个连续的种群。猩。这两个物种形成了一个连续的种群。将以上动物的血将以上动物的血红蛋白与人比较红蛋白与人比较鸡鸡solid circle: 链链open circle: 链链k k aa约等于约等于0.9 0.9 k k aa x 10 x 10-9-9血红蛋白血红蛋白 、 链基因的重复是一古老的事件,发生在链基因的重复是一古老的事件,发生在鲨鱼物种产生鲨鱼物种产生 、 链之间的氨基酸差异链之间的氨基酸差异人人 ( ( vs. vs. ) Pd=0.58) P

28、d=0.58鲤鱼鲤鱼( ( vs. vs. ) Pd=0.59) Pd=0.59鲨鱼鲨鱼( ( vs. vs. ) Pd=0.67) Pd=0.67k k aaaa = 0.81 X 10 = 0.81 X 10-9-9 、 链之间的分子演化是独立的,它们的链之间的分子演化是独立的,它们的k k aa约为约为1010-9-9尽管尽管Port Jackson sharkPort Jackson shark被称为活化石,它的血红蛋被称为活化石,它的血红蛋白的分子演化速率与其它生物一样白的分子演化速率与其它生物一样形态演化和分子演化的速率不一致形态演化和分子演化的速率不一致4. 分子钟分子钟 (mo

29、lecular clock) 学说学说Zuckerkandl and Pauling (1965)Evolutionary Divergence and Convergence in Proteins,(1)定义:一个特定的大分子(蛋白质或)定义:一个特定的大分子(蛋白质或DNA)在所有)在所有的演化谱系中具有恒定的演化速率。的演化谱系中具有恒定的演化速率。(2)得到速率)得到速率 的关键:的关键:大分子(物种)分歧的时间大分子(物种)分歧的时间 时间很难预测时间很难预测 最准的是用化石或地质事件最准的是用化石或地质事件 相对速率相对速率 : 用一分歧时间早于所比较的两个种的物用一分歧时间早于

30、所比较的两个种的物种作参考种作参考 先决条件:演化速率恒定(必须事先验证)先决条件:演化速率恒定(必须事先验证)Linus Pauling (1901-1994)1954年年 Nobel Prize in chemistry (化学键,蛋白的分子结构)化学键,蛋白的分子结构)阻止核试验阻止核试验1963年年Nobel Prize in Peace大力推广大力推广Vc的大剂量服用,的大剂量服用, 受到科学界批评受到科学界批评Emile Zuckerkandl (1922- ) 1998年获奥地利科年获奥地利科学荣誉十字勋章学荣誉十字勋章夏威夷群岛形成夏威夷群岛形成的时间已知的时间已知其上的鸟类和

31、果其上的鸟类和果蝇一些基因具有蝇一些基因具有匀速演化速率匀速演化速率分子演化的单位分子演化的单位: pauling, : pauling, MEU: 10MEU: 10-9-9/aa/year/aa/year(3)分子钟的局限性:)分子钟的局限性: 分子钟的区域性分子钟的区域性 (local clock)并非所有的并非所有的DNA分子都符合分子钟学说分子都符合分子钟学说并非基因的所有部分都符合分子钟学说并非基因的所有部分都符合分子钟学说 如何解释同一分子在不同物种中不同的演化速率?如何解释同一分子在不同物种中不同的演化速率?如:啮齿类动物的演化速率要快于灵长类如:啮齿类动物的演化速率要快于灵长

32、类为什么为什么a)不同的修复系统(用离体的细胞系来做)不同的修复系统(用离体的细胞系来做)人细胞的修复系统要比旧大陆的猴子细胞的修复系统效率高人细胞的修复系统要比旧大陆的猴子细胞的修复系统效率高反方意见:反方意见:不是体内实验,不精确不是体内实验,不精确 b)生命周期的不同(长的慢、短的快,)生命周期的不同(长的慢、短的快, 单位时间内生殖单位时间内生殖细胞分裂次数多)细胞分裂次数多) 上述的假设为:主要的突变发生在上述的假设为:主要的突变发生在DNA复制过程中复制过程中c)代谢速率)代谢速率 (快的演化速率快,反之亦然)(快的演化速率快,反之亦然)代谢速率快,产生自由基多,代谢速率快,产生自

33、由基多, 突变突变例子:线粒体消耗例子:线粒体消耗95%的细胞的细胞O2,它的基因组中碱基替换率,它的基因组中碱基替换率 大于相应的大于相应的nt DNA 同一个分子不同的部位速率不同同一个分子不同的部位速率不同a)一些位点变化被保留,因此变化快)一些位点变化被保留,因此变化快b)一些重要的位点变化慢,因此很保守)一些重要的位点变化慢,因此很保守RBBI3-3 -RPWGDCCDKAF-CNKMNPPTCRCMD-EVKECADACKDC-QRVESS RBTI PRTWGDCCDKAF-CNKMNPPTCRCMD-EVKECADACKDC-QRVESS RBBI3-1 -RPWGKCCDKA

34、F-CNKMNPPTCRCMD-EVNKCAAACKDC-QRVESS RBBI2-3 -RPWGDCCTNTT-CTRSIPPICRCND-KVKKCAAACKDC-KRVKSS RBBI2-C1 PRPWGYCCTNTT-CTRSIPPICRCND-KVKKCAAARKDG-KRVKSS RBBI3-2 -RPWGDCCDNTT-CTKSIPPICSCGD-KVAACDGACKDC-QPVASS RBBI2-1 -RPWGDCCDKAF-CTRSLPPICHCAD-EVASCAAACKEC-DMVNSS RBBI2-2 -WPWGPCCDIAV-CTKSLPPICHCSD-EVESCAAA

35、CGQC-EMVDSWRBBI2-4 PRPWGDCCDMDI-CSRSLPPICRCAD-EVESCAAACKDC-QQLESS*与三维结构造型有关与三维结构造型有关与催化位点相关与催化位点相关催化位点与底物结合相关,催化位点与底物结合相关, 催化位点变化催化位点变化 结合的底物可能变化结合的底物可能变化鸡基因的演化速率为何慢?鸡基因的演化速率为何慢?特殊的生态环境?特殊的生态环境?分子演化研究应该和形态演化、环境的互作分子演化研究应该和形态演化、环境的互作相结合相结合课堂问题:课堂问题:请仔细看一下密码子编码氨基酸的表格,推请仔细看一下密码子编码氨基酸的表格,推测一下哪个位置可能最保守(变

36、化最小)?测一下哪个位置可能最保守(变化最小)? A T G第一位第一位第二位第二位第三位第三位“现代分子生物学现代分子生物学”作者:朱玉贤、李毅作者:朱玉贤、李毅出版社:高等教育出版社出版社:高等教育出版社出版时间:出版时间:2002The Neutral Theoryof Molecular Evolution(第三章)第三章) 作者:作者:Motoo Kimura出版社:出版社:Cambridge University Press出版时间:出版时间:1983参考书籍参考书籍上节课总结上节课总结自然变异、遗传多样性的物质基础自然变异、遗传多样性的物质基础中性演化理论提出的背景中性演化理论提

37、出的背景中性演化论的主要内容:中性突变,随中性演化论的主要内容:中性突变,随机选择机选择演化速率与种群大小的关系演化速率与种群大小的关系蛋白质分子演化的重要公式:蛋白质分子演化的重要公式:每个位点氨基酸的平均替代数(每个位点氨基酸的平均替代数( Kaa )Kaa = - ln (1 - pd )每个位点每年的氨基酸替代率(每个位点每年的氨基酸替代率( k kaa )为:)为:k kaa = Kaa / (2T)3. 3. 分子的演化速率分子的演化速率(2)核苷酸序列(基因)演化的速率)核苷酸序列(基因)演化的速率 必须有两个以上的同源序列,演化速率是相对的必须有两个以上的同源序列,演化速率是相

38、对的 每个核苷酸就是一个位点每个核苷酸就是一个位点 起始密码子和终止密码子一般不算(对编码蛋白质起始密码子和终止密码子一般不算(对编码蛋白质的基因而言)的基因而言) 启动子启动子(promoter)(开关)(开关)53A. 真核生物编码蛋白质及真核生物编码蛋白质及RNA的基因结构的基因结构3非转录区非转录区(3UTR)(非编码区非编码区)外显子外显子(exon)(编码区编码区)内含子内含子(intron)(非编码区非编码区)完整的基因编码区(完整的基因编码区(mRNA)ATGTAATAGTGA5非转录区非转录区(5UTR)(非编码区非编码区)ATG CCG AGC GTT GTA AGG TC

39、C ATC GTG GCC ATT TAAAGCT置换置换(Transition):颠换颠换(Transversion) :嘌呤嘌呤 嘌呤,嘌呤, 嘧啶嘧啶 嘧啶嘧啶B. 核苷酸序突变的速率核苷酸序突变的速率碱基替代的类型(碱基替代的类型(types of base subsitution):):同义替代(同义替代(synonymous substitution):碱基的改变不影响所编码的氨基酸碱基的改变不影响所编码的氨基酸非同义替代非同义替代(non-synonymous substitution):碱基的改变影响所编码的氨基酸碱基的改变影响所编码的氨基酸嘌呤嘌呤 嘧啶,嘧啶,嘧啶嘧啶 嘌呤

40、嘌呤a. a. 碱基替代速率的不同的模型碱基替代速率的不同的模型a) Jukes and Cantora) Jukes and Cantors ( JC) s ( JC) 模型模型 或单参数模型(或单参数模型(one parameter modelone parameter model)每个位点的碱基被另一个碱基替代速率为每个位点的碱基被另一个碱基替代速率为 每个位点的碱基替代速率每个位点的碱基替代速率 = 3= 3 K-2模型模型JC模型模型AGCTAGCT b) Kimura Two-Parameter b) Kimura Two-Parameter 模型模型 或或 K-2 K-2 模型模

41、型: :碱基置换和颠换的速率不一样碱基置换和颠换的速率不一样 为一个位点的碱基被同类碱基替代(置换)的速率为一个位点的碱基被同类碱基替代(置换)的速率 为一个位点的碱基被另一类碱基替代(颠换)的速率为一个位点的碱基被另一类碱基替代(颠换)的速率JC JC 和和 K2 K2 模型的区别和相同之处模型的区别和相同之处: : 假设不一样假设不一样JCJC模型模型: : 所有碱基的替代速率均等所有碱基的替代速率均等K-2K-2模型模型: : 置换和颠换的替代速率不相等置换和颠换的替代速率不相等 当时间无穷大时当时间无穷大时, , 两个模型趋于一致两个模型趋于一致其他模型其他模型C. C. 核苷酸序列位

42、点的平均碱基替代数核苷酸序列位点的平均碱基替代数(K)(K)的计算的计算a. a. 非编码区非编码区: :a) JC(a) JC(模型模型) )方法方法: :K = - (3/4)ln1-(4/3)p K = - (3/4)ln1-(4/3)p p = p = 两序列中发生变化的碱基的比例两序列中发生变化的碱基的比例b) K2(b) K2(模型模型) )方法:方法:K = (1/2)ln(x) + (1/4) ln(y)K = (1/2)ln(x) + (1/4) ln(y)x = 1/(1 x = 1/(1 2P 2P Q), y = 1/(1-2Q) Q), y = 1/(1-2Q)P P

43、为两序列中发生置换的碱基的比例为两序列中发生置换的碱基的比例Q Q为两序列中发生颠换的碱基的比例为两序列中发生颠换的碱基的比例举例举例: : 人和人和鹰脸猴鹰脸猴胰岛素基因的第一个胰岛素基因的第一个intronintron(非编码区)(非编码区)总长总长: 163nt,: 163nt,不同的碱基数不同的碱基数: 18, p = 18/163 = 0.11: 18, p = 18/163 = 0.11根据根据JCJC模型模型: K = 0.119: K = 0.119根据根据K2K2模型模型: P = 14/163 = 0.086, Q = 4/163 = 0.025: P = 14/163 =

44、 0.086, Q = 4/163 = 0.025 K = 0.122 K = 0.122D. 编码区编码区a. 一般一般start和和stop codon不予考虑不予考虑b. 根据密码子中碱基的兼并性将碱基分为三类根据密码子中碱基的兼并性将碱基分为三类:0兼并性兼并性(0),nondegenerate: 无论替代哪个碱基无论替代哪个碱基, 编码编码的氨基酸都变的氨基酸都变如如CCA (Pro) 的第一二个碱基的第一二个碱基 2兼并性兼并性(2),twofold degenerate: 有两个碱基可替代有两个碱基可替代, 编编码的氨基酸不变码的氨基酸不变如如CAU (His) 的第三个碱基的第

45、三个碱基4兼并性兼并性(4),fourfold degenerate: 无论替代四个碱基中无论替代四个碱基中的哪一个的哪一个, 编码的氨基酸不变编码的氨基酸不变如如CCA(Pro)的第三个碱基的第三个碱基(Ile是例外是例外,一般作一般作2倍兼并性处理倍兼并性处理)c. 每类位点的总替代数每类位点的总替代数:0兼并性位点:兼并性位点:K0 (全部非同义替代)(全部非同义替代)4兼并性位点:兼并性位点:K4 ( 全部同义替代)全部同义替代)2兼并性位点:兼并性位点:K2 (既有同义替代(既有同义替代, 又有非同义又有非同义替代)替代)同义替代位点的平均替代数:同义替代位点的平均替代数:KS 非同

46、义替代位点的平均替代数:非同义替代位点的平均替代数:KACCACCCCCGCCUCAACAGCACCAU估算估算DNA的演化速率:的演化速率:K为每个位点的平均替代数为每个位点的平均替代数K小,标准差便大小,标准差便大T不能太小,亲缘关系太近误差大不能太小,亲缘关系太近误差大注意!注意!PCR扩增出的序列引物部分要慎重扩增出的序列引物部分要慎重在现实中碱基的替代是复杂的在现实中碱基的替代是复杂的( 2T ) = K单个替代单个替代多个替代多个替代同时替代同时替代平行替代平行替代趋同替代趋同替代回复替代回复替代 D. 小结小结a. 基因不同部分的演化速率不同基因不同部分的演化速率不同非同义位点非

47、同义位点: 一般来说,受负选择压力较大一般来说,受负选择压力较大同义同义位点位点:为中性或接近中性的选择为中性或接近中性的选择根据密码表,根据密码表,Ka的位点与的位点与Ks的位点相同的位点相同Ka 造成编码氨基酸的改变,可能改变其功能造成编码氨基酸的改变,可能改变其功能Ks 编码的氨基酸不改变,不影响其功能编码的氨基酸不改变,不影响其功能Ka / Ks = 1 ?Ka / Ks 1 ?b. 观察到的碱基替代数往往会比实际发生的要观察到的碱基替代数往往会比实际发生的要 少少4. 基因组的演化基因组的演化现已有几百个原核生物的基因组被测序现已有几百个原核生物的基因组被测序几十个几十个真核生物的基

48、因组真核生物的基因组被测序被测序生生 物物 基因(基因(ORF, 开放阅读框)开放阅读框)Mycoplasma genitalium 480(到目前为止已知的最简单的生物的基因组)(到目前为止已知的最简单的生物的基因组)一般的原核生物一般的原核生物E. coli4,277 最简单的真核生物酵母最简单的真核生物酵母6,246 最简单的无脊椎生物线虫最简单的无脊椎生物线虫19,223 较简单的高等植物拟南芥较简单的高等植物拟南芥25,498鸭嘴兽鸭嘴兽(爬行、鸟类、哺乳爬行、鸟类、哺乳) 18,527“高等高等”的脊椎动物人的脊椎动物人3万多万多人类重要的食物资源水稻人类重要的食物资源水稻5万多万

49、多未上封面的物种:大豆、高粱、短柄草、蘑菇、未上封面的物种:大豆、高粱、短柄草、蘑菇、黄瓜、褐藻、水螅、黄瓜、褐藻、水螅、Songbird,等等,等等Craig VenterCelera公司总裁公司总裁Francis Collins NIH人类基因组人类基因组研究中心主任研究中心主任基因组研究中常用的一些术语:基因组研究中常用的一些术语: 单碱基多态性(单碱基多态性(Single Nucleotide Polymorphism, SNP) 碱基的替代碱基的替代 AAGCGTACTGGCAGGTTTAGC AACGGTACTGGCAGTTTACGC 插入插入/缺失(缺失(insertion/de

50、letion, indel) 一般指一般指1-5个碱基的插入或缺失个碱基的插入或缺失 AAG GTACTGGCAGGTTTAGC AACGGTACTGGCA TACGC 单倍型(单倍型(haplotype) 一组具有相同变异的序列一组具有相同变异的序列(1)基因组演化的机制:)基因组演化的机制: 整个基因组的重复整个基因组的重复 多倍体多倍体酵母整个基因组重复过一次酵母整个基因组重复过一次拟南芥、水稻的基因组均重复过拟南芥、水稻的基因组均重复过原估计植物中约原估计植物中约70%为多倍体,现推测远远不止为多倍体,现推测远远不止 杂交事件杂交事件植物植物中的自然杂交事件远远多于动物中的自然杂交事件

51、远远多于动物 染色体的染色体的重排重排 基因的重复(血红蛋白基因,植物的抗病基因等等)基因的重复(血红蛋白基因,植物的抗病基因等等)(2)基因组中编码)基因组中编码RNA的基因(不包括的基因(不包括mRNA, tRNA, rRNA)的功能?的功能?一个快速进化的一个快速进化的RNA基因在人脑早期发育阶段表达基因在人脑早期发育阶段表达该基因的功能未知,但有可能参与调控一些重要基因的时空表达该基因的功能未知,但有可能参与调控一些重要基因的时空表达有可能与有可能与Homo sapiens和和Pan troglodytes的分化相关的分化相关寻找人基因组中快速演化的寻找人基因组中快速演化的RNA判断判

52、断(3)很多)很多“无用无用”的序列到底有没有用?的序列到底有没有用? 哺乳动物中哺乳动物中非编码序列的非编码序列的研究研究矮牵牛花矮牵牛花Petunia hybrida人和黑猩猩的基因组的差异只有人和黑猩猩的基因组的差异只有1.09%;染色体的数目及形态几乎没有变化染色体的数目及形态几乎没有变化未重排染色体部分的基因未重排染色体部分的基因Ka/Ks值值染色体重排部分的基因染色体重排部分的基因Ka/Ks值值结论:染色体的重排与基因功结论:染色体的重排与基因功能的分化密切相关,与黑猩猩能的分化密切相关,与黑猩猩与人的分化密切相关与人的分化密切相关Ka / Ks值值Ka/Ks1虽然人和黑猩猩的染色体的数目及形态几乎虽然人和黑猩猩的染色体的数目及形态几乎没有变化,但存在很多的重排没有变化,但存在很多的重排对对13个哺乳动物中保守的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论