版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、From Genes to Genomes(7)Interrupted genes(8)bIntroduction引言引言bRestriction endonucleases are a key tool in mapping Restriction endonucleases are a key tool in mapping DNA DNA 通过限制性内切作图通过限制性内切作图 How variable are individual genomes? How variable are individual genomes? 分子标记,分子标记作图与应用(?)分子标记,分子标记作图与应用(?
2、)bInterrupted GeneInterrupted Gene Exon sequences are conserved but introns vary Exon sequences are conserved but introns vary Genes can be isolated by the conservation of exonsGenes can be isolated by the conservation of exons b基因在尺寸大小上分布广泛53-b断裂基因是如何发展进化的?58-本讲主要内容1993 Nobel Richard J. Roberts and
3、 Phillip A. Sharp GenomicbA restriction map represents a linear sequence of the sites at which particular restriction enzymes find their targets. bDistance along such maps is measured directly in base pairs (abbreviated bp) for short distances; longer distances are given in kb, corresponding to kilo
4、base (103) pairs in DNA or to kilobases in RNA. At the level of the chromosome, a map is described in megabase pairs (1 Mb = 106 bp).b我们现在可以制作一个完整的我们现在可以制作一个完整的5000bp区域图谱。区域图谱。b前面那长张图显示了特异的限制性酶切前面那长张图显示了特异的限制性酶切DNA的位置,这些切点的位置,这些切点的距离由碱基对进行测量。的距离由碱基对进行测量。这样这样DNA被分割成一系列由限制性被分割成一系列由限制性酶决定的确定长度的区域,这些长度区
5、域由限制酶切割。酶决定的确定长度的区域,这些长度区域由限制酶切割。 2.2 Restriction endonucleases are a key tool in mapping DNA 32. Restriction mapping b5000bp长b的DNA分子由两个限制性酶A和B切成片段,而后DNA进行电泳。每一条片段的大小由已知大小的片段的位置来决定,如中部所示。b酶A将DNA切成4段(长为2100, 1400, 1000, 500pb), b酶B切为3段(长为2500, 1300, 1200bp)。那么是否能根据这些数据制作一个图谱,来显示DNA分子的特定的断裂点呢?b真正构建限制性
6、图谱时需要许多酶,所以解决由各真正构建限制性图谱时需要许多酶,所以解决由各种各样酶产生的十分复杂的覆盖片段是十分必要的。种各样酶产生的十分复杂的覆盖片段是十分必要的。许多更进一步的技术就用来构建图谱。许多更进一步的技术就用来构建图谱。b 另一种方法是用部分(酶切)消化,通过在一些另一种方法是用部分(酶切)消化,通过在一些条件下,一种酶并不确认每一种条件下,一种酶并不确认每一种DNADNA分子的目标切分子的目标切点而是不能在目标切点上进行切除。这种条件可以点而是不能在目标切点上进行切除。这种条件可以设置,这样这种酶有一个特殊的可能性,例如,只设置,这样这种酶有一个特殊的可能性,例如,只切它所识位
7、点的切它所识位点的5050。b应用单酶切不完全消化技应用单酶切不完全消化技术,酶术,酶A A可能产生可能产生35003500, 31003100, 1400bp1400bp等等的分裂片的分裂片段,通过比较完全消化的段,通过比较完全消化的部分产品,部分产品, 1000-2100bp1000-2100bp片段可被认作片段可被认作3100bp3100bp部分部分片段的邻近成分。同样,片段的邻近成分。同样,21002100, 1400bp1400bp片段可被置片段可被置于于3500bp3500bp部分片段作为邻部分片段作为邻近成分。这样该技术允许近成分。这样该技术允许单切酶切点按序排列。单切酶切点按序
8、排列。b如果一种酶的两个些切点如果一种酶的两个些切点离得非常近离得非常近(比如,(比如,小于小于50bp50bp),则所产生的非常小的片段就在琼),则所产生的非常小的片段就在琼脂糖凝胶上丢失。当然,当其它片段的分子量脂糖凝胶上丢失。当然,当其它片段的分子量相加时,这种情况会导致脱节。相加时,这种情况会导致脱节。b这个问题可以通过应用其他一些限制性酶来构这个问题可以通过应用其他一些限制性酶来构建图谱而被克服掉,所以用不同酶产生的片段建图谱而被克服掉,所以用不同酶产生的片段中有总够的覆盖来保证所有的中有总够的覆盖来保证所有的DNADNA都被包含进都被包含进来。来。b另一有用技术是末端标记另一有用技
9、术是末端标记,而,而DNADNA分子的末端用分子的末端用放射性放射性P P元素进行标记(一定的酶可将元素进行标记(一定的酶可将P P单元特单元特定地加到定地加到55或或33端)。这允许了包含末端的片段端)。这允许了包含末端的片段由于放射标记而被识别。这样在片段由于放射标记而被识别。这样在片段A A准备中,准备中, A-1000A-1000, A-500A-500将迅速置于图谱两端,将迅速置于图谱两端, 片段片段B-B-12001200, B-1300B-1300将被认为是末端片段。将被认为是末端片段。b 通过用末端标记技术比较部分酶切消化,一通过用末端标记技术比较部分酶切消化,一系列的由一种酶
10、所确定的切点可以直接相对末系列的由一种酶所确定的切点可以直接相对末端而在图上做出来,图端而在图上做出来,图2.42.4显示了显示了仅由它们放射仅由它们放射性的标记末端性的标记末端而识别出的片段,那些分子内的而识别出的片段,那些分子内的切点被忽略掉,然后而一系列片段确定了距标切点被忽略掉,然后而一系列片段确定了距标记末端的每一个切点。如果图记末端的每一个切点。如果图6.46.4的左端的左端5000bp5000bp片段被做上标记,酶片段被做上标记,酶A A的部分断裂将立即确定出的部分断裂将立即确定出距末段的距末段的10001000, 31003100, 4500bp4500bp切点。切点。2.2
11、Restriction endonucleases are a key tool in mapping DNA 10001000, 31003100, 4500bp4500bpbDNA 结构在结构在不同种不同种类的生物体内存在着相当大的差异类的生物体内存在着相当大的差异b随着对基因及基因组认识的不断深入,发现随着对基因及基因组认识的不断深入,发现同种同种的不的不同个体之间,尽管其蛋白质产物的结构和功能完全相同个体之间,尽管其蛋白质产物的结构和功能完全相同或仅有微小差异,但在同或仅有微小差异,但在DNA 水平却存在着差异或明水平却存在着差异或明显差异,显差异,尤其在不编码蛋白质的区域以及没有重要
12、调尤其在不编码蛋白质的区域以及没有重要调节功能的区域表现更为突出节功能的区域表现更为突出。bDNA 顺序上的大多数突变是中性突变,即不影响生物顺序上的大多数突变是中性突变,即不影响生物体的表型,因而过去长期对这些突变不太重视,也无体的表型,因而过去长期对这些突变不太重视,也无法用传统的遗传学方法来研究。法用传统的遗传学方法来研究。2.3 How variable are individual genomes? 个体基因组如何变化个体基因组如何变化? (though HPG)For example , you and me 与与 酶切有关酶切有关(小小基因组)基因组)b分子操作技术的不断发展,从
13、分子操作技术的不断发展,从DNA 水平上直接水平上直接分析生物体的突变成为可能。分析生物体的突变成为可能。b假如假如DNA 顺序中的某个碱基发生了突变,尤其顺序中的某个碱基发生了突变,尤其是在某种限制性内切酶的位点是在某种限制性内切酶的位点( (突变或缺失突变或缺失) )。这。这样,利用该限制性内切酶消化此样,利用该限制性内切酶消化此DNA 时,便会时,便会产生产生与正常不同的限制性片段与正常不同的限制性片段。这样,在同种。这样,在同种生物的不同个体中会出现不同长度的限制性片生物的不同个体中会出现不同长度的限制性片段类型,即限制性片段多态性(段类型,即限制性片段多态性(RFLP )。)。b其他
14、的显示其他的显示DNADNA差异(多态性的)?差异(多态性的)?b分子标记分子标记 构建高分别率构建高分别率遗传图谱遗传图谱( ( b8080年代年代,Botsein,Botsein提出提出DNADNA限制性片段长度多态限制性片段长度多态性性(RFLP)(RFLP)可以作为遗传标记可以作为遗传标记,从此开创了直接应从此开创了直接应用用DNADNA多态的新阶段多态的新阶段.b9090年代年代,DNA,DNA多聚酶链式反应多聚酶链式反应(PCR)(PCR)的发展的发展,使直使直接扩增接扩增DNADNA的多态性成为可能的多态性成为可能,并在此基础上并在此基础上产生了许多种新型分子标记产生了许多种新型
15、分子标记,诸如扩增片段多诸如扩增片段多态性态性(ALFR)(ALFR)、串联重复序列、串联重复序列(VNTR)(VNTR), RAPDRAPD是较是较为突出的一种为突出的一种. . bSNP SNP 单链构型多态性单链构型多态性(PCR-SSCP)(PCR-SSCP)、序列特异扩、序列特异扩增区域增区域(SCAR).(SCAR).限制性片段长度限制性片段长度多态性多态性的的分分类类bRFLP分为两类型:分为两类型:b 一类是由于限制性内切酶一类是由于限制性内切酶位点上发生了单个碱基突位点上发生了单个碱基突变而使这一限制性变而使这一限制性位点发位点发生丢失或获得生丢失或获得而产生的多而产生的多态
16、性,故称之为态性,故称之为点多态点多态性性(point polymorphism )。)。这类多态性实际上是双态这类多态性实际上是双态的,即有(的,即有(+ )或无()或无(- )。)。另一类是由于另一类是由于DNA 分子内部发生较大的顺序变化所致。分子内部发生较大的顺序变化所致。这一类多态性又可以分成这一类多态性又可以分成两类两类: 第一类第一类是由于是由于DNA 顺序上发生突变如缺失、重复、插顺序上发生突变如缺失、重复、插入所致入所致。反映的是在。反映的是在RLFPRLFP多态多态 第二类第二类是所谓是所谓“高变区高变区”。高变区(。高变区(highly variable region )
17、,是由多个串联重复顺序组成的,不同的个),是由多个串联重复顺序组成的,不同的个体高变区内所串联重复的拷贝数相差悬殊,因而高变体高变区内所串联重复的拷贝数相差悬殊,因而高变区的长度变化很大,从而使高变区两侧限制性内切酶区的长度变化很大,从而使高变区两侧限制性内切酶识别位点的固定位置随高变区的大小而发生相对位移。识别位点的固定位置随高变区的大小而发生相对位移。所以这一类型的所以这一类型的RFLP 是由于是由于高变区内串联重复顺序的高变区内串联重复顺序的拷贝数不同拷贝数不同所产生的,其突出特征是限制性内切酶识所产生的,其突出特征是限制性内切酶识别位点本身的碱基没有发生改变,改变的只是它在基别位点本身
18、的碱基没有发生改变,改变的只是它在基因组中的相对位置。因组中的相对位置。即可反映在即可反映在RLFPRLFP上,也可上,也可PCRPCR扩增扩增 高变区高变区DNA与与DNA指纹指纹b人的卫星人的卫星DNA 或称随体或称随体DNA 是由一些短的是由一些短的DNA 片片段(段(10bp 左右)多次重复所构成的。左右)多次重复所构成的。b重复片段的组成和拷贝数在不同的个体及基因组的重复片段的组成和拷贝数在不同的个体及基因组的不同位置上不一样。不同位置上不一样。bDNA 指纹的图谱取决于所用探针的核心序列(即重指纹的图谱取决于所用探针的核心序列(即重复序列中的重复单位)。目前所用的探针有两种,复序列
19、中的重复单位)。目前所用的探针有两种,即探针即探针33.5 。其核心序列为。其核心序列为 AGAGGTGGGCAGGTGG, 33.6 ,即,即AGGGCTGGAGG 。b这就是说这两种序列在人体基因组中不同的这就是说这两种序列在人体基因组中不同的位置上分别重复不同的次数,而在不同个体位置上分别重复不同的次数,而在不同个体的基因组中,对应位置上这两种核心序列的的基因组中,对应位置上这两种核心序列的重复次数也不相同。重复次数也不相同。b这样用这两种探针之一与合适的酶切割的人这样用这两种探针之一与合适的酶切割的人体基因组体基因组DNA 片段杂交,在不同的个体将得片段杂交,在不同的个体将得到不同的到
20、不同的DNA 指纹,而且探针指纹,而且探针33.5 的的DNA 指指纹图也不相同。纹图也不相同。DNA 指纹具有细胞稳定性和指纹具有细胞稳定性和种系稳定性,是按孟德尔规律遗传的,而且种系稳定性,是按孟德尔规律遗传的,而且杂合性高。杂合性高。b对于由点突变引起的对于由点突变引起的RFLP ,就某一个多态性,就某一个多态性切点来说只有两种多态性,即切点有(切点来说只有两种多态性,即切点有(+ )或)或切点无(切点无(- )。)。b而对由于高变区重复片段长度不同所引起的而对由于高变区重复片段长度不同所引起的RFLP 来说,在基因组上某一个位置核心序列来说,在基因组上某一个位置核心序列的重复次数在不同
21、的个体不一样,比如在个体的重复次数在不同的个体不一样,比如在个体为为10 个拷贝,个体为个拷贝,个体为15 个拷贝,而个体个拷贝,而个体又可能为又可能为18 个拷贝等等。个拷贝等等。b因此,在不同个体同一个相应位置上核心序列的因此,在不同个体同一个相应位置上核心序列的重复次数就是重复次数就是多态的,而不是双态的多态的,而不是双态的。即使在基。即使在基因组上的某一个位置处核心序列的次数一样,从因组上的某一个位置处核心序列的次数一样,从而被酶切出的长度相同,但在基因组的其他位置而被酶切出的长度相同,但在基因组的其他位置上该核心序列重复次数又可能不同。上该核心序列重复次数又可能不同。b由于由于DNA
22、 指纹是按孟德尔规律遗传的,子代的指纹是按孟德尔规律遗传的,子代的DNA 指纹图可以追溯到其父母指纹图可以追溯到其父母DNA 指纹图上,而指纹图上,而在不是其父母的在不是其父母的DNA 指纹图上则很难找到与其一指纹图上则很难找到与其一样的小随体样的小随体DNA 片段。在父亲的片段。在父亲的5 条可分辨的小条可分辨的小随体随体DNA 片段中,有片段中,有4 条处于杂合状态,即这条处于杂合状态,即这4 条条DNA 片段有不同的个体长度。片段有不同的个体长度。b因此,因高变区核心序列重复次数不同引起的因此,因高变区核心序列重复次数不同引起的RLFP 才是真正的多态性。才是真正的多态性。b在不同个体,
23、这种在不同个体,这种RLFP 即即DNA 指纹可以说不指纹可以说不存在相同的。存在相同的。b即使使用一种探针产生的即使使用一种探针产生的DNA 指纹图无法鉴定指纹图无法鉴定这两个个体,如再用另一种探针便有可能将这这两个个体,如再用另一种探针便有可能将这两个个体区分开。两个个体区分开。bDNA 指纹技术已被应用于亲子鉴定和法医学上指纹技术已被应用于亲子鉴定和法医学上对罪犯的确认等领域。对罪犯的确认等领域。2.3 How variable are individual genomes?个体基因组如何变化个体基因组如何变化? ?SNP (single nucleotide polymorphism)
24、 is any site at which a single nucleotide has changed when two (haploid) genomes are compared.bA Single Nucleotide Polymorphism (SNP), pronounced snip, ispronounced snip, is a single DNA base variation a single DNA base variation observed in the human population.observed in the human population.bA A
25、 haplotype stands for stands for a set of linked SNPs on the on the same chromosome.same chromosome.SNP1SNP2SNP3-A C T T A G C T C-A A T T T G C T C-A C T T T G C T T-A C T T T G C T C-Haplotype2Haplotype3C A CA T CC T THaplotype1SNP1SNP2SNP3Haplotype4C T C SNP,RLFP, VTRPb实际上,在实际上,在DNA 顺序中,存在着大量的单个碱
26、基的替顺序中,存在着大量的单个碱基的替换,但用通常所用的技术只能检测出影响到限制性内换,但用通常所用的技术只能检测出影响到限制性内切酶识别位点上的突变。切酶识别位点上的突变。b不同的多态性切点在一特定人群中出现(不同的多态性切点在一特定人群中出现(+ )的频率)的频率不一样。不一样。一段一段DNA,切点,切点= =0.6 (即(即60 的人含有该切点,而另的人含有该切点,而另外外40 的人在同一位点处不含该切点);的人在同一位点处不含该切点); 切点切点= =0.4 。 随机随机 : :、同时存在(、同时存在(+ )0.6 0.4=0.24, 即即24 的人同时含有、两个切点。的人同时含有、两
27、个切点。 非随机相关的,那么同时存在的可能性将和非随机相关的,那么同时存在的可能性将和预期的频率相差较大。预期的频率相差较大。这种相关的非随机性称为这种相关的非随机性称为: : 连锁连锁不平衡。不平衡。n ,2n 组合,每种组合称为一种单元型,每种单元型组合,每种组合称为一种单元型,每种单元型随随机相关机相关的预期出现频率为各个位点频率乘积。但是,的预期出现频率为各个位点频率乘积。但是,实践证明多态性切点之间实践证明多态性切点之间并非并非随机相关。随机相关。例如,在例如,在 珠蛋白基因簇内多态性切点珠蛋白基因簇内多态性切点2 到到9 共共8 个,理个,理论应有论应有28=256 种组合,即种组
28、合,即256 种单体型。但实际上有种单体型。但实际上有3 种单体型在希腊、意大利和亚洲印度人种单体型在希腊、意大利和亚洲印度人 A 染色体染色体(携带正常(携带正常 珠蛋白基因的染色体)中就有珠蛋白基因的染色体)中就有94 ,而有些理论上的组合在实际上却是不存在的。而有些理论上的组合在实际上却是不存在的。在理论上,单体型(从切点在理论上,单体型(从切点2 到到9 )的频率为)的频率为 0.46 0.48 0.7 0.27 0.83 0.52 0.37 0.32=0.0021, 而实际上该单体型的频率为而实际上该单体型的频率为0.64 ,两,两者相差甚大。者相差甚大。这说明各个多态性切点之间是非
29、随机相关的(这说明各个多态性切点之间是非随机相关的(连锁不平连锁不平衡衡)。)。Mapping human genes by linkage analyisisPhysical dist. Genetic dist.Chromosome 1 : 283 Mb 270 cM (0.95 cM/Mb)q arm of chromosome 21: 30 Mb62 cM (2.1 cM/Mb)Human genome3200 Mb 3615 cM (1.13 cM/Mb)Female genome4460 cMMale genome 2590 cMDA=Da=f(D)*f(A)or(a)dA=da=
30、f(d)*f(A)or(a)DA=Da=f(D)*f(A)or(a)dA=da=f(d)*f(A)or(a)- Ratio form genetic distance to basepairs range from 0.01cM/Mb to 60 cM/Mb- 90% of all SNPs are shared among disparate populations- African populations have smallers blocks (average 7.3kb) comparedwith 16.3kb in Europeans whereas the Chinese and
31、 Japanese blocks have an average size of 13.2kb. bCandidate gene analysis Based on prior localization information from affected familiesbGenome-wide scanb定位克隆b辅助选择b疾病诊断b。b分子标记的重要作用分子标记的重要作用: :b 为发现疾病提供了诊断过程。有些遗传描述详细为发现疾病提供了诊断过程。有些遗传描述详细但是分子机制描述困难的人类疾病很难诊断,如但是分子机制描述困难的人类疾病很难诊断,如果一个限制性片段与表型可靠地相关,那么它的果
32、一个限制性片段与表型可靠地相关,那么它的存在可用来诊断该种疾病,无论是在出生以前还存在可用来诊断该种疾病,无论是在出生以前还是出生后。是出生后。b 为分离基因提供依据。如果两个位点很少或者从为分离基因提供依据。如果两个位点很少或者从不重组,在遗传图谱中限制性片段应该距离基因不重组,在遗传图谱中限制性片段应该距离基因相对很近。尽管遗传中相对很近。尽管遗传中“相对很近相对很近”用用DNA DNA 碱基碱基对表示可能是有一定距离,但它提供了一个使我对表示可能是有一定距离,但它提供了一个使我们沿着们沿着DNA DNA 找到基因的起点。找到基因的起点。bRELPsRELPs在人类基因组内发生频繁,对遗传
33、作图是很在人类基因组内发生频繁,对遗传作图是很有用。但有用。但.bCatalog of common human genetic variation across the genome “Common” was taken to mean that the more rare allele was in at least 5% of the populationb1 Million SNPs were genotyped in 269 samples comprising 4 populationsbAssociations between SNPs have been identified
34、and cataloguedbUsing information from the HapMap, it is possible to select a set of 300,000-600,000 SNPs that will represent all variation in the genomebUsing array technologies, it is possible to genotype this many SNPs at once based on Common Disease-Common Variant HypothesisbThe DNA samples for t
35、he HapMap have come from a total of 270 people. The Yoruba people of Ibadan, Nigeria, provided 30 sets of samples from two parents and an adult child (each such set is called a trio). In Japan, 45 unrelated individuals from the Tokyo area provided samples. In China, 45 unrelated individuals from Bei
36、jing provided samples. Thirty U.S. trios provided samples, which were collected in 1980 from U.S. residents with northern and western European ancestry by the Centre dEtude du Polymorphisme Humain (CEPH). The hapMap(haplotype map- Post-genomeb确定限制性图谱的突变点更困难一些。偶然它们确定限制性图谱的突变点更困难一些。偶然它们将改变限制性酶的目标切点,但它
37、们就保持不可将改变限制性酶的目标切点,但它们就保持不可探测性,因为限制性片段的在野生型和突变型保探测性,因为限制性片段的在野生型和突变型保持着同样大小。有时,探测通过它们对单链持着同样大小。有时,探测通过它们对单链DNADNA较较短的片段的移动的影响是可以探测其顺序变化的,短的片段的移动的影响是可以探测其顺序变化的,b在一项叫作单链构型多态性(在一项叫作单链构型多态性(SSCPSSCP)的技术即可)的技术即可达到此项目的。但是在达到此项目的。但是在DNADNA更大区域内寻找碱基替更大区域内寻找碱基替代物时,决定核苷酸代物时,决定核苷酸DNADNA的顺序将非常必要了。的顺序将非常必要了。b聚合酶
38、链反应-单链构象多态性分析(Single Strand Conformation Polymorphism Analysis of Polymerase Chain Reaction Products, PCR-SSCP)是近年来发展起来的一种基因分析方法。b PCR-SSCP PCR-SSCP分析的基本程序为:首先分析的基本程序为:首先PCRPCR扩增特定扩增特定靶序列,然后将扩增产物变性为单链,进行非变靶序列,然后将扩增产物变性为单链,进行非变性聚丙烯酰胺凝胶电泳。性聚丙烯酰胺凝胶电泳。b相同长度的相同长度的DNADNA单链其序列不同,甚至单个碱基单链其序列不同,甚至单个碱基不同,所形成的
39、构象不同,电泳迁移率也不同。不同,所形成的构象不同,电泳迁移率也不同。PCRPCR产物变性后,单链产物经中性聚丙烯酰胺凝产物变性后,单链产物经中性聚丙烯酰胺凝胶电泳,靶胶电泳,靶DNADNA中含单碱基置换,或数个碱基插中含单碱基置换,或数个碱基插入或缺失等改变时,因迁移率变化会出现泳动变入或缺失等改变时,因迁移率变化会出现泳动变位,从而可将变异位,从而可将变异DNADNA与正常与正常DNADNA区分开。区分开。bPCR-SSCPPCR-SSCP分析技术是一种分析技术是一种DNADNA单链凝胶电泳技术,单链凝胶电泳技术,该技术已被广泛用于癌基因和抗癌基因变异的检该技术已被广泛用于癌基因和抗癌基因
40、变异的检测、测、bUsing microsatellite repeats as molecular markers for mapping. A hybridization pattern is shown for a family with six children, and this pattern is interpreted at the top of the illustration with the use of four different-sized microsatellite “alleles,” M through M, one of which (M) is prob
41、ably linked in cis configuration to the disease allele P.图图2.7 2.7 限制片段长度限制片段长度多态性多态性(RFLP)(RFLP)可以按可以按孟德尔方式遗传,孟德尔方式遗传,四种等位基因在每四种等位基因在每代中独立地分离,代中独立地分离,但图中经限制消化但图中经限制消化后所有后所有Figure 2.7 Restriction site polymorphisms are inherited according to Mendelian rules.图图2.8 2.8 可用限制酶多态可用限制酶多态性作为遗传标记,测量性作为遗传标记,
42、测量两个重组子表型两个重组子表型( (如眼如眼睛的颜色睛的颜色) )所对应的遗所对应的遗传学距离。图传学距离。图2.8 2.8 中做中做了简化,仅将有关的等了简化,仅将有关的等位基因列出。位基因列出。图图2.9 2.9 如果某限如果某限制性标记与一个制性标记与一个表型相关,则该表型相关,则该限制酶位点必定限制酶位点必定位于决定此表型位于决定此表型的基因附近。图的基因附近。图中,突变将正常中,突变将正常人普遍存在的带人普遍存在的带转换成病人中普转换成病人中普遍存在的带。遍存在的带。The mutation changing the band that is common in normal pe
43、ople into the band that is common in patients is very closely linked to the disease gene.2.4 Organization of interrupted genes may be conservedbinterruptions occur at homologous positions in all known active globin genes:mammals, birds, and frogs. bThe first short, and the second longer, but the act
44、ual lengths can vary. Most of variation from the second intron. In the mouse, the second intron in the -globin gene is only 150 bp long, tatol 850 bp, compared with the major -globin gene where the intron length of 585 bp gives the gene a total length of 1382 bp. The variation in length of the genes
45、 is much greater than the range of lengths of the mRNAs (-globin mRNA = 585 bases, -globin mRNA = 620 bases). All classes of genes may be interrupted: nuclear genes coding for proteins, nucleolar genes coding for rRNA, and genes coding for tRNA. Interruptions also are found in mitochondrial genes in
46、 lower eukaryotes, and in chloroplast genes. Interrupted genes do not appear to be excluded from any class of eukaryotes, and have been found in bacteria and bacteriophages, although they are extremely rare in prokaryotic genomes.2.4 Organization of interrupted genes may be conserved高等高等 真核生物真核生物多数基
47、因多数基因都有内含子,没有内含于的仅占极都有内含子,没有内含于的仅占极少数。少数。裂殖酵母裂殖酵母较多较多酿酒酵母只有酿酒酵母只有少数基因少数基因有内含子,有内含子,大肠杆菌大肠杆菌T4T4噬菌体、枯草杆菌噬菌体、枯草杆菌spo1spo1噬菌体和蓝细菌噬菌体和蓝细菌少数少数基基因有内含子。因有内含子。线粒体、叶绿体基因线粒体、叶绿体基因也有也有内含子。内含子。不但编码蛋白质的基因有,编码不但编码蛋白质的基因有,编码 tRNAtRNA的基因也有内含子。的基因也有内含子。不同生物的同一基因,内含子长度尽管不同生物的同一基因,内含子长度尽管 变化很大,但数目、变化很大,但数目、位置往往相同位置往往相
48、同。一般一般, , 一内含子序列不会见之于另一内合子,而外显子则往一内含子序列不会见之于另一内合子,而外显子则往往和蛋白往和蛋白 质的功能性结构域相对应。质的功能性结构域相对应。b因此曾设想内含子对于外显子重新组合以促进基因大步伐进化因此曾设想内含子对于外显子重新组合以促进基因大步伐进化起着重要作用。由于内含子中信息起着重要作用。由于内含子中信息 量小,在此处改组量小,在此处改组(shuffling)(shuffling),不会危及外显子的功能结构域。,不会危及外显子的功能结构域。b此看法是认为一切生物原来都有内含子,以后不断进化,原此看法是认为一切生物原来都有内含子,以后不断进化,原 核生物
49、由于基因组小、复制快,内含子成为快速复制的包袱,核生物由于基因组小、复制快,内含子成为快速复制的包袱,因因 此逐渐失去。不同生物同一基因的内含子数目、位置一致,此逐渐失去。不同生物同一基因的内含子数目、位置一致,是是 其旁证。其旁证。b与此相反的一种看法认为生物本来没有内含子,内含子与此相反的一种看法认为生物本来没有内含子,内含子 是由是由于外显子改组位置不准确而来的。所以原核生物内含子极少,于外显子改组位置不准确而来的。所以原核生物内含子极少, 低等真核生物少,高等真核生物多低等真核生物少,高等真核生物多. . 酵母细胞色素酵母细胞色素c c基因无内含基因无内含子,而人、鼠有之。内含子回归与
50、传染子,而人、鼠有之。内含子回归与传染b这又是个鸡生蛋、蛋生鸡的问题。因此,自然而然地出现了这又是个鸡生蛋、蛋生鸡的问题。因此,自然而然地出现了 中问路线。孰是孰非,一时难于作出正确判断。中问路线。孰是孰非,一时难于作出正确判断。b内含子按其连接位点的结构和剪接方式来分,可以分内含子按其连接位点的结构和剪接方式来分,可以分为三类,为三类, 即即I I类、类、II II类和一般核类和一般核Pre-mRNAPre-mRNA类。类。I I类类: 4: 4个保守序列个保守序列 2 2个不大保守序列个不大保守序列 E-EE-EP(AUGGUGG-AAA), P(AUGGUGG-AAA), 排列排列: :
51、Q(AAUCAGCAGG), 5-E-P-Q-R-E-S-3Q(AAUCAGCAGG), 5-E-P-Q-R-E-S-3R(UCAGAGACUACA), R(UCAGAGACUACA), 真菌线粒体真菌线粒体/ /叶绿体叶绿体/ /四膜虫四膜虫rRNArRNAS(AAGAUAUAGUCC) /TS(AAGAUAUAGUCC) /T偶数噬菌体偶数噬菌体II II类类: : 少数真菌线粒体少数真菌线粒体/ /大多数叶绿体大多数叶绿体/ /植物线粒体植物线粒体7070个个II II类内含子分析类内含子分析:6:6个区个区I A B C (C1/C2) D (D1/D2) I A B C (C1/C2
52、) D (D1/D2) II III .VIII III .VIII II类内含子类内含子 按其大按其大 小和结构来说,又可分为小和结构来说,又可分为普通的普通的II II类、类、IIIIII类和孪生内含类和孪生内含子子 (twintron)(twintron)三类。三类。II II类内含子类内含子比较大,可达比较大,可达600600核苷酸以上,有核苷酸以上,有6 6个结构域。个结构域。IIIIII类内含子类内含子可以看作是可以看作是II II类的缺失突变体,除类的缺失突变体,除II II类的类的 结构域结构域VIVI保保持完整外,结构域持完整外,结构域I I、Il Il、IIIIII、IVI
53、V、V V可以缺失,因可以缺失,因 此比此比II II类内类内含子小很多,一般不超过含子小很多,一般不超过150150个核苷酸。个核苷酸。孪生内含子孪生内含子 是在是在IIIIII类内含子类内含子( (称为外内合子,称为外内合子,) )结构域结构域VIVI的上的上 游,游,插入了另一个甚至几个插入了另一个甚至几个II II类类( (也有也有I I类类) )内含子内含子( (称为内内称为内内 含子含子) )。其实由两个其实由两个I I类内含子组成的孪生内含子类内含子组成的孪生内含子 也是有的。也是有的。b原生动物有原生动物有I I类内含子。最近报类内含子。最近报 道小球藻的病毒编码蛋白质道小球藻
54、的病毒编码蛋白质( (和和TFIISTFIIS同源同源) )的基因和的基因和14. 2kDa 14. 2kDa 可读框有可读框有I I类内含子。各类类内含子。各类内含子剪接的共同点是二步转酯键内含子剪接的共同点是二步转酯键 反应;不同点是反应;不同点是I I类、类、Il Il类类都是自我剪接,一般核都是自我剪接,一般核pre-mRNApre-mRNA类类 则得有剪接体参加;则得有剪接体参加;Il Il类和核类和核premRNApremRNA的剪接都有套索中间体。的剪接都有套索中间体。b以前以为只有线粒体和叶绿体才有以前以为只有线粒体和叶绿体才有II II类内含子。后来按类内含子。后来按II I
55、I类类 内含子中员为保守的序列合成引物,用聚合酶链内含子中员为保守的序列合成引物,用聚合酶链式反应从叶绿体的祖先蓝细菌和线粒体的祖先紫细菌式反应从叶绿体的祖先蓝细菌和线粒体的祖先紫细菌都扩增、克隆到了都扩增、克隆到了II II类内含子类内含子. . 因此,认为现代核基因因此,认为现代核基因内含子可能来源于内含子可能来源于II II类内含子。类内含子。 b从从 剪接反应的立体化学来看,剪接反应的立体化学来看,PremRNAPremRNA的剪接和的剪接和II II类内含子的剪类内含子的剪 接相似。但三类内含子剪接是否有进化接相似。但三类内含子剪接是否有进化上的联系,迄今还没有上的联系,迄今还没有
56、明确的答案。有些明确的答案。有些pre-tRNApre-tRNA也也有内含子。由于有内含子。由于pre-tRNApre-tRNA的结构的结构 相对恒定,内含子位相对恒定,内含子位置一定,剪接的信息不在内含子而在外显子,置一定,剪接的信息不在内含子而在外显子, 剪接由剪接由酶进行,与上面三类内含子剪接的关系很小。酶进行,与上面三类内含子剪接的关系很小。 GT-AGGT-AG b 有些基因的外显子不但被内含子隔开,而且彼有些基因的外显子不但被内含子隔开,而且彼此相距甚远。例如,地钱的叶绿体核糖体蛋白此相距甚远。例如,地钱的叶绿体核糖体蛋白s12s12基因由基因由3 3个外显子组成;个外显子组成;3
57、 3端的两个外显子端的两个外显子由一股由一股DNADNA编码,编码,5 5端的外显子由另一股端的外显子由另一股DNADNA编编码;两者相距码;两者相距30 kb30 kb,莱茵衣藻,莱茵衣藻MAMA基因的三个外基因的三个外显子分别相距显子分别相距5050、90kb90kb;b这类这类premRNApremRNA要经过反式剪接,才能成为成要经过反式剪接,才能成为成熟的熟的mRNAmRNA。锥虫只有反式剪接,线虫有。锥虫只有反式剪接,线虫有1010一一1515的的PremRNAPremRNA是反式剪接;甚至同一基因、是反式剪接;甚至同一基因、既可顺式、又可反式剪接,得到不同的既可顺式、又可反式剪接
58、,得到不同的mRNAmRNA。b内含子由此一基因转移到另一基因,称为转座。内含子由此一基因转移到另一基因,称为转座。用用PCRPCR法证明酵母线粒体法证明酵母线粒体II II类内含子类内含子al al1 1转座到转座到coxcox1 1。bPodospora anserinaPodospora anserina线线粒体粒体cox1cox1基因的基因的II II类内含类内含子子a a转座到转座到tRNAtRNAIleIle基因和基因和tRNAtRNASerSer基因之间。基因之间。2.5 Exon sequences are conserved but introns vary外显子序列保守,内
59、含子序列多变外显子序列保守,内含子序列多变b球蛋白和球蛋白和DHFRDHFR基因说明了一个普遍现象:那基因说明了一个普遍现象:那些在进化过程中相关的基因有着相类似的结些在进化过程中相关的基因有着相类似的结构,至少包括了一些内含子位置的保守性,构,至少包括了一些内含子位置的保守性,基因长度的变化主要取决于内含子长度的变基因长度的变化主要取决于内含子长度的变化化。 b结构基因在其基因组中是独特的吗?结构基因在其基因组中是独特的吗?b答案可能是模棱两可的。既是又不是答案可能是模棱两可的。既是又不是b整个基因的长度是独特的,但其外显子通常与其它整个基因的长度是独特的,但其外显子通常与其它基因外显子相关
60、。一般而言,当两个基因是相关的,基因外显子相关。一般而言,当两个基因是相关的,它们外显子的关系比内含子的关系更紧密。它们外显子的关系比内含子的关系更紧密。b在特殊情况下,两个基因的外显子可能编码同一个在特殊情况下,两个基因的外显子可能编码同一个蛋白质,但其内含子可能不同。说明这两个基因可蛋白质,但其内含子可能不同。说明这两个基因可能起源于一个共同的祖先基因,拷贝间内含子差异能起源于一个共同的祖先基因,拷贝间内含子差异积累,但因编码蛋白质功能的需要,其外显子区域积累,但因编码蛋白质功能的需要,其外显子区域是保守。是保守。b外显子可能是基因进化的基础,它们可以通过不同的方式进行组合。一个基因可能含
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石河子大学《食品机械与设备》2023-2024学年第一学期期末试卷
- 石河子大学《教育影视赏析》2021-2022学年第一学期期末试卷
- 石河子大学《家畜育种学》2023-2024学年第一学期期末试卷
- 石河子大学《饭店管理》2023-2024学年第一学期期末试卷
- 沈阳理工大学《商业品牌整体策划》2023-2024学年第一学期期末试卷
- 沈阳理工大学《建筑设计》2022-2023学年第一学期期末试卷
- 2018年四川内江中考满分作文《我心中的英雄》8
- 沈阳理工大学《化工安全与环保》2022-2023学年第一学期期末试卷
- 沈阳理工大学《电力变压器设计》2023-2024学年期末试卷
- 沈阳理工大学《产品仿生学应用设计》2021-2022学年第一学期期末试卷
- 邮储高级练习卷三(第12章-第17章)附有答案
- 重庆市江北区2023-2024学年六年级下学期期末考试数学试题
- 军队文职聘用合同管理规定
- 2024年贵州省安顺市西秀区小升初语文试卷
- 2024-2029年中国儿童牙冠行业市场现状分析及竞争格局与投资发展研究报告
- 新时代铁路发展面对面全文内容
- 人工智能与语文阅读理解教学
- 科学素养培育及提升-知到答案、智慧树答案
- 快递主管岗位职责
- 医疗差错、纠纷、事故登记表
- 七年级第一次期中家长会课件
评论
0/150
提交评论