医学分子生物学:第五章 DNA及基因组-2_第1页
医学分子生物学:第五章 DNA及基因组-2_第2页
医学分子生物学:第五章 DNA及基因组-2_第3页
医学分子生物学:第五章 DNA及基因组-2_第4页
医学分子生物学:第五章 DNA及基因组-2_第5页
已阅读5页,还剩166页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、基因的概念1.

基因的生物学意义

1)1865年

一个遗传因子决定生物体一个性状。

-------《植物的杂交试验》Mendel(孟德尔)

第二节基因12)1926年遗传因子是在特定染色体上,基因是直线排列在染色体上遗传颗粒。一个基因控制一个性状。

-------《基因论》Morgan(摩尔根)

23)1941年提出了

“一个基因一个酶”

1950’s

一个基因一个蛋白质

(一个基因决定一种多肽链)。

------LinusPauling

------BeadleandTatum3一个顺反子,一条多肽链

------Benzer

m1++m2+为野生型,即正常基因型,m为突变型*顺反实验反式顺式4顺反子(cistron):通过顺反效应而发现的遗传功能单位。如果两个突变不能在反式排列中互补,就属于同一个互补群,互补群相当于一个独立的遗传功能单位。5

基因是合成有功能的蛋白多肽链或RNA所必需的全部核酸序列(通常是DNA序列)。即除了编码蛋白质或RNA的核酸序列,还包括转录所必须的调控序列,5’端非翻译序列,内含子以及3’端非翻译序列等所有的核酸序列。

**

用分子生物学的术语来给基因下定义:

2.

基因的分子定义6

二、基因的分类与结构

1.基因的分类:

1)结构基因(structuralgene):可转录成mRNA并翻译成蛋白质多肽链的基因。

2)调控基因(regulatorygene):一些调控结构基因表达的基因,其产物往往是反式转录因子或DNA结合蛋白。

73)管家基因(housekeepinggene):在绝大多数细胞中都表达为维持各种细胞基本活动所必需的结构和功能蛋白质编码的基因。如:糖酵解中3-磷酸甘油醛脱氢酶

(glyceraldehyde3-phosphatedehydrogenase,GAPDH)84)奢侈基因(luxurygene):对细胞自身生存并无影响,这种基因产物通常只在特化细胞类型中大量合成。如:红细胞中合成血红蛋白浆细胞中合成免疫球蛋白95)假基因(pseudogene):

在核苷酸序列上与有功能的基因相似,但它们或者不能转录,或者转录后生成无功能的基因产物。10*DNA双链中一股链作为模板转录成mRNA,称为模板链、(-)链、反意义链。*与模板链相互补的链,其编码区的碱基序列与mRNA的密码序列相同(仅T、U

互换),称为编码链、(+)链、有意义链

2.基因的结构11DNA两条链,一个基因的序列或基因结构往往用有意义链(sensechain)来表示有意义链12三、基因的大小与数量哺乳动物基因的大小在5~100kb,很少小于2kb。基因的大小与mRNA长短无关,与外显子数量无关13基因的数量:生殖道支原体470嗜血流感菌1,743大肠埃希菌4,288线虫19,099人类20,000~25,00014

第三节基因组的结构与功能

基因组(genome):

最早出现于1920年,是基因(gene)和染色体(chromosome)的缩合。

基因组的现代生物学定义是:

指导一个物种的结构与功能的所有遗传信息的总和。

15**人类基因组通常是指细胞核23对染色体中的所有DNA。16**人线粒体基因组

(humanmitochondriagenome)

是人细胞线粒体中基因及DNA。基因组学(genomics)定义:基因组学是研究基因组的结构与功能的科学。17二、

原核生物基因组1.大肠埃希菌的DNA是环状双链DNA分子,三级结构折叠盘旋凝集在一起,染色体密集的区域形成核质体(nucleiod)

2.蛋白质和RNA也是基因组织的成分,对于维持DNA分子折叠形成环状结构域(domain)是必不可少的。18193.有些蛋白质很像真核细胞中的组蛋白,称为组蛋白样蛋白质

(histone-likeproteins,HLPs),

另一些蛋白质则在基因调控或DNA复制时起作用。4.原核生物绝大多数是单倍体20

1)DNA两条链上都有基因。功能上相关的几个基因往往在一起组成操纵子结构细菌基因组织的特点大肠埃希菌乳糖操纵子基因图212)基因组中只有一个复制起始点3)没有内含子(intron)成分,转录后不需要剪接加工。4)细菌的DNA绝大部分用于编码蛋白质,只有小部分是非翻译区,其中包含基因表达调控的DNA序列。

5)极少有基因重叠现象。

6)重复序列很少。22三、病毒和噬菌体基因组

1.病毒颗粒(virion)

外壳蛋白

内部基因组:DNA或RNA

231)每种病毒中核酸成分只能是一种。

2.病毒和噬菌体基因组的特点*肝炎病毒(hepatitisvirus):

甲肝病毒(HAV)RNA病毒乙肝病毒(HBV)DNA病毒丙肝病毒(HCV)RNA病毒丁肝病毒(HDV)RNA病毒戊肝病毒(HEV)RNA病毒242)病毒核酸大小差别很大。

3)大部分病毒核酸是一条单链或双链分子,少数病毒由几个核酸片段组成。

4)也具有操纵子结构。

5)噬菌体基因中无内含子,而感染真核细胞的病毒有内含子。

256)有重叠基因存在。(overlappinggenes)261981年,首例表现为严重免疫缺陷症状的疾病,称为“获得性免疫缺陷综合征”(acquiredimmunodeficiencysyndrome),简称AIDS中文译为“艾滋病”。人类免疫缺陷综合症病毒为RNA肿瘤病毒

(humanimmunodeficiencevirus,HIV)27

一、HIV的分子结构:

1.在逆转录病毒中,HIV的结构最为复杂,它的基因组最长,所含基因数也最多。

2.HIV病毒颗粒呈球形,直径为100nm,最外层有包膜:脂双层膜,嵌有gp120和gp41

包膜内侧面有蛋白质P17

衣壳:蛋白质P24

核心部分:基因组RNA(两条,单链)蛋白质:P7,P9,逆转录酶,蛋白酶和整合酶。

28291.HIV的基因组是两条相同的RNA单链,每条RNA单链含9749个核苷酸。2.5’和3’端均有一段相同的重复序列R.3.5’端有帽结构,3’端有polyA尾巴.4.在5’附近附有tRNA以作为逆转录时的引物。5.两条RNA单链在近5’端区以氢键相连。6.HIV的基因组除其他逆转录病毒均有的3个基因gag,pol,env外,还有6个为调节基因。二、HIV的基因组30二、HIV的基因组31325’和3’端的R序列是相同的,U5和U3不相同。LTR不编码蛋白质,LTR序列中有控制病毒基因转录的序列,有DNA复制的起始位点,并与病毒致病的特异性有关。3334

四、真核生物基因组3536

(一

)真核生物基因组织的C值矛盾

(C-valueparadox)*每种真核生物的单倍体基因组中的全部

DNA量称C值*在真核生物中,进化的复杂程度与DNA

含量C值并不完全一致。

371.有的同类生物中C值差别有10

倍以上。3839各种生物的基因数目与DNA量的比较大肠埃希菌基因数2350DNA分子大小4.6*106编码序列占基因组%98以上5酵母果蝇610087501.3*1071.4*108人300003.2*1092702.DNA的量远远大于编码蛋白质所需要的量400.00131.9630*复性动力学测定41快复性组分中间复性组分慢复性组分占基因组百分数253045Cot1/20.00131.9630复杂性bp10~103不均一3*108重复频率105~1061Cot值范围10-4~2*10-20.2~10080~100002~102

功能例子能编码仅能转录不能转录血红蛋白rRNA,tRNA,组蛋白基因(能编码)卫星DNA42中度重复序列高度重复序列单一序列

(二)高度重复顺序*复性极快,由寡核苷酸串联、重复排列而成的DNA序列*长度从几个bp到几百bp个或更长*重复次数105~106,在基因组DNA

中约占25%。

43*高度重复序列具有的特点是:

a.重复顺序中一部分常以“祖先序列片段”形式出现,进化上是原始的,趋向保守。另一部分则以新进化的家族形式出现。44b.不同家族常源于同一个“祖先重复序列”,故结构很相似,但同一家族中各个体成员间存在个体突变。

c.新的高度重复序列家族,往往是在新的物种衍化时或在进化中,通过一定机制形成,随基因扩大而被扩大。451.卫星DNA(SatelliteDNA)

1)卫星DNA的概念:真核生物DNA剪切后离心,显示一个主峰和小峰。真核生物大部分DNA的

G-C含量在30%~50%,形成一个主峰。另外有些DNA的G-C含量高于或低于

30%~50%会出现小峰,称卫星DNA。

46472)卫星DNA的产生与C-G含量有关3)卫星DNA序列非常简单,重复性极高4)卫星DNA都位于异染色质,通常不转录48小卫星DNA(MinisatelliteDNA)ⅰ.重复序列为6-70bp。ⅱ.有的小卫星DNA的重复单位内含有共同的GC丰富的核心同源序列。常位于染色体近端粒和着丝区。又称为同向重复序列可变数(variablenumbertandemrepeat,VNTRs)区,在不同个体和基因组的不同位点上数目都不同。49*2.反向重复顺序(invertedrepeats)

1)概念:具有方向相反、序列相同的

DNA区域称反向重复顺序

2)邻近(adjacent)反向重复顺序也称回文结构(palindrome)。

…GGTACC……CCATGG…3)分隔(Separated)反向重复顺序。

…GGTNNNNACC……CCANNNNTGG…504)在基因组约含5%。单拷贝散在分布。

5)常见于基因组调控区中,可能与复制

和转录调控有关。51(三)中度重复序列(intermediaterepeat,

moderatelyrepetitiveDNA,middlerepetitivesequence)

在基因组DNA中约占30%,重复出现几十次到几千次

。2.重复单位序列相似,散在分布在基因组中,序列的长度和拷贝数非常不均一。52Alu家族(短片段间隔型)i.占人类基因组3%~10%,重复30万~50万次,Alu序列高度同源,大部分序列有限制性内切酶AluⅠ酶切位点(AG↓CT)。ⅱ.人Alu顺序长300bp,由两个130bp的重复序列中间有31bp间隔序列,两端各有一段7~21bp正向重复序列,可能属可转移成分。53ⅲ.在人类基因组中,大约5kbDNA中就有一个Alu序列ⅳ.Alu序列散在分布在基因组中,可能是Alu序列被转录成RNA后再逆转录形成cDNA片段,重新插入到基因组。v.Alu序列可能是在300~500万年前起源于7SLRNA基因vi.Alu家族具有种属特异性,可用于区分不同哺乳细胞vii.

Alu元件的插入、删除和重组导致了许多先天性遗传疾病和癌症542)

kpnⅠ家族(长片段间隔型)Ⅰ.人和灵长类动物DNA用kpnⅠ酶切产生

1.2kb、1.5kb、1.8kb和1.9kb4个片段,

占人类基因组织3%~6%,散在分布。

Ⅱ.kpnⅠ家族成员中3’端序列具有广泛的同源,不同长度的kpnⅠ成员又是高度不均一的。55Ⅲ.在有的细胞中kpnⅠ序列能被转录成无

polyA尾巴的hnRNAⅣ.kpnⅠ家族的散在分布可能是kpnⅠ转录物再逆转录形成cDNA片段,重新插入到基因组DNA563.可转移的DNA元件(mobileDNAelements)也称转位因子(transposableelement)

可在DNA分子内或DNA分子间进行转移的

DNA片段。原来位置的DNA片段保留。

*40年代B.McClintock首先在玉米的遗传学研究中发现*1968年Jordan分子水平证实了在大肠杆菌存在,引起重视。*现在认为所有的生物体内都存在。57**插入序列(insertionsequences,IS)

是一类较小的转移元件,1-2kb。*IS两端有反向重复顺序和正向重复顺序,重复序列之间只有编码与转位有关的蛋白质基因,如转位酶(transposase)*IS已发现很多种,每种IS元件都有不同序列。

58**

转座子(transposon,Tn)除了带有转座有关基因外还带有其他基因,如抗药基因。tnpAtnpRampr重复序列38bp3086bp558bp861bp38bptnpA转座酶基因(转座酶基因作用于原有转座子末端)tnpR解体酶基因(作用于复制拷贝)ampr

抗氨苄青酶素的ampr基因Tn359**真核生物中的转座子:逆转录转座子(retroposon)先转录成RNA然后逆转录成cDNA,再整合到基因组中。

ⅰ)非病毒样反转录转座子ⅱ)病毒样逆转录转座子

60ⅰ)非病毒样反转录转座子

RNA聚合酶Ⅲ61ⅱ)病毒样逆转录转座子62与部分病毒序列有很强的同源性分子较长,5-7kb两端有LTR两侧的正向重复序列是转移元件存在的特征之一。634)转位的遗传效应

Ⅰ.基因重排

Ⅱ.基因突变Ⅲ.插入位点引入新基因Ⅳ.转移DNA元件可通过增强子的组合与分布来影响基因的表达64抗药基因的转移654.多基因家族(multigenefamily)也称基因家族(genefamily)1)概念多基因家族是指一组具有类似功能,核苷酸序列又有同源性的基因。多基因家族是真核生物基因组最显著的特征之一。它的家族成员在核酸上的同源性提示它们是由同一个祖先基因进化而来的。662)多基因家族的分类Ⅰ.按基因的终产物分类⑴编码RNA的多基因家族如:编码snRNA、tRNA、rRNA等基因⑵编码蛋白质的多基因家族如:组蛋白、干扰素、珠蛋白生长激素等基因67Ⅱ.按在基因组中的分布不同分类

⑴基因串联排列在一起,形成基因簇

(genecluster),也叫串联重复基因

(tandemlyrepeatedgenes)。如:rRNA、tRNA、组蛋白等基因

68①rRNA

真核生物rRNA转录单位(18S、5.8S、

28S),分布在13、14、15、21和22号染色体上。人类基因组约含280个拷贝。

②tRNA

人类约有1300个tRNA基因,每种

tRNA有10到几百个基因拷贝,同种

tRNA串联形成基因族(7q32~q36)6970③组蛋白(7q32~q36)

ⅰ)人类拷贝数为30~40,基因中没有内含子转录后mRNA无polyA尾巴。

ⅱ)组蛋白基因家族有5个成员:即H1、H2A、H2B、H13、H4

5个成员的基因串联排列在一起构成一个重复单位,各种生物中这5个基因的排列顺序有所不同7172①干扰素

INF-α

白细胞产生至少10个基因9p21INF-β

成纤维细胞产生1个基因9p21INF-r

淋巴细胞产生1个基因12q24.1⑵.分散在染色体不同的部位。如:干扰素,珠蛋白,生长激素等等。73

α类16p12②珠蛋白

β类11p15α类基因5’-ζ-

ζ-

a1-a2-a1-3’β类基因5’-ε-Gr-Ar-

β-δ-β-3’

74③生长激素人生长激素(hGH)17q

包括3种基因人胎盘促乳素(hCS)17q

催乳素6号染色体hGH-NhCS-LhCS-AhGH-VhCS-B正常表达假基因正常表达未发现表正常表达达产物75Ⅲ.

假基因(pseudogene)⑴概念:假基因在核苷酸顺序上与有功能基因相似,它们或者不能转录,或者转录后生成无功能基因产物。假基因常用符号

来表示。76⑵假基因有两类①有内含子的假基因这种类型的假基因保留原来基因的外显子和内含子,但失去起始转录信号,或外显子-内含子连接处不能剪接或翻译不能终止,细菌与真核生物中都有发现。77②无内含子的假基因仅含有亲本基因的外显子,常常有3’端polyA尾巴,并随机分布于基因组中。这种假基因是源于mRNA并通过逆转录而重新整合进基因组。只在真核生物中被发现。7879(四)超基因家族(Supergenefamily)

1.概念:超基因家族指一组由多基因家族及单基因组成的更大基因家族。它们在结构上有程度不等的同源,可能起源于相同的祖先基因,但功能并不相同。

2.最经典的超基因家族免疫球蛋白超基因家族

(免疫球蛋白样的结构域)

80

表5-3免疫球蛋白超基因家族主要成员分类表类别人类染色体定位类别人类染色体定位免疫球蛋白T细胞表面分子重链14q32一q33CD21p13

轻链

2p12CD412pter-p12CD8(A)2p12 CD8(B)2p12

轻链

22q11.1一q11.2CD58(LFA—3)1p13Thy-l11q22.3-q23主要组织相容性复合物神经组织分子

I类α链6p21.3NCAM(CD56)11q23-q24β2m15q21一q22MAG19q13.1II类α链6p21.3MRCox--23q12-q13β链6p21.3Po蛋白未定·T细胞抗原受体复合物肿瘤抗原

TCRα链14q11.2CEA(癌胚抗原)19q13.1一ql3.2

生长因子受体

β链7q35PDGFRA4q11一q12γ链7ql5PDGFRB5q33一q35

14q11.2CSFlR5Q33一q35CD3非细胞表面分子

1lq23αl—BGP19q13.2.

11q23基底膜连接蛋白未定

11q23免疫球蛋白受体

LNIR1

8182新的与免疫球蛋白超基因家族有关分子:

CD7,CD28,IgE受体α亚基,BLAST-l,原癌基因c-kit,神经粘附分子L1,细胞间粘附分子-1、-2、-3,血管细胞粘附分子-1,血小板内皮细胞粘附分子,IL-1和IL-6的受体及EB病毒编码的两种糖蛋白(QQBE48及QQBE4L)等。833.原来的多基因家族成为超基因家族如:丝氨酸蛋白酶超基因家族

(功能区中丝氨酸是活性中心的关键氨基酸残基)84它的家族成员如下:单纯蛋白酶:胰蛋白酶,糜蛋白酶,弹性蛋白酶,激肽释放酶凝血系统:凝血因子Ⅸ、X,凝血酶原,凝血酶原转变加速因子前体纤溶系统:血纤溶酶原,组织纤溶酶原激活物,尿激酶其他:触珠蛋白,载脂蛋白LP(a)85(五)单一序列(uniquesequence)*占人类基因组DNA45%

*大多数转录开放的结构基因是单一顺序86(六)“自私”DNA(SelfishDNA)指真核生物基因中大量的非编码序列,包括分散的高度、中度重复序列、内含子和间隔序列。87“垃圾DNA”不垃圾——重新认知垃圾DNAENCODE项目(EncyclopediaofDNAElements,DNA元素百科全书)

五、细胞器基因组*细胞器基因组的一些特征:

1.基因组常常是环状的,并且是多拷贝的。

2.绝大多数细胞器基因组都是有基因表达功能的,但大多数蛋白质是由核编码后运输进来的。

3.细胞器基因组的表达对于抗生素敏感,但对真核基因的抑制因子并不敏感。89线粒体DNA

(mitochondrialDNA,mtDNA)独立于细胞核染色体外的又一基因组,能自主复制。90线粒体由内外两层膜封闭,包括外膜、内膜、膜间隙和基质四个功能区隔。一、线粒体结构91ⅢⅠⅡⅣF0F1CytcQNADH+H+NAD+延胡索酸琥珀酸H+1/2O2+2H+H2OADP+PiATPH+H+H+胞液侧基质侧++++++++++---------二、线粒体的功能:

生物体内进行氧化磷酸化的场所92三、线粒体DNA的结构1963年,首先在鸡胚细胞中发现线粒体DNA,一般都呈环状。不同物种线粒体基因组大小相差悬殊*已知:哺乳动物最小,果蝇和蛙的稍大,酵母的更大,植物最大。*人、大鼠、小鼠的线粒体基因组都是16.5kb左右。

93mtDNA位于线粒体内基质。每个线粒体有多个拷贝的mtDNA。通常体细胞mtDNA只有细胞总DNA含量的不到0.1%,在受精的卵细胞中,线粒体增多,mtDNA含量也就上升。94在动物的mtDNA中基因之间的空隙很小,转录是多顺反子,只有单个控制复制和基因表达的非编码区。植物的绝大多数的线粒体mRNA是单顺反子,转录有多个起始位点。95⒈人mtDNA基因组的结构

碱基组成:16.569kb。

DNA的结构:裸露的环状双链DNA,由两条链组成,外环是重链(H链),内环是轻链(L链)

编码的基因:共编码37个基因,

13种蛋白质基因

22种tRNA基因

2种rRNA基因*人线粒体基因组/bio/webcourse/xdycx/course/G08/webtext/G08-4-4.HTM96线粒体DNA的电镜照片97线粒体基因所编码的13种蛋白质:7个为NADH-CoQ的亚基3个为构成CytC氧化酶复合体催化活性中心的亚单位2个为ATP酶复合体F0部分的2个亚基1个为CoQH2-细胞色素c还原酶复合体中细胞色素b的亚基98线粒体的半自主性:

线粒体能合成与自身结构有关的一部分蛋白质,同时又依赖于核编码的蛋白质的输入。因此,它与核遗传体系处于相互依存之中。992.人线粒体基因组的特点:⑴mtDNA结构紧密,几乎都是编码顺序,不含内含子,只有87个核苷酸不参与基因的组成。⑵mtDNA没有组蛋白包绕,而且两条链不对称,H链有28个编码序列,L链有9个编码序列。⑶遗传密码子的意义有所不同。甚至不同种属的线粒体所用的遗传密码也有所不同。100表5-4线粒体遗传密码与标准遗传密码有所差异

线粒体密码 细胞核标准密码 —————————————————

哺乳动物酵母 果蝇 植物UGA Stop TrpTrp Trp StopAGA,AGG Arg Stop Arg Ser ArgAUA,AUU Ile MetMet Met IleCUU,CUC Leu LeuThr Leu Leu

101⑷mtDNA的突变率高于核DNA,并且缺乏修复能力。(比核基因大10-20倍,4/1000bp)⑸mtDNA为严格母系遗传。102五、线粒体与疾病线粒体病的概念以线粒体结构和功能缺陷为主要疾病原因的疾病称为线粒体病。一般情况下,线粒体病主要是由于基因的突变引起的。103

许多人类疾病的发生与线粒体功能缺陷相关,如线粒体肌病和脑肌病、线粒体眼病,老年性痴呆、帕金森病、Ⅱ型糖尿病、心肌病及衰老等,有人统称为线粒体疾病。

104*分类:

遗传性疾病;病因包括核DNA损害、线粒体DNA损害和基因组间的通讯障碍

获得性疾病:主要由毒素、药物和衰老引起。105*线粒体DNA突变的致病机制:1.线粒体DNA丢失:

通过印迹杂交、原位杂交和免疫组化分析,线粒体DNA丢失的患者转录因子A(TFA)表达减低。线粒体TFA表达减少的机制可能是由于翻译过程受损,进入线粒体障碍和TFA的不稳定性.

1062.大规模线粒体DNA重排:

线粒体DNA重排包括缺失(deletion)和重复(duplication),主要见于Kearns-Sayre综合征、慢性进行性眼外肌瘫痪及Pearson综合征.

107

3.线粒体DNA结构基因的突变:

有两种疾病被发现有线粒体DNA结构基因的突变,即Leber遗传性视神经病(LHON)及Leigh病。

1084.线粒体tRNA基因突变:肌阵挛性癫痫合并破碎红纤维(myoclonicepilepsyandraggedredfiber,MERRF)一般被认为是由于线粒体DNA上tRNALys基因上第8344处A到G的点突变(A8344G)引起。线粒体脑肌病伴乳酸血症和卒中样发作(MELAS),主要由线粒体DNA上的tRNALeu(UUR)基因第3243处发生T到G的点突变引起1095.线粒体rRNA基因的突变:

12SrRNA基因上第1555位A到G的突变,这个突变导致了母系遗传的氨基甙类诱导的耳聋和家族性耳聋。110*线粒体病的特点:⒈高突变率⒉异质性异质性-指野生型mtDNA与突变型共存与组织细胞的现象。由于突变型异质性遗传的波动性,症状程度与突变型mtDNA的百分比有关。

1113.母系遗传(maternalinheritance)

-母亲传给儿子和女儿,女儿继续传递。12123456712345678910123456IIIIIIIV112阈值-能够引起特定组织器官功能障碍的突变mtDNA的最少数量。阈值与组织器官有关-中枢神经系统→骨骼肌→心脏→胰腺→肾→肝阈值与发育阶段有关-新生儿无症状,成年人表现症状阈值与个体差异有关-不同人发病状况具有差异分裂旺盛的细胞表现出排斥突变型mtDNA趋势,表现野生趋同现象。静止细胞表现出突变mtDNA复制优势,导致突变积累。⒋阈值效应113第四节人类基因组计划

1.HGP的基本目标和任务基本目标与任务目标:测定30亿个碱基对的排列顺序,确定基因在染色体上的位置,破译人类全部遗传信息。任务:在制图的基础上测序,最后获得四张图谱

遗传图

物理图

转录图

序列图2.HGP发展过程:

(1)源起美国“肿瘤计划”搁浅60年代初期,肿瘤发病率在世界各国急剧上升美国决心在20年内解决肿瘤的早期诊断和治疗斥资几百亿美元,动员全国的力量几乎所有同细胞增殖有关的基因,都与肿瘤有关人类所有疾病,都直接或间接与基因有关(2)提议1985年,美国能源部(DepartmentofEnergy,DOE)在加州大学圣克鲁滋会议上第一次对人类基因组全部测序进行可行性论证形成“人类基因组计划”草案。(2)提议1986年,诺贝尔奖获得者RenatoDulbecco发表于《Science》杂志的短文《肿瘤研究的转折点:人类基因组测序》中高瞻远瞩地率先向世界公开提出人类基因组计划,并倡导全世界有能力的科学家共同完成这一国际性大课题。“如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。……人类的DNA序列是人类的真谛,这个世界上发生的一切事情,都与这一序列息息相关。”1987年人类基因组创意报告(美国能源部)1988年人类基因组的作图与测序报告(美国科学院),同年底美国国会通过1990年开始实施,预计15年完成,拨款30亿美元.J.Watson担任“国家人类基因组计划研究中心”首任主任1998年:CraigVenter宣布成立Celera公司,并宣称将采用“全基因组鸟枪法”完成人类基因组的全部测序。从此,人类基因组测序在“公、私”之间展开了激烈竞争

(3)发展/CreationofaBacterialCellControlledbyaChemicallySynthesizedGenome.Science2010:329(5987):52-561999年:中国获准参加HGP,承担测定人类基因组1%测序任务;英国日本和美国共同完成了第一条人染色体—第22条染色体的全部测序工作。(3)发展(3)发展2000年:6月26日,HGP与Celera公司的领导人在白宫的庆祝仪式上共同宣布了人类基因组工作框架图的完成,并约定将双方的研究成果同时发表2000年6月公共领域测序计划工作框架图2001年2月:

HGP将人类基因组工作框架图发表在《Nature》;Celera公司则将其成果发表在《Science》上。“工作框架图”已能覆盖人类基因组的97%,其中至少92%的序列已组装得准确无误,并显示其中只有3万到3.5万个编码蛋白质的基因,这是人类基因组研究的一个重要里程碑。Celera公司:Science,2001,291:1304-1351

六国科学家:Nature,2001,Vol.409:860

(作者274人,其中中国科学家57人)(3)发展(3)发展2003年4月14日当地时间11时

美国HGP负责人CollinsF.在华盛顿宣布,人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现2006年5月18日

人类最后一个染色体-1号染色体基因测序完成,发表在Nature上。至此“生命之书”覆盖基因组99.99%。国际人类基因组

测序任务分配情况遗传图谱转录图谱0.7cM或kb

序列图谱物理图谱100kbSTSmap四张图:遗传图、物理图、序列图、转录图4.HGP的主要内容(1)遗传图(geneticmap,又称连锁图)

指基因根据重组频率在染色体上的线形排列和分布。是以具有遗传多态性的遗传标记为路标,以遗传学距离为图距绘制的基因组图。遗传多态性:在某个遗传位点上具有一个以上的等位基因,且其在群体中出现的频率均高于1%。遗传学距离:在减数分裂事件中,两个位点之间进行交换、重组的百分率,规定1%的重组率为1cM(厘摩尔根)。cM值越大,两者之间距离越远。第一代多态性标记:RFLP(restrictionfragmentlengthpolymorphism,限制性片段长度多态性)不同个体的DNA在用某种限制性内切酶水解时,会产生两种不同长度的水解片段。由一个多态性位点出现在某种限制性内切酶的酶切位点上造成的。缺点:数量较少,信息量有限

第二代多态性标记

微卫星标记(microsatellitemarker,MS),

简短串联重复序列(shorttandemrepeat,STR),

短序列长度多态性(shortsequencelengthpolymorphism,SSLP)

重复单元2-6bp,多态性主要来自重复序列拷贝数的变化优点:高度多态性,信息量大,符合孟德尔遗传规律可采PCR使操作自动化CTAGCTTATATATATATATATATATATATAAGCTTGC1994年底,完成由RFLP和STR组成的遗传图谱,包括5826个标记,分辨率为0.7cM第三代多态性标记:单核苷酸的多态性(singlenucleotidepolymorphism,SNP)是由于单个核苷酸改变而导致的核酸序列多态性。

人类基因密码差异不到0.1%,不同人群仅有140万个核苷酸差异。这些差异是SNP产生的,它构成了不同个体的遗传基础。特点:SNP在基因组中的数目多,可达到300万个,平均每1000个碱基对就有一个。因而成为一种信息量非常大的遗传标记系统。SNP可能在密度上达到人类基因组“多态”位点数目的极限。SNP与RFLP、STR等DNA标记的不同,是不再以“长度”的差异作为检测手段,而直接以序列的差异作为标记。SNP为DNA芯片技术应用于遗传作图提供了基础。

定位基因的重要手段,大致了解各个基因或DNA片断之间的相对距离与方向研究人类基因组遗传与变异的重要手段意义:(2)物理图(physicalmap)

以已知核苷酸序列的DNA片段为“位标”(STS),以DNA实际长度为图距的基因组图谱。

标记:序列标记位点(sequence-taggedsite,STS)。指基因组中任何单拷贝的长度在100~500bp之间的DNA序列,与核酸内切酶识别序列相关联。在基因组中有明确位置。图距:Mb或Kb主要内容:建立含有STS对应序列的相互重叠连接的DNA片段重叠群(Contig)只要有一定数量的STS标签,所有DNA大片段在该染色体或基因组中的位置都能被确定。1995年,完成分辨率为200kb,以STS为标志的物理制图意义:

把遗传学的位点信息转化为基因组位点的物理信息基于STS位点信息的大片段DNA克隆重叠群(clonecontig)提供基因定位的参考依据(3)序列图最详尽的物理图。测定总长约lm、由30亿个核苷酸组成的全序列。既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和HGP的基本目标(4)转录图(基因图谱)目的:在人类基因组中鉴定出全部基因的位置、结构、功能。方法:把mRNA先分离、定位,再转录成cDNA片段,就构成一张人类基因的转录图。cDNA片段又称表达序列标签(expressedsequencetag,EST)。

EST:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的5'或3'端序列称为表达序列标签(EST),一般长300-500bp左右。意义有效反映在正常或受控条件中表达的全基因的时空图EST除提供序列信息外,同时也提供了该基因表达的组织、生理状况与发育阶段的信息。1990年,提出了HGP的大规模cDNA测序研究战略并建立了EST技术。至1998年,公共数据库中EST序列已达一百多万条,加上各公司已测但未公布的数据,估计现有的EST已包含了绝大多数的人类基因序列。

5.HGP的大规模测序方法

(1)实验室测序Sanger的末端终止法:在PCR时加入荧光标记的复制终止剂,比如ddA,ddT,ddC,ddG(相应于4种碱基)ddX的两个作用:可以当作正常碱基参与复制一旦链入DNA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论