物理图谱与测序_第1页
物理图谱与测序_第2页
物理图谱与测序_第3页
物理图谱与测序_第4页
物理图谱与测序_第5页
已阅读5页,还剩168页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章DNA物理图谱的构建及序列测定,物理图谱(physical map),物理图/限制性图谱(restriction map)是各种限制性内切酶切点在某一DNA分子或DNA片段上的排列,由于各酶切点之间的距离是以碱基对(kbp mbp)表示的,所以可计算出二切点间的绝对距离,因此限制图也称物理图。物理图谱的构建是基因组研究的重要组成部分。,质粒pBR322的限制图,一、限制性核酸内切酶(restriction endonuclease),细菌核酸内切酶 识别、剪切特殊双链DNA序列 用途:DNA物理图谱构建、DNA序列分析、基因分离、基因定位、DNA重组,1.细菌的修饰作用和限制性核酸内切酶

2、的发现,20世纪50年代,Luria Asakawa et al. 1997) 。 Not 识别序列,位点十分稀少。重组子通过 Not 消化后,可以得到完整的插入片段。 Sp6 、 T7 是来源于噬菌体的启动子,用于插入片段末端测序。,BAC 载体空载时大小约 7.5kb ,在大肠杆菌中以质粒的形式复制,具有一个氯霉素抗性基因。 外源基因组 DNA 片段可以通过酶切、连接克隆到 BAC 载体多克隆位点上,通过电穿孔的方法将连接产物导入大肠杆菌重组缺陷型菌株。 装载外源 DNA 后的重组质粒通过氯霉素抗性和 Lac Z 基因的 互补筛选。,BAC载体的优点,以大肠杆菌为宿主,电转化,效率高 BA

3、C载体以超螺旋形式存在于大肠杆菌,提取方便; 复制子源自F质粒,遗传稳定,嵌合、重组少; DNA单拷贝存在,适于传统菌落培养,可采用菌落原位杂交筛选目地基因; 克隆位点两侧有T7和SP6启动子,可制备RNA探针或对插入片段测序。,菌落原位杂交筛选目地基因,三、基因组研究的有关图谱,遗传图谱 物理图谱 基因图谱 序列图谱,1.遗传图谱(genetic map)/遗传连锁图/连锁图谱(linkage map),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。 如果同一条染色体上的两个基因相对距离越长,那么他们减数分裂发生重组的概率将越大,共同遗传的概率也就越小。因此可以

4、根据他们后代性状的分离可以判断他们的交换率,也就可以判断他们在遗传图谱上的相对距离。,以具有遗传多态性(在一个遗传位点上具一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。 6000多个遗传标记将人的基因组分成6000多个区域,使连锁分析法可以找到某一致病或表现型的基因与某一标记邻近(紧密连锁)而定位。是定位疾病基因和分析基因是个关键。,遗传图基因的相对定位,遗传标记,有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。 构建遗传图谱就是寻找基因组不同位置上的

5、特征标记。 包括: 形态标记 细胞学标记 生化标记 DNA分子标记,标记具有多态性(polymophism),花色:白色、红色 株高:高、矮 血型:A、B、O型 淀粉:糯、非糯 多态性是基因突变的结果,遗传图谱的 DNA标记,第1代标记:经典的遗传标记,以蛋白质或免疫学多态性位点为标记。标记位点与所研究性状间连锁关系。 ABO血型位点标记,HLA(人类白细胞抗原)位点标记。已知多态性蛋白位点少,技术复杂、准确性差。 70年代,限制性片段长度多态性(RFLP):群体中不同个体DNA序列仅有约1%差异DNA多态性位点,酶切位点的变异(RFLP)。,限制性片段长度多态性,一对等位基因,一个具有某一种

6、酶的酶切位点,而另一个没有,酶切产物DNA片段长度的差异多态性。,第2代标记,80年代,微卫星中心(minisatellite core)、可变串联重复VNTR(variable number of tandem repeats)提供不同长度重复片段(612个核苷酸 1989年微卫星标记(microsatellite marker)系统的发现和建立,结合PCR技术简单序列长度多态性(simple sequence length polymorphism,SSLP) ,扩增片段长度多态性 (Amplified Fragment Length Polymorphism,AFLP)等 。,微卫星(m

7、icrosatellite)标记,微卫星又称为简单重复序列(simple sequence repeat,SSR)。 这种重复序列的重复单位很短,常常26bp,如(CA)n、(AT)、(GGC)n等重复,重复区大多几十几百bp,分散在基因组中,大多不存在于编码序列内,具有较高的多态性。目前微卫星DNA已经发现了万余个位点。,TTCAGCTAGCTCAGCAGCAGCAGCAGCAGAGCTTGC AAGTCGATCGAGTCGTCGTCGTCGTCGTCTCGAACG,500bp 400bp 300bp 240bp,微卫星DNA PCR扩增结果,该结果显示在所检查的人群中,该位点多态性有4种。

8、,第3代标记,90年代,单核苷酸多态性(single nucleotide polymorphism,SNP):指染色体基因组水平上由单个核苷酸变异引起的DNA序列多态性,具有分布广、密度高(人类基因组中每1000个核苷酸就有一个SNP )、多态性丰富等特点。 不同个体间,基因组DNA某部位的 单核苷酸的变异。,SNP在人类基因组中广泛存在,平均每5001000个碱基对中就有1个,估计其总数可达1700万个甚至更多。,糖尿病基因的个人SNP差别,日本研究人员最近经过研究发现,与糖尿病有关的基因并不是千篇一律,它们之间存在着个人差别,即“单核苷酸多态性”(SNP)。,果蝇连锁图,14号染色体遗传

9、图谱上家系定位示意图,7号染色体上已定位的遗传病,疾病基因的确定,2. 物理图谱,DNA限制性酶切片段排列顺序图 酶切片段在DNA链上的定位 直接检测DNA标记在染色体上的实际位置基因组中基因间顺序显性化 比遗传图谱分辨率更高 是从遗传图到序列图的中间图谱,遗传图谱的缺陷,分别率有限 人类只能研究少数减数分裂事件,不能获得大量子代个体 精确性不够 经典遗传学认为,交换是随机发生的 基因组中有些区域是重组热点 倒位、重复等染色体结构变异会限制交换重组,酵母遗传图与物理图比较,A 遗传图 B 物理图,3.基因图谱,在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信

10、息的图谱。鉴别出全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。 能有效地反应在正常或受控条件中表达的全基因组时空图。 可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。,对基因转录表达产物mRNA互补的cDNA(其片段称为表达序列标签,EST)进行大规模测序是序列标签位点的主要来源,并以此构建人类基因组转录图(基因图)。,A portion of the E.coli chromosome showing genes and opero

11、ns. A dot indicates the promoter for each gene or operon. Arrows and color indicate the direction of transcribtion: dark blue genes are transcribed left to right, light blue are transcribed right to left.Overlapping gene are shown in green.,4. 序列图谱,包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。 大规模测

12、序基本策略:逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。全基因组鸟枪法:在一定作图信息基础上,不经大片段连续克隆系的构建,直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。,四、构建DNA物理图谱的方法,完整的物理图谱包括:人类基因组的不同载体DNA克隆片段重叠群图;大片段限制性内切酶切点图;DNA片段或异DNA序列(sequence tags site,STS)的路标图;基因组中广泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的标记图。 基本原理是把庞大的无从下手的DNA先“敲碎”,再拼接。以

13、Mb、kb、bp作为图距,以DNA探针的STS(sequence tags site)序列为路标。,主要方法,限制性核酸内切酶降解法 部分变性法 DNA聚合酶法 杂交电镜法(环形成法) 末端标记法,1.限制性核酸内切酶降解法,部分酶解法 交叉酶解法,部分酶解法的2个基本步骤,完全降解:限制性内切酶将放射性标记DNA完全降解,经凝胶电泳分离后进行自显影,图谱显示组成该DNA链的酶切片段的数目和大小。 部分降解:末端标记DNA一条链,以相同酶部分降解(控制反应条件使酶量、温度、时间DNA链上该酶的切口随机断裂),电泳分离及自显影。比较2个自显影图谱,根据片段大小及彼此间的差异排出酶切片段在DNA链

14、上的位置片那段重叠。,一线性DNA片断长18.1kb,EcoRI完全消化后电泳,得8个片段,部分消化产生15个片断。,完全消化片断: A (4.6) , B (4.0), C (3.3), D (2.5), E (2.0), F (1.0), G (0.5), H (0.2) 部分消化片断: 6.6 6.5 5.3 4.6 4.2 4.0 3.8 3.5 3.3 2.5 2.0 1.0 0.7 0.5 0.2,部分消化大片断是完全消化小片断之和,可推测: 6.6 = 2+4.6(E + A); 6.5 = 2.5+4.0 (D + B); 5.3 = 2+3.3(E + C); 3.8 = 0

15、.5+3.3(G + C); 0.7 = 0.2+0.5(G+H); 4.2 = 0.2+4 (B+H) 或 4.2 =0.2+0.5+1.0+2.5(H + F + G + D); 3.5 =1.02.5 (F + D) 或 3.5 = 0.2+3.3(H + C) 或 3.5 = 0.5+1.0+2.0(G + F + E),A E C G H F D B,4.6 2.0 3.3 2.5 4.0,0.5 0.2 1.0,EcoR I 在此DNA片段上的酶切图谱,交叉酶解法,DNA片段总长 3kb EcoR: 1.7,0.9,0.4 Hpa: 1.6,1.4 EcoR+ Hpa:1.2 ,

16、0.9 , 0.5 , 0.4,Hpa一个切点 EcoR1.7 kb片段不在末端-无0.2、0.1片段 EcoR 0.9和0.4 kb都在末端,2.部分变性法,DNA分子各区域AT含量不同,部分变性后,富含AT区出现电镜下可见的环状结构。 比较限制酶切DNA部分变性及全分子部分变性结果,确定酶切位点顺序。,3.末端标记法,待测DNA片段的5或3端先用32P标记; 用某限制性内切酶部分酶解; 电泳和放射自显影分析这一组酶解片段的长度。 各相邻片段的长度之差就是二个相邻切点之间的距离,也即它们之间片段的大小。 以足够数量的限制性内切酶分别进行分析,对DNA片段作出比较详细的物理图谱。,G F E

17、D C B A,*,A-G,*,A-F,A-E,A-D,*,A-C,*,A-B,*,A,*,末端标记,*,电泳凝胶上DNA片断的鉴定,人类部分染色体物理图谱,The E.coli genome,五、核酸序列分析,DNA一级结构测定 (DNA sequencing),DNA的一级结构: 多聚脱氧核苷酸链中脱氧核苷酸的排列顺序碱基序列,DNA碱基顺序测定的主要方法,1975年,Sanger 加减法 1977年,Sanger 双脱氧终止法 1977年,Maxam & Gilbert 化学断裂法,1.双脱氧法(dideoxy method)或末端终止法(chain termination),DNA s

18、equencing with chain-terminating inhibitors. Sanger, F. , Nicklen, S. & Coulson, A.R. (1977).Proceedings of the National Academy of Sciences, USA, 74, 5463-7. a second Nobel Prize in Chemistry in 1980,DNA的生物合成,参与DNA复制的主要物质 底物: dATP, dGTP, dCTP, dTTP(dNTP) 聚合酶: DNA聚合酶(DNA polymerase) 模板(template): 解开

19、成单链的DNA母链 引物(primer): 互补于模板链的寡核苷酸片段, 提供3-OH末端使dNTP可以依次聚合 子链DNA延长的方向: 53,DNA生物合成的过程,DNA聚合酶催化的反应,双脱氧核苷酸,双脱氧核苷酸的掺入终止DNA链的合成,测序体系,聚丙烯酰胺凝胶电泳检测,变性聚丙烯酰胺凝胶电泳,丙烯酰胺+双丙烯酰胺三维网状孔结构 变性剂: 尿素,电泳装置,放射自显影,利用放射性同位素所发射出来的带电粒子(或粒子)作用于感光材料的卤化银晶体,从而产生潜影,这种潜影可用显影液显示,成为可见的像。,2.自动测序,Hood developed a prototype automated DNA s

20、equencer in 1985 Leroy Hood (1938-) earned an M.D. From Johns Hopkins University in 1964 and a Ph.D. in biochemistry from the California Institute of Technology in 1968. He won the 2003 Lemelson-MIT Prize for inventing four instruments: the DNA gene sequence and synthesizer, and the protein synthesi

21、zer and sequencer,2004,荧光物质作为标记物,C C G A A T G C T G A C G T A,荧光物质标记双脱氧核苷酸,the Sanger Institute Team 55: Sequencing Facility,3. 碱基序列测定的新方法(Next generation methods),美国国家卫生研究院(NIH)设立 “Revolutionary Genome Sequencing Technologies”基金,目标: 2009年,测定一人全基因组序列只$10万,2014年,费用将降为$1000。 Waston2007年5月31日获赠装有他本人完整

22、基因组图谱数据的DVD光盘。(2个月,$200万) 基因组学先锋J. Craig Venter 、炎黄一号第一个中国人基因组图谱先后完成 2008,首张非洲人全基因组图谱问世 2009,第二个韩国人基因组的测序和注释,目前已完成的完整个人基因组图谱,测序实验流程,高通量,低成本,半自动化 Amersham MegaBACE 1000,全自动化 ABI 3730 xl DNA Analyzer,毛细管电泳替代垂直板电泳,Pyrosequencing (焦磷酸测序, Biotage ) 454 Sequencing a brand of sequencing by 454 Life Sciences, that dramatically expands pyrosequencing Sequencing by hybridization Nanopore sequencing Polony sequencing (聚合酶克隆 ),新方法不断涌现,焦磷酸测序基本原理,在每一轮测序反应中,只加入一种dNTP,若该dNTP与模板配对,聚合酶就可以将其掺入到引物链中并释放出等摩尔数的焦磷酸基团(PPi)。 反应体系 :测序引物和单链DNA模板结合,酶混合物(包括DNA Polymerase、ATP Sulfurylase-硫酸化酶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论