基因组测序与序列_第1页
基因组测序与序列_第2页
基因组测序与序列_第3页
基因组测序与序列_第4页
基因组测序与序列_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1基因组测序与序列基因组测序与序列第1页/共89页第1页/共89页第2页/共89页第2页/共89页第3页/共89页Genome Size (Mb)第3页/共89页第4页/共89页什么是什么是C 值?值?C值悖理:值悖理: 生物的复杂性与基因组的大小并不完全成比生物的复杂性与基因组的大小并不完全成比例增加例增加第4页/共89页第5页/共89页细菌细菌真菌真菌等等动物动物阴影部分为一个门内阴影部分为一个门内C-值的范围值的范围第5页/共89页第6页/共89页第6页/共89页第7页/共89页 DNA 的复性的复性 遵循二级反应动力学,可表述为遵循二级反应动力学,可表述为:dCt / dt =

2、-KC02 反应达反应达 t 时,单链时,单链DNA浓度浓度 = CtC0 = 单链单链 DNA起始浓度起始浓度 K 复性速度常数复性速度常数顺序复杂性第7页/共89页第8页/共89页Cot(1/2) = 1/K (mol. Sec / L) 常数常数 Ct/C0 0101C0t(1/2) C0t(1/2) C0t(1/2)值与基因组复杂性成正比。值与基因组复杂性成正比。第8页/共89页第9页/共89页 是遗传信息的物理和功能单位,包含产生是遗传信息的物理和功能单位,包含产生一条多肽链或功能一条多肽链或功能RNA所必需的全部核苷酸所必需的全部核苷酸序列。序列。 基因分类:基因分类: 编码编码R

3、NA的基因,如的基因,如rRNA基因,基因,snRNA基因等;基因等; 编码蛋白质的基因编码蛋白质的基因2. 什么是基因?什么是基因?第9页/共89页第10页/共89页基因的不连续性基因的不连续性Intron 和和Exon: 大多数真核生物蛋大多数真核生物蛋白质基因的编码顺白质基因的编码顺序序(Exon)都被或长都被或长或短的非编码顺序或短的非编码顺序(Intron)隔开隔开第10页/共89页第11页/共89页基因家族基因家族 一群具有一致的或相似顺序的基因一群具有一致的或相似顺序的基因, ,有的还担负有的还担负类似的生物学功能类似的生物学功能, , 可以相互补偿可以相互补偿, , 比如比如:

4、E2f :E2f transcription factor transcription factor Mouse symbolHuman OrthologE2f1E2F1 E2f2E2F2E2f3E2F3E2f4E2F4E2f5E2F5E2f6E2F6第11页/共89页第12页/共89页假基因假基因(Pseudogene) 来源于功能基因来源于功能基因 但已失去活性但已失去活性 的的DNA序列序列产生假基因的原因有产生假基因的原因有:1. 由重复产生的假基因由重复产生的假基因;2. 加工的假基因加工的假基因, 由由RNA反转录为反转录为cDNA 后再整合后再整合到基因组中到基因组中;3. 残缺

5、的基因残缺的基因(Truncated gene) 第12页/共89页第13页/共89页重迭基因有以下几种情况:重迭基因有以下几种情况:*一个基因完全在另一个基因内部一个基因完全在另一个基因内部*部分重叠部分重叠* 两个基因共用少数碱基对两个基因共用少数碱基对 第13页/共89页第14页/共89页*一个基因完全在另一个一个基因完全在另一个基因内部基因内部如:如:B和和A, E和和D 其读码结构互不相同其读码结构互不相同 -ATG-/-AATGCC -/-ATAACG-/-TAA-A*BATGCCN-NNATAA第14页/共89页第15页/共89页*部分重叠部分重叠 如:如: K和和C *两个基因

6、共用少数两个基因共用少数碱基对碱基对 如:如: D和和J-TAATG-D 终止密码子终止密码子J 起始密码子起始密码子第15页/共89页第16页/共89页第16页/共89页第17页/共89页第17页/共89页第18页/共89页A 克隆于质粒中DNA用碱或热变性B M13克隆单链DNAC 噬粒克隆DNAD PCR产生单链DNAA 高酶活性B 无53外切酶活性C 无35外切酶活性ddATP/ddCTP/ddGTP/ddTTP 的3碳原子连接的是氢原子,不是羟基第18页/共89页第19页/共89页第19页/共89页第20页/共89页第20页/共89页第21页/共89页第21页/共89页第22页/共8

7、9页第22页/共89页第23页/共89页碱基特异修饰方法GPh8.0,用硫酸二甲酯对 N7进行甲基化,使 C8-C9键对碱基裂解有特殊敏感性A+GpH2.0 哌啶甲酸可使嘌呤环的N原子化,从而导致脱嘌呤,并因此消弱腺嘌呤和鸟嘌呤的糖苷键C+T肼可打开嘧啶环,后者重新环化成五元环后易除去C1.5mol/L NaCl存在时,可用肼除去胞嘧啶第23页/共89页第24页/共89页哌啶第24页/共89页第25页/共89页第25页/共89页第26页/共89页第26页/共89页第27页/共89页第27页/共89页第28页/共89页第28页/共89页第29页/共89页1 ATACGTTA2 GTTAGATC3

8、 ACGTTAGA4 CGTTAGAT5 GTTAGATCDNA 样品 TATGCAATCTAG与基因芯片上 65,000 种可能的八聚体进行杂交从而形成特定的结合图形计算机分析杂交图象并由探针的重叠情况推导样品的核酸序列1 ATACGTTA3 TACGTTAG4 ACGTTAGA2 CGTTAGAT5 GTTAGATC3 TACGTTAG4 ACGTTAGA2 CGTTAGAT互补序列为:ATACGTTAGATC样品序列为:TATGCAATCTAG利用基因芯片进行杂交测序的原理第29页/共89页第30页/共89页ABCABCABCABC小片段测序小片段测序计算机拼装计算机拼装第30页/共89

9、页第31页/共89页ABC小片段测序小片段测序计算机拼装计算机拼装鸟枪法鸟枪法(Shotgun)测序的问题测序的问题 CAATGCATTAGCAGCCAATGCGAP错装错装第31页/共89页第32页/共89页第32页/共89页第33页/共89页解决办法:通过相邻已知顺序作为探针筛选已有的基因组文库解决办法:利用其它宿主菌与载体重新构建文库第33页/共89页第34页/共89页第34页/共89页第35页/共89页第35页/共89页第36页/共89页 先将染色体打成比较大的片段先将染色体打成比较大的片段(几十几十-几百几百Kb), 利用利用分子标记将这些大片段排成重叠的克隆群分子标记将这些大片段排

10、成重叠的克隆群(Contig), 分别分别测序后拼装测序后拼装. 这种策略叫基于克隆群这种策略叫基于克隆群(contig-based)的策的策略略.ABCABC大片段大片段contig小片段测序拼装小片段测序拼装第36页/共89页第37页/共89页第37页/共89页第38页/共89页第38页/共89页第39页/共89页第39页/共89页第40页/共89页第40页/共89页第41页/共89页第41页/共89页第42页/共89页第42页/共89页第43页/共89页第43页/共89页第44页/共89页随机测序与序列组装方法和指导测序与序列组装方法相结合进行序列组装第44页/共89页第45页/共89页

11、第45页/共89页第46页/共89页第46页/共89页第47页/共89页第47页/共89页第48页/共89页 19号染色体是含基因最丰富的染色体,而13号染色体含基因量最少目前已经发现和定位了26000多个功能基因,其中尚有42%的基因尚不知道功能人类基因组中存在“热点”和大片“荒漠”。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA” 不包含或含有极少基因的成分。基因组上大约有14的区域没有基因的片段。 353的基因包含重复的序列。这说明那些原来被认为是“垃圾”的DNA也起重要作用,应该被进一步研究。第48页/共89页第49页/共89页第49页/共89页第50页/共89页第

12、50页/共89页第51页/共89页5.6 人类基因组计划的论理学第51页/共89页第52页/共89页第52页/共89页第53页/共89页第53页/共89页第54页/共89页第54页/共89页第55页/共89页第55页/共89页第56页/共89页第56页/共89页第57页/共89页第57页/共89页第58页/共89页第58页/共89页第59页/共89页第59页/共89页第60页/共89页第60页/共89页第61页/共89页第61页/共89页第62页/共89页第62页/共89页第63页/共89页第63页/共89页第64页/共89页第64页/共89页第65页/共89页第65页/共89页第66页/共8

13、9页第66页/共89页第67页/共89页第67页/共89页第68页/共89页第68页/共89页第69页/共89页第69页/共89页第70页/共89页第70页/共89页第71页/共89页第71页/共89页第72页/共89页第72页/共89页第73页/共89页第73页/共89页第74页/共89页第74页/共89页第75页/共89页第75页/共89页第76页/共89页cDNA文库构建第76页/共89页第77页/共89页cDNA文库构建第77页/共89页第78页/共89页5RACE第78页/共89页第79页/共89页3RACE第79页/共89页第80页/共89页第80页/共89页第81页/共89页 是遗传信息的物理和功能单位,包含产生是遗传信息的物理和功能单位,包含产生一条多肽链或功能一条多肽链或功能RNA所必需的全部核苷酸所必需的全部核苷酸序列。序列。 基因分类:基因分类: 编码编码RNA的基因,如的基因,如rRNA基因,基因,snRNA基因等;基因等; 编码蛋白质的基因编码蛋白质的基因2. 什么是基因?什么是基因?第81页/共89页第82页/共89页*一个基因完全在另一个一个基因完全在另一个基因内部基因内部如:如:B和和A, E和和D 其读码结构互不相同其读码结构互不相同 -ATG-/-AATGCC -/-ATAACG-/-TAA-A*BATGCCN-NNAT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论