基因组与比较基因组学_第1页
基因组与比较基因组学_第2页
基因组与比较基因组学_第3页
基因组与比较基因组学_第4页
基因组与比较基因组学_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章基因组与比较基因组学

9.1人工染色体构建

9.2新的测序策略--全基因组鸟枪法测序

9.3全基因组序列分析--基因组学的新内容

9.4

比较基因组学(Comparativegenomics)

9.1人工染色体构建

1983年,美国的Dana-Farber癌症研究所和哈佛大学医学院的教授首次在Nature上发表文章,报道了构建YAC(YeastArtificialChromosome)库的过程。1987年,Burke等人发现,仅仅带有ARS序列(autonomousreplicatingsequence)的载体虽然能够被复制,但极易在有丝分裂时丢失。即使在选择培养基上,也只有5%-20%的子代细胞带有ARS载体。加入Centromeres(CEN)能显著提高ARS质粒在有丝分裂时的稳定性,90%以上子代细胞带有该载体。CEN还能显著降低拷贝数,从20-50/细胞降为1-2/细胞。(Science,236:806-812)。

人工染色体含有三种必需成分:着丝粒、端粒和复制起点。

着丝粒(CEN)位于染色体中央,呈纽扣状结构,在有丝分裂时结合微管并调控染色体的运动,也是姐妹染色单体配对时的最后位点,接收细胞信号而使姐妹染色体分开。

端粒(TEL):主要功能是防止染色体融合、降解、确保其完整复制。端粒酶以其自身RNA为模板,在染色体端部添加上端粒重复序列,并参与端粒长度和细胞增殖的调控。

复制起点:DNA复制通常由起始蛋白与特定的DNA序列相互作用开始。DNA合成的起始位点和DNA复制起点(遗传位点)所需的Cis靶区常位于同一段长约100bp的DNA上。

YAC的主要缺点

1.存在高比例的嵌合体,即一个YAC克隆含有两个本来不相连的独立片段;

2.部分克隆子不稳定,在转代培养中可能会发生缺失或重排;

3.难与酵母染色体区分开,因为YAC与酵母染色体具有相似的结构。

4.操作时容易发生染色体机械切割。

以细菌寄主系统为基础的克隆载体形成嵌合体的频率较低,转化效率高,又易于分离。科学家用"染色体建造"法用F质粒及其调控基因构建细菌载体,克隆大片段DNA。该质粒主要包括oriS,repE(控制F质粒复制)和parA、parB(控制拷贝数)等成分。

BAC的优点

1.易于用电击法转化E.coli(转化效率比转化酵母高10-100倍);2.超螺旋环状载体,易于操作;3.F‘质粒本身所带的基因控制了质粒的复制;4.很少发生体内重排。有人把人类染色体端粒DNA上单个α-卫星DNA单元多聚化形成1Mb左右的大片段并与人类基因组DNA混合,产生了能被复制、能正常分裂并得到长期稳定保存的人工合成的染色体,长度约为6-10Mb,称为MAC或HAC。

9.2新的测序策略--全基因组鸟枪法测序

对某基因组文库全部克隆片段进行末端序列测定中未测到的碱基数,即缺口(gap),与已测定的总碱基数相关。随着已测定碱基数的增加,缺口的总碱基数目会按照泊松公式的一个推论(P=e-m)迅速减小。其中P为基因组中某个碱基未被测定的概率,m为所测定的碱基数与基因组大小相比的倍数。m越大P值越小。当m值达到5(即随机测定的碱基数达到基因组5倍时),基因组中未测定的碱基数为基因组总碱基数的0.67%(e-5=0.0067)。对流感嗜血杆菌这样大的基因组(1.83Mb),可能留有128个平均长度为100bp的缺口。全基因组鸟枪法测序的主要步骤

第一,建立高度随机、插入片段大小为2kb左右的基因组文库。克隆数要达到一定数量,即经末端测序的克隆片段的碱基总数应达到基因组5倍以上。第二,高效、大规模的末端测序。对文库中每一个克隆,进行两端测序,TIGR在完成流感嗜血杆菌的基因组时,使用了14台测序仪,用三个月时间完成了必需的28,463个测序反应,测序总长度达6倍基因组。第三,序列集合。TIGR发展了新的软件,修改了序列集合规则以最大限度地排除错误的连锁匹配。第四,填补缺口。有两种待填补的缺口,一是没有相应模板DNA的物理缺口,二是有模板DNA但未测序的序列缺口。他们建立了插入片段为15-20kb的λ文库以备缺口填补。

鸟枪法测序的缺点

对鸟枪法的改进

(1)Clonecontig法。首先用稀有内切酶把待测基因组降解为数百kb以上的片段,再分别测序。(2)靶标鸟枪法(diretedshotgun)。首先根据染色体上已知基因和标记的位置来确定部分DNA片段的相对位置,再逐步缩小各片段之间的缺口。一些常见的缩写

SSLPs,simplesequencelengthpolymorphisms;

STRs,simpletandemrepeats;

SNPs,singlenucleotidepolymorphisms.

LINEs,longinterspersednuclearelements;

SINEs,shortinterspersednuclearelements;

LTR,longterminalrepeat.

FISH,FluorescentinsituHybridization;

STS,SequenceTaggedSite

EST,EndSequenceTag.9.3全基因组序列分析--基因组学的新内容

1.数据存放。

2.碱基百分含量分析。无论是GC富含区还是AT富含区,都可能是一些特殊功能的区域。

肺炎支原体GC百分含量高和GC百分含量低的区域对应于重组值较低的区域,包括着丝粒和端粒,而尿殖道支原体GC百分含量最低的区域对应于rRNA和tRNA。流感嗜血杆菌GC百分含量高的区域也对应于6个rRNA基因。

3.ORF分析。首先要用多个不同的软件来要找到并估测基因组中的每一个ORF。

(1)通过流感嗜血杆菌能量代谢类群的ORF分析,了解到在这种生物中缺乏三羧酸循环(TCA)中必需的三个酶,即柠檬酸合成酶基因、异柠檬酸脱氢酶基因和顺乌头酸酶基因。由此推断流感嗜血杆菌TCA缺失,不能合成谷氨酸,因为谷氨酸的供体是TCA的中间产生物α-酮戊二酸。

(2)在尿殖道支原体基因组中有一个称为MgPa的ORF。考察全基因组,共发现有9个与MgPa同源

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论