精选基因组学考试资料-整理版_第1页
精选基因组学考试资料-整理版_第2页
精选基因组学考试资料-整理版_第3页
精选基因组学考试资料-整理版_第4页
精选基因组学考试资料-整理版_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基因组学考试资料-整理版第一章一、基因组1、基因组genome:生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。2、基因组学:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。基因组学包括3个不同的亚领域结构基因组学(structural genomics) :以全基因组测序为目标 功能基因组学(functional genomics):以基因功能鉴定为目标比拟基因组学(comparative genomics)二、基因组序列复杂性1

2、、C值是指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。每个细胞中以皮克(pg,10-12g)水平表示。C 值悖理矛盾C-value paradox):在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。C值反映了总体趋势上,随着生物结构和功能的复杂性的增加,各分类单元中最小基因组的大小随分类地位的提高而递增。2、序列复杂性单一顺序:基因组中单拷贝的DNA序列重复顺序:基因组中多拷贝的基因序列真核生物基因组DNA组分为非均一性,可分为3种类型:快速复性组分、居间复性组分、缓慢复兴组分三、基因与基因家族1、基因家族:是真核基因组的共

3、同特征,他们来自一个共同的祖先,因基因加倍和趋异,产生了许多在DNA序列上根本一致而略有不同的成员。包括编码RNA的基因和编码蛋白质的基因2、隔裂基因split gene:指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。3、异常结构基因分类重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。 基因内基因:一个基因的内含子中包含其他基因。 反义基因: 与基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。4、假基因:来源于功能基因但已失去活性或者改变原来活性功能的DNA序列.四、基因组特征比拟真核生物基因组的特征 :复杂性较高的生物基因组结构松弛

4、,在整个基因组范围内分布大量重复顺序小基因组重复序列较少,大基因组重复序列急剧扩增;含有大量数目不等的线性DNA分子,并且,每个长链DNA都与蛋白质组成染色体结构; 含有细胞器基因组所有真核生物都具有环状的线粒体DNA,植物细胞还含有环状的叶绿体DNA。原核生物基因组的特征 :原核生物基因数目比真核生物少,大小在5 Mb以下; 原核生物基因组结构更紧凑;极少重复序列;重复基因的数量远远低于真核生物;不存在内含子,根本都是编码序列,无断裂基因。第二章一、为何要绘制遗传图与物理图?1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图谱进行指导。2)基因组存在大量重复顺序,会干扰排序

5、,因此要高密度基因组图。3)遗传图和物理图各有优缺点,必须相互整合校正。二、基因组测序方法、原理及特点:1. 克隆重叠群法clone contig method,作图法测序:先构建遗传图,再利用几套高度覆盖的大片段基因组文库BAC、PAC等获得精细的物理图,选择适宜的BAC或PAC克隆测序,利用计算机拼装。BAC内的空洞根本上都可以利用设计引物等手段填补,形成一条完整的BAC序列。然后由相互关联、局部重叠的BAC克隆连成一个大的重叠群Contig。优点:通过这种方法得到的基因组数据是最为准确和精细的数据,也是基因组测序的最终目标。缺点:该方法的技术难度较高,尤其大片段基因组文库BAC和精细物理

6、图构建是技术性极强的工作;此外,费用相对于鸟枪法要稍高一些,完成整个基因组测序周期也要长些。2. 全基因组鸟枪法whole-genome shotgun method:是随机先将整个基因组打碎成小片段进行测序,最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置。优点:速度快,简单易行,本钱较低,可以在较短的时间内通过集中机器和人力的方法获得大量的基因片断。缺点:最终排序结果的拼接组装比拟困难,尤其在局部重复序列较高的地方难度较大。此外有许多序列片段难以定位在确切的染色体上,成为游离片断;同时又会有许多地方由于没有足够的覆盖率而形成空缺。这些缺陷最终导致整个基因图

7、会留下大量的空洞,也影响其准确度。三、遗传图与物理图遗传作图Genetic mapping:采用遗传学分析方法将基因或其它DNA序列标定在染色体上构建连锁图。此方法包括杂交实验,家系分析。遗传图距单位为厘摩(cM), 每单位厘摩定义为1%交换率。相对位置 物理作图Physical mapping:采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实际位置。物理图的距离依作图方法而异,如辐射杂种作图的计算单位为厘镭(cR), 限制性片段作图与克隆作图的图距为DNA的分子长度,即碱基对(bp, kb)。绝对位置基因是首先被使用的标记:基因十分有限,大量的基因间隔区DNA标记必须有等位型

8、才是有用的四、遗传图标记及特点:1.限制性片段长度多态性restriction fragment length polymorphisms, RFLP同一物种的亚种、品系或个体间基因组DNA 受到同一种限制性内切酶作用而形成不同的酶切图谱的现象,第一代分子标记。特点:1) 处于染色体上的位置相对固定; 2) 同一亲本及其子代相同位点上的多态性片段特征不变; 3) 同一凝胶电泳可显示等位区段不同多态性片段, 表现为共显性(可鉴定纯合子和杂合子); 4) 需要用Southern杂交检测显示。2. 简单序列长度多态性simple sequence length polymorphisms, SSLP

9、第二代分子标记 SSR技术的优点是:1在基因组中随机分布,检测的多态性频率高;2PCR特异引物,重复性好3共显性,操作相对简单。问题是:1SSR需要测序和设计引物,因而需要大量的人力、物力和时间;2另外其种属特异性强,开发所需的费用高昂,因此一些实验室进行了合作,共同开发微卫星引物。 SSR标记的关键是引物的设计3. 单核苷酸多态性single nucleotide polymorphisms, SNP是指同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。其中最少一种在群体中的频率不小于1;根据SNP在基因中的位置,SNP可分为:基因编码区SNP、基因周边SNP、基因间SNP。

10、SNP特点:1)SNP由核苷酸代换产生2)人类基因组平均600bp含一个SNP 3)人类基因组SNP总量大于500万占人类DNA序列差异的10% - 50%4)基因组中一些紧密连锁的SNP可组成单倍型(Haplotype).单倍型中不同的SNP位点之间不发生重组与交换.五、遗传作图理论根底:采用一组分子标记构建遗传图的方法 主要依赖于连锁分析。根本方法:两点测验法和三点测验法六、不同模式生物连锁分析有性杂交实验、质谱分析、DNA转移七、 Lod值是基因连锁可能性的对数,用于初步判断所研究的2个基因是否位于同一染色体上。八、细菌的遗传作图:局部二倍体作图法转化 transformation :供

11、体细胞释放的一段DNA通常小于50kb,经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组克隆。转导transduction):通过噬菌体将小片段DNA从供体细胞转移到受体细胞。接合 (conjugation):两个细菌形成物理接触,DNA从供体转移到受体。转移DNA可以是一段也可以是整个染色体,可达1Mb.第三章一、为什么需要物理作图?1、遗传图谱分辨率有限:由于人类及其大多数高等真核生物来说,不可能获得巨大数量的后代,因此可用于研究的减数分裂体就少很多,连锁分析就受限制,导致标记密度的减小,从而影响遗传作图;2、遗传图覆盖面低:由于染色体交换区域的不平衡,有些区段很少发生交换,难以获

12、得高密度连锁图;3、遗传图分子标记的排列有时会出现过失:遗传作图依赖子代的重组及别离比,由于环境及取样误差,有时结果会出现差异,相同的标记在连锁图上位置不一样。二、物理作图方法及原理限制性作图、基于克隆的基因组作图、荧光原位杂交FISH、序列标签位点STS)1、限制性作图:将限制性酶切位点标定在DNA分子的相对位置。方法及原理:通过比拟不同限制性内切酶切割所产生DNA片段大小:首先用一种酶处理样品后,电泳确定DNA片段的大小;然后用第二种酶处理,获得第二组片段。最后用两种酶混合处理,获得第三组片段。收集上述资料进行比照组装:两种酶切位点交替出现的区段用加减法确定其的相对位置。连续出现2个或多个

13、相同酶切位点的区段,采用局部酶解法。切点过多时可以采用末端同位素标记结合局部酶解进行绘图。限制性作图更适合于小分子。当需要对大于50kb的基因组进行限制性作图时,通过选择靶DNA分子中的稀有酶切位点酶可以克服限制性酶切作图的局限性。大分子DNA别离采用特殊电泳:脉冲凝胶电泳PFGE、正交交变电场凝胶电泳OFAGE2、基于克隆的基因组作图:根据克隆的DNA片段之间的重叠序列构建重叠群(Contig), 绘制物理连锁图。常用大分子DNA克隆载体:酵母人工染色体YAC、噬菌体P1载体、细菌人工染色体BAC、P1人工染色体PAC、F黏粒。方法及原理:1、基因克隆2、构建重叠群染色体步移法、指纹法3、荧

14、光原位杂交FISH:指在染色体上进行DNA杂交,以便识别荧光标记探针在染色体上位置的方法。4、序列标签位点作图STS:通过PCR或分子杂交将小段DNA序列定位在基因组的DNA区段中。三、脉冲电泳PFGE的根本原理:将一个方向不断变换的电场,取代简单的单一电场单向电场),使电泳中受阻的DNA分子在电场改变时扭转迁移方向,较小的分子比拟大的分子重新排列的快,以此到达别离的目的。分辨率到达10Mb。四、重叠群:可以通过末端的重叠序列相互连接形成连续的DNA长片段的一组克隆称为重叠群(contig)五、指纹法:1、分类:限制性带型Restriction patterns指纹:用不同限制性酶消化后,经凝

15、胶别离产生的条带。重复顺序DNA指纹Repetitive DNA fingerprints:将不同克隆的限制性片段电泳转膜后,与基因组范围分布的重复序列杂交形成的带型。重复顺序DNA PCR Repetitive DNA PCR或分散重复顺序PCRinterspersed repeat element PCR, IRE-PCR指纹:用基因组范围的重复序列的互补序列做引物,扩增两个重复序列之间的单一顺序,得到的产物带型。2、克隆指纹法的原理:如果2个克隆彼此重叠,它们一定含有相同的序列。3、基因组范围内查找重叠克隆的最好方法首推克隆指纹排序。4、指纹:指确定DNA样品所具有的特定DNA片段组成,

16、一个克隆的指纹表示了该克隆所具有的指定序列的特征,可以同其他克隆产生的同类指纹比拟。六、STS作图法:根据STS序列设计引物,扩增文库当中的克隆,能扩出条带的克隆都含有序列重叠的插入子。前提:某一克隆重叠群锚定到现有的STS标记物理图上,STS是单一序列,序列。序列标记位点Sequence tagged site, STS :指一段短的DNA序列,通常长度在100-500bp,易于识别, 在待研究的染色体或基因组中仅存有1个拷贝。因此当2个片段含有同一STS顺序时,可以确认这两个片段彼此重叠。合格的STS需要具备的两个条件:1. 在染色体上的位置独一无二;2. 序列,方便PCR检测。寻找STS

17、的方法:1表达序列标签expressed sequence tag, ETS):来源于cDNA克隆的小段序列。EST来自单拷贝的基因时可作为STS;2SSLP 具有多态性且通过连锁分析进行定位的SSLP很有价值,可以建立遗传图与物理图之间的联系;3随机基因组顺序。可通过对克隆的基因组DNA随机测序获得,或者从数据库中寻找。七、荧光原位杂交:fluorescent in situ hybridization,FISH指在染色体上进行DNA杂交,以便识别荧光标记探针在染色体上位置的方法。八、作图试剂mapping reagent):STS作图过程中将的STS定位在染色体或基因组中的DNA区段,这些

18、STS标记和作图用的染色体区段以及DNA克隆。如何获得作图试剂?1放射杂交 2克隆文库辐射杂种radiation hybrid):含有其他生物染色体片段的啮齿类动物细胞。辐射杂种群radiation hybrid panel):通过放射杂交产生的融合细胞群称为辐射杂种群。辐射杂种群分为两类:全基因组辐射杂种群单染色体辐射杂种群第四章一、DNA测序两种方法过程及原理:双脱氧链终止法更易于机械手操作,可以程序化控制;同时,化学降解法试剂的毒性影响健康1、双脱氧链终止法the chain termination method,是通过合成与单链DNA互补的多核苷酸链来读取待测DNA分子的顺序。根本原理

19、: 通过合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反响,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的顺序。目前普遍采用的测序酶为Sequenase, 来自T7噬菌体 2、化学降解法chemical degradation method,是将双链DNA分子用化学试剂处理,产生切口,用同位素标记进行测序根本原理:在选定的核苷酸碱基中引入化学基团,再用哌啶处理使DNA分子在被修饰的核苷酸位置降解,形成只差一个核苷酸的降解DNA群体。每个单链的同一方向都结合了放射性同位素标记,显示DNA位置。DMS硫酸二甲酯在中性pH环境,主要作用于G,被六氢吡啶作用而造成该

20、位点上DNA链的断裂。 甲酸具有脱嘌呤作用。DNA链在脱嘌呤位点(G和A)发生断裂。 肼联氨 NH2.NH2,在碱性条件下,作用于T胸腺嘧啶和C胞嘧啶,在具有六氢吡啶的条件下,导致在这个核苷酸位置上发生DNA链的断裂。如果在反响体系中参加高浓度的盐,同胸腺嘧啶的反响速率便会下降,主要作用于C胞嘧啶。二、双脱氧链终止法技术路线与要求:制备单链模板 A.克隆于质粒中DNA用酸或碱变性 B.M13克隆单链DNA将单链模板与一小段引物退火 C.噬粒克隆DNA D.PCR产生单链DNA参加DNA多聚酶 高酶活性、无3-5外切酶活性、无5-3外切酶活性 4种脱氧核苷酸分别参加少量4种双脱氧核苷酸ddNTP

21、的3C原子连接的是氢原子,不是羟基 将4种反响产物分别在4条泳道电泳 根据4个碱基在4条泳道的终止位置读出基因序列三、双脱氧链终止法要求单链作为模板,如何制备单链模板?1. 将DNA克隆到质粒载体中:碱变性或热变性变为单链,DNA变性后两条单链可同时双向测序但未纯化的DNA污染干扰测序反响;2. 以M13载体克隆单链DNA:M13噬菌体基因组为单链DNA,可用于克隆单链DNA,可以作为模板进行DNA测序; 无需变性,直接测序;但3kb时扩增时容易发生丧失与重排,只能操作小片段DNA测序。3. 以噬菌粒phagemid克隆DNA:改造的质粒载体,有2个复制起始点质粒自身和 M13单链噬菌体,在大

22、肠杆菌细胞中产生单链噬菌粒,该系统防止了M13系统的不稳定性,可克隆片段 10kb DNA测序4. PCR产生单链DNA:根据测序DNA两端序列合成2个引物,采用PCR法扩增样品DNA,然后将其中一个引物连接到很小的磁珠,利用吸磁的方法提纯扩增的单链DNA;四、基因组测序方法原理优缺点:按照大分子DNA克隆绘制的物理图分别在单个大分子DNA内部进行测序和序列组装,然后将彼此相连的的大分子克隆按排列次序搭建支架,最后以分子标记为向导将搭建的支架分别锚定到基因组整合图上作图测序; 优点:缺点:将整个基因组DNA打断成小片段后克隆到质粒载体上,然后随机挑选克隆对插入片段进行测序,并以测序的序列构建重

23、叠群,在此根底上搭建支架,以分子标记为向导将搭建的支架分别锚定到基因组整合图上全基因组随机测序或鸟枪法测序。 优点:测序速度快,并且无须提供相关的遗传图谱和物理图谱。缺点:对于结构复杂的大基因组而言,鸟枪法的序列组装的起始阶段工作量非常大;基因组中普遍存在的重复序列是十分棘手的问题,在序列组装时可能出现错误连接,使某些片段从原位置跳到另一无关位置。五、间隙类型:测序后将DNA顺序进行组装,会发现存在不连续的区段,它们产生于:1) 因覆盖率的原因而留下的未能测序的顺序,仍存在于克隆文库中, 这类间隙称为顺序间隙。解决方法:通过相邻顺序作为探针筛选已有的基因组文库2) 因克隆载体自身的限制或DNA

24、顺序特殊的组成等原因造成某些顺序丧失或未能克隆, 这类间隙称为物理间隙。解决方法:利用其它宿主菌与载体重新构建文库六、覆盖面或深度:每个核苷酸在完成顺序中平均出现的次数,或者说完成顺序的长度与组装顺序长度之比。在测序前,首先要考虑测序规模,P0=e- mm为覆盖面,即单倍体基因组数;e为自然对数底数七、重要区域测序1、人们对感兴趣的基因或与疾病相关的基因优先测序。如:人类主要组织相容性复合区位于第6号染色体,与人类免疫系统有关,因而优先测序。2.EST (Expressed sequence tag) 测序 EST是一种重要的基因组图分子标记,以EST为探针很容易从 cDNA文库中筛选全基因,

25、又可从BAC克隆中找到其基因组的基因序列。3、浏览测序:粗略分析初步测序结果,从中寻找基因编码顺序的方法。八、名词解释1) BAC 末端序列(BAC-end sequenced) 一个BAC克隆插入片段两端的已测序的序列,不包括内部顺序. 可用于确定BAC的排列方向以及重叠群(contig)在支架(scaffold)中的排列方向.2) 重叠群(contig) 一群相互重叠的克隆或DNA顺序,可以是草图顺序或精确顺序(finished), 包括连续的(内部无间隙)或不连续的(内部含间隙)DNA顺序,未锚定到染色体上.3) 草图顺序(draft sequence) 人类基因组测序方案定义为经Phr

26、ed Q20软件认可覆盖测序克隆片段3-4倍的DNA顺序. 含间隙或无间隙, 排列方向和位置未定.4) 精确顺序(finished sequence) 顺序过失率(错误碱基数)低于0.01%的DNA序列, 排列方向确定,内部不含间隙, 一般测序覆盖率在8-10个单倍体基因组 5) 支架(scaffold) 一组已锚定在染色体上的重叠群, 内部含间隙或不含间隙. 九、几种生物的测序方法: 大肠杆菌基因组测序图位法; 流感嗜血杆菌基因组测序鸟枪法; 果蝇基因组测序鸟枪法; 人类基因组测序图位法和鸟枪法; 水稻基因组测序 图位法和鸟枪法。第五章一、内含子出现的问题:内含子的出现给计算机判读基因带来不少问题,对ORF扫描的根本程序的编写要考虑以下几个问题: 1密码子偏好;编码同一氨基酸的不同密码子称为同义密码,其差异仅在密码子的第3位碱基不同。特定种属有特征性的密码子偏爱,这些序列在编码区常常出现,非编码区只保持平均的碱基分布水平。2外显子内含子边界;上游外显子-内含子边界序列是判断是否为编码序列之一;但常有例外,导致判读程序编写有一定困难。3上游调控序列。几乎所有基因或操纵子上游都有调控序列,它们

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论