




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章基因组1.2基因组序列复杂性1.2.1C值与C值悖理基因组:一个物种单倍体染色体的数目及其所携带的全部基因称为该物种的基因组(genome)。
C值(Cvalue):是指一个单倍体基因组中DNA的总量,一个特定的种属具有特征的C值。最小的:原核生物支原体基因组小于106bp;最大的:某些植物和两栖类基因组大于1011bp。图总的趋势是:随着生物结构与功能复杂性而增加生物的复杂性与基因组的大小并不完全成比例增加。如:蕨类的低等植物Psilotum
nudum,其基因组大小为2.5×1012bp,相当于模式植物拟南芥基因组的3000倍。
Cvalueparadox(C值悖理):C值的大小并不能完全说明生物进化的程度和遗传复杂性的高低,也就是说,物种的C值和它进化复杂性之间没有严格的对应关系。1.2.1序列复杂性序列复杂性:基因组中单拷贝的DNA序列称为单一序列,多拷贝的DNA序列称为重复序列,不同序列的DNA总长称为复杂性(complexity)。基因组复杂性与基因组大小
真核生物基因组DNA组分为非均一性,可分为3种类型:快速复性组分,居间复性组分和缓慢复性组分。
如果基因组中每一种基因只有一个,即都是单拷贝序列,那么基因组愈大则基因组的复杂性愈大,复性速率愈小,C0t1/2与非重复序列的基因组大小呈正比。1.2.3基因组的序列组成单拷贝序列(uniquesequence)亦称非重复序列(nonrepetitivesequence):在一个基因组中只有一个拷贝(或2-3个拷贝)中度重复序列(moderatelyrepetitivesequence)高度重复序列(highlyrepetitivesequence)1.2.3基因组的序列组成高度重复序列
重复单位长度在数个碱基对至数千碱基对之间,拷贝数几百个至上百万个。高等真核生物高度重复序列DNA有如下一些特点:它们都是由极其相似的重复拷贝首尾相连串接排列;在介质氯化铯中作密度梯度离心时,可形成特异的卫星带,故又称卫星DNA(sateliteDNA);集中分布在染色体的特定区段,如着丝粒和近端粒区。中度重复序列其长度(由100bp到几千bp)和拷贝数差别很大,一般分散在整个基因组中。有多种类型的中度重复序列,其表达产物常是细胞大量需要的,如rRNA、tRNA和组蛋白等。还有如哺乳类的:短散在元件(shortinterspersednuclear,SINE),长度在500bp以下,拷贝数可达10万以上。如Alu序列。长散在元件(longinterspersednuclear,LINE),长度在1000bp以下,拷贝数1万左右。类似于逆转录酶基因,L1。1、rRNA基因真核生物的rRNA有28s、18s、5.8s和5s4种,其中28s、18s和5.8s3种的编码基因串联排列,组成一个转录单位,在人类基因组中约有300个拷贝,分布在13、14、15、21和22号染色体上。5srRNA基因单独为一个转录单位,在人类基因组中约有2000个拷贝,位于1号染色体。rRNA基因可以作为一种遗传标志,在分子遗传学中有重要的意义。2、tRNA基因:每一种tRNA基因的拷贝数有几十到几百个。同一种tRNA基因常常串联在一起排列成基因簇,各个编码tRNA基因之间也有间隔区有的tRNA基因编码序列中插入有内含子3、Alu家族:每个长度约300bp,富含CG,因在其第170bp处有一个限制性内切酶AluI(AGCT)的位点而得名占人类基因组的3%~6%,Alu家族分散于整个基因组的间隔序列中,多位于一些编码基因的5’端和3’端的远端,个别的也有存在于内含子中。Alu序列具有种属特异性,其功能可能与hnRNA的加工成熟,DNA复制及转录调节有关。单一序列
不同生物基因组中单一序列与重复序列的比例差异很大:原核生物绝大部分为单一序列(90%)。低等真核生物,大部分(80%)为单一序列。动物细胞中,中度重复序列与高度重复序列约占50%。大多数植物与两栖类单一序列只占基因组DNA的很少比例(20%)。基因主要位于单一序列部分生物种属基因组的序列组成不同生物基因组序列组成不同生物基因组的序列组成差别极大,原核生物基因组重复序列的含量很少。真核生物中大型基因组有很高比例的重复序列,植物中多倍体的重复序列比例高于两倍体物种。1.3基因与基因家族基因(gene):用来表示决定可遗传的某一表型的遗传物质。
即由不同的DNA片段共同组成的一个完整的表达单元,有一个特定的表达产物,表达产物可以是RNA分子,亦可为多肽分子。组成基因的DNA成分包括:编码初级转录物的全部序列;为正确启动转录及进行转录物加工所必需的最低要求的DNA序列;调节转录速率所必需的DNA序列,如涉及转录的诱导与抑制的序列以及组织与发育专一性表达的序列。基因分为两大类,即编码RNA的基因与编码蛋白质的基因。1.3.1编码RNA基因细胞中绝大多数的RNA分子都与遗传信息的传递有关,涉及前体RNA的加工与mRNA的翻译;大多数编码RNA的基因都是多拷贝;RNA基因大致可分为6个类群:即rRNA基因、tRNA基因、scRNA基因、snRNA基因、snoRNA基因、小分子干扰RNA基因。rRNA基因约占总量的80%
真核生物:18S,5.8S,28S和5SrRNA;原核生物16S,23S和5SrRNA。tRNA基因约占总量的15%
真核生物每种tRNA基因的拷贝数从数个至数百个不等。scRNA基因:编码小分子细胞质RNA(small
cytoplasmicRNA,胞质内小RNA)。仅知3种类型:7SLRNA、7SKRNA、4.5SRNA7SLRNA是细胞质信号序列识别颗粒(signalsequencerecognitionpartcle,SRP)组装的骨架SRP可与正在合成的多肽链信号肽序列结合,介导后者与内质网接触真核生物蛋白质合成后的定向运输SnRNA基因:
编码小分子细胞核RNA(small
nuclerRNA,核内小RNA)。它们始终与蛋白质结合形成核蛋白复合物,即snRNP,参与mRNA前体的剪接加工。剪接复合体:snRNP+mRNA
真核生物mRNA的剪接机制---剪接分两步:
5’位点剪断与(分支点)形成套索状中间体同步进行
3’位点剪断和外显子连接同步进行。内含子的切除snoRNA基因
编码小分子核仁RNA(smallnuclearRNA,核仁小RNA)。作用场所主要位于核仁区其功能是修饰rRNA,如指定特定位置的碱基甲基化或将某些碱基转变为假尿嘧啶。miRNA
:
miRNA(microRNA,微小RNA)是小分子干扰RNA的主要活性形式,系由原miRNA(pri-miRNA)加工产生。
长度22nt的成熟miRNA。
功能:促使靶mRNA的降解或阻止和干扰靶mRNA的翻译。小分子干扰RNAsiRNA:产生于双链RNA(主要来源于内源转座子、反向重复DNA、病毒mRNA、转基因表达产物)。
功能:主要涉及基因沉默、阻止翻译和染色体重建piRNA(pivi-interactingRNA):动物中发现。
功能:抑制内源逆转座子的表达,保持基因组的稳定性。1.3.2编码蛋白质基因均由RNA聚合酶转录。断裂基因(splitgene):外显子(exon)和内含子(intron)初级转录物:
------mRNA前体5’帽的形成
------mRNA前体3’-端切除及加polyA尾
-----内含子被切除--------成熟的mRNA。1.3.3基因家族多基因家族(genefamily):是真核生物基因组的共同特征,它们来自一个共同的祖先,因基因加倍和趋异产生许多在DNA序列组成上基本一致而略有不同的成员。同一家族的基因成员在序列组成上相似,担负类似的生物学功能。如人体血红蛋白的α-和β-球蛋白亚基组成了2个基因亚家族,其中α球蛋白基因有3个成员,β-球蛋白基因有5个成员。基因家族主要产生于祖先基因的重复及其突变。组蛋白基因家族超基因家族(supergenefamily):
系指起源于共同的祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。如免疫球蛋白基因家族:
IgG,IgM,IgA,IgE,IgD联合基因(unionofgenomicsequence)基因组中一段连续的DNA序列,编码一组关联的彼此重叠的功能产物。1.3.4异常结构基因重叠基因(overlappinggene):
编码序列彼此重叠的基因,含有不同蛋白质的编码序列。
病毒基因组、某些高等生物线粒体基因组和核基因组中发现。主要类型:单个的mRNA可编码2种或多种蛋白质,如大肠杆菌噬菌体ΦΧ174基因组长5386bp,共编码11个基因。由不同的启动子转录的彼此重叠的mRNA,各自编码不同的蛋白质。如人类核基因组INK4a/ARF座位有2个蛋白质产物p19和p16。GenomeorganizationoftheSARS-CoV基因内基因(genes-within-genes)
:常常一个基因的内含子中包含其他基因。如人类基因组神经成纤维细胞瘤Ⅰ型基因的一个内含子中含有3个较短的基因,分别为OGMP,EV12A和EV128。反义基因(antisencegene)
:与已知基因编码序列互补的负链编码的基因。人类基因组中含有大约1600个反义基因。不对称转录(asymmetrictranscription)
在DNA分子双链上某一区段,一股链用作模板指导转录,另一股链不转录;模板链并非永远在同一条单链上。5
3
3
5
模板链编码链编码链模板链结构基因转录方向转录方向1.3.5假基因假基因(pseudogene):
系指来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或异常延伸,合成无活性的蛋白质。第一类假基因:称为重复的假基因。由重复产生的假基因其位置一般与起源的基因拷贝邻近排列,保留着祖先基因的组成特点,有些细胞器(线粒体)基因组的基因转移至核基因组。第二类假基因:称为加工的假基因。这类假基因由RNA反转录为cDNA后再整合到基因组中。已不含原来基因的内含子以及两侧序列;分散在整个基因组中;大多数为5′残缺。第三类假基因:为残缺基因,它们缺失了或长或短的基因片段,常常位于基因家族内部,由不等交换及重排产生。第2章
遗传图绘制测序策略-----作图法测序:
绘制高密度分子标记遗传图和大分子DNA克隆重叠群(contig)覆盖的基因组物理图根据分子标记所在的位置将遗传图和物理图彼此衔接绘制基因组整合图在此基础上,将单个大分子DNA克隆逐个随机测序,随后进行序列组装。这是一种由上而下(uptodown)的测序策略。鸟枪法测序:全基因组鸟枪法随机测序,随后将序列重叠的片段构建重叠群。以大分子DNA克隆为基准,将随机测序搭建的重叠群归并到所在的大分子克隆内。最后以分子标记为基点将归并的鸟枪法DNA片段锚定到染色体上。………ATGCCGTAGGCCTAGCTAGGCCTAGCTCGGA……
………ATGCCGTAGGCCTAGCTCGGA……基因组DNABAC文库根据物理图谱正确定位的BAC或contig用于霰弹法测序的候选克隆用于霰弹法测序的亚克隆测序并组装完整的基因组序列逐步克隆法(ClonebyClone)
全基因组霰弹法(WholeGenomeShot-gun)基因组DNA
霰弹法克隆测序并进行全基因组序列组装完整的基因组序列遗传作图(geneticmapping)
采用遗传学分析方法将基因或其他DNA分子标记标定在染色体上构建连锁图称之为遗传连锁图(geneticlinkagemap)或遗传图(geneticmap)。这一方法包括杂交实验,家系分析。遗传图的图距单位为厘摩(cM),每单位厘摩定义为1%交换率。遗传图的绘制是人类基因组研究的第一步,即以染色体上某一点为遗传标记,以与之相伴遗传的特征为对象,经连锁分析,将编码该特征的基因定位于染色体特定位置。cM值越大,两者之间距离越远。通过遗传图分析,可大致了解各个基因或DNA片段之间的相对距离与方向,了解哪个基因更靠近着丝粒,哪个更靠近端粒等。遗传距离是通过遗传连锁分析获得的,研究中所使用的DNA标志越多,越密集,所得到的遗传连锁图的分辨率就越高。物理作图(physicalmapping)
采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组的实际位置所构建的位置图称之为物理图。物理图的距离依作图方法而异,如辐射杂种(radiationhybrid)作图的图距单位为厘镭(cR),限制性片段作图与克隆作图的图距为DNA的分子长度,即碱基对。由于方法的局限遗传图和物理图均会产生某些偏差,通过共同的作图标记可以相互校正,由此获得的基因组连锁图称之为基因组图(genomemapping)。2.2遗传作图标记2.2.1基因标记
在经典遗传学中,研究一种性状的遗传必须要求同一性状至少有2种不同的存在形式或称表型。如孟德尔在研究豌豆性状的遗传规律时就选用了如植株高与矮这种相对性状,每个相对性状都由一个不同的等位基因(allele)控制。HLA-B位点至少有60个等位基因。2.2.2DNA标记DNA标记:
基因之外的作图工具统称为DNA标记。限制性片段长度多态性
(restrictionfragmentlengthpolymorphisms,RFLP)简单序列长度多态性
(simplesequencelengthpolymorphisms,SSLPs)单核苷酸多态性
(singlenucleotidepolymorphisms.SNPs)A.限制性片段长度多态性
(restrictionfragmentlengthpolymorphisms,RFLP)
其基本设想是,由于同源染色体同一区段DNA序列的差异,当用限制酶处理时,可产生长度不同的限制性片段。这些DNA片段经琼脂糖凝胶电泳分离,可直接显示不同个体同一位点DNA组成的差异。提供大量位点多态性信息。RELP被称为第一代分子标记。DNA标记特征:处于染色体上的位置相对固定;同一亲本及其子代相同位点上的多态性片段特征不变;同一凝胶电泳可显示不同多态性片段,具有共显性特点。B.简单序列长度多态性
(simplesequencelengthpolymorphisms,SSLPs)SSLP产生于重复序列的可变排列,同一位点重复序列的重复次数不同,表现出DNA序列的长度变化。与RELP不同的是,SSLP具多等位性(multiallelic),每个SSLP都有多个长度不一的变异体。分布具有多态性频率高以及分布比较均匀的特点,SSLP标记又称为第二代分子标记,有时称为SSR。小卫星序列(minisatellite):可变串联重复(variablenumberoftandemrepeats,VNTR),其重复单位为数十个核苷酸微卫星序列(microsatellite):简单串联重复(STR)重复单位为1~6个核苷酸,由10~50个重复单位串联组成。平均每6kb有一个SSLP位点,人类基因组中,76%的重复序列为A、AC、AAAN、AAN或AG,丰度依次递减。作图中应用最广的重复序列为AG。微卫星序列应用较普遍,原因有二小卫星序列在基因组中的分布很不均匀,大多集中在染色体的端部和着丝粒区,而微卫星则分布在整个基因组中,并且密度高;微卫星序列便于PCR分析,当PCR扩增的DNA长度少于300bp时,反应既快速又精确。C.单核苷酸多态性
(singlenucleotidepolymorphisms.SNPs)
基因组中单个核苷酸的突变,每个单核苷酸位置最多只有4种形式,A、T、C、G。某些群体在特定的单苷核酸位置只有2个或3个SNP,这些位点称为双等位(biallele)或三等位(triallele)。
人类基因组中位于基因内部的SNP至少超过200,000,基因外部的点突变是基因内部的10倍甚至更多,整个SNP数目约在1,000万左右。ATGCACACACACACACACATGCACACACACACACACACACATypeofvariationamongpopulationSNPSTR对某一特定的SNP,同一家系的成员可能有相同的基因型。如SNP在基因组中的数量极大,人群中几乎任何2个个体的基因组都有许多SNP。SNP分子标记具有分布密集的特点,在亲缘关系非常接近的生态型或种内因遗传漂变而隔离的群体,尤其在人类不同种族的多态性检测中被广泛采用。又称为第三代分子标记第3章
物理图绘制物理作图:
以DNA分子的序列排列为基础的非遗传学的作图技术统称为物理作图。物理作图的方法和策略有多种多样,常用的有:限制性作图;基于克隆的基因组作图;荧光原位杂交;序列标签位点作图。3.1限制性作图3.2基于克隆的基因组作图3.2.1大分子DNA的克隆载体细菌人工染色体(bacterialartificialchromosome,BAC):
BAC载体源于大肠杆菌中天然的F质粒。F质粒有较大的克隆容量,可达300kb以上可采取类似制备质粒的方法直接提取克隆的DNA。3.2.2重叠群组建重叠群(contig):相互重叠的DNA片段组成的物理图称为重叠群。克隆重叠群的组建:最早采用的是染色体步移(chromosomewalking)法。首选从基因组文库中挑取一个指定的或随机的克隆,将该起始克隆的末端序列作为探针,在基因组文库中寻找与之重叠的第二个克隆。再按同样的操作程序寻找第三个重叠的克隆,依次延伸,直到完成所需要的重叠群。该方法速度缓慢仅适合于小基因组及小区段染色体的物理图绘制。Contig3.2.3指纹作图克隆指纹(clonefingerprinting)排序:指纹:系指克隆的DNA序列所具有的特定的DNA片段组成。这些DNA片段可以通过不同的方法产生,经凝胶电泳显示后组成特定排列模式的DNA条带,即指纹。克隆指纹:每个克隆的DNA序列都具有特征性的指纹,这些指纹称为克隆指纹。如果两个DNA克隆含有部分相同的指纹,那么这两个克隆就含有部分重叠的DNA序列,它们在基因组中应该相邻排列。>20kb~300bpMolecularweightmarkerevery5thlane
BACclones培养提取BACDNAHindIII完全酶切
1%琼脂糖凝胶电泳
指纹图谱法
(WalkingbyFingerprintingdatabase)
挑取靠近空洞(gap)的种子克隆,酶切构建其指纹图谱,在FPC数据库中进行比对,搜索含有此克隆的重叠克隆群信息,从中确定覆盖空洞区域的克隆,达到延伸目的。限制性带型(restrictionpatterns)指纹:
用不同限制性酶处理样品,经凝胶分离产生DNA条带。如果2个克隆产生的DNA条带有部分是相同的,说明它们含有重叠的序列。HindIII完全酶切HindIII完全酶切FPC数据库中比对CloneACloneBCloneCCABSTS作图(STScontentmaping)指纹:当需将某一克隆重叠群锚定到现有的已具有STS标记的物理图上时,这一方法特别有效。因为STS是单一序列,并且序列已知。根据选定的某个STS序列设计专一性引物,可对大量的单个克隆进行PCR检测,凡是能扩增出条带的克隆均含有序列重叠的插入子。3.4辐射杂种作图构建详细的大基因组物理图的主流技术为STS定位(STSmaping)的辐射杂种(radiationhybrid)作图。主要原理是:基因组中单一序列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 探索演出经纪人资格证考试的科学复习方法及试题及答案
- 营养师相关职业技能体系试题及答案
- 常见营养师考试误区试题及答案
- 西藏色彩联考考题及答案
- 云南三鑫职业技术学院《曲式分析(Ⅰ)》2023-2024学年第一学期期末试卷
- 太原城市职业技术学院《音乐文献检索与论文写作》2023-2024学年第二学期期末试卷
- 浙江商业职业技术学院《能源生产解决方案》2023-2024学年第二学期期末试卷
- 广东外语外贸大学南国商学院《固有免疫与皮肤健康》2023-2024学年第二学期期末试卷
- 哈尔滨职业技术学院《试验设计与统计方法实验》2023-2024学年第二学期期末试卷
- 南京理工大学泰州科技学院《机械工程项目管理》2023-2024学年第一学期期末试卷
- 2022义务教育小学科学课程标准(2022版)解读(面向核心素养的科学教育)
- 9 短诗三首 生字笔顺课件(共10张PPT)
- 无线射频识别技术外文翻译参考文献
- 电力负荷曲线与用电负荷预测课件
- 钢支撑、围檩专项施工方案
- 【2021部编版语文】-四年级下册第六单元教材解读--PPT课件
- 环网电缆35KV中间接头制作技术交底(共4页)
- 隧道电缆沟整体式液压台车(厦沙A7项目)
- 损益平衡点的计算方法
- 化工股份有限公司离子膜法制碱标准操作流程分析标准操作手册中文参考译文
- 进料、制程、成品检验流程图
评论
0/150
提交评论