真核基因组中重复序列_第1页
真核基因组中重复序列_第2页
真核基因组中重复序列_第3页
真核基因组中重复序列_第4页
真核基因组中重复序列_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组小,单拷贝;非编码序列较少化学组成多样;多顺反子;基因重叠

断裂基因;分段基因组

核基因组之一病毒基因组核基因组之二原核生物基因组1.基本是单拷贝的;2.拟核(类核)结构;3.存在多顺反子结构;4.非编码序列相对较少;

真核生物核基因组1.基因组较大,低等真核生物:107-108bp,较原核生物大10倍;高等真核生物:5X108-1010bp,某些植物和两栖生物可达1011bp;哺乳类生物大于2X109它们可编码100万个基因。2.真核生物核DNA与蛋白质结合,形成核小体,再缠绕成染色质(染色体);重楼百合1.5X10e11

NucleosomestructureNucleosomecore(left)146bpDNA;13/4turnsofDNADNAisnegativelysupercoiledtwoeach:H2A,H2B,H3,H4(histoneoctomer)Nucleosome(right)~200bpDNA;2turnsofDNAplusspaceralsoincludesH1histoneNucleofilamentstructureVideoDNA包装人体DNA的总长度大约为3.5米,细胞核直径仅有0.01毫米。按比例放大,相当于将150公里的长绳硬塞进一个足球里。Wapl控制cohesin与DNA结合紧密程度。Vermicelli(意,小虫子)骨架,维持染色体的形状。

AntonioTedeschi,etal.Waplisanessentialregulatorofchromatinstructureandchromosomesegregation.Nature,25August2013;doi:10.1038/nature124713.基因组一般为双倍体(diploid);4.基因组中非编码序列多于编码序列,有大量的冗余DNA;5.存在大量重复序列,重复次数可高达百万倍;6.基因为单顺反子。一个基因单独转录,一个基因一条mRNA,翻译成一条多肽链;7.大部分基因有内含子,因此基因不连续;8.具有基因家族。

真核生物基因组的特点:

重复性、基因家族、不连续性。

5’3’promoterregionexons(filledandunfilledboxedregions)introns(betweenexons)transcribedregiontranslatedregionmRNAstructure+1Genestructure(一个完整的具有转录功能的单元)不连续性

基因家族genefamily1.概念

基因组中来源相同、结构相似、功能相关的一组基因成为基因家族(genefamily)。一些基因彼此靠近,成串地排列在一起,这种基因排列结构叫基因簇(genecluster)。在基因家族结构中经常会看到基因簇结构。基因簇——多顺反子结构

分类:串联重复多基因家族组蛋白、tRNArRNA分散重复多基因家族Alu家族不同组织、细胞类型、发育时期表达的多基因家族同工酶(珠蛋白)真核生物中重要的基因家族1.Alu基因家族分散重复序列在单倍体人基因组中有5X105个拷贝,约占人基因组的3-6%。每个重复单元的长度为300bp,含一个Alu酶切位点,因而得名。酶切后生成130bp和170bp两个片段,每个Alu片段两侧有6-20bp的同向重复序列,存在于间隔区(space)和内含子中。功能:可能与基因转录、调控、加工有关。LDLreceptorgeneAlurepeatspresentwithinintronsAlurepeatsinexons444555666AluAluAluAluX46Aluunequalcrossingoveroneproducthasadeletedexon5(theotherproductisnotshown)

2.rRNA基因家族串联重复,有转录活性

大多数真核生物rRNA基因家族集中分布在一条或几条染色体上,以核仁区含量最高。通常编码区较为保守,内间区具有种间特异性,常被用作物种种类鉴定及进化分析。

rRNA基因家族(genecluster)

5SrRNA基因家族在所有染色体上都有,分布频率较高。一般由120bp组成每个重复单元由5sRNA基因和和转录区前的非转录区组成,重复串联形成基因簇。非洲爪蟾卵母细胞的5sRNA基因:富含A-T的序列,由不同的15bp序列重复而成,(CAAAGTTTGAGTTTT)这段序列的串连数不同,非转录的间隔区的长度会有所改变。

真核生物tRNA基因家族

tRNA基因长约70-90bp,基因全长约140bp;基因之间串联重复排列;多个不同的tRNA基因组成一个串联重复,每个基因的方向不同,并单独转录。组蛋白基因家族与细胞DNA复制有关中度重复序列(几十~几百个重复),不含内含子,无需转录后加工,mRNA产物无3’—polyA与DNA复制无关的组蛋白组织特异性表达的组蛋白单拷贝

特点:组蛋白基因缺乏内含子;组蛋白基因家族是重复序列中唯一已知具有蛋白质编码功能的基因。珠蛋白基因家族血红蛋白分子是珠蛋白的四聚体22,型亚基基因在16号染色体上,型亚基基因在11号染色体上,珠蛋白基因以基因家族的形式排列。核基因组之三真核生物核基因组1.一般为双倍体,基因组较大,2.真核生物核DNA与蛋白质结合,形成核小体,再缠绕成染色质(染色体);3.基因为单顺反子,有内含子不连续;4.基因组中非编码序列多,存在大量重复序列;5.基因家族基因组结构与进化的关系:1.基因组的物质组成从多样→单一;DNA、RNA分工明确单链、双链,线状、环状→双链线状2.基因组由小→大;3.DNA的利用率越来越低;(多拷贝、非编码区、基因不连续)4.调控序列增多,调控方式更复杂。PropertiesofthehumangenomeNuclearthehaploidhumangenomehas~3X109bpofDNAsingle-copyDNAcomprises~75%ofthehumangenomethehumangenomecontains~23,000to25,000genesgenesarecomposedoffrom1to>75exonsgenesvaryinlengthfrom<100to>2,300,000bpAlusequencesarepresentthroughoutthegenomeMitochondrialcirculargenomeof~17,000bpcontains<40genes遗传性疾病----DMD

遗传性疾病----DMD的分子诊断迪谢内肌营养不良(DMD)是一种高发病率、高致残、高致死的X染色体连锁的遗传性疾病,发病率为1/3500个男孩DMD基因位于Xp21.2-21.3,全长2400Kb,有79个外显子。DMD的最主要遗传缺陷是外显子缺失,约占60%~70%。DMD基因的突变导致dystrophin缺陷检测DMD基因的技术:Southern印迹、多重PCRDMD基因外显子缺失的检测

史蒂芬·霍金

ALS肌萎缩性侧索硬化症

TypeofDNA%ofGenomeFeaturesSingle-copy(unique) ~75% Includesmostgenes1RepetitiveInterspersed ~15% Interspersedthroughoutgenomebetween andwithingenes;includesAlusequences2

Satellite(tandem) ~10% Highlyrepeated,VNTRs

2

Alusequencesare about300bpinlength andarerepeatedabout 300,000timesinthe genome.Theycanbe foundadjacenttoor withingenesinintrons ornontranslatedregions.1Somegenesarerepeated,wouldbeintherepetitiveDNAfraction501000IIIIIIIIIfast~10%intermediate

~15%slow(single-copy)

~75%ClassesofrepetitiveDNAInterspersed(dispersed)repeats(e.g.,Alusequences)TTAGGGTTAGGGTTAGGGTTAGGGTandemrepeats(e.g.,microsatellites)GCTGAGGGCTGAGGGCTGAGG

重复性(重复序列)DNA的复杂性Cot1/2=1/k

据基因组重复次数高低:单拷贝序列重复序列轻度重复序列2~101中度重复序列10~102高度重复序列102~106

1.单拷贝序列:只有一个拷贝,占基因组的40-70%.主要是功能基因。2%2.轻度重复基因组中有2-10个拷贝,主要是组蛋白和tRNA基因.

3.中度重复序列

拷贝数有几十至几百个,一般无RNA转录产物(非编码序列),一般认为与基因的表达调控有关(包括转录调控序列,复制控制序列,转录后的加工等).

长周期分散的重复序列LINE5000bp疾病分两种短周期分散的重复序列SINE100~300bp

4.高度重复序列

卫星:(satelliteDNA)序列较短5-100bp,大部分集中在异染色质中(中心粒和端粒的附近)真核生物中含10~20%。特点:A、T含量高,序列简单,不转录,其功能尚不清楚。小卫星:15-70核心序列为33bp,常定位在人常染色体区域,呈多态性微卫星(microsatellite)。微卫星在2~6bp之间,普遍散布在人类整条染色体上,或者在基因间区域或者位于内含子内。又称简单串联重复序列STR,SSR(SimpleSequenceRepeats)DNAdetective分子探针1.RFLP2.SSR/STR3.SNP应用:正常样本的差异鉴定病理样本的变化1982年,Bell等发现高度串联重复的短序列单位,重复单位数目的差异导致了这种高度的可变性,由于这些结构特征,人们称这些区域可变数目的串联重复(VariableNumberofTandemRepeats,VNTR)。

VNTR1985年,Jeffreys等用肌红蛋白基因第一内含子中的串联重复序列(重复单位含33bp)作探针,从人的基因文库中筛选出8个含有串联复序列(小卫星)的重组克隆。序列分析表明,这8个小卫星重复单位的长度和序列不完全相同,但都有相同的核心序列(coresequence)。他们先后用两个多核心小卫星探针进行southern杂交,在低严谨条件下杂交得到了包含10多条带的杂交图谱,不同个体杂交图谱上带的位置就象人的指纹一样千差万别,Jeffrey称之为DNA指纹(DNAfingerprint),又名遗传指纹(geneticfingerprint)。(VNTR)analysisiscommonlyusedinforensicsVNTRisbasedonhypervariablemicrosatellitesequencepolymorphismswithinthehumangenome.Thesesequences(e.g.,CACACA…)arefoundinmanylocationsinthehumangenomeandvarygreatlyfrompersontoperson.UsingVNTRtocompareforensicandsuspectsamplesIndividualsA&Careexcludedbythisanalysis.ThesamplesfromindividualBwillbesubjectedtofurthertests.微卫星MicrosatelliteDNA

SSR(SimpleSequenceRepeats)

微卫星DNA是一种广泛分布于真核生物基因组中的串状简单重复序列,每个重复单元的长度在2—10bp之间,常见的微卫星如(TG)n或(AAT)n等,呈现出长度多态性(序列多态性)。而且每个SSR座位两侧一般是相对保守的单拷贝序列.了解SSR座位的侧翼序列(FlankingRegion),寻找其中的特异保守区。据此可设计引物来扩增SSR序列。后经聚丙烯酰胺凝胶电泳、染色,通过比较谱带的相对迁移距离,便可知不同个体在某个SSR座位上的多态性。微卫星的优点:(1)微卫星DNA数量多且均匀分布在基因组中。据估计,在基因组中平均30—50kb就存在一个微卫星,为在整个基因组中定位更多的基因提供了极大的方便(2)微卫星DNA具有丰富的多态性(SSR重复数目变化很大,所以SSR标记能揭示比RFLP高得多的多态性),并且微卫星位点检测可以显示纯合子和杂合子(孟德尔遗传)。这就是SSR标记的原理。(3)微卫星检测容易、重复性较好、省时,适合于进行自动化分析。通过GeneScan检测,一个位点的检测一般可在24h内完成,且可同时进行多位点的检测。应用CombinedDNAIndexSystem(CODIS)DNAdatabase(FBI)

DNAdetective应用:1.生物进化2.DNA指纹图谱(亲子鉴定)3.RFLP分析检测基因缺失、突变、扩增第一代RFLP限制性内切酶多态性分析RestrictionFragmentLengthPolymorphisms制作方法:酶切—电泳—(转膜—杂交)—分析

举例:

——镰刀状红细胞贫血

β-珠蛋白基因的第六个密码子A→T↓

表达产物:谷氨酸→缬氨酸

一个碱基突变→缺失1个MstⅡ内切酶位点

正常人:1.1kb患者:1.3kb

5’3’

5’3’

1.1kb

1.3kb

MstII酶切位点(CCTNATG)正常基因突变基因1.3kb1.1kb0.2kb123

1、正常人2、突变携带者3、患者AFLP—AmplifiedFragmentLengthPolymorphism扩增片段长度多态性分析制作方法:酶切—加接头—PCR—电泳—分析。RFLP、AFLP用于突变分析的局限性:突变必须发生于酶切位点区域,否则检测不到。SSCP—Singlestrandconformationpolymorphism单链构象多态性分析

基本原理:单链DNA片段呈复杂的空间折叠构象,这种立体结构主要是由其内部碱基配对等分子内相互作用力来维持的,当有一个碱基发生改变时,会或多或少地影响其空间构象,使构象发生改变,空间构象有差异的单链DNA分子在聚丙烯酰胺凝胶中迁移率不同。基本过程是:①PCR扩增靶DNA;②PCR扩增产物变性;③聚丙烯酰胺凝胶电泳;④显色分析结果.若发现单链DNA带迁移率与正常对照的相比发生改变,就可以判定该链构象发生改变,进而推断该DNA片段中有碱基突变.

局限性:只有突变位点影响其空间构象才能被检出来。检出率:70%

第三代SNPSNP是SingleNucleotidePolymorph

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论