真核基因与基因组课件_第1页
真核基因与基因组课件_第2页
真核基因与基因组课件_第3页
真核基因与基因组课件_第4页
真核基因与基因组课件_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三篇

基因信息的传递

FLOWOFGENETICINFORMATION第三篇真核基因与基因组DNA的生物合成DNA的损伤和修复RNA的生物合成蛋白质的生物合成基因表达调控细胞信号转导本篇重点学习内容真核基因与基因组本篇重点学习内容1.本部分主要讨论生物遗传信息传递的具体机制及特征。通过学习和讨论,掌握遗传信息的稳定性与不稳定性(产生变异与进化)的矛盾统一。2.遗传信息的基本单位是基因(gene)。所谓基因,是指DNA(在极少的情况下,如某些病毒是RNA)上为生物活性产物编码的功能片断,它们编码的信息用于产生特定的功能产物(蛋白质或RNA)。1.本部分主要讨论生物遗传信息传递的具体机制及特征。通过学Thecentraldogmaofmolecularbiology.Itshowsthegeneralpathwaysofinformationflowviareplication,transcription,andtranslation.Theterm“dogma”isamisnomer.IntroducedbyFrancisCrickatatimewhenlittleevidencesupportedtheseideas,thedogmahasbecomeawell-establishedprinciple.Thecentraldogmaofmolecular3.中心法则(Thecentraldogma)明确了遗传信息传递的基本规律,即DNARNA蛋白质。中心法则的三个基本过程为:复制、转录、翻译。

复制(replication):从母代DNA拷贝产生序列相同的子代DNA。(dsDNAdsDNA)转录(transcription):DNA的编码信息抄录至RNA分子上的过程。(dsDNAssRNA)翻译(translation):在核糖体上,以mRNA上的编码信息为指导合成特定序列的多肽链(蛋白质)。(mRNApolypeptide)3.中心法则(Thecentraldogma)明确了遗生物体内的遗传信息传递遵循中心法则DNA以半保留复制的方式将亲代细胞的遗传物质高度忠实地传递给子代。以DNA为模板转录生成的mRNA作为信使,其核苷酸序列构成的密码子在合成蛋白质时被翻译为肽链中氨基酸的排列顺序。细胞内所有蛋白质一级结构的信息全部来源于DNA序列。生物体内的遗传信息传递遵循中心法则DNA以半保留复制的方式将NOTE:Thecentraldogmaisbroadlycorrect,althoughanumberofexamplesareknownwhichcontradictpartsofit.Retrovirusesreversetranscribe(逆转录)RNAintoDNA,anumberofvirusesareabletoreplicateRNAdirectlyintoanRNAcopy,andanumberoforganismscaneditamessengerRNA

(mRNA的编辑)sequencesothattheproteincodingsequenceisnotdirectlyspecifiedbyDNAsequence.NOTE:逆转录病毒以及逆转录酶的发现,补充完善了中心法则。HowardTemin在1962年最早推断在逆转录病毒中必然存在一种逆催化逆转录的酶。Temin

和DavidBaltimore于1970年分别在各自的实验室内分离得到逆转录酶。逆转录病毒以及逆转录酶的发现,补充完善了中心法则。真核基因与基因组课件ContributionsofDavidBaltimore1982:ThefoundingdirectorofMIT'sWhiteheadInstitute1986:ThediscoveryofthekeytranscriptionfactorNF-κB1987:Thecreationoftransgenicmiceasamodelforthestudyofdisease.1989:TherecombinationactivatinggenesRAG-1andRAG-2a1990:Bcr-ablissufficienttostimulatecellgrowthandcausechronicmyelogenousleukemia(CML).——anti-cancerdrugImatinib(Gleevec)ContributionsofDavidBaltimo中心法则(TheCentralDogma)转录翻译逆转录复制DNARNA蛋白质中心法则(TheCentralDogma)转录真核基因与基因组

第十三章EukaryoteGeneandGenome真核基因与基因组第十三章EukaryoteGenean除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或基因组的一段DNA序列。基因包括编码序列(外显子)、调控序列和间隔序列(内含子)。基因(gene):编码蛋白质或RNA等具有特定功能产物的、负载遗传信息的基本单位。Thefundamentalunitofinformationinlivingsystemsisthegene除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或基因组(genome):一个生物体内所有遗传信息的总和。(1920年,H.Winkles提出)人类基因组包含了细胞核染色体DNA(常染色体和性染色体)及线粒体DNA所携带的所有遗传物质。基因组(genome):一个生物体内所有遗传信息的总和。(1真核基因的结构与功能

第一节TheStructureandFunctionofEukaryoteGene真核基因的结构与功能第一节TheStructurean利用碱基的不同排列荷载遗传信息。通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变。作为基因表达(geneexpression)的模板,使其所携带的遗传信息通过各种RNA和蛋白质在细胞内有序合成而表现出来。

基因的功能利用碱基的不同排列荷载遗传信息。基因的功能单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为基因组构(geneorganization)。

与基因功能相关的结构编码区序列(codingregionsequence

)非编码序列(non-codingsequence)基因表达需要的调控区(regulatoryregion)序列,包括启动子(promoter)、增强子(enhancer)等。在细胞内表达为蛋白质或功能RNA的DNA序列单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称一、真核基因的基本结构编码蛋白质或RNA的编码序列。非编码序列,包括编码区两侧的调控序列和编码序列间的间隔序列。一、真核基因的基本结构编码蛋白质或RNA的编码序列。非编码序真核基因结构不连续,为断裂基因(splitgene)。真核基因结构外显子(exon);在基因序列中,出现在成熟mRNA分子上的序列。内含子(intron):外显子之间、与mRNA剪接过程中被删除部分相对应的间隔序列。真核基因结构不连续,为断裂基因(splitgene)。真核真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因。断裂基因(splitgene)CABD编码区A、B、C、D非编码区真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续周芷(LouiseT.Chow)1977年《细胞》杂志第11卷第4期周芷(LouiseT.Chow)真核生物绝大部分编码蛋白质的基因都有内含子。编码rRNA和一些tRNA的基因也都有内含子。内含子的数量和大小决定了真核基因的大小。不同种属中,外显子序列通常比较保守,而内含子序列则变异较大。外显子与内含子接头处有一段高度保守的序列(大多数内含子以GT为5’端开始,末端为AG-OH-3’),这一共有序列是真核基因中RNA剪接的识别信号。真核生物绝大部分编码蛋白质的基因都有内含子。编码rRNA和一基因的5端称之为上游,3端称为下游基因序列中开始RNA链合成的第一个核苷酸所对应的碱基记为+1,此碱基上游的序列记为负数,下游的序列记为正数。基因的5端称之为上游,3端称为下游二、基因编码区编码多肽链和特定的RNA分子基因的编码序列决定其编码产物的序列和功能。编码序列中一个碱基的改变或突变,可能使基因功能发生重要的变化。相同的DNA序列因起始位点的变化或不同的剪接方式而编码不同的蛋白质多肽链。基因编码区中的DNA碱基序列决定特定的成熟RNA分子的序列,即DNA的一级结构决定着其转录产物RNA分子的一级结构。二、基因编码区编码多肽链和特定的RNA分子基因的编码序列决三、调控序列参与真核基因表达调控位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的DNA序列,又称旁侧序列(flankingsequence)。基因的调控区(顺式作用元件)三、调控序列参与真核基因表达调控位于基因转录区前后,对基因转录起始点TATA盒CAAT盒GC盒增强子AATAAA剪接加尾转录终止点修饰点外显子翻译起始点内含子OCT-1OCT-1:ATTTGCAT八聚体+1结构基因启动子上游启动子元件转录起始点TATA盒CAAT盒GC盒增强子AATAAA剪接加启动子上游调控元件增强子加尾信号细胞信号反应元件顺式作用元件(cis-actingelements)启动子顺式作用元件(cis-actingelements)1.启动子提供转录起始信号启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体的序列。多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。少数启动子(如编码tRNA基因的启动子)位于转录起始点的下游,这些DNA序列可以被转录。1.启动子提供转录起始信号启动子是DNA分子上能够介导R真核生物有3类启动子,分别对应于细胞内存在的三种不同的RNA聚合酶和相关蛋白质。rRNAmRNA5SrRNA,tRNA真核生物有3类启动子,分别对应于细胞内存在的三种不同的RNA能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。通常数个增强子序列形成一簇。有时增强子序列也可位于内含子之中。不同的增强子序列结合不同的调节蛋白。2.增强子增强邻近基因的转录增强子是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种沉默子(silencer)是抑制基因转录的特定DNA序列,当其结合一些反式作用因子(repressors)时对基因的转录起阻遏作用,使基因沉默。REST/NSRF----RE-1/NRSE:silencingofneuronalgenes3.沉默子是负调节元件沉默子(silencer)是抑制基因转录的特定DNA序列,当4.绝缘子是异染色质扩散的屏障绝缘子(insulator)是具有独立调节作用的染色质结构,可位于增强子或沉默子与启动子之间,阻止其对启动子的增强或抑制作用(enhancer-blockinginsulators);位于活化基因与异染色质之间,阻止异染色质扩展对活化基因造成的抑制作用(barrierinsulators)

4.绝缘子是异染色质扩散的屏障绝缘子(insulator)Enhancer-blockinginsulatorsBarrierinsulatorsEnhancer-blockinginsulatorsBaThechickenβ-globinlocusThechickenβ-globinlocus真核基因组的结构与功能

第二节TheStructureandFunctionofEukaryoteGenome真核基因组的结构与功能第二节TheStructurea基因组:细胞或生物体的一套完整单倍体遗传物质的总和。基因组:细胞或生物体的一套完整单倍体遗传物质的总和。一、真核基因组具有独特的结构基因的编码序列所占比例远小于非编码序列。高等真核生物基因组含有大量的重复序列,真核基因组中存在多基因家族和假基因。大多基因具有可变剪接,80%的可变剪接会使蛋白质的序列发生改变。基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体。结构特点:一、真核基因组具有独特的结构基因的编码序列所占比例远小于非编二、真核基因组中存在大量重复序列高度重复序列(highlyrepetitivesequence)中度重复序列(moderatelyrepetitivesequence)单拷贝序列(singlecopysequence)或低度重复序列二、真核基因组中存在大量重复序列高度重复序列(highly(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般由2~10bp组成,成串排列,在人基因组中约占5%~6%。重复频率可达103以上,不编码蛋白质或RNA。反向重复序列(invertedrepeatsequence)卫星DNA(satelliteDNA)两个相同顺序的互补拷贝在同一DNA链上反向排列而成,重复单位长度约300bp,多数散在于基因组中。分类:(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般参与复制水平的调节

存在于DNA复制起点区的附近,是一些蛋白质(包括酶)的结合位点。参与基因表达的调控

可以转录到核内不均一RNA分子中,有些反向重复序列可以形成发夹结构,有助于稳定RNA分子。参与染色体配对

如卫星DNA成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。功能:参与复制水平的调节功能:(二)中度重复序列重复数十至数千次,大多数与单拷贝基因间隔排列。短分散重复片段(shortinterspersedrepeatsequences,SINEs)长分散重复片段

(longinterspersedrepeatsequences,LINEs)平均长度约300bp~500bp,与长度约为1000bp的单拷贝序列间隔排列。拷贝数可达数十万。如Alu家族、KpnI家族、Hinf家族。平均长度为3500bp~5000bp,与长度约为13000bp的单拷贝序列间隔排列。(二)中度重复序列重复数十至数千次,大多数与单拷贝基因间隔排每个成员的长度约300bp。每个单位长度中一个限制性内切酶Alu的切点(AG↓CT),将其切成长130bp和170bp的两段。Alu家族仅次于Alu家族的第二大家族,重复序列中含有限制性内切酶KpnⅠ的位点呈散在分布,拷贝数约为3000~4800个KpnI家族以319bp长度的串联重复存在于人基因组中重复序列中含有限制性内切酶HinfI的位点。Hinf家族短分散重复片段每个成员的长度约300bp。Alu家族仅次于Alu家族的第Karyotypefromafemalehumanlymphocyte(46,XX).ChromosomeswerehybridizedwithaprobeforAluelements(green)andcounterstainedwithTOPRO-3(red).ThemembersoftheAlufamily,maybemobileelements,capableofjumpingintoandoutofvarioussiteswithinthegenomeTheinsertionofAlusequencesintoagenecausesneurofibromatosis,whichisanautosomaldominantdisorder.Thenervetissuegrowstumors(neurofibromas)thatmaybebenignandmaycauseseriousdamagebycompressingnervesandothertissuesKaryotypefromafemalehumanrRNA基因重复序列属于中度重复序列各重复单位中的rRNA基因都是相同的。rRNA基因集中成簇存在,这样的区域称为rDNA区。人类的rRNA基因位于13、14、15、21和22号染色体的核仁组织区,每个核仁组织区平均含有50个rRNA基因的重复单位。5SrRNA基因全部位于1号染色体,每个单倍体基因组约有1000个5SrRNA基因。rRNA基因重复序列属于中度重复序列各重复单位中的rRNA基MicrosatelliteRepeatSequencesOnecategoryofrepeatsequences:microsatellitesequences

consistof2–6bprepeatedupto50timesAC(mostcommonly),CG,AT,andCATheACrepeatsequencesoccurat50,000–100,000locationsinthegenomeThisisaheritabletraitandusefulinconstructinggeneticlinkagemapsMicrosatelliteRepeatSequenceTrinucleotidesequencesthatincreaseinnumber(micro-satelliteinstability)cancausedisease.Unstablep(CGG)nrepeatsequenceisassociatedwiththefragileXsyndromeOthertrinucleotiderepeatsthatundergodynamicmutation(usuallyanincrease)areassociatedwithHuntington‘schorea(CAG),myotonicdystrophy(CTG),spinobulbarmuscularatrophy(CAG).

TrinucleotidesequencesthatiFragileXsyndromeisassociatedwiththeexpansionoftheCGGtrinucleotiderepeataffectingtheFragileXmentalretardation1(FMR1)geneontheXchromosome,resultinginafailuretoexpressthefragileXmentalretardationprotein(FMRP),whichisrequiredfornormalneuraldevelopment.Physicalcharacteristics:anelongatedface,largeorprotrudingears,andlargetestesBehavioralcharacteristics:stereotypicmovements(e.g.hand-flapping),andsocialanxietyFragileXsyndromeisassociatMyotonicdystrophyisachronic,slowlyprogressing,highlyvariable,inheritedmultisystemicdisease.TheaffectedgeneiscalledDMPK,whichcodesformyotonicdystrophyproteinkinase,aproteinexpressedpredominantlyinskeletalmuscle.Thegeneislocatedonthelongarmofchromosome19.thereisanexpansionofthecytosine-thymine-guanine(CTG)tripletrepeatintheDMPKgene.40-year-oldpatientwithmyotonicdystrophypresentingwithbilateralcataractsandcompleteheartblock.Myotonicdystrophyisachroni在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。(三)单拷贝序列(低度重复序列)在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。三、真核基因组中存在大量的多基因家族与假基因多基因家族是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质。如组蛋白基因家族。基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质。如球蛋白基因家族(11,16号染色体)。三、真核基因组中存在大量的多基因家族与假基因多基因家族是指由DNA序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称。(免疫球蛋白超家族基因)超家族基因(superfamilygene)基因组中存在的一段与正常基因非常相似但不能表达的DNA序列。以来表示。假基因(psuedogene)DNA序列相似,但功能不一定相关的若干个单拷贝基因或若干组基Anillustrationofthemutationsthatcancausepseudogenes.Thehumansequenceisofapseudogeneintheolfactorygenefamily.Thechimpanzeesequenceisthefunctionalortholog.ThesepsuedogenesconsistofDNAsequencesidenticalornearlyidenticaltothoseofthemessengerRNAfortheappropriategeneproduct.——the5'-nontranslatedregion,thecodingregionwithoutintronrepresentation,andthe3'poly(A)tailareallpresentcontiguously.ThisparticularDNAsequencearrangementmusthaveresultedfromthereversetranscriptionofanappropriatelyprocessedmessengerRNAmolecule

fromwhichtheintronregionshadbeenremovedandthepoly(A)tailadded.Theycontainnonsensecodonsthatprecludetheirabilitytoencodeafunctional,intactprotein.Anillustrationofthemutatio四、线粒体DNA结构有别于染色体DNA线粒体DNA(mitochondrialDNA,mtDNA)是核外遗传物质,能独立编码线粒体中的一些蛋白质。mtDNA的结构为环状分子,与原核生物的DNA类似,结构特点也与原核生物相似。四、线粒体DNA结构有别于染色体DNA线粒体DNA(mito人的线粒体基因组线粒体基因组编码37个基因,包括13个编码呼吸链多酶体系的一些多肽的基因、22个编码mt-tRNA的基因、2个编码mt-rRNA(16S和12S)的基因。人的线粒体基因组线粒体基因组编码37个基因,包括13个编码呼物种基因组大小(Mb)基因数染色体数*支原体M.genitalium0.58470无流感嗜血杆菌H.influrnzae1.831743无枯草芽孢桿菌B.subtilis4.204100无大肠杆菌E.coli4.604288无酿酒酵母S.cerevisiae13.50603416裂殖酵母

S.pombe12.50492916燕麦O.sativa4663000021果蝇D.melanogaster165136014秀丽隐杆线虫

C.elegans97184246小鼠mouse27003000020人H.sapiens30002500023不同生物体基因组的比较五、人基因组中有两万多个基因物种基因组大小(Mb)基因数染色体数*支原体M.geni基因组大小和基因数量在生物进化中可能并不具有特别重要的意义,人类的基因较其他生物体可能更为“有效”,其发挥功能的方式与其他生物不同。基因组大小和基因数量在生物进化中可能并不具有特别重要的意义,六、人的基因在染色体上的分布特征人类基因组的染色体DNA六、人的基因在染色体上的分布特征人类基因组的染色体DNA最长的染色体:1号染色体,250kb,含3000多个基因最小的染色体:21号染色体,约47kb,含300-400个基因肌萎缩性侧索硬化症SOD1mutation唐氏综合症,21-三体综合征Downsyndrome

最长的染色体:1号染色体,250kb,含3000多个基因肌萎基因在染色体上并不是均匀分布。基因密度最大的是第19号染色体,密度最小的是第13号和Y染色体。染色体上存在着无基因的“沙漠区”,即在500kb区域内,没有任何基因的编码序列。基因在染色体上的分布特征基因在染色体上并不是均匀分布。基因密度最大的是第19号染色体小结基因:能够编码蛋白质或RNA等具有特定功能产物的、负载遗传信息的基本单位,通常是指染色体或基因组的一段DNA序列基因基本结构包含编码蛋白质或RNA的编码序列及其与之相关的非编码序列。基因组是指一个生物体内所有遗传信息的总和。线粒体DNA是核外遗传物质,可以独立编码线粒体中的一些蛋白质。人类线粒体基因组全长16569bp,共编码37个基因。人类基因组有2万多个基因。小结基因:能够编码蛋白质或RNA等具有特定功能产物的、第三篇

基因信息的传递

FLOWOFGENETICINFORMATION第三篇真核基因与基因组DNA的生物合成DNA的损伤和修复RNA的生物合成蛋白质的生物合成基因表达调控细胞信号转导本篇重点学习内容真核基因与基因组本篇重点学习内容1.本部分主要讨论生物遗传信息传递的具体机制及特征。通过学习和讨论,掌握遗传信息的稳定性与不稳定性(产生变异与进化)的矛盾统一。2.遗传信息的基本单位是基因(gene)。所谓基因,是指DNA(在极少的情况下,如某些病毒是RNA)上为生物活性产物编码的功能片断,它们编码的信息用于产生特定的功能产物(蛋白质或RNA)。1.本部分主要讨论生物遗传信息传递的具体机制及特征。通过学Thecentraldogmaofmolecularbiology.Itshowsthegeneralpathwaysofinformationflowviareplication,transcription,andtranslation.Theterm“dogma”isamisnomer.IntroducedbyFrancisCrickatatimewhenlittleevidencesupportedtheseideas,thedogmahasbecomeawell-establishedprinciple.Thecentraldogmaofmolecular3.中心法则(Thecentraldogma)明确了遗传信息传递的基本规律,即DNARNA蛋白质。中心法则的三个基本过程为:复制、转录、翻译。

复制(replication):从母代DNA拷贝产生序列相同的子代DNA。(dsDNAdsDNA)转录(transcription):DNA的编码信息抄录至RNA分子上的过程。(dsDNAssRNA)翻译(translation):在核糖体上,以mRNA上的编码信息为指导合成特定序列的多肽链(蛋白质)。(mRNApolypeptide)3.中心法则(Thecentraldogma)明确了遗生物体内的遗传信息传递遵循中心法则DNA以半保留复制的方式将亲代细胞的遗传物质高度忠实地传递给子代。以DNA为模板转录生成的mRNA作为信使,其核苷酸序列构成的密码子在合成蛋白质时被翻译为肽链中氨基酸的排列顺序。细胞内所有蛋白质一级结构的信息全部来源于DNA序列。生物体内的遗传信息传递遵循中心法则DNA以半保留复制的方式将NOTE:Thecentraldogmaisbroadlycorrect,althoughanumberofexamplesareknownwhichcontradictpartsofit.Retrovirusesreversetranscribe(逆转录)RNAintoDNA,anumberofvirusesareabletoreplicateRNAdirectlyintoanRNAcopy,andanumberoforganismscaneditamessengerRNA

(mRNA的编辑)sequencesothattheproteincodingsequenceisnotdirectlyspecifiedbyDNAsequence.NOTE:逆转录病毒以及逆转录酶的发现,补充完善了中心法则。HowardTemin在1962年最早推断在逆转录病毒中必然存在一种逆催化逆转录的酶。Temin

和DavidBaltimore于1970年分别在各自的实验室内分离得到逆转录酶。逆转录病毒以及逆转录酶的发现,补充完善了中心法则。真核基因与基因组课件ContributionsofDavidBaltimore1982:ThefoundingdirectorofMIT'sWhiteheadInstitute1986:ThediscoveryofthekeytranscriptionfactorNF-κB1987:Thecreationoftransgenicmiceasamodelforthestudyofdisease.1989:TherecombinationactivatinggenesRAG-1andRAG-2a1990:Bcr-ablissufficienttostimulatecellgrowthandcausechronicmyelogenousleukemia(CML).——anti-cancerdrugImatinib(Gleevec)ContributionsofDavidBaltimo中心法则(TheCentralDogma)转录翻译逆转录复制DNARNA蛋白质中心法则(TheCentralDogma)转录真核基因与基因组

第十三章EukaryoteGeneandGenome真核基因与基因组第十三章EukaryoteGenean除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或基因组的一段DNA序列。基因包括编码序列(外显子)、调控序列和间隔序列(内含子)。基因(gene):编码蛋白质或RNA等具有特定功能产物的、负载遗传信息的基本单位。Thefundamentalunitofinformationinlivingsystemsisthegene除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或基因组(genome):一个生物体内所有遗传信息的总和。(1920年,H.Winkles提出)人类基因组包含了细胞核染色体DNA(常染色体和性染色体)及线粒体DNA所携带的所有遗传物质。基因组(genome):一个生物体内所有遗传信息的总和。(1真核基因的结构与功能

第一节TheStructureandFunctionofEukaryoteGene真核基因的结构与功能第一节TheStructurean利用碱基的不同排列荷载遗传信息。通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变。作为基因表达(geneexpression)的模板,使其所携带的遗传信息通过各种RNA和蛋白质在细胞内有序合成而表现出来。

基因的功能利用碱基的不同排列荷载遗传信息。基因的功能单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为基因组构(geneorganization)。

与基因功能相关的结构编码区序列(codingregionsequence

)非编码序列(non-codingsequence)基因表达需要的调控区(regulatoryregion)序列,包括启动子(promoter)、增强子(enhancer)等。在细胞内表达为蛋白质或功能RNA的DNA序列单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称一、真核基因的基本结构编码蛋白质或RNA的编码序列。非编码序列,包括编码区两侧的调控序列和编码序列间的间隔序列。一、真核基因的基本结构编码蛋白质或RNA的编码序列。非编码序真核基因结构不连续,为断裂基因(splitgene)。真核基因结构外显子(exon);在基因序列中,出现在成熟mRNA分子上的序列。内含子(intron):外显子之间、与mRNA剪接过程中被删除部分相对应的间隔序列。真核基因结构不连续,为断裂基因(splitgene)。真核真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因。断裂基因(splitgene)CABD编码区A、B、C、D非编码区真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续周芷(LouiseT.Chow)1977年《细胞》杂志第11卷第4期周芷(LouiseT.Chow)真核生物绝大部分编码蛋白质的基因都有内含子。编码rRNA和一些tRNA的基因也都有内含子。内含子的数量和大小决定了真核基因的大小。不同种属中,外显子序列通常比较保守,而内含子序列则变异较大。外显子与内含子接头处有一段高度保守的序列(大多数内含子以GT为5’端开始,末端为AG-OH-3’),这一共有序列是真核基因中RNA剪接的识别信号。真核生物绝大部分编码蛋白质的基因都有内含子。编码rRNA和一基因的5端称之为上游,3端称为下游基因序列中开始RNA链合成的第一个核苷酸所对应的碱基记为+1,此碱基上游的序列记为负数,下游的序列记为正数。基因的5端称之为上游,3端称为下游二、基因编码区编码多肽链和特定的RNA分子基因的编码序列决定其编码产物的序列和功能。编码序列中一个碱基的改变或突变,可能使基因功能发生重要的变化。相同的DNA序列因起始位点的变化或不同的剪接方式而编码不同的蛋白质多肽链。基因编码区中的DNA碱基序列决定特定的成熟RNA分子的序列,即DNA的一级结构决定着其转录产物RNA分子的一级结构。二、基因编码区编码多肽链和特定的RNA分子基因的编码序列决三、调控序列参与真核基因表达调控位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的DNA序列,又称旁侧序列(flankingsequence)。基因的调控区(顺式作用元件)三、调控序列参与真核基因表达调控位于基因转录区前后,对基因转录起始点TATA盒CAAT盒GC盒增强子AATAAA剪接加尾转录终止点修饰点外显子翻译起始点内含子OCT-1OCT-1:ATTTGCAT八聚体+1结构基因启动子上游启动子元件转录起始点TATA盒CAAT盒GC盒增强子AATAAA剪接加启动子上游调控元件增强子加尾信号细胞信号反应元件顺式作用元件(cis-actingelements)启动子顺式作用元件(cis-actingelements)1.启动子提供转录起始信号启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体的序列。多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。少数启动子(如编码tRNA基因的启动子)位于转录起始点的下游,这些DNA序列可以被转录。1.启动子提供转录起始信号启动子是DNA分子上能够介导R真核生物有3类启动子,分别对应于细胞内存在的三种不同的RNA聚合酶和相关蛋白质。rRNAmRNA5SrRNA,tRNA真核生物有3类启动子,分别对应于细胞内存在的三种不同的RNA能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。通常数个增强子序列形成一簇。有时增强子序列也可位于内含子之中。不同的增强子序列结合不同的调节蛋白。2.增强子增强邻近基因的转录增强子是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种沉默子(silencer)是抑制基因转录的特定DNA序列,当其结合一些反式作用因子(repressors)时对基因的转录起阻遏作用,使基因沉默。REST/NSRF----RE-1/NRSE:silencingofneuronalgenes3.沉默子是负调节元件沉默子(silencer)是抑制基因转录的特定DNA序列,当4.绝缘子是异染色质扩散的屏障绝缘子(insulator)是具有独立调节作用的染色质结构,可位于增强子或沉默子与启动子之间,阻止其对启动子的增强或抑制作用(enhancer-blockinginsulators);位于活化基因与异染色质之间,阻止异染色质扩展对活化基因造成的抑制作用(barrierinsulators)

4.绝缘子是异染色质扩散的屏障绝缘子(insulator)Enhancer-blockinginsulatorsBarrierinsulatorsEnhancer-blockinginsulatorsBaThechickenβ-globinlocusThechickenβ-globinlocus真核基因组的结构与功能

第二节TheStructureandFunctionofEukaryoteGenome真核基因组的结构与功能第二节TheStructurea基因组:细胞或生物体的一套完整单倍体遗传物质的总和。基因组:细胞或生物体的一套完整单倍体遗传物质的总和。一、真核基因组具有独特的结构基因的编码序列所占比例远小于非编码序列。高等真核生物基因组含有大量的重复序列,真核基因组中存在多基因家族和假基因。大多基因具有可变剪接,80%的可变剪接会使蛋白质的序列发生改变。基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体。结构特点:一、真核基因组具有独特的结构基因的编码序列所占比例远小于非编二、真核基因组中存在大量重复序列高度重复序列(highlyrepetitivesequence)中度重复序列(moderatelyrepetitivesequence)单拷贝序列(singlecopysequence)或低度重复序列二、真核基因组中存在大量重复序列高度重复序列(highly(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般由2~10bp组成,成串排列,在人基因组中约占5%~6%。重复频率可达103以上,不编码蛋白质或RNA。反向重复序列(invertedrepeatsequence)卫星DNA(satelliteDNA)两个相同顺序的互补拷贝在同一DNA链上反向排列而成,重复单位长度约300bp,多数散在于基因组中。分类:(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般参与复制水平的调节

存在于DNA复制起点区的附近,是一些蛋白质(包括酶)的结合位点。参与基因表达的调控

可以转录到核内不均一RNA分子中,有些反向重复序列可以形成发夹结构,有助于稳定RNA分子。参与染色体配对

如卫星DNA成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。功能:参与复制水平的调节功能:(二)中度重复序列重复数十至数千次,大多数与单拷贝基因间隔排列。短分散重复片段(shortinterspersedrepeatsequences,SINEs)长分散重复片段

(longinterspersedrepeatsequences,LINEs)平均长度约300bp~500bp,与长度约为1000bp的单拷贝序列间隔排列。拷贝数可达数十万。如Alu家族、KpnI家族、Hinf家族。平均长度为3500bp~5000bp,与长度约为13000bp的单拷贝序列间隔排列。(二)中度重复序列重复数十至数千次,大多数与单拷贝基因间隔排每个成员的长度约300bp。每个单位长度中一个限制性内切酶Alu的切点(AG↓CT),将其切成长130bp和170bp的两段。Alu家族仅次于Alu家族的第二大家族,重复序列中含有限制性内切酶KpnⅠ的位点呈散在分布,拷贝数约为3000~4800个KpnI家族以319bp长度的串联重复存在于人基因组中重复序列中含有限制性内切酶HinfI的位点。Hinf家族短分散重复片段每个成员的长度约300bp。Alu家族仅次于Alu家族的第Karyotypefromafemalehumanlymphocyte(46,XX).ChromosomeswerehybridizedwithaprobeforAluelements(green)andcounterstainedwithTOPRO-3(red).ThemembersoftheAlufamily,maybemobileelements,capableofjumpingintoandoutofvarioussiteswithinthegenomeTheinsertionofAlusequencesintoagenecausesneurofibromatosis,whichisanautosomaldominantdisorder.Thenervetissuegrowstumors(neurofibromas)thatmaybebenignandmaycauseseriousdamagebycompressingnervesandothertissuesKaryotypefromafemalehumanrRNA基因重复序列属于中度重复序列各重复单位中的rRNA基因都是相同的。rRNA基因集中成簇存在,这样的区域称为rDNA区。人类的rRNA基因位于13、14、15、21和22号染色体的核仁组织区,每个核仁组织区平均含有50个rRNA基因的重复单位。5SrRNA基因全部位于1号染色体,每个单倍体基因组约有1000个5SrRNA基因。rRNA基因重复序列属于中度重复序列各重复单位中的rRNA基MicrosatelliteRepeatSequencesOnecategoryofrepeatsequences:microsatellitesequences

consistof2–6bprepeatedupto50timesAC(mostcommonly),CG,AT,andCATheACrepeatsequencesoccurat50,000–100,000locationsinthegenomeThisisaheritabletraitandusefulinconstructinggeneticlinkagemapsMicrosatelliteRepeatSequenceTrinucleotidesequencesthatincreaseinnumber(micro-satelliteinstability)cancausedisease.Unstablep(CGG)nrepeatsequenceisassociatedwiththefragileXsyndromeOthertrinucleotiderepeatsthatundergodynamicmutation(usuallyanincrease)areassociatedwithHuntington‘schorea(CAG),myotonicdystrophy(CTG),spinobulbarmuscularatrophy(CAG).

TrinucleotidesequencesthatiFragileXsyndromeisassociatedwiththeexpansionoftheCGGtrinucleotiderepeataffectingtheFragileXmentalretardation1(FMR1)geneontheXchromosome,resultinginafailuretoexpressthefragileXmentalretardationprotein(FMRP),whichisrequiredfornormalneuraldevelopment.Physicalcharacteristics:anelongatedface,largeorprotrudingears,andlargetestesBehavioralcharacteristics:stereotypicmovements(e.g.hand-flapping),andsocialanxietyFragileXsyndromeisassociatMyotonicdystrophyisachronic,slowlyprogressing,highlyvariable,inheritedmultisystemicdisease.TheaffectedgeneiscalledDMPK,whichcodesformyotonicdystrophyproteinkinase,aproteinexpressedpredominantlyinskeletalmuscle.Thegeneislocatedonthelongarmofchromosome19.thereisanexpansionofthecytosine-thymine-guanine(CTG)tripletrepeatintheDMPKgene.40-year-oldpatientwithmyotonicdystrophypresentingwithbilateralcataractsandcompleteheartblock.Myotonicdystrophyisachroni在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。(三)单拷贝序列(低度重复序列)在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。三、真核基因组中存在大量的多基因家族与假基因多基因家族是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。基因家族成簇地分布在某一条

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论