




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因结构及基因组学植物基因工程1第1页,共82页,2023年,2月20日,星期四第一节基因结构与功能2第2页,共82页,2023年,2月20日,星期四什么是基因?孟德尔在1866年发表的《植物杂交的试验》一文中提出了“遗传因子”的概念。1909年,丹麦人约翰逊将孟德尔文章中的遗传因子称为基因,于是,基因的概念便成了遗传学中的一个基本概念。1910年,美国人摩尔根发表了关于果蝇性连锁遗传的论文,将一个基因和一个具体的染色体的行为联系起来。DNA是遗传物质。DNA碱基的突变导致表型的改变。基因的本质就是DNA第3页,共82页,2023年,2月20日,星期四基因的概念基因(遗传因子)是遗传的基本单元,是DNA或RNA分子上具有遗传信息的特定核苷酸序列。基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。基因储存着生命孕育、生长、凋亡过程的全部信息,通过复制、转录、表达,完成生命繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。第4页,共82页,2023年,2月20日,星期四基因的概念(1)基因是原核、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位。(2)基因是DNA分子中含有特定遗传信息的一段核苷酸序列,是遗传物质的最小功能单位。(3)对于编码蛋白质的结构基因来说,基因是决定一条多肽链的DNA片段。第5页,共82页,2023年,2月20日,星期四根据是否具有转录和翻译功能可以分为三类第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因第二类是只有转录功能而没有翻译功能的基因,包括tRNA基因和rRNA基因第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因第6页,共82页,2023年,2月20日,星期四原核细胞真核细胞第7页,共82页,2023年,2月20日,星期四原核生物无细胞核,染色体散在细胞质的核区中。一般只有一个染色体,即一个DNA或RNA分子,Gene
是连续的。大多数是双链环状,少数为单链、线状;如:大肠杆菌,双链环状DNA分子,3000~4000个基因,4.2x106bp,已经定位900多个基因(一)原核与真核生物基因比较第8页,共82页,2023年,2月20日,星期四真核生物有细胞核,染色体存在于细胞核中。Gene结构复杂,断裂基因,3~4万个Gene;Gene大小差别很大。β珠蛋白基因(1700bp)=3个外显子+2个内含子。DMD基因(2300kb)79个外显子,
78个内含子。(迄今认识的最大的基因)第9页,共82页,2023年,2月20日,星期四1、外显子和内含子在结构基因中,编码序列称为外显子(exon),表达多肽链部分。非编码序列称为内含子(Intron),又称插入序列。β珠蛋白基因(1700bp)=3个外显子+2个内含子。DMD基因(2300kb)=79个外显子+78个内含子。(迄今认识的最大的基因)真核生物内含子和外显子不是完全固定不变的,有时同一DNA链上的某一段DNA序列,当它作为编码某一多肽链的基因时是外显子,而作为编码另一多肽链时,则是内含子。这样,同一基因却可以转录两种或两种以上的mRNA。真核生物某些结构Gene没有内含子,如组蛋白Gene,干扰素Gene等。它们多以基因簇形式存在,大多数的酵母结构Gene也没有内含子。10第10页,共82页,2023年,2月20日,星期四hnRNA:heterogeneousRNA11第11页,共82页,2023年,2月20日,星期四5`GT——AG3`法则
在每个外显子和内含子的接头区都是一段高度保守的共有序列,内含子的5`端是GT,3端是AG,这种接头方式称为GT-AG法则,普遍存在于真核生物中,是RNA剪接的识别信号,转录后的前体RAN中的内含子剪接位点。12第12页,共82页,2023年,2月20日,星期四13第13页,共82页,2023年,2月20日,星期四2、侧翼序列与调控序列
每个结构基因的第一个和最后一个外显子的外侧,都有一段不被转录的非编码区,称为侧翼序列(Flankingsequence)。它是基因的调控序列,对基因的有效表达起调控作用,包括:启动子、增强子、终止子等。14第14页,共82页,2023年,2月20日,星期四2.1启动子
启动子(
Promoter)是一段特定的核苷酸序列,位于Gene转录起始点上游的100bp范围内,是RNA聚合酶的结合部位,能促进转录过程。Promoter决定DNA中的转录链。TATA框(TATABox)是一段高度保守序列(TATAA),位于转录起始点上游-25~-30bp(原核生物-10区)。TATA框与转录因子TFII结合,再与RNA聚合酶II形成复合物,从而准确地识别转录起始位置,对转录水平有定量效应。。15第15页,共82页,2023年,2月20日,星期四CAAT框(CAATBox):是一段保守序列(CCAAT),位于转录起始点上游-70~-80bp(原核生物-35区),转录因子CTF识别位点并与之结合,激活转录。GC框(GCBox):顺序为GGCGGG,有两个拷贝,位于CAATBox两侧,与转录因子SP1结合。(SP1有锌指区可以与DNA结合,在N端有激活转录的作用)GC框有激活转录的功能。16第16页,共82页,2023年,2月20日,星期四17第17页,共82页,2023年,2月20日,星期四18第18页,共82页,2023年,2月20日,星期四2.2增强子增强子(Enhancer)能强化转录起始的一段DNA序列。1981年Benerji在SV40噬菌体DNA中发现一个140bp的序列,它能大大提高SV40DNA/兔β—血红蛋白融合基因的表达水平,这是发现的第一个增强子。它位于SV40早期基因的上游,由两个正向重复序列组成,每个长72bp。目前发现的增强子多半是重复序列,一般长50bp,通常有一个8—12bp组成的“核心”序列,如SV40增强子的核心序列是5’—GGTGTGGAAAG—3’。19第19页,共82页,2023年,2月20日,星期四特点:在任意位置都有效——增强子提高同一条DNA链上基因转录效率,可以远距离作用,通常可距离1-4kb、个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。无方向性——增强子作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。而将启动子倒就不能起作用,可见增强子与启动子是很不相同的。有组织特异性——例如:Beta珠蛋白Gene增强子是由串联重复的两个72bp长的相同序列组成,位于转录起点上游-1400bp或下游3300bp处,均可增强转录效率(活性)200倍。增强子在转录起始点的上下游一定范围内增强转录效率。作用可以是5’~3’,也可以是3’~5’方向。20第20页,共82页,2023年,2月20日,星期四2.3终止子终止子(Terminator)由一段回文序列以及特定的序列(PolyA)5’--AATAAA--3’组成。回文序列为转录终止号。PolyA为附加信号。终止子为反向重复序列,是RNA聚合酶停止工作的信号,反向重复序列转录后,可以形成发夹式结构,并且形成一串U。发夹式结构阻碍了RNA聚合酶的移动。一串U的U与DNA模板中的A的结合不稳定,从模板上脱落下来,终止转录。21第21页,共82页,2023年,2月20日,星期四调控序列(RegulatorSequence)包括启动子,增强子和终止子均属于基因的顺式调控因子(顺式作用元件),是人类Gene组中的一些特殊序列,起调控基因表达的作用。反式作用因子:是指能直接或间接地识别或结合在各类顺式作用元件核心序列上参与调控靶基因转录效率的蛋白质,如TFII、CTF、SP1等。2.4顺式作用原件和反式作用因子因子22第22页,共82页,2023年,2月20日,星期四第二节基因组第23页,共82页,2023年,2月20日,星期四基因组中不同的区域具有不同的功能有些区域编码蛋白质的结构基因有些区域是复制及转录的调控信号有些区域的功能尚不清楚基因组(genome):单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。第24页,共82页,2023年,2月20日,星期四Winkler在1920年首次提出基因组(genome)一词,意为gene与chromosome的组合。目前在不同的学科中,对基因组含义的表述有所不同,概括为如下:①从细胞遗传学的角度来看,基因组是指一个生物物种单倍体的所有染色体数目的总和;②从经典遗传学的角度来看,基因组是一个生物物种的所有基因的总和;③从分子遗传学的角度来看,基因组是一个生物物种所有的不同核酸分子的总和;④从现代生物学的角度来看,基因组是指导一个生物物种的结构和功能的所有遗传信息的总和,包括全部的基因和调控元件等核酸分子。第25页,共82页,2023年,2月20日,星期四1.基因组较小,通常只有一个环形或线形的DNA分子;2.通常只有一个DNA复制起点;3.非编码区主要是调控序列;4.基因密度非常高,基因组中编码区大于非编码区;5.结构基因没有内含子,多为单拷贝,结构基因无重叠现象;6.重复序列很少,重复片段为转座子;7.基因组的大部分序列是用来编码蛋白质的,基因之间的间隔序列很短;8.功能相关的序列常串连在一起,由共同的调控元件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成,这种结构称操纵子。原核生物基因组特点第26页,共82页,2023年,2月20日,星期四1.基因组较大。真核生物的基因组由多条线形的染色体构成,每条染色体有一个线形的DNA分子,每个DNA分子有多个复制起点;2.不存在操纵子结构。真核生物的同一个基因簇的基因,不会像原核生物的操纵子结构那样,转录到同一个mRNA上;3.存在大量的重复序列。真核生物的基因组里存在大量重复序列,通过其重复程度可将其分成高度重复序列、中度重复序列、低度重复序列和单一序列;4.有断裂基因。大多数真核生物为蛋白质编码的基因都含有“居间序列”,即不为多肽编码,其转录产物在mRNA前体的加工过程中被切除的成分;5.真核生物基因转录产物为单顺反子;6.功能相关基因构成各种基因家族。真核生物基因组特点第27页,共82页,2023年,2月20日,星期四核基因组——是单倍体细胞核内的全部DNA分子;线粒体基因组——线粒体所包含的全部DNA分子(双链环状,少数线状);叶绿体基因组——则是一个叶绿体所包含的全部DNA分子(双链环状)。植物基因组第28页,共82页,2023年,2月20日,星期四(1)C值矛盾C值通常指一种生物单倍体基因组DNA的总量。ThetotalamountofDNAinthegenomeofhaploidisacharacteristicofeachlivingspeciesknownasitsMaximumCvalue
(单倍体基因组总DNA的含量)
最大C值(MaximumCvalue)ThetotalamountofDNAforencodingthegenesinformationistermeditsMinimumcvalue(编码基因信息的总DNA含量)
最小C值(Minimumcvalue)第29页,共82页,2023年,2月20日,星期四霉菌藻类G+细菌G-细菌显花植物鸟类哺乳类爬行类两栖类硬骨鱼类软骨鱼类棘皮类甲壳类昆虫类软体动物蠕虫类真菌支原体A生物体进化程度与大
C值不成明显正相关B亲缘关系相近的生物间大C值相差较大
C一种生物内大C值与小c值相差极大(人体c=C/10)
第30页,共82页,2023年,2月20日,星期四,内含子、启动子第31页,共82页,2023年,2月20日,星期四遗传图谱:以遗传学距离(cM,即每次减数分裂的重组频率为1%)为图距的基因组图。(2)基因组的四大图谱物理图谱:物理图谱描绘DNA上可以识别的标记的位置和相互之间的距离(以碱基对的数目为衡量单位)。序列图谱:通过测序得到基因组的序列图谱转录图谱:是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。第32页,共82页,2023年,2月20日,星期四第33页,共82页,2023年,2月20日,星期四球形芽孢杆菌C3-41菌株34第34页,共82页,2023年,2月20日,星期四(3)线粒体基因组和叶绿体基因组大多数细胞器DNA是闭合环状的。1)线粒体的基因组(mtDNA)脯乳动物的mtDNA为16.5Kb2)叶绿体的基因组(cpDNA)植物特有,大约121-155Kb第35页,共82页,2023年,2月20日,星期四(4)基因家族1)基因家族(genefamily):真核生物基因组中来源相同,结构和功能相关的基因聚集在一起形成基因家族。根据分布形式分基因簇和散布的基因家族:基因簇(genecluster)基因家族的各个成员紧密成簇排列成大段的串联重复单位,分布在某一条染色体的特殊区域;它们可同时发挥作用,合成某些蛋白质。如组蛋白基因家族聚集在第7号染色体长臂3区内。组蛋白基因家族第36页,共82页,2023年,2月20日,星期四第三节基因结构预测与功能注释第37页,共82页,2023年,2月20日,星期四基因组序列cDNA序列编码区预测CodonbiasGCContent限制性酶切位点基因结构分析选择性剪切转录调控因子序列比对功能注释KEGGGO系统发育树蛋白质序列翻译蛋白质理化性质二级结构预测结构域分析重要信号位点分析三级结构预测(1)基因组功能分析第38页,共82页,2023年,2月20日,星期四(2)植物基因的主要结构特征第39页,共82页,2023年,2月20日,星期四40基因结构分析常用软件开放读码框GENSCANGENOMESCANCpG岛CpGPlot启动子/转录起始位点PromoterScan转录终止信号POLYAH密码子偏好分析CodonWmRNA剪切位点NETGENE2Spidey选择性剪切ASTD(3)基因结构分析第40页,共82页,2023年,2月20日,星期四1、开放阅读框的识别开放阅读框(openreadingframe,ORF)
是一段起始密码子和终止密码子之间的碱基序列ORF是潜在的蛋白质编码区第41页,共82页,2023年,2月20日,星期四42基因开放阅读框/基因结构分析识别工具ORFFinder/gorf/gorf.htmlNCBI通用BestORF/berry.phtml?topic=bestorf&group=programs&subgroup=gfindSoftberry真核GENSCAN/GENSCAN.htmlMIT脊椎、拟南芥、玉米GeneFinder/tools/genefinder/Zhanglab人、小鼠、拟南芥、酵母FGENESH/berry.phtml?topic=fgenesh&group=programs&subgroup=gfindSoftberry真核(基因结构)GeneMark/GeneMark/eukhmm.cgiGIT原核GLIMMER/genomes/MICROBES/glimmer_3.cgi/software/glimmer
Maryland原核Fgenes/berry.phtml?topic=fgenes&group=programs&subgroup=gfindSoftberry人(基因结构)FgeneSV/berry.phtml?topic=virus&group=programs&subgroup=gfindvSoftberry病毒Generation/generation/ORNL原核FGENESB/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindbSoftberry细菌(基因结构)GenomeScan
/genomescan.html
MIT脊椎、拟南芥、玉米GeneWise2http://www.ebi.ac.uk/Wise2/EBI人GRAIL/grailexp/ORNL人、小鼠、拟南芥、果蝇第42页,共82页,2023年,2月20日,星期四43ORF识别:GENSCAN/GENSCAN.html结果返回到邮箱(可选)提交序列提交序列文件运行GENSCAN显示氨基酸或CDS序列序列名称(可选)是否显示非最优外显子选择物种类型第43页,共82页,2023年,2月20日,星期四2、转录调控序列分析
CpG岛、启动子和转录终止信号区域的预测第44页,共82页,2023年,2月20日,星期四CpG岛的预测CpG岛常位于真核生物基因转录起始位点,GC含量>50%,长度>200bp的一段DNA序列。第45页,共82页,2023年,2月20日,星期四46CpGIsland分析常用软件CpGIsland/cpgislands2/cpg.aspxWebCpGPlothttp://www.ebi.ac.uk/emboss/cpgplot/index.htmlWebCpGfinder/berry.phtml?topic=cpgfinder&group=programs&subgroup=promoterWebCpGi130/CpG130.dowebCpGproDhttp://pbil.univ-lyon1.fr/software/cpgprod_query.htmlweb第46页,共82页,2023年,2月20日,星期四提交序列文件提交序列参数选项CpG岛的预测:CpGPlothttp://www.ebi.ac.uk/emboss/cpgplot/index.html第47页,共82页,2023年,2月20日,星期四启动子区结构启动子(Promoter)
位于结构基因5’端上游,能活化RNA聚合酶,使之与模板DNA结合并具有转录起始的特异性转录起始位点(Transcriptionstartsite,TSS)PYCAPY(嘧啶)核心启动子元件(Corepromoterelement)TATAbox,Pribnowbox
(TATAA)上游启动子元件(Upstreampromoterelement,UPE)CAATbox,GCbox,SP1,Otc增强子(Enhancer)PyCAPyTATAATGC区CAAT区mRNA+1-40-25-110增强子上游启动子元件,UPE核心启动子元件转录起始位点第48页,共82页,2023年,2月20日,星期四PromoterScan/molbio/proscan/WebPromoser/zlab/PromoSer/WebNeuralNetworkPromoterPrediction/seq_tools/promoter.htmlWebSoftberry:BPROM,TSSP,TSSG,TSSW/berry.phtml?topic=index&group=programs&subgroup=promoterWebMatInspectorhttp://www.gene-regulation.de/WebRSAThttp://rsat.ulb.ac.be/rsat/WebCister/~mfrith/cister.shtmlWeb启动子结合位点分析常用软件第49页,共82页,2023年,2月20日,星期四启动子预测:PromoterScan/molbio/proscan/提交序列第50页,共82页,2023年,2月20日,星期四PromoterScan输出结果找到的TATAbox和转录起始位点预测可能的转录因子转录因子在提交序列中的位置第51页,共82页,2023年,2月20日,星期四转录终止信号上游作用元件:AAUAAA下游作用元件:GCrich二重对称区、UUUUUUAAUAAACAAAAAAAAAAAAA成熟mRNA5’3’AAUAAACAGUmRNA前体5’3’第52页,共82页,2023年,2月20日,星期四转录终止信号预测:POLYAH/berry.phtml?topic=polyah&group=programs&subgroup=promoter
提交序列文件提交序列第53页,共82页,2023年,2月20日,星期四polyA位置POLYAH输出结果第54页,共82页,2023年,2月20日,星期四基因密码子偏好性第55页,共82页,2023年,2月20日,星期四561.研究蛋白质结构功能中的作用2.在表达外源基因方面的作用3.在生物信息学研究中的作用第56页,共82页,2023年,2月20日,星期四基因密码子偏好性:CodonW粘帖目的序列密码子表的选择如需计算FOP/CBI选择相应物种如需计算CAI选择相应物种http://mobyle.pasteur.fr/cgi-bin/portal.py?form=codonw第57页,共82页,2023年,2月20日,星期四参数选择计算所有指数计算有效密码子数计算GC含量计算GC3s含量计算同义密码子数量计算同义密码子第三位碱基组成密码子总数第58页,共82页,2023年,2月20日,星期四59密码子使用频率CodonW结果界面第59页,共82页,2023年,2月20日,星期四内含子/外显子剪接位点识别如何分析核酸序列中的外显子组成?通过对特征序列(GT-AG)的分析进行直接的预测基因预测软件(NetGene2)与相应的基因组序列比对,分析比对片段的分布位置(Spidey)第60页,共82页,2023年,2月20日,星期四http://www.cbs.dtu.dk/services/NetGene2/提交序列选择物种内含子/外显子剪接位点识别:NetGene2第61页,共82页,2023年,2月20日,星期四NetGene2输出结果供体位点受体位点可信度
相位第62页,共82页,2023年,2月20日,星期四mRNA剪接位点识别:SpideyNCBI开发的在线匹配程序用于mRNA序列同基因组序列比对分析/spidey第63页,共82页,2023年,2月20日,星期四Spidey同源序列的获得:序列比对通过BLAST进行序列比对,找到可能同源的相似性好的一系列mRNA序列。BLAST比对到的三条mRNA序列第64页,共82页,2023年,2月20日,星期四输入基因组序列或序列数据库号输入相似性序列判断用于分析的序列间的差异,并调整比对参数不受默认内含子长度限制。默认长度:内部内含子为35kb,末端内含子为100kb比对阈值选择物种输出格式选择第65页,共82页,2023年,2月20日,星期四66Spidey输出结果第一条蓝色序列为基因组序列,橘黄色为外显子外显子对应于基因组上的起始/结束位置外显子对应于mRNA/cDNA上的起始/结束位置供体、受体位点外显子长度一致性百分比错配和gap外显子序号序列联配结果第66页,共82页,2023年,2月20日,星期四可能的选择性剪切体GENSCAN与Spidey结果比较第67页,共82页,2023年,2月20日,星期四可变剪接(Alternativesplicing)分析可变剪接是调控基因表达的重要机制了解不同物种、细胞、发育阶段、环境压力下基因的调控表达机制第68页,共82页,2023年,2月20日,星期四可变剪接的类型第69页,共82页,2023年,2月20日,星期四70查询可变剪接相关的网站http://www.ebi.ac.uk/astd/main.html综合http://splicenest.molgen.mpg.de/综合/new_alt_exon_db2/综合.tw/.au/altExtron人/~kent/intronerator/altsplice.html线虫/tdb/e2k1/ath1/altsplicing/splicing_variations.shtml拟南芥从已知基因的功能推测剪接机制第70页,共82页,2023年,2月20日,星期四选择性剪接查询:ASTD数据库
http://www.ebi.ac.uk/astd/main.html
输入基因名称选择物种类型第71页,共82页,2023年,2月20日,星期四ASTD数据库检索结果:基因描述信息
导出序列文件第72页,共82
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度林业产业园区林地转让合同
- 2025年大流量罗茨鼓风机合作协议书
- 入股餐馆合同范例
- 公司加农户养鸭合同范例
- led合作合同范例
- 养殖场用工合同范本
- 南宁联锁块施工方案
- 个人房屋置换合同范本
- 江西钢桥施工方案
- 停车场系统的施工方案
- 房地产 -旭辉第五代住宅产品手册 H系全产品结构及标准化体系-(上)
- 养老机构认知症老人非药物干预疗法操作指南
- 一例结肠穿孔手术患者护理查房
- 《铁路职业道德》课件-3.1 铁路职业意识
- 生物材料伴我行 知到智慧树网课答案
- 【碧桂园项目成本控制存在的问题及优化建议探析11000字(论文)】
- 文档-火灾报警器中英文文献翻译-基于单片机的火灾探测和监控系统-单片机
- 2024年河北省初中学业水平适应性测试生物学试卷
- 《鸿门宴》(教学课件)- 统编版高中语文必修下册
- 标识标牌制作及安装项目技术方案
- 医疗器械物价收费申请流程
评论
0/150
提交评论