版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
问题基因组序列所包含的全部遗传信息是什么?基因组作为一个整体如何行使其功能?用什么方法寻找基因,研究基因地功能呢?现在是1页\一共有82页\编辑于星期五1.寻找基因1.1根据开放读框预测基因⑴起始密码子ATG第一个ATG的确定(依据Kozak规则);Kozak规则是基于已知数据的统计结果.所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律.现在是2页\一共有82页\编辑于星期五Kozak规则:若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下:(1)第4位的偏好碱基为G;(2)ATG的5’端约15bp范围的侧翼序列内不含碱基T;(3)在-3,-6和-9位置,G是偏好碱基;(4)除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基。现在是3页\一共有82页\编辑于星期五信号肽分析软件(SignalPhttp://www.cbs.dtu.dk/services/signalP)
把预测过程中证实含完整mRNA5’端的序列翻译为蛋白序列;然后用SignalP软件对前50个氨基酸序列(从第一个ATG对应的甲硫氨酸Met开始)进行评估,如果SignalP分析给出正面结果,则测试序列有可能为信号肽;⑵信号肽分析现在是4页\一共有82页\编辑于星期五⑶终止密码子
终止密码子:TAA,TAG,TGAGC%=50%终止密码子每64bp出现一次;GC%>50%终止密码子每100-200bp出现一次;由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF不少于100个密码子。现在是5页\一共有82页\编辑于星期五⑷3’端的确认
3’端的确认主要根据Poly(A)尾序列,若测试DNA片段不含Poly(A)序列,则根据加尾信号序列“AATAAA”和BLAST同源性比较结果共同判断。现在是6页\一共有82页\编辑于星期五⑸非编码序列、内含子高等真核生物ORF阅读的复杂性:基因间存在大量的非编码序列(人类基因组中是70%)绝大多数基因含有非编码的内含子。高等真核生物多数外显子长度少于100个密码子,有的不到50个密码子甚至更少;不能根据ORF长度判断读框的准确性。现在是7页\一共有82页\编辑于星期五编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。不同种属间使用同义密码的频率有很大差异:如人类基因中,
丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少苏氨酸(Thr)密码子多为ACA,ACC或ACT,而ACG很少⑹密码子偏爱性现在是8页\一共有82页\编辑于星期五⑺密码子偏爱性高等植物207个基因单子叶植物53个,6个单子叶种群,18种氨基酸有16种氨基酸的密码子摇摆碱基为G+C双子叶植物154个,35个双子叶种群,只有7种氨基酸的摇摆碱基是G+C,其余均为A+T密码子偏倚codonbias,原因不明。现在是9页\一共有82页\编辑于星期五⑻外显子-内含子边界外显子和内含子的边界有一些明显的特征:如:内含子的5‘端或称供体位(donorsite)常见的顺序为5’-AG↓GTAAGT-3’;3’端又称受体位(acceptorsite),多为5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);但是由于边界序列常有例外,仅适用于一定范围。现在是10页\一共有82页\编辑于星期五⑼上游控制序列几乎所有基因(或操纵子)上游都有调控序列,它们可与DNA结合蛋白作用,控制基因表达。
通过同源性比较来预测mRNA的5’端,最常用的与转录起始位点相关的数据库是真核启动子数据库(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http://www.epd.unil.ch/)。
另外个别生物基因组的特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有CpG岛。现在是11页\一共有82页\编辑于星期五CG岛有1Kb,CG含量高,56%的人类基因与上游的CG岛相连。主要用于原核生物。现在是12页\一共有82页\编辑于星期五
⑽内含子和外显子序列差异内含子受选择压力小,突变多。由于碱基C到A,内含子A/T比例高内含子A/T比例高,所以终止密码子出现的频率高。现在是13页\一共有82页\编辑于星期五
⑾软件预测采用NCBI的ORF预测软件(ORFfinder:/gorf/orfig.cgi)判断ORF的可能范围。现在是14页\一共有82页\编辑于星期五基因注释软件Genscan——重于信号指令:起始密码、终止密码、剪接受体位和供体位序列等FgeneSH——重于内容指令:密码子使用偏好、内含子外显子的差异等TWINSCAN和SGP2——根据相似性和一致性现在是15页\一共有82页\编辑于星期五基因注释软件缺点外显子注释的准确率<80%。误拼和误拆错误较多。容易忽略结构较小的基因,特别是基因内基因。线虫基因的注释19477个软件预测11984个克隆验证,未能预测到的cDNA和EST为4365个现在是16页\一共有82页\编辑于星期五包括内容:转录成mRNA的序列,外显子和内含子的位置,基因编码的蛋白质顺序。脊椎动物的130bp的外显子长度平均,68-208的占65%,10%的小于60bp,35%的人类基因组序列存在非编码外显子,注释容易遗漏,热别是保守性不强的外显子。目前的软件均无法注释mRNA的53非编码区的边界。现在是17页\一共有82页\编辑于星期五1.2同源查询途径
通过已存入数据库中的基因顺序与待查的基因组序列进行比较,从中查找可与之匹配的碱基顺序及其比例,用于界定基因的方法称为同源查询。
现在是18页\一共有82页\编辑于星期五同源性包括编码和非编码序列,相近的物种,老鼠和人,油菜和拟南芥具有90%以上的基因彼此共有。编码序列,外显子组成,调控序列,相似之处进化的保守性。现在是19页\一共有82页\编辑于星期五相似性有如下几种情况:
ADNA序列某些片段完全相同;B开放读码框(ORF)排列类似,如有长外显子;C开放读码框翻译成氨基酸序列的相似性;D模拟多肽高级结构相似同源基因:氨基酸的一致性和相似性>25%现在是20页\一共有82页\编辑于星期五功能和结构相似的直向同源基因成员,起源相同,存在保守序列。还有就是同一物种的家族基因,基因重复造成的。可综合考虑也可单项考虑,如果一个基因没有同源序列,又符合一些条件,试验方法证实。现在是21页\一共有82页\编辑于星期五同源性:homology起源于同一祖先但序列已经发生变异的序列,分布在不同物种间的同源基因,只有是与非的区别。一致性:identity同源DNA序列的同一碱基位置上相同的碱基成员,或者蛋白质中同一氨基酸位置相同的氨基酸成员的比例,用%表示。相似性:similarity同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。比较氨基酸和基因的同源性?现在是22页\一共有82页\编辑于星期五分子杂交可确定DNA片段是否含有表达顺序Northernblot:指将待测DNA样品标记后与RNA杂交,以判断RNA中是否含有DNA的转录产物。但在操作中存在一些问题1.3试验确认基因现在是23页\一共有82页\编辑于星期五1977年J.C.Alwin首创Northernblotting
现在是24页\一共有82页\编辑于星期五问题解决方案A某一基因的转录产物进行可变剪接或该基因为某一多基因家族的成员时,会出现多个杂交带设计其他实验区分现在是25页\一共有82页\编辑于星期五现在是26页\一共有82页\编辑于星期五心肌特异性蛋白现在是27页\一共有82页\编辑于星期五Troponin
T是心肌特异性蛋白,主要用于心肌梗塞等多种心脏病的研究现在是28页\一共有82页\编辑于星期五问题解决方案B基因的表达具有组织特异性及发育阶段的差别,而选择的RNA样品中不一定含有该基因产物尽可能多地收集各种不同发育时期及不同组织器官的RNA现在是29页\一共有82页\编辑于星期五问题解决方案C某些基因产物丰度极低或不易提取适当提高RNA上样量,或先以已知的DNA序列设计引物从mRNA中扩增基因产物现在是30页\一共有82页\编辑于星期五C基因表达产物丰度的问题拟Northern杂交——根据已知的DNA顺序设计引物,从mRNA群体中扩增基因产物,再以DNA为探针与之杂交。动物园杂交——根据亲缘关系相似的物种,其基因的编码区相似性较高,而非编码区的同源性很低的原理。现在是31页\一共有82页\编辑于星期五如果某一物种的DNA顺序与来自另一亲缘物种的DNA片段杂交产生阳性信号,该区段可能含有1个或多个基因,这种方法又称为动物园杂交。现在是32页\一共有82页\编辑于星期五现在是33页\一共有82页\编辑于星期五DNA顺序中基因位置的确定cDNA测序受两个方面的影响:一是相关cDNA在cDNA文库中出现的频率;二是cDNA的完整性Northernblot和Zooblot可以判断DNA片段中是否含有基因,但是不能给出基因定位信息。获得基因定位信息的最容易的方法是cDNA测序现在是34页\一共有82页\编辑于星期五如何获取基因全长cDNA序列?AcDNA文库构建BRACE技术现在是35页\一共有82页\编辑于星期五干扰cDNA筛选基因的因素:目标cDNA所占比例很低分成亚群进行筛选cDNA均一化
影响cDNA测序的因素与mRNA的反转录有关现在是36页\一共有82页\编辑于星期五cDNA文库构建(CLONTECH)现在是37页\一共有82页\编辑于星期五cDNA文库构建(CLONTECH)现在是38页\一共有82页\编辑于星期五5’RACE(CLONTECH)现在是39页\一共有82页\编辑于星期五先利用mRNA的3‘末端的poly(A)尾巴作为一个引物结合位点,以Oligo(dT)30MN作为锁定引物在反转录酶MMLV作用下,反转录合成标准第一链cDNA。利用该反转录酶具有的末端转移酶活性,在反转录达到第一链的5’末端时自动加上3-5个(dC)残基,退火后(dC)残基与含有SMART寡核苷酸序列Oligo(dG)通用接头引物配对后,转换为以SMART序列为模板继续延伸而连上通用接头(见下图)。然后用一个含有部分接头序列的通用引物UPM(universalprimer,UPM)作为上游引物,用一个基因特异引物2(GSP2genespecificprimer,GSP)作为下游引物,以SMART第一链cDNA为模板,进行PCR循环,把目的基因5‘末端的cDNA片段扩增出来1988年现在是40页\一共有82页\编辑于星期五3’RACE(CLONTECH)现在是41页\一共有82页\编辑于星期五SMART3′-RACE的原理是:利用mRNA的3′末端的poly(A)尾巴作为一个引物结合位点,以连有SMART寡核营酸序列通用接头引物的Oligo(dT)30MN作为锁定引物反转录合成标准第一链cDNA。然后用一个基因特异引物GSP1(genespecificprimer,GSP)作为上游引物,用一个含有部分接头序列的通用引物UPM(universalprimer,UPM)作为下游引物,以cDNA第一链为模板,进行PCR循环,把目的基因3′末端的DNA片段扩增出来。现在是42页\一共有82页\编辑于星期五确定DNA顺序中基因的位置A通过对全长cDNA序列的测序、对比,以及与基因组DNA的比较,确定基因所在的区域;B通过物种已建立遗传图和物理图来确定基因的位置;现在是43页\一共有82页\编辑于星期五利用计算机分析基因功能2、基因功能的预测2.1同源性确定基因功能2.2同源性分析在酵母基因组计划中的应用现在是44页\一共有82页\编辑于星期五2.1同源性确定基因功能
种间同源基因或直系基因(orthologousgene):指不同物种之间的同源基因,它们来自物种分化以前的共同祖先
种内同源基因或平行基因(paralogousgene)同一物种内的同源基因,它们常常是多基因家族的不同成员现在是45页\一共有82页\编辑于星期五同源基因都拥有一个共同的祖先基因,它们之间有许多相似的序列。同源基因可以分为2类:种间同源基因或直系基因(orthologousgene):指不同物种之间的同源基因,它们来自物种分化以前的共同祖先
种内同源基因或平行基因(paralogousgene)同一物种内的同源基因,它们常常是多基因家族的不同成员,其共同祖先可能存在于物种形成以后,也可能存在于物种形成之前现在是46页\一共有82页\编辑于星期五同源基因一般不会有完全一致的核苷酸序列,因为不同的基因或不同的生物都会独立地发生随机突变,但它们有相似的序列,大部分未突变的核苷酸位置是相同的
同源性分析可以给出整个基因或其中某一区段功能的有关信息
当一个新基因的序列被确认后,根据同源性可以从数据库中查找已知序列的同源基因。根据进化的相关性,可以根据已知的同源基因推测新基因的功能
现在是47页\一共有82页\编辑于星期五2.2同源性分析在酵母基因组计划中的应用酵母基因组大约含有6000个基因30%是通过传统遗传学分析得到的另外70%是用同源性分析获得现在是48页\一共有82页\编辑于星期五3.1基因失活在基因功能分析的作用3.2基因的超表达用于功能检测3、实验确认基因功能现在是49页\一共有82页\编辑于星期五在正常情况下,基因产物的数量是有限制的,必须与其它基因的产物平衡,某一基因产物的过量和不足都会破坏这种平衡,造成生长和发育的异常
有两种技术可以使细胞中某一基因过量表达:增加基因的拷贝数;采用强启动子
现在是50页\一共有82页\编辑于星期五3.1.1基因剔除(knock-out)最简便的基因失活的方法.主要原理:在一段无关DNA片段的两侧连接与代换基因两侧相同的顺序,将这一构建导入目的细胞,由于同源片段之间的重组,可使无关片段取代靶基因,整合到染色体中。为了便于筛选,用于取代的外源DNA中含有报告基因。3.1基因失活在基因功能分析的作用现在是51页\一共有82页\编辑于星期五tk胸苷激酶标记基因←gangcyclovirneor新霉素抗性基因→G418现在是52页\一共有82页\编辑于星期五基因的功能是一个过程,是从基因到表型的一系列生理生化反应过程。现在的基因功能研究与传统的遗传分析正好相反,传统的遗传分析是从表型出发最终到达基因(正向遗传学),而在基因组计划中研究基因功能则是从基因出发,最终到达表型(反向遗传学)。因此必须寻找一系列的实验方法来鉴别与目标基因相关的表型基因失活是基因功能分析的主要手段现在是53页\一共有82页\编辑于星期五现在是54页\一共有82页\编辑于星期五3.1.2反义RNA反义RNA是由基因的负链编码,可与正义RNA(senseRNA)或DNA编码顺序结合,干扰mRNA的转录,加工和转运,调控基因的表达。现在是55页\一共有82页\编辑于星期五反义RNA技术
反义RNA由基因的负链(模板链的互补链)编码,可以与由功能基因转录而成的正义RNA形成双链结构,干扰mRNA的翻译,从而干扰基因的表达
将基因的编码序列反向插入表达载体,转化目标生物,获得转基因个体或品系后,进一步分析表达的反义RNA在生理生化或形态发生中所起的作用,由此判别目标基因的功能
现在是56页\一共有82页\编辑于星期五构建反义RNA表达载体:将全目的基因或部分目的基因反向插入表达载体→转化目标生物→获得转基因个体或品系→分析转基因植株在生理、生化、形态等方面的变异→判别目的基因的功能现在是57页\一共有82页\编辑于星期五正义表达载体反义表达载体现在是58页\一共有82页\编辑于星期五反义RNA作用机理:
A干扰翻译的起始与延伸,可与翻译起始顺序及编码序列结合形成双链RNA,随之被细胞降解。B与mRNA的引导顺序结合,阻止核糖体的附着,使翻译无法启动。C反义RNA与mRNA形成双链分子后,使RNA多聚酶脱离模板,转录终止。现在是59页\一共有82页\编辑于星期五3.1.3RNA干涉RNAi是通过双链RNA的介导,特异性地降解相应序列的mRNA,从而阻断相应基因表达的转录后水平的基因沉默机制.现在是60页\一共有82页\编辑于星期五RNAi作用机理AdsRNA核酸内切酶Dicer被激活,它把dsRNA加工成21~25个核苷酸长的RNA链;B这些小片段RNA(siRNA)作为另一个核糖核酸复合体RISC(RNA-inducesilencingcomplex,RNA诱导沉默复合体)的指引物,结合到RISC上,使之识别并降解mRNA,从而导致与双链RNA同源的基因沉默;现在是61页\一共有82页\编辑于星期五现在是62页\一共有82页\编辑于星期五RNAi设计方法及应用AFraser合成与开放读码框相对应的双链RNA或利用细菌克隆表达这些双链RNA→微量注射和喂食→干扰同源基因的表达BChuang等设计出嵌合体结构→连接强启动子大量表达双链mRNA→干扰同源基因的表达现在是63页\一共有82页\编辑于星期五HbF基因的RNAi载体构建现在是64页\一共有82页\编辑于星期五RNAi技术的优缺点RNAi最根本的特点是特异性RNAi具有特殊的穿越能力,而且干扰作用会传给后代;RNAi对一些低水平表达的基因的RNAi现象并不明显,而且几个有相同或相似序列的基因,RNAi也会同时作用与它们。现在是65页\一共有82页\编辑于星期五3.2基因超表达增加基因的拷贝数采用强启动子促使基因超表达现在是66页\一共有82页\编辑于星期五构建转座子突变库酵母双杂交(yeasttwo-hybridization)3.3 其他方法现在是67页\一共有82页\编辑于星期五3.3.1转座子插入突变现在是68页\一共有82页\编辑于星期五
上世纪三十年代,玉米遗传学家
BarbaraMcClintock在研究中发现了玉米籽粒色斑不稳定遗传的现象,可能是一种可转移的遗传因子。现在是69页\一共有82页\编辑于星期五1948年McClintock首先确认和提出了转座子的概念,这一重大发现并未引起人们的重视,70年代后在原核和真核生物中不断发现有转位因子.◆转座遗传因子又叫可移动因子,是指一段特定的DNA序列。它可以在染色体组内移动,从一个位点切除,插入到一个新的位点。这种切除和移动,能够引起基因的突变或染色体重组。◆它是McClintock(1956)在玉米上首先发现的。这是遗传学发展史上重要的里程碑之一。基因能够在染色体上移动位置,也就是说能“转座”或“跳动”,这在当时对许多遗传学家来说简直是件前所未闻的事情。因为按照传统的观念,基因在染色体上是固定不变的,它们有一定的位置、距离和顺序,它们只可以通过交换或重组改变自己的相对位置,通过突变改变自己的相对性质;但是,要从染色体的一个位置“跳”到另一个位置,甚至“跳”到别的染色体上,科学家们从来连想都没有想过。因此,他们在读了麦克林托克1950年发表的《玉米易突变位点的由来与行为》,和1951年发表的《染色体结构和基因表达》两篇论文后,许多人都认为她可能是“发疯”了,“稳定”的基因居然能随意移动!这就连当时一流的遗传学家也无法理解麦克林托克的语言,她受到了前所未有的冷遇。“转座因子”的概念麦克林托克早在1938年就已提出了,但直到1976年,在美国冷泉港召开的“DNA插入因子、质粒和游离基因”专题讨论会上,与会科学家明确地承认可以用麦克林托克的术语“转座因子”,来说明所有能够插入基因组的DNA片段。麦克林托克在这时才真正成为基因调控的“调节—操纵子理论”的先驱。早在20世纪40年代初期,麦克林托克完全是通过个人的努力、用传统的遗传学和细胞学研究的手段,得出了“转座因子”的概念,解决了用分子生物学和分子遗传学的方法才能解决的问题,成为走在时代前面的科学家。麦克林托克在半个世纪前提出的“转座因子”理论,对于分子生物学和分子遗传学的发展,对以DNA重组技术为代表的基因工程的发展等都具有极其重要的意义。1983年,瑞典皇家科学院诺贝尔奖金评定委员会终于把这一年度的诺贝尔生理学或医学奖授予了这位81岁高龄、不屈不挠的女科学家,麦克林托克也由此成为遗传学研究领域第一位独立获得诺贝尔奖的女科学家。面对这份迟到了近半个世纪的荣誉,麦克林托克深感欣慰。1992年9月2日,麦克林托克在冷泉港去世,终年90岁。现在是70页\一共有82页\编辑于星期五1944:美国国家科学院院士1945:美国遗传学会主席1983:NobelPrize,35年后将转位因子的重大发现归功于她McClintock(1902-1992)现在是71页\一共有82页\编辑于星期五
Ac和Ds这两个因子都位于玉米的第九号染色体短臂,在色素基因C的附近。Ac因子全长4.5kb,有5个外显子,其产物是转座酶。Ac因子两端是长11bp的反向重复序列(IR);
Ds因子长0.4-4kb,它的中间(在转座酶基因中)有许多种长度不等的缺失,Ds的两端也都有11bp的反向重复序列。现在是72页\一共有82页\编辑于星期五Ac-Ds转座元件结构示意图。右边示Ac及Ds元件的单链DNA末端反向重复配对所形成的茎环结构,这种结构可能对转座有意义现在是73页\一共有82页\编辑于星期五玉米转座因子对胚乳颜色的影响
现在是74页\一共有82页\编辑于星期五35SAc转座酶NPTIIIAAHAcTATA
GUS
NPTIIIAAHDsEIAAHDsGIA
GUS
NPTIIIAAH吲哚乙酸水解酶,NAM(萘乙酰胺)敏感现在是75页\一共有82页\编辑于星期五35SAc转座酶NPTIIIAAHAcTATA
GUS
NPTIIIAAHDsEIAAHDsGIA
GUS
NPTII增强子捕获TATA
GUS
NPTIIEEE外显子IA
GUS
NPTII内含子基因捕获外显子IA
GUS
NPTII外显子外显子突变体库构建载体策略现在是76页\一共有82页\编辑于星期五A、插入突变隐性突变体库构建存在问题现在是77页\一共有82页\编辑于星期五B、冗余基因的存在现在是78页\一共有82页\编辑于星期五3.3.2酵母双杂交(yeasttwo-hyb
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年产xxx客厅隔断项目可行性研究报告(项目建议书)
- 抱箍项目可行性研究报告
- 幼儿园沟通培训内容
- 4.1陆地水体及相互关系课件高中地理鲁教版(2019)选择性必修1
- 人教版部编本四年级下册《千年梦圆在今朝》教案设计及教学反思
- 年度总结团建活动汇报
- 老年腹泻个案护理查房
- 病区护理人员心理疏导
- 儿童财商课程培训
- 猴痘的诊断与治疗
- 承台、墩柱模板施工方案
- 一年级大个子二年级小个子
- 无轴螺旋输送机检验记录报告(LS)
- 逆向思考的艺术
- 销售报价工作流程图
- 《消化系统疾病》PPT课件.ppt
- 广东常用的100种植物
- 经皮肾镜取石术的并发症及防治.ppt
- 电工仪表与测量PPT课件
- 输电线路设计知识讲义
- 意大利汽车零部件企业
评论
0/150
提交评论