基因组序列诠释_第1页
基因组序列诠释_第2页
基因组序列诠释_第3页
基因组序列诠释_第4页
基因组序列诠释_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组序列诠释第一页,共60页。问题基因组序列所包含的全部遗传信息是什么?基因组作为一个整体如何行使其功能?用什么方法寻找基因、研究基因的功能?2第二页,共60页。基因组序列的诠释研究基因组的最终目的--诠释基因组所包含的信息和基因组功能。1.在基因组中搜寻基因根据序列分析搜寻基因实验分析确认基因2.基因功能测定3第三页,共60页。

5.1在基因组中搜寻基因

ORF(openingreadingframes)扫描:人工或计算机序列筛选ORF:每个编码蛋白的基因都含有ORF,由一系列密码子组成,通常以ATG开始,TAA、TGA、TAG结束。通过寻找起始密码子和终止密码子确定ORF序列,是寻找基因的一种重要的方法成功关键:终止子在DNA序列中出现的频率。4第四页,共60页。5.1在基因组中搜寻基因高等真核生物DNA的ORF的阅读障碍:基因间存在大量非编码序列(人类基因组占70%)很多基因含有内含子由于多数外显子长度<100个密码子,当读码进入到内含子时很快就遇到终止密码,从而难以判断读码的准确性5第五页,共60页。A起始密码子ATGB信号肽分析C终止密码子D3’端的确认E非编码序列、内含子F密码子偏爱性G外显子-内含子边界H上游调控序列I软件预测

5.1在基因组中搜寻基因

根据序列分析搜寻基因6第六页,共60页。A起始密码子ATG第一个ATG的确定(依据Kozak规则)Kozak规则--基于已知数据的统计结果第一个ATG侧翼序列的碱基分布所满足的统计规律根据开放读码框(ORF)预测基因7第七页,共60页。Kozak规则:若将第一个ATG中的碱基A,T,G分别标为1,2,3位,侧翼碱基序列具有以下特征:第4位的偏好碱基为GATG的5’端约15bp范围的侧翼序列内不含碱基T在-3,-6和-9位置,G是偏好碱基除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基8第八页,共60页。B信号肽分析信号肽分析软件(SignalP)把预测过程中证实含完整mRNA5’端的序列翻译为蛋白序列然后用SignalP软件对前50个氨基酸序列(从第一个ATG对应的甲硫氨酸Met开始)进行评估,如果SignalP分析给出正面结果,则测试序列有可能为信号肽

9第九页,共60页。C终止密码子终止密码子:TAA,TAG,TGAGC%=50%终止密码子每64bp出现一次

GC%>50%终止密码子每100-200bp出现一次由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF不少于100个密码子10第十页,共60页。D3’端的确认Poly(A)尾序列若测试DNA片段不含Poly(A)序列,则根据加尾信号序列“AATAAA”,与BLAST同源性比较结果共同判断11第十一页,共60页。E非编码序列、内含子

高等真核生物多数外显子长度少于100个密码子,有的不到50个密码子甚至更少12第十二页,共60页。F密码子偏爱性同义密码:编码同一氨基酸的不同密码子,差别在于密码子的第3位碱基不同种属间使用同义密码的频率有很大差异,如人类基因中,丙氨酸(Ale)密码子多为GCA、GCC、GCT,GCG很少使用种属特征性密码子序列在编码区出现,非编码区只保持平均的碱基分布水平13第十三页,共60页。G外显子-内含子边界外显子和内含子的边界有明显的特征内含子的5‘端或称供体位(donorsite)常见的顺序为5’-AG↓GTTAAGT-3’3’端又称受体位(acceptorsite),多为5‘PyPyPyPyPyPyCAG-3’(Py:嘧啶核苷酸,T或C)14第十四页,共60页。H上游调控序列几乎所有基因(或操纵子)上游都有调控序列,与DNA结合蛋白作用,控制基因表达原核生物调控序列有明显特点,参考真核生物基因上游控制序列差异较大通过同源性比较来预测mRNA的5’端真核启动子数据库(TheTRADATProject,EukaryoticPromoterDatabase,EPD.)特定生物基因组的特有组成--

CpG岛,脊椎动物基因组许多基因的上游promotor都有,长度1kb,GC比例高

15第十五页,共60页。I软件预测采用NCBI的ORF预测软件(ORFfinder:)判断ORF的可能范围16第十六页,共60页。

5.1在基因组中搜寻基因

适用于高等真核生物基因组的ORF扫描方法:上游调控序列(upstreamcontrolsequence):上游调控序列和外显子-内含子边界一样具有显著特征,这些特征是参与基因表达的DNA结合蛋白的识别信号。但真核的变化也较大同源查询(homologysearch):利用已存入数据库中的已有基因序列与待查基因组序列进行比较,从中查找可与之匹配的碱基顺序及其比例用于界定基因的方法孤独基因(orphangene):在基因分类时缺少同源顺序的ORF17第十七页,共60页。5.1在基因组中搜寻基因实验分析确认基因分子杂交NorthernblottingZooblottingDNA序列中基因位置的确定cDNA文库构建RACE技术基因定位第十八页,共60页。

5.1在基因组中搜寻基因

分子杂交可确定DNA片段是否含有表达序列Northernblotting:指将待测DNA样品标记后与RNA杂交,以判断RNA中是否含有DNA的转录产物。Zooblotting:亲缘关系相近的物种,其基因编码区相似性较高,而非编码区的同源性很低。以某一物种的DNA序列与来自另一亲缘种的DNA片段杂交,如产生阳性信号,则该区段可能含有1或多个基因19第十九页,共60页。问题解决方案多个杂交带:某一基因的转录产物进行可变剪接或该基因为某一多基因家族的成员时,会出现设计其他实验区分基因的表达具有组织特异性及发育阶段的差别,而选择的RNA样品中不一定含有该基因产物扩大样本量,收集各种不同发育时期及不同组织器官的RNA某些基因产物丰度极低或不易提取提高RNA上样量,或以已知的DNA序列设计引物从mRNA中扩增基因产物20第二十页,共60页。

5.1在基因组中搜寻基因

DNA序列中基因位置的确定分子杂交可以判断DNA片段中是否含有基因,但不能给出基因定位信息cDNA测序:获得基因定位信息的最容易的方法cDNA测序受两个方面的影响:目标cDNA在cDNA文库中出现的频率cDNA的完整性21第二十一页,共60页。

5.1在基因组中搜寻基因

如何获取基因全长cDNA序列?确定其在基因组中的位置?AcDNA文库构建BRACE技术C通过对全长cDNA序列的测序、对比,以及与基因组DNA的比较,确定基因所在的区域;通过物种已建立遗传图和物理图来确定基因的位置;22第二十二页,共60页。cDNA文库中目标cDNA的低频率cDNA文库分为亚群、亚群杂交初筛、选择杂交信号强的亚群进一步筛选cDNA均一化:抑制高拷贝cDNA,增加低拷贝cDNA数量。DNA复性动力学合适条件下,多数高拷贝cDNA呈双链,中低拷贝cDNA呈单链羟基磷灰石柱吸附双链cDNA收集单链cDNA23第二十三页,共60页。5’RACE(CLONTECH)24第二十四页,共60页。3’RACE(CLONTECH)25第二十五页,共60页。一.利用计算机分析基因功能二.实验分析确定基因功能5.2基因功能的测定26第二十六页,共60页。一.利用计算机分析基因功能

同源性确定基因功能

同源基因都拥有一个共同的祖先基因,有许多相似序列。同源基因可以分为2类:

种间同源基因或直系基因(orthologousgene):不同物种之间的同源基因,来自物种分化以前的共同祖先

种内同源基因或平行基因(paralogousgene)同一物种内的同源基因,常常是多基因家族的不同成员。其共同祖先可能存在于物种形成以后,也可能存在于物种形成之前27第二十七页,共60页。同源基因通常不会有完全一致的核苷酸序列,因为不同的基因或不同的生物都会独立地发生随机突变,但它们有相似的序列,大部分未突变的核苷酸位置是相同的氨基酸序列与核苷酸序列28第二十八页,共60页。推测新基因的功能

确认新基因序列后,根据进化的相关性,

根据已知的同源基因推测新基因的功能

局部相似基因序列:无明显亲缘关系的基因之间会出现局部相似区段。相似的功能,相似的序列是核心功能区域。功能域有共同的起源。29第二十九页,共60页。30第三十页,共60页。同源性分析在酵母基因组计划中的应用酵母基因组大约含有6000个基因,30%--通过传统遗传学分析得到70%--通过同源性分析获得back31第三十一页,共60页。二.实验分析确定基因功能基因失活

基因超表达噬菌体展示(phagedisplay)酵母双杂交(yeasttwo-hybridization)5.2基因功能的测定32第三十二页,共60页。基因的功能实现--一个过程,从基因到表型的一系列生理生化反应过程正向遗传学:传统的遗传分析,从表型出发最终到达基因反向遗传学:现代基因功能研究方法,与传统遗传分析相反,从基因出发,最终到达表型基因组计划中基因功能研究:基因到表型。通过系列实验方法鉴别与目标基因相关的表型基因失活是基因功能分析的主要手段1.基因失活33第三十三页,共60页。基因失活基因剔除(knock-out)反义RNA技术RNAi技术转座子插入突变34第三十四页,共60页。5.2基因功能的测定基因剔除(knock-out)

最简单的基因失活方法,用一段无关的DNA片段取代目标基因。主要原理:用一段无关的核苷酸序列取代目标基因的中间序列,导入生物体内或目的细胞内,如果该基因所控制的表型发生变化,即从反面验证了目标基因的功能。35第三十五页,共60页。基因剔除(knock-out)基因敲除最简便的基因失活的方法.1987年建立,2007年获诺贝尔生理医学奖主要原理:

在一段无关DNA片段的两侧连接与代换基因两侧相同的序列,导入目的细胞,由于同源片段之间的重组,可使无关片段取代靶基因,整合到染色体中.

为了便于筛选,用于取代的外源DNA中含有报告基因

36第三十六页,共60页。基因敲除基本步骤ES细胞的获得基因载体的构建目的基因导入筛选靶细胞观察生物学性状的改变第三十七页,共60页。tk胸苷激酶标记基因←gangcyclovirneor新霉素抗性基因→G41838第三十八页,共60页。39第三十九页,共60页。基因敲除技术的应用及前景:①建立生物模型。基因功能、代谢途径等研究中模型生物的建立非常重要。基因敲除技术建立某种特定基因缺失的生物模型,从而进行相关的研究。这些模型可以是细胞,也可以是完整的动植物或微生物个体。最常见的是小鼠,家兔、猪、线虫、酵母和拟南芥等的基因敲除模型也常见于报道。②疾病的分子机理研究和疾病的基因治疗。通过基因敲除技术可以确定特定基因的性质以及研究它对机体的影响。对于了解疾病的根源、寻找基因治疗的靶目标都有重大意义。

第四十页,共60页。③.提供廉价的异种移植器官器官来源稀少是人体器官移植的最大制约因素,而大量廉价的异种生物如猪等的器官却不能用于人体。异源生物的基因会产生能引起人体强烈免疫排斥的异源分子福音:将产生这些异源分子的基因敲除,那么动物的器官将能用于人体的疾病治疗PPLTherapeutics公司于1999年已成功地在猪的体细胞中用基因敲除技术敲除了α-1,3GT基因。使每只猪都缺乏产生a1-3半乳糖基转移酶的基因的2个拷贝。这些酶在细胞表面产生一种糖分子,人体的免疫系统可以立即辨认出这种糖分子为异源性,从而引发超急性免疫排斥反应。在缺乏这种酶的情况下,超急性排斥反应即不会再发生

第四十一页,共60页。④.免疫学中的应用异源抗体用于人体时会有一定的免疫排斥,使得人用抗体类药物的生产和应用受阻。将动物免疫分子基因敲除,换以人的相应基因,那么将产生人的抗体,从而解决人源抗体的生产问题。

⑤改造生物、培育新的生物品种基因敲除技术是遗传工程中的另一重大飞跃,为定向改造生物,培育新型生物提供了重要的技术支持

第四十二页,共60页。基因敲除技术的缺陷

敲掉一个基因并不一定就能获知该基因的功能许多基因在功能上是冗余的,敲掉一个在功能上冗余的基因,并不能造成容易识别的表型,因为基因家族的其他成员可以提供同样的功能;对于某些必需基因,敲除后会造成细胞的致死性,也就无法对这些必需基因进行相应的研究。第四十三页,共60页。反义RNA技术

反义RNA由基因的负链(模板链的互补链)编码,与正义RNA(senseRNA)或DNA编码序列结合,干扰mRNA的转录、加工和转运,干扰基因的表达

将全目的基因或部分目的基因反向插入表达载体→转化目标生物→获得转基因个体或品系→分析转基因个体在生理、生化、形态等方面的变异→判别目的基因的功能44第四十四页,共60页。正义表达载体反义表达载体45第四十五页,共60页。反义RNA作用机理:

A干扰翻译的起始与延伸,可与翻译起始序列及编码序列结合形成双链RNA,随之被细胞降解。

B与mRNA的引导序列结合,阻止核糖体附着,使翻译无法启动。

C反义RNA与mRNA形成双链分子后,使RNA多聚酶脱离模板,转录终止。46第四十六页,共60页。RNAi干扰

转录后水平的基因沉默机制通过双链RNA的介导,特异性地降解相应序列的mRNA,从而阻断相应基因表达.47第四十七页,共60页。RNAi作用机理AdsRNA核酸内切酶Dicer被激活,将dsRNA加工成21-25个核苷酸长的RNA链;B这些小片段RNA(siRNA)作为另一个核糖核酸复合体RISC(RNA-inducesilencingcomplex,RNA诱导沉默复合体)的指引物,结合到RISC上,使之识别并降解mRNA,从而导致与双链RNA同源的基因沉默;48第四十八页,共60页。49第四十九页,共60页。RNAi设计方法及应用A

Fraser

合成与开放读码框相对应的双链RNA或利用细菌克隆表达双链RNA→微量注射/喂食→干扰同源基因的表达BChuang等设计出嵌合体结构→连接强启动子大量表达双链mRNA→干扰同源基因的表达50第五十页,共60页。HbF基因的RNAi载体构建51第五十一页,共60页。RNAi技术的优缺点最根本的特点--特异性RNAi具有特殊的穿越能力,如将双链RNA注射在线虫性腺里,会干扰到体细胞里的基因表达,而且干扰作用会传给后代;对一些低水平表达的基因,RNAi现象并不明显RNAi能同时作用于几个有相同或相似序列的基因52第五十二页,共60页。转座子插入突变

将转座子随机插入功能基因内,使其失活,亦可用于基因功能研究。back53第五十三页,共60页。2.基因的超表达用于功能检测

在正常情况下,基因产物的数量是有限制的,必须与其它基因的产物平衡,某一基因产物的过量和不足都会破坏这种平衡,造成生长和发育的异常

基因过量表达策略:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论