基因组序列诠释强伯勤_第1页
基因组序列诠释强伯勤_第2页
基因组序列诠释强伯勤_第3页
基因组序列诠释强伯勤_第4页
基因组序列诠释强伯勤_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组序列诠释强伯勤第一页,共六十八页,编辑于2023年,星期五问题基因组序列所包含的全部遗传信息是什么?基因组作为一个整体如何行使其功能?用什么方法寻找基因,研究基因地功能呢?第二页,共六十八页,编辑于2023年,星期五1.寻找基因1.1根据开放读框预测基因⑴起始密码子ATG第一个ATG的确定(依据Kozak规则);Kozak规则是基于已知数据的统计结果.

所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律.第三页,共六十八页,编辑于2023年,星期五Kozak规则:

若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下:(1)第4位的偏好碱基为G;(2)ATG的5’端约15bp范围的侧翼序列内不含碱基T;(3)在-3,-6和-9位置,G是偏好碱基;(4)除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基。第四页,共六十八页,编辑于2023年,星期五

信号肽分析软件(SignalPhttp://www.cbs.dtu.dk/services/signalP)

把预测过程中证实含完整mRNA5’端的序列翻译为蛋白序列;

然后用SignalP软件对前50个氨基酸序列(从第一个ATG对应的甲硫氨酸Met开始)进行评估,如果SignalP分析给出正面结果,则测试序列有可能为信号肽;⑵

信号肽分析第五页,共六十八页,编辑于2023年,星期五⑶

终止密码子

终止密码子:TAA,TAG,TGAGC%=50%终止密码子每64bp出现一次;

GC%>50%终止密码子每100-200bp出现一次;由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF不少于100个密码子。第六页,共六十八页,编辑于2023年,星期五⑷

3’端的确认

3’端的确认主要根据Poly(A)尾序列,若测试DNA片段不含Poly(A)序列,则根据加尾信号序列“AATAAA”和BLAST同源性比较结果共同判断。第七页,共六十八页,编辑于2023年,星期五⑸

非编码序列、内含子高等真核生物ORF阅读的复杂性:基因间存在大量的非编码序列(人类基因组中是70%)绝大多数基因含有非编码的内含子。

高等真核生物多数外显子长度少于100个密码子,有的不到50个密码子甚至更少;不能根据ORF长度判断读框的准确性。第八页,共六十八页,编辑于2023年,星期五编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。不同种属间使用同义密码的频率有很大差异:如人类基因中,

丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少苏氨酸(Thr)密码子多为ACA,ACC或ACT,而ACG很少⑹

密码子偏爱性第九页,共六十八页,编辑于2023年,星期五⑺

密码子偏爱性

高等植物207个基因单子叶植物53个,6个单子叶种群,18种氨基酸有16种氨基酸的密码子摇摆碱基为G+C双子叶植物154个,35个双子叶种群,只有7种氨基酸的摇摆碱基是G+C,其余均为A+T密码子偏倚codonbias,原因不明。第十页,共六十八页,编辑于2023年,星期五⑻

外显子-内含子边界外显子和内含子的边界有一些明显的特征:如:内含子的5‘端或称供体位(donorsite)常见的顺序为5’-AG↓GTAAGT-3’;3’端又称受体位(acceptorsite),多为5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);但是由于边界序列常有例外,仅适用于一定范围。第十一页,共六十八页,编辑于2023年,星期五⑼上游控制序列

几乎所有基因(或操纵子)上游都有调控序列,它们可与DNA结合蛋白作用,控制基因表达。

通过同源性比较来预测mRNA的5’端,最常用的与转录起始位点相关的数据库是真核启动子数据库(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http://www.epd.unil.ch/)。

另外个别生物基因组的特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有CpG岛。第十二页,共六十八页,编辑于2023年,星期五

内含子和外显子序列差异内含子受选择压力小,突变多。由于碱基C到A,内含子A/T比例高内含子A/T比例高,所以终止密码子出现的频率高。第十三页,共六十八页,编辑于2023年,星期五

软件预测采用NCBI的ORF预测软件(ORFfinder:/gorf/orfig.cgi)判断ORF的可能范围。第十四页,共六十八页,编辑于2023年,星期五基因注释软件Genscan——重于信号指令:起始密码、终止密码、剪接受体位和供体位序列等FgeneSH——重于内容指令:密码子使用偏好、内含子外显子的差异等TWINSCAN和SGP2——根据相似性和一致性第十五页,共六十八页,编辑于2023年,星期五基因注释软件缺点外显子注释的准确率<80%。误拼和误拆错误较多。容易忽略结构较小的基因,特别是基因内基因。

线虫基因的注释19477个软件预测

11984个克隆验证,未能预测到的cDNA和EST为4365个第十六页,共六十八页,编辑于2023年,星期五1.2同源查询途径

通过已存入数据库中的基因顺序与待查的基因组序列进行比较,从中查找可与之匹配的碱基顺序及其比例,用于界定基因的方法称为同源查询。

第十七页,共六十八页,编辑于2023年,星期五相似性有如下几种情况:

ADNA序列某些片段完全相同;B开放读码框(ORF)排列类似,如有长外显子;C开放读码框翻译成氨基酸序列的相似性;D模拟多肽高级结构相似同源基因:氨基酸的一致性和相似性>25%第十八页,共六十八页,编辑于2023年,星期五同源性:homology起源于同一祖先但序列已经发生变异的序列,分布在不同物种间的同源基因,只有是与非的区别。一致性:identity同源DNA序列的同一碱基位置上相同的碱基成员,或者蛋白质中同一氨基酸位置相同的氨基酸成员的比例,用%表示。相似性:similarity同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。比较氨基酸和基因的同源性?第十九页,共六十八页,编辑于2023年,星期五分子杂交可确定DNA片段是否含有表达顺序Northernblot:指将待测DNA样品标记后与RNA杂交,以判断RNA中是否含有DNA的转录产物。但在操作中存在一些问题1.3试验确认基因第二十页,共六十八页,编辑于2023年,星期五1977年J.C.Alwin首创Northernblotting

第二十一页,共六十八页,编辑于2023年,星期五问题解决方案A某一基因的转录产物进行可变剪接或该基因为某一多基因家族的成员时,会出现多个杂交带设计其他实验区分第二十二页,共六十八页,编辑于2023年,星期五第二十三页,共六十八页,编辑于2023年,星期五心肌特异性蛋白第二十四页,共六十八页,编辑于2023年,星期五问题解决方案B基因的表达具有组织特异性及发育阶段的差别,而选择的RNA样品中不一定含有该基因产物尽可能多地收集各种不同发育时期及不同组织器官的RNA第二十五页,共六十八页,编辑于2023年,星期五问题解决方案C某些基因产物丰度极低或不易提取适当提高RNA上样量,或先以已知的DNA序列设计引物从mRNA中扩增基因产物第二十六页,共六十八页,编辑于2023年,星期五C基因表达产物丰度的问题拟Northern杂交——

根据已知的DNA顺序设计引物,从mRNA群体中扩增基因产物,再以DNA为探针与之杂交。动物园杂交——根据亲缘关系相似的物种,其基因的编码区相似性较高,而非编码区的同源性很低的原理。第二十七页,共六十八页,编辑于2023年,星期五第二十八页,共六十八页,编辑于2023年,星期五DNA顺序中基因位置的确定

cDNA测序受两个方面的影响:一是相关cDNA在cDNA文库中出现的频率;二是cDNA的完整性第二十九页,共六十八页,编辑于2023年,星期五如何获取基因全长cDNA序列?AcDNA文库构建BRACE技术第三十页,共六十八页,编辑于2023年,星期五干扰cDNA筛选基因的因素:目标cDNA所占比例很低分成亚群进行筛选cDNA均一化

影响cDNA测序的因素与mRNA的反转录有关第三十一页,共六十八页,编辑于2023年,星期五cDNA文库构建(CLONTECH)第三十二页,共六十八页,编辑于2023年,星期五cDNA文库构建(CLONTECH)第三十三页,共六十八页,编辑于2023年,星期五5’RACE(CLONTECH)第三十四页,共六十八页,编辑于2023年,星期五3’RACE(CLONTECH)第三十五页,共六十八页,编辑于2023年,星期五确定DNA顺序中基因的位置A通过对全长cDNA序列的测序、对比,以及与基因组DNA的比较,确定基因所在的区域;B通过物种已建立遗传图和物理图来确定基因的位置;第三十六页,共六十八页,编辑于2023年,星期五利用计算机分析基因功能2、基因功能的预测2.1同源性确定基因功能2.2同源性分析在酵母基因组计划中的应用第三十七页,共六十八页,编辑于2023年,星期五2.1同源性确定基因功能

种间同源基因或直系基因(orthologousgene):指不同物种之间的同源基因,它们来自物种分化以前的共同祖先

种内同源基因或平行基因(paralogousgene)同一物种内的同源基因,它们常常是多基因家族的不同成员第三十八页,共六十八页,编辑于2023年,星期五同源基因一般不会有完全一致的核苷酸序列,因为不同的基因或不同的生物都会独立地发生随机突变,但它们有相似的序列,大部分未突变的核苷酸位置是相同的

同源性分析可以给出整个基因或其中某一区段功能的有关信息第三十九页,共六十八页,编辑于2023年,星期五2.2同源性分析在酵母基因组计划中的应用酵母基因组大约含有6000个基因30%是通过传统遗传学分析得到的另外70%是用同源性分析获得第四十页,共六十八页,编辑于2023年,星期五3.1基因失活在基因功能分析的作用3.2基因的超表达用于功能检测3、实验确认基因功能第四十一页,共六十八页,编辑于2023年,星期五3.1.1基因剔除(knock-out)

最简便的基因失活的方法.

主要原理:

在一段无关DNA片段的两侧连接与代换基因两侧相同的顺序,将这一构建导入目的细胞,由于同源片段之间的重组,可使无关片段取代靶基因,整合到染色体中。为了便于筛选,用于取代的外源DNA中含有报告基因。3.1基因失活在基因功能分析的作用第四十二页,共六十八页,编辑于2023年,星期五tk胸苷激酶标记基因←gangcyclovirneor新霉素抗性基因→G418第四十三页,共六十八页,编辑于2023年,星期五第四十四页,共六十八页,编辑于2023年,星期五3.1.2反义RNA

反义RNA是由基因的负链编码,可与正义RNA(senseRNA)或DNA编码顺序结合,干扰mRNA的转录,加工和转运,调控基因的表达。第四十五页,共六十八页,编辑于2023年,星期五构建反义RNA表达载体:

将全目的基因或部分目的基因反向插入表达载体→转化目标生物→获得转基因个体或品系→分析转基因植株在生理、生化、形态等方面的变异→判别目的基因的功能第四十六页,共六十八页,编辑于2023年,星期五正义表达载体反义表达载体第四十七页,共六十八页,编辑于2023年,星期五反义RNA作用机理:

A干扰翻译的起始与延伸,可与翻译起始顺序及编码序列结合形成双链RNA,随之被细胞降解。

B与mRNA的引导顺序结合,阻止核糖体的附着,使翻译无法启动。

C反义RNA与mRNA形成双链分子后,使RNA多聚酶脱离模板,转录终止。第四十八页,共六十八页,编辑于2023年,星期五3.1.3RNA干涉

RNAi是通过双链RNA的介导,特异性地降解相应序列的mRNA,从而阻断相应基因表达的转录后水平的基因沉默机制.第四十九页,共六十八页,编辑于2023年,星期五RNAi作用机理AdsRNA核酸内切酶Dicer被激活,它把dsRNA加工成21~25

个核苷酸长的RNA链;B这些小片段RNA(siRNA)作为另一个核糖核酸复合体RISC(RNA-inducesilencingcomplex,RNA诱导沉默复合体)的指引物,结合到RISC上,使之识别并降解mRNA,从而导致与双链RNA同源的基因沉默;第五十页,共六十八页,编辑于2023年,星期五第五十一页,共六十八页,编辑于2023年,星期五RNAi设计方法及应用AFraser合成与开放读码框相对应的双链RNA或利用细菌克隆表达这些双链RNA→微量注射和喂食→干扰同源基因的表达BChuang等设计出嵌合体结构→连接强启动子大量表达双链mRNA→干扰同源基因的表达第五十二页,共六十八页,编辑于2023年,星期五HbF基因的RNAi载体构建第五十三页,共六十八页,编辑于2023年,星期五RNAi技术的优缺点RNAi最根本的特点是特异性RNAi具有特殊的穿越能力,而且干扰作用会传给后代;RNAi对一些低水平表达的基因的RNAi现象并不明显,而且几个有相同或相似序列的基因,RNAi也会同时作用与它们。第五十四页,共六十八页,编辑于2023年,星期五3.2基因超表达增加基因的拷贝数采用强启动子促使基因超表达第五十五页,共六十八页,编辑于2023年,星期五构建转座子突变库酵母双杂交(yeasttwo-hybridization)3.3 其他方法第五十六页,共六十八页,编辑于2023年,星期五3.3.1转座子插入突变第五十七页,共六十八页,编辑于2023年,星期五

上世纪三十年代,玉米遗传学家

BarbaraMcClintock在研究中发现了玉米籽粒色斑不稳定遗传的现象,可能是一种可转移的遗传因子。第五十八页,共六十八页,编辑于2023年,星期五1944:美国国家科学院院士1945:美国遗传学会主席1983:NobelPrize,35年后将转位因子的重大发现归功于她McClintock(1902-1992)第五十九页,共六十八页,编辑于2023年,星期五

Ac和Ds这两个因子都位于玉米的第九号染色体短臂,在色素基因C的附近。

Ac因子全长4.5kb,有5个外显子,其产物是转座酶。Ac因子两端是长11bp的反向重复序列(IR);

Ds因子长0.4-4kb,它的中间(在转座酶基因中)有许多种长度不等的缺失,Ds的两端也都有11bp的反向重复序列。第六十页,共六十八页,编辑于2023年,星期五

Ac-Ds转座元件结构示意图。右边示Ac及Ds元件的单链DNA末端反向重复配对所形成的茎环结构,这种结构可能对转座有意义第六十一页,共六十八页,编辑于2023年,星期五玉米转座因子对胚乳颜色的影响

第六十二页,共六十八页,编辑于2023年,星期五35SAc转座酶NPTIIIAAHAcTATA

GUS

NPTIIIAAHDsEIAAHDsGIA

GUS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论