版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1生物信息学序列分析利用生物信息学进生物信息学序列分析利用生物信息学进行功能基因的电子隆技术行功能基因的电子隆技术链链cDNA杂交,以选择性除去二者间的杂交体。杂交,以选择性除去二者间的杂交体。2.4 扣除杂交或抑制消减杂交法(扣除杂交或抑制消减杂交法(SSH Suppression Subtractive Hybridization)其依据的技术主要有两点:消减杂交和抑制性其依据的技术主要有两点:消减杂交和抑制性PCR,利用链内退火优于链间退火利用链内退火优于链间退火,比链间退火更稳定,从而使非目的序列片段两端反向重复序列在退火时产生类似,比链间退火更稳定,从而使非目的序列片段两端反向
2、重复序列在退火时产生类似于于“平底锅平底锅”的结构,无法与引物配对,选择性地抑制了非目的基因片段的扩增;的结构,无法与引物配对,选择性地抑制了非目的基因片段的扩增;同时根据复性动力学原理,即浓度高的单链同时根据复性动力学原理,即浓度高的单链cDNA在退火时产生同源杂交的速度要在退火时产生同源杂交的速度要快于浓度低的单链快于浓度低的单链cDNA,从而使原来在浓度上有差别的单链从而使原来在浓度上有差别的单链cDNA相对含量达到相对含量达到基本一致。基本一致。 其特点是:速度快、效率高,可同时分离几十或上百个差异表达的基因;假其特点是:速度快、效率高,可同时分离几十或上百个差异表达的基因;假阳性率低
3、,其阳性率高达阳性率低,其阳性率高达94%;敏感程度较;敏感程度较DD和和RDA高,一些低丰度表达的高,一些低丰度表达的cDNA可被检出;并可以大量特异扩增那些代表了有差别表达的可被检出;并可以大量特异扩增那些代表了有差别表达的cDNA片段,片段,减少了实验结果的复杂性。减少了实验结果的复杂性。2.5 基因表达系列分析基因表达系列分析(Serial Analysis of Gene Expression,SAGE)技术技术 细胞或组织的细胞或组织的RNA逆转录为逆转录为cDNA,分别使用锚酶及标签酶酶分别使用锚酶及标签酶酶切,分离出每个切,分离出每个cDNA上的标签上的标签(tag),经连接成
4、双标签经连接成双标签(ditag),分析其组成,去除变形体后,经分析其组成,去除变形体后,经PCR扩增、酶切后,串联扩增、酶切后,串联ditag,对照基因文库,查出不同对照基因文库,查出不同tag代表的不同基因及可能的代表的不同基因及可能的基因产物,如果在文库中无匹配的序列,就有可能发现了新的基因产物,如果在文库中无匹配的序列,就有可能发现了新的基因;同时还可利用基因;同时还可利用SAGE tag的丰度确定基因表达丰度。但的丰度确定基因表达丰度。但是由于是由于SAGE技术所得到的标签信息量少,对未搜索到的匹配技术所得到的标签信息量少,对未搜索到的匹配序列的标签鉴定存在困难,因此该技术主要局限于
5、序列的标签鉴定存在困难,因此该技术主要局限于GenBank、EST数据丰富的生物,如人类、小鼠、大鼠等。数据丰富的生物,如人类、小鼠、大鼠等。2.6 cDNA微阵列或芯片微阵列或芯片(DNA microarray or chip)技术技术近年发展起来的又一新的分子生物学研究技术,其实验近年发展起来的又一新的分子生物学研究技术,其实验包括包括6个步骤:将个步骤:将cDNA克隆加工为可供点印的材料;将克隆加工为可供点印的材料;将cDNA克隆克隆(或寡核苷酸或寡核苷酸)点印到载体上;样品点印到载体上;样品RNA的分离的分离(总总RNA或或mRNA);探针的制备探针的制备(例如例如cDNA的合成和标的
6、合成和标记记);标记的探针;标记的探针DNA与载体上的与载体上的DNA杂交;杂交结果的杂交;杂交结果的成像和图象分析。主要应用于:基因表达水平的检测;成像和图象分析。主要应用于:基因表达水平的检测;通过比较组织细胞基因的表达谱差异,可以发现新的可通过比较组织细胞基因的表达谱差异,可以发现新的可能致病基因或疾病相关基因;可进行基因点突变、多态能致病基因或疾病相关基因;可进行基因点突变、多态性检测及染色体结构研究。其最为主要的优点是:可自性检测及染色体结构研究。其最为主要的优点是:可自动、高效、同时检测目的材料中大量基因的表达情况;动、高效、同时检测目的材料中大量基因的表达情况;并几乎可用于所有核
7、酸杂交技术的领域。并几乎可用于所有核酸杂交技术的领域。3. 图位克隆图位克隆(map-based cloning)上世纪上世纪90年代初期图位克隆应运而生,成功完成了诸如人年代初期图位克隆应运而生,成功完成了诸如人NPCI等基因的克隆,其等基因的克隆,其大致原理是根据功能基因在基因组中存在相对较稳定的基因座,在利用分子标记大致原理是根据功能基因在基因组中存在相对较稳定的基因座,在利用分子标记技术对目的基因进行精确定位的基础上,用与目的基因紧密连锁的分子标记筛选技术对目的基因进行精确定位的基础上,用与目的基因紧密连锁的分子标记筛选DAN文库文库(如如YAC、BAC或或Cosmid文库文库),构建
8、出目的基因区域的物理图谱,再通,构建出目的基因区域的物理图谱,再通过染色体步行过染色体步行(chromosome walking)逐步逼近候选区域或通过染色体登陆逐步逼近候选区域或通过染色体登陆(chromosome landing)的方法,的方法, 最终找到包含该目的基因的克隆进而克隆该基因。定位克隆理论上适用于一切最终找到包含该目的基因的克隆进而克隆该基因。定位克隆理论上适用于一切基因,但也存在应用上的一些不足:构建叠跨克隆群可能存在着困难;精细作基因,但也存在应用上的一些不足:构建叠跨克隆群可能存在着困难;精细作图成本很高;定位克隆不能提供基因功能的相关信息,需借助其他手段。图成本很高;
9、定位克隆不能提供基因功能的相关信息,需借助其他手段。 4. 转座子标签转座子标签(transposon tagging)技术技术转座子是染色体上一段可以移动的转座子是染色体上一段可以移动的DNA序列,它可以从一个基因座位转移到另一个序列,它可以从一个基因座位转移到另一个基因座位,当转座子插入到某个功能基因内部或邻近位点时,就会使插入位置的基基因座位,当转座子插入到某个功能基因内部或邻近位点时,就会使插入位置的基因失活并诱导产生突变型,通过遗传分析可以确定某基因的突变是否由转座子引起因失活并诱导产生突变型,通过遗传分析可以确定某基因的突变是否由转座子引起,由转座子引起的突变可用转座子,由转座子引
10、起的突变可用转座子DNA为探针,从突变株的基因组文库中钓取含该为探针,从突变株的基因组文库中钓取含该转座子的转座子的DNA片段,获得含有部分突变株片段,获得含有部分突变株DNA序列的克隆,序列的克隆, 然后以该然后以该DNA序列为探针,筛选野生型植株的基因组文库,最终得到完整的序列为探针,筛选野生型植株的基因组文库,最终得到完整的目的基因。该技术主要用于植物基因的克隆,由于可供利用的转座子的种类太目的基因。该技术主要用于植物基因的克隆,由于可供利用的转座子的种类太少,而转座子在不同的植物中转座的频率和活性相差很大,并且需要筛选大量少,而转座子在不同的植物中转座的频率和活性相差很大,并且需要筛选
11、大量的个体来鉴定转座子突变个体,限制了转座子标签法的应用范围。的个体来鉴定转座子突变个体,限制了转座子标签法的应用范围。(一)、电子克隆的特点:(一)、电子克隆的特点:挖掘和克隆功能基因是利用基因工程技术进行植物品种改良、挖掘和克隆功能基因是利用基因工程技术进行植物品种改良、有效利用基因资源的基础。基因克隆的传统方法主要是图位克有效利用基因资源的基础。基因克隆的传统方法主要是图位克隆和转座子标签法克隆等,但这些方法操作技术复杂,成本高隆和转座子标签法克隆等,但这些方法操作技术复杂,成本高,实验周期长,在基因克隆中并没有能得到非常广泛的运用。,实验周期长,在基因克隆中并没有能得到非常广泛的运用。
12、最近发展起来的最近发展起来的mRNA差异显示技术、抑制差减杂交技术和基差异显示技术、抑制差减杂交技术和基因表达系列分析技术由于其操作相对简便、效率高,已成为功因表达系列分析技术由于其操作相对简便、效率高,已成为功能基因克隆的重要手段,在许多实验室得到应用,但其主要缺能基因克隆的重要手段,在许多实验室得到应用,但其主要缺点是得到的点是得到的cDNA都不是全长都不是全长cDNA,必须通过必须通过cDNA文库筛文库筛选或选或RACE的方法才能获得全长的方法才能获得全长cDNA,进一步用于基因的功进一步用于基因的功能分析和转基因研究。能分析和转基因研究。电子克隆电子克隆(in silico cloni
13、ng)是近年来伴随着基因组计划和是近年来伴随着基因组计划和EST(expressing sequence tag)计划发展起来的基因克隆新方法,它的主要原理是利用日益发展计划发展起来的基因克隆新方法,它的主要原理是利用日益发展的生物信息学技术,借助电子计算机的巨大运算能力,通过的生物信息学技术,借助电子计算机的巨大运算能力,通过EST或基因组的序列或基因组的序列组装和拼接,利用组装和拼接,利用RT-PCR的方法快速获得功能基因,具有投入低、速度快、技的方法快速获得功能基因,具有投入低、速度快、技术要求低和针对性强等优点。术要求低和针对性强等优点。 (二)二)EST简介简介1 1 什么是表达序列
14、标签(什么是表达序列标签(Expression sequence tag ,EST )?)?短短 cDNA序列,完整基因的某些片段。单次文库测序产生的序列,完整基因的某些片段。单次文库测序产生的cDNA,一般在一般在400-600 bp,GenBank中大约中大约70是是EST。 2 EST如何产生?如何产生?从特定的状态的组织或细胞中分离从特定的状态的组织或细胞中分离 RNA,将将RNA逆转录成逆转录成cDNA亚克隆到亚克隆到载体中,利用载体上的引物对插入片段测序载体中,利用载体上的引物对插入片段测序 测序出来的片段结果即称为测序出来的片段结果即称为E S T s ( e x p r e s
15、 s e d s e q u e n c e t a g s ) 。 3 使用使用EST时应该注意的问题:时应该注意的问题:(1)由于是单次测序结果,序列的精确度较低,存在较多错误。)由于是单次测序结果,序列的精确度较低,存在较多错误。(大约大约 2% error,HGP错误率标准是错误率标准是0.01%),表现在:,表现在:缺失、替代、插入等错误(与缺失、替代、插入等错误(与mRNA相比)。相比)。测序中的错误引发大约测序中的错误引发大约1.5%的利用的利用oligo T产生的产生的EST无法无法与已知的与已知的mRNA的的3端比对上。端比对上。倒置(倒置(5端和端和3端弄反,插入克隆载体时
16、出错)。端弄反,插入克隆载体时出错)。嵌合嵌合EST (5端和端和3端来自不同端来自不同mRNA)。)。随着人类基因组计划的实施,已有研究人员利用电子克隆的方法克隆了很多人的随着人类基因组计划的实施,已有研究人员利用电子克隆的方法克隆了很多人的功能基因。由于受到序列资料的限制,植物基因的电子克隆还鲜有报道。目前在功能基因。由于受到序列资料的限制,植物基因的电子克隆还鲜有报道。目前在GenBank中已经登录了大量的中已经登录了大量的EST数据,而且数据,而且EST每天还在高速地增长。例如,每天还在高速地增长。例如,在在2002年初,我国华大基因公司和瑞士年初,我国华大基因公司和瑞士Syngent
17、a公司同时公布了水稻基因组的序公司同时公布了水稻基因组的序列框架图,因此可以利用生物信息学技术全面开展分析和鉴定水稻等植物的功能列框架图,因此可以利用生物信息学技术全面开展分析和鉴定水稻等植物的功能基因。基因。(三)国际上(三)国际上3大核酸数据库大核酸数据库 (含有大量的(含有大量的EST数据)数据)数据库数据库 (Database) 网址网址 (Address)EMBL GenBank DDBJ www.ebi.ac.uk/embl /GenBank www.ddbj.nig.ac.jp 国际上三大核酸数据库国际上三大核酸数据库EMBL:欧洲分子生物
18、学实验室欧洲分子生物学实验室(European Molecular Biology Laboratory, 其其下有下有European Bioinformatics Centre),主要位于英国剑桥主要位于英国剑桥Cambridge和德国汉堡和德国汉堡Hamburg。GenBank:由美国国家生物技术信息中心由美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI)建立。该中心隶属于美国国家医学图书馆,位于美建立。该中心隶属于美国国家医学图书馆,位于美国家卫生研究院国家卫生研究院(NIH)内。内。DDBJ:日本日本DN
19、A数据库数据库(DNA Data Bank of Japan), 由由the National Institute of Genetics, NIG主管。主管。这这3个大型数据库于个大型数据库于1988年达成协议,组成合作联合体。它们每天交换信息,并对数年达成协议,组成合作联合体。它们每天交换信息,并对数据库据库DNA序列记录的统一标准达成一致。每个机构负责收集来自不同地理分布的数据序列记录的统一标准达成一致。每个机构负责收集来自不同地理分布的数据(EMBL负责欧洲,负责欧洲,GenBank负责美洲,负责美洲,DDBJ负责亚洲等),然后来自各地的所有负责亚洲等),然后来自各地的所有信息汇总在一
20、起,信息汇总在一起,3个数据库的数据共享并向世界开放,故这个数据库的数据共享并向世界开放,故这3个数据库又被称为公共个数据库又被称为公共序列数据库(序列数据库(Public Sequence Database)。)。所以从理论上说,这所以从理论上说,这3个数据库所拥个数据库所拥有的有的DNA序列数据是完全相同的。你可以从中选择一个你喜欢的数据库;但是如果你序列数据是完全相同的。你可以从中选择一个你喜欢的数据库;但是如果你的研究需要实时的研究需要实时(24小时以内小时以内)的,则要注意这些数据库间的记录是会有差异的。的,则要注意这些数据库间的记录是会有差异的。 北京大学生物信息学中心北京大学生物
21、信息学中心(Centre of Bioinformatics, Peking University):北京华大基因研究中心:北京华大基因研究中心:http:/ :我国主要的相关研究机构我国主要的相关研究机构(四)利用(四)利用EST数据库信息进行电子克隆数据库信息进行电子克隆利用利用EST数据库信息进行功能基因的电子克隆是目前最常用的手段。首先选择感兴趣数据库信息进行功能基因的电子克隆是目前最常用的手段。首先选择感兴趣的的EST作为查询探针,搜索作为查询探针,搜索dbEST数据库,找到部分重叠的数据库,找到部分重叠的EST进行拼接,然后再以进行拼接,然后再以拼接好的拼接好的EST重叠群重叠群(
22、EST contig)为新的查询探针,继续搜索为新的查询探针,继续搜索dbEST库,直到没有新库,直到没有新的的EST可供拼接为止,最后根据拼接好的完整序列设计可供拼接为止,最后根据拼接好的完整序列设计PCR引物,通过引物,通过RT-PCR的方的方法获得目的法获得目的cDNA克隆并进行序列测定验证。克隆并进行序列测定验证。 目前利用目前利用EST序列拼接获得水稻等植物的完整序列拼接获得水稻等植物的完整cDNA的研究的研究已经有一些报道。已经有一些报道。例如,南京农业大学的黄骥等以来源于水稻盐胁迫例如,南京农业大学的黄骥等以来源于水稻盐胁迫cDNA文文库的库的1个个500bp的的ESTS121为
23、信息探针搜索位于为信息探针搜索位于GenBank的的水稻水稻EST库,发现有库,发现有2个个EST与与S121部分序列一致,经过拼部分序列一致,经过拼接组装获得了接组装获得了1个个886bp的全长的全长cDNA序列,同源性比较的结序列,同源性比较的结果表明其可能编码一个新的水稻锌指蛋白基因,根据拼接好果表明其可能编码一个新的水稻锌指蛋白基因,根据拼接好的序列设计的序列设计PCR引物,通过引物,通过RT-PCR的方法成功分离了该基的方法成功分离了该基因的完整因的完整cDNA克隆,命名为克隆,命名为OsZFP,该锌指蛋白可能涉及该锌指蛋白可能涉及到水稻幼苗的盐胁迫应答反应。到水稻幼苗的盐胁迫应答反
24、应。 此外,对某种植物来说,除了利用其自身的此外,对某种植物来说,除了利用其自身的ESTEST作查询探针外,还可以选择其他作查询探针外,还可以选择其他物种尤其是亲缘关系较近的物种全长或物种尤其是亲缘关系较近的物种全长或ESTEST作为查询探针,搜索作为查询探针,搜索dbESTdbEST库,进而拼库,进而拼接成完整的接成完整的cDNAcDNA序列。其主要理论依据是不同物种同类基因之间存在序列保守序列。其主要理论依据是不同物种同类基因之间存在序列保守性。性。唐向荣等发现唐向荣等发现2 2个水稻个水稻ESTEST片段与大白菜片段与大白菜BcpLHBcpLH基因的双链基因的双链RNARNA结合结构域结
25、合结构域( (dsRBD)dsRBD)有同源区域,根据同源片段设计引物有同源区域,根据同源片段设计引物,用,用RT-PCRRT-PCR的方法从水稻愈伤组织中扩增得到了的方法从水稻愈伤组织中扩增得到了1.81.8kbkb的的cDNAcDNA片段,该片段,该cDNAcDNA含有完整的编码区,有两个典型的含有完整的编码区,有两个典型的dsRBDdsRBD,与大白菜与大白菜BcpLHBcpLH基因的基因的dsRBDdsRBD在氨基酸水平上相似性在氨基酸水平上相似性为为75%75%左右。左右。 黄骥等以玉米全长黄骥等以玉米全长6-6-磷酸葡萄糖酸脱氢酶磷酸葡萄糖酸脱氢酶cDNAcDNA为查询探针,为查询
26、探针,搜索水稻搜索水稻dbESTdbEST数据库,发现了几十条高度同源的水稻数据库,发现了几十条高度同源的水稻ESTEST,通过序列组装和拼接获得了通过序列组装和拼接获得了1.8 1.8 kbkb左右的左右的cDNAcDNA序列,进一步序列,进一步用用RT-PCRRT-PCR的方法克隆了水稻的的方法克隆了水稻的6-6-磷酸葡萄糖酶基因。磷酸葡萄糖酶基因。 (六)利用基因组信息进行电子克隆(六)利用基因组信息进行电子克隆 的策略的策略在在GenBank中已经登录了庞大的小鼠、大鼠和人类等多种生物的中已经登录了庞大的小鼠、大鼠和人类等多种生物的EST数据资料数据资料,所以利用,所以利用EST拼接它
27、们的全长拼接它们的全长cDNA序列相对容易些。同时,基因组信息也在序列相对容易些。同时,基因组信息也在迅速增加,如在迅速增加,如在2002年初,中国华大公司将水稻基因组序列的测序结果无偿地年初,中国华大公司将水稻基因组序列的测序结果无偿地在在Internet上公布,供全世界免费使用,这无疑促进了水稻等植物功能基因的电上公布,供全世界免费使用,这无疑促进了水稻等植物功能基因的电子克隆。子克隆。 利用基因组信息资料进行电子克隆的最大优点就是基因的克隆不受作物发育时期利用基因组信息资料进行电子克隆的最大优点就是基因的克隆不受作物发育时期或特殊环境条件的限制,可以用来源于任何时期或组织的水稻和其他物种
28、的或特殊环境条件的限制,可以用来源于任何时期或组织的水稻和其他物种的EST或全长或全长cDNA序列作为信息探针搜索位于序列作为信息探针搜索位于GenBank或者我国华大公布的水稻基因或者我国华大公布的水稻基因组序列,随后根据内含子组序列,随后根据内含子“GU.AG”的规则通过人工拼接或相应的计算机软件预的规则通过人工拼接或相应的计算机软件预测,可以得到该基因完整的开放读码框测,可以得到该基因完整的开放读码框(ORFopen reading frame),根据拼接根据拼接的序列结果设计的序列结果设计PCR引物,进一步采取引物,进一步采取RT-PCR的方法获得目的基因的的方法获得目的基因的cDNA
29、克隆克隆并进行序列测定。并进行序列测定。 事实上,电子克隆往往是结合以上两个方面即事实上,电子克隆往往是结合以上两个方面即EST数据库和基因组信息资料同时进数据库和基因组信息资料同时进行的。因为行的。因为EST数据直接代表的是表达序列,所以在电子克隆的拼接中占有非常重数据直接代表的是表达序列,所以在电子克隆的拼接中占有非常重要的地位。一般策略是对于任何一个感兴趣的序列首先进行要的地位。一般策略是对于任何一个感兴趣的序列首先进行EST拼接,无法继续拼拼接,无法继续拼接后再进行基因组比较和外显子预测,以判断接后再进行基因组比较和外显子预测,以判断EST拼接的完整性。当然序列拼接只拼接的完整性。当然
30、序列拼接只是在计算机上的是在计算机上的“虚拟克隆虚拟克隆”,还需要通过,还需要通过RT-PCR、序列测定和序列测定和Northern杂交等杂交等方法进行验证和基因表达水平的鉴定。方法进行验证和基因表达水平的鉴定。随着生物信息学的迅猛发展,随着生物信息学的迅猛发展,Internet上已经开发了一些上已经开发了一些EST拼接和基因结构分析拼接和基因结构分析的软件,其中大多数都是免费提供,大大加快了电子克隆的速度。的软件,其中大多数都是免费提供,大大加快了电子克隆的速度。EST拼接软件的拼接软件的原理是,计算机程序自动将用户提供的原理是,计算机程序自动将用户提供的EST序列与序列与EST数据库比较,
31、构建数据库比较,构建EST重叠重叠群,得到尽可能长的群,得到尽可能长的EST拼接的序列反馈给用户。基因结构分析包括外显子预测、拼接的序列反馈给用户。基因结构分析包括外显子预测、启动子预测等。启动子预测等。 外显子预测主要指从外显子预测主要指从DNA中找到编码蛋白质的部分即外显子部分。因为不同的物中找到编码蛋白质的部分即外显子部分。因为不同的物种在外显子剪接、启动子序列上存在一些难以确定的差异,所以不同的程序其外种在外显子剪接、启动子序列上存在一些难以确定的差异,所以不同的程序其外显子的预测效果也不尽相同。在利用基因组拼接的过程中,为了分析基因的启动显子的预测效果也不尽相同。在利用基因组拼接的过
32、程中,为了分析基因的启动子区域可以使用启动子预测软件,以确定启动子的位置以及更准确地确定基因结子区域可以使用启动子预测软件,以确定启动子的位置以及更准确地确定基因结构预测的结果。构预测的结果。 另外还有一些预测转录起始位点、另外还有一些预测转录起始位点、Poly(A)加尾信号、转录因子结合位点的软件,加尾信号、转录因子结合位点的软件,都可以验证基因组拼接的结果,并对自己感兴趣的序列作出结构和功能的预测。当都可以验证基因组拼接的结果,并对自己感兴趣的序列作出结构和功能的预测。当然,利用网上程序预测的基因结构不可能是然,利用网上程序预测的基因结构不可能是100%可靠的,应该同时利用几个程序可靠的,
33、应该同时利用几个程序预测的结果并结合自己的拼接经验综合考虑,确定最有可能的基因结构。预测的结果并结合自己的拼接经验综合考虑,确定最有可能的基因结构。 (七)电子克隆中电子延伸是其中最为重要(七)电子克隆中电子延伸是其中最为重要的一步,电子延伸系统应该有以下几个部分的一步,电子延伸系统应该有以下几个部分组成:组成:预处理预处理(preprocessing)、聚类聚类(clustering)、拼接拼接(assembly) 和分析和分析(analysis)。 预处理预处理1. 除去载体序列除去载体序列2 . 将将 E S Ts 序 列 将 与 人 重 复 序 列 库序 列 将 与 人 重 复 序 列
34、 库 ( R e p B a s e , / ) 比较,除去重复序列,这样可以比较,除去重复序列,这样可以提高拼接的效率。提高拼接的效率。 3.其它潜在的污染序列其它潜在的污染序列(如线粒体、核糖体如线粒体、核糖体DNA 序列等序列等) 4.还有几种污染属于研究前沿,至今没有很好的解决。还有几种污染属于研究前沿,至今没有很好的解决。包括:如果是包括:如果是ESTEST序列,要去除来自基因组序列,要去除来自基因组DNA的污染、来的污染、来自自pre-mRNA的污染、跨越非常规内含子(不是以的污染、跨越非常规内含子(不是以GT或或GC开头和开头和AG结尾的
35、内含子)的结尾的内含子)的EST,这些都会影响拼接的成这些都会影响拼接的成功率和正确率。功率和正确率。 聚类聚类在对大量在对大量ESTs数据进行分析时,数据进行分析时, 情况比较复杂,从概念上区分情况比较复杂,从概念上区分“聚类聚类”和和“拼接拼接”是必要的。聚类过程的目的是将标记同一基因相同转录本的、具有重叠是必要的。聚类过程的目的是将标记同一基因相同转录本的、具有重叠部分部分(overlapping)的的ESTs整合至单一的簇整合至单一的簇(cluster)中。中。拼接拼接使用生物信息学软件进行,如:使用生物信息学软件进行,如:PHRAP(phragment assembly progra
36、m)/index.htmlCAP3该软件是该软件是CAP(contig assembly programme)的改进版的改进版本,可在线进行。本,可在线进行。 CAP3 CAP3在线服务:在线服务:/aat/sas.html /aat/sas.html TIGR assembler zEST assembler MIRA2: /mira_downloads.htmlG
37、igAssembler: /learithe/browse/goldenPath/algo.html 分析及文库构建分析及文库构建如果要验证拼接是否正确,或同时想经过比对对结果再进行延伸,就需要与转录组如果要验证拼接是否正确,或同时想经过比对对结果再进行延伸,就需要与转录组数据库和蛋白质组数据库进行比对数据库和蛋白质组数据库进行比对 。(八)电子克隆中的一些常见问题(八)电子克隆中的一些常见问题和对策和对策 电子克隆虽然在执行速度上有很大的优势,但在实际应用中常常会碰到一些非常棘电子克隆虽然在执行速度上有很大的优势,但在实际应用中常常会碰到一些非常棘
38、手的问题,针对这些问题,列出了以下解决方案。手的问题,针对这些问题,列出了以下解决方案。(1) 有时难以获得完整的有时难以获得完整的5端序列。这是电子克隆中遇到的最主要问题。因为植物基端序列。这是电子克隆中遇到的最主要问题。因为植物基因的因的5端保守性一般比较低,在以基因组序列为基础的电子克隆中尤其难以确定。端保守性一般比较低,在以基因组序列为基础的电子克隆中尤其难以确定。根据根据Kozak规则以及我们的经验,对于完整规则以及我们的经验,对于完整ORF的的5的完整性一般有以下几条原则的完整性一般有以下几条原则:(2)对于通过基因组结构预测获得的基因,有时候难以确定其对于通过基因组结构预测获得的
39、基因,有时候难以确定其表达的时期,给表达的时期,给RT-PCR验证带来困难。一般可以根据其功能验证带来困难。一般可以根据其功能预测或查找相关的文献资料确定该基因的表达时期,也可以预测或查找相关的文献资料确定该基因的表达时期,也可以同时测定各个时期和不同组织的表达谱加以判断。同时测定各个时期和不同组织的表达谱加以判断。(3)有些查询探针是来自与水稻同源关系较远的物种,给基因有些查询探针是来自与水稻同源关系较远的物种,给基因结构的人工分析带来困难。这种情况下可以借助于基因结构结构的人工分析带来困难。这种情况下可以借助于基因结构预测软件,使得结构分析变得简单而且准确。由于水稻基因预测软件,使得结构分
40、析变得简单而且准确。由于水稻基因的基因组序列平均只有的基因组序列平均只有4.5kb,只要将该基因估计的基因组序只要将该基因估计的基因组序列列(10kb)进行预测,一般都能得到比较准确的结果。进行预测,一般都能得到比较准确的结果。 (九)电子克隆技术的展望(九)电子克隆技术的展望 电子克隆技术是随着基因组和电子克隆技术是随着基因组和EST计划的发展而产生的,开始计划的发展而产生的,开始主要应用于人类。主要应用于人类。2002年年初我国水稻基因组序列资料的发布年年初我国水稻基因组序列资料的发布使得水稻基因的电子克隆成为可能。相信电子克隆很快就会在使得水稻基因的电子克隆成为可能。相信电子克隆很快就会
41、在水稻的基因克隆中占有非常重要甚至主导性地位。水稻的基因克隆中占有非常重要甚至主导性地位。与传统的基因克隆方法相比,电子克隆主要有以下优点:与传统的基因克隆方法相比,电子克隆主要有以下优点: 1) 速速度快。包括同源性比较、序列拼接组装等工作在计算机上完成度快。包括同源性比较、序列拼接组装等工作在计算机上完成,只需,只需RT-PCR序列验证即可。序列验证即可。 2) 投入低。电子克隆只需能够投入低。电子克隆只需能够上网的计算机和上网的计算机和PCR仪等仪器即可进行,实验成本较低。仪等仪器即可进行,实验成本较低。 3) 技技术要求低。实验室工作只涉及到术要求低。实验室工作只涉及到RNA抽提、反转
42、录、抽提、反转录、PCR扩增扩增等分子生物学的基本实验,研究人员很容易掌握。等分子生物学的基本实验,研究人员很容易掌握。 4) 针对性强针对性强。 拟克隆基因的生物学功能大都比较明确,一旦获得即可直接应用于转基因技术进行拟克隆基因的生物学功能大都比较明确,一旦获得即可直接应用于转基因技术进行作物品种改良。随着遗传图谱与以序列为基础的物理图谱的整合,直接将目的基因作物品种改良。随着遗传图谱与以序列为基础的物理图谱的整合,直接将目的基因与连锁标记的遗传距离转换为物理图距后的电子克隆有可能成为取代传统的图位克与连锁标记的遗传距离转换为物理图距后的电子克隆有可能成为取代传统的图位克隆的重要措施;而对于
43、采用抑制差减杂交、差异显示或基因表达系列分析等方法得隆的重要措施;而对于采用抑制差减杂交、差异显示或基因表达系列分析等方法得到的到的EST采取电子克隆的方法获得全长采取电子克隆的方法获得全长cDNA的策略,则可成为取代的策略,则可成为取代RACE或或cDNA文库筛选的最佳方案。文库筛选的最佳方案。 电子克隆技术的产生很可能从此改变植物基因研究的策略,电子克隆技术的产生很可能从此改变植物基因研究的策略,人们关注的焦点更多地集中于克隆基因的功能研究,在很多人们关注的焦点更多地集中于克隆基因的功能研究,在很多规模较小的实验室可以轻易地建立起基因克隆规模较小的实验室可以轻易地建立起基因克隆-转基因功能
44、研转基因功能研究的实验体系,使得水稻基因工程的内部联系更加紧密。除究的实验体系,使得水稻基因工程的内部联系更加紧密。除此之外,人们还可以利用电子克隆技术,以水稻为研究对象此之外,人们还可以利用电子克隆技术,以水稻为研究对象在基因水平上研究某些复杂事件或途径的机制。综上所述,在基因水平上研究某些复杂事件或途径的机制。综上所述,电子克隆在今后的基因克隆中将起到不可替代的作用。伴随电子克隆在今后的基因克隆中将起到不可替代的作用。伴随着基因组计划出现的电子克隆必将大大加速基因结构、功能着基因组计划出现的电子克隆必将大大加速基因结构、功能研究的进程,推动比较基因组学的发展和水稻基因的进化、研究的进程,推
45、动比较基因组学的发展和水稻基因的进化、起源方面的研究,使得我们赖以生存的水稻更好地造福于人起源方面的研究,使得我们赖以生存的水稻更好地造福于人类。类。 EST walking基于染色体基于染色体DNA序列的电子克隆序列的电子克隆53ESTSearch in EST databaseSearch in EST databaseSearch in ESTdatabaseSearch in ESTdatabase53Complete cDNASeed EST (start EST)AU184451RICR2584A99AS825D004D07C25822RICS1291AAAAAAAD004D07A
46、AAAAA99AS825AU184451RICR2584AC25822RICS1291AATGTAA一个一个EST walking的示例的示例苹果酸脱氢酶同功酶基因的拼接苹果酸脱氢酶同功酶基因的拼接EST, partial cdsSearch in genomic sequence databaseGenomic sequence of ESTgene annotationHomolog search based on a.a sequenceSearch in EST databaseCorrect annotated gene By EST and homologpredicted gen
47、eDesign 5-, 3-primers based on predicted sequnceRT-PCR for cDNAcloning and sequencingEST walking 的优点和局限的优点和局限优点优点:快速,无须实验操作快速,无须实验操作局限局限:1. EST库不均一;库不均一;2. EST库测序精度不高库测序精度不高3. EST库中有不完全剪切产物库中有不完全剪切产物水稻水稻emf2基因的注释和校读示例基因的注释和校读示例EST walking的技巧的技巧1.如何鉴定片段重叠和筛选最佳目的如何鉴定片段重叠和筛选最佳目的EST?2. 如何选择合适的片段用于检索如何选择
48、合适的片段用于检索EST文库?文库?CLONE INFO CLONE INFO Clone Id: S20127_2Z Clone Id: S20127_2Z DNA type: cDNA DNA type: cDNA RIMERS PolyA Tail: Unknown RIMERS PolyA Tail: Unknown SEQUENCE SEQUENCE GATATGCGGCTANTATAGCCAGCATGCCATATGAGGGGCTTTTAGCATTAGAAGAGCAGA GATATGCGGCTANTATAGCCAGCATGCCATATGAGGGGCTTTTAGCATTAGAAGAGC
49、AGA TTGGNGATGTAAATACTGGTCTGGCAAAAAGCTACATTGTAGAGAAATTGAAGACTAGCT TTGGNGATGTAAATACTGGTCTGGCAAAAAGCTACATTGTAGAGAAATTGAAGACTAGCT TATTTGTNCCAGGATCATCCTGCATGTCTAATAAGTCTTCTGAATCTTCCATGGAGAATG TATTTGTNCCAGGATCATCCTGCATGTCTAATAAGTCTTCTGAATCTTCCATGGAGAATG ATGCTTGCATAATATGCCAGGAAGAGTATCAGGTTAAAGAATGCATTGGAAC
50、CCTTGACT ATGCTTGCATAATATGCCAGGAAGAGTATCAGGTTAAAGAATGCATTGGAACCCTTGACT GTGGCCACAGGTACCACGAAGATTGCATAAAACAATGGTTGATGGTAAAGAATTTATGCC GTGGCCACAGGTACCACGAAGATTGCATAAAACAATGGTTGATGGTAAAGAATTTATGCC CCATCTGCAAGACGACAGCTTTGTCAACCGGAAGAAGAAGTGGATAACGAACAGGAATAA CCATCTGCAAGACGACAGCTTTGTCAACCGGAAGAAGAAGTGGATAA
51、CGAACAGGAATAA TCTTATTAGTTATTTACTTCCGACAAATATTCAGCTCAATTTTGTATATAAGAAACGGTA TCTTATTAGTTATTTACTTCCGACAAATATTCAGCTCAATTTTGTATATAAGAAACGGTA GACCATTCTGCTACCTGTATTTGTTGCTCACTTTGTTGTGATCCGGGAGTAACTCAGCTT GACCATTCTGCTACCTGTATTTGTTGCTCACTTTGTTGTGATCCGGGAGTAACTCAGCTT CCTAAACTGTACAGCCATAACATTGATCATTTTCTTCGGTGT
52、AGAATATTTTAAATTACT CCTAAACTGTACAGCCATAACATTGATCATTTTCTTCGGTGTAGAATATTTTAAATTACT CAGTTCGCCCCCATCTGTATCATAAGGCGGACCGACAAAAAAACTCACAATGTCATTTCT CAGTTCGCCCCCATCTGTATCATAAGGCGGACCGACAAAAAAACTCACAATGTCATTTCT AGGCAAACATTGTATCTACCATCAGATTAAAAATCAGAACAGAACATGTGCTCTTCTGTN AGGCAAACATTGTATCTACCATCAGATTAAAAATCAG
53、AACAGAACATGTGCTCTTCTGTN CAAAAAAAAAAAAAAAAAAAAAAAAAAAA CAAAAAAAAAAAAAAAAAAAAAAAAAAAA Genomic DNA* * *cDNAEST homologa.a homologGene annotationpredicted gene优点:优点:1.充分利用现有的信息资源充分利用现有的信息资源 A. 基因组测序结基因组测序结 B. 其他物种的其他物种的EST、cDNA信息信息2.基因组测序精度远高于基因组测序精度远高于EST测序精度测序精度缺点和局限缺点和局限:1. 必须经实验验证必须经实验验证2. 不适用以下种类的基因预测不适用以下种类的基因预测 A. 种间保守性差的基因种间保守性差的基因 B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版初中七年级下册历史与社会 5.3.2 东部和西部差异显著 说课稿
- 2025年音乐教研组工作计划
- 2025年春科学教研组教研计划
- 2025年幼儿园保洁卫生工作计划
- 2025年集团会计核算年度工作计划
- 2025年老师年终培训工作计划范文
- 2025年服装店工作计划书
- 边牧抚养知识培训课件
- 2025年高考物理二轮复习计划五步走
- 2025年店长工作计划书
- 2024年道路清障拖车服务合同协议3篇
- 2025年1月八省联考河南新高考物理试卷真题(含答案详解)
- 建设工程检试验工作管理实施指引
- 软件租赁合同范例
- 汇川技术在线测评题及答案
- 广东省广州市2023-2024学年高一上学期期末物理试卷(含答案)
- 2024年四川省公务员录用考试《行测》真题及答案解析
- 银行内部管理档案制度
- 安徽省芜湖市2023-2024学年高一上学期期末考试 物理 含解析
- 电气自动化年终总结
- 第2章-变压器的基本作用原理与理论分析
评论
0/150
提交评论