生物信息学 第6章 表达序列标签_第1页
生物信息学 第6章 表达序列标签_第2页
生物信息学 第6章 表达序列标签_第3页
生物信息学 第6章 表达序列标签_第4页
生物信息学 第6章 表达序列标签_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第6章 表达序列标签 Expressed Sequence Tags (EST) 一、表达序列与表达序列标签一、表达序列与表达序列标签 n什么是表达序列? 基因组表达为mRNA的序列 中心法则 EST的获得技术路线的获得技术路线 克隆区域 5测测 序序 位位 置置 3测测 序序 位位 置置 表达序列标签 (expressed sequence tag, EST) 从已建好的cDNA库中随机取出一个克隆, 从5末端或3末端对插入的cDNA片段进行一轮单 向自动测序,所获得的约60-500bp的一段cDNA 序列。 一、表达序列标签一、表达序列标签 二、二、ESTEST数据分析方法数据分析方法 随

2、机挑取克隆进行随机挑取克隆进行5或或3端测序端测序 序列前处理序列前处理 聚类和拼接聚类和拼接 基因注释及功能分类基因注释及功能分类 后续分析后续分析 去除低质量的序列去除低质量的序列(如使用如使用Phred) 应用应用BLAST、RepeatMasker或或Crossmatch屏蔽屏蔽数据数据 组中不属于表达的基因的赝象序列组中不属于表达的基因的赝象序列(artifactual sequences) 载体序列载体序列(/repository/vector) 重复序列重复序列(RepBase,) 污染序列污染序

3、列 (如核糖体如核糖体RNA、细菌或其他物种的基因、细菌或其他物种的基因 组组DNA等等) 去除其中的去除其中的嵌合克隆嵌合克隆 (一)序列前处理(一)序列前处理 ESTEST数据预处理流程数据预处理流程 聚类目的:将来自同一个基因或同一个转录本的具有聚类目的:将来自同一个基因或同一个转录本的具有 重叠部分重叠部分(over-lapping) 的的ESTs整合至单一的簇整合至单一的簇(cluster) 中中 聚类作用:聚类作用: 产生较长的一致性序列产生较长的一致性序列(contigs) ,用于注释,用于注释 降低数据的冗余,纠正错误数据。降低数据的冗余,纠正错误数据。 可以用于检测选择性剪切

4、。可以用于检测选择性剪切。 (二)(二)ESTs的聚类的聚类 (三)序列注释和分析(三)序列注释和分析 序列注释序列注释 后续分析后续分析 Y (一一) ESTs与基因识别与基因识别 在同一物种中搜寻基因家族的新成员在同一物种中搜寻基因家族的新成员(paralogs) 在不同物种间搜寻功能相同的基因在不同物种间搜寻功能相同的基因(orthologs) 已知基因的不同剪切模式的搜寻已知基因的不同剪切模式的搜寻 使用合适的比对参数,大于使用合适的比对参数,大于90的已经注释的基因都的已经注释的基因都 能在能在EST库中检测到。库中检测到。 (二二) ESTs与与基因表达谱的构建基因表达谱的构建 表

5、达量比较分析:不同组织或发育阶段基因表达量比较 EST来源于不同的组织,那么就可以对不同来源的基因 表达进行比较 (三三) ESTs与与新基因预测新基因预测 由于由于EST来源于来源于cDNA,因此每一条,因此每一条EST均代表了文库均代表了文库 建立时所采样品特定发育时期和生理状态下的一个基因建立时所采样品特定发育时期和生理状态下的一个基因 的部分序列。的部分序列。 (四四) ESTs与与SNP位点预测位点预测 来自不同个体的冗余的来自不同个体的冗余的ESTs可用于发现基因组中转录区可用于发现基因组中转录区 域存在的域存在的SNPs。 应注意区别真正的应注意区别真正的SNPs和由于测序错误而

6、引起的本身不和由于测序错误而引起的本身不 存在的存在的SNPs。解决这一问题可以通过:。解决这一问题可以通过: 提高提高ESTs分析的准确性。分析的准确性。 对所发现的对所发现的SNPs进行实验验证。进行实验验证。 (五)电子PCR克隆 n电子PCR克隆,指利用已经有的片段进行 全长基因序列的分析。 5 3 53 四四、EST数据的不足数据的不足 ESTs很短,没有给出完整的表达序列;很短,没有给出完整的表达序列; 低丰度表达基因不易获得低丰度表达基因不易获得; 由于只是一轮测序结果,出错率达由于只是一轮测序结果,出错率达2%5%; 有时有载体序列和核外有时有载体序列和核外mRNA来源的来源的

7、cDNA污染或污染或 是基因组是基因组DNA的污染;的污染; 有时出现有时出现镶嵌克隆镶嵌克隆; 序列的冗余,导致所需要处理的数据量很大。序列的冗余,导致所需要处理的数据量很大。 五、常用的五、常用的EST数据库数据库 数据库名称数据库名称网址网址说明说明 dbEST/dbEST/综合综合 UniGene/unigene综合综合 Gene Indices/tgi/综合综合 (一)(一)dbEST(database of EST) Genbank的一部分的一部分 63,236,621条数据(条数据(20091016) u描述:描述: u向向dbEST提交数据提交数据 按格式编辑数据按格式编辑数据 通过通过E-mail提交提交 更新数据更新数据 (二)(二)UniGene数据库数据库 Genbank的一部分的一部分 一条纪录为一个一条纪录为一个gene cluster u简介简介 (三)(三)Gene Indices数据库数据库 The Institute of Genomic R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论