用于Illumina测序平台数据分析的图像界面软件需求_第1页
用于Illumina测序平台数据分析的图像界面软件需求_第2页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用于Illumina测序平台数据分析的图像界面软件需求一、名称:专用于 Illumina 测序平台数据分析的图像界面软件二、用途:是一款生物信息学综合分析工具,其界面友好直观,操 作简便,易于掌握。除了基本的分子生物学工具外,如序列比对、进 化树构建等, 还可对所有主流的二代测序平台产生的测序结果进行 数据分析,如重测序分析、 转录组学分析、表观基因组学分析和从头 拼接,并且该软件还可自定义标准化的工作流程(Workflow )用于Illumina 数据拼接、分析,以及分析 16S,18S,ITS 及其他扩增区 域的二代测序数据分析。三、购置数量: 1四、主要技术参数1、该软件是一个基因组工作

2、台的综合分析包,它可以分析可视化数 据,可以分析所有主要的 NGS(二代测序)平台数据,比 SOLiD Roche454、Illumina 、 Ion Torrent的数据。2、 适用的测序数据一代测序数据, Sanger 平台; 几乎所有的二代测序平台产生的数据,如S O L i D、 L ifeIon Torrent 、Complete Genomics、Roche454、Illumina Genome Analyzer ; 三代测序数据, PacBio 平台。3、 提供 De novo 或公开数据库的 OTL 丛集比对。4、使用自动分析流程,可快速获得病原种类及分型病毒实验室数据用于二代

3、测序信息分析 。5、数据库支持,可以自动连接相关基因数据库5.1、 可下载及分类 NCBI 全部微生物基因组数据库5.2、 可下载整合 GO 数据库5.3、 可下载整合 Protein Family-Pfam 数据库5.4 、可下载整合病原物种序列数据库5.5、 可下载整合抗药性基因数据库6、分类及组态分析6.1 、分析 16S, 18S, ITS 及其他扩增区域的二代测序数据分析6.2、 提供 De novo 或公开数据库的 OTU 丛集比对6.3、 OTU 数据库:Greengenes, SILVA, and UNITE6.4 、可针对不同分类层级的结果搭配样本注解一同呈现6.5 、对微生

4、物全基因组序列进行分类6.6、 可针对特别功能性区域进行数据汇整分类7、统计分析7.1 、计算群内群外的样本差异7.2 、搭配样本注解提供 PCA plot 结果呈现7.3、 PERMANOVA 计分析7.4 、统计不同样本的微生物族群丰度7.5、测量均质化 OTU 丰度 7.6、评估统计差异7.6 、探索样本之间的关系系数8、使用自动分析流程 , 可快速获得病原种类及分型 :8.1 、Multi locus sequence type (MLST)8.2 、分类8.3 、最接近的物种及参考序列8.4 、微生物抗药性基因8.5 、建立基因亲缘树8.6 、根据分型及亲缘分析 , 可以了解病源爆发

5、演化的关联性8.7 、提供数据运算管理及样本注解的整合介面 .9、利用二代测序对微生物做全基因组测序并分型10、 Read mapping序列比对功能支持 short reads 、 long reads 及 paired reads ;支 持空位比对和非空位比对; 支持 Illumia 、Sanger、Roche454 和 SOLiD 的测序数据。 Color space mapping 比对 35merSOLiD 数据,多发现 的匹配数高达 80%。只要计算机有足够的内存, CLC Genomics Workbench 可以将序列比 对到任意大小的基因组上。在一台内存为 24G 的标准配置

6、的计算机 上,可以进行 10 倍于人类基因组数据的序列比对。11、 De novo assemblyDe novo assembly 功能支持 short reads 、long reads 及 pairedreads ;支持 lllumi na Gen omeA nalyzer、San ger、Roche454 和 SOLiD的测序数据;可拼装任意大小的基因组。使用该功能,用户无需进行 枯燥的数据运算,显著减少了手工作业量。*12、SNP 检测提供基于 NQS( Neighborhood Quality Standard )算法的自动化 SNP 检测。如果参考序列带有 ORF 或者 CDS

7、注释,SNP 佥测也将报告该 SNP 是同义突变还是非同义突变。如果 SNP 导致翻译产生的蛋白质中的氨 基酸发生改变, 那么新的氨基酸将被报告。 而它的图形用户界面能让 用户轻松识别 SNP 在或大或小的基因组区段都能获得 SNP 的全貌图。*13 、多样本分析在进行不同样品的批量测序时, 通过使用多样本分析技术可以在同一 流程中运行多个样本。通常情况下,不同样品的 reads 很难分离。因 此,来自同一样本的 reads 被放在一起分析。CLC Geno mics Workbe nch 支持大量多样本方案,包括基于名称的多 种类型的多样本方案及基于标签或条码的多样本方案。14、数字基因表达

8、支持基于 Mortazavi A 等方法的 mRNA seq 该模块的一大优点就是 统计结果基于RPK(每百万mapped reads中每一千碱基外显子模型 的 reads 数),这是在使用数字基因表达时,对基因表达水平进行标 准化的好而简单的方法。15、小 RNA 分析可对 SOLiD 川 umina 和 454 系统产生的小 RNA 序列进行分析。分析 的第一步是接头的去除及从多样本数据中提取某一样本的数据, 然后 进行标签计数,最后利用 miRBase 及其他数据资源对小 RNAS 进行注 释。在前体或成熟的 miRNA 水平上可进行分组注释。最终的结果可利 用表达分析工具来查看和分析。

9、16、 标签表达谱具备强大的标签作图功能,这是使用新生代测序技术对 SAG 啲一个 扩展。整个工作流程都支持从携带标签的 reads 中提取标签、 创建虚 拟的标签目录以及用基因名称为标签进行注释。17、 表观基因组学分析含有全套整合的 ChIP 测序分析方案,用户可轻松将数据比对到参考 序列,而得到 ChlP 测序结果的高级视图和图表输出。数据可以是基 于 ChIP 的单个样本信息,也可以是 ChIP 样本和对照样本的比较信息。18、 EST 文库构建使用从头拼装算法可构建 EST 文库。19、 服务器整合用户可以在一台或多台强大的中枢计算机上运行大型项目, 如全基因 组拼装。与此同时不影响

10、在本地计算机上进行其他数据的下游分析。20、定制化服务提供一个免费的基于 Java 的软件开发工具包(SDK。用户使用这个 软件开发工具包,可以将自有算法整合到我们的产品中。此外,我们 还能根据客户的特定需求,为 CLC Genomics Workbench 和 CLC Genomics Server设计和开发定制化的附加模块。这无疑成为客户提 高研究速度和研究质量的一种快速而经济的方法。*21 、Workflow 功能 在 workbench 中,可以将 tool box 中的各种工具连接起来构建一个 workflow。Workbench 也可批量运行,确保相同流程分析大量样本时 的快速准确。五、配置:1、硬件要求Mac OS X 10.7 或者更高版本; Intel 处理器;在 64 位 Intel 系统 中支持Mac OS X 10.5.8Win XP/Vista/Win7 ;Windows Server 2003/2008Linux: RedHat5 或更高版本;SuSE10 或更高版本64 位计算机或操作系统,建议内存不低于 2GB (小的数据集要求2-4GB;大的数据集要求 16-32GBIn tel 或 AMD 勺中央处理器1024X768 的分辨率显卡能够支持 Ope

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论