生命科学高性能计算解决方案_第1页
生命科学高性能计算解决方案_第2页
生命科学高性能计算解决方案_第3页
生命科学高性能计算解决方案_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 生命科学高性能计算解决方案 摘要生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。背景介绍生物信息学在短短十几年间,已经形成了多个研究方向,其中与高性能计算相关的主要研究重点如下。序列比对序列比对(Sequence Alignment)的基本问题是比较两个或两个以上符号序列的相似性

2、或不相似性。从生物学的初衷来看,这一问题包含了以下几个意义:从相互重叠的序列片断中重构DNA的完整序列。在各种试验条件下从探测数据(probe data)中决定物理和基因图存贮,遍历和比较数据库中的DNA序列,比较两个或多个序列的相似性,在数据库中搜索相关序列和子序列,寻找核苷酸(nucleotides)的连续产生模式,找出蛋白质和DNA序列中的信息成分。在序列对比的过程中将会产生巨量的数据,这对我们的存储系统带来了较大规模的挑战。现在用于存储的硬盘容量每14个月会有一倍的增长,而基因序列的数据量则每5月左右会翻一番,例如:CeleraGenomics 和Sanger Centre 等主要基因

3、研究机构都在管理数以万亿字节计的数据,其数据库信息量超过了人类开展生物学研究以来积累的数据量。序列拼接序列拼接是将测序生成的reads短片段拼接起来,恢复出原始的序列。该问题是序列分析的基本任务,是基因组研究成功与失败的关键,拼接结果直接影响到序列标注,基因预测、基因组比较等后续任务。基因组序列的拼接也是基因组研究必须解决的首要难题。其困难不仅来自它的海量数据(以人类基因组序列为例,从数量为10兆级的片断恢复出长度为亿级的原始序列),而且源于它含有高度重复的序列。从计算机方面来讲,在拼接初期,会有大量的初始数据导入内存,然后对这些数据进行处理,因此,序列拼接对于计算机的内存量和计算能力都有非常

4、大的需求。基于结构的药物设计人类基因工程的目的之一是要了解人体内约10万种蛋白质的结构,功能,相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗。基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要的研究领域。为了抑制某些酶或蛋白质的活性,在已知其蛋白质3级结构的基础上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物。然后在数据库中进行对比并且得到优势结构,选择使用分子模拟的方法实现药物分子的设计。解决方案介绍基于分析我们得出,生物信息学类计算的核心内容是内存密集型,存储密集型,结合浪潮多年来的经验,我们为客户提供针对化专业的解决方案。浪潮高性

5、能应用集群主要解决了生物信息学中的四个主要问题:高性能对于高性能计算而言,一方面是浮点处理性能,另一方面为CPU本身的综合性能,浪潮结合生物信息学行业的特点,推荐使用Intel处理器,不仅实现了较高的处理性能,并且在能效比,内存支持,以及CPU本身的架构上intel都有很大的优势。内存问题在生物信息学应用中,先期数据的载入对于内存容量的要求越来越高,浪潮采用大内存服务器四路或者八路胖节点,可以在单节点中配置高达2TB内存,充分达到应用的实际需求。存储容量问题海量存储系统是生物信息学计算的先决条件。浪潮不仅可以提供了专业的直连存储,更有8Gb接口的光纤存储系统,通过专有的存储节点构建Lustre

6、并行文件系统,接入以太网,甚至40GB的Infiniband网络,总体容量可达到PB级,除此之外还考虑到用户的数据安全,数据备份等,从根本上解决了生物信息学的数据存储难题。系统高稳定性一套高稳定性的系统能够使我们的生物信息学应用更加方便快捷,同时也能够高效率的处理数据,保证业务不中断,浪潮通过统一的集群管理,作业调度,结合浪潮高性能的服务器,从各个方面保证了整套系统的稳定性,大大提高了用户的使用稳定性和减少了故障率,为用户提高生产力提供持续不间断的支持。客户收益应用分析浪潮拥有一支专业的HPC应用分析团队,可以针对客户应用,运用测试工具得出具体的硬件平台需求,从而帮助浪潮提为客户提供针对性的高性价比HPC解决方案。应用加速浪潮不仅为客户提供硬件产品、解决方案,而且研究HPC技术发展,在异构并行计算领域提前布局,建立一个优秀的应用开发团队,可以满足客户各种定制化开发服务,满足用户的特殊需求。在CPU技术方面,该团队成功与BGP合作完成单频属性提取、多时窗倾角扫描、体曲率提取、构造导向滤波、特征值相干、纹理属性提取、数据分离等石油勘探解释与处理CPU多核并行算法开发和优化项目。在GPU技术方面,浪潮具备从算法级、桌面级、集群级开发能力,与北京基因组所、西北工业大学、BGP合作完成Blastn、LES-LBM、PSTM、RNA等多款GPU软件,较原有软件获得几十倍性能提升。在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论