基因组学生物信息学及高性能计算_第1页
基因组学生物信息学及高性能计算_第2页
基因组学生物信息学及高性能计算_第3页
基因组学生物信息学及高性能计算_第4页
基因组学生物信息学及高性能计算_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组学生物信息学及高性能计算第一页,共三十五页,2022年,8月28日内容1.研究所整体介绍2.基因组及生物信息基础科研环境3.生物信息研究工作4.致谢第二页,共三十五页,2022年,8月28日

West

5InstitutesShanghai8InstitutesBeijing

7

InstitutesBio-relatedInstituteofCASMid-South5Institutes25Institutes19NationalKeyLabs15BotanicGardens18Museums9SpecimenDepository13ObservationStations第三页,共三十五页,2022年,8月28日3Mb30Mb400Mb3000MbOnecancertainlydosomethingusefulforChinaPLoSBiology2005RiceGeneMapsStartfrom1999第四页,共三十五页,2022年,8月28日2007年10月22日,经过2个月的装修和筹备工作,中国科学院北京基因组研究所临时所址落成。第五页,共三十五页,2022年,8月28日北京基因组所的中心任务

以大规模测序解决重要生物学问题

(测序是手段,不是目的)

将发现应用到经济和社会发展中水稻基因组项目人类转录组研究肿瘤基因组研究细菌及微生物研究第六页,共三十五页,2022年,8月28日内容1.研究所整体介绍2.基因组及生物信息基础科研环境3.生物信息研究4.致谢第七页,共三十五页,2022年,8月28日基因组学生物信息学高性能计算第八页,共三十五页,2022年,8月28日测序能力测序仪数量序列图像运行时间SOLiDv4.0730GB6~8TB10天/台SOLEXAGAII415GB4TB10天/台4541400MBGB量级7小时/台37304~50KBGB量级2小时/台数据产量:1TB/月

(不包括图像文件)第九页,共三十五页,2022年,8月28日第十页,共三十五页,2022年,8月28日第十一页,共三十五页,2022年,8月28日454SolexaGAII第十二页,共三十五页,2022年,8月28日第十三页,共三十五页,2022年,8月28日第十四页,共三十五页,2022年,8月28日第十五页,共三十五页,2022年,8月28日“钓鱼”和“捞鱼”前基因组时代的“钓鱼”和后基因组时代的“捞鱼”第十六页,共三十五页,2022年,8月28日CPU:960(core)AggregationCapabilities:10.2TFLOPS第十七页,共三十五页,2022年,8月28日运算速度快节点多单节点内存大(至少2~4GB/Core)节点内部网络通路无特殊要求应用(NGS数据分析)全基因组序列比对分析(BWA,SOAP,Bioscope,Bfast,…)转录组序列比对分析…通用高性能集群计算环境第十八页,共三十五页,2022年,8月28日

专用计算环境大内存服务器128GB/256GB/512GB/1TB用途大基因组拼接转录组拼接基于大数据量的功能分析…第十九页,共三十五页,2022年,8月28日存储资源环境分级存储普通存储+高性能存储高性能存储+磁带库存储普通存储+高性能存储+磁带库存储基因组所状况普通存储:700TB(参与小数据计算)高性能存储:200TB(参与大数据计算)磁带存储:若干(备份数据)第二十页,共三十五页,2022年,8月28日第二十一页,共三十五页,2022年,8月28日内容1.研究所整体介绍2.基因组及生物信息基础科研环境3.生物信息研究工作4.致谢第二十二页,共三十五页,2022年,8月28日生物信息研究工作第二十三页,共三十五页,2022年,8月28日(1)ResequencingWholegenomesequencingExoncapturesequecing第二十四页,共三十五页,2022年,8月28日(2)AssemblySequencingReadsLongreads:454、3730Shortreads:Solexa、SolidHybridReads:Long+ShortreadsAssemblypipelineReadsfiltering(QV,adaptor,redundantreads)ReadscorrectionContigassemblyScaffoldingFixgap第二十五页,共三十五页,2022年,8月28日(3)TranscriptomeBasicAnalysisReadsfilteringMaptogenomeMaptojunctionAnnotationDEGseqGOKEGGAdvancedAnalysisDenovoassemblySNPalleleAlternativeSplicingIsoformexpressionAnti-senceRNA…第二十六页,共三十五页,2022年,8月28日第二十七页,共三十五页,2022年,8月28日(4)microRNA第二十八页,共三十五页,2022年,8月28日(5)MethylationSolexasequencingBusilfitemethodSingle-endPair-endMappingstrategyMethylationsiteStatisticalanalysisDistributionGCornon-GC第二十九页,共三十五页,2022年,8月28日(6)DatabaseandsoftwareBioinformaticsdatabasedesignanddevelopWebservicedevelopmentSoftwaredevelopmentLabInformationManagementSystem(LIMS)designanddevelop

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论