intel analyticsai keynote - big data application congress of cn英特尔分析主题演讲大数据应用峰会_第1页
intel analyticsai keynote - big data application congress of cn英特尔分析主题演讲大数据应用峰会_第2页
intel analyticsai keynote - big data application congress of cn英特尔分析主题演讲大数据应用峰会_第3页
intel analyticsai keynote - big data application congress of cn英特尔分析主题演讲大数据应用峰会_第4页
intel analyticsai keynote - big data application congress of cn英特尔分析主题演讲大数据应用峰会_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分析与AI引爆未来KevinHuiskes企业与政府高级总监英特尔数据中心事业部每一天–数据量都在呈爆炸式增长1预计到2020年每天生成的数据。请参阅23页附录页的脚注内容1.5GB¹平均每名互联网用户4,000GB³

自动驾驶汽车3,000GB²

智能医院1MGB²智能工厂40KGB²飞机数据洞察=全新竞争优势资料来源:Gartner2017年对2,500名首席执行官进行的调查。商业智能与分析

首席执行官的首要投资优先事项今天的工业公司,未来将会转变为

软件与分析公司。—JeffImmelt,通用电气首席执行官分析技术的演进资料来源:ForresterResearchAI

自身即为一个很大的类别,对于推动数据分析达到更高成熟度和更大规模有着重要作用描述分析诊断分析预测分析指导分析认知分析运营分析高级

分析新兴现在分析曲线分析机遇遍及各行各业工业个人医疗金融零售能源交通加速业务盈利与竞争优势分析成就智能工厂分析成就智能零售分析成就智能体育分析成就智能医疗分析挑战性能可扩展性使用面向

优化的

易于

灵活性未来TCO使用英特尔采用整体性方法促进分析与AI发展技术解决方案软件优化社区用于在从边缘到数据

中心开展训练和推理

等工作常用框架与优化水平与垂直

解决方案芯片英特尔®Nervana™Graph软件解决方案英特尔®Nervana™平台

BigDLMLliB英特尔®Nervana™产品组合*其他的名称和品牌可能是其他所有者的资产。英特尔®至强®可扩展平台

数据中心领域最重大的进步业界十年来推出英特尔®至强®可扩展处理器:分析性能最高

2X最高

1.59X最高

1.36X相比前一代英特尔®至强®处理器

E5-2697v4,BigBench性能更高相比前一代英特尔至强处理器

E78890-v4,TPS更高相比前一代英特尔至强处理器

E5-2699v4,处理大型复杂数据集的速度更快结果基于英特尔和外部评测结果,仅供参考。请参阅

24页备用页了解详细配置信息。英特尔®至强®可扩展处理器:最敏捷的AI平台固有的ROI使用现有熟悉的基础设施立即开始AI征程使用常用的AI框架开展深度学习训练与推理

卓越性能相比前一代产品,深度学习训练与推理性能提高最高2.2倍优化的软件+硬件:

性能比前一代产品提高113倍生产就绪能够可靠支持所有AI与分析部署服务器级可靠性、安全性与

可管理性结果基于英特尔内部评测结果,仅供参考。请参阅25页备用页了解详细配置信息。软件示例:“BIGDL”*其他的名称和品牌可能是其他所有者的资产。Spark内核数据框SQLStreamingSparkRML管道MLlibGraphXBigDLBIGDL专为英特尔®至强®设计Caffe*和Torch*带来均衡功能通过使用现有

基础设施实现较低

总体拥有成本和出色易于使用性

在大数据平台上开展深度学习,支持高效进行横向扩展数据

软件

软件

最高

4.3X最高

5.6X最高

50%

分析优化示例12请参阅26页查看优化声明与配置详细信息*其他的名称和品牌可能是其他所有者的资产。纠删码显著降低

HDFS存储量1HBASEoff-heap

读取优化2基于英特尔®数学核心函数库的MLLIB*2优化优化优化基础设施解决方案示例:用于基因组学的“Bigstack”*其他的名称和品牌可能是其他所有者的资产。**BIGstack的条件是解决方案在应用层预集成GATK,并且堆栈通过BroadInstitute验证

应用预打包基因组学应用BWA平台GenomicsDB优化的基因组学内核函数库¥Cromwell工作流执行硬件英特尔®

全路径架构英特尔基因组学参考设计优化的解决方案大幅提升

基因组学应用的性能

BIGstack**采用包括:培训专家授课的培训、动手

实践研讨会、独家远程

访问等工具来自英特尔的最新库、

框架、工具和技术英特尔®Nervana™人工智能研究院

提升技能,开创AI未来社区与行业精英、开发人员和英特尔工程师紧密协作数据洞察创新收入英特尔®至强®可扩展处理器

出色敏捷性、卓越可扩展性与优异性能全面满足您的分析需求让我们携手并进

加速驶向未来法律声明英特尔技术的特性和优势取决于系统配置,并需要借助硬件、软件或服务来实现。实际性能会因您使用的具体系统配置的不同而有所差异。请联系您的系统制造商或零售商,或访问,了解更多信息。任何计算机系统都无法提供绝对的安全性。在特定系统中对组件性能进行特定测试。硬件、软件或配置的任何差异都可能影响实际性能。请进行多方咨询,以评估您考虑购买的系统或组件的性能。如欲了解有关性能和性能指标评测结果的完整信息,请访问:。

在性能检测过程中涉及的软件及其性能只有在英特尔微处理器的架构下方能得到优化。诸如SYSmark和MobileMark等测试均系基于特定计算机系统、硬件、软件、操作系统及功能,上述任何要素的变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以对目标产品进行全面评估。如欲了解更多信息,请访问:。

英特尔编译器针对非英特尔微处理器的优化程度可能与英特尔微处理器相同(或不同)。这些优化包括SSE2®、SSE3和SSSE3指令集以及其它优化。对于在非英特尔制造的微处理器上进行的优化,英特尔不对相应的可用性、功能或有效性提供担保。此产品中依赖于处理器的优化仅适用于英特尔微处理器。某些不是专门面向英特尔微体系结构的优化保留专供英特尔微处理器使用。请参阅相应的产品用户和参考指南,以了解关于本通知涉及的特定指令集的更多信息。描述的成本降低方案旨在作为举例,说明指定的英特尔架构产品在特定环境和配置下,可能如何影响未来的成本和提供成本节省。环境将有所不同。英特尔不保证任何成本或成本降低。英特尔不对本文中引用的第三方基准数据或网站承担任何控制或审计的责任。您需要访问参考网站以确认所引用数据是否准确。英特尔公司©2017年。英特尔、Intel标识、英特尔至强和IntelXeon是英特尔在美国和/或其他国家的商标。*其它品牌和名称可能是其他公司的财产。附录–数据增长来源所有数字均为预估结果

分析性能配置详细信息本结果基于英特尔内部分析估算得出,仅作参考之用。任何系统硬件、软件的设计或配置的不同均可能影响实际性能。在性能检测过程中涉及的软件及其性能只有在英特尔微处理器的架构下方能得到优化。诸如SYSmark和MobileMark等测试均系基于特定计算机系统、硬件、软件、操作系统及功能,上述任何要素的变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以对目标产品进行全面评估。更多信息敬请登录。配置:请见下一页。最高1.36倍提升声明基于TCP-BB(BigBench)性能指标评测工作负载:8节点到8节点:双路英特尔至强处理器E5-2697v4,采用24x32GBDIMM、2x2TB+2x1TBSATAA3固态盘、万兆位以太网单端口,对比英特尔至强可扩展处理器Platinum8168,采用12*64GBDIMM、2x2TB+2x1TBSATA固态盘、万兆位单端口。qpm@10TB结果:Broadwell467/Skylake637最高1.59倍提升声明基于面向SAPHANA工作负载的SAP*BW版本:1节点,四路英特尔®至强®处理器E7-8890v4,基于Grantley-EX的平台,采用1024GB总内存,运行SLES12SP1,对比SAP内部测试预计结果,1节点,四路英特尔®至强®可扩展处理器产品家族(代号Skylake-SP)系统。最高2倍提升声明基于SASBusinessAnalytics*:SAS9.4m4应用,和运行30个会话SAS混合分析工作负载。操作系统:CentOS7.2kernel3.10.0。测试由英特尔和SAS于2017年5月实施。基准:四路英特尔®至强®处理器E7-2699v4,2.2GHz,24核,启用睿频加速,禁用超线程,BIOS275.R01.1603300531,256GB总内存,16个插槽/16GB/2133MT/秒/DDR4LRDIMM,7块800GB英特尔®固态盘DCS3700+1块2TB基于NVMe的英特尔固态盘DCP3700,CentOS*7.2内核3.10.0。新:双路英特尔®至强®Platinum处理器8180,2.5GHz,28核,启用睿频加速,禁用超线程,BIOS01.00.0412.,384GB总内存,24个插槽/16GB/2666MT/秒/DDR4LRDIMM,4块800GB英特尔固态盘DCS3710+4块375GB英特尔傲腾固态盘P4800X,CentOS*7.2内核3.10.0。英特尔®至强®Platinum处理器8180与英特尔®至强®E5-2699v4对比时,在NeonResNet-18上推导吞吐率提高最高2.4倍;推导吞吐率批处理大小:1;训练:不同代比较:英特尔®至强®Platinum8180处理器与英特尔®至强®E52699v4对比时,在NeonResNet-8上训练吞吐率提高最高2.4倍;训练吞吐率批处理大小:256平台:双路英特尔®至强®Platinum8180CPU@2.50GHz(28核),禁用超线程,禁用睿频加速,通过intel_pstate驱动程序扩展governorset到“performance”,384GBDDR4-2666ECCRAM。CentOSLinux7.3.1611版(Core),Linux内核3.10.0-514.10.2.el7.x86_64。固态盘:英特尔®固态盘DCS3700系列(800GB,2.5英寸SATA6Gb/秒,25纳米,MLC):性能测量配置:环境变量:KMP_AFFINITY='granularity=fine,compact‘,OMP_NUM_THREADS=56,CPU频率设置为cpupowerfrequency-set-d2.5G-u3.8G-gperformance平台:双路英特尔®至强®CPUE5-2699v4@2.20GHz(22核),启用超线程,禁用睿频加速,通过acpi-cpufreq驱动程序扩展governorset到“performance”,256GBDDR4-2133ECCRAM。CentOSLinux7.3.1611版(Core),Linux内核3.10.0-514.10.2.el7.x86_64。固态盘:英特尔®固态盘DCS3500系列

(480GB,2.5英寸SATA6Gb/秒,20纳米,MLC)性能测量配置:环境变量:KMP_AFFINITY='granularity=fine,compact,1,0‘,OMP_NUM_THREADS=44,CPU频率设置为cpupowerfrequency-set-d2.2G-u2.2G-gperformanceNeon:ZP/MKL_CHWNbranchcommitid:52bd02acb947a2adabb8a227166a7da5d9123b6d。使用空数据。使用main.py脚本在mkl模式下进行评测。使用的ICC版本:17.0.320170404,英特尔MKL小型函数库版本2018.0.20170425;推导和训练吞吐率使用FP32指令;推导:在英特尔®至强®Platinum8180处理器上使用英特尔优化的Caffe框架和英特尔®MKL函数库,相比在英特尔®至强®E5-2699v3上运行未经优化的BVLCCaffe,推导吞吐率性能提升最高138倍;推导吞吐率CaffeGoogleNetv1批处理大小256;训练:在英特尔®至强®Platinum8180处理器上使用英特尔优化的Caffe框架和英特尔®MKL函数库,相比在英特尔®至强®E5-2699v3上运行未经优化的BVLCCaffe,训练吞吐率性能提升最高113倍;训练吞吐率AlexNet批处理大小256;平台:双路英特尔®至强®Platinum8180CPU@2.50GHz(28核),禁用超线程,禁用睿频加速,通过intel_pstate驱动程序扩展governorset到“performance”,384GBDDR4-2666ECCRAM。CentOSLinux7.3.1611版(Core),Linux内核3.10.0-514.10.2.el7.x86_64。固态盘:英特尔®固态盘DCS3700系列(800GB,2.5英寸SATA6Gb/秒,25纳米,MLC):性能测量配置:环境变量:KMP_AFFINITY='granularity=fine,compact‘,OMP_NUM_THREADS=56,CPU频率设置为cpupowerfrequency-set-d2.5G-u3.8G-gperformance平台:双路英特尔®至强®CPUE5-2699v3@2.30GHz(18核),启用超线程,禁用睿频加速,通过intel_pstate驱动程序扩展governorset到“performance”,256GBDDR4-2133ECCRAM。CentOSLinux7.3.1611版(Core),Linux内核3.10.0-514.el7.x86_64。操作系统盘:Seagate*EnterpriseST2000NX02532TB2.5英寸内置机械硬盘。性能测量配置:环境变量:KMP_AFFINITY='granularity=fine,compact,1,0‘,OMP_NUM_THREADS=36,CPU频率设置为cpupowerfrequency-set-d2.3G-u2.3G-gperformance英特尔Caffe:(),revisionb0ef3236528a2c7d2988f249d347d5fdae831236.推导使用“caffetime--forward_only”命令测量;训练使用“caffetime”命令测量。对于“ConvNet”拓扑,使用了空数据集。对于其他拓扑,在训练前数据存储在本地存储,并缓存在内存中。拓扑规范:(GoogLeNet,AlexNet,andResNet-50),(VGG-19),以及(ConvNet性能指标评测,文件进行了更新以使用较新的Caffeprototxt格式,但功能相同)。GCC4.8.5,MKLML版本2017.0.2.20170110。BVLC-Caffe:,推导与训练使用“caffetime”命令测量。对于“ConvNet”拓扑,使用了空数据集。对于其他拓扑,在训练前数据存储在本地存储,并缓存在内存中。BVLCCaffe(),revision91b09280f5233cafc62954c98ce8bc4c204e7475(commitdate5/14/2017)。BLAS:atlasver.3.10.1.在性能检测过程中涉及的软件及其性能只有在英特尔微处理器的架构下方能得到优化。诸如SYSmark和MobileMark等测试均系基于特定计算机系统、硬件、软件、操作系统及功能,上述任何要素的变动

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论