金融行业存储精益化管理降低存储成本 202412_第1页
金融行业存储精益化管理降低存储成本 202412_第2页
金融行业存储精益化管理降低存储成本 202412_第3页
金融行业存储精益化管理降低存储成本 202412_第4页
金融行业存储精益化管理降低存储成本 202412_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Al金融行业存储精益化管理,降低存储成本CONTENTS现状:近年银行存储采购情况分析•不同规模的银行根据其业务需求和预算,在存储设备上的投资金额相对比较大,从小型的几百万元到大型的几千万元不等•金融行业通常是中低端存储和高端存储搭配使用,集中存储和分布式存储的混合使用,最终的结果是通过架构的设计或管理要求,既要保证系统的高可用性和性能要求,又要用最低的成本采购到最适合的存储设备银行项目名称人行征信中心2024年存储采购项目兴业银行2022年存储云化设备扩容项目3444万人行征信中心2024年存储采购项目浦发银行2024年信用卡中心存储资源池采购中国银行2024年总行IT基础硬件资源池分布式存储966万北京银行2024年蓝光存储采购项目2024年分布式存储采购2024年信用卡机房统一存储平台邢台银行2024年存储设备采购365.8万九江银行2024年存储设备采购项目240万绍兴银行2024年分布式存储采购项目哈尔滨银行2024年NAS存储采购广东农商行2024年存储替换纸全闪存储采购项目80%-90%非结构化数据33ZB2018挑战一:海量的数据增长,存储年年买,成本居高80%-90%非结构化数据33ZB2018••随着数据量越来越大,对存储的需求越来越大,存储成本逐年升高•存储数据未分类,大量“冷数据”与频繁修改、点查的数据放在同一环境中进行同等处理•数据无序堆积:随着各种非结构化数据(文志等)在存储平台间的不断膨胀,数据的存储成本居高不•存储资源浪费:大量重复、过期文件占用宝贵的存储空间,费用•成本控制困难:缺乏有效的数据管理和优化策略,难以分辨哪些数据必须长期保留,哪些数据是冷数据可以丢弃,哪些数据是热数据需要存储在高性能但高成本的存储介质上,哪些冷数数据可挑战二:存储资源利用率普遍较低,缺少多视角的存储资源优化分析缺乏使用者视角?难难缺少全局视角:企业往往需要跨多个平台甚至地理位置整合存储资源。缺乏全局视角使得企业难以对存储资源进行全面务单元之间平衡存储资源,以满足各自的性能和容量需求。但是,大部分企业缺少业务视角的资源使用分析,难以将存储资源的分配与业务需求和优先级对齐。员工是存储资源的直接使用者,他们的个人存储空间管理对整体资源利用效率有着直接影响。然而,许多企业在存储资源优化分析时往往缺乏对使用者需求的考虑,导致存储资源存储需求预测困难:业务数据量迅速增加,导致存储需求不断上升,但是大部分组织的存储需求预测缺乏前瞻性,可能设计研发经营管理协同办公生产控制决策分析设计研发经营管理协同办公生产控制决策分析旦管理者技术/运维人员业务人员旦财务人员其他人员...大数据平台对象存储本地文件系统NAS分布式文件大数据平台对象存储本地文件系统多样化的数据类型:客户拥有包括文本文档、图片、视频、音频和日志文件等在内的多种类型的非结构化数据。跨多个业务部门的运作:企业的各个部门通常都有独立的系统来管理其业务流程,并生成各自的数据,这些数据往往被封闭在各自的系统中,缺乏共享机制和统一管理与分析的能力。不同用户需求的差异:企业的不同用户对于数据的使用需求各不相同。一些用户需要全局的可视化数据报表,另一些则需要详细的实时数据报表,需求的多样化导致数据在整合和分析过程中变存储(NAS)、存储区域网络(SAN)、对象存储等。这些环境各自使用不同的协议、标准和访问控制机制,加剧了数据的分散,导缺乏统一的数据视图:企业无法全盘掌握其所有数据资源。这意应用场景存储精益化管理解决方案架构应用场景需存储数据支持5类存储系统分布式存储对象存储大数据平台理降本增效生产系统降本增效生产系统热温冷数据分类大文件识别容量趋势热温冷数据分类大文件识别容量趋势热度检测模型热度检测模型重复文件检测模型容量预测模型分布式搜索引擎分布式搜索引擎机器数据湖跨品牌支持跨品牌支持…通过存储精益化管理,支撑数据分级管理归档库企业文化资料归档库企业文化资料归档库项目资料票据电子影像音视频文件归档库归档库基于热度分类文件类型分类自定义分类…业务属性海量文件数据分布式文件存储精益化管理基于热度分类文件类型分类自定义分类…业务属性海量文件数据分布式文件存储精益化管理温数据冷数据音乐、视频压缩文件组织结构名称项目名称正则表达式规则数据存储规范数据管理规范数据保留规范数据归档规范优化数据管理规范数据存储规范数据管理规范数据保留规范数据归档规范优化数据管理规范数据备份策略数据恢复策略数据归档策略灾难恢复演练策略优化备份管理策略数据备份策略数据恢复策略数据归档策略灾难恢复演练策略优化备份管理策略文件数据自动分类优化数据管理策略、提高数据可靠性数据分类存储、降低成本压缩和重复数据删除归档系统$机台DCO客户端x前置机重复数据可删除/可恢复NFS挂载|CIFS挂载|本地Agent|RESTAPI文件元数据读取分层归档自动化数据转储压缩和重复数据删除归档系统$机台DCO客户端x前置机重复数据可删除/可恢复NFS挂载|CIFS挂载|本地Agent|RESTAPI文件元数据读取分层归档自动化数据转储冷热温数据分类结果机器数据湖重复文件统计结果重复文件夹统计结果待转数据处理支持动态调整冷热温数据的存储策略,将热数据迁自重复文件列表重复文件夹列表自重复文件列表重复文件夹列表冷热温分类冷热温分类标签管理AnyStorageAnyStorage分布式存储管理生产系统基于热度的数据分类存储优化建议数据从冷转热:最后访问时间数据从热转冷:最后修改时间、最后访问时间热数据经常被访问或使用的实时数据。访问频率高,对性能要求高,生产系统基于热度的数据分类存储优化建议数据从冷转热:最后访问时间数据从热转冷:最后修改时间、最后访问时间热数据经常被访问或使用的实时数据。访问频率高,对性能要求高,建议存储在快速的存储介质上。热数据分类模型温数据机械硬盘访问频率较低但偶尔需要访问的数据。能够容忍一定的访问延迟,建议存储在性能和成本之间的平衡存储介质上。温数据冷数据访问频率低,可以长期存储而不需要频繁访问的数据。冷数据建议存储在成本较低的介质,进行归档,或将没有价值的过期数据删除。本地文件海量数据本地文件储分布式文件•支持创建时间、最后访问时间、最后修改时间的冷数据识别按照数据的创建时间、最后访问时间、最后修改时间按照数据的创建时间、最后访问时间、最后修改时间,将数据分为冷、热、温三个类别。。非结构化数据非结构化数据半结构化数据存储数据半结构化数据存储数据率数据库率数据库虚拟机虚拟机大数据平台大数据平台结构化数据结构化数据应用应用注:依据《GB/T38667-2020信息技术大数据数据分数据存储策略数据保留策略数据归档策略灾难恢复演练策略降低存储成本,是一个重要的考虑因素。不同的业务对数问频率和重要性有不同的要求。在线业务系统需要实时访理热数据,离线分析系统则需要处理大量的历史数据和冷需要通过对数据进行热、温、冷分类,根据数据的访问频值,选择不同性能和成本的存储介质和存储方案,实现存数据存储策略数据保留策略数据归档策略灾难恢复演练策略降低存储成本,是一个重要的考虑因素。不同的业务对数问频率和重要性有不同的要求。在线业务系统需要实时访理热数据,离线分析系统则需要处理大量的历史数据和冷需要通过对数据进行热、温、冷分类,根据数据的访问频值,选择不同性能和成本的存储介质和存储方案,实现存本存储介质上,实现数据分类存储,从而降低成本、冷分类后,管理员可以根据数据的分类情况制数据分类管理生产系统海量文件数 分布式文件大数据文件自动分类热数据温数据冷数据存储数据的全局视角管理存储全局概览冷数据分析•重复文件总数重复文件总数据量重复数据量百分比重复文件总数重复文件总数据量重复数据量百分比可节省空间自文件夹唯一标识符重复文件夹路径文件夹大小文件唯一标识符重复文件路径文件大小….….在海量文件的存储系统中,常常面临的一个挑战是处理和管理大数据。重复数据的存在,一方面占用大量存储空间、造成资源浪费….….重复文件详情列表重复文件夹详情重复文件/文件夹统计重复文件可能存在于企业内的多个存储系统中,如何跨存储重复文件详情列表重复文件夹详情重复文件/文件夹统计重复文件重复文件组重复文件重复文件组重复文件夹重复文件夹组重复文件夹重复文件夹组•多种重复文件识别方法:支持文件哈希值抽样比较法、文件属性数据比较法进行重复文件识别。其中文件哈希值抽样比较法通过海量文件分布式文件系统(NAS/S3对象存储/…)•跨异构存储识别重复文件识别,提升管理效率:通过提供跨异构存储重复文件的识别,存储管理员可针对海量文件分布式文件系统(NAS/S3对象存储/…)•消除冗余数据、降低存储成本:通过识别出的重复文件/文件夹详情列表,通过删除或合并重复文件消除冗余数据,可以节省大释放存储空间•重复文件分析•一级文件夹分析文件类型分类分析支持两种在文件元数据中打业务部门标签方式•目录标签自动提取:如果存储中的文件目录带有业务系统信息,则可通过配置提取规则,自动提取业务系统标签到元数据•目录/业务系统映射表:管理员可手动编辑文件目录和业务系统的映射关系,元数据处理时会根据映射关系附加业务系统标签业务系统资源详情表自业务系统资源报表业务系统资源报告文件元数据业务部门明细业务部门汇总 元数据采集挂载点MP…业务系统资源详情表自业务系统资源报表业务系统资源报告文件元数据业务部门明细业务部门汇总 元数据采集挂载点MP…存储存储存储存储存储海量存储业务系统存储概览业务系统资源详情业务系统汇总分析分析业务部门对存储资源使用现状,实现业务部门成本监控和优化业务部门总体情况可优化的业务部门本部门使用情况支持两种在文件元数据中打业务部门标签方式业务部门总体情况可优化的业务部门本部门使用情况业务部门资源报表文件元数据业务部门明细业务部门汇总 元数据采集↑自业务部门资源报表文件元数据业务部门明细业务部门汇总 元数据采集↑自•目录标签自动提取:如果存储中的文件目录带有业务部门信息,则可通过配置提取规则,自动提取业务部门标签到元数据•目录/业务部门映射表:管理员可手动编辑文件目录和业务部门的映射关系,元数据处理时会根据映射关系附加业务部门标签部门A部门B资源整体使用、可优化的情况门资源使用多、可优化空间多,针对性用、费用和可优化点,针对部门存储进存储存储存储存储存储海量存储业务部门资源详情表自业务部门资源报告业务部门概览•业务部门资源详情分析业务部门汇总分析统一数据视图全面的数据视图全局视角数据资源梳理•全面洞察不同位置和系统中的文件数据分布,有效地整合分散的数据,构建统一的数据视图。多视角数据资源清点•业务视角:识别不同业务部门的数据需求,并根据业务标准对业务视角个人使用者视角跨平台文件检索,全面洞察文件存储大小和分布统一数据视图全面的数据视图全局视角数据资源梳理•全面洞察不同位置和系统中的文件数据分布,有效地整合分散的数据,构建统一的数据视图。多视角数据资源清点•业务视角:识别不同业务部门的数据需求,并根据业务标准对业务视角个人使用者视角分布式文件大数据系统平台•个人使用者视角•个人使用者视角:分析员工在虚拟桌面等企业资产中的文件使非结构化数据存储多业务部门数据中心数据中心数据中心数据中心数据中心数据中心跨平台文件路径检索,合理规划存储使用文件元数据查询•存储容量预测,降低容量规划复杂度存储增长趋势剩余可用时间未来存储量•深度学习:TCN、存储增长趋势剩余可用时间未来存储量•深度学习:TCN、RNN、block_RNN、nbeats、transformer•基线算法:naïve_arift、naïve_drift、naïve_mean、naïve_sea•指数平滑:SES、Holt机器学习预测引擎前瞻性存储资源分配机器学习预测引擎前瞻性存储资源分配•预测性规划使企业能够根据预期的存储增长趋势提前为不同海量文件海量文件分布式文件系统(NAS/S3对象存储/…)避免资源瓶颈避免资源瓶颈•预测存储的剩余使用时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论