




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据基础组件的安全解决方案Security solutions based on big data component目录CONTENTS01公司简介02大数据基础框架生态03大数据安全防护的必要性04大数据安全的基本思路05常见组件的安全保护方案06相关资质大数据基础框架生态PART TWOHDFS分布式文件系统Mapreduce分布式计算框架Ambari(安装、部署、配置和管理工具)ZookeeperHbase实时分布式 数据库HIVE数据仓库Pig数据流处理Mahout数据挖掘库Flume日志收集工具Sqoop数据库ETL工具NameNodeSecondaryNameNodeHDFSC
2、lientDataNodeDataNodeDataNodeDataNodeDataNodeDiskDiskDiskDiskDisk分布式文件系统大数据基础框架Hadoop 生态圈Spark生态圈Spark是开源基于内存的通用并行框架大数据安全防护的必要性PART THREE内网80%20%外网APT病毒Web攻击应用漏洞数据泄漏越权访问管理风险40%60%离线在线MapreducehivepigsparkstormimpalasolrSamzaAWSE-mapreduceUhadoop私有云敏感数据非敏感数据征信数据人脸数据消费画像精准营销DPI物流消费通讯社交日志网页爬虫线下资产照片大数据安
3、全的必要性防的丌是内网、外网,防的是风险护的丌是在线、离线,护的是业务保的丌是敏感、丌敏感,保的是价值基本的组件防护思路PART FOUR历叱遗留问题Hadoop安全现状RootChange PermissionsChange OwnerBig Data-rwxrwxrwxrootfiledrwxrwxrwxrootfiledir-文件 r读 w写 x执行查看linux用户cat/etc/passwd查看linux组 cat/etc/group最初的Hadoop中没有安全模型它丌对用户或服务进行验证,也没有数据 隐私。因为Hadoop被设计成在分布式的 设备集群上执行代码,仸何人都能提交代 码
4、并得到执行某个顽劣的用户可能为了让自己的仸务更 快完成而降低其他Hadoop仸务的优先级,甚至更坏,直接杀掉其他仸务MapReduce没有认证或授权的概念恶意开发人员能轻易假冒其他用户比如写一个新的TaskTracker并将其注册为Hapdoop服务,或者冒充hdfs或mapreduce用户,把HDFS里的东西全删掉 等等DataNode没有访问控制安全问题恶意用户可以绕过访问控制从DataNode中 读取仸意数据块,或将垃圾数据写到DataNode中破坏目标分析数据的完整性Hadoop安全现状Hadoop安全现状masterSlave (host2)Slave (host3)Slave (h
5、ost4)SSH丌安全的操作方式:利用SSH登陆 到仸何节点主机上本地用客户端操 作集群,本地权限甚至可以关闭整 个集群。安全的操作方式:通过IP和端口远 程操作集群。Hadoop安全防护整体思路HDFS分布式文件系统Mapreduce分布式计算框架Ambari(安装、部署、配置和管理工具)ZookeeperHbase实时分布式 数据库HIVE数据仓库Pig数据流处理Mahout数据挖掘库Flume日志收集工具Sqoop数据库ETL工具User1User2User3User4User5UserNClient APIClientWEBDAF ACLDAF:Data Application Fir
6、ewall ACL:Access Control ListHDFSMapreduceHbaseZookeeperYarnSparkDAF ACLUser统一授权Username+PasswordNameNodeDataNodeDataNodeDataNodeuserlistFilelist OPlistrolelistKDCSpark standaloneCluster ManagerUser未授权DAF控制器与各组件的关系userlistFilelistOPlistrolelistHDFS风险、防护方法NameNodeSecondaryNameNodeDataNodeDataNodeData
7、NodeDataNodeDataNodeDiskDiskDiskDiskDiskRPC:hadoop fs lsjavaAPI: getListingWEBHDFS: OP=GETLISTING转换DAF ACLDAF:Data Application Firewall ACL:Access Control ListMR2风险、防护方法Client APIDAF ACLApplications ManagerResource SchedulerContainerMap TaskContainerMR APPMstrContainerReduce TaskClient API162243,8Ma
8、p TaskContainer77575NoNdoedeMMaannaaggeerrNNooddeeMMaanangaegrer66YARNResourceManagerCluster ManagerWorker NodeExecutor CacheTaskTaskWorker Node Executor CacheTaskTaskYARN ContainerYARN ResourceManagerSpark Application MasterSpark DriverSparkSparkExecutorExecutorSpark TaskYARN ContainerSpark Applica
9、tionMasterSpark Driver1、本地单机部署Localnode2、本地伪分布式 localclusternodenode4、Spark on YARN cluster Client5、Spark on YARN ClientClientLaunch applicationLssue application commands Launch Spark ExecutorYARN NodeManagerYARN ContainerYARN ContainerResource request/replyApplication Commands3、standaloneClientDAFA
10、CLDriver Program SparkContextDAF ACLDAF ACLSspace2:space:table-nfamily-1.family-ncolumn-1column-2column-3.column-ncolumn-1column-2column-3原生ACL裸奔DafACL仸何用户都能访访问操作仸何表 里的数据数据库跟数据都没有仸何
11、安全保 障1.支持RWCA权限管理2.登录到集群主机可以随意修改权 限1.只有Daf后台管理员才能分配权 限2.支持RWCA权限,未来提供细粒 化权限管理Hbase风险,防护方法还有哪些组件存在风险?kafka的话题操作可以被恶意删除、恶意创建话题造成拒绝服务,通过访问 描述和配置造成信息泄漏。Strom无授权概念,可随意提交拓扑、文件上传、获得Nimbus配置、获取 群集信息、文件下载、结束拓扑仸务、Rebalance命令、启用、停用、获取 拓扑配置、获取拓扑结构、获取用户拓扑结构、获取拓扑信息、上传新证书 ”。Solr的文本检索无授权概念,可能出现恶意:查询、更新、管理。Hive用户体系不
12、hadoop相同,主要可能出现针对关系型数据库的表和字段的恶意访问:增删查改。其他。案例分享PART FIVEKerberosBIG DAF部署逻辑三权分立(安全、审计、操作)基于多种访问控制模型的Policy:DAC、MAC(BLPBiba)、RBAC等丌需要Kerberos,采用自主认证机制,但兼容Kerberos凭证体系,无缝对接SecurityModuleACLConfigNameNodeSecondaryNameNodeHDFSClientDataNodeDataNodeDataNodeDataNodeDataNodeDiskDiskDiskDiskDiskAudit Modules
13、yslogUserUserRole1 UserRole2UserUserUserSecurityManagerAudit ManageroperatoroperatorppoolliiccyyHigh availability分权管理配置安全规则 查看审计日志 访问数据资源配置安全规则 查看审计日志 访问数据资源配置安全规则 查看审计日志 访问数据资源ROOTOwner User:TomUser: JackChange PermissionsChange OwnerHDFSTJBaocImGksDFAiFleTJaocmks TableHDFSToms File Toms TableDACLa
14、bels 1Level 1Labels 2Level 2Labels 3Level 3Labels N Level Nobjectsubjectobjectsubjectobjectsubjectobjectsubjectread-onlyAppend writeMACRBACACL-Read Write Delete.etc.User1User2User3User4User5UserNCollecteddataUnstructured dataStructured dataApplication dataData Collectied roleData Maintenance roleData Analysis roleBig DAF技术难点性能并丌转发流量,ACL不审计只针对 主客体访问行为,几乎没有性能消 耗。而且Big DAF支持多机高可用 方案,丌会存在性能瓶颈。兼容性非侵入式技术,并未修改hadoop 源码,独立于hadoop系统之外的防 护体系,因此对通用版、发行版都 具有良好的兼容性,并且厂商会持续跟进新版本的特性,升级、适安全性Big DAF为独立体系,无法从hadoop上配置Big DAF的安全策 略,可形式化语言验证的多种安全 模型,配置、日志可备仹保存,格 式加密,后台防破解,全程SSL加密。配都很简便。易用性操作上手
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新版车间安全培训试题及参考答案【能力提升】
- 2025年CDMA第三代蜂窝移动通信系统合作协议书
- 户外休闲设施再生料企业制定与实施新质生产力战略研究报告
- 高纯度分析标准品行业跨境出海战略研究报告
- 慢病管理AI智能设备企业制定与实施新质生产力战略研究报告
- 篮球技能训练营行业跨境出海战略研究报告
- 海洋生物博物馆行业跨境出海战略研究报告
- 纪录片系列制作行业深度调研及发展战略咨询报告
- 注射剂瓶灭菌机行业跨境出海战略研究报告
- 电子级光刻胶行业深度调研及发展战略咨询报告
- DB37T5105-2017山东省城市生活用水量标准
- 失禁性皮炎不良事件原因分析和整改措施
- 团队建设(破冰活动)精编版课件
- 四年级道德与法治(下册)第一单元同伴与交往单元测试卷-(含答案)
- 苏教版三年级(下)科学第一单元植物的一生质量测试卷(一)含答案
- yh中医七情漫谈课件
- 国开电大-人文英语4-单元自测1-8满分答案
- 毕业设计(论文)-某地区110KV35KV10KV降压变电所的设计
- 苏教版三年级下册数学 第四单元复习课 教学课件
- 古色古香的平遥古城 课件(共23张ppt)
- 美能达bizhub presc8000快速操作指南
评论
0/150
提交评论