CloudOps云上运维系列课程 - 演讲材料_第1页
CloudOps云上运维系列课程 - 演讲材料_第2页
CloudOps云上运维系列课程 - 演讲材料_第3页
CloudOps云上运维系列课程 - 演讲材料_第4页
CloudOps云上运维系列课程 - 演讲材料_第5页
已阅读5页,还剩436页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CloudOps自动化运维,助力云上业务高效稳定运行借助云上原生工具与能力,实现业务的持续优化阿里云弹性计算高级产品专家01云上业务持续运行面临的挑战02ECS自动化运维(CloudOps)的产品大图03ECS使用成熟度评估与洞察(ECSinsight)介绍-里云-里云Auto-里云管理云上成本资源/技能不足软件许可证管理部门责任平衡数据来源:Flexera《2023StateoftheCloudReport》-里云成本管理稳定可靠安全合规弹性高可用-里云成本成本效率效率稳定稳定可用可用安全安全-里云-里云效率效率效率效率成本效率效率效率效率效率效率稳定稳定可用成本效率效率安全成本效率效率安全n自动化运维套件CloudOps效率效率安全CloudOps落地指南基础设施安全数据保护网络安全GuestOs安全访问控制操作审计ActionTrailCloudOps落地指南基础设施安全数据保护网络安全GuestOs安全访问控制操作审计ActionTrail包年包月按量付费抢占式实例Spot预留实例券RI节省计划SP资源报表性能优化推荐GuestOS管理(CloudInit、userdata等)资源分组管理(标签、资源组、RAM等)License管理LicenseManager补丁管理patchmanager标签服务TagLicense管理LicenseManager补丁管理patchmanager标签服务Tag实例启动模板workbench云助手实例托管ManagedInstances配置清单Inventory服务器迁移中心阿里云客户端AliyunclientSessionManagerROS资源复制实例健康诊断网络端到端诊断运维+资源状态变化事件ROS资源复制实例健康诊断网络端到端诊断运维+资源状态变化事件实例健康状态应用管理实例无法启动安全组诊断事件订阅云监控应用监控ARMS弹性伸缩ESS垂直升降配智能预测扩缩容弹性供应组预留实例RI预留容量宝容量预定计算形态计算形态基础镜像基础镜像(Linux、Windows等)基础安全防护基础安全防护(基础版DDOS高防等)资源视角ECSECSECSOSSOSSOSS部门:信息科技部ECSECSOSSVPC环境:生产ECSOSSVPC资源视角ECSECSECSOSSOSSOSS部门:信息科技部ECSECSOSSVPC环境:生产ECSOSSVPC>用户可以通过定义标签策略,对资源进行创建、管理等合规限定操作,提升企业在标签分账、标签分权、基于标签的自动化运维等场景上的管理效率。-里云标签标签地区部门环境北京区信息部生产VPCVPCVPCVPCVPC标签视角标签视角地区:北京区ECSOSSOSSECSECSVPC无当前标签:环境无当前标签:环境生产生产预发预发测试测试不带标签,则没有权限进行操作>提供了自动化任务的管理和执行,包括批量操作、定时运维任务、事件驱动的自动化操作、跨地域操作等,最终实现基础设施运维即代码(Opsas>支持免密码、免登陆、免跳板机进行批量运维、执行命令、发送文件等操作。-里云VPCVPCECSECSECSECSECSECSECSECSECSRollingRolling开始执行下一批执行下一批-里云VPC最大实例数期望实例数最小实例数VPC最大实例数期望实例数最小实例数-里云资源不足资源不足人工介入资源浪费资源量业务负载SLB、ALB、NLB自动挂载伸缩配置/ECS启动模板伸缩模式生命周期挂钩挂起扩缩容流程↓自动关联RDS、PolarDB、ADB等资源量资源量业务负载-里云CloudOps落地指南基础设施安全数据保护网络安全GuestOs安全访问控制操作审计ActionTrailCloudOps落地指南基础设施安全数据保护网络安全GuestOs安全访问控制操作审计ActionTrail包年包月按量付费抢占式实例Spot预留实例券RI节省计划SP资源报表性能优化推荐GuestOS管理(CloudInit、userdata等)资源分组管理(标签、资源组、RAM等)License管理LicenseManager补丁管理patchmanager标签服务TagLicense管理LicenseManager补丁管理patchmanager标签服务Tag实例启动模板workbench云助手实例托管ManagedInstances配置清单Inventory服务器迁移中心阿里云客户端AliyunclientSessionManagerROS资源复制实例健康诊断网络端到端诊断运维+资源状态变化事件ROS资源复制实例健康诊断网络端到端诊断运维+资源状态变化事件实例健康状态应用管理实例无法启动安全组诊断事件订阅云监控应用监控ARMS弹性伸缩ESS垂直升降配智能预测扩缩容弹性供应组预留实例RI预留容量宝容量预定计算形态计算形态基础镜像基础镜像(Linux、Windows等)基础安全防护基础安全防护(基础版DDOS高防等)-里云>从CloudOps定义的五大维度出发,基于客户的ECS使用数据以及云上最佳实践,为用户提供ECS业务风险识别与优化推荐。-里云资源覆盖面与分布、权益类服务及对应工具的使用情l行业最佳实践指南全方位的数据采集与分析能力安全性能力弹性能靠性能力成本洞察能力力-里云-里云-里云-里云产品能力产品能力•从计算、存储、网络、账号与资源管理四个维度,评估当前账号下所有ECS和计算基础能力计算基础能力存储基础能力存储基础能力网络基础能力网络基础能力账号与资源管理能力账号与资源管理能力抢占式包年包月节省计划产品能力抢占式包年包月节省计划产品能力-里云使用率的数据支撑,存储和分析大量历史数据面临门成本洞察能力购买抢占式实例使用性价比更高的实例规格购买预留实例RI购买并使用节省计划SP-里云产品能力1.自动化能力不足:受技术能力或业务发展阶段限制,日常运维管理都需要人工操作,比如资源部署,应用发布等,不仅操作周期长,而且还容易误2.脚本难统一维护或形成规范:运维脚本由每个运维工程师独立管理和维护,操作不透明,难以维护和复用。3.自服务能力缺失:所有日常运维都需要运维团队人工响应,研发团队无法自助完成简单的运维场景,协同成本高效率半自动化的方式进行基础管控,包括资源创建、释放、排障等。2.(中级)借助云上自服务工具,实现自动化管理:借助ROS、云助手、实例访问工具等进行自动化集成,基于trigger方式实现高度自动化管理。维中心OOS、软件包、参数管理等工具,构建平台系统,实现标准化作业-里云产品能力稳定性能力实例稳定性实例稳定性数据可靠性数据可靠性性能可靠性性能可靠性资源浪费资源资源浪费资源浪费资源资源浪费-里云产品能力提前扩容,超配资源人工扩容资源不好的用户体验损失用户损失收入 /资源不好的用户体验损失用户损失收入/浪费资源浪费双方责任边界双方责任边界-里云产品能力-里云0-0-ECS基础能力80401-成本洞察能力5-安全性能力-里云04-弹性能力4-弹性能力3-可靠性能力-里云ECS省钱指南:如何选择与业务形态最匹配的付费方式蒋超阿里云弹性计算技术专家-里云云上成本优化:ECS付费方式与资源规格选购创建ECS的各种方式及云上成本优化:ECS付费方式与资源规格选购使用场景Part-里云Flexera2023年云状态报告数据显示:-里云01选取合适的付费方式•包年包月•抢占式实例•预留实例券•节省计划02选取合适的资源规格•通用计算•异构计算•高性能计算•资源使用率优化•抵扣产品覆盖率优化•架构优化-里云基础:资源交付类演进:折扣权益类基础:资源交付类演进:折扣权益类-里云进阶:保障权益类进阶:保障权益类经济性确定性(可用区级)确定性确定性★★按量付费按量体系包年月体系确定性竞价体系抢占式实例确定性-里云合理使用ECS抢占式实例,客户最高可节省90%经营成本(相比按量付费),可以使用相同的预算,最多可以将计算容量提升10倍用户设置价格≧市场价格同时库存资源充足同时库存资源充足用户设置价格<市场价格或库存资源不足用户设置价格≧市场价格同时库存资源充足同时库存资源充足用户设置价格<市场价格或库存资源不足用户设置价格≧市场价格抢占式实例的生命周期与市场价格、库存资源强相关。-里云使用抢占式实例越能节省成本和提升吞吐量。可弹性伸缩的业务站点适用无状态、任务型的业务场景科学计算业务广告竞价业务••实时分析业务•地理空间勘测分析业务•图像和媒体编码业务•测试业务ecs.g7.largeECS2:ecs.c7.largeecs.c7.large*2华东2可用区FECS3:ecs.c7.largeecs.gn7.2xlarge华东2可用区Fecs.hfc7.2xlargeECS4:ecs.gn7.2xlargeECS:ecs.hfc7.2xlargeECS1:ecs.g7.large-里云-里云-里云APPAPP1APPAPP2APPAPP3APPAPP1APPAPP2APPAPP3-里云-里云购买时只需选择:有效期(1or3年)支付方式(全/半/0预付)购买时需选择:有效期(1or3年)支付方式(全/半/0预付)每小时承诺-里云务部门和晚上大数据部门使用的资源不一6.6折(月)-7.0折(月)7.0折(月)6.1折(年)-X--X✅✅✅X--XX✅X--X✅✅✅X--XXX✅X--✅✅✅✅✅✅适用于固定的7*24适用于不定时弹性任务型的业务场景抵扣较稳定的按量付费实例账单,适用于较固定的7*24抵扣较稳定的按量付费实例账单,适用于较固定的抵扣较稳定的按量付费实例账单,适用于较固定的7*24抵扣较稳定的按量付费实例账单,适用于较固定的7*24不确定需求弹性支撑无状态、任务型的业务负载支撑有状态、动态变化型的业务负载支撑稳定的业务负载支撑无状态、任务型的业务负载支撑有状态、动态变化型的业务负载支撑稳定的业务负载-里云Hadoop/SparkHadoop/Sparkgn7/gn7ig7/g7a/g6rg7/g7a/g6rc7/c7a/c6rr7/r7ag7ne/g5nere6e/re6第一代AEP非易失性内存i3/i3g持SGX与Enclave功能音视频/图像转码vgnvgn7ivGPUAcceleratedeaiseaisvideovideo-enhance通用计算实例a,g7a,g8y)存储增强型实例大数据实例D3S/D2S)大内存实例持久内存实例例机和互联网应用大数据分析分布式文件AI/机器学习科学计算视频编解码参数服务器高性价比算力保障高性价比算力保障配比丰富实例带宽最大提升全量搭载可信芯相同算力购置成本最高下降单一规格族支持多种处理器和内1:1/1:2/1:4/1:8高性价比算力保障配比丰富提供持续稳定算力的企业级实例,保障用户业务稳定运行资源规格选型–通用计算实例-里云高性能处理器高性能网络高性价比实例带宽最大提升全量搭载可信芯规格粒度小最小实例规格资源成本低基准性能保障保障用户的基准-里云Serverless化-里云-里云-里云里•业务量波动较大,希望可以提供基于作业负载的弹性伸缩能力,最大化利用计算资源;•深势科技希望有效调度集群的计算资源,希望提供跨可用区的多规格实例弹性扩容•满足了客户低成本构建高可用算力集群的需求:30%成本实现海量算力交付。深势科技利•性能需求:广告推理服务精排模块,随广告模型结构不断升级,在线推理模型请求参数变态伸缩的形式进行资源调控,在高峰期时及时开放资差别的匹配不同地区、不同机型,在成本进一步优化的同时,业务里流量对接 发放日志广告主后台管理投放引擎 投放引擎Search创建ECS的各种方式及适用场景樊毅伟阿里云弹性计算技术专家-里云创建ECS的各种方式与适用场景一键交付整套基础设施批量大规模交付ECS算力集群定时/动态弹性创建ECS高确定性创建ECS资源轮转/升级——ECS确定性保障-里云-里云场景:接口调试•URL:https://场景:接口调试•URL:/•场景:个人/企业新手免费试用;支持137款产品•URL:/wizard•URL:/mobile-里云•/api/Ecs/2014-05-26/RunInstances?params={"RegionId":"cn-beijing","InstanceType":"ecs.u1-c1m1.large","ImageId":"aliyun3x64_20G_alibase_20230727.vhd","SecurityGroupId":"sg-2zedcz9uks31udoie8y7","InstanceName":"qingyi-test-create-ecs","SystemDisk.Size":"20","SystemDisk.Category":"cloud_essd","VSwitchId":"vsw-2zey4630mbyjqx2oy6s5u"}场景:接口调试场景:接口调试•aliyunecsRunInstances--regioncn-beijing--RegionId'cn-beijing'--InstanceType'ecs.u1-c1m1.large'--ImageId'aliyun3x64_20G_alibase_20230727.vhd'--SecurityGroupId'sg-2zedcz9uks31udoie8y7'--InstanceName'qingyi-test-create-ecs'--SystemDisk.Size20--SystemDisk.Categorycloud_essd--VSwitchId'vsw-2zey4630mbyjqx2oy6s5u'场景:接口调试场景:接口调试•aliyunecsRunInstances--regioncn-beijing--LaunchTemplateId'lt-2zee2bl0qz16ah2r0brp'合规管控提升效率节省成本-里云InternetInternet--------------NatGatewayZone1Zone2VSwitch2VSwitch1/aliyun/ros-templates/blob/master/documents/solution/high-availability-architecture/elastic-highly-available-service.yml-里云持续保持••持续保持••-里-里云弹性供应弹性供应AutoProvisioning多可用区多种交付方式多种供应策略多可用区多种交付方式•稳定:容量优化策略•容灾:多可用区均衡策略•成本:成本最优策略弹性伸缩Auto弹性伸缩AutoScaling根据配置定时(如周五13:00:00)地增加或减少ECS内网出入流量等进行建模,通过机器学习预测算法预测未来2天整体的使用情况,并自动进行•健康模式、手工模式-里云•例如:每周五20:00热门节目来临时,某视频公司的业务量激增,您可以创建定时任务,在每周五20:00自动增加1台ECS实例。•例如:某视频直播公司的日常业务量难以预测,您可以创建报警任务,在CPU使用率大于80%时自动增加1台ECS实例。-里云容量预定Capacity容量预定CapacityReservation-里云90804000306090120150180210按高确定性创建高确定性创建ECS•资源轮转/升级/混布—ECS确定性保障容量预定高效创建ECS•启动模版/购买相同配置•OpenAPI门户/CloudShell•ROS/Terraform-里云弹性创建弹性创建ECS•批量大规模交付ECS算力集群弹性供应AutoProvisioning•定时/动态弹性创建ECS弹性伸缩AutoScaling高弹性、高可用、低成本的云上资源管理最佳实践阿里云弹性计算技术专家01云上资源管理面临的挑战02如何实现高弹性、高可用、低成本资源管理04总结与展望AutoAuto-里云01云上资源管理面临的挑战02如何实现高弹性、高可用、低成本资源管理04总结与展望-里云-里云资源量资源量业务负载传统模式业务负载业务负载资源量弹性模式-里云4.2添加到伸缩组,并配置负载均衡和RDS4.1创建ECS实例4.2添加到伸缩组,并配置负载均衡和RDS4.1创建ECS实例弹性伸缩(ElasticScalingService,伸缩模式(触发伸缩活健康模式 动态模式(云监伸缩组伸缩组伸缩规则伸缩配置伸缩活动2.ExecuteScalingRule(RuleAir伸缩活动执行程序3.3创建伸缩活动1.监控健康情况1.监控性能60s内完成1000台资源交付-里云扩容成功率99.9%-里云根据配置定时地增加或减少资源(如周五13:00:00,扩容N台资源)手动添加包年包月实例(不会被移出伸缩组)确保业务基座根据配置定时地增加或减少资源(如周五13:00:00,扩容N台资源)手动添加包年包月实例(不会被移出伸缩组)确保业务基座-里云基于云监控指标(比如CPU使用率)负载情况,根据配置自动伸缩-里云3.多付费类型组合进一步降低成本多付费类型组合预付费/预付费/RI-里云预付费/RI按量Spot景01云上资源管理面临的挑战02如何实现高弹性、高可用、低成本资源管理04总结与展望解决方案使用弹性伸缩完成业务的高弹性改造,不仅灵活应对工作日和周-里云按量实例包月实例按量实例包月实例按量实例按量实例包月实例按量实例包月实例按量实例解决方案-里云提前补偿任务自动替补即将释放的实例01云上资源管理面临的挑战02如何实现高弹性、高可用、低成本资源管理04总结与展望1.随着云计算的发展和普及,将面临更多的弹性资源管理1.随着云计算的发展和普及,将面临更多的弹性资源管理),-里云1.业务弹性化改造实现资源弹性管理2.基于弹性能力建立高可用资源管理能力3.在保障资源高可用的前提下,降低资源成本ECS多场景迁移上云最佳实践弹性计算技术公开课-CloudOps云上运维系列阿里云弹性计算技术专家-里云01如何将线下服务器迁移上云02如何从云平台迁移至阿里云03云服务器的高效迁移与升级-里云-里云件WindowsWindows/Linux操作系统-里云硬件驱动不同系统配置不同硬件驱动不同系统配置不同依赖软件不同-里-里云原生自带cloud-init、云助手软件原生自带cloud-init、云助手软件-里-里云•镜像(Image)可理解为服务器GuestOS的模板,在云上可用于创建云服务器。-里云服务器迁移中心SMC-里-里云服务器迁移中心(ServerMigrationCenter,简称SMC是阿里云的一款免费的自助式服务器迁移产品。专注于提供能力普惠、体验一致、效率至上的迁移服务。迁移上云目标:AnyPlatformToAlibabaCloud步骤二:创建迁移任务步骤二:创建迁移任务-里-里云ECS镜您检测完成查看报告-里云-里-里云-里云-里云-里云服务器迁移中心SMC-里-里云-里-里云-里云-里云•当前可用区实例规格无法变配•思路:进行跨可用区迁移,实现实例规格变配-里云40%99.6%40%99.6%2020年1月2021年12月2023年10月2024年6月•操作系统EOL趋势下,安全漏洞问题严重(可用区B)(可用区B)(新版本系统)-里云服务器迁移中心SMC-里-里云2.迁移规划4.迁移实施5.迁移验证2.迁移规划4.迁移实施5.迁移验证-里云3.迁移演练3.迁移演练•更专业全面,适合大中型高要求迁移业务场景,比如业务RTO秒级甚至不中断迁移•缺点是周期往往长达数月之久,成本巨大,且重度依赖第三方专业迁移咨询与实施团队•门槛更低、性价比更高,更适合DevOps趋势下的广大企业应用业务搬迁上云•配合完备的自助式迁移产品方案可实现自动化迁移上云,同时降本增效显著…ECS服务器云上迁移服务云上迁移迁移上云云上迁移迁移演练迁移演练迁移验证迁移验证ECSGuestECSGuestOS上云服务多云基础设施的统一纳管与运维实践阿里云弹性计算技术专家-里云01多云的发展和管理挑战02多云服务器的高效管理03多云服务器的高效运维04多云服务器的工作协同中心团队/业务部门责任平衡中心团队/业务部门责任平衡软件License管理迁移上云成本管理知识缺乏多云管理合规-里云-里云-里云,些?,些?-里云01多云的发展和管理挑战02多云服务器的高效管理03多云服务器的高效运维04多云服务器的工作协同1.不希望在多个平台上分开的管理云主机1.1.不希望在多个平台上分开的管理云主机1.通过公网直连连接到ECS云助手2.使用公网代理连接到ECS云助手3.使用高速通道连接到阿里云VPC4.使用VPN网关连接到阿里云VPC1.在云助手控制生成注册脚本2.根据入网环境调整脚本选项3.复制脚本到目标机器上执行4.在云助手托管实例中查看机器2.可以在阿里云平台上,进行统一的管理专线接入公网接入专线接入由阿里云管理的服务器或网络VPCVPCVPCVPC-里云用户的诉求:资源数量多,希望能归类标记,按分组查看和管理Value区信息部示例一:按资源Tag授权示例一:按资源Tag授权-里云-里云01多云的发展和管理挑战02多云服务器的高效管理03多云服务器的高效运维04多云服务器的工作协同-里云-----------------------------------------------e------------------------>•使用Shell脚本发起调用-里云托管实例托管实例托管实例托管实例ECS实例ECS实例ECS实例ECS实例托管实例-4托管实例-3托管实例-2ECS实例-2托管实例-4托管实例-3托管实例-2ECS实例-2-里云用户的诉求:众多的服务器,希望集中进行监控,管理报警规则托管实例-8托管实例-7ECS实例-8ECS实例-4ECS实例-6三ECS实例-5托管实例-6托管实例-5用户的诉求:用户的诉求:希望能自动处理报警内容,减少人工参与的环节-里云运维操作审计运维操作审计-里云用户的诉求:团队多人负责运维一组机器,怎样能证明谁做过什么,和没有做过什么,保证权限被正当的使用13 413 4-里云•关键的信息,可能被其他人员审计查•发送命令时,请求链路上容易留下日 云服务器内生成密钥对,并返回公钥信息云服务器内生成密钥对,并返回公钥信息 新命令:含解密指令,和使用解密的结果新命令:含解密指令,和使用解密的结果 -里云4.机器账号管理负担•不需要提供登录密码,不产生密码泄露•操作内容可以投递到SLS日志,方便进行•在有授权后,可以免于输入凭据,直接连接-里云托管实例ECS:StartTerminalSession访问控制 返回WebSocket地址连接WebSocket数据中转 内容投递5终端程序端口连接托管实例ECS:StartTerminalSession访问控制 返回WebSocket地址连接WebSocket数据中转 内容投递5终端程序端口连接6shellSLS日志客户侧应用客户侧应用 会话管理(SessionManager)工作原理示意-里云01多云的发展和管理挑战02多云服务器的统一纳管03多云服务器的统一运维04多云服务器的工作协同用户的诉求:可以在一个平台上,执行多云的运维任务使用云效,向多云主机/托管实例部署应用-里云使用云监控,统一监控多云主机/托管实例-里云-里云应用部署应用部署分发文件免费9安全9高效6线下线下IDC机房|私有云服务器|友商云服务器|阿里云服务器郑大禹阿里云弹性计算技术专家-里云4.总结4.总结-里云-里云云资源规模随业务发展快速增长,企业需要管理更多的计算、存储这将大大增加运维的复杂性,需要企业投入更多的时间和人力资源来管理和监控这些资源。企业需要建立有效的运维流程和工具,以提高资源的运维效率和可靠性。202320242025202620272028II-里云云资源成本随资源规模相应增长,企业需要进行有效的成本II202120222023202420252026-云资源成本-里云漏洞管理和补丁更新:随着云资源规模的增长,企业需要定期更新和升级系统的补丁,修复已知的安全漏洞。云资源合规要求:需要满足公司或行业的云资源合规要求。企业需要定期对云资源进行合规性检查,修复不合规的资源。-里云最佳实践场景往往是一系列运维操作的组合。-里云作为平台提供一系列自动化和半自动化的平台能力,实践基础设施运维即代码(OperationasCode)理念。-里云托管服务,稳定可靠,无需安装配置。启动实例动作ACS::ECS::StartInstance启动实例动作ACS::ECS::StartInstanceDescribeInstancDescribeInvocatDescribeInvocat-里云ACS::ECS::RunCommandStartInstance-里云滚动升级滚动升级滚动升级-里云Dev/GoldenImageIdDev/GoldenImageIdTest/GoldenImageIdProd/GoldenImageIdTerraformTest/EcsPasswordTest/RdsPasswordProd/EcsPasswordTest/EcsPasswordTest/RdsPasswordProd/EcsPasswordProd/RdsPassword-里云08:0012:0016:0020:0000:0004:0008:00Ubuntu18.04/20.04/22.04、AlmaLinux-里云....-里云标签标签Value存在指定标签(部门)-里云-里云如何实现云上“人、财、物”管理林小平阿里云弹性计算高级技术专家-里云企业大规模资源管理面临问题:不同管理模式下的问题企业管理视角与云上资源连接:设计、检索、规范大规模资源场景最佳实践:分权、分账、自动化运维大规模资源管理实践:设计、应用不同视角(管理、运维、财务)需要资源差异化管理云上资源与企业内部管理连接不足不同视角(管理、运维、财务)需要资源差异化管理云上资源与企业内部管理连接不足统一管理难-里云不同企业管理模式需要不同云上资源运维管理模式>分散管理分散运维(自管自用)•无管理,存在巨大风险、如不合规、无流程等。>集中管理集中运维(职责分离:只管不用、只用不管)>集中管理分散运维(精细职责:项目组/业务组自管自用)•日常管理自己管理。集中团队解决急迫的问题,提升生产效率。云上资源成本管理模式>showback模式•把账按部门算出来,给CFO和部门高层看一看,通常没有预算、独立>chargeback模式•把账按部门算出来,除了review之外,各个BU独立的进行IT成本计-里云企业资源企业资源-里云-里云企业大规模资源管理面临问题:不同管理模式下的问题企业管理视角与云上资源连接:设计、检索、规范大规模资源场景最佳实践:分权、分账、自动化运维大规模资源管理实践:设计、应用-里云标签管理标签管理-里云-里云-里云-里云业务场景使用业务场景使用不符合规范不符合规范符合规范不符合规范-里云-里云-里云企业大规模资源管理面临问题:不同管理模式下的问题企业管理视角与云上资源连接:设计、检索、规范大规模资源场景最佳实践:分权、分账、自动化运维大规模资源管理实践:设计、应用{"Version":"1","Statement":[{"Effect":"Allow","ecs:StopInstance"-里云环境:生产环境:生产测试/研发人员"acs:ecs:cn-hangzhou:*:*""StringEquals":{"acs:ResourceTag/env":"production""acs:MFAPresent":"true""IpAddress":{"0/22"]}}}]-里云 -里云……Value:业务部/市场部/研发部/运维部Value:项目1/项目2/项目3/…-里云企业大规模资源管理面临问题:不同管理模式下的问题企业管理视角与云上资源连接:设计、检索、规范大规模资源场景最佳实践:分权、分账、自动化运维大规模资源管理实践:设计、应用-里云互斥/集体互斥/集体1.1.明确管理模式(分散管理分散运维、集中管理集中运维、集中管理分散运维)1.1.明确管理模式(分散管理分散运维、集中管理集中运维、集中管理分散运维)-里云1.2.确认管理诉求场景(快速检索、精细权限管理、自动化运维、多维度分账)1.3.设计场景分类(部门/业务/项目/应用/应用owner/资源归属/财务责任人)1.4.规范场景标准(设计标签策略满足分类的最佳实践)1.5.小范围测试实践场景分类(测试是实践场景是否满足业务价值要求)1.6.应用场景分类(将标签键应用于所有资源)1.7.持续治理优化(治理不满足的资源,确保精确分类到值)跳转查看“如何保障规范管理”提升云上资源稳定性利器之ECS事件驱动体系构建基于事件驱动快速搭建自动化运维体系,提升运维效率与体验阿里云弹性计算技术专家01基于事件构建可观测体系02基于事件的云上运维体系-里云-里云2.磁盘出现损坏,无法进行数据读写2.磁盘出现损坏,无法进行数据读写2.实例非预期重启2.实例非预期重启3.实例性能受损4.实例过保5.实例欠费2.云盘性能严重降低1.启动实例,怎么知道实例启动结果2.挂载网卡,怎么感-里云2.实例存在安全违规停止/重启/重新部署停止/重启/重新部署化事件)计划内运维事件非预期运维事件性能变化用户操作有一定影响,需要您在影响持续期间加以关注,或者选择合适时间处理,例如突发性能实例性能受限时可以运行,您自行选择是否关注即可,例如磁盘快照已创建完成。Instance:SystemMaintenance.Reboot:Inquiring行该运维任务时会重启实例-里云-里云-里云4.实例存在潜在的安全风险,如何处-里云运维事件OpenAPI运维事件OpenAPI-里云EventBus平台:-里云),-里云-里云22(非预期事件、计划运维事件,分发(非预期事件、计划运维事件,分发1EventBridge3-里云11资源处理中性能高效编程友好操作完成资源处理中性能高效编程友好操作完成流(解决资源状态更新不及2资-里云基于事件配置短信、基于事件配置短信、API-里云提升云上资源稳定性利器之ECS自诊断工具基于自诊断工具快速搭建自动化运维体系,提升运维效率与体验-里云01使用ECS遇到故障时的痛点-里云-里-里云-里-里云-里-里云-里-里云-里云-里-里云-里-里云性能受损/性能性能受损/性能-里-里云ImpairedCreatingRunning启动失败启动成功NotApplicableImpairedCreatingRunning启动失败启动成功NotApplicableInSufficientDataInSufficientData初始化中数据不足 正常初始化中数据不足 正常-里-里云性能受损/性能降级性能受损/性能降级-里云4.根据文档中的解决方案修复问题1.远程连接ECS294.根据文档中的解决方案修复问题1.远程连接ECS29失败-里-里云3.诊断报告显示3.诊断报告显示ECS内部SSH没有运行导致2.使用2.使用ECS健康诊断进行实例问题排查-里-里云-里-里云合,可以一次性对诊断指标里的所有指标进ECSService.ServiceHealthECSService.InstanceNetworkECSService.InstanceStorageECSService.InstanceConfigure检查实例在启动过程中或运行中,是否被某个操作阻塞(block)ECSService.AccountBalance检查实例操作系统内的系统文件、关键进程、常用业务端口ECSService.ActionTrace3.提交工单4.云服务器ECS1.ECS控制台3.提交工单4.云服务器ECS1.ECS控制台2.工单-里-里云Impaired?!Impaired?!-里-里云-里云正常:受损:正常:受损:-里云-里-里云(DiagnosticIssue)ECSService.ServiceHealthInstance.ECSService.MngServiceExceptionInstance.ECSService.CPUBindFailureInstance.ECSService.CP实例的操作系统Crash。Instance.ECSService.Gu操作系统Crash。CloudOps助力云上业务安全运行借助Cloudops,体系化提升ECS安全性阿里云弹性计算高级技术专家阿里云弹性计算技术专家01云上ECS面临的典型安全威胁03如何体系化提升ECS安全性-里云-里-里云-里云-里云-里-里云•保护用户的数据安全和用户隐私一直以来是ECS非常重要的任务和目标。•安全性能力评分旨在引导客户使用ECS产品安全特性能力,以帮助客户提-里云-里云-里云LinkedIn数据库泄露后,攻击者发现特朗普邮箱以及他常用的密码,攻击者使用泄露数据的账密信息撞库攻击,最终导致特朗普推特账号被盗。-里-里云0101字典攻击02暴力破解社会工程Surfing)06键盘记录-里云-里云•企业可以基于会话管理协议,在内部系统中定制与集成,灵活•支持与云助手托管实例结合使用,实现在线运维阿里云外服•云上服务器,若分配公网IP则易被攻击,若不分配则不方便登录StartTerminalSession返回WebSocket地址连接WebSocket 理RAM访问控制StartTerminalSession返回WebSocket地址连接WebSocke

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论