VMware虚拟化平台巡检手册_第1页
VMware虚拟化平台巡检手册_第2页
VMware虚拟化平台巡检手册_第3页
VMware虚拟化平台巡检手册_第4页
VMware虚拟化平台巡检手册_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

系统拓扑图物理连接图整体拓扑图拓扑结构说明由上图可以看到,物理层面,我们用户采用了两台IBMX3850X5的X86服务器作为虚拟化的物理服务器。用1台IBMDS5020作为虚拟化存储,同时该存储中划分了众多LUN,部分LUN用于别的系统使用(如小型机系统)。存储和主机之间通过SAN交换机连接。整个虚拟化服务器通过LAN网络对外提供服务。在虚拟层面,我们用户虚拟化采用HA机制来保护虚拟机的高可用。物理硬件检查报告172.16.12.75硬件状态报告CPU状态报告在虚拟平台上,所有物理硬件都被视为物理资源,在虚拟平台上CPU的状态参考值必须为Normal,表示处于正常状态。在用户vmware虚拟平台上,这台IP地址为172.16.12.75的IBMX3850,物理CPU型号为IntelXeonE7-48202.00GHz;目前状态正常。内存状态报告内存状态参考值也必须是Normal,从上图我们看到用户这台IP地址为172.16.12.75的IBMX3850配置了32G内存,存在告警,告警内存的状态无法识别。建议检查停机检查内存。其他硬件状态报告由上图可以看到,其他硬件状态全部处于Normal状态。属于正常状态。172.16.12.76硬件状态报告CPU状态报告在虚拟平台上,所有物理硬件都被视为物理资源,在虚拟平台上CPU的状态参考值必须为Normal,表示处于正常状态。在用户vmware虚拟平台上,这台IP地址为172.16.12.76的IBMX3850,物理CPU型号为IntelXeonE7-48202.00GHz;目前状态正常。内存状态报告内存状态参考值也必须是Normal,从上图我们看到用户这台IP地址为172.16.12.75的IBMX3850配置了64G内存,状态正常。其他硬件状态报告由上图可以看到,其他硬件状态全部处于Normal状态。属于正常状态。虚拟平台检查报告虚拟平台基本状态检查172.16.12.75基本状态检查网络状态检查报告在虚拟平台上,网络基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台高可用性的特性,我们设计规划中,对于网络必须拥有多张网卡,建议每台主机有8张千兆网卡为佳。对于虚拟交换机,如果无特殊业务需求,建议每台ESXI主机仅有一个标准虚拟交换机或者分布式交换机。从上面两图来看,我们用户虚拟平台首先管理网络存在单点故障,没有冗余。同时我们当前有3台虚拟交换机,这3台虚拟交换机,实际情况只有vswitch0挂载有虚拟机,其他2台,没有挂载虚拟交换机。Vswitch1预计是做链接NAS存储用,vswitch2配置了管理地址,做管理用。对于vmotion,FT等高可用的网络确没有做任何配置。这种配置模式不合理。所有网络都处于单点故障状态,对于虚拟平台的高可用也存在严重问题。建议修正配置。存储状态检查报告在虚拟平台上,存储基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台性能的要求,我们设计规划中,对于存储规划上,我们要求存储的LUN划分要合理,使得运行性能最佳。从上图来看,我们用户虚拟平台存储存在两个存储,1个为性能较高的SAN存储。另外一个为性能较低的NAS存储。然而这两个存储属于各自运行,性能相差较大,无法进行冗余设计。建议配置一台同样性能SAN存储,作为冗余。NAS存储仍然作为备份使用。同时对存储里面的LUN进行重新划分,以优化性能。由于用户虚拟平台配置了SSD存储。SSD存储可以作为主机缓存。这里主机缓存配置把所有SSD盘当作主机缓存。建议重新配置,按照实际情况配置。虚拟机状态检查报告虚拟机良好运行状态,应该保障无告警,无性能问题,有高可用保障。由上图我们可以看到,用户虚拟化平台上的虚拟机已经处于HA群集状态,但同时有很多VM处于告警状态,该告警,经过初步分析,有可能以下原因引起:VMtools异常引起;GuestOS异常引起;目前存在内存错误引起;软件授权异常引起某些模块无法正常工作引起;我们建议,首先消除底层的内存错误,然后检查GuestOS和VMtools工作情况,其次对vmwarevsphere升级到最新的5.1。172.16.12.76基本状态检查网络状态检查报告在虚拟平台上,网络基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台高可用性的特性,我们设计规划中,对于网络必须拥有多张网卡,建议每台主机有8张千兆网卡为佳。对于虚拟交换机,如果无特殊业务需求,建议每台ESXI主机仅有一个标准虚拟交换机或者分布式交换机。从上面两图来看,我们用户虚拟平台首先管理网络存在单点故障,没有冗余。同时我们当前有3台虚拟交换机,这3台虚拟交换机,实际情况只有vswitch0挂载有虚拟机,其他2台,没有挂载虚拟交换机。Vswitch1预计是做链接NAS存储用,vswitch2配置了管理地址,做管理用。对于vmotion,FT等高可用的网络确没有做任何配置。这种配置模式不合理。所有网络都处于单点故障状态,对于虚拟平台的高可用也存在严重问题。建议修正配置。存储状态检查报告在虚拟平台上,存储基本建议必须有冗余设计,不存在单点故障。同时根据虚拟化平台性能的要求,我们设计规划中,对于存储规划上,我们要求存储的LUN划分要合理,使得运行性能最佳。从上图来看,我们用户虚拟平台存储存在两个存储,1个为性能较高的SAN存储。另外一个为性能较低的NAS存储。然而这两个存储属于各自运行,性能相差较大,无法进行冗余设计。建议配置一台同样性能SAN存储,作为冗余。NAS存储仍然作为备份使用。同时对存储里面的LUN进行重新划分,以优化性能。由于用户虚拟平台配置了SSD存储。SSD存储可以作为主机缓存。这里主机缓存配置把所有SSD盘当作主机缓存。建议重新配置,按照实际情况配置。虚拟机状态检查报告虚拟机良好运行状态,应该保障无告警,无性能问题,有高可用保障。由上图我们可以看到,用户虚拟化平台上的虚拟机已经处于HA群集状态,但同时有很多VM处于告警状态,该告警,经过初步分析,有可能以下原因引起:VMtools异常引起;GuestOS异常引起;目前存在内存错误引起;软件授权异常引起某些模块无法正常工作引起;我们建议,首先消除底层的内存错误,然后检查GuestOS和VMtools工作情况,其次对vmwarevsphere升级到最新的5.1。系统授权检查报告由上图可以看到,我们用户的虚拟平台输入的license为vsphereenterpriseplus5.0的license。经过了解得知,我们用户目前购买的为4.x版本的vsphere。上述的使用方式适用于测试使用。正式生产平台建议购买vsphere5.1最新版本license。由于之前已经购买过4.x版本,可以选择升级或者新购。虚拟平台安全检查报告172.16.12.75安全检查报告安全配置的参考准则:没有必要开的服务必须关闭,只是偶尔需要通讯的,我们可以通过防火墙限制。防火墙默认只开需要对外提供服务的端口。由上图可以看到,我们的安全配置属于正常状态。没有开放多余的服务和端口。172.16.12.76安全检查报告安全配置的参考准则:没有必要开的服务必须关闭,只是偶尔需要通讯的,我们可以通过防火墙限制。防火墙默认只开需要对外提供服务的端口。由上图可以看到,我们的安全配置属于正常状态。没有开放多余的服务和端口。系统性能检查报告172.16.12.75性能检查报告CPU性能报告CPU性能参考值:其中1%~30%属于比较空闲,31%~80%属于资源合理利用。80%~99%属于繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要CPU保持在55%以下都是正常范围。由上图可以看到,我们的月平均CPU使用率才2.5%;属于比较空闲状态。内存性能报告内存性能参考值:1%~30%属于资源富余状态,31%~90%属于资源合理利用;90%~99%属于资源繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要内存使用率保持在65%以下都是正常范围。由上图可以看到,我们的月平均内存使用率才62.5%;属于比较空闲,接近繁忙状态;这里需要特别注意的是,虚拟化平台的内存管理的气球技术统计无数据。这和软件授权和底层内存状态识别有关系。需要及时修正。磁盘性能报告磁盘性能参考值:空间方面80%以下为可用,81%以上为空间不足;I/O方面,占总I/O性能的70%以下为优良状态。70%以上为繁忙状态;我们用户虚拟平台磁盘空间容量目前充足,磁盘I/O目前平均在1134.83kBps,属于正常范围。网络性能报告网络性能参考值:使用率1%~50%均属于空闲状态;51%~80%属于合理利用状态;81%~99%属于繁忙状态。我们用户虚拟平台,网络平均流量97.622KBps,属于空闲状态;然而综合观察,网卡之间负载很不平衡,只有vmnic0有流量,其他均为0。需要改进配置,使得多网卡可以负载平衡且合理利用。172.16.12.76性能检查报告CPU性能报告CPU性能参考值:其中1%~30%属于比较空闲,31%~80%属于资源合理利用。80%~99%属于繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要CPU保持在55%以下都是正常范围。由上图可以看到,我们的月平均CPU使用率才2.5%;属于比较空闲状态。内存性能报告内存性能参考值:1%~30%属于资源富余状态,31%~90%属于资源合理利用;90%~99%属于资源繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)。我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要内存使用率保持在65%以下都是正常范围。由上图可以看到,我们的月平均内存使用率才73%;属于超额且繁忙状态,需要增加内存以备HA切换和虚拟机使用;这里还需要特别注意的是,虚拟化平台的内存管理的气球技术统计无数据。这和软件授权和底层内存状态识别有关系。需要及时修正。磁盘性能报告磁盘性能参考值:空间方面80%以下为可用,81%以上为空间不足;I/O方面,占总I/O性能的70%以下为优良状态。70%以上为繁忙状态;我们用户虚拟平台磁盘空间容量目前充足,磁盘I/O目前平均在808.83kBps,属于正常范围。网络性能报告网络性能参考值:使用率1%~50%均属于空闲状态;51%~80%属于合理利用状态;81%~99%属于繁忙状态。我们用户虚拟平台,网络平均流量355KBps,属于空闲状态;然而综合观察,网卡之间负载很不平衡,只有vmnic0有流量,其他均为0(这里是月视图,没有实时显示各网卡数据,但配置和75一样,各网卡流量负载平衡同样是失衡的)。需要改进配置,使得多网卡可以负载平衡且合理利用。系统告警检查报告172.16.12.75系统告警报告系统告警参考值:无红色告警,需关注黄色告警。我们

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论