




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、百度文库让每个人平邹地捉升口我运维通服务方案建议书撰稿方:广州网脊网络科技有限公司公司 撰稿日期:CUSTOMER, S NAME:用户名称:PROJECT NAME:项目名称:运维通服务方案建议书VOLUME NUMBER:卷标:第一版电话:4006-3525-00传真:地址:广州市番禺区大学城中二横路22号创业楼A区4楼网址:目 录第一部分引言3第二部分概述4运维通设计背景4设计原则4第三部分运维通解决方案6一键通功能6主机监控7网站监控10自定义分组与拓扑图10丰富的自定义报表功能11丰富的事件查询机制12自定义阀值.报警12第四部分部署方案14部署方式14第五部分服务方案16服务范围1
2、6故障级别16工作内容17日常支持17现场服务工程师工作内容17日常工作内容详细说明17日常服务17客户服务经理及专家支持团队18运维通培训支持185第一部分引言伴随的IT服务的发展.IT服务的概念也在发生着巨大的变化。IT运维服务已经由原来局限在 用户自身环境下的IT服务,延伸到覆盖公用云、私有云、外包服务商等多纬度、全天候的SaaS 运维模式,从狭义理解.IT服务仅仅是为了解决信息系统岀现的故障,在系统出现停顿的时候可以快速的 恢复。而目前的IT服务已经包含了更多的内容,IT服务渗透在信息系统的整个生命周期之中。本 文基于该理念,对IT服务系统的实现进行分析研究。文章基于网脊运维通SaaS
3、(SOftWare as a SerViCe)模式理念”构建统一平台下支持多类型用户使用的基于SaaS模式的IT自动化运维平台。 使用户在使用效果上与企业自有IT服务运维平台基本没有区别,但节省了大量用于购买硬件设 备、技术支持和维护运行的资金,冋时使得原来分散在不同区域多个机构孤立的信息有了信息共 享的条件,使得用户能对分散在不同地方的IT系统进行控制、并及时了解相关信息。同时结合网脊运维通的手机APP,用户可以随时、随地地了解自身IT基础环境、业务系统等 IT资源的可用性、性能、安全事件等主要监控类别,同时结合手机APP上的一键通功能,用户 可以方便地对远端机器进行硬件重启,预录制命令脚本
4、执行等方便、快捷的一键运维功能。运维通集成了简单、实用的监控、远程操作等实用功能,让普通用户无需购买、安装复杂的 IT运维系统就可以享受在线的IT监控、运维系统,同时具备即时通讯功能的工单流转系统,可 将用户、外包服务商、IDC机房维护工程师等角色有机地整合在一起,是一个完全创新的基于SaaS 模式的社交型IT运维技术平台。第二部分概述运维通设计背景运维通的设计背景主要是针对目前互联网上的设备、应用越来越多,而一般客户的运维技术人员 多在公司本部,系统、设备多托管在远端机房,他们希望能有一套集成了远程连接、在线监控的 自动化运维解决方案,同时可以很好地集成到手机APP上,随时随地对远端设备进行
5、监控或者简 单常用的快捷操作等功能,同时IDC托管机房也希望可以拓展自身的业务范借1,不停留在低价竞 争的机柜出租业务上,而是可通过运维通系统对用户提供系统、实用的监控、远程维护、工单流 转/考核等功能,从而可持续性地提升用户服务体验,提高自身品牌的客户美誉度。设计原则在线系统的监控、运维与普通运维解决方案看似有许多相似的地方,但其实还是有很大的不 同,普通运维解决方案部署在本地,监控的设备数量有限,使用的用户数量也有限,但在线SaaS 系统则明显不同,监控的设备往往是海量数据,一个普通IDC就有上万台设备,用户数量则往往 过千,如果采用普通IT运维网管软件的设计是完全不行的,同时在SaaS模
6、式下,整个监控是在 公网上完成,用户对安全性要求比较高,如果采用插件的方式,用户也一泄会比较抵制,总之, 在线SaaS运维系统的设汁有英自身的特左,我们在开发运维通过程中,遵循了以下设计原则:弹性化架构考虑到在线SaaS系统的运营特点,运维通的设讣采用了高度可扩展性的云系统架构,整个 系统分为三个层次,按需部署的收集器、管理服务器以及数据库集群,任何层而的设备都是 采用负载均衡的方式工作,任何设备实效后会自动切换到相应的健康设备上。高性能网脊运维通的收集器,每台至少可监控、管理500台设备(主要是SnmP协议特点,而非运 维通设计瓶颈),每台管理服务器至少可以管理30台收集器,一个2台管理服务
7、器、60台收 集器的小型运维通系统集群就可以很好地管理、监控3万台互联网设备,英性能指标是比较 高的。安全性与完全运行在用户企业内部网络的本地监控系统不同,网脊运维通系统是为广大用户通过 SaaS方式来监控、管理自身设备而研发的,所以网脊科技在开发过程中摒弃了英企业解决方 案运维通的很多功能强大,但会牺牲安全性的监控项目和监控策略,用户设备无需安装插件,百度文库让每个人平邹地捉升口我第三部分运维通解决方案运维通是一个监控、运维门户,用户只需经过简单的注册后,就可以在线实现互联网IT资 源的监控、故障报警、报表、ITIL事件跟踪、一键通自动化运维等功能,同时具备,以保障客户 互联网业务应用的可靠
8、运行。现在很多国内的IT用户都在考虑如何把自己的业务部署到私有云或混合云环境中,以增强 英业务的可扩充性及高可用性,从理论上来说,云架构可以提供更髙可用性的IT基础环境,但 实际上云计算不是万能的,最近亚马逊及GOOgle的多次重大云故障说明,云计算环境除了系统 层而以上的应用软件问题,其更加复杂的架构及资源池算法等因素,都需要更专业的监控管理工 具及具备云讣算知识背景的运维人员才能很好胜任云平台的高可用运维,但一般企业显然不能把 他的运维团队搬到运营商机房去,这时候,运维通就有了用武之地,下而简单介绍网脊运维通的 主要特点:一键通功能运维通的一键通功能,主要实现的功能就是通过预先配置好的IP
9、HI接口协议,实现类似远程 KVM的一些功能,主要可以实现以下功能:远程开、关机-一-可对远程托管的已经死机、蓝屏的远端服务器,直接进行重启操作, 无需IDC购买价格高昂的PDU设备,只需连接服务器主板上的IPMI接口,通过运维通软 件就可以实现硬重启: 一键命令一一对于常用的运维命令脚本,如:重启服务、重启进程等等,可预先设置 好后,在手机APP上一键运行,当某个服务出现僵死,而自己不在电脑旁边时,这个功 能就变的非常实用:乜启动/关闭设备远程开机功开机视® 一潼开机 一參机卜设备:12 管理IP: 12手机上也具备完整的一键通功能,具体
10、使用界面可见下图:设备 211.154.14323? tfaiP:211.154 U3 23?(SEn«S®一鑒助手幵机助夢决援IftQ网脊运维通谁用谁轻松彳 O SB5* 0BT<Jai9:oo网脊运维通I ½J2WS90O主机罗件>211 154 143237O主机多件>211 )54.14348O主机罗件>20296.15519O主机事件>令図A 个人g免3jr勺印体输MM M½MX<k flZaIr为 W ; "gW"j IAA0*. MIWO. K.BM主机监控在
11、线SaaS监控系统中,最重要的部分是服务器主机的监控,通过监控主机的主要可用性、 性能、日志等指标,用户可以随时了解和掌握放在远端数据中心机房的设备工作好坏,配合手机 APP的及时推送信息,免除在IDC托管机房还需购置短信网关等问题,主机监控主要涉及的监控 项目主要有:CPU/内存一一这是非常基本的监控项目,运维通以仪表板的方式直观地展现CPU、内存 的消耗情况,让用户了解这一基本资源的消耗情况;端口监控一一与目前主流的云监控、SaaS监控系统的总端口流量监控不同,运维通的 端口监控可以任意泄义物理或虚拟端口的监控,对于多台设备托管在IDC,跑不同业务的 用户该项功能非常实用,并且端口监控是以
12、连续波形的方式展现,用户可以通过设立小 时、日、周等方式变换视角。进程监控 一般的云监控平台只可监控总进程数,这个对于网管人员非常不实用, 运维通可以选择任意进程来进行监控,也是以连续波形的方式来展现。磁盘监控以图像化的方式展现目前所设泄的监控磁盘、分区的总容量、可用容量等磁盘信息。服务监控用户可设龙被监控的任意服务端口,系统会自动监控其服务状态,如果端 口 down则为红色,正常则为绿色12同脊远纳诵也定义力f畑邑¢: 21115<fcX4390Zll 15<.i439CCpu¾ CPU比併恋 O SUS光WyK; O芫护3.7*3 玄?:313沪2149.0
13、LMWHIk tr.211l 54143.190r21LIS4.U3.imftr001 Sfr211.154W.1902111M.143.190CPUfrB2O 5fr211¼143.Zbrtegrityd/! if* 止 I ¾>Me9r<v1 igjkiU.iS443.00 IPSnCp.38 IP Sewe tcp.elt?'CpMSem 例榔2叼5性35(%)100r WEJee gmoMMI O 空土皈 × to T Wtt)Ect&Sg» attX±如*0CO23:BB:65clA:B87324<b
14、p.IOSQTKbp"月“ V:天启OUCPTTMemIJM刀"闷亡 KflnM天用月IOOZ5C*ZS. A d_ WcOUCo丄IeCO一 me<n22e&ooI2180»亠一亠u7穴拒.CVl e« 36TM, e 48422MOSSE 妙V蚀F SfflQ U 176-25世3筋Cpv祐migrefrCfVIWt0"甌g0T 仙 qd/D0.20%0ib<mr>gsty dlt>>20%IeKsbirr>yak>gd ; *arvr>pk>g<lpid -C S0%3.
15、5IMhom<5WWooVVrWWIWaW. p*0t5n,ji Py Woe%54.6M>rt*jnty<JZdmi TatlOnaau/Ok.oftrqdi0Z5brhioty detty2 ibfs>o>d 4 Mty5k>gd.pid < 5/Kom vvmvo=tv/V .w*r j ml. produ ct;IrU rV/«g iSOoO l>itgrxd,i*l天ITaoG*p.80手机界面展不如下:Q BT;gja 19:05返回主机管理设备事件概要信烏21154.143,48eiiP: 211 154 143.48CP
16、U: 12.0% 内存:91.9% 描述说明:I最新事件8W : /为 设备211.154 143.48内存使用百分比达到设Ik定的最大值90 I 吞时司 2014-06-25 19:05发生次次285次84枣件倍忌接口elhl已掉线!O *司 Ji可 2014-06-25 19:04发生次数:1996次8H件二冃 进程已停止:optnetbase4binPythonZopt/ netbase4/ProdUCtSnetPerDatanetmerger. Py daemon話时乜 2014-06-2519:03发生次真
17、.200D次 C 0 Qi象匕19:06返回主机管理楸要信息进程信息接口信息逬程名称:optetbase4bnPythOnotnetbase4PrOClU. CPU: 0.0% 内存:18.12M 状态:ONM$ 9 G H19?0 絹於07«"细 Mem<<M进程名称:optnetbase4mongodbbinmongod -auth «.CPU: 0.7% 内存:612.18M 状态:ON-A*Ma3Cow?Sn07«W(I4tti竺玖 nntHQthncodhinZnvthnn nntnthncQzlnrnr1 A-A.-tIVI2游2
18、3网站监控网站监控也是SaaS监控中非常重要的部分,毕竟大部分的在线系统主要是各种网站,对于 网站监控,网脊运维通可以从不同的监控点来监控被监控网站的延时响应时间,这对目前国内的网络环境还是有必要的,下图为网脊运维通网站监控实际的例子:网脊运维通WWW弭奶盅 12m小*手Z昨UeD IOoWM:CH7ySi*.70CSMMWbNdacc<n(vrM.Man)e«xnIO¼p.MM<v44<Xno¼ZUob*x<omSgMMMlcO36<IKrti"天H075U伍4砂 <b4ifttt, HfMzttflp MwK M
19、cmvcom<ft I14-06-2S IZ)WMW中电倖钛有*力询以才逹”勿曲46.252皿0 >*÷n9CJJtT 中 BR *p W >iomv<omfi52!2014-W-25 21j29 u中 R*I><o*L5!12014-00-25 2129-OJS 40UtIiiJ8 P *w XleDm Cofn KVHA*fi w* warv <» 4OUttW WWW 10086 CB 中QW坯 ud tacb<o.COn -*- 44Sifl SW bd.KMG-JCTGMMw.bidcc<nN/ANMWM<
20、;n4 7ImJ79mjPM"m<v扛 <nN/ASudtaoaoomS6634m.74BXmw1C0W<4% Slmt4017 JmJ-岭刁叫*右自定义分组与拓扑图网脊运维通除了针对主机、网站等进行监控外,还允许用户对该对象进行自圧义分组,并且 通过类似VISlO的绘图功能来绘制自己的网络拓扑图,让用户非常直观地了解自己被监控设备的 工作情况,百度文库让每个人平邹地捉升口我211.154 143 Ido202 9C1W19丰富的自定义报表功能HU人:q?Jafedrcon. CCC- c® (笳个枚件人ff J SS÷P: #1230$# .5
21、V画 n JtSUEO ffi 1C<>86WAWWBrlMnrCKW>谢毬VlIA MMW/7TTTTTTT777MLlMMUt»M20MlimNQJX»i9lM1U21UJ1U42114X1412PUu>X,MW4WKD12MJtMMtAfMUM0>Cfc«HQM24?JLLlSCUlltO>»DlTrwMOCrl)CU tnc< ttm网脊运维通的报表是可以按照用户的需求进行自定义配置,自定义的规则可以监控的 任意项目来进行设定,并可导出为PDF格式,具体设定项目见下图所示:百度文库让每个人平邹地捉升口我丰
22、富的事件查询机制网脊运维通的事件机制比一般SaaS监控产品或云监控产品丰富,可按照系统的不同分类监控项 目,如:主机、网站、磁盘、进程等等来进行分类査看,同时也可选择不同的时间区间来进行事 件査看,支持信息内容检索、组件检索等等辅助功能,详细见下图:0<«A*WnZ<edob>M.½*>doU)o.½wdUob*o.IXU xnudUohc.dUohM.MWn JCK09xnVedUobA uc.CM林 atft>4C<r<Bt2e*w*>dc*<njKftCM*Jo>X<.>mSft Mwa
23、a w½ 加 Og<0血匝匆 CMWaftI S乂咖 Og gg.RUOuJ JUoseoQmCC.R*i3gQm煦 CC>WU3fi59K' MQBRftUMW.2Ulcr fr*WAM*eJ4U<orn*ft开仙1Swarn处XU02J51M*26 他 0?38ntzo1ct8i4%22 0i3»14.06-261IlMnto1ct2OI4Ofr25N512014-0-20 WW738Kco*1e<t20Mg22 S 为2014021019IIWf<co1e<t0140fr-20 OJW20U02003 W2Kc0le<
24、12<M4g2602"20"g2602492oe<coQt20Mg26 021420Ia-O¢-20 02 W2netc1e<t2014026 Q 曲2ntEt20K*2603mi4g260g6nteolt20UgM Oti414-06-26 0t2ntcot<t20H46UkM14-06-260Hr4nto1rrtOWOS20 CnIM2014 O&-20 OI94ntrol<t硼2仙为ZOtUOlEl-2tt>½*my<l>nM+Tk,-wa!*«5Lbt H fe=s÷ w
25、.Mwixn < .rtt,USg eI 可 RT “饷心P A 令 JL Q H M m K上j_医.r. %>心47闻 a ±S « h 仆raI i黜丐貝茫令自定义阀值、报警网脊运维通的监控项目,主要是在线服务器的一些重要的可用性、性能、事件等监控指标,每个 监控项目,用户都可以自左义触发报警的阀值、报警级别等相关条件,做到事件、报警按照用户 的意愿和需求来生成,免却大量无用报警、事件的烦恼。17 2li.l¼145J5?Wzilimmmb XlA lW.i612fi?> WUVt I第四部分部署方案网脊运维通的监控功能简单、实用,但考虑到
26、是SaaS应用方式,故其部署相对普通的监控系 统来说要庞大和复杂一些,运维通的架构其实是分为4个层面,收集器、交互层、管理服务器/数 据库、前端负载均衡web服务器。而向用户设备的是收集器,主要负责采集用户设备的SnmP监控 数据,通过IPMISSH/Wl等协议与设备进行互动,与收集器连接的中间层而为RadiS和MemCaChe 数据缓存及交互层面,该层面负责将收集器和管理服务器之间的交互,保证收集器岀问题后,管 理服务器可以维持数据的完整性并把数据交互到其他收集器,管理服务器和数据库负责存储用戸 配置信息、业务数据,前端负载均衡web服务器负责与用户GUI交互。部署方式运维通主要是为大量用户
27、同时使用而设汁,苴部署相对普通的内部局域网运维监控产品有所 不同,运维通的部署分为以下4个层面:1:收集器收集器的部署,取决于监控用户的多少,一般按照每收集器监控500台主机左右来进行收集 器部署,网络拓扑上,可采用双网口,与内部中间层面交互的接口用内部接口,速度快,网络环 境封闭、安全,监控用户设备的接口使用外部接口。2:配置服务器配置服务器的部署数量主要取决于收集器的数量,一般按照30: 1的数疑来进行配比,配 服务器最好通过内部网络接口连接收集器,配苣服务器无需外部接口,只需要连接收集器和数据 库。3:数据库数据库存放所有的监控策略、监控到的各种数据、用户信息等等,当用户量比较大的情况下
28、 建议采用集群的方式来部署,运维通采用的是HiongoDB,其集群部署最少需要5台设备。4: nginx/web服务器由于用户量比较大,采用nginx来做Web服务器的负债均衡,Web服务器采用的是DjangO方式, 网脊运维通的网页内容相对还是比较简明,2000用H左右用一台Web服务器都没什么问题,当用 户数突破这个限制比较多的情况,可以使用NginX负载均衡来解决。网脊运维通与被监控设备直接需要开通相关通信接口如下表所示。部署前需要测试各端口是 否可以正常通信。运维通部署的相关协议端口如下:服务名称端口源地址目的地址备注SSH22收集器地址公网被监控设备远程命令等WMl135收集器地址公
29、网被监控设备WindOWS命令等SNMP161收集器地址公网被监控设备监控数据Web服务80/81外部用户Web月艮务器nginxWeb访问数据库27017/27018配置服务器web服务器数据库集群数据库服务memcached112111121211213Web服务器配置服务器缓存服务rpyc12233收集器地址配置服务器传输连接服务网脊运维通典型部署的拓扑图如下:NGfMXrginx 80SmongoDB 4WCbSCrVOr:91Conf Serverrrc.12233.112H9 11212. 11213boot.12305 CcpServer 12363 rod is 6379POr
30、mDrKO.2 7OfSGQnflhnRO. 27017第五部分服务方案为了更好地在IDC及运营商合作伙伴推广网脊运维通解决方案,网脊公司将为合 作伙伴提供运维通的实施、维护服务和二次开发服务。服务范围服务对象范用包括:1、合作伙伴的所有网脊运维通产品:2、服务期限:一年。故障级别问题级別问题定义处理时限一级故障业务中断或半中断状态,已影响用户的正常使用现场服务,鉴于地域的因素,如果在 非现场服务时间内,工程师到达现场 的时间为2小时内,并4小时内修复 故障或采用省地各局同意的替代方 案恢复业务,保证业务的正常运行和 用户的正常使用二级故障存在故障隐患,业务处理能力下降,并影响 了用户业务的正常使用6小时修复三级故障对业务有轻微彫响,但不影响业务运行和用 户正常使用的问题12小时内给予技术支持四级故障不影响业务运行和用户使用的问题24小时内给予技术支持百度文库-让每个人平聲地提升自我工作内容日常支持1、在本次运维通的服务项目中,网脊工程师将为省地各局提供日常的支持服务,包括7*24 小时的电话热线服务、邮件服务以及传真服务。支持的内容可以包括运维通的配置疑问,产品咨 询等非监控系统故障的问题。2、客户服务经理根据需求提供服务计划,左期与省地各局沟通控制服务质量,并在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国8寸袖珍折叠自行车数据监测研究报告
- 2019-2025年军队文职人员招聘之军队文职管理学自我检测试卷B卷附答案
- 2019-2025年军队文职人员招聘之军队文职管理学与服务过关检测试卷A卷附答案
- 康德三诊物理试题及答案
- 保安文化测试试题及答案
- 小学生人际交往故事征文
- 企业虚拟专用网络服务协议
- 《统计学的数据处理基础:初三数学教案》
- 产品销量排行表-电商销售统计
- 辽宁省朝阳市建平县2024-2025学年八年级上学期期末生物学试题(含答案)
- 2004年考研英语一真题及答案
- 过程装备控制基础过程装备控制技术及应用
- 博弈论与信息经济学课件
- 模块二项目二观察力课件
- DB64-T 1147-2022 宁夏工业单位产品能源消耗限额
- 中交项目标准化手册-第一册工地建设
- 天文小报(流星与彗星)
- 公安机关业务技术用房和办公用房规划设计规范
- 校园华尔兹教案-2021-2022学年高中体育与健康人教版必修全一册(表格式)
- L阿拉伯糖与排毒课件
- 《冲压工艺与模具设计》知识点 (2)
评论
0/150
提交评论