版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、故障处理业务技术规范RG-erCache 产品2012-05-31福建星网锐捷网络文件类型: 故障处理类版本号:V1.0文档作者:TAC文档密级: 受控内审人:使用对象:ASE、PMC、RSC福建星网锐捷网络2000-2011锐捷网络,并保留对本手册及本的一切权利。未得到锐捷网络的,任何人不得以任何方式或形式对本手册内的任何部分进行商业用途。、摘录、备份、修改、翻译成其他语言、将其全部或部分用于、都是星网锐捷网络的商标,不得仿冒。技术支持锐捷网络: 天*24 小时技术服务:4008-111-000锐捷网络技术: HYPERLINK http:/ http:/锐捷网络技术支持与反馈信箱:.cn锐
2、捷网络: HYPERLINK http:/ http:/您可以在每周一至周五早8:30至晚6点,通过“”获得信息咨询、调试排障、软件等技术支持。无需客户端,可以即时截图、发附件,方便快捷。锐捷网络技术支持中心: 安装手册本手册介绍了产品在功能和物理上的一些特性,提供了设备安装步骤、硬件故障排除、模块技术规格,以及电缆和连接器的规格和使用准则等。产品 配置手册详细的产品各功能配置手册产品 命令手册本手册对产品支持的配置命令做了详细的描述。包括命令模式、参数说明和使用指南等,并配有具体的实例。1前言读者对象本文档是作为故障排查业务的配套技术规范,讲述了 RG-erCache 产品在故障处理业务中需
3、要掌握的的重点技术规范,在故障分析,信息收集,故障定位,解决方案实施等各个环节的操作建议,并给出了相关告警与日志分析以及典型案例的解决方操作标准,帮助提高故障处理业务的效率。范工本文档主要适用于以下工:l工l调测工l网络工修订日期修订说明执行人2012-5-31第一次发布此文档仅限公司,严禁外传。如果您在阅读中产生疑问,请与文档人联系。2目录1234前言4目录5常用故障信息收集8硬件类故障9硬盘类故障处理9故障现象9故障处理流程9故障处理步骤10RAID 类故障处理10故障现象10故障处理流程11故障处理步骤11CPU 类故障处理12故障现象12故障处理流程12故障处理步骤12内存类故障处理1
4、3故障现象13故障处理流程13故障处理步骤14系统类故障15Web 界面无法打开故障处理16故障现象16故障处理流程16故障处理步骤16更改控制台端口后,重新初始化 web 界面 443 端口不能连接故障处理17故障现象17故障处理流程17故障处理步骤17忘记信任 IP 地址故障处理18故障现象18故障处理流程18故障处理步骤1855.4 忘记 web 界面 administrator故障处理19故障现象19故障处理流程19故障处理步骤195.5 忘记root. 205.5.1 故障现象20故障处理流程20故障处理步骤205.6 主机不能登陆21故障现象21故障处理流程21故障处理步骤215.
5、7 搜狗浏览器不能正常重定向缓存文件故障处理22故障现象22故障处理流程22故障处理步骤235.8 增加网卡配置需求23故障现象23故障处理流程23故障处理步骤24服务器异常死机故障处理24故障现象24故障处理流程24故障处理步骤24清除和替换Cache 故障硬盘故障处理25故障现象25故障处理流程25故障处理步骤25修改Cache IP 地址故障处理29故障现象29故障处理流程29故障处理步骤29清除 cache 缓存文件故障处理30故障现象30故障处理流程30故障处理步骤30更改 BT 硬盘为HTTP 硬盘故障处理32故障现象32故障处理流程32故障处理步骤32系统根目录使用率 100%故
6、障处理33故障现象33故障处理流程33故障处理步骤34opt 目录使用率 100%故障处理35故障现象35故障处理流程36故障处理步骤36从服务器加入主服务器集群中,无法选择从服务器查看统计报表信息故障处理37故障现象37故障处理流程375.16.3 故障处理步骤38Cache 提供了错误的缓存文件故障处理38故障现象38故障处理流程38故障处理步骤39删除集群中的从服务器故障处理39故障现象39故障处理流程39故障处理步骤40网络类故障4166.1 正确部署缓存后,无HTTP 和流服务流量41故障现象41故障处理流程42故障处理步骤426.2 缓存系统不能用户请求数据包43故障现象43故障处
7、理流程43故障处理步骤436.3 开启缓存服务后,系统不能. 44故障现象44故障处理流程44故障处理步骤446.4 无法通过SNMP 协议erCache 系统44故障现象44故障处理流程45故障处理步骤45erCache 通信网卡丢包故障处理46故障现象46故障处理流程46故障处理步骤466.57兼容类故障47故障处理流程47故障处理步骤473常用故障信息收集故障处理的初期阶段做好与故障相关的各种基本信息的收集工作,可以帮助范围,提高故障定位的准确性。对于Cache故障来说,常用的故障基本信息搜集缩小定位故障的令如下:信息项使用命令使用说明CPU 信息查看 CPU 利用率及各种应用进程 CP
8、U 的情况CPU 利用率是分析er Cache 响应慢的重要内存利用率查看er Cache 内存占用情况,是分析设备是否存在内存溢出的必须端口状态显示网卡的状态(包括双工、速率、模式等)可以显示网卡的详细统计信息(包括报文速率、CRC 等异常丢包统计信息,用来评估网络环境的重要信息网络通信显示网卡及路由的详细信息(包括 IP 地址、子网掩码、网关、DNS、主机路由表等)日志查看日志信息,包括故障关联周边设备的Log 信息都是非常关键的。系统日志是排查 er Cache 问题的重要线索。通过日志可以查询 er Cache 各服务是否工作正常。异常信息查看显示 er Cache 的异常错误信息。该
9、信息是分析硬件故障引起的 er Cache 异常错误的重要线索。dmesgcat /var/log/messagescat admin.log cat sniffer.logcat downloader.logtail -f acs.logifconfig routecat /etc/resolv.confethtool eth0free -mtop建议erCache 类的故障,以下信息作为常用故障基本信息作为每次故障信息的必备收集内容。4硬件类故障关于本章4.1.1 故障现象硬盘作为服务器,与普通单机电脑硬盘一样,随时可能因使用年限过长、硬盘自身质量问题以及不良操作等原因造成各种服务器硬盘故
10、障(如硬盘坏道、磁头不稳定、盘片划伤等),譬如当服务器出现频繁死机、无征兆重启等现象时则有可能是服务器硬盘出现了物理坏道,需服务器数据安全管理提高警惕。4.1.2 故障处理流程硬盘类故障通常是由于硬盘安装故障处理流程如下:或接口松动、硬盘自身质量问题、硬盘槽位硬件故障引起的。4.1 硬盘类故障处理章节内容介绍4.1 硬盘类故障介绍了硬盘类故障的处理思路。4.2 RAID卡类故障介绍RAID卡类故障处理思路。4.3 CPU类故障介绍CPU类故障处理思路。4.4 内存类故障介绍内存类故障处理思路。确定硬件是否插紧,检查接插件是否有损坏确定基本连接正常尝试更换硬件槽位、硬件替换排除硬件故障排除硬件故
11、障拨打支持并传回收集信息寻求故障解决帮助4.1.3 故障处理步骤步骤 1检查并确定硬件是否插紧,检查接插件是否有损坏,可尝试重新插拔硬件,以便确定硬件是否连接正常。对于插拔时,受到阻力或感觉不顺畅的时候,请不要强行大力或拨出,需要立即停止操作。并缓慢移出硬件,确认硬件和背板相连的接插件是否松动或明显变形现象,确认硬件是否存在明显变形的情况,确认背板槽上的接插件是否被折弯或明显变型现象。如条件具备,强烈建议对接插件进行详细拍照并。步骤 2尝试更换硬件槽位、硬件替换排除硬件故障。步骤 3拨打 400,寻求故障解决帮助。4.2.1 故障现象服务器具有海量的功能,这主要源于其采用 RAID 卡模式。常
12、见的服务器阵列包括 RAID0、,甚至数据丢失,严重影响服务器数据RAID1、RAID5 等,一旦出现故障,将直接导致服务器数据不可4.2 RAID 类故障处理安全管理。经常表现为 RAID 信息丢失,硬盘经常掉线,不能做 REBUILD,开机自检时检测不到硬盘或需要较长时间4.2.2 故障处理流程RAID 卡类故障通常是由于 RAID 卡安装故障引起的。故障处理流程如下:或接口松动、RAID 卡自身质量问题、RAID 卡槽位硬件确定硬件是否插紧,检查接插件是否有损坏确定基本连接正常尝试更换硬件槽位、硬件替换排除硬件故障排除硬件故障拨打支持并传回收集信息寻求故障解决帮助4.2.3 故障处理步骤
13、步骤 1检查并确定硬件是否插紧,检查接插件是否有损坏,可尝试重新插拔硬件,以便确定硬件是否连接正常。对于插拔时,受到阻力或感觉不顺畅的时候,请不要强行大力或拨出,需要立即停止操作。并缓慢移出硬件,确认硬件和背板相连的接插件是否松动或明显变形现象,确认硬件是否存在明显变形的情况,确认背板槽上的接插件是否被折弯或明显变型现象。如条件具备,强烈建议对接插件进行详细拍照并。步骤 2尝试更换硬件槽位、硬件替换排除硬件故障。步骤 3拨打 400,寻求故障解决帮助。4.3.1 故障现象服务器处理器 CPU 出现故障时,通常表现为服务器无法启动(一般会有现象。声)、服务器莫名死机等4.3.2 故障处理流程CP
14、U 类故障通常是由于 CPU 安装故障处理流程如下:或接口松动、CPU 自身质量问题、CPU 槽位硬件故障引起的。确定硬件是否插紧,检查接插件是否有损坏确定基本连接正常尝试更换硬件槽位、硬件替换排除硬件故障排除硬件故障拨打支持并传回收集信息寻求故障解决帮助4.3.3 故障处理步骤步骤 1检查并确定硬件是否插紧,检查接插件是否有损坏,可尝试重新插拔硬件,以便确定硬件是否连接正常。对于插拔时,受到阻力或感觉不顺畅的时候,请不要强行大力或拨出,需要立即停止操作。并缓慢移出硬件,确认硬件和背板相连的接插件是否松动或明显变形现象,确认硬件4.3 CPU 类故障处理是否存在明显变形的情况,确认背板槽上的接
15、插件是否被折弯或明显变型现象。如条件具备,强烈建议对接插件进行详细拍照并。步骤 2尝试更换硬件槽位、硬件替换排除硬件故障。步骤 3拨打 400,寻求故障解决帮助。4.4.1 故障现象内存和 CPU 一样是服务器成员,内存可能因自身承载的服务过多,而导致服务器处理数据时速度越来越慢,甚至出现内存系统频繁重启(可从 BIOS 错误等现象。中查出)、服务器无法启动(一般伴有声)4.4.2 故障处理流程内存类故障通常是由于内存安装故障处理流程如下:或接口松动、内存自身质量问题、内存槽位硬件故障引起的。确定硬件是否插紧,检查接插件是否有损坏确定基本连接正常尝试更换硬件槽位、硬件替换排除硬件故障排除硬件故
16、障拨打支持并传回收集信息寻求故障解决帮助4.4 内存类故障处理4.4.3 故障处理步骤步骤 1检查并确定硬件是否插紧,检查接插件是否有损坏,可尝试重新插拔硬件,以便确定硬件是否连接正常。对于插拔时,受到阻力或感觉不顺畅的时候,请不要强行大力或拨出,需要立即停止操作。并缓慢移出硬件,确认硬件和背板相连的接插件是否松动或明显变形现象,确认硬件是否存在明显变形的情况,确认背板槽上的接插件是否被折弯或明显变型现象。如条件具备,强烈建议对接插件进行详细拍照并。步骤 2尝试更换硬件槽位、硬件替换排除硬件故障。步骤 3拨打 400,寻求故障解决帮助。5系统类故障关于本章章节内容介绍5.1 web界面无法打开
17、故障处理介绍了web界面无法打开故障处理思路。5.2 更改控制台端口后,重新初始化 web界面443端口不能连接故障处理介绍更改控制台端口后,重新初始化web界面443端口不能连接故障处理思路。5.3 忘记信任IP故障处理介绍忘记系统信任IP故障处理思路。5.4 忘记web页面administrator密码故障处理介绍忘记web页面administrator故障处理思路。5.5 忘记roo故障处理介绍忘记roo故障处理思路5.6主机不能登录故障处理介绍主机不能登录故障处理思路5.7搜狗浏览器不能正常重定向缓存文件故障处理介绍搜狗浏览器不能正常重定向缓存文件故障处理思路5.8增加网卡配置故障处理
18、介绍增加网卡配置故障处理思路5.9服务器异常死机故障处理介绍服务器异常死机故障处理思路5.10清除和替换cache故障硬盘故障处理介绍清除和替换 cache 故障硬盘故障处理思路5.11 修改cache ip地址故障处理介绍修改 cache ip 地址故障处理思路5.12清除cache缓存文件故障处理介绍清除 cache 缓存文件故障处理思路5.13 更改BT硬盘为HTTP硬盘故障处理介绍更改 BT 硬盘为HTTP 硬盘故障处理思路5.14 系统根目录使用100%故障处理介绍系统根目录使用 100%故障处理思路5.15 opt目录使用率100%故障处理介绍 opt 目录使用率 100%故障处理
19、思路5.16 从服务器加入主服务器集群,不能查看从服务器统计报表故障处理介绍从服务器加入主服务器集群,不能查看从服务器统计报表故障处理思路5.17 删除集群中从服务器故障处理介绍删除集群中从服务器故障处理思路5.1.1 故障现象能正常登录系统初始化 web 界面,但初始化后只能够 SSH 登录系统,不能通过 web 界面登录系统5.1.2 故障处理流程此故障是由于工误操作导致系统初始化没有正常完成(初始化时er Cache 意外掉电关机)导致的。故障处理流程如下:443 端检查系统口是否开放重新初始化缓存系统拨打支持并传回收集信息5.1.3 故障处理步骤步骤1ssh 登陆er Cache步骤2
20、rootRG-erCache xcache#iptables-save 通过此命令查看是否开启 443 端口请检查列表中是否有-A RH-Firewall-1-INPUT -p tcp -m se -se NEW -m tcp -dport 443-j ACCEPT 条目,如没有此条,需要将其加入/etc/sysconfig/iptables 文件中,然后通过/etc/init.d/iptables restart 命令重启服务。在测试是否能正常登陆系统web 界面。如5.1 Web 界面无法打开故障处理果不能请继续下一步步骤3rootRG-erCache xcache# cd /opt/xc
21、ache/步骤4rootRG-erCache xcache# /etc/init.d/xcached re步骤5拨打 400,寻求故障解决帮助。5.2.1 故障现象在 web 界面恢复出厂设置,重新初始化后,web 界面不能连接5.2.2 故障处理流程此故障一般是由于更改控制台端口后,也同步更改了端,重新初始化,系统不会将防火端口修改为默认 443 端。导致 web 界面不能登陆。故障处理流程如下:检查系统口是否开放443 端拨打支持并传回收集信息5.2.3 故障处理步骤步骤1ssh 登陆er Cache步骤2rootRG-erCache xcache# iptables-save 通过此命令
22、查看是否开启 443 端口5.2 更改控制台端口后,重新初始化 web 界面 443 端口不能连接故障处理请检查列表中是否有-A RH-Firewall-1-INPUT -p tcp -m se -se NEW -m tcp -dport 443-j ACCEPT 条目,如没有此条,需要将其加入/etc/sysconfig/iptables 文件中,然后通过/etc/init.d/iptables restart 命令重启服务。在测试是否能正常登陆系统 web 界面。步骤3拨打 400,寻求故障解决帮助。5.3.1 故障现象用户正确输入用户名后,系统提示为“非信任 IP”错误5.3.2 故障处
23、理流程故障处理流程如下:检查/opt/xcache/conf/user.conf 文件trustedip 选项设置拨打支持并传回收集信息5.3.3 故障处理步骤步骤 1步骤 2ssh 登陆er CacherootRG-erCache # vi /opt/xcache/conf/user.conf请检查列表中trustedIp 选项配置,此选项配置了信任 IP,可查看系统信任 IP 或修改系统信任 IP null 代表信任所有 IP 修改完后,通过/etc/init.d/xcached restart 命令重启缓存服务生效。5.3 忘记信任 IP 地址故障处理步骤 3拨打 400,寻求故障解决帮
24、助。5.4.1 故障现象忘记系统 web 界面,导致不能正常登陆系统5.4.2 故障处理流程故障处理流程如下:检查/opt/xcache/conf/user.conf 文件password 选项设置拨打支持并传回收集信息5.4.3 故障处理步骤步骤 1步骤 2ssh 登陆er CacherootRG-erCache # vi /opt/xcache/conf/user.conf请检查列表中password 选项配置,将此选项值修改为 0DPiKuNIrrVmD8IUCuw1hQxNqZc=改为 admin 修改完后,通过/etc/init.d/xcached restart 命令重启缓存服务生
25、效。步骤 3拨打 400,寻求故障解决帮助。5.4 忘记web 界面 administrator故障处理5.5.1 故障现象由于 root 用户忘记 导致不能正常登陆系统5.5.2 故障处理流程故障处理流程如下开机修改 root拨打支持并传回收集信息5.5.3 故障处理步骤步骤 1开机启动的时候按下e键.出现菜单RuiJie,再按e键进入二级菜单,出现 3 个选项:root (hd0,0)RuiJieOS (2.6.18-128.el5PAE)kernel /vmlinuz-2.6.18-128.el5PAE ro root=LABEL=/ rhgb quietinitrd /initrd-2
26、.6.18-128.el5PAE.img步骤 2用光标键选中第二行,再按e键,在 rhgb 后面增加 single(注意 rhgb 后面有一空格),然后回车,再按b,即可启动到单用户模式,出现 rootmaster log# 提示符. rootmasterlog# .5.5 忘记root步骤 3修改.在提示符后面输入: passwd root回车,提示输入新登陆了。,输入 2 次,系统确认。然后再输入 reboot, 重新启动系统即可用新步骤 4拨打 400,寻求故障解决帮助。5.6.1 故障现象通过 SSH 方式无法连接系统5.6.2 故障处理流程故障处理流程如下测试网络的连通性检查22 端
27、口是否开启重启 ssh 服务拨打支持并传回收集信息5.6.3 故障处理步骤步骤 1通过命令检查系统的连通性5.6 主机不能登陆步骤 2检查22 端口是否开启步骤 3通过/etc/init.d/sshd restart 命令重启 ssh 服务步骤 4拨打 400,寻求故障解决帮助。5.7.1 故障现象IE 浏览器能够正常重定向缓存文件,搜狗浏览器不能正常重定向缓存文件5.7.2 故障处理流程此 故 障 是 由 于 由 于 系 统 配 置 误 操 作 , 导 致 /opt/xcache/conf/perties“application.host= ”选项 IP 地址部分多了一个空格。导致数据库 U
28、RL IP 地址部分多了一个空格标识(%20),IE 浏览器能自动清除空格标识,搜狗浏览器不能自动清除空格标识。 故障处理流程如下验证 IE 浏览器是否能正常重定向缓存文件验证搜狗浏览器是否能够正常重定向件缓存文拨打支持并传回收集信息5.7 搜狗浏览器不能正常重定向缓存文件故障处理5.7.3 故障处理步骤步骤 1通过 IE 浏览器测试是否能正常重定向缓存文件,如果能,请进行下一步排查,如果不能请检查网络问题。步骤 2测试搜狗浏览器是否能正常重定向缓存文件,若不能请执行如下操作步骤重新更新数据库 host 字段可以解决此问题。ssh 登陆er Cacheapplication -e update
29、 http_filessethost=;/etc/init.d/xcached restart步骤 3拨打 400,寻求故障解决帮助。5.8.1 故障现象新增网卡后,cache 无法新增网卡数据5.8.2 故障处理流程故障处理流程如下:检查/opt/xcache/conf/perties文件是否配置新增网卡拨打支持并传回收集信息5.8 增加网卡配置需求5.8.3 故障处理步骤步骤1检查/opt/xcache/conf/perties 文件sniffer.device=选项是否配置了新增监听网卡,如果没有配置,请执行如下操作ssh 18 登陆er Cachevi /opt/xcache/conf
30、/perties听网卡选项,不同网卡见用“;”号隔开/etc/init.d/xcached restart“sniffer.device=eth2;eth3”选项为监步骤 2拨打 400,寻求故障解决帮助。5.9.1 故障现象不能通连接主机,显示器无输出信息,键盘不能操作5.9.2 故障处理流程故障处理流程如下:检查 message 日志是否异常拨打支持并传回收集信息5.9.3 故障处理步骤步骤 1检查 message 日志是否有异常错误,如硬盘错误、CPU 错误、内存错误等步骤 2拨打 400,寻求故障解决帮助。5.9 服务器异常死机故障处理5.10.1 故障现象系统无法识别硬盘、硬盘无法读
31、写,重启故障依然存在。此故障会导致用户文件,因此,当硬盘出现故障时,请及时清除。故障硬盘文件时无法5.10.2 故障处理流程故障处理流程如下:系统是否能正别故障硬盘清除故障硬盘替换故障硬盘5.10.3 故障处理步骤步骤 1检查系统是否能正别故障硬盘,可通过 fdisk l 命令查看。可通过拔插硬盘、更换槽位来测试硬盘是否正常,如系统不能识别硬盘,请执行步骤 3 操作。如系统能识别硬盘,请执行步骤 2 操作。步骤 2硬盘是否能够正常进行读写操作。可通过如下命令进试进入硬盘所在的分区,通过 ls touch 命令测试硬盘是否可读写。如系统不能正常读写,请执拨打支持并传回收集信息硬盘读写是否正常5.
32、10 清除和替换 Cache 故障硬盘故障处理下一步操作。步骤 3清除故障硬盘,具体操作步骤如下以缓存服务器 IP 地址:18 硬盘目录:/data1 为例一、停止缓存服务:cd /opt/xcache/etc/init.d/xcached stop/etc/init.d/nginx stop二、缓存文件数据库:./bin/config.sh cache cleanfiles 18 /data1./bin/config.sh cache cleanfiles host disk注解:(删除硬盘数据库参数说明)三、删除缓存文件:cd /rm -rf /data1/*四、取消分区挂载umount
33、/data1五、删除分区目录rm -rf /data1六、修改配置文件/etc/fstab 文件vi /etc/fstab删除一行配置文本:LABEL=/data1/data1ext3defaults 0 0缓存服务配置文件:vi /opt/xcache/conf/perties删除/data1 缓存目录七、重启缓存服务/etc/init.d/xcache restart步骤 4替换 cache 故障硬盘,具体操作步骤如下一、首先使用命令查看硬盘设备列表:fdisk -l二、给其中一块硬盘创建分区:fdisk /dev/sdb根据情况,输入n(回车)p(回车)1(回车)(回车)(回车)w(回车
34、)注释:硬盘与分区对应关系(sdb 对应/data1、sdc 对应/data2、sdd 对应/data3、sde 对应/data4、sdf 对应/data5、sdg 对应/data7、sdh 对应/data8、sdi 对应/data9、sdj 对应/dataA、sdk对应/dataB、sdl 对应/d)三、格式化分区:mkfs.ext3 -L /data1 /dev/sdb1四、挂载分区:mkdir -p /data1echo LABEL=/data1/data1ext3defaults 0 0 /etc/fstabmount -a五、缓存服务配置文件:vi /opt/xcache/conf/
35、perties增加/data1 缓存目录六、重启缓存服务/etc/init.d/xcache restart5.11.1 故障现象修改 cache 网卡 IP 地址后,所有 cache 已缓存的资源都不可用5.11.2 故障处理流程故障处理流程如下:更新 cache 软件配置及数据库拨打支持并传回收集信息5.11.3 故障处理步骤步骤 1更新 cache 软件配置及数据库,具体操作步骤如下:请首先将服务器的 IP 地址网络设置修改启用新的 IP 地址。下面的例子将修改址从 2 到 2IP 服务器地一、更新 cache 配置 IP:cd /opt/xcache./bin/config.sh cl
36、uster changehost 2 2二、更新 cache iptables(此操作会设置的内部网段):./bin/config.sh cache iptables5.11 修改 Cache IP 地址故障处理三、更新 cache 文件数据库:./bin/config.sh cache movefiles 22四、重启集群服务./bin/cluster.sh restart步骤 2拨打 400,寻求故障解决帮助。5.12.1 故障现象Cache 更换测试用户,需要把原来用户处缓存的数据清空5.12.2 故障处理流程故障处理流程如下:清除 cache 缓存文件拨打支持并传回收集信息5.12.3
37、 故障处理步骤步骤 1清除 cache 缓存文件方法如下:X5 清除缓存文件处理方法/etc/init.d/xcached stopwget/updates/xcache/ruijie-xcache/delete-disk-x5.sh5.12 清除 cache 缓存文件故障处理od a+x delete-disk-x5.sh(给赋予可执行权限)./delete-disk-x5.sh(清除 cache 中的缓存文件)/etc/init.d/xcached restart登录 web 界面重新初始化X10 清除缓存文件处理方法/etc/init.d/xcached stopwget/updates
38、/xcache/ruijie-xcache/delete-disk-x10.shod a+x delete-disk-x10.sh(给赋予可执行权限)./delete-disk-x10.sh(清除 cache 中的缓存文件)/etc/init.d/xcached restart登录 web 界面重新初始化W5 清除缓存文件处理方法/etc/init.d/wcached stopwget/updates/xcache/ruijie-xcache/delete-disk-w5.shod a+x delete-disk-w5.sh(给赋予可执行权限)./delete-disk-w5.sh(清除 ca
39、che 中的缓存文件)/etc/init.d/wcached restart登录 web 界面重新初始化步骤 2拨打 400,寻求故障解决帮助。5.13.1 故障现象一般是由于学校封了 BT,导致没有 BT 流量,需要将 BT 硬盘更改为 HTTP 硬盘5.13.2 故障处理流程故障处理流程如下:将 BT 硬盘更改为 HTTP 硬盘拨打支持并传回收集信息5.13.3 故障处理步骤步骤 1将BT 硬盘更改为 HTTP 硬盘,具体操作步骤如下:以将/data6 /data7 /data8 BT 硬盘更改为 HTTP 硬盘为例1.停止缓存服务rootRG-erCache xcache# /etc/i
40、nit.d/xcached stop2.删除 BT 分区的所有文件rootRG- rootRG-rootRG-erCache erCacheerCachedata6# data7#data8#rm rmrm-rf-rf-rf/data6/*&/data7/*&/data8/*&3.清除 BT 硬盘的数据库rootRG- rootRG-rootRG-erCache erCacheerCachexcache# xcache#xcache#./bin/config.sh./bin/config.sh./bin/config.shcache cachecachecleanfiles cleanfile
41、scleanfiles717171/data6/data7/data84.更改 BT 分区为 HTTP/流分区rootRG-erCache xcache# vi /opt/xcache/conf/perties# downloader settingdownloader.http.enabled=true5.13 更改 BT 硬盘为 HTTP 硬盘故障处理downloader.http.path=/data1;/data2;/data3;/data4;/data5;/data6;/data7;/data8 downloader.bt.enabled=truedownloader.bt.down
42、load=false #downloader.bt.path=/data6;/data7;/data85.重启缓存服务rootRG-erCache conf# /etc/init.d/xcachedrestart步骤 2拨打 400,寻求故障解决帮助。5.14.1 故障现象web 查看统计报表出错,root 用户写入错误5.14.2 故障处理流程故障处理流程如下检查根分区使用情况检查硬盘挂载情况及处理检查 message 日志大小及处理拨打支持并传回收集信息5.14 系统根目录使用率 100%故障处理密级:故障处理业务技术规范5.14.3 故障处理步骤步骤 1通过df h命令 检查根分区使用率
43、是否为 100%步骤 2通过df h命令查看各缓存硬盘挂载是否正常,如缓存硬盘工作正常,请继续步骤 3 操作。主要检查硬盘大小是否与挂载目录大小一致,如果不一致,需要将其从 cache 配置文件中删除,并删除对应缓存目录下的所有缓存文件。(注:如出现硬盘故障,导致系统无法识别,系统默认会将缓存文件到对应该硬盘的根目录文件夹中,会导致根分区使用率 100%),具体操作步骤如下:以缓存服务器 IP 地址:18 硬盘目录:/data1 为例一、停止缓存服务:cd /opt/xcache/etc/init.d/xcached stop/etc/init.d/nginx stop二、缓存文件数据库:./
44、bin/config.sh cache cleanfiles 18 /data1./bin/config.sh cache cleanfiles host disk 注解:(删除硬盘数据库参数说明)三、删除缓存文件:cd /rm -rf /data1/*四、取消分区挂载umount /data1五、删除分区目录rm -rf /data1六、修改配置文件保存期限:2 年锐捷网络,不得扩散第 34 页, 共 47 页密级:故障处理业务技术规范/etc/fstab 文件vi /etc/fstab删除一行配置文本:LABEL=/data1/data1ext3defaults0 0缓存服务配置文件:vi
45、 /opt/xcache/conf/perties删除/data1 缓存目录七、重启缓存服务/etc/init.d/xcache restart步骤 3检查 message 日志大小及内容是否正常。具体操作步骤如下:通过 ls -la /var/log/messages 命令查看 message 日志是否过大,当message 日志大小超过2G 后,会导致系统根分区使用率 100%。通过 cat /var/log/message 查看 message 日志内容,并将错误日志,以供研发工排查错误。如 message 日志过大,请执行如下操作:rm -rf /var/log/messages*/e
46、tc/init.d/rsyslog restart软件后续改善:1.扩大根分区容量,避免系统日志过大导致根分区满的问题出现步骤 4拨打 400,寻求故障解决帮助。5.15.1 故障现象web 查看统计报表出错保存期限:2 年锐捷网络,不得扩散第 35 页, 共 47 页5.15 opt 目录使用率 100%故障处理密级:故障处理业务技术规范5.15.2 故障处理流程检查/opt/xcache/logs 目录日志大小是否正常及处理检查/opt/xcache/nginx/logs/目录日志大小是否正常及处理检查/opt/xcache/data/logs/目录日志大小是否正常及处理拨打支持并传回收集
47、信息5.15.3 故障处理步骤步骤 1检查/opt/xcache/logs 目录日志大小是否正常及处理可通过 ls la /opt/xcache/logs 目录日志大小,当日志过大,需要手动将其删除,具体操作步骤如下:/etc/init.d/xcached stop/etc/init.d/nginx stop rm -rf /opt/xcache/logs/*/etc/init.d/xcached restart步骤 2检查/opt/xcache/nginx/logs 目录日志大小是否正常及处理可通过 ls la /opt/xcache/nginx/logs 目录日志大小,当日志过大,需要手动
48、将其删除,具体操作步骤如下:/etc/init.d/xcached stop/etc/init.d/nginx stop保存期限:2 年锐捷网络,不得扩散第 36 页, 共 47 页密级:故障处理业务技术规范rm -rf /opt/xcache/nginx/logs/*/etc/init.d/xcached restart检查/opt/xcache/data/logs 目录日志大小是否正常及处理步骤 3可通过 ls la /opt/xcache/data/logs 目录日志大小,当日志过大,需要手动将其删除,具体操作步骤如下:/etc/init.d/xcached stop/etc/init.
49、d/nginx stoprm -rf /opt/xcache/data/logs/*/etc/init.d/xcached restart步骤 4拨打 400,寻求故障解决帮助。5.16.1 故障现象在集群主服务器web 统计报表中,无法单独选择从服务器查看统计报表信息5.16.2 故障处理流程故障处理流程如下:修改集群设置拨打支持并传回收集信息保存期限:2 年锐捷网络,不得扩散第 37 页, 共 47 页5.16 从服务器加入主服务器集群中,无法选择从服务器查看统计报表信息故障处理密级:故障处理业务技术规范5.16.3 故障处理步骤步骤 1修改集群设置,具体操作步骤如下:以主服务器 IP:4
50、 从服务器 IP:6 为例 1.登录从服务器做如下操作vi /opt/xcache/conf/perties将# application setting 选项修改为 application.type=downloaderapplication.host=6vi /opt/xcache/conf/clustroperties 将内容修改为application.admin.host=4 application.downloader.hosts=4;6 application.sniffer.hosts=42.登录主服务器做如下操作vi /opt/xcache/conf/clustropertie
51、s 将内容修改为application.admin.host=4 application.downloader.hosts=4;6 application.sniffer.hosts=43.在主服务器上重启集群服务生效 cd /opt/xcache/./bin/cluster.sh restart步骤 2拨打 400,寻求故障解决帮助。5.17.1 故障现象文件名相同,URL 不同时,有可能出现极少数的文件误缓存问题,即用户从缓存系统里到的文件与用户实际请求的原始文件不一致。具体原因详见RG-erCache X 系列 4.0 版本 FAQ2.7.1 章节5.17.2 故障处理流程故障处理流程如
52、下:保存期限:2 年锐捷网络,不得扩散第 38 页, 共 47 页5.17 Cache 提供了错误的缓存文件故障处理密级:故障处理业务技术规范将重定向错误加入,不对其做缓存拨打支持并传回收集信息5.17.3 故障处理步骤步骤 1对重定向错误加入,不对其做缓存。具体操作步骤如下:将该IP 地址加入缓存删除缓存系统中该的缓存内容步骤 2拨打 400,寻求故障解决帮助。5.18.1 故障现象从服务器下线时,需要将其从服务器集群中删除。否则会导致集群主服务器还会发送从服务器的内容重定向给客户,导致客户不能正常资源。5.18.2 故障处理流程故障处理流程如下:保存期限:2 年锐捷网络,不得扩散第 39
53、页, 共 47 页5.18 删除集群中的从服务器故障处理密级:故障处理业务技术规范删除集群中的从服务器拨打支持并传回收集信息5.18.3 故障处理步骤步骤 1删除集群中的从服务器,具体操作步骤如下:以从服务器 IP 地址为 2 为例登录主服务器执行以下操作一、集群配置删除服务器: cd /opt/xcache./bin/config.sh cluster removehost 2二、更新所有集群服务器 iptables(此操作会./bin/config.sh cache iptables缓存设置的缓存网段):三、删除服务器缓存文件数据库./bin/config.sh cache cleanfi
54、les四、重启集群服务./bin/cluster.sh restart:2步骤 2拨打 400,寻求故障解决帮助。保存期限:2 年锐捷网络,不得扩散第 40 页, 共 47 页密级:故障处理业务技术规范6网络类故障关于本章6.1.1 故障现象正确部署缓存后,无HTTP 和流服务流量保存期限:2 年锐捷网络,不得扩散第 41 页, 共 47 页6.1 正确部署缓存后,无 HTTP 和流服务流量章节内容介绍6.1 正确部署缓存系统后,无HTTP和流服务流量故障处理介绍正确部署缓存系统后,无 HTTP 和流服务流量故障处理思路6.2 缓存系统不能用户请求故障处理介绍缓存系统不能用户请求故障处理思路6
55、.3 开启缓存系统后,系统不能故障处理介绍开启缓存系统后,系统不能故障处理思路6.4 无法通过SNMP协议 erCache系统故障处理介绍无法通过SNMP 协议erCache 系统故障处理思路6.5erCache通信网卡丢包故障处理介绍erCache 通信网卡丢包故障处理思路密级:故障处理业务技术规范6.1.2 故障处理流程此故障一般是因为客户端不能正常接收 Cache 发出的重定向数据包,导致客户端无法从 Cache 上文件。此原因一般是由于 Cache 和客户端间通信存在故障处理流程如下:或安全策略,将 Cache 发出的重定向。缓存系统是否能正常扑捉镜像数据包缓存系统通信网卡是否有重定向
56、数据包发出用户端是否能正常收到缓存系统重定向数据包用户和缓存系统间是否存在进行6.1.3 故障处理步骤步骤 1检查缓存系统是否能正常从资源,可通过 wget 命令测试资源,如不能请检查网络信息,如能,请继续步骤 2 操作。步骤 2检查缓存系统是否能正常扑捉镜像数据包,可通过 tcpdump -n -i ethx命令查看镜像数据包是否正常。ethx 为镜像网卡,如没有镜像数据,请检查端口镜像配置是否正常,续步骤 3 操作。检查缓存系统通信网卡是否有重定向数据包发出,可通过 tcpdump 命令抓取数据包,然后通过镜像数据,请继步骤 3Wireshark 工具进行分析,如果没有重定向数据包发出,请联系研发工包发出,请继续步骤 4 操作。如果有重定向数据检查用户端是否能正常收到缓存系统发出的重定向数据包。可通过 Wireshark 工具抓取数据包进步骤 4保存期限:2 年锐捷网络,不得扩散第 42 页, 共 47 页缓存系统是否能正常从资源密级:故障处理业务技术规范行分析。如果客户端能收到缓存系统发出的重定向数据包,但不能从缓存系统文件,请确认端口镜像是否为 cisco或板卡镜像,处理方法详见er
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《棉及化纤纯纺、混纺纱线退浆试验方法》
- 05 C反冲现象 火箭 提升版2025新课改-高中物理-选修第1册(21讲)
- 桥接车辆相关项目投资计划书
- 银行业务宣讲培训
- 护理管理学健康教育
- 我国环保法庭诉讼规则研究毕业论文
- 第六章 电子商务基础技术4、5课件
- 智慧医院综合管理解决方案(医院报警管理)
- 流行病学因果联系
- 2024年大班毕业家长的发言稿例文(2篇)
- 《装备质量问题归零实施指南》
- 混凝土组织供应运输售后服务方案
- 四级营养师模拟及答案
- 第13课《不求甚解》 统编版语文九年级下册
- 水电改造工程投标方案(技术标)
- 光电信息科学与工程专业大学生职业生涯规划书
- 2023-2024学年广东省深圳市48校联考九年级(上)期中语文试卷
- 华为经营管理-华为市场营销体系(6版)
- 卫浴营销方案
- 联想医疗桌面云平台解决方案@20180727
- 林业遥感技术及典型应用
评论
0/150
提交评论