TSM日常维护手册范本_第1页
TSM日常维护手册范本_第2页
TSM日常维护手册范本_第3页
TSM日常维护手册范本_第4页
TSM日常维护手册范本_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

...wd......wd......wd...xxTSM数据备份工程日常维护手册xxxxxx科技目录TOC\o"1-3"\h\z1前言32TSM巡检操作手册42.1查看TSM服务器42.2查看TSMmanageconsole42.3在TSM服务器上登录到管理界面52.4在TSMclient端检查63TSM常见问题的处理63.1TSMServer的故障处理63.1.1所有的备份和恢复操作都无法进展63.1.2如何获得TSM错误描述73.1.3系统出现无法读写磁带或磁盘的故障73.1.4处理带库故障后TSM工作不正常。83.1.5atapeinlibrarydoesnotdisplayinqlibv83.1.6reclaimprocessnotrun83.1.7howtodeletearchivelogfilesafterbackup83.1.8windowsdevicemanager,foundadrivemarkasyellow93.2TSMClient的故障处理93.2.1TSMClient无法连接TSMServer93.2.2TSMClient备份大文件时经常不成功93.2.3ANS1312Eerrorindsmerror.log103.2.4whenbackupdata,error:mediacannotmount103.2.5ANR8779EUnabletoopendrivemt0.3.0.3,errornumber=170104日常维护104.1启动和停顿TSM服务器104.2进入管理员界面114.3进入TSMclient文件备份/恢复界面114.4管理数据库和日志114.5管理磁带库124.5.1查看带库中磁带驱动器状态:124.5.2磁带的分配:124.5.3检查活动日志,有可能要求作出回应,124.5.4查看磁带上的备份内容:134.5.5从磁带库中取出已使用的磁带放到异地保存:134.5.6将取出的磁带重新放入磁带库中:134.5.7向磁带库中增加新的供TSM使用的磁带:134.5.8将新磁带添加到storagepool中〔可选〕134.5.9重复利用磁带库中的磁带134.6管理磁带库存储池144.7管理客户端节点144.7.1删除一个客户端节点144.7.2修改节点密码144.8定时备份维护144.8.1TSMClien/TDP节点定时备份守候进程144.8.2客户端停顿定时备份144.8.3查看定时备份日志154.9建设策略域(PolicyDomain)154.10监控TSMServer运行情况155IBM客户支持服务流程16前言本文档是TSM巡检操作手册,常见问题的处理和日常维护。TSM巡检操作手册查看TSM服务器查看TSM服务器和ADIC带库的连接状态,如以下列图为正常:主要为其它设备可以看到ADIC的SNC,介质变换器,磁带驱动器都有设备显示。查看TSMmanageconsole在"开场"菜单--〉"程序"--〉"TivoliStorageManager"中选择运行"ManagementConsole":可以看到带库和驱动器的信息。在TSM服务器上登录到管理界面在cmd的窗口里进入到TSM的安装目录baclient下运行dsmadmc,输入口令/密码admin/admin进入管理员界面在TSMclient端检查检查lanfree的进程,使用命令:#ps–ef|grepdsmsta如果进程没有启动,需要启动这个进程,方法:IBM服务器的路径/usr/tivoli/tsm/StorageAgent/bin#nohup./dsmsta&HP服务器的路径/opt/tivoli/tsm/StorageAgent/bin#nohup./dsmsta&TSM常见问题的处理在解决问题的过程中,需要具体问题具体分析,首先需要检查各种错误日志,定位问题,然后参考以下解决问题的方法,同时也可直接联系800技术支持热线,寻求专业的技术支持。TSMServer的故障处理所有的备份和恢复操作都无法进展问题描述TSMServer启动正常,但所有的备份和恢复操作都无法进展。 问题处理建议检查TSM本身的数据库是否已满>querydatabase如何获得TSM错误描述问题描述在TSM的日志中发现有类似ANR7800I的错误信息,如何得到该错误号的详细描述。问题处理建议使用TSM的文档查找错误描述,或直接使用命令查找:>help7800系统出现无法读写磁带或磁盘的故障问题描述在日常备份过程中或TSM日志中出现无法读写磁带或磁盘的故障。 问题处理建议检查磁带库是否正常TSM>qlibrary;查看是否Online状态;检查驱动器是否正常TSM>qdrive;查看是否Online状态; 检查磁带是否正常TSM>qlibvolume;查看磁带状态;看是否是读写状态。TSM>qvolf=d;查看磁带状态;看是否是读写状态。检查Path是否正常TSM>qpath;看online是否为yes?检查详细的TSM活动日志TSM>QUERYACTLOGBEGINTIME=NOW-30ENDTIME=NOW检查操作系统下关于设备的日志。在操作系统下检查设备状态;AIX:lsdev–Cctape处理带库故障后TSM工作不正常。问题描述当带库出现故障后,如更换driver后,TSM工作不正常。问题处理建议按照配置步骤重新检查path,drive的定义、状态检查磁带机的s/n号。atapeinlibrarydoesnotdisplayinqlibv问题描述atapeinlibrarydoesnotdisplayinqlibv。问题处理建议checkinlibvlibnamesearch=yescheckl=bstatus=scrreclaimprocessnotrun问题描述reclaimprocessnotrun,checkstgpoolreclaimthreashold,thevaluewas100问题处理建议modifythreasholdlessthan100howtodeletearchivelogfilesafterbackup问题描述howtodeletearchivelogfilesafterbackup问题处理建议usingrmandeleteinputalloptionwindowsdevicemanager,foundadrivemarkasyellow问题描述 Inwindowsdevicemanager,foundadrivemarkasyellow,somanyoperationsisnotsuccessful.问题处理建议重起TSM服务器重新安装librarydriver?重起TapeLibraryTSMClient的故障处理TSMClient无法连接TSMServer问题描述TSMClient无法连接TSMServer。 问题处理建议检查服务器配置文件,并检查服务器是否绑定配置文件中规定的端口查看服务器的状态〔QueryStatus〕确保设置好了"Availability:Enabled";检查客户端配置文件中端口号和IP地址是否与服务器端一致;检查节点是否被服务器端锁定〔LOCK〕;系统管理员检查网络状况和服务器的内存利用状况,如果内存不够用了,则新的连接肯定无法建设。TSMClient备份大文件时经常不成功问题描述TSMClient在备份大文件时经常报如下错误,但备份小文件没有问题:2006-03-1311:50:37ANS1005E在套接字=636处TCP/IP读取错误,错误号=10035,原因:无法立即完成一个非阻挡性套接字操作。

2006-03-1311:50:37ANS1809W会话丧失;正在初始化会话的再翻开过程。

2006-03-1311:50:53ANS1811STSM会话无法重建。问题处理建议检查服务器端dsmserv.opt中有一项IDLETimeout、Commtimeout设置,调大后进展测试。(注:要求TSMServer和storageagent端设置一致)。ANS1312Eerrorindsmerror.log问题描述ANS1312Eerrorindsmerror.log问题处理建议deleteoldpathre-definewhenbackupdata,error:mediacannotmount问题描述whenbackupdata,error:mediacannotmount问题处理建议re-definedrivepath,auditlibraryANR8779EUnabletoopendrivemt0.3.0.3,errornumber=170问题描述OnWindows,actlog,ANR8779EUnabletoopendrivemt0.3.0.3,errornumber=170.问题处理建议检查library状态。检查path,发现pathoffline,无法online。在操作系统下删除设备,重新识别重新定义path。日常维护启动和停顿TSM服务器启动TSM服务器系统中,TSMServer作为一项系统服务已设置为在系统启动时自动启动。停顿TSM服务器停顿TSM服务器操作步骤为:1. 运行dsmadmc,输入口令/密码admin/admin进入管理员界面2. 制止服务器接收新的客户端访问TSM>disablesessions3. 查看当前客户端与服务器的连接TSM>querysession4. 等待客户端完毕备份或直接中断连接TSM>cancelsessionXX(all)5. 查看服务器进程TSM>queryprocess6. 等待服务器进程完毕或直接中断进程TSM>cancelprocessqmount检查是否有磁带被使用。qrequest检查是否有需要人工干预的操作。7. 停顿服务器TSM>halt进入管理员界面字符界面访问在TSM服务器上运行dsmadmc,输入管理员ID,密码。进入TSMclient文件备份/恢复界面字符界面访问在TSM客户端运行dsmc输入密码。GUI界面访问在TSM客户端运行dsmj,点击backup/restore按钮既可。要求有图形支持。管理数据库和日志查看tsm数据库和日志使用率查看数据库使用率,使用命令为TSM>querydb,查看PctUtil项是否接近100。查看日志使用率,使用命令为TSM>querylog,查看PclUtil项是否接近100。扩大数据库和日志容量如PctUtil接近100,则必须扩大容量,扩数据库为:TSM>definedbvolumedsmdb02.dsmformatsize=XXwait=yesTSM>extenddbXX 扩日志容量为:TSM>definelogvolumelog03formatsize=XXwait=yesTSM>extendlogXX(XX为大小,例如200代表200MB.)扩大之后,用querydb和qlog查看扩大后PctUtil的值。管理磁带库由于TSM对磁带库以独占方式访问,所以,在TSMServer运行的时候,不要用任何其他命令或方式对磁带库进展操作,以免冲突。查看带库中磁带驱动器状态:在磁带驱动器状态正常情况下,TSM才能正常的备份数据。TSM>querydrive查看磁带驱动器状态,其中OnLine列应皆为Yes,说明磁带驱动器可以使用。假设TSM启动后观察到OnLine项不为Yes,检查磁带库是否已上电,或者请求IBM支持。磁带的分配:磁带的分配是自动的,系统中有2个存储池,某个池需要磁带时,系统就会从当前的空闲磁带目录中分配磁带给它。1盘供TSM备份自身数据库。由于已在设定存储池〔stgpool〕时指定MaxScratch,所以其余带子可以需要时自动参加。向磁带库中增加新的供TSM使用的磁带1. 在磁带库I/O槽中放入新磁带。2. labellibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)A000XXX(这里是使用qlibvol查看到的磁带的名称)overwrite=yescheckin=scratch参考labellibvolume3584libsearch=yeslabelsource=barcheckin=scratchoverwrite=yes3. tsm:TSM>qactlog4. tsm:TSM>TSM>reply25. 将磁带从带库中取出TSM>checkoutlibvlibnamea00047检查活动日志,有可能要求作出回应,TSM>qrequestTSM>reply1label=a00047查看磁带上的备份内容:在TSM字符管理界面下运行:TSM>qcontentTAPE_LABEL其中TAPE_LABEL为备份使用的磁带标签,可用qvol或qlibvolume看到。所看到的文件名格式为<SID>___XXmmddhhmm_x,其中中间一串时间对应上述<TIMESTAMP>。所以也可以通过这里知道要恢复的备份的时间戳。从磁带库中取出已使用的磁带放到异地保存:TSM>checkoutlibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)TAPE_LABELremove=yes然后从磁带库前面的I/O窗口中取出退出的磁带妥善保存。这时用qvol命令可以看到这盘磁带的信息,但用qlibvolume看不到。将取出的磁带重新放入磁带库中:将欲放回的磁带放入前面的I/O窗口中,注意条码一边向内。TSM>checkinlibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)search=bulkstatus=private向磁带库中增加新的供TSM使用的磁带:将欲放回的磁带放入磁带库前面的I/O窗口中,注意条码一边向内。TSM>labellibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)search=bulklabelsource=barcodecheckin=scratch将新磁带添加到storagepool中〔可选〕TSM>definevolumePOOL_NAMETAPE_LABEL重复利用磁带库中的磁带1. 自动重复利用当以前的备份随时间流逝而过期,磁带上相应的空间会腾空,但由于磁带属于流设备,只要后面还有数据存在,前面的空闲空间就不可使用。缺省状态下,当一盘磁带上这样的可回收空间到达90%时,TSM会自动将这盘磁带上的全部数据转移到同一存储池的另一盘有足够可用空间的磁带上,使这盘磁带可以被重复利用。这种方式不需要人工干预。2. 快速重复利用如果用qcontent命令查看某盘磁带上的备份内容后,认为这些备份数据都可以删除了,我们就能快速清空这盘磁带,使它可以被重复利用。TSM>deletevolTAPE_LABELdiscarddata=yesTSM>definevolumePOOL_NAMETAPE_LABEL管理磁带库存储池查看数据存储池利用率:例如vobpool:TSM>querystgpoolvobpoolformat=detailPctUtil的值表示其利用率。管理客户端节点删除一个客户端节点删除一个客户端节点,只需在服务器上将节点删除,但必须要有足够权限。1. 除该节点在服务器端的数据,使用命令:TSM>deletefilespaceNODENAME*wait=yes2.节点定义,使用命令TSM>removenodeNodename修改节点密码使用命令:TSM>updatenodeNodenameNewPasswd定时备份维护TSMClien/TDP节点定时备份守候进程1.后台启动定时器:#cd/usr/tivoli/tsm/client/ba/bin#nohupdsmcschedule-se=***-password=***2>/dev/null&2. 以在/etc/inittab中参加如下行使其自动启动。Tsm::once:/usr/bin/dsmcschedule-se=***-password=***>/dev/null2>&1#TSMScheduler客户端停顿定时备份(1) ps-ef|grepdsmc|grepschedule得到所有dsmcschedule进程号。(2) kill-9将其中止。查看定时备份日志dsmsched.log,该文件存在运行dsmcschedule命令的目录。建设策略域(PolicyDomain)策略域定义备份保存的版本及版本保存的时间,是TSM存储管理的核心。1.NDARD策略域COPY为一个新的策略域。3. 修改BackupCopyGroup属性,指定StoragePool、对象存在时保存版本数(Verexist)、对象删除后保存版本数(Verdeleted)、额外版保存天数(Retextra)、最后版本保存天数(Retonly)。4. 检验,激活上述配置。监控TSMServer运行情况 使用querystatus命令查看server当前状态。 使用queryactlog命令查看近期内服务器和客户端的活动。可以设定具体的查看时间段。 使用queryvolhisttype=dbbackup查看TSM服务器数据库备份情况。 使用queryevent命令查看客户定时器状态,成功、失败或将来状态。 使用queryeventtype=admin命令查看TSM服务器定时器状态,成功、失败或将来状态。 查看/usr/Tivoli/tsm/server/bin/dsmerror.log和dsierror.log中的出错信息。 查看客户端的/usr/Tivoli/tsm/client/ba/bin/dsmsched.log中定时备份的信息。 可以使用dsmadmc-consolemode命令开一个窗口,窗口中会记录服务器和客户端的活动情况。 使用querycontentA00047(这里是使用qvol查看到磁带卷名称)查看磁带中的备份内容。IBM客户支持服务流程IBM支持流程提供5x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论