GBase 8A MPP Cluster 产品培训-日常维护_第1页
GBase 8A MPP Cluster 产品培训-日常维护_第2页
GBase 8A MPP Cluster 产品培训-日常维护_第3页
GBase 8A MPP Cluster 产品培训-日常维护_第4页
GBase 8A MPP Cluster 产品培训-日常维护_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、GBASE版权所有版权所有2004-2013GBase 8a MPP Cluster 日常维护维护管理规范介绍维护管理规范介绍目录2一数据库日常维护数据库日常维护二问题解答问题解答三维护管理规范介绍维护管理规范介绍目录3一数据库日常维护数据库日常维护二问题解答问题解答三 检查集群状态 查询磁盘空间 监控内存使用情况 帐号、权限管理 系统日志查看日常维护4集群状态集群状态 使用gcadmin命令查看正常的集群状态(命令行方式) 上图为正常的集群状态和节点状态。 当集群/节点某个状态不正常时,相应文字会闪烁。5集群状态集群状态 集群的工作状态分为: ACTIVED 状态:当前集群中Online 的

2、节点个数大于1/2 时,集群总的状态为ACTIVED 状态。 LOCKED 状态:当前集群中Online 的节点个数小于等于1/2 时,集群总的状态为 LOCKED 状态。集群不再执行SQL操作。 集群的模式分为: normal :正常,能执行所有SQL操作 readonly:只读,只能执行查询SQL,用于数据备份操作。 recovery:恢复,不能进行任何SQL操作,用于数据恢复操作。6节点节点状态状态 节点的工作状态分为: Online 状态:节点为正常状态 。 Offline 状态:则表示节点断线或者集群 gcware 服务未启动。 各模组进程的工作状态分为: Open 状态:该模组进程

3、为正常状态 。 Close 状态:则表示该模组进程启动失败或消失。 datastate 数据的一致性状态分为: 0:该节点数据一致性正常。 1 :该节点数据一致性已不正常。 nodestate 节点的一致性状态分为: 0:该节点正常。 1 :该节点不正常(长期故障)。7模组进程故障排除模组进程故障排除 节点的工作状态为Offline 状态 排查是否掉电、断网等硬件、网络问题。 重新启动该节点的gcware服务。service gcware start 整体集群重启操作172.17.254.101节点root用户Cexecs service gcware restart 查看gcware日志分析

4、原因。vi /var/log/corosync.log 查找lost的记录8模组进程模组进程closeclose状态故障排除状态故障排除 节点服务启动后,正常有以下模组进程启动: gcluster进程名:gclusterd gnode进程名:gbased gcsync同步进程名:gc_sync_server gcware进程名:corosync 监控工具:monit 元数据恢复工具:gcmetarecover 数据恢复工具:gcdatarecover 检查进程是否正常命令ps ef |grep 进程名 如果有进程不存在,需重新启动该节点gcware服务service gcware restar

5、t(service gcware restart 会启动所有模组进程,需使用root帐号启动服务)9模组进程模组进程closeclose状态故障排除状态故障排除 查看模组进程状态命令:service 进程名 status 单独启动/停止各模组进程命令如下:(需使用root帐号启动服务) gcluster进程启停命令: service gclusterd start/stop gnode进程启停命令: service gbased start/stop gcsync同步进程启停命令: service gcsync start/stop gcware进程启停命令: service corosync

6、 start/stop monit监控工具启停命令: service monit start/stop 元数据恢复工具启停命令: service gcmetarecover start/stop 数据恢复工具启停命令: service gcdatarecover start/stop10数据恢复数据恢复datastate状态为状态为1 1的的故障排除故障排除 当某个节点执行命令失败后,数据恢复工具可监控到错误日志,然后调用同步工具,自动修复节点数据不一致的情况,确保各节点数据的一致性。数据恢复数据恢复datastate状态为状态为1 1的故障排除的故障排除 说明:1.同步工具是将safegro

7、up组另一个好的节点上的数据拷贝到locked节点上。2.适用于节点出现offline状态,故障恢复后需数据恢复。3.执行加载、DDL&DML语句导致数据状态不一致时,Lock节点发起自动恢复。4.集群支持自动恢复方式,恢复时先恢复ddl操作,然后恢复dml操作。DDLDDL自动恢复自动恢复datastate状态为状态为1 1的的故障排除故障排除 DDL自动恢复实现过程:1.如果有节点执行DDL操作失败,gcware会把失败记录写入到ddlevent日志;2.Gcmetarecover恢复进程定时的从gcware检索ddlevent日志;3.发现有错误信息,则会将表上锁;4.重新执行DDL操作

8、;5.执行成功后,清除错误日志记录;6.解除表锁。数据自动恢复数据自动恢复datastate状态为状态为1 1的故障排除的故障排除 数据自动恢复实现过程:1.如果有节点执行dml/loader操作失败,gcware会把失败记录写入到dmlevent日志;2.Gcdatarecover恢复进程定时的从gcware检索dmlevent日志;3.发现有错误信息,则会将表上锁;4.进行数据恢复,自动调用同步工具,将同组中另一个好的节点上的表的副本分片数据(非整个表分片数据)拷贝过来;5.同步成功后,清除错误日志记录;6.解除表锁。节点故障排除 当某个节点出现故障时,短时间无法修复,需设置节点状态fai

9、luregcadmin setnodestate nodeip 192.168.12.53 failure 当故障修复完毕,则将节点状态设置为normalgcadmin setnodestate nodeip 192.168.12.53 normal 数据会自动恢复。1515集群命令行集群命令行gcadmingcadmin管理工具管理工具 命令行工具gcadmin可以为管理员提供管理集群的操作,包括:添加SafeGroup、查看集群状态、切换集群状态、查询集群表锁等常用功能。 主要功能:gcadmin -help 列出所有命令gcadmin addsg -nodes -names name1,

10、name2 增加组gcadmin removesg 移除组(有数据时慎用)gcadmin showcluster 查看集群信息gcadmin switchmode normal|readonly|recovery 切换集群模式gcadmin showlock 查看集群锁(表级)gcadmin setnodestate normal|failure节点出现故障时,设置节点状态为failure,修好以后,设置节点状态为normal16gcadmin切换集群模式 集群模式集群模式分为:normal :正常,能执行所有SQL操作readonly:只读,只能执行查询SQL,用于数据备份操作。recove

11、ry:恢复,不能进行任何SQL操作,用于数据恢复操作。 举例:备份之前设置集群模式为readonly。gcadmin switchmode readonly备份结束之后,将集群模式设置为normalgcadmin switchmode normal1717gcadmin查看集群锁 查看集群锁 命令: gcadmin showlock 功能:查看目前集群中的表级锁。 示例: Table name:锁加在哪个表上 Owner: 哪个节点加的这把锁 Content: 锁的备注 Create time: 锁的创建时间(以加锁的节点的时间为准) Orphan: 是否是孤儿锁。 Type: 锁的类型,S:

12、 共享锁 E: 独占锁18gcadmin查看集群锁 查看集群锁 gcadmin showlock19检查内存使用率 使用top(LINUX), nmon(/opt/gnode/server/bin/目录下)等工具进行监控 /opt/gnode/server/bin/nmon20检查磁盘空间使用情况检查磁盘空间使用情况 使用 df h 命令 查看磁盘的使用率和剩余空间 如果空间快满,需考虑是否增加磁盘或者集群扩容。rootTEST10138 # df -hFilesystem Size Used Avail Use% Mounted on/dev/mapper/VolGroup00-LogVol

13、00 209G 113G 86G 57% /dev/sda6 92M 24M 64M 27% /boottmpfs 2.0G 0 2.0G 0% /dev/shm21连接集群连接集群数据库几种方法数据库几种方法 通过通过GBaseGBase Shell Shell方式连接集群(命令行方式)方式连接集群(命令行方式)$ gccli -ugbase -pgbase20110531 h172.17.254.106(101-108,111-118) -P5258$ /opt/gcluster/server/bin/gbase -ugbase -pgbase20110531 -P5258 批处理批处理S

14、QLSQL文件文件$ gccli -ugbase -pgbase20110531 -Dtest -vvv -f sql/result.txt 2 sql/result.err 企业管理器可连接(企业管理器可连接(windowswindows下的图形化客户端)下的图形化客户端) 应用程序访问应用程序访问22实用实用SQLSQL语句语句- -帐号帐号管理管理 创建用户:CREATE USER admin IDENTIFIED BY 123456; admin是新用户名,123456是密码 删除用户DROP USER admin; 修改用户名RENAME USER old_user TO new_u

15、ser 设置/修改密码SET PASSWORD = PASSWORD(adminnew);SET PASSWORD FOR admin1 = PASSWORD(admin); 查询用户:SELECT TRIM(host) host, TRIM(user) user,password FROM gbase.user;用户管理23实用实用SQLSQL语句语句- -帐号帐号管理管理 GRANT 和REVOKE 语句允许系统管理员创建8a 集群用户帐号,并处理用户权限的赋予与收回。 授权语法:GRANT ALL ON TEST.* TO admin WITH MAX_QUERIES_PER_HOUR

16、20MAX_UPDATES_PER_HOUR 10 MAX_CONNECTIONS_PER_HOUR 5MAX_USER_CONNECTIONS 2 ;MAX_QUERIES_PER_HOUR:每节点上限制每用户每小时发出的查询数MAX_UPDATES_PER_HOUR:每节点上限制每用户每小时发出的更新数MAX_CONNECTIONS_PER_HOUR:每节点上限制每用户每小时可连接服务器的次数MAX_USER_CONNECTIONS:每节点上限制每用户可同时连接的最大连接数。24实用实用SQLSQL语句语句- -帐号帐号管理管理权限列表权 限意 义ALL PRIVILEGES设置除GRAN

17、T OPTION之外的所有简单权限ALTER允许使用ALTER TABLEALTER ROUTINE更改或取消已存储的子程序CREATE允许使用CREATE TABLECREATE ROUTINE创建已存储的子程序CREATE TEMPORARY TABLES允许使用CREATE TEMPORARY TABLECREATE USER允许使用CREATE USER, DROP USER, RENAME USER和REVOKE ALL PRIVILEGES。CREATE VIEW允许使用CREATE VIEWDELETE允许使用DELETEDROP允许使用DROP TABLEEXECUTE允许用户

18、运行已存储的子程序FILE允许使用SELECT.FROM TABLE_NAME INTO OUTFILE等INDEX允许使用CREATE INDEX和DROP INDEXINSERT允许使用INSERTPROCESS允许使用SHOW FULL PROCESSLISTREFERENCES未被实施SELECT允许使用SELECTSHOW DATABASESSHOW DATABASES显示所有数据库SHOW VIEW允许使用SHOW CREATE VIEWSHUTDOWN允许使用gbaseadmin shutdownUPDATE允许使用UPDATEGRANT OPTION允许授予权限25实用实用SQ

19、LSQL语句语句- -帐号帐号管理管理 查看用户授权的语句SHOW GRANTS FOR user ; 收回语法:REVOKE ALL PRIVILEGES, GRANT OPTION FROM user;收回权限管理26查看服务器运行语句查看服务器运行语句 查看本节点正在运行的线程(SQL语句):SHOW FULL PROCESSLIST; -如果有SUPER 权限,可以看到所有线程。 显示8a集群的系统变量的值:SHOW GLOBAL | SESSION VARIABLES LIKE pattern; 举例:显示集群压缩相关的系统变量的值SHOW VARIABLES LIKE %compr

20、ess%;27查看服务器运行语句查看服务器运行语句 显示警告或错误信息:SHOW WARNINGS; - 显示由最后一个语句产生的错误,警告和注意信息。SHOW ERRORS; - 显示由最后一个语句产生的错误信息。 显示集群中节点信息:SHOW NODES; -如果有SUPER 权限,可以看到所有节点信息。SHOW LOCAL NODE; - 显示集群中客户端正在访问节点的信息。28查询数据库信息查询数据库信息show databases; -查看系统中数据库名的语句(根据权限显示)use db_name; -数据库作为以后查询的缺省数据库。show tables; -列出给定数据库的所有非临时表desc test.t; -查看test库t表的列信息show index from test.t; -查看test库t表的索引信息29查询创建数据的信息查询创建数据的信息SHOW CREATE DATABASE test; -查看test的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论