大数据平台运维手册_第1页
大数据平台运维手册_第2页
大数据平台运维手册_第3页
大数据平台运维手册_第4页
大数据平台运维手册_第5页
已阅读5页,还剩177页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

运维手册PAGE\*romaniii运维手册PAGE\*romaniii大数据平台运维手册目录简介 1大数据平台介绍 1大数据平台Manager介绍 2使用前的准备 3客户端硬件配置 3软件环境要求 3支持的浏览器 3系统检查 4管理员服务器IP,端口及账号权限检查 4管理员服务器空间检查 4开始集群管理 5TDHManager的基本操作 5启动和停止TDHManager 5终止TDHManager进程 6重启大数据平台-manager和agent 6TDHManager登入和登出 6TDHManager语言选择 7TDHManager用户信息登记和更新 8创建集群服务 10创建集群 10集群服务的添加、删除 13管理菜单 17节点管理 17添加节点 18用户管理 22管理用户 23管理用户组 33管理用户角色 35日志查询 43审计查询 44NTP管理 45许可证管理 46Guardian服务监控 48Guardian服务的角色 49Guardian服务的配置 50Guardian服务操作的监控 51备份与恢复 51Zookeeper的运维 53ZooKeeper服务的管理 53启动、停止、删除Zookeeper服务 53配置服务 54ZooKeeper服务的监控 54CPU使用监控 54ZooKeeper概要信息监控 55ZooKeeper服务历史监控 56ZooKeeper节点监控 56ZooKeeper统计信息监控 56ZooKeeper服务的配置 58配置ZooKeeper的角色 58修改ZooKeeper的配置 62Zookeeper的安全配置 64查看ZooKeeper操作 64HDFS的运维 66HDFS服务的管理 66启动、停止、删除HDFS服务 66配置服务 67HDFS服务的监控 67CPU使用监控 67HDFS概要信息监控 68HDFS服务历史监控 69HDFS节点监控 69HDFS统计信息监控 70HDFS服务的配置 71配置HDFS的角色 71修改HDFS的配置 73HDFS的安全配置 75查看HDFS操作 76HDFS的维护 77YARN的运维 79YARN服务的管理 79启动、停止、删除YARN服务 79配置服务 80YARN服务的监控 80CPU使用监控 80YARN概要信息监控 81YARN服务历史监控 81YARN节点监控 82YARN统计信息监控 82YARN服务的配置 83配置YARN的角色 83修改YARN的配置 87YARN的资源管理 88YARN的安全配置 89查看YARN操作 90Hyperbase的运维 92Hyperbase服务的管理 92启动、停止、删除Hyperbase服务 92配置服务 93Hyperbase服务的监控 93CPU使用监控 93Hyperbase概要信息监控 94Hyperbase服务历史监控 94Hyperbase节点监控 94Hyperbase统计信息监控 95Hyperbase服务的配置 95配置Hyperbase的角色 95修改Hyperbase的配置 98Hyperbase的安全配置 100查看Hyperbase操作 101Discover的运维 102Discover服务的管理 102启动、停止、删除Discover服务 102配置服务 103Discover服务的监控 103CPU使用监控 103Discover概要信息监控 104Discover服务历史监控 105Discover节点监控 105Discover统计信息监控 105Discover服务的配置 106配置Discover的角色 106修改Discover的配置 107Discover的资源分配 109Discover的安全配置 110查看Discover操作 111InceptorSQL的运维 112InceptorSQL服务的管理 112启动、停止、删除InceptorSQL服务 112配置服务 113InceptorSQL服务的监控 113CPU使用监控 113InceptorSQL概要信息监控 114InceptorSQL服务历史监控 114InceptorSQL节点监控 114InceptorSQL统计信息监控 115InceptorSQL服务的配置 115配置InceptorSQL的角色 115修改InceptorSQL的配置 117InceptorSQL的资源分配 118InceptorSQL的安全配置 119查看InceptorSQL操作 119查看Holodesk 120InceptorSQL客户端的下载 120Stream的运维 122Stream服务的管理 122启动、停止、删除Stream服务 122配置服务 123Stream服务的监控 123CPU使用监控 123Stream概要信息监控 124Stream服务历史监控 124Stream节点监控 125Stream统计信息监控 125Stream服务的配置 126配置Stream的角色 126修改Stream的配置 127Stream的资源分配 129查看Stream操作 129Kafka的运维 130Kafka服务的管理 130启动、停止、删除Kafka服务 130配置服务 131Kafka服务的监控 131CPU使用监控 131Kafka概要信息监控 132Kafka服务历史监控 132Kafka节点监控 132Kafka统计信息监控 133Kafka服务的配置 134配置Kafka的角色 134修改Kafka的配置 135Kafka的安全配置 136查看Kafka操作 137Oozie的运维 138Oozie服务的管理 138启动、停止、删除Oozie服务 138配置服务 139Oozie服务的配置 139配置Oozie的角色 139修改Oozie的配置 140查看Oozie操作 141Sqoop的运维 142Sqoop服务的管理 142启动、停止、删除Sqoop服务 142配置服务 143Sqoop服务的配置 143配置Sqoop的角色 143修改Sqoop的配置 144查看Sqoop操作 145HUE的运维 146HUE服务的管理 146启动、停止、删除HUE服务 146配置服务 147HUE服务的配置 147配置HUE的角色 147修改HUE的配置 148查看HUE操作 150Elasticsearch的运维 151Elasticsearch服务的管理 151启动、停止、删除Elasticsearch服务 151配置服务 152Elasticsearch服务的配置 152配置Elasticsearch的角色 152修改Elasticsearch的配置 153查看Elasticsearch操作 154系统监控 156TDHManager状态监控 156TDHManager热点图监控 156TDHManager警报 158TDHManager操作 159升级工具的使用 160升级前的准备 160开始升级 165升级失败的回滚 167升级常见错误 167运维基本说明 168Zookeeper 16821.1.1.日志 16821.1.2.启动停止 168HDFS 16821.2.1.日志 16821.2.2.启动停止 168YARN 16921.3.1.日志 16921.3.2.启动停止 169Hyperbase 17021.4.1.日志 17021.4.2.启动停止 170Inceptor 17021.5.1.日志 17021.5.2.启动停止 170术语表 173范例清单创建用户 24授予用户Alice在InceptorSQL1中创建数据库的权限 28授予用户Alice在InceptorSQL1中对某个数据库的权限 29授予用户Alice在InceptorSQL1中对某张表的权限 31添加用户组 34创建角色 36授予角色sales在InceptorSQL1中创建数据库的权限 40授予角色sales在InceptorSQL1中对某个数据库的权限 40授予角色sales在InceptorSQL1中对某张表的权限 421.简1.简介运维手册PAGE174运维手册PAGE174简介大数据平台介绍大数据平台(简称TDH)是国内首个全面支持Spark和SQL2003语言解析的Hadoop商业发行版,也是国内落地案例最多的商业版本,是国内外领先的高性能平台,比开源基于MapReduce计算框架的版本快10x~100x倍。TDH过内存计算、高效索引、执行优化和高度容错的技术,使得一个平台能够处理GB到PB并且在每个数量级上,都能比现有技术提供更快的性能;企业客户不再需要混合架构,TDH可以伴随企业客户的数据增长,动态不停机扩容,避免MPP或混合架构数据迁移的棘手问题。星环的大数据平台TDH包含五个组成部分:大数据平台Hadoop企业版,大数据平台Inceptor布式内存分析引擎,大数据平台Hyperbase分布式实时在线数据处理引擎,大数据平台流处理引擎和大数据平台Discover机器学习引擎,五个产品组件构成了完整的大数据平台。在统一的分布式存储之上数据平台上通过大数据平台YARN提供统一的资源管理调度,结合LDAP与Kerberos提供完备的权限管理控制,不同的部门以及使用租户可以按需创建计算集群访问其授权数据,包括基于Spark计算框架的SQL类统计分析应用与数据挖掘类应用,或者基于MapReduce计算框架的应用。同时,平台通过使用Hyperbase结合Inceptor,为用户提供基于SQL的高并发的查询以及分析能力。在数据导入与交换方面,数据平台提供多样的数据导入与交换形式,包括Flume提供海量数据文件的聚合汇总到HDFS的功能,FTPOverHDFS提供文件通过FTP传入HDFS的通道,Sqoop提供与关系型数据库的数据交换以及Kafka消息队列集群接收实时流数据。此外,TDH数据平台提供实时的流处理能力,通过消息队列Kafka接收实时数据流,做到数据不丢不重,通过大数据平台Stream基于SparkStreaming提供类似与批处理系统的计算能力、健壮性、扩展性的同时,将数据时延降低至秒级甚至毫秒级。大数据平台Manager介绍大数据平台Manager是星环信息技术有限公司为TDH开发的平台管理软件。通过大数据平台Manager,您可以通过浏览器来安装、部署、监控和管理整个TDH集群。大数据平台Manager赋予大数据平台运维人员经营者企业级标准的平台管理能力,经营者可以藉此提高平台运维性能,提高服务质量并降低运营成本。运维人员可以轻松地部署和集中操作整个的TDH集群。应用程序自动执行安装过程中,部署时间从几周减少到几分钟,大数据平台Manager可以为您提供群集范围内的实时视图的节点运行和服务;提供了一个单一节点的中央控制台;制定配置的更改和全范围的报告和诊断工具来帮助您优化性能和利用率;可以实时报警异常情况。新一代的大数据平台Manager采用了扁平化风格和可视化界面来展示TDH集群服务状态个指标等。2.使用前的准备2.使用前的准备使用前的准备大数据平台Manager软件采用浏览器的方式管理整个集群。客户端软硬件需要以下配置。客户端硬件配置客户端PC必须具备以下最低配置硬件1颗2核心x86指令集CPU的PC台式机或笔记本2GB以上内存1个300G以上的硬盘1个千兆网卡或无线网卡软件环境要求客户端支持以下操作系统。操作系统版本WindowsWindowsXP,Windows7,Windows8oraboveLinuxRedhatorSuseLinuxDesktopversionAppleMacOS10.8.1或以上GoogleChromeOS36.0.x支持的浏览器您需要通过网页浏览器使用大数据平台Manager,管理平台支持以下浏览器浏览器版本GoogleChrome(推荐)36.0.1985.143及以上FireFox36.0及以上AppleSafari7.0.2及以上InternetExplorer(不推荐)不支持3.系统检查3.系统检查系统检查在开始使用TDH集群前,您需要对您的系统进行以下检查。管理员服务器IP,端口及账号权限检查在使用大数据平台Manager前你需要知道您在安装TDH过程中所预设的大数据平台ManagerIP地址及端口号,大数据平台Manager管理员的用户名及密码,这些值如下:大数据平台Manager的IP是您集群管理节点的IP,默认端口是8180。大数据平台Manager初始的管理员用户名是admin,密码是admin。管理员服务器空间检查大数据平台Manager在运行过程中会产生日志和数据库数据,因此在安装大数据平台Manager服务器需要预留100GB空间给日志和数据库。4.开始集群管理4.开始集群管理开始集群管理TDHManager是TDH集群图形化管理应用程序。通过TDHManager可视性来控制Hadoop集群。你可以轻松地部署、安装、监控和集中操作整个的TDH集群。如下所示,TDHManager承载管理控制台、Web服务器和应用程序逻辑。它是负责安装软件、配置、启动和停止服务以及管理的群集服务在其运行。TDHManager由以下几部分组成:配置、报警以及监视主机。(TDH安装时候会自动安装)库服务器。例如,TDH可以监控守护进程使用不同的逻辑数据库。客户端:TDHManager会提供一个接口,用于客户端与服务器进行交互。管理控制台是基于Web的用户界面,管理员通过用户界面管理群集。TDHManager的心跳机制:TDHManager采用心跳通信机制同所管理的集群保持通讯。默认情况下代理每10秒发送心跳信号到管理服务器。为减少用户等待时间,可以在改变状态增加频率。心跳通讯机制可以定期把集群服务器的现有状态汇报给TDHManager服务器。TDH管理服务器会汇总哥哥代理的信息整体展现给用户。如果TDHManager不能收到代理的通讯或某项服务启动失败。比如一个进程无法启动,服务器就将标记为失败后的启动命令并在管理界面上报警。TDHManager的基本操作启动和停止TDHManager登陆大数据平台-master所在机器,使用以下命令启动TDHManager。service大数据平台-managerstart登陆大数据平台-master所在机器,使用以下命令停止TDHManager。service大数据平台-managerstop终止TDHManager进程1.查找进程号jps|grep大数据平台Manager使用kill命令终止TDHManager进程重启大数据平台-manager和agent重启大数据平台-managerservice大数据平台-managerrestart重启agentservice大数据平台-manager-agentrestartTDHManager登入和登出系统的登入(login)打开客户端浏览器(推荐使用googlechrome),输入安装好的管理节点IP或DNS地址,比如0:8180/(0是manager_IP地址,端口号是8180),输入用户名和密码。初次登入时候必须以admin的身份登录,admin的默认密码是admin。首次登陆后,您需要接受大数据平台最终用户协议:系统的登出(logout)点击用户界面右上角的登入用户名显示下拉式菜单,点击“登出”菜单登出系统。其操作如下图。TDHManager语言选择点击用户界面右上角的用户名显示下拉菜单,点击“首选项”进入语言选择界面,如下图。利用“用户首选项”界面中的“语言”菜单栏选择适合的语言,如下图所示。TDHManager目前支持中文、英文两种语言。TDHManager用户信息登记和更新点击用户界面右上角的用户名显示下拉菜单,点击“用户信息”。在“用户简介”页面中,可以查看当前用户的全名、电子邮件、部门、所属组、角色等信息,如下图所示。在用户简介下面有两个选项:编辑信息、更改密码。点击编辑信息,弹出“编辑信息”界面,用户可在上面编辑用户名、全名、电子邮件、部门、描述等信息;点击“更改密码”,弹出“编辑信息”页面,用户可在上面编辑新密码。如下图所示。5.创建集群服务5.创建集群服务创建集群服务创建集群在主界面的右边有一系列隐藏菜单,从上往下分别为“NEW”、集群一、集群二等,点击“NEW”,进入创建集群向导,开始创建集群。您需要给您的集群设置一个名字。输入集群名字后点击“下一步”。您在这个页面添加/删除/修改机柜。将鼠标移到机柜的名字和描述上可以对机柜的名字和描述进行修改。完成后点击“下一步”。在这一步向您的集群添加节点。点击“添加节点”会弹出下面窗口:您可以按照提示在窗口中搜索节点:点击“搜索”,大数据平台Manager会搜索您输入的节点:点击“继续”。并提供SSH访问权限并输入您管理节点的密码:输入密码后,点击“完成”。节点便添加完成。如果我们只有一个机柜,大数据平台Manager自动将所有的节点分配给了默认机柜。如果您有多个机柜,您可以点击“分配机柜”来分配机柜。(如果您的集群中有6个以上的节点,那么您必须配置机架信息,方便以后的运维和服务配置)集群服务的添加、删除将鼠标移至主页面任意集群左侧的“+”号上,点击弹出的“+服务”,进入服务添加向导页面。点击“下一步”,选择想要添加的服务,再点击“下一步”。为选择的服务指定其依赖的服务,点击“下一步”。为选择的服务分配角色,默认已按推荐方法配置,修改时先选左侧菜单的一个角色,再在中间面板上为该角色分配节点。结束后点击“下一步”。配置选中的服务,包括属性、基础参数、自定义参数,资源分配。结束后点击“下一步”。出现“基础参数”页面,核对无误后点击“下一步”,弹出“安装确认”窗口,点击“确认”开始安装服务。6.管理菜单6.管理菜单管理菜单将鼠标移到大数据平台Manager页面上方的上会出现管理菜单:通过管理菜单您可以对集群整体进行各项管理。本章对这些管理进行详细介绍。节点管理在管理菜单中点击“节点”:您将进入节点管理页面:添加节点点击节点管理页面右上角的“+”,进入“添加节点”页面:“添加节点”页面有三个标签页:选择集群、编辑机柜和分配节点。选择集群选择所要操作的集群,点击下一步。编辑机柜在“编辑机柜”标签页中可以进行下面操作:点击“添加机柜”可以向集群中添加新机柜;将鼠标移至要删除的机柜上,点击出现的“删除”按钮将其删除;点击任意机柜名及其描述,可对其进行编辑。机柜编辑完成后,点击“下一步”进入“分配节点”标签页。分配节点在分配节点标签页可以进行下面操作:添加节点点击界面上的可以添加新节点,系统会弹出下面窗口,在这个窗口可以搜要添加的节点并提供这些节点的访问权限:在“搜索节点”标签页中输入IP地址搜索您想要添加的节点,如果Manager节点,它的IP会出现在列表中。完成搜索后点击“继续”,为Manager点的SSH访问权限:节点便添加成功。分配新增节点的机柜如果您只有一个机柜,Manager自动将新增节点分配给了默认机柜。如果您有多个机柜,您可以勾选新增节点,然后点击来分配机柜(如果您集群中有6个以上的节点,那么您必须配置机架信息,方便以后的运维和服务配置)。删除新增节点如果您想要放弃添加新增节点,可以勾选新增节点,然后点击将其删除。节点分配完成后,点击“下一步”,Manager击“完成”,节点便安装成功:用户管理点击管理菜单中的“用户”:进入用户管理界面:在用户管理界面中您可以管理用户、用户组和用户角色。管理用户点击页面右侧的,进入用户管理页面:用户管理页面中显示了当前集群和Manager中所有的用户。在该页面,您可以进行用户管理操作,包括添加、删除和编辑用户。添加用户

点击来添加一个新用户。Manager会弹出下面的窗口,您需要在这里输入新用户的息:其中,“用户名”、“用户名全名”、“用户组”、“密码”、“确认密码”和“用户类型”是必须信息。“用户名”将被用来登陆Manager或者访问集群服务;“用户名全名”虽然必须提供,但是目前没有特殊功能,在未来版本的TDH中会用于更好地管理集群用户。“用户类型”中:管理代表该用户组将是管理类型的用户组,管理类型的组只能在Manager中使用。集群集群则代表该用户组将是集群类型的用户组,集群类型的用户组既可以在Manager使用,也可以在TDH集群中使用。例例6.1.创建用户创建Carol用户:删除用户编辑用户

在用户管理界面的用户列表中勾选一个用户,然后点击便可以将其删除。在用户管理界面中点击一个用户,会进入这个用户的编辑界面,例如下面是集群用户Carol的用户编辑界面:下面是Manager用户David的用户编辑界面:在用户编辑界面中,您可以:修改用户信息设置用户密码修改用户所属组修改用户角色锁定或解锁用户编辑用户权限(限集群用户)生成Keytab文件(限集群用户)修改用户信息点击用户编辑界面的,Manager会弹出下面窗口:在该窗口中,您可以修改该用户的邮件、用户名全名、部门和描述。注意,不可修改用户名。设置用户密码点击用户编辑界面的,Manager会弹出下面窗口让您设置用户密码:修改用户所属组点击用户编辑界面的,Manager会弹出下面窗口:这个窗口中,左边一栏是Manager(如果该用户是Manager用户)或集群(如果该用户是集群用户)中所有的组;右边一栏是该用户已经加入的组。将用户添加进组在左栏中勾选想要将用户添加进去的组,然后点击,勾选中的组会出现在右栏中,表添加成功。将用户移出组在右栏中勾选想要将用户移出的组,然后点击,勾选中的组会从右栏中消失,表示移成功。修改用户角色点击用户编辑界面的,Manager会弹出下面窗口:这个窗口中,左边一栏是Manager(如果该用户是Manager用户)或集群(如果该用户是集群用户)中所有的角色;右边一栏是该用户已经有的角色。赋予角色在左栏中勾选想要赋予给用户的角色,然后点击,勾选中的角色会出现在右栏中,表赋予成功。收回角色在右栏中勾选想要将从用户处收回的角色,然后点击,勾选中的角色会从右栏中消失表示收回成功。锁定或解锁用户点击会将用户锁定,用户被锁定后,将不能再登陆Manager或集群。要解锁用户,可在被锁定用户的编辑页面点击。编辑权限(限集群用户)虽然Manager类型的用户也有选项,但是我们建议不对Manager型的用户进行权限设置操作。点击一个集群用户的用户编辑页面的会进入该用户的权限设置窗口,如下:页面右上显示了当前的Inceptor服务,页面上显示的是用户在该Inceptor服务中的权限。如果您的集群上有多个Inecptor服务,您可以点击下图中红框标出的部分切换Inceptor服务:在这个页面中,您可以对该用户在集群上的Inceptor服务中的权限,在该页面可以进行所有InceptorSQL用户授权语句能够执行的操作。下面我们举一些例子。在页面上的操作都需要点击页面下方的才会生效。例例6.2.授予用户Alice在InceptorSQL1中创建数据库的权限InceptorSQL中授予Alice创建数据库权限的语句为:GRANTCREATETOUSERGRANTCREATETOUSERAlice;在Alice的权限设置页面,您仅需要勾选页面中的“CREATEDATABASE”,便可达到和上面语句相同的效果:勾选后,点击页面下方的动:让改动生效。Manager会弹出下面的窗口要求确认改例例6.3.授予用户Alice在InceptorSQL1中对某个数据库的权限下面的InceptorSQL语句授予用户Alice对数据库hr的权限:GRANTCREATEONDATABASEhrTOUSERAlice;GRANTSELECTONDATABASEhrTOUSERAlice;授予用户Alice在hr中建表的权限授予用户Alice在hr中执行SHOWTABLES下面是如何在用户权限界面进行等效操作:1.点击,在下拉菜单中点击数据库hr:这时,数据库hr会出现在列表中:此时,您只需要勾选hr对应的 勾选框来授予Alice在hr中建表的权限,勾选hr对应的 勾选框来授予Alice在hr中执行SHOWTABLES的权限。如果您要收回用户Alice的权限,只需要取消勾选便可。对应的InceptorSQL为:REVOKE(CREATE|SELECT)ONDATABASEhrFROMUSERAlice;5.5.如果您要收回用户Alice对hr的全部权限,您也可以直接点击hr对应的 将hr从列表中直接删除。6.要使操作生效,您需要点击页面下方的。例例6.4.授予用户Alice在InceptorSQL1中对某张表的权限以下InceptorSQL语句授予用户Alice对在数据库hr中的test表的权限:GRANT(INSERT|SELECT|UPDATE|DELETE|ALL)ONhr.testTOUSERAlice;下面是如何在用户权限界面进行等效操作:1.点击,在下拉菜单中点击数据库hr:2.这时右边会出现,点击它,在下拉菜单中点击表test:现在,hr中的表test会出现在列表中:您只要勾选各项权限对应的勾选框便可以完成授权操作。要收回权限,只需取消勾选。对应的InceptorSQL操作为:REVOKE(INSERT|SELECT|UPDATE|DELETE|ALL)ONhr.testFROMUSERAlice;如果您要收回用户Alice对test的全部权限,您也可以直接点击test对应的test从列表中直接删除。6.6.要使操作生效,您需要点击页面下方的。生成Keytab文件(限集群用户)点击集群用户编辑界面的,该用户的Keytab文件便会自动下载到本地。管理用户组点击页面右侧的,进入用户组管理页面:页面上会显示当前集群和Manager用户组管理包括添加、删除和编辑用户组。添加用户组点击添加一个新的用户组。Manager会弹出下面窗口,您需要提供新增用户组的信息:其中“组名”和“用户类型”为必须信息。“用户类型”中:管理代表该用户组将是管理类型的用户组,管理类型的组只能在Manager中使用。集群集群则代表该用户组将是集群类型的用户组,集群类型的用户组既可以在Manager使用,也可以在TDH集群中使用。例例6.5.添加用户组添加一个名为Sales的集群用户组:删除用户组在用户组列表中选中一个组,然后点击可以将选中的组删除。编辑用户组在用户组列表中点击一个用户组可以进入该用户组的编辑界面,对用户组进行编辑。下面是一个名为Sales用户组的编辑页面:编辑组

点击可以对用户组本身进行编辑;点击可以对用户组中的用户进行编辑。对组本身的编辑只能修改组的描述:编辑用户

编辑完成后点击保存修改。对组中用户的编辑包括将用户移入和移出用户组。将用户移入用户组勾选“可选用户”列表中的一个或多个用户,点击,选中用户即被加入该组。将用户移出用户组勾选“已加入该组的用户”列表中的一个或多个用户,点击,选中用户即被移出该组。管理用户角色点击页面右侧的,进入用户角色页面:添加角色

页面上显示了当前Manager和集群上所有的角色以及它们的类型、权限和描述。在这个页面,您可以进行用户角色管理操作,包括添加、编辑和删除用户角色。点击可以添加一个新角色。Manager会弹出下面窗口:您需要在这个窗口提供新增角色的信息。其中“角色名”和“用户类型”为必须信息。“用户类型”中:管理代表该角色将是管理类型的角色,管理类型的角色只能在Manager中使用。集群集群则代表该角色将是集群类型的角色,集群类型的角色既可以在Manager也可以在TDH集群中使用。填写完信息后点击完成添加。例例6.6.创建角色添加sales角色:删除角色编辑角色

在用户角色页面的角色列表中勾选一个角色,然后点击,即可以删除选中的角色。点击角色管理页面中的一个角色,可以进入该角色的编辑页面。例如下面是角色sales的编辑页面:在角色编辑界面中,您可以:修改角色描述编辑角色下的用户编辑角色权限(限集群角色)修改角色描述在角色编辑页面中点击,Manager会弹出下面窗口,在该窗口中您可以修改角色的述。注意,角色名不能修改。编辑角色下的用户在角色编辑页面中点击,Manager会弹出下面窗口:这个窗口中,左边一栏是Manager(如果该角色是Manager角色)或集群(如果该角色是集群角色)中所有的用户;右边一栏是角色下已经有的用户。赋予角色在左栏中勾选想要赋予角色的用户,然后点击,勾选中的用户会出现在右栏中,表示予成功。收回角色在右栏中勾选想要将从收回角色的用户,然后点击,勾选中的用户会从右栏中消失,示收回成功。编辑角色权限(限集群角色)在一个集群角色的角色编辑页面点击会进入该角色的权限设置窗口,如下:页面右上显示了当前的Inceptor服务,页面上显示的是用户在该Inceptor服务中的权限。如果您的集群上有多个Inecptor服务,您可以点击下图中红框标出的部分切换Inceptor服务:在这个页面中,您可以对该角色在集群上的Inceptor服务中的权限,在该页面可以进行所有InceptorSQL角色授权语句能够执行的操作。下面我们举一些例子。在页面上的操作都需要点击页面下方的才会生效。让改动生效。Manager让改动生效。Manager会弹出下面的窗口要求确认改勾选后,点击页面下方的动:在角色sales的权限设置页面,您仅需要勾选页面中的“CREATEDATABASE”,便可达到和上面语句相同的效果:GRANTCREATETOROLEsales;例6.7.授予角色sales在InceptorSQL1中创建数据库的权限InceptorSQL中授予角色sales创建数据库权限的语句为:例6.8.授予角色sales在InceptorSQL1中对某个数据库的权限下面的InceptorSQL语句授予角色sales对数据库hr的权限:GRANTCREATEONDATABASEhrTOROLEsales;GRANTSELECTONDATABASEhrTOROLEsales;授予角色sales在hr中建表的权限授予角色sales在hr中执行SHOWTABLES下面是如何在sales的角色权限界面进行等效操作:点击,在下拉菜单中点击数据库hr:这时,数据库hr会出现在列表中:此时,您只需要勾选hr对应的 勾选框来授予角色sales在hr中建表的权限勾选hr对应的 勾选框来授予角色sales在hr中执行SHOWTABLES的权限。如果您要收回角色sales的权限,只需要取消勾选便可。对应的InceptorSQL为:REVOKEREVOKE(CREATE|SELECT)ONDATABASEhrFROMROLEsales;5.如果您要收回角色sales对hr的全部权限,您也可以直接点击hr对应的 将hr从表中直接删除。6.要使操作生效,您需要点击页面下方的。例例6.9.授予角色sales在InceptorSQL1中对某张表的权限以下InceptorSQL语句授予角色sales对在数据库hr中的test表的权限:GRANT(INSERT|SELECT|UPDATE|DELETE|ALL)ONhr.testTOROLEsales;下面是如何在用户权限界面进行等效操作:1.点击,在下拉菜单中点击数据库hr:2.这时右边会出现,点击它,在下拉菜单中点击表test:3.3.,hr中的表test会出现在列表中:您只要勾选各项权限对应的勾选框便可以完成授权操作。4.InceptorSQL操作为:REVOKE(INSERT|SELECT|UPDATE|DELETE|ALL)ONhr.testFROMROLEsales;5.如果您要收回角色sales对test的全部权限,您也可以直接点击test对应的 test从列表中直接删除。6.要使操作生效,您需要点击页面下方的。日志查询TDHManager支持对所有日志进行分类检索查询。选择顶部菜单栏中的“管理”菜单,点击“日志查询”选项,进入日志查询页面。在过滤条件板块,根据检索需要选择集群名称、服务名称、节点名称、角色种类、级别、关键字等检索要素,然后点击查找,日志查询结果显示在页面下方。审计查询TDHManager记录所有该TDHManager上与用户有关的操作,包括用户登录、锁住用户、解锁用户、更新用户的偏好等。选择顶部菜单栏“管理”菜单,点击“审计查询”,进入审计查询页面。在过滤条件板块,根据检索需要选择用户名、IP地址、分页大小、“操作”关键字,点击“检索”,页面下方显示检索结果,包括用户登陆时间、用户名、IP地址、操作。NTP管理一些服务比如Hyperbase在正常工作时需要节点之间进行时间同步,所以TDHManager为用户提供了网络时间协议管理功能,即NTP管理。选择顶部菜单栏中的“管理”菜单,点击“网络时间管理协议”,进入NTP管理页面。在NTP管理页面中,状态一栏显示当前为TDH提供时间的内部服务器和外部服务器,以及所有和NTP服务器时间相差大于5分钟的节点。外部NTP服务器一栏以列表形式显示所有外部NTP服务节点名称,右上角有“添加”和“删除”两个选项。勾选服务器,并点击“删除”,可以删除选中的服务器。点击“添加”弹出“添加外部NTP服务器”窗口。点击“添加NTP服务器”,在空白栏中填写服务器地址,再点击“测试连接”,连接通过后点击Append,添加完成。许可证管理TDH默认有一个月的试用期,但过了试用期后,运行TDH需要许可证,TDHManager提供对许可证的一站式管理。选择顶部菜单栏的“管理”菜单,点击“许可证”,进入许可证管理页面。“概要”部分显示ServerKey、序列号和许可证服务三项内容,其中ServerKey回送的编码,许可证服务显示该服务的状态,用户可以点击“启动”开始这项服务,或者点击“停止”终止这项服务。“概要”下方有两个选项,点击“上传License”,用户可以通过粘贴文本或上传文件来上传自己的序列号和LicenseKey。点击“保存”,License即上传成功。用户可点击“查看LicenseKey”查看自己的LicenseKey。“详情”部分显示用户当前所使用产品的License情况,包括产品名称、License类型、节点容量、License截止日期。Guardian服务监控在管理菜单中选中Guardian:您会进入Guardian页面,这个页面中您可以对Guardian服务进行监控。Guardian服务管理Manager以及集群中的用户、用户组和角色以及它们的权限。如果您想要了解Guardian使用,请参考“用户管理”部分的内容。Guardian服务的角色包括:OpenLDAPServer,KerberosServer以及KadminServer。以下是Guardian服务的角色页面:您可以在这个页面查看Guardian服务各个角色的健康状况。您还可以启动(点击角色对的 图标)、停止(点击角色对应的图标)和删除(点击角色对应的图标)。Guardian服务的配置点击可以进入Guardian服务的配置页面:在这个页面您可以修改Guardian服务的相关参数。直接点击您要修改的参数的值便可以修改。修改完毕后您需要先点击来保存更改,然后点击页面右上的,在出现的下拉菜单点击“配置服务”。这样操作后,对Guardian服务参数的修改才会生效。Guardian服务操作的监控点击可以进入Guardian服务的操作监控页面:在这里您可以监控Guardian服务的历史操作。备份与恢复在管理菜单中选中“备份与恢复”:您会进入备份管理界面。在这个页面中,您可以:导出Manager数据:点击 ,Manager数据会自动下载到本地。导入Manager数据:通过导入Manager数据,您可以恢复某个之前备份的Manager。击 ,在弹出的窗口中选取本地的数据,然后点击“上传”。7.Zookeeper的运维7.Zookeeper的运维Zookeeper的运维ZooKeeper是一个分布式的,开源的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper服务的管理启动、停止、删除Zookeeper服务在“状态”主页面上,将鼠标移至ZooKeeper框的右上角,出现下拉菜单,您可以点击菜单栏中的选项启动、停止、删除该ZooKeeper服务。您也可以进入服务状态页面进行操作,有两种进入服务状态页面的方法:直接点击“状态”主页面上的ZooKeeper框选择顶部菜单栏中的“服务”,在下拉菜单中选择操作目标服务。在ZooKeeper服务状态页面的顶部有三个图标 ,点击启动服务,点击停止服务,击 删除服务。配置服务点击服务状态界面右上角的“更多操作”,在下拉菜单中点击”配置服务”,开始配置。ZooKeeper服务的监控CPU使用监控进入ZooKeeper服务状态页面,页面的最上端显示TDH上所有被管理节点的CPU使用率,将鼠标置于任意时间点上,都会显示该时间所在的5分钟内CPU的使用率。可以在时间轴上方设置时间轴尺度,默认为30分钟,可以选择1小时、2小时、6小时、12小时、1天、1周、30天,下图将时间轴尺度改为6小时一格。CPU使用率的时间轴上有一块矩形阴影部分,您可以通过拖动、拉伸、压缩该阴影部分来调节本服务状态页面中所有表格的时间,当您点击时间轴左边的“Now”时,阴影的最右端复位至时间轴最右段,即现在的时间。所有服务的状态页面均会显示CPU使用率。ZooKeeper概要信息监控在ZooKeeper服务状态页面的中间有一栏“ZooKeeper概要”,左边显示该ZooKeeper服务的最大延迟、最小延迟、平均延迟分别以淡蓝色线、绿线、深蓝色线表示,将鼠标放置在线的任意时间点上,都会显示该时间有关延迟的详细信息。“ZooKeeper概要”右边部分显示该ZooKeeper服务的领导节点和跟随节点。点击下方的“日志”,可进入日志页面进行查询,查询操作方法见5.2。ZooKeeper服务历史监控ZooKeeper服务状态页面左下方显示服务历史,并显示出每一条历史的级别、时间、分类、标题。ZooKeeper节点监控ZooKeeper服务状态页面左下方显示节点信息,包括CPU使用率、IP、主机名、所在机柜、核数、物理内存,并用五种颜色标识节点的CPU使用率的大小。ZooKeeper统计信息监控ZooKeeper服务状态页面右下方显示ZooKeeper统计信息,包括ZooKeeper接受数据包、ZooKeeper发送数据包、存在的连接、ZooKeeperOutstandingRequest。将鼠标放在任意一个表中的任意一个时间点,均会显示数据源、时刻、数值。内的时间键显示前后时间的信息。ZooKeeper服务的配置点击ZooKeeper您可以对Zookeeper的不同项目进行配置。配置ZooKeeper的角色点击ZooKeeper状态页面左边的菜单栏,选择“角色”选项,进入角色页面。删除角色

角色页面显示每个角色的角色名称、节点名称、机柜名称、服务链接、健康状况,并允许您对其进行启动、停止、删除和迁移操作。您还可以通过在搜索栏中输入关键词搜索角色。迁移角色

当您想要删除一个角色时,必须要先停止该角色,有些角色像DataNode和NodeManager在删除前最好能先将其退役。当您点击删除按键时,系统会弹出以下提示。从TDH4.3开始,大数据平台Manager支持Zookeeperserver的迁移。在一个角色后面点击便要重新启动以后,新的改动才能够被识别。在小于等于三个节点的集群上不能进行Zookeeperserver角色的迁移。下面我们演示将在tw-node127上的Zookeeperserver迁移到tw-node132上。点击tw-node127上的Zookeeperserver角色后的image::migrate.png[scaledwidth=120%]图标:系统会弹出以下提示:点击“继续”来选择迁移的目标节点,我们选择集群中的最后一个节点即tw-node132节点:点击“继续”进入自定义配置:在这里您可以自定义如图所示的三个参数,您也可以选择使用我们提供的默认值。完成配置后点击“继续”来更新依赖:集群中很多其他服务都依赖于Zookeeper,在您迁移了Zookeeperserver这些服务才能更新依赖。您可以选择在这一步就重启依赖于这个Zookeeper服务的服务(勾选“立刻重启收到影响的服务”),或者之后再手动重启所有该页面提到的服务。点击“完成”即可以让大数据平台Manager开始执行迁移:当该页面显示全部操作完成后点击“完成”退出,您可以看到原来在tw-node127上的Zookeeperserver已经成功迁移到了tw-node132上:修改ZooKeeper的配置点击ZooKeeper状态页面左边的菜单栏,选择“配置”选项,进入服务配置页面。服务配置页面显示所有配置项的名称、值、描述。您可以通过在搜索栏中输入关键词搜索某配置项。点击想要修改的配置的值,在栏中输入新值,并点击,完成修改;点击,修改无效,恢置的值恢复至默认值。增加自定义参数点击界面右上方的“+增加自定义参数”,弹出以下页面。在页面中输入属性、值、描述,点击“添加”,完成新增自定义参数。任何修改服务配置的操作都需要点击右上角的“保存更改”按钮才能被保存。Zookeeper的安全配置点击ZooKeeper状态页面左边的菜单栏,选择“安全”选项,进入安全配置页面。为了提高服务的安全级别,需要开启Kerberos。点击,弹出以下页面。输入KAdmin票据名、KAdmin密码,点击“确认”,完成开启。在开启kerberos前必须先配置Kerberos,配置方法请见附录A《配置Kerberos》。查看ZooKeeper操作点击ZooKeeper状态页面左边的菜单栏,选择“操作”选项,进入操作查看页面。可在页面上查看某段时间内的ZooKeeper操作,包括操作名称、状态、开始时间、结束时间、上下文。可以通过移动、拉伸、压缩页面上方时间轴上的方块阴影来调整所要查看的时间段。8.HDFS的运维8.HDFS的运维HDFS的运维Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为ApacheNutch搜索引擎项目的基础架构而开发的。HDFS是ApacheHadoopCore项目的一部分。HDFS服务的管理启动、停止、删除HDFS服务在“状态”主页面上,将鼠标移至HDFS框的右上角,出现下拉菜单,您可以点击菜单栏中的选项启动、停止、删除该HDFS服务。您也可以进入服务状态页面进行操作,有两种进入服务状态页面的方法:直接点击“状态”主页面上的HDFS框选择顶部菜单栏中的“服务”,在下拉菜单中选择操作目标服务。在HDFS服务状态页面的顶部有三个图标 ,点击启动服务,点击停止服务,点击 除服务。配置服务点击服务状态界面右上角的“更多操作”,在下拉菜单中点击”配置服务”,开始配置。HDFS服务的监控CPU使用监控进入HDFS服务状态页面,页面的最上端显示TDH上所有被管理节点的CPU使用率,将鼠标置于任意时间点上,都会显示该时间所在的5分钟内CPU的使用率。可以在时间轴上方设置时间轴尺度,默认为30分钟,可以选择1小时、2小时、6小时、12小时、1天、1周、30天,下图将时间轴尺度改为6小时一格。CPU使用率的时间轴上有一块矩形阴影部分,您可以通过拖动、拉伸、压缩该阴影部分来调节本服务状态页面中所有表格的时间,当您点击时间轴左边的“Now”时,阴影的最右端复位至时间轴最右段,即现在的时间。所有服务的状态页面均会显示CPU使用率。在HDFS服务状态页面的中间有一栏“HDFS概要”。当您选择“basic”项时,左边显示该HDFS显示该时间有关读写吞吐量的详细信息,包括数据源、时刻、值;右边显示HDFS包括已使用容量、剩余容量、可用的DataNodes、待备份数据块、损坏的数据块、预定备份数据块、数据块总数、备份中的数据块。当您选择“Namenode”选项时,左边显示名字节点堆使用率、事务处理平均时间,将将鼠标值;右边显示名字节点的信息,包括名称、挂载点、现役名字节点、备用名字节点。“HDFS概要”下边部分显示该HDFS服务的剩余分布式文件系统、活跃的字节比例。HDFS服务历史监控HDFS服务状态页面左下方显示服务历史,并显示出每一条历史的级别、时间、分类、标题。HDFS节点监控HDFS服务状态页面左下方显示数据节点的使用率,包括数据节点使用率、IP、主机名、所在机柜、核数、物理内存,并用五种颜色标识数据节点使用率的大小。HDFS统计信息监控HDFS服务状态页面右下方显示HDFS统计信息,包括数据块总数、损坏的数据块、待备份数据块、备份中的数据块、预定备份数据块。将鼠标放在任意一个表中的任意一个时间点,均会显示数据源、时刻、数值。内的时间键显示前后时间的信息。HDFS服务的配置点击HDFS状态页面左边的菜单栏,弹出完整的菜单栏。通过点击菜单栏中的不同选项,您可以对HDFS的不同项目进行配置。配置HDFS的角色点击HDFS状态页面左边的菜单栏,选择“角色”选项,进入角色页面。删除角色

角色页面显示每个角色的角色名称、节点名称、机柜名称、服务链接、健康状况,并允许您对其进行启动、停止和删除,迁移角色的操作。您还可以通过在搜索栏中输入关键词搜索角色。当您想要删除一个角色时,必须要先停止该角色,有些角色像DataNode和NodeManager在删除前最好能先将其退役。当您点击删除按键时,系统会弹出以下提示。NameNode的迁移点击NameNode后面的图标可以对NameNode角色进行迁移。点击迁移角色按键时,系统会弹以下提示选择想要迁移到的节点,在这里,由于tw-node127,tw-node128,tw-node129节点上都有NameNode的角色,所以只能将tw-node127的角色迁移到tw-node129节点上选择节点之后,可以自定义节点的属性,一共有dfs.datanode.data.dir,.dir,datanode.memory三个属性点击“继续”,会弹出“更新依赖”的界面,可以勾选“立即重启受到影响的服务”,也可以稍后手动重启这些服务,使得所做的变动生效修改HDFS的配置点击HDFS状态页面左边的菜单栏,选择“配置”选项,进入服务配置页面。服务配置页面显示所有配置项的名称、值、描述。您可以通过在搜索栏中输入关键词搜索某配置项。点击想要修改的配置的值,在栏中输入新值,并点击,完成修改;点击,修改无效,恢置的值恢复至默认值。增加自定义参数点击界面右上方的“+增加自定义参数”,弹出以下页面。在页面中输入属性、值、描述,点击“添加”,完成新增自定义参数。任何修改服务配置的操作都需要点击右上角的“保存更改”按钮才能被保存。HDFS的安全配置点击HDFS状态页面左边的菜单栏,选择“安全”选项,进入安全配置页面。为了提高服务的安全级别,需要开启Kerberos。点击,弹出以下页面。输入KAdmin票据名、KAdmin密码,点击“确认”,完成开启。查看HDFS操作点击HDFS状态页面左边的菜单栏,选择“操作”选项,进入操作查看页面。可在页面上查看某段时间内的HDFS操作,包括操作名称、状态、开始时间、结束时间、上下文。可以通过移动、拉伸、压缩页面上方时间轴上的方块阴影来调整所要查看的时间段。HDFS的维护点击HDFS状态页面左边的菜单栏,选择“维护”选项,进入维护页面。TDHManager允许您将名字节点恢复到新的节点,但您可能需要现将服务停止。点击“NameNode恢复”,弹出以下窗口。本向导将帮助恢复HDFS的NameNodes,向导包含以下几步:1.分配角色2.配置服务3.安装请根据您的需求对每一步做配置。9.YARN的运维9.YARN的运维YARN的运维ApacheHadoopYARN(YetAnotherResourceNegotiator,另一种资源协调者)是一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。TDHYARN是新一代资源管理框架,允许多个应用集群同时高效地运行在一个物理集群上。经改进后,成为真正的多应用程序平台,可服务于整个企业。YARN服务的管理启动、停止、删除YARN服务在“状态”主页面上,将鼠标移至YARN框的右上角,出现下拉菜单,您可以点击菜单栏中的选项启动、停止、删除该YARN服务。您也可以进入服务状态页面进行操作,有两种进入服务状态页面的方法:直接点击“状态”主页面上的YARN框选择顶部菜单栏中的“服务”,在下拉菜单中选择操作目标服务。在YARN服务状态页面的顶部有三个图标 ,点击启动服务,点击停止服务,点击 除服务。配置服务点击服务状态界面右上角的“更多操作”,在下拉菜单中点击”配置服务”,开始配置。YARN服务的监控CPU使用监控进入YARN服务状态页面,页面的最上端显示TDH上所有被管理节点的CPU使用率,将鼠标置于任意时间点上,都会显示该时间所在的5分钟内CPU的使用率。可以在时间轴上方设置时间轴尺度,默认为30分钟,可以选择1小时、2小时、6小时、12小时、1天、1周、30天,下图将时间轴尺度改为6小时一格。CPU使用率的时间轴上有一块矩形阴影部分,您可以通过拖动、拉伸、压缩该阴影部分来调节本服务状态页面中所有表格的时间,当您点击时间轴左边的“Now”时,阴影的最右端复位至时间轴最右段,即现在的时间。所有服务的状态页面均会显示CPU使用率。YARN概要信息监控在YARN服务状态页面的中间有一栏“YARN概要”,左上方为一个横坐标为时间、纵坐标为个数的表,显示正在运行的应用和等待中的应用,分别以淡蓝色线和绿色线表示。右上方显示已使用内存、剩余内存、已使用的核、剩余的核,并提供进入日志页面的链接:点击“日志”,可进入日志页面进行查询,查询操作方法见5.2。下方为一行表格,显示完成的应用(AppsCompleted)、失败的应用(AppsFailed)、运行中的容器(ContainersRunning)、活跃的节点(ActiveNodes)、退役的节点(Decommissioned)、丢失的节点(LostNodes)、不健康的节点(UnhealthyNodes)、重启的节点(RebootedNodes)的数量。YARN服务历史监控YARN服务状态页面左下方显示服务历史,并显示出每一条历史的级别、时间、分类、标题。YARN节点监控YARN服务状态页面左下方显示节点核使用率,包括节点核使用率、IP、主机名、所在机柜、核数、物理内存,并用五种颜色标识节点的CPU使用率的大小。YARN统计信息监控YARN服务状态页面右下方显示YARN统计信息,包括已使用内存、剩余的内存、已使用的核、剩余的核。将鼠标放在任意一个表中的任意一个时间点,均会显示数据源、时刻、数值。内的时间键显示前后时间的信息。YARN服务的配置点击YARN状态页面左边的菜单栏,弹出完整的菜单栏。通过点击菜单栏中的不同选项,您可以对YARN的不同项目进行配置。配置YARN的角色点击YARN状态页面左边的菜单栏,选择“角色”选项,进入角色页面。删除角色

角色页面显示每个角色的角色名称、节点名称、机柜名称、服务链接、健康状况,并允许您对其进行启动、停止和删除操作。您还可以通过在搜索栏中输入关键词搜索角色。当您想要删除一个角色时,必须要先停止该角色,有些角色像DataNode和NodeManager在删除前最好能先将其退役。当您点击删除按键时,系统会弹出以下提示。您还可以点击“服务链接”中的“Link”链接,查看角色的详细内容。比如,点击resourcemanager(tw-node127)的链接,弹出以下页面。添加角色您还可以添加角色:点击页面右上角的“+”,弹出以下页面。通过添加角色、配置角色,完成角色添加。resourcemanager角色的迁移从TDH4.3起,大数据平台Manager支持对resourcemanager色后的,会弹出以下的界面点击“继续”,会弹出“选择节点”的界面,在这里我们可以选择将resourcemanager移动到的节点位置选择节点之后,点击“继续”,进行自定义配置节点的属性配置好节点的属性之后,点击继续,会进入下一步“更新依赖”的操作,勾选“立刻重启受到影响的服务”,则受到影响的服务会被重启,角色的迁移变动也会生效修改YARN的配置点击YARN状态页面左边的菜单栏,选择“配置”选项,进入服务配置页面。服务配置页面显示所有配置项的名称、值、描述。您可以通过在搜索栏中输入关键词搜索某配置项。点击想要修改的配置的值,在栏中输入新值,并点击,完成修改;点击,修改无效,恢置的值恢复至默认值。增加自定义参数点击界面右上方的“+增加自定义参数”,弹出以下页面。在页面中输入属性、值、描述,点击“添加”,完成新增自定义参数。任何修改服务配置的操作都需要点击右上角的“保存更改”按钮才能被保存。YARN的资源管理点击YARN状态页面左边的菜单栏,选择“资源管理”选项,进入YARNSchedule配置页面。TDH提供两种调度器:CapacityScheduler、FairScheduler,您可以选择其中的一种。CapacityScheduler当您选择CapacityScheduler时,您可在全局配置中选择resourcecalculator的类型,并配置Queue。FairScheduler当您选择FairScheduler时,您可以进行全局配置、Queue配置和用户配置。在配置完资源管理之后,点击页面右上角“保存更改”,完成配置。YARN的安全配置点击YARN状态页面左边的菜单栏,选择“安全”选项,进入安全配置页面。为了提高服务的安全级别,需要开启Kerberos。点击,弹出以下页面。输入KAdmin票据名、KAdmin密码,点击“确认”,完成开启。在开启kerberos前必须先配置Kerberos,配置方法请见附录A《配置Kerberos》。查看YARN操作点击YARN状态页面左边的菜单栏,选择“操作”选项,进入操作查看页面。可在页面上查看某段时间内的YARN操作,包括操作名称、状态、开始时间、结束时间、上下文。可以通过移动、拉伸、压缩页面上方时间轴上的方块阴影来调整所要查看的时间段。10.Hyperbase的运维10.Hyperbase的运维Hyperbase的运维大数据平台Hyperbase是星环信息科技(上海)有限公司开发的实时在线事务处理引擎,是一个建立在ApacheHBase基础之上,融合了多种索引技术、分布式事务处理、全文实时搜索、图形数据库在内的实时NoSQL数据库。它也可以结合大数据平台Inceptor进行SQL查询。在本章节中,我们将概述HyperBase在TDHManager中的管理,监控以及简单的使用。Hyperbase服务的管理启动、停止、删除Hyperbase服务在“状态”主页面上,将鼠标移至Hyperbase框的右上角,出现下拉菜单,您可以点击菜单栏中的选项启动、停止、删除该Hyperbase服务。您也可以进入服务状态页面进行操作,有两种进入服务状态页面的方法:直接点击“状态”主页面上的Hyperbase框选择顶部菜单栏中的“服务”,在下拉菜单中选择操作目标服务。在Hyperbase服务状态页面的顶部有三个图标 ,点击启动服务,点击停止服务,击 删除服务。配置服务点击服务状态界面右上角的“更多操作”,在下拉菜单中点击”配置服务”,开始配置。Hyperbase服务的监控CPU使用监控进入Hyperbase服务状态页面,页面的最上端显示TDH上所有被管理节点的CPU使用率,将鼠标置于任意时间点上,都会显示该时间所在的5分钟内CPU的使用率。可以在时间轴上方设置时间轴尺度,默认为30分钟,可以选择1小时、2小时、6小时、12小时、1天、1周、30天,下图将时间轴尺度改为6小时一格。CPU使用率的时间轴上有一块矩形阴影部分,您可以通过拖动、拉伸、压缩该阴影部分来调节本服务状态页面中所有表格的时间,当您点击时间轴左边的“Now”时,阴影的最右端复位至时间轴最右段,即现在的时间。所有服务的状态页面均会显示CPU使用率。Hyperbase概要信息监控在Hyperbase服务状态页面的中间有一栏“Hyperbase概要”。当您选择“Basic”项时,左边显示该Hyperbase服务的发出的读请求、写请求,分别以深蓝色线、绿色线表示,将鼠标放置在线的任意时间点上,显示该时间有关读写请求的详细信息,包括数据源、时刻、值;右边显示liveregionservers、deadregionservers、totalregions的数目。当您选择“Masters”选项时,左边的界面不变;右边显示活跃节点和备用节点的分配情况。Hyperbase服务历史监控Hyperbase服务状态页面左下方显示服务历史,并显示出每一条历史的级别、时间、分类、标题。Hyperbase节点监控Hyperbase服务状态页面左下方显示每个节点的region数,包括region数、IP、主机名、所在机柜、核数、物理内存,并用五种颜色标识节点的CPU使用率的大小。Hyperbase统计信息监控Hyperbase服务状态页面右下方显示Hyperbase统计信息,包括CompactionQueueLength、FlushqueueLength、AverageLoad均会显示数据源、时刻、数值。内的时间键显示前后时间的信息。Hyperbase服务的配置点击Hyperbase状态页面左边的菜单栏,弹出完整的菜单栏。通过点击菜单栏中的不同选项,您可以对Hyperbase的不同项目进行配置。配置Hyperbase的角色点击Hyperbase状态页面左边的菜单栏,选择“角色”选项,进入角色页面。删除角色

角色页面显示每个角色的角色名称、节点名称、机柜名称、服务链接、健康状况,并允许您对其进行启动、停止和删除操作。您还可以通过在搜索栏中输入关键词搜索角色。当您想要删除一个角色时,必须要先停止该角色,有些角色像DataNode和NodeManager在删除前最好能先将其退役。当您点击删除按键时,系统会弹出以下提示。master角色的迁移点击master后面的图标可以对master角色进行迁移。点击迁移角色按键时,系统会弹出以提示点击继续,进而选择将要迁移到的节点位置选择要迁移的节点位置之后,会进入自定义配置的界面点击继续,进入到安全模式的界面,此时需要输入Kadmin的用户名和密码点击继续,进入更新依赖的界面,这里我们可以选择立刻重启还是稍后重启受到影响的服务部修改Hyperbase的配置点击Hyperbase状态页面左边的菜单栏,选择“配置”选项,进入服务配置页面。服务配置页面显示所有配置项的名称、值、描述。您可以通过在搜索栏中输入关键词搜索某配置项。点击想要修改的配置的值,在栏中输入新值,并点击,完成修改;点击,修改无效,恢置的值恢复至默认值。增加自定义参数点击界面右上方的“+增加自定义参数”,弹出以下页面。在页面中输入属性、值、描述,点击“添加”,完成新增自定义参数。任何修改服务配置的操作都需要点击右上角的“保存更改”按钮才能被保存。Hyperbase的安全配置点击Hyperbase状态页面左边的菜单栏,选择“安全”选项,进入安全配置页面。为了提高服务的安全级别,需要开启Kerberos。点击,弹出以下页面。输入KAdmin票据名、KAdmin密码,点击“确认”,完成开启。在开启kerberos前必须先配置Kerberos,配置方法请见附录A《配置Kerberos》。查看Hyperbase操作点击Hyperbase状态页面左边的菜单栏,选择“操作”选项,进入操作查看页面。可在页面上查看某段时间内的Hyperbase操作,包括操作名称、状态、开始时间、结束时间、上下文。可以通过移动、拉伸、压缩页面上方时间轴上的方块阴影来调整所要查看的时间段。11.Discover的运维11.Discover的运维Discover的运维Discover是基于内存的数据挖掘引擎。Discover服务的管理启动、停止、删除Discover服务在“状态”主页面上,将鼠标移至Discover框的右上角,出现下拉菜单,您可以点击菜单栏中的选项启动、停止、删除该Discover服务。您也可以进入服务状态页面进行操作,有两种进入服务状态页面的方法:直接点击“状态”主页面上的Discover框选择顶部菜单栏中的“服务”,在下拉菜单中选择操作目标服务。在Discover服务状态页面的顶部有三个图标 ,点击启动服务,点击停止服务,击 删除服务。配置服务点击服务状态界面右上角的“更多操作”,在下拉菜单中点击”配置服务”,开始配置。Discover服务的监控CPU使用监控进入Discover服务状态页面,页面的最上端显示TDH上所有被管理节点的CPU使用率,将鼠标置于任意时间点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论