管理Cloudera集群的主题足够广泛,因此不可能在一篇文章中进行介绍。 在本文中,我们将重点介绍有关解决与群集及其所安装的服务相关的最常见问题的说明,而对于更深入的探讨,我建议您参考官方文档和论坛。 在那里您可以找到几乎所有问题的信息。

集群启动
在Cloudera Manager主页上,单击集群名称右侧的带有箭头的按钮,然后选择“开始”:

集群重启
我们与上一段相同,然后选择“重新启动”。
集群停止
我们与上一段相同,然后选择“停止”。
启动服务角色
在Cloudera Manager主页上,单击“群集”按钮,然后在想要运行其角色的所需群集中选择服务:

转到此服务的“实例”选项卡:

服务角色在其名称的右侧具有状态。 停止角色对应于停止。 在表中,我们注意到需要启动的服务的角色:

单击“所选动作”,然后选择“开始”:

按下开始按钮以确认开始:

重新启动服务角色
重复上一段中的步骤,并在单击“选定的操作”按钮后选择“重新启动”。
停止服务角色
我们的操作与上一段相同,请在单击“选定的操作”按钮后选择“停止”。
添加角色
在Cloudera Manager主页上,单击“集群”按钮,然后在所需集群中选择需要为其添加角色的服务:

转到此服务的“实例”选项卡,然后单击“添加角色实例”:

对于要添加的角色,选择需要在其上安装主机的主机:

我们确认所选角色在指定主机上的安装:

角色删除
在Cloudera Manager主页上,单击“集群”按钮,然后在想要删除其角色的所需集群中选择服务:

转到此服务的“实例”选项卡:

我们注意到需要删除的角色(之前已停止了它们):

单击“所选操作”按钮,然后选择“删除”:

单击删除按钮确认删除:

添加服务
添加服务已在“安装其他Parsels”一节中进行了描述,因此我们将不再详细介绍此过程。
服务删除
在Cloudera Manager主页上,单击“集群”按钮,然后选择要删除的集群中的服务:

转到此服务的“实例”选项卡:

我们注意到其积极作用:

单击“所选动作”,然后选择“停止”:

按下“停止”按钮确认停止:

转到Cloudera Manager主页,单击要删除的服务名称右侧的带有箭头的按钮,然后选择“删除”:

单击删除按钮确认删除:

更改配置文件后重新部署服务
更改服务配置文件后,您将需要重新部署这些服务。 在这种情况下,带有箭头的文件符号将出现在相应服务的右侧。 点击它:

在右下角,单击“重新启动旧服务”:

我们通过单击右下角的立即重新启动来确认重新启动。 如果不需要扩展客户端配置,请删除此页面上的复选框:

重新启动页面显示可重新启动服务的状态。 如果配置不正确,请单击任务右侧的箭头,将提供错误详细信息。 重新启动完成后,单击完成:

配置监控工具
将主机添加到群集时,Cloudera Manager会在其上安装其代理,从而可以监视这些计算机的系统指标。 “所有主机\主机名”部分的“图表库”选项卡上提供了所收集的所有指标的图形。 Cloudera Manager还具有一种灵活的机制,用于基于SQL查询和过滤器来可视化指标,该机制使您可以轻松,快速地在主屏幕上创建一系列监视器,以提供相当完整的系统图片。 通过向主页添加系统指标之一的图形的示例来考虑这些机制。
在Cloudera Manager主页上,单击主机按钮,然后选择所有主机:

选择我们要添加其指标监视器的服务器:

选择其中一个图形,单击齿轮位于右上角的按钮,然后选择“添加到仪表板”(以同样的方式,您可以转到“图表库”选项卡,然后从完整目录中选择所需的图形):

指定图表的名称(默认情况下可以保留它),选择我们要放置其的面板(将其放置在Cloudera Manager主页上,选择主页),然后单击Save Chart:

之后,所选图表将出现在相应的面板上:

如有必要,可以通过单击右上角的齿轮按钮并在“图表生成器”中选择“打开”来更改添加的图表。
结论
设置监控后,Cloudera集群即可运行:您可以运行以下任务:加载数据,转换数据以及连接数据挖掘工具。 尽管实现最终目标还有很长的路要走,但可以将这一点视为起点。
作为该项目的结果,有可能实现所有目标:该部门员工用于计算信用风险因素的日常任务是自动化的,数据科学家获得了“高质量”的协作工具。 在实现这些目标的过程中,在以下几部分中,我也很高兴与您分享许多细微差别和困难时刻。 他们将致力于建立持续的集成以加速开发流程,以及安装和配置数据挖掘工具。
总之,我想说的是,使用围绕Apache Hadoop形成的应用程序堆栈并不总是那么简单,而是非常有趣的。 他们的技术带来了很多机会,并且已经在他们周围形成了一个相当大的社区,随时准备在困难时期提供帮助。 稍加练习,您就会成功。
PS在下一篇文章中,我将告诉您如何有效地组织CDH下开发项目的持续集成。 待会见!
链接到以前的文章:
数据湖概念中的分布式数据仓库:从哪里开始
Data Lake概念中的分布式数据仓库:安装CDH