[实战] 用数人云，部署弹性 ELK 集群就五步

摘要：本篇文章介绍了如何通过数人云部署一套标准的 ELK 日志收集系统。第一步，将主机组织成集群；第二步，发布 ElasticSearch 实例；第三步，发布 Kibana 实例；第四步，发布 Logstash 实例到待收集日志的应用 server ；第五步，快速扩展/减少 ElasticSearch , Kibana 实例数(可选)。

在具体介绍部署步骤前，让我们先来了解下 ELK 是什么。 ELK 是 ElasticSearch+Logstash+Kibana 的缩写， ElasticSearch 是一款基于 Lucene 的分布式搜索引擎，大名鼎鼎的 GitHub 就是由它提供的搜索。 Logstash 是一款分布式日志收集系统，是一个应用程序日志、事件的传输、处理、管理和搜索的平台，可以用来统一对应用程序日志进行收集管理，提供 Web 接口用于查询和统计。 Kibana 是一个基于浏览器页面的 ElasticSearch 前端展示工具，内置了各种查询和聚合操作，并拥有图形化展示功能。

我们知道，日志记录了各种重要信息，如应用程序的 log 记录的 error，warn 级别的 log，在量小的情况下，我们当然可以直接 vi+awk+sed+grep 定位原因，而当数量非常大，且需要各种聚合或基于多个异常关键词的组合搜索时，就是 ELK 大显身手的地方！可以说， ELK 是运维界的明星，非常适合应用级的实时监控和核心服务预警。

下面就让我们来看看如何通过数人云部署一套标准的 ELK 日志收集系统吧。

第一步，将主机组织成集群

首先，需要访问数人云注册并登录系统，然后进入主机的准备工作。假设有7台主机，这些主机可以是连接互联网的私有主机，也可以是阿里云、Ucloud、 AWS、Azure、首都在线、华为云等公有云上购买的任意一台云主机。这7台主机之间需要网络互通并能够访问外网。7台主机的规划及配置信息如下：
图片描述
然后，登录账户，在集群管理中，点击创建群组，填写集群名称（ elk ），选择 3 Master 集群，点击完成。添加主机后，如图点击右上角下拉菜单，选择添加主机。

点击已有主机下面的按钮 Ubuntu 或者 CentOS ，填写主机名称，并在主机上根据"连接主机"的提示进行操作。

选择主机组件：前 3 台主机( 10.3.10.9 [1-3] )为 Master 节点, 无可选组件；在添加主机 10.3.10.94 时需要将可选组件中的内部代理勾选上。
图片描述

登录到将要添加的主机终端

`ssh ubuntu@10.3.10.91        `

安装 Docker （若主机已安装 Docker ，这步可跳过）

`curl -sSL https://get.docker.com/ | sh         `

安装 Agent ：点击页面按钮，点击“生成命令”生成安装命令并粘贴到主机终端运行。

`sudo -H OMEGA_ENV=prod bash -c "$(curl -Ls https://raw.githubusercontent.com/Dataman-Cloud/agent-installer/master/install-agent.sh)" -s 92a0c8b287d34445b03f8518ce688e66    `

按提示执行以上两步后，点击"完成"即成功添加主机。

需要注意的是，由于数人云默认将加入集群的前3台机器作为 master 节点，为了符合前期规划，请确保主机10.3.10.91, 10.3.10.92, 10.3.10.93 首先被加入到集群中。同时，向同一集群添加的主机应存在于同一网段内，暂不支持跨公网的主机组建集群。此外，由于数人云在主机连接后会向主机上安装基础服务，所以主机需要一段时间进行初始化，依主机所处的网络环境，主机初始化的时间有所不同。

主机添加完成后，检查主机运行是否正常，如图：
图片描述

第二步，发布 ElasticSearch 实例

我们将通过数人云将 ES 的 Docker 镜像以 HOST 模式部署到我们规划的主机 10.3.10.95 和 10.3.10.96 上。具体操作如下：

选择"应用管理"中的"新建应用"，如图：
图片描述
新建 ES 应用：

填写应用名称： es
选择集群：elk
添加应用镜像地址：index.shurenyun.com/dataman/jdk7-elasticsearch-1.4.5
填写镜像版本：2015112811
网络模式：HOST 模式
主机选择：10.3.10.95,10.3.10.96
容器目录：容器内的挂载目录 /data/app/elasticsearch
主机目录：主机上的挂载目录 /data (该目录是我们主机数据盘所在的目录)
选择容器规格： CPU：0.8 内存：4096MB
容器个数：2 并且勾选 1 容器: 1 主机
高级设置：

添加应用地址：

 * 应用端口: 9200

* 类型: 对内

 *  协议: TCP

 * 地址: 10.3.10.94:9998

环境变量

 *  Key: CLUSTERNAME

 *  Value: dataman-es

环境变量

 * Key: ZOOKEEPER_ADDRESS

 * Value: 10.3.10.91:2181,10.3.10.92:2181,10.3.10.93:2181

填写完成后，点击创建。如图：

图片描述

第一次向集群部署 ES 时由于本地没有 Docker 镜像 index.shurenyun.com/dataman/jdk7-elasticsearch-1.4.5，集群需要大约 1-2 分钟去拉取镜像（可能更长时间）。我们可以在 ES 的应用详情页看到相应的状态，以及事件等。

第三步，发布 Kibana 实例

点击新建应用，新建 Kibana 应用：

填写应用名称: kibana
选择集群：elk
添加应用镜像地址：index.shurenyun.com/dataman/kibana
填写镜像版本：4.1.4
网络模式：网桥模式
选择主机: ALL
容器规格： CPU：0.2 内存：256 MB
容器个数：1

高级设置：

应用地址：

  * 应用端口: 5601

  * 类型: 对内

  * 协议: HTTP

  * 地址: http://10.3.10.94:5601

环境变量：

  * KEY: ELASTICSEARCH_URL

  * VALUE: http://10.3.10.94:9998

注：Kibana 需要通过环境变量 ELASTICSEARCH_URL 来确定 ElasticSearch 的地址，由于添加主机时我们已经设置内部代理的节点为10.3.10.94,并且在添加 ES 应用时将其端口映射到了内部代理端口 9998 , 所以这里我们只需要设置 ELASTICSEARCH_URL=http://10.3.10.94:9998 即可使得 Kibana 发现 ES 实例。

来到 Kibana 的应用详情页，若应用状态为运行中即应用已正常运行。
图片描述
打开浏览器，访问地址：http://10.3.10.94:5601（可能需要为你的浏览器设置内网代理），看到如下页面，则说明 kibana 应用已经成功运行。

第四步，发布 Logstash 实例到待收集日志的应用 server

点击新建应用，新建 Logstash 应用：

填写应用名称: logstash
选择集群：elk
添加应用镜像地址：index.shurenyun.com/dataman/logstash
填写镜像版本：2.1
网络模式：网桥模式
选择主机: 10.3.10.97

注：由于上面我们假设应用运行在了主机 10.3.10.97 上，所以这里我们限制 Logstash 在该主机上收集日志

主机/容器目录
- 数据挂载目录: /var/log/app
- 容器目录: /var/log/app

注：这里我们假设用户的应用（待采集日志的应用）日志存储在了主机目录 /var/log/app 下面。

容器规格： CPU：0.3 内存：256 MB
容器个数：1
高级设置：

CMD:

`logstash -e 'input { file { type => "linux-syslog" path => ["/var/log/app/*.log"]}} output { elasticsearch { hosts => "10.3.10.94:9998" }}'`

同样，等待 1-2 分钟后 Logstash 将被部署到应用 server 上并且开始收集日志，用户可以通过访问 Kibana 的页面来发掘相应的日志信息。

第五步，快速扩展/减少 ElasticSearch, Kibana 实例数(可选)

为了提高集群的资源利用率，我们可能需要根据负载来扩展或者减少 ElasticSearch , Kibana 等的实例数，在数人云的应用列表页或者应用详情页, 点击扩展按钮，即可快速调整相应应用的实例数。

通过前面的五步实战，大家都尝试了用数人云去部署 ELK 系统，总结来说，使用数人云去部署 ELK 主要有三大优势：第一，部署方便: 用户的应用无需任何改造，只需要提供日志的存储目录；第二，可扩展: 如果日志存储端( ElasticSearch )需要添加更多的实例，用户只需要向集群中添加更多的机器，并在应用列表页点击扩展相应的 ELK 即可；第三，安全: 用户应用的所有日志数据都存储在了集群内网的 ES 服务集群中。

[实战] 用数人云，部署弹性 ELK 集群就五步

第一步，将主机组织成集群

第二步，发布 ElasticSearch 实例

第三步，发布 Kibana 实例

第四步，发布 Logstash 实例到待收集日志的应用 server

第五步，快速扩展/减少 ElasticSearch, Kibana 实例数(可选)

优云数智

引用和评论

解析 | openshift源码简析之pod网络配置(下）

数据库的下一场革命：S3 延迟已降至原先的 10%，云数据库架构该进化了

在 ApeCloud （云猿生数据）实习是怎样的体验？跟行业大佬练技术修为的一年小记

阿里云 ESA 游戏行业解决方案｜安全防护、加速、低延时的技术融合

基于 KubeBlocks 的 PikiwiDB(原Pika) 云化下一站

Linux系统安装更新Python3.x版本详细步骤

K3s + KubeSphere + DeepSeek 全流程部署指南：轻量 K8s 与 AI 大模型私有化实践

[实战] 用数人云，部署弹性 ELK 集群就五步

第一步， 将主机组织成集群

第二步，发布 ElasticSearch 实例

第三步， 发布 Kibana 实例

第四步， 发布 Logstash 实例到待收集日志的应用 server

第五步， 快速扩展/减少 ElasticSearch, Kibana 实例数(可选)

优云数智

引用和评论

解析 | openshift源码简析之pod网络配置(下）

数据库的下一场革命：S3 延迟已降至原先的 10%，云数据库架构该进化了

在 ApeCloud （云猿生数据）实习是怎样的体验？跟行业大佬练技术修为的一年小记

阿里云 ESA 游戏行业解决方案｜安全防护、加速、低延时的技术融合

基于 KubeBlocks 的 PikiwiDB(原Pika) 云化下一站

Linux系统安装更新Python3.x版本详细步骤

K3s + KubeSphere + DeepSeek 全流程部署指南：轻量 K8s 与 AI 大模型私有化实践

第一步，将主机组织成集群

第三步，发布 Kibana 实例

第四步，发布 Logstash 实例到待收集日志的应用 server

第五步，快速扩展/减少 ElasticSearch, Kibana 实例数(可选)