Elasticsearch监控变得简单

通过了解有关群集状态,节点和分片详细信息,JVM统计信息等的详细信息来监控Elasticsearch群集性能。

安装并配置Elasticsearch插件以监视开源,分布式文档存储和搜索引擎。它在很大程度上取决于Apache Lucene,它是Java中的全文搜索引擎。密切关注Elasticsearch环境的性能,以确保您了解工作集群的内部结构。

本文档详细介绍了如何配置Elasticsearch插件和监控指标,以深入了解Elasticsearch集群的性能,可用性和使用情况统计信息。

Elasticsearch性能监控指标:

使用我们广泛的指标,并获得需要您注意的危险错误的通知。通过我们的指标图表跟踪意外趋势,并尽快排除故障。我们支持的各种开箱即用指标包括:

活动分片

active_shards表示群集中主分片的数量。这是所有指数的总计

初始化分片

initializing_shards是新创建的分片数

节点/数据节点数

群集中的节点/数据节点的数量分别由度量number_of_nodes和number_of_data_nodes表示。数据节点保存数据并执行与数据相关的操作,例如CRUD,搜索和聚合

重新定位碎片

relocating_shards是当前从一个节点移动到另一个节点的分片数

活动主分片

active_primary_shards是所有索引中所有分片的总计,包括副本分片

未分配的分片

从初始化位置开始,当主节点开始将分片分配给集群中的节点时,分片将移至未分配状态。unassigned_shards存在于集群状态,但在集群本身中找不到。长时间处于未分配的位置可能是对不稳定群集的警告

群集状态

群集的状态由红色表示:0,绿色:1和黄色:2。绿色的群集状态表示分配了所有主分片和副本分片。黄色表示至少一个副本分片未分配或丢失。群集状态为红色表示尚未分配一个或多个主分片

JVM指标

Elasticsearch在Java虚拟机(JVM)上运行,并且它在节点上使用RAM的方法之一是通过JVM堆。度量标准jvm_mem_pool_old_used_perc是垃圾收集(GC)中旧节点的每个节点的JVM内存使用量(百分比)的平均值。度量标准jvm_gc_old_coll_time和jvm_gc_old_coll_count给出自上次轮询以来所有节点中的GC时间(以毫秒为单位)和旧生成计数(默认为5分钟)

内存和CPU使用率

由于Elasticsearch依赖于它所安装的机器,因此监控CPU和内存使用情况至关重要。监视每个节点类型的CPU使用情况有助于研究节点之间的工作负载分布。包括free(mem_free),used(mem_used),shared(shared_mem),驻留(resident_mem),总虚拟内存(virtual_mem)在内的度量标准有助于密切关注内存使用情况并了解它如何加载和影响集群

这个怎么运作?

先决条件:

  • 确保Elasticsearch已安装在服务器中并且已启动并正在运行
  • 在安装Elasticsearch插件时,在“elasticsearch”目录下创建一个空的JSON文件“counter.json”

Elasticsearch插件安装:

  • 在Site24x7 Linux代理插件目录下创建一个名为“elasticsearch”或“elasticsearchcluster”或“elasticsearchnodes”的目录 - / opt / site24x7 / monagent / plugins /
  • sudo mkdir elasticsearch
    或者
    sudo mkdir elasticsearchcluster
    或者
    sudo mkdir elasticsearchnodes
  • 仅对于elasticsearch插件,在路径中创建一个空的JSON文件“counter.json” - / opt / site24x7 / monagent / plugins / elasticsearch
  • 从我们的GitHub存储库下载elasticsearch.pyelasticsearchcluster.pyelasticsearchnodes.py,并将它分别放在“elasticsearch”,“elasticsearchcluster”或“elasticsearchnodes”目录下
  • sudo wget https://raw.githubusercontent.com/site24x7/plugins/master/elasticsearch/elasticsearch.py
    或者
    sudo wget https://raw.githubusercontent.com/site24x7/plugins/master/elasticsearchcluster/elasticsearchcluster.py
    或者
    sudo wget https://raw.githubusercontent.com/site24x7/plugins/master/elasticsearchnodes/elasticsearchnodes.py
  • 插件脚本中给出的默认python路径是#!/ usr / bin / python。如果您希望提供备用python路径,请替换前面带有shebang字符“#!”的现有路径。
  • 更改HOST,USERNAME,PORT,PASSWORD的值以匹配您的配置。默认情况下,未配置代理。如果需要,请更改代理设置
  • 服务器代理将在Site24x7 Web客户端的“插件”选项卡下报表有关Elasticsearch集群性能的统计信息。如果该插件未在Site24x7 Web客户端中列出,请重新启动该代理
  • sudo /etc/init.d/site24x7monagent restart

监控其他指标:

  • 要监控其他指标,请编辑“elasticsearch.py​​”或“elasticsearchcluster.py”或“elasticsearchnodes.py”文件,并添加需要监控的新指标
  • 增加这些文件中的插件版本值以查看新添加的度量标准(例如,将默认插件版本从PLUGIN_VERSION =“1”更改为“PLUGIN_VERSION =”2“)

相关插件:

可信

世界领先的公司

客户

没有Site24x7帐户?立即注册