Перестал работать мониторинг кластера

KOTOXJle6 · November 15, 2020, 9:49pm

Добрый день.

Несколько дней назад заметил что в кластере перестали отображаться данные. Появляется стандартное окно

При попытке включить self monitoring говорит что данных нет

При этом индексы существуют

Я уже пробовал и через Metricbeat получать данные, но там такая же проблема, при этом индексы создаются и судя по их размеру информация в них в порядке. С местом проблем нет, данные в остальные индексы приходят. Если смотреть состояние кластера через Dev Tools, показывает что кластер зеленый. Свободные шарды есть. В логе /var/log/elasticsearch/cluster нет ошибок, ворнингов тоже.
Перед возникновением пробелмы вроде ничего не менял, кроме изменения политики Index Lifecycle Policy, но она вроде бы не должна влиять на доступность мониторинга.

ES и KIbana 7.9.1.

Уже третий день пытаюсь победить эту проблему, но ничего не получается. Подскажите пожауйста, с чем это может быть свзяано?

raya · November 17, 2020, 6:57pm

Здравствуйте,
Вы поверили что индекс патерны на месте?
Kibana не работает без них.
Иногда возобновить их помогает ситуации.

Raya

Sergei_Frolov · November 18, 2020, 3:44pm

А если в мониторинге выбрать диапазон побольше? Иногда помогает, если выбрать последние 24 часа.

Chingis_D · November 18, 2020, 6:23pm

Проверьте что аккаунт/роль с которыми кибана используется с эластиком имеет достаточно привилегий для мониторинга

KOTOXJle6 · November 20, 2020, 6:20am

Паттерны или индексы? В паттернах есть два дефолтных, остальные мои

В самих индексах заметил что после попыток включить metricbeat, включить и выключить мониторинг, индексы мониторинга перестали создаваться. Создаются только индексы по мониторингу Kibana

KOTOXJle6 · November 20, 2020, 6:27am

Некоторое время назад при выборе диапазона на 7 дней, чтобы в него попадали имеющиеся индексы .monitoring-es*, открывалась статистика вот в таком виде

При попытке поменять диапазон начинала появляться ошибка в правом нижнем углу:

Monitoring Request Failed

Unable to find the cluster in the selected time range. UUID: VdZPYWRCT8eMvjFOpWB6Lw

HTTP 404

Но при этом состояние ноды можно было отследить в наличию IP-адреса. Если он был, значит нода активна, если нода перезагружалась, то в реальном времени адрес менялся на N/A и было видно что роль мастера переходит на другую ноду.

Сейчас при входе на эту страницу, независимо от выставленного диапазона, появляется вот такая ошибка

Monitoring Request Error

[illegal_argument_exception] unknown type for collapse field `cluster_uuid`, only keywords and numbers are accepted (and) [illegal_argument_exception] unknown type for collapse field `cluster_uuid`, only keywords and numbers are accepted (and) [illegal_argument_exception] unknown type for collapse field `cluster_uuid`, only keywords and numbers are accepted: Check the Elasticsearch Monitoring cluster network connection or the load level of the nodes.

HTTP 400

KOTOXJle6 · November 20, 2020, 6:45am

Тоже думал что что-то не так с правами, но вроде бы всё в порядке.

Chingis_D · November 20, 2020, 1:37pm

Как я понял у вас нет отдельного кластера для мониторинга, т.е. вы включаете мониторинг на главном кластере (для логов)

У вас есть выделенные ноды для мастеров? Есть что-нибудь в логах мастера при включении/выключении мониторинга через API как описано здесь: Monitoring interface unable to find the cluster

KOTOXJle6 · November 21, 2020, 1:31pm

Спасибо, кажется получилось.

Выделенных нод нет, в логах только событие включения/выключения мониторинга.

Я попробовал отключить шифрование в кластере. После этого мониторинг стал работать, но только при нажатии на кнопку Setup with Metricbeat, при этом на странице появлялась ошибка

Monitoring Request Error
[illegal_argument_exception] Text fields are not optimised for operations that require per-document field data like aggregations and sorting, so these operations are disabled by default. Please use a keyword field instead. Alternatively, set fielddata=true on [logstash_stats.logstash.uuid] in order to load field data by uninverting the inverted index. Note that this can use significant memory.: Check the Elasticsearch Monitoring cluster network connection or the load level of the nodes.
HTTP 400

Я попробовал по совету из последней статьи поменять таймаут с 30 секунд на 15

PUT _cluster/settings
{
  "persistent": {
    "xpack.monitoring.collection.cluster.stats.timeout": "15s"
  }
}

и после этого всё стало работать как раньше.

Относительно проблемы, которая была с мониторингом в первом посте, я подумал что может быть это как-то связано с тем что у меня имя ноды-координатора и кибаны, которые находятся на одном хосте, совпадают. Хочу попробовать поменять имена и настроить шифрование ещё раз.

Chingis_D · November 22, 2020, 4:21pm

поменять таймаут с 30 секунд на 15

Т.е. он у вас был выставлен на 30с до этого? Звучит странно, т.к. вы уменьшили его в этом случае. У параметра 10с по умолчанию, его повышение с 10 до 15 звучит логично для разрешения проблемы.

Если все так и было (повышение с дефолтных 10 до 15с решило проблему) - признак того что ваш мастер перегружен. Советую перейти на выделенные мастер ноды.

system · December 20, 2020, 4:21pm

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.

Topic		Replies	Views
Monitoring data not showing up in kibana Kibana	34	5491	June 18, 2019
Kibana monitor index exists, but dashboard says "No Monitoring Data Found" Kibana	3	3696	September 7, 2017
Monitoring issue Kibana elastic-stack-monitoring	2	639	February 10, 2021
Not seeing any data in the monitoring tab Kibana elastic-stack-monitoring	47	2113	June 8, 2019
Monitoring interface unable to find the cluster Kibana elastic-stack-monitoring	16	10425	December 12, 2018

Перестал работать мониторинг кластера

Related topics