Приоритет обновления cluster state

Denis_Lamanov · August 5, 2020, 7:16am

Добрый день!
Заметил, что если остановить запись в кластер и начать удалять большое количество больших индексов(через wildcard), то это так напрягает дисковую подсистему, что cluster state обновляется с timeout и из-за этого вылетают ноды(мастер их отсоединяет).
Можно ли сделать приоритет обновления cluster state максимальным?

Igor_Motov · August 5, 2020, 12:37pm

Странно. Какая у вас OS и файловая система?

Denis_Lamanov · August 5, 2020, 3:02pm

CentOS 7.7, Ext4, Elasticsearch 7.8.0

Утилизация диска на одной из нод в течение суток

Во время удаления индексов

Igor_Motov · August 5, 2020, 3:54pm

Ужас какой. Сколько шард в этих индексах, которые вы за один раз удаляете?

Denis_Lamanov · August 5, 2020, 7:07pm

7 шард, по одной на ноду + 1 реплика, т.е. всего 14
Удаляю индексы за месяц, т.е. 31 индекс
Размер одного индекса в среднем 350 Гб

Кстати, такое поведение началось с 7.0. В 5,6-ой версиях таких проблем не было
Правда тогда таких больших индексов не было

Igor_Motov · August 5, 2020, 7:42pm

Я спросил разработчиков, работающих над публикацией состояния кластера. Посмотрим, что они скажут.

Пока могу только посоветовать, увеличить размер индекса или удалять чаще (каждый день, или раз в неделю, например).

Denis_Lamanov · August 6, 2020, 1:31pm

Спасибо, ждём ответа и пока будем удалять 1 индекс в день. Возможно настроим ILM

Igor_Motov · August 6, 2020, 1:54pm

Разработчики спрашивают про сообщения в логах, с которыми master выкинул узлы. Например, что-нибудь вроде

node [...] is lagging at cluster state version [...], although publication of cluster state version [...] completed [...] ago

Denis_Lamanov · August 6, 2020, 2:46pm

Именно так. Вот лог с мастера сразу после начала удаления индексов
"файл удалён"

Igor_Motov · August 6, 2020, 3:11pm

Разработчики были удивлены медленным I/O и сказали, что можно увеличить cluster.follower_lag.timeout. По умолчанию он 90 сек, и если у вас узлы за это время с состоянием кластера не справляются их выкидывают из кластера, что у вас и происходит.

Denis_Lamanov · August 6, 2020, 3:14pm

Установить именно на мастер нодах?

Igor_Motov · August 6, 2020, 3:18pm

Да..

Denis_Lamanov · August 6, 2020, 3:35pm

Спасибо, установил, на днях ещё буду удалять индексы по маске и отпишусь

Topic		Replies	Views
Cluster takes too long to apply cluster state Elasticsearch	26	1880	June 6, 2023
Elasticsearch cluster data nodes are being removed from cluster by timeout Elasticsearch	17	1469	October 14, 2021
7.3.2 и потеря мастера Вопросы на русском языке	72	2874	October 29, 2019
Data node constantly dropping out of the cluster Elasticsearch	18	7415	September 4, 2019
Elasticsearch global state file Elasticsearch	17	3363	May 9, 2019

Приоритет обновления cluster state

Related topics