Lucene Merge Thread в hot threads

У человека такая же ситуация: [6.8.2] Unusual Server Load

Проанализировал разницу между нагрузкой на нодах. CPU и диски загружены одинаково. Раница существенная в Load Average и Context switсhes. На высоконагруженной ноде всё в среднем в 2-2.5 раза больше.
Могу прислать hotthreads со всех нод

Присылайте, посмотрим.

Hot threads(hot_threads?threads=9999) для всех нод:

node00 https://gist.github.com/UkrZilla/712778936148e697a156d13086504931
node01 https://gist.github.com/UkrZilla/a72e39456acdf5024bcc7d9529318878
node02 https://gist.github.com/UkrZilla/607ac7f8475068d4e0941c9dac57907f
node03 https://gist.github.com/UkrZilla/c606d7b7bf469c61abfd349d9a579aff
node04 https://gist.github.com/UkrZilla/56fea57082e788ccc311b80f6bc0c91f
node05 https://gist.github.com/UkrZilla/29202c6ef0095ba79f8548559534669b
node06 https://gist.github.com/UkrZilla/d2d6b5de1de7f7f273ea56208bb625fa

Высоконагруженная нода: node04 - Load Average на графике красным

Как у вас распределены шарды индекса gameplay.raid.globalevents_201908_1?

Извиняюсь что картинкой

image

Странно, нагрузка в основном наблюдается от операции merge на этом индексе. Но вроде он нормально распределен. Это физическое железо или виртуалки?

Довольно мощное железо. Хм, отключили запись этого лога и вот что получилось. И это уже более менее приемлимо. Кстати globalevents_201908_1 - индекс в который на тот момент не велась запись. 1 - номер недели с 0