afterBulk() метод

Katja · March 29, 2017, 11:12am

Здравствуйте, подскажите, пожалуйста, с таким вопросом. Я индексирую документы с помощью BulkProcessor. У меня такой user case:

"An application has critical data and might decide to stop passing requests to bulk processor until the Elasticsearch cluster is up again."

Я нашла, что можно добавить в afterBulk() метод request.waitForActiveShards(). Но я неуверенна, достаточно ли этого. Спасибо и мой метод:

@Override
public void afterBulk(long executionId,
BulkRequest request,
Throwable failure) {
logger.warn("There is a problem with the burk request", failure);
request.waitForActiveShards();
}

dadoonet · March 29, 2017, 1:36pm

I moved your question

Igor_Motov · March 29, 2017, 1:56pm

Где вы это нашли?

Katja · March 29, 2017, 2:49pm

В методах, которые можно вызывать на объекте request. Теперь понимаю, что это неправильно. Остановилась на следующем, что в методе afterBulk() добавляю request: bulkProcessor.add(request). А потом уже в своей программе жду долго, а потом закрываю bulkProcessor. Но как остановить добавление документов в bulkProcessor не знаю, если в предыдущем bulk возникает ошибка.

Igor_Motov · March 29, 2017, 5:12pm

Ну так вопрос в том, от чего возникла эта ошибка. Если она произошла потому, что сервер перегружен, то BulkProcessor эти ошибки перехватывает и реагирует в соответствии с BackoffPolicy. Если индекс не доступен, то запрос на индексирование будет ждать пока праймари не появится или свалиться по таймауту. Во всех остальных, ошибка скорее всего возникла из-за того, что проблема с самой записью. То есть добавляет ее снова и снова не имеет смысла.

Katja · March 30, 2017, 7:31am

Спасибо. По-моему ошибка возникла из-за java.lang.OutOfMemoryError: Java heap space. Поэтому индекс был недоступен. Попробую дать es больше памяти. Я правильно поняла, что я в afterBurk() могу поймать ошибки. А "to stop passing requests to bulk processor until the Elasticsearch cluster is up again" не получится.

Igor_Motov · March 30, 2017, 12:42pm

Теоретически, можно запрашивать state индекса время от времени и перестать добавлять новые записи в BulkProcessor до тех пор, пока индекс не позеленеет. Вопрос в том, где эти записи в это время держать? Если у вас есть очередь какая-нибудь перед elasticsearch, то можно держать из в это очереди, туда же можно добавить записи из afterBulk, если вы уверены, что имеет смысл их еще раз попытаться проиндексировать.

Katja · March 31, 2017, 1:35pm

Спасибо.

Topic		Replies	Views
BulkProcessor never executing AfterBulk Elasticsearch	1	651	August 9, 2019
Java application using BulkProcessing hangs if elasticsearch hangs Elasticsearch	8	4657	September 16, 2016
BulkProcessor pest practices Elasticsearch	1	2531	April 24, 2015
Bulk update with java API Elasticsearch	2	2511	July 12, 2015
Send a blocking bulk index request via the Elasticsearch Java client (8.9) Elasticsearch	2	838	August 17, 2023

afterBulk() метод

Related topics