Как правильно переиндексировать индекс?

stanleer · December 9, 2015, 9:13am

Если стоит задача полной переиндексации большого по объему данных индекса, то как правильно это сделать?
Не удалять же старый и создавать новый.

Igor_Motov · December 9, 2015, 1:43pm

Существует несколько способов. Начните с изучения документации и этого блога. Если будут конкретные вопросы - спрашивайте.

stanleer · December 9, 2015, 3:31pm

так я тему создал с учетом что подскажут лучшее решение а не множество.
Мне главное чтобы простоя между обновлениями не было.
Сейчас протестировал индекс на 50к записей, он заполнялся 25минут.

Igor_Motov · December 9, 2015, 3:48pm

Лучшее для чего? Лучшее это понятие очень относительное. Оба способа, которые я привел - лучшие только для разных случаев. Если вы можете описать свою ситуацию подробнее, то можно будет порекомендовать что-то конкретнее.

stanleer · December 10, 2015, 8:30am

пока приоритет на скорость

Igor_Motov · December 10, 2015, 2:21pm

Скорость самого процесса индексирования? Каким образом Вы это делаете в данный момент? Где узкое место? CPU? Диск? Или машина не перегружена, но все равно медленно? Сколько машин в кластере и на сколько это все должно быть прозрачно для пользователей?

stanleer · December 11, 2015, 1:56pm

Пока 1 машина
документы добавляю с помощью прослойки elastica по одному документы и потом делаю обновление индекса.

Скорость мне кажется слишком малой по сравнению с тем же sphinx.
Я же привел пример - 50к записей за 25 минут. Т.к. в эластике еще слабоват, то не знаю нормально это или плохо.

Igor_Motov · December 11, 2015, 5:53pm

Теперь понятно. Надо начать с того, что переключиться с индексирования по одному документу на bulk и перестать так часто обновлять индекс. Elasticsearch может обрабатывать несколько параллельных запросов bulk одновременно, если ваше приложение это позволяет. Если после этого будет все равно медленно, то надо будет смотреть где медленно и ускорять, но тут уже многое зависит от вашей системы и версии elasticsearch.

stanleer · December 13, 2015, 10:17pm

Спасибо, попробую пакетную индексацию.
На этапе разработки приходится переделывать индекс. В это время основная работа с переиндексацией, а потом это будет редко делаться..

stanleer · December 14, 2015, 9:39am

Пакетная индексация помогла, теперь все происходит за 19с )

Topic		Replies	Views
Cкорость индексации Вопросы на русском языке	7	2761	July 6, 2017
Many small indices vs one large index? Elasticsearch	10	5455	July 6, 2017
Низкая скорость индексации Вопросы на русском языке	3	1473	December 2, 2017
How to reindex ElasticSearch quickly? Elasticsearch	14	4328	July 6, 2017
Увеличение времени выполнения поисковых запросов при Bulk Insert Вопросы на русском языке	6	1257	July 6, 2017

Как правильно переиндексировать индекс?

Related topics