Влияние Named Queries на производительность

IvanTushin · June 10, 2019, 12:49pm

Добрый день! Я хочу использовать в своих запросах Named Queries, однако протестировав на небольшом запросе, я заметил почти двукратное снижение производительности. (90-150 мс против 200-300мс с именованными запросам). Сразу скажу, что выборка идет по prefix, возвращается 50 элементов.

Я нашел тему на форуме где столкнулись с таким же поведением, однако ответа на вопрос там не содержится.

Можете объяснить/подтвердить замедление поиска с использованием Named Queries?

Igor_Motov · June 10, 2019, 6:15pm

А сколько у вас этих именованных под-запросов в одном запросе? Пример не покажете?

IvanTushin · June 10, 2019, 6:40pm

Вот запрос: https://gist.github.com/tushinivan/972cde9918f779047010a4b0c5cd6576

Мне почему-то кажется, что использование Named Queries отключает какую-нибудь оптимизацию, например, без них, если документ попал по какому-нибудь условию дальнейшая проверка не идет, а с Named Queries продолжается проверка всех условий, что бы вывести весь список по которым подошел документ.

Igor_Motov · June 10, 2019, 8:35pm

Какая версия?

IvanTushin · June 11, 2019, 5:14am

6.4.3

Igor_Motov · June 11, 2019, 1:05pm

Хранение запроса, который совпал для каждой записи, конечно, добавляет нагрузку, но увеличение времени исполнения в два раза - это как-то странно. Сколько записей этот запрос находит и как время исполнения меняется если заменить самый первый should на filter?

IvanTushin · June 12, 2019, 4:58pm

Если заменить первый should на filter, то запрос выдает 0 результатов за хорошее время.

Но отказаться от корневого should невозможно, т.к. таким образом мы даем пользователям возможность объединять сохраненные настройки поиска, однако после поиска понять из какого именно запроса пришли документы сложно, поэтому мы рассматриваем возможность использовать Named Queries.

Igor_Motov · June 12, 2019, 5:22pm

Я не заметил что там два подзапроса. А если помесить этот верхний bool в другой bool с filter? Я просто хочу понять, какую нагрузку несет вычисление _score по сравнению с хранением имен.

IvanTushin · June 12, 2019, 5:59pm

По результатам 10 выборок среднее время практически не изменилось. Разница в 11 мс.

Я подумал, что до этого я испытывал только на простом запросе и может быть Named Queries добавляет 150 мс и это не критично, однако, сейчас я провел испытание с тяжелыми запросами и понял, что время исполнения увеличивается пропорционально количеству условий. Вот результаты которые я получил:

С Named Queries
28706 мс
22298 мс
22247 мс
24341 мс
24970 мс
avg: 24512,4 мс

Без Named Queries
15025 мс
14019 мс
14280 мс
14609 мс
10606 мс
avg: 13707,8 мс

Я понял, что для нас это неприемлемо и можно считать вопрос закрытым. Однако, я готов оказать помощь если захотите понять почему так происходит.

Igor_Motov · June 13, 2019, 2:57pm

Есть еще несколько вопросов. Это одна нода или этот индекс распередлен? Сколько в нем шард? Как ноды сконфигурированы? Какой диск, RAM и heap для elasticsearch?

IvanTushin · June 14, 2019, 5:53am

Индекс распределен по 4 нодам, конфигурация одинаковая для всех нод:

Процессор|E3-1230v6 3.5-3.9ГГц (4 ядра)
Оперативная память|64Гб
Диск 1|2000Гб NVMe
Heap для elasticsearch: 32Гб

В индексе 6 шард и 1 реплика. Все остальные параметры и конфигурация по умолчанию.

Topic		Replies	Views
Named queries slowing down searches Elasticsearch	3	1232	April 4, 2016
Performance impact of "named-queries" Elasticsearch	0	568	March 20, 2024
Named query performance degradation after upgrading to 8.13.2 (from 8.7.1) Elasticsearch docker	3	335	May 13, 2024
Questions about Named Queries Elasticsearch	2	712	July 28, 2016
Профилирование запроса Вопросы на русском языке	18	2228	March 22, 2018

Влияние Named Queries на производительность

Related topics