Правильно ли я использую script?

IvanTushin · December 30, 2019, 7:08am

Добрый день! У меня есть порядка 45 тыс. поисковых запросов (это шаблоны поиска сохраненные нашими пользователями)

Я хотел загрузить их в es и использовать search template для выполнения, однако, вставив порядка 13 тыс. скорость вставки сильно упала, и логика мне подсказывает, что я делаю что-то не правильно.

Предназначено ли скриптовое хранилище под такое количество данных?

Igor_Motov · December 30, 2019, 2:23pm

Скажем так, на такой объем мы не рассчитывали. Хотелось бы узнать, какая цель хранение этих запросов как шаблонов?

IvanTushin · December 30, 2019, 3:10pm

Я планировал использовать их для отслеживания изменений в индексах. Т.е. по ним идет цикл и проверяет наличие новых данных, а что бы не тащить все данные за все время подставляются некоторые даты и параметры.

Igor_Motov · December 30, 2019, 4:03pm

Вы на перколятор не смотрели?

IvanTushin · December 30, 2019, 4:23pm

Конечно смотрел, но структура подразумевает дочерне родительские отношения документов, поичем дочерние документы появляются гораздо позже. Все это не позволяет мне пользоваться перколятором.

Igor_Motov · December 30, 2019, 4:25pm

Это вы где такое нашли?

IvanTushin · December 30, 2019, 5:32pm

Я еще раз ознакомился с документацией, действительно, там ничего не сказано про это. Однако есть

At search time, the document specified in the request gets parsed into a Lucene document and is stored in a in-memory temporary Lucene index.

Как это работает с запросами содержащими has_child запросы?

Во вторых, для дочерних документов я исключаю текстовые поля из _source из-за их большого размера, так что извлечь их через GET не получится. Я сейчас говорю про пример который позволяет указать id документа из другого индекса.

GET /my-index/_search
{
    "query" : {
        "percolate" : {
            "field": "query",
            "index" : "my-index",
            "id" : "2",
            "version" : 1 
        }
    }
}

Igor_Motov · December 30, 2019, 6:02pm

Понял, если под "структурой" подразумеваются ваши запросы, то с запросами с has_child и has_parent действительно работать не будет, я думал вы про структуру самого индекса перколятора говорите. Тогда перколятор, действительно, отпадает. Я бы тогда хранил эти запросы как документы в поле с типом "object" и "enabled":"false".

IvanTushin · December 30, 2019, 6:34pm

Помимо es, у нас еще есть mysql, так что я не вижу смысла использовать es в роли БД. Просто я хотел оптимизировать работу сохранив поисковые шаблоны и не таскать гигабайты запросов, а так разницы нет, что из мускуля получать, что из эластика.

Спасибо за помощь и с наступающим Новым Годом!

Topic		Replies	Views
Несколько вопросов о percolate query Вопросы на русском языке	1	558	February 28, 2019
Storing suitable document ids that matches percolator query Elasticsearch painless	0	280	April 7, 2022
Percolate and store the result Elasticsearch	0	297	January 18, 2012
Percolator Memory Usage -- 10-1 Disk-Memory Usage. Why? Elasticsearch	4	615	January 16, 2015
Storing Percolate Queries Elasticsearch	2	1289	September 1, 2015

Правильно ли я использую script?

Related topics