Поиск с морфологией и без

Vivaldy · January 15, 2018, 12:16pm

Elasticsearch настроил, за что огромное спасибо. Сейчас изучаю анализаторы, маппинг. Возник вопрос - прочитал про проблемы с suggestions поиском и морфологией когда документ в индексе: "Катя разговаривает" не находится при вводе фразы "Катя разгов" так как морфологический фильтр преобразовал "разговаривает" -> "говорить" и потому рекомендуют хранить оба варианта (преобразованный и не преобразованный).
Решение этого вопроса я увидел следующим образом:

применение токенайзера nGram, но он в купе с морфологией начинает давать очень странные результаты. То есть если токенайзер я ставлю так:

'my_index' => [
'type' => 'custom',
'tokenizer' => 'my_nGram',
'filter' => ['lowercase', 'custom_word_delimiter', 'my_stopwords', 'russian_morphology']
],
то веселые истории выдает на запрос о веслах

если так:

'my_index' => [
'type' => 'custom',
'tokenizer' => 'standart',
'filter' => ['lowercase', 'custom_word_delimiter', 'my_stopwords', 'russian_morphology', 'my_nGram']
],
то уже лучше, но все равно меня это, что-то смущает

второй вариант который я вижу это сделать два анализатора в одном подключить морфологию, в другом не подключать. После чего в запросе склеивать поиск по этим полям с одинаковым boost-ом (как сделать одно поле с идексами и с морфологией и без я не понял пока что, может возможно как-то?)
Плюс к тому, получается, что при том - если я хочу чтоб отдельное слово "разговаривает с.." мело больший вес чем часть слова "разговаривает с..." и было выше в результатах то мне получается уже надо делать 4 запроса лишь по одному полю. С одной стороны не проблема, с другой стороны когда полей много - запрос разрастается невероятно - не будет ли это в последствии сильно тормозить?

Подскажите как лучше делать? возможно ли сформировать индекс с морфологией и без вместе. а не клеить? Извиняюсь если это тривиально, я недавно стал разбираться.

Заранее спасибо.

Igor_Motov · January 15, 2018, 3:28pm

Этот вопрос в форуме периодически возникает. Последний раз мы тут об этом говорили.

Vivaldy · January 17, 2018, 2:06pm

Спасибо, вроде выбрал подходящий вариант

Topic		Replies	Views
Русская морфология Вопросы на русском языке	21	8285	March 31, 2016
English_morphology Вопросы на русском языке	2	1651	July 4, 2015
Не получается побороть морфологию Вопросы на русском языке	6	1350	May 28, 2019
Синонимы и подстроки Вопросы на русском языке	1	2346	October 30, 2017
Базовые настройки индекса для работы с русской морфологией Вопросы на русском языке	13	13952	March 22, 2017

Поиск с морфологией и без

Related topics