Как исключить подстветку не полностью совпадающих запросов?

Stan · July 11, 2015, 9:59am

Добрый день!

Просьба подсказать. Есть проиндексирвоанные данные - имя и фамилия, которые проиндексированы через edgeNGram. Когда я делаю поиск с помощью match_prefix, с указанием необходимости сделать highlight, я получаю инетерсный, но не очень подходящий результат. Например, есть два поля:
nam: 'Иван'
fam: 'Иваськин'

При поиске по префиксу, подсветка выглдяит следующим образом:
nam: 'Иван'
fam: 'Иваськин'

Есть ли какой-нибудь флаг, который может ограничить подсветку "неполных" фрагментов? Чтобы fam не подсвечивался, поскольку полностью не соответствует введенной юзером фразе?

Igor_Motov · July 11, 2015, 2:25pm

Это происходит потому, что по умолчанию подсветка выполняется по тому же запросу, что и поиск. В вашем случае, вы хотите искать по префиксу, а подсвечивать по полному запросу. И это можно сделать c помощью параметра highlight_query.

Stan · July 20, 2015, 7:04pm

Прошу прощения, сразу не ответил. В принципе - хороший вариант. Вопрос вот только - это же увеличит время поиска примерно вдвое? Или он будет применять highlight_query только к найденному в основном запросе?

Igor_Motov · July 20, 2015, 7:08pm

Нет, искать он будет только один раз. Подсветка и поиска не зависят друг от друга. Просто по умолчанию и то и другое происходит по одному запросу.

Stan · July 20, 2015, 7:24pm

Не-не, навреное не поняли друг друга. Изначально суть проблемы была в том, что при поиске по префиксу, например, слова "Иванова", будут подсвечены и "Иванова" и "Иванов", потому что по префиксу "Иванов" тоже часть слова "Иванова".

Как я понимаю, если использовать highligth_query, то можно задать отдельные условия для выделения слов. Например, искать только точные совпадения. Тогда, при запросе "Иванова" подсветится только слово "Иванова", но не Иванов.

Если все так, то не очень понимаю логику работы - разве Elastic не будет "применять" дважды заданные правила? Один раз для поиска по префиксу (например, match_prefix), а второй раз по точному совпадению (например, highlight_query)?

Igor_Motov · July 20, 2015, 7:34pm

Во время поиска никакой информации о том, почему конкретная запись была найдена, не сохраняется. Поэтому во время подсветки, elasticsearch анализирует найденную запись и запрос и пытается вычислить какие-же слова в записи совпадают со словами в запросе. Другими словами поиск и подсветка - процессы независимые. Так что никакие "правила" применяться дважды не будут. Просто одни "правила" будут использованы при поиске, и другие "правила" будут применены при подсветке.

Stan · July 20, 2015, 7:53pm

Отлично! Тогда точно - то, что надо. Спасибо!

Topic		Replies	Views
Подсветка фраз со стоп-словами при match_phrase поиске Вопросы на русском языке	2	1650	November 24, 2015
The highlight is not returned when using prefixing query Elasticsearch	0	230	December 4, 2023
Highlight "best matches" using Elastic Highlighting API Elasticsearch	0	1053	February 15, 2019
How do I help the users understand some unexpected search hits (Or how can I do "highlighting" on _all) Elasticsearch	5	509	September 25, 2014
Text Phrase Query Elasticsearch	8	477	October 12, 2011

Как исключить подстветку не полностью совпадающих запросов?

Related topics