Добавление синонимов через функцию

IvanTushin · October 3, 2018, 12:37pm

Добрый день!
Опишу сначала проблему: В наших документах иногда встречаются слова с замененными визуально похожими буквами, например, русская "а" и английская "а". Это создает проблемы во время поиска.

Хотел индексировать синонимы, однако вариантов написания может быть очень много. Отсюда вопрос, можно как-нибудь использовать функцию для составления синонимов во время индексации?

Igor_Motov · October 3, 2018, 1:24pm

Вы можете проиндексировать поле дважды - один раз как есть, второй раз, с переводом всех похожих латинских букв в кириллицу с помощью фильтра символов mapping.

IvanTushin · October 3, 2018, 5:24pm

Хорошая идея, но к сожалению хранить 2 экземпляра слишком дорого, к тому же в слове может быть более одной измененной буквы, поэтому я рассчитывал сохранить всевозможные комбинации в качестве синонимов. Подстановка рядом в документ всех комбинаций тоже не подходит по причине поиска в окрестности.

Видимо единственный вариант это перебирать комбинации во время составления поискового запроса.

Igor_Motov · October 3, 2018, 5:31pm

Вы не будете хранить 2 экземпляра - у вас будет 2 индекса.

к тому же в слове может быть более одной измененной буквы,

Это все равно, все буквы будут заменены на кириллицу.

поэтому я рассчитывал сохранить всевозможные комбинации в качестве синонимов

Это на мой взгляд заплатка, а не решение. Ни к чему хорошему в долгосрочной перспективе это не приведет. Но, если вы хотите это делать, то проще всего это будет сделать в вашем приложении во время генерирования запроса.

IvanTushin · October 3, 2018, 5:54pm

Если быть точнее, мне нужно заменять не во всех случаях, а только когда в слове вдруг промелькнула среди русских букв английская. Я смотрю есть Pattern Replace Char Filter так что если составить регулярки на поиск таких ситуаций - это решит мою проблему.

Igor_Motov · October 3, 2018, 6:30pm

Тогда уж лучше Pattern Replace Token Filter.

IvanTushin · October 4, 2018, 4:37am

Спасибо за помощь!

Topic		Replies	Views
Подключение синонимов Вопросы на русском языке	1	957	July 18, 2017
Синонимы для словосочетаний, сохранение исходных слов Вопросы на русском языке	8	3361	February 7, 2017
Wildcards + synonyms Вопросы на русском языке	5	1006	April 12, 2017
Фильтр nGram на синонимы Вопросы на русском языке	16	3866	January 19, 2016
Иерархическое применение синонимов Вопросы на русском языке	9	1538	October 10, 2019

Добавление синонимов через функцию

Related topics