Добрый день, есть цель объединить 3 анализатора в 1 для будущих индексов, я с этим не сталкивался в процессе работы да и с эластиком в принципе то же редко, по идее у меня цель 3 анализатора.
Может кто поможет с этим делом, я все ломаю или вообще не правильно склеиваю, все 3 анализатора ниже
Это сделать нельзя, так как в анализаторе только один токенизатор, но можно выбрать общий токенизатор и обьединить токен-фильтры в один анализатор. Что вы хотите добиться-то?
итоговая цель, при поисковом запросе
1)что бы е/ё были 1 символом
2)точка была разделителем
3)дублирующая информация в одном документе удалялась после 1го вхождения
Я думал это все анализаторами делается и их обьединением.
Это не цель. Вы описываете решение, которое вы пытаетесь воплотить. Мне сложно приставить какую проблему вы пытаетесь решить с помощью этого набора мер. Особенно меня смущает 3). Можно, как-нибудь, на примерах пояснить какие документы и запросы должны совпадать?
1)Думаю логично е и ё однин символ при поисковом запросе Еж или Ёж одно и то же
2)"Город Москва, красивый.город Москва" при поисковом запросы вывод что бы получался первая часть Город Москва,красивый вторая часть город Москва
3)"Город Москва, красивый.город Москва" вывод должен получаться Город, красивый.город Москва
А все объединить что бы в итоговом варианте получалось + е/ё
первый вывод "Город, красивый"
второй вывод "город Москва"
Нафига оно надо не могу сказать, попросили сделать, по отдельности сделал, кроме последнего пункта, а как объединить хз.
Просили это -
Чувствительность поиска к Ё (считаем, Е и Ё одним символом): добавить к анализатору приравнивание Е к Ё и е к ё
Отсутствие пробелов между типом и названием АО - Сделать точку разделителем в поисковом анализаторе
повторяющиеся названия уровней (удаляем первое повторение): дополнительный сервис-прослойка на задваивающиеся элементы строки
Тут наверно мои знания синтаксиса эластика заканчиваются, а для чего стоит замена точки на запятую.
в этом анализаторе работает только Е/ё ,а ведь цель еще добавить к анализу разделитель слов - точку и отсутствие дублей слов в выводе
Как я уже писал , это попросили сделать меня, для чего это все хз.
А мой вараинт с точкой не пройдет? И удаление дублей видимо о же нужно, я не находил такого решения сам.
Жаль, что ничем вам тут помочь не смогу. Я в таком режиме не работаю. Когда я вижу бессмысленное требование я всегда пытаюсь понять что за этим требованием стоит, вместо того, чтобы бездумно это требование выполнять.
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.