Поиск по документам (pdf, docx и прочие)

Используем ES для полнотекстового поиска по структурированным данным (название, даты, атрибуты, вложенные сущности с названиями и т.д.). Сейчас нам необходимо к каждому документу проиндексировать N файлов, чтобы поиск можно было расширить по содержимому файлов. Вопрос в том, как лучше организовать индекс. Делать ли для файлов отдельный индекс или индексировать файлы в поле с основной информацией. Но тогда при обновлении основного документа информация по файлам будет затираться и нужно заново индексировать файлы?

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.