Понимание основ

ktomu · September 21, 2016, 12:04pm

Приветствую, помогите плз с пониманием основ. Когда мы передаем в индекс эластика какую-ту инфу, данная инфа проходит цепочку обработки – Analyzer. Целью этой цепочки является преобразование данной информации в набор токенов через различные анализаторы. На основании этого строится поисковый индекс, к которому мы в итоге обращаемся через различные запросы. Индекс состоит с одной стороны из токенов, а с другой с документов в которых эти токены встречаются.
Пока все верно понял?)
Если все верно, у меня следующие вопросы:
--- У каждого индекса в рамках эластика свой набор токенов и документов, не общие они в рамках всего кластера индексов?
---Как можно переиндексировать текущий индекс путем применения другого набора анализаторов к нему? Например, как можно на основе текущего индекса применив к нему другой набор анализаторов создать другой?
--- как посмотреть текущий индекс анализатора (токены – документы)?

P.S. Может создал путаницу с термином индек - сорри. Под индексом я понимал обычный индекс в эластике (аналог бд), под поисковым индексом или индексом анализатора - я имел ввиду индекс из токенов который создается/обновляется после анализа поступающей инфо в эластик.

Igor_Motov · September 21, 2016, 8:12pm

более-менее

--- У каждого индекса в рамках эластика свой набор токенов и документов, не общие они в рамках всего кластера индексов?

На логическом уровне - да, но практически у каждого сегмента свой набор. (Индексы состоят из шард и шарды из сегментов)

---Как можно переиндексировать текущий индекс путем применения другого набора анализаторов к нему? Например, как можно на основе текущего индекса применив к нему другой набор анализаторов создать другой?

Если много способов, но самый простой - командой reindex.

--- как посмотреть текущий индекс анализатора (токены – документы)?

Есть несколько способов, но все они достаточно муторные. Проще посмотреть во что поле превращается при анализе с помощью команды analyze

P.S. Может создал путаницу с термином индек - сорри. Под индексом я понимал обычный индекс в эластике (аналог бд),

Это не совсем аналог бд, и эта аналогия может привезти к проблемам. В большинстве случаев лучше думать об индексе как таблице, но и с этим тоже есть свои проблемы.

под поисковым индексом или индексом анализатора - я имел ввиду индекс из токенов который создается/обновляется после анализа поступающей инфо в эластик.

это будет сегмент

Topic		Replies	Views
Много вопросов от новичка Вопросы на русском языке	33	8571	January 25, 2018
Вопросы по организации индексов Вопросы на русском языке	3	1686	December 23, 2016
Re-Index Strategies Elasticsearch	4	356	July 7, 2010
Вопрос по агрегации и скорости Вопросы на русском языке	31	2837	December 14, 2018
Долгий реиндекс неотсортированных данных Вопросы на русском языке	13	1100	October 15, 2021

Понимание основ

Related topics