Подсветка результатов поиска по полю с фильтром word_delimiter не правильно работает

Подсветка работает нормально, это анализатор весь перекрученный и выдает ерунду. Если посмотреть, что происходит с токенами:

POST test/_analyze
{
  "text": ["Import46 (copy).csv"],
  "analyzer": "my_ngram"
}

то вы получите кроме всего прочего:

    {
      "token" : "import46",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "word",
      "position" : 8,
      "positionLength" : 2
    },

Другими словами, анализатор утверждает, что import46 начинается на позиции 6 и имеет длину в 2 символа, что у вас и подсвечивается.

Вообще, graph фильтры - дело сложное, особенно, если пытаться применять их при индексации вместо поиска да еще и с N-граммами. Я могу объяснить почему это решение работать не будет, но я не могу понять, что вы хотите добиться этим анализатором, поэтому другие решения подсказать не могу.

1 Like