Объем требуемого дискового пространства стал больше в ElasticSearch 5.x

Результат работы

Опять же ничего особенного для 5.x я не вижу. Скорее всего в меппинге что-то по сравнению с 2.x что-то изменилось. Но я могу посоветовать, как уменьшить размер индекса. Первое, что бросается в глаза это размер поля _all. Судя по названиям полей, я очень сомневаюсь, что поиск по этому полю кому-то нужен. Я бы его отключил, или выбрал только те поля которые там действительно нужны. Очень многие поля, которые судя по названию не предназначены для полно-текстового поиска (DOCS.RecordingEgIp.RecordId например) проиндексированы как text вместо keyword. В тех полях, в которых полнотекстовый поиск нужен (в именах, например) можно было бы отключить norms.

Игорь, здравствуйте!
Спасибо большое за ответ. Я займусь оптимизацией индекса. Мы просто дополнительно столкнулись с проблемой, при использовании keyword, что данные поля не "подсвечиваются". Поэтому сейчас пока на время оставили text до тех пор, пока не разберемся с проблемой.

Я не вижу в чем проблема

PUT test/doc/1
{
  "foo": "bar"
}
GET test/_search
{
  "query": {
    "match": {
      "foo.keyword": "bar"
    }
  },
  "highlight": {
    "fields": {
      "foo.keyword": {}
    }
  }
}

возвращает мне

{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 0.2876821,
    "hits": [
      {
        "_index": "test",
        "_type": "doc",
        "_id": "1",
        "_score": 0.2876821,
        "_source": {
          "foo": "bar"
        },
        "highlight": {
          "foo.keyword": [
            "<em>bar</em>"
          ]
        }
      }
    ]
  }
}

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.