Правильное использование script в aggs

11116 · December 18, 2015, 1:37pm

Добрый день!

Из индекса нужно выделить количество пользовательских сессий с различными ошибками. Для этого используется такого вида запрос:

 "aggs": {
            "ERBL": {
               "cardinality": {
                  "script": "if (doc['error.ERBL.code']){ doc['info.PID'].value }"
               }
            },
            "ERVS": {
               "cardinality": {
                  "script": "if (doc['error.ERVS.code']){ doc['info.PID'].value }"
               }
            },
            "ERVS_CH": {
               "cardinality": {
                  "script": "if (doc['error.ERVS_CH.code']){ doc['info.PID'].value }"
               }
            }
... и так далее для других ошибок
 "All": {
               "cardinality": {
                  "field": "info.PID"
        }
}

Все поля с ошибками имеют вид error._имя_ошибки_.code.
info.PID это идентификатор пользователя.
Маппинг для ошибок выглядит так:

                     "ERBL": {
                        "properties": {
                           "code": {
                              "type": "integer"
                           },
                           "msg": {
                              "type": "string",
                              "index": "not_analyzed",
                              "doc_values": false
                           }
                        }
                     }

В результате получаем общее количество сессий и количество сессий с различными типами ошибок, высчитывается процент ошибок и отправляется внешним скриптом в мониторинг.
Обязательно ли расписывать каждую ошибку отдельно, как мы сейчас делаем, или это можно сделать проще? И можно ли как-то получить сразу % ошибочных сессий от общих, а не высчитывать их отдельно в отправляющем скрипте?
Спасибо!

Igor_Motov · December 18, 2015, 7:01pm

Есть несколько вопросов:
Сколько разных ошибок может присутствовать в документе?
Маппинг для всех ошибок одинаковый?
Сколько разных типов ошибок вы ожидаете иметь в системе?

11116 · December 22, 2015, 7:38am

В одном документе только одна ошибка
У некоторых ошибок есть еще дополнительное поле для нумерации, но у всех есть поля для кода и текста ошибки
Всего ошибок примерно 20

Igor_Motov · December 22, 2015, 4:51pm

В этом случае, лучше "сплющить" структуру документа и хранить имя ошибки как обычное поле. В этом случае не нужно будет заморачиваться со скриптами, так как обычный (и гораздо более эффективный) агрегатор terms вполне справиться с такой структурой.

11116 · December 23, 2015, 7:45am

Странно, что мы пропустили такое простое решение) Спасибо!

Topic		Replies	Views
Script aggreation shows significant performance issue then none-script aggreation Elasticsearch	5	1060	June 28, 2016
Using painless with aggregation results Elasticsearch	13	7340	February 5, 2018
Attempting to perform aggregation script on ES buckets Elasticsearch	1	438	August 30, 2019
Undercounting of doc_counts in Terms agg V.S. scripted terms agg Elasticsearch	0	323	March 30, 2020
Script Aggregations Significant Performance Degradation in 2.2.0 Elasticsearch	15	2805	June 2, 2016

Правильное использование script в aggs

Related topics