ML Kibana: difference between by_field_name and partition_field_name

richcollier · August 1, 2019, 6:31pm

If you want to “hard split” the analysis, select a “partition_field_name”

The field chosen should have < 10,000 distinct values per job, in general as more memory is required to partition
Each instance of the field is like an independent variable
Scoring of anomalies for partitions is more independent (especially v6.5+)

If you want a “soft split”, select a “by_field_name”

In the Advanced job, you can use both, by the way - effectively getting a double-split. For example:

count by error_code partition=host

Topic		Replies	Views
ML What is the difference between by_field_name and partition_field_name Elasticsearch elastic-stack-machine-learning	2	2486	December 27, 2017
ML: difference between partition_field_name and by_field_name? Elasticsearch elastic-stack-machine-learning	4	1064	August 27, 2021
ML: difference between partition_field_name and by_field_name in a population job? Elasticsearch elastic-stack-machine-learning	9	1668	December 7, 2021
Can you set partition field and count by as the same field? Kibana elastic-stack-machine-learning	3	448	December 14, 2022
ML Kibana: problem with an advanced job using partitionfield Kibana elastic-stack-machine-learning	18	1262	September 3, 2019