ML What is the difference between by_field_name and partition_field_name

richcollier · November 29, 2017, 5:28pm

Both methods split data to establish separate baselines.
Can be used separately or applied together in one detector (i.e. count by error_type partition_field=host)

If you want to “hard split” the analysis, select an “partition_field_name”

The field chosen should have < 10,000 distinct values per job, in general as more memory is required to partition
Each instance of the field is like an independent variable
Scoring of anomalies is more independent

If you want a “soft split”, select a “by_field_name”

Topic		Replies	Views
ML: difference between partition_field_name and by_field_name? Elasticsearch elastic-stack-machine-learning	4	882	August 27, 2021
ML Kibana: difference between by_field_name and partition_field_name Kibana elastic-stack-machine-learning	4	2752	August 29, 2019
ML: difference between partition_field_name and by_field_name in a population job? Elasticsearch elastic-stack-machine-learning	9	1463	December 7, 2021
Can you set partition field and count by as the same field? Kibana elastic-stack-machine-learning	3	413	December 14, 2022
ML Kibana: problem with an advanced job using partitionfield Kibana elastic-stack-machine-learning	18	1155	September 3, 2019