Bonjour,
Par défaut quand on fait un job de machine learning; on scan et scroll les données du cluster avec un delay compris entre 60s et 120s.
Plus d'infos ici : https://www.elastic.co/guide/en/machine-learning/current/ml-delayed-data-detection.html
Et ici : https://www.elastic.co/guide/en/elasticsearch/reference/7.6/ml-put-datafeed.html#ml-put-datafeed-request-body
Globalement si vous avez de la latence sur l'ingestion des logs ML ne va pas lire les données et indiqués avec l'annotation que vous avez eu que les données sont arrivés en dehors de la fenêtre du query delay.
Ce n'est pas forcément du à une latence au niveau d'Elasticsearch mais peut être que les logs eux mêmes sont écrits avec un delay sur la machine par exemple.
Si vous savez que votre ingestion peut prendre un plus de temps typiquement 1h de retard par exemple vous pouvez indiquer un query delay dans la configuration de ML. Attention ça signifie également que vous ne serez pas notifié en temps réel d'anomalies.
Il faut trouver un compromis entre le query delay et la latence maximum autorisé dans l'ingestion des données.