Bonjour,
J'utilise Machine Learning pour remonter des alertes lorsque des courbes de trafic web sont anormales. Par exemple s'il y a trop de trafic ou pas assez.
Je fait pour ça la somme (count) du nombre de connexions à un site web au cours du temps et déffinit un bucket span de plusieurs minutes.
Ca marche très bien s'il y a trop ou pas assez de trafic par rapport à la normale, tant qu'il y a du trafic.
Par contre, j'ai eu un cas où une absence totale de trafic a été considéré il me semble comme une absence de données, conséquence de quoi l'alerting n'a pas sonné.
Je dis absence de données car quand je clique sur machine learning, j'ai droit à des encarts gris sur les courbes, m'indiquant que le datafeed a manqué 1 517 829 documents à cause de latence en ingestion (avec un B en haut de l'encart : cf capture ecran ci-dessous) entre le 16/03 - 22h00 et le 17/03 - 22h00. Ce qui est étonnant puisque sur cette plage je ne constate aucune latence en allant dans le monitoring (pas d'augmentation de la Latency sous monitoring > nodes, l'indexing rate est à son minimum de la journée pour le seul index qui travaille et son document count est stable. Dans monitoring > overview j'ai même un creux d'indexing latency entre 22h et 8h le lendemain. Pas de sursaut de JVM). Alors qu'en réalité les données sont bien indexées puisque je les vois dans discover. Sauf que comme il n'y a aucun trafic pour ce que je surveille, il n'y a aucune données pour le bucket, logique...
J'aimerai savoir comment solutionner cela car c'est je pense une anomalie dans la mécanique qui devrait être capable de distinguer les cas d'absence de trafic des cas d'absence d'indexation de documents.
Ps sous machine learning j'ai ce message : Datafeed has missed 1,517,829 documents due to ingest latency, latest bucket with missing data is 2020-03-17T18:00:00.000Z. Consider increasing query_delay. Qu est-ce le query delay ?
Par avance merci.
Capture ecran :
