Données "dupliquées" semble être ignorées dans les requête kibana

Bonjour,

Je stocke des logs dans un ES et j'essai de les visualiser dans un kibana. Or il semble que quand j'essai de faire un count basique, kibana (ou ES) ne compte pas certaines lignes qui ont les mêmes valeurs (car les logs disent la même chose dans la même milliseconds).

Comment faire pour que ces données ne soit pas ignorées pour pouvoir compter ce qu'il se passe correctement.

Merci d'avance pour votre réponse.

Ça fait exactement la même chose avec une requête ES.

Quand je regade mes infos sur mes index avec http://url:port/_cat/indices?v

J'ai une valeur bizarre

health status index uuid pri rep docs.count docs.deleted store.size pri.store.size

yellow open logstash-2019-07-30 Cw4pIkUzTre3iBhOd2GbiQ 1 1 1246 3107 2mb 2mb

3107 doc supprimés alors que je n'ai rien supprimé. Est-ce que mes "doublons" passe ici ?

J'ai rajouté un identifiant unique dans chacun de mes logs pour qu'ils ne soient plus "dupliqués" or j'ai encore une foule de docuements qui passent en docs.deleted.
Personne n'a déjà vu ça ?

@David_Pilato do you think you can take this up ?

Thanks
Rashmi

1 Like

Oui. Un reindex d'un document est égal à un delete + index.