Je ne suis pas un expert dans le sujet car je n'utilise que la partie Elasticsearch (et légèrement Kibana).
Mais il me semble que par défaut, ELK doit générer un index / jour dans elasticsearch contenant les logs de la journée (c'est configurable pour la période je pense).
Au niveau du tri lors de l'indexation des logs, oui, côté Logstash, il est possible de rajouter des conditions pour ignorer une donnée si elle ne correspond pas. Peut-être que dans ce cas de figure basique il y a même plus simple pour ignorer les lignes de logs inintéressantes.
Après, on peut également filtrer dans Kibana pour ignorer les niveaux que l'on ne souhaite pas traiter mais tout de même les avoir tous dans l'index.
Cela me surprend que les logs indexés via logstash soient dans /var/log/elasticsearch. Normalement ce dossier devrait servir à stocker les logs d'exécutions d'elasticsearch (dans /var/log/apache2 par exemple, on aura le log du serveur apache seulement). Les indexes en eux même sont stockés dans un autre dossier je pense.
Dans les filters de logstash tu peux régler pour ignorer un niveau à partir du quel tu envoies réellement à ES mais je n'ai jamais eu à l'utiliser car en production, on configure nos programmes pour ne pas sortir les logs d'un certain niveau si l'on n'est pas intéressé par ces derniers. Du coup, logstash ne recoit que des logs que l'on voudra indexer.
PS : En fonction de la version d'elasticsearch / logstash / kibana que tu utilises, je te conseille de l'appeler "Stack Elastic" avec éventuellement en précision : "Anciennement ELK". C'est le nouveau nom officiel et cela témoigne que tu es à jour sur la techno
De lire directement les fichiers ? Je ne pense pas. La structure des fichiers est définie par ES et tu ne pourras pas les exploiter.
Je pense que le plus intéressant a été dis par David. Les fichiers de l'index sont répartis sur les disques locaux de chaque serveurs possédant un noeud de cet index. Le path que tu as trouvé me semble cohérent si tu veux le mentionner mais il ne sera pas exploitable tel quel. Pour information, si besoin, on peut changer dans la config d'ES le dossier où seront stockés les fichiers (au lieu de "/var/lib/elasticsearch") il me semble.
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.