je ne suis pas un spécialiste d'ElasticSearch mais je l'utilise dans mon milieu professionnel :).
je voulais avoir des retours par rapport à l'utilisation de ES dans le calcul des statistiques: est ce que c'est adapté pour faire ce genre de traitement sur un volume de données de quelques To et les limites.
Personnellement je l'ai utilisé dans pas mal de cas d'utilisation pour remplacer des systèmes de BI et datamining existants, la différence majeure est que ES n'est pas un model relationnel et donc l'approche change un peu au niveau ingestion des données où va falloir flatter les données et enrichir avec le maximul d'info pour avoir toutes les possibilité d'analyse.
Si vous pouvez fournir plus de détails sur votre use case, on peut échnager sur les possibilités
Sizing de votre cluster selon la volumétrie à traiter, il y a l'architecture hot/warm (tu peux aller sur 1Go de RAM pour chaque 32Go de data pour les noeuds hot, et tu peux aller jusqu'a 90Go de data pour chaque 1Go de RAM pour les noeuds warm), check here
Définir le mapping de vos données, c'est hyper important pour avoir des temps de réponse rapide
Calculer ce qui peut etre calculer au moment de l'ingest (logstash ou ingest pipeline)
Enrichir tout ce qui peut etre enrichit au moment de l'ingest (logstash ou pipeline enrichi policy)
Utiliser TSVB à chaque fois que les visulisation de Kibana ont une limite, au pire de cas tu as toujours vega pour faire ce que tu veux sans limite
Je travail bcp dans le contexte telecom, ou je sui sobligé de traiter un volume important de logs et au méme temps garder une longue période de rétention pour les analyses, j'ai souffert avec MSSQL jusqu'a ce que j'ai déouvert Elasticsearch qui me donne la possibilité de scaler comme je veux .... biensure la contre partie perdre la flexibilité des jointures SQL, mais bon fallait faire un choix
On partage prèsque les mêmes souffrances !!!
MSSQL et puis je suis passé sur ES.
Actuellement je commence à avoir de plus en plus de données et je me demande si je continue à utiliser ES pour les stats et c'est le but de mon post.
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.