Est-il possible de connaitre l'espace disque utilisé par un sous-ensemble de document ?
Exemple, dans mon index j'ai une liste de documents qui contiennent un champ client.
Je voudrais connaitre l'espace disque utilisé par tous les documents qui ont la valeur 1 dans le champ client.
Au mieux on peut avoir l'espace d'un shard et le nombre de documents a un temps donné
Le meme json envoyé 2 fois prendra pas la meme taille suivant les termes deja present dans l'index inverse lucene du segment donc on ne peut qu'avoir qu'une estimation... Aussi apres des merges des segments la taille va aussi changer.
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.