Template par défaut

GedeoN · June 3, 2019, 12:21pm

Bonjour Messieurs Dames,

Je me posais une question aujourd'hui, je travaille sur la future mutualisation des plateformes ELK de mon client. (Une plateforme en 6.4.2 et une en 5.4.2)
L'idée sera de passer notamment de la version 5.4.2 à la 6.8.0 et de la 6.4.2 à la 6.8.0.

Mais avant la migration, je souhaiterais déjà mettre d'aplomb la plateforme en version 5.
Aujourd'hui, les shards sont par défaut à la valeur de base, c'est à dire à 5 shards et 1 replicas.
Afin d'optimiser l'espace disque, je souhaiterais passer de 5 à 2 shards.
J'ai donc pour cela modifier le _template/default, et tout s'est bien passé. Mais à la création automatique de nouveaux indexes (basés sur un nommage bien précis), ils continuent à se créer avec 5 shards.

Dans la version 6, j'ai vu qu'il y avait une option index_patterns que je peux positionner sur ["*"] afin de prendre en compte tous les indexes, mais cette option n'a pas l'air d'exister sur la version 5.x.

Est-ce qu'il y a un moyen de forcer du coups les shards de 5 à 2 en prenant en compte le fait que des indexes portent déjà ce nom?

Je veux pas qu'il modifie les anciens, car impossible, mais bien que les prochains créés soient bien à 2 shards.

En espérant avoir été clair.
Elastiquement.
Jonathan

dadoonet · June 3, 2019, 2:45pm

C'est juste que en 5.x et avant, le champ était nommé template et non index_patterns.

Regarde https://www.elastic.co/guide/en/elasticsearch/reference/5.6/indices-templates.html et https://www.elastic.co/guide/en/elasticsearch/reference/6.8/indices-templates.html

Ensuite il faut que tu regardes la liste complète des templates qui sont dans ton cluster. Ils sont appliqués suivant leur poids. Donc un index template peut en écraser un autre.

D'ailleurs, pourquoi deux shards ? Pourquoi pas un seul ?

GedeoN · June 4, 2019, 7:42am

Bonjour David,

Merci pour ce retour.
Je vois la nuance maintenant, je pensais qu'ils avaient dissocié les deux.
Par contre je ne savais pas que les templates était appliqués selon leur poids, j'ai d'ailleurs renseigné le champs "order" pour m'assurer qu'il soit bien pris en compte en premier.
Alors pourquoi deux shards, c'est une contrainte client, du coups je ne fais que suivre leurs directives de ce côté là.

dadoonet · June 4, 2019, 8:15am

Est-ce que ton client sait ce qu'il fait ?

GedeoN · June 4, 2019, 8:46am

C'est beaucoup moins sûr.
Je tente simplement d'optimiser avec ce que j'ai, c'est pas tous les jours facile et je découvre toujours de nouvelles blagues.

dadoonet · June 4, 2019, 9:12am

Règle simple. A prendre avec des pincettes car ça dépend de ton cas d'utilisation.

Mais en gros, un shard peut tenir facilement entre 20go et 50go de données. Si tu as moins que ça, alors met un seul shard.

GedeoN · June 4, 2019, 9:26am

Merci pour l'information.
En fait c'est variable selon les clients, mais on a des shards avec bien plus de données, comme je joue sur une configuration d'un template par défaut pour l'ensemble des clients, je pense que 2 n'est pas déconnant. Je vais continuer l'inventaire et voir s'il serait pas plus intelligent de faire des templates dédiés selon l'utilisation.

dadoonet · June 4, 2019, 10:30am

Je te conseille de regarder ceci:

https://www.elastic.co/elasticon/conf/2016/sf/quantitative-cluster-sizing

And https://www.elastic.co/webinars/using-rally-to-get-your-elasticsearch-cluster-size-right

GedeoN · June 13, 2019, 1:30pm

Salut David.

Très bonne vidéo, ça permet d'avoir une notion plus claire du fonctionnement.
Et effectivement ça dépend ^^
Le client pour lequel je travaille fait au plus simple car personne ne maintenait les plateformes, si deux shards ont été choisis, c'est principalement pour répondre au besoin général par défaut. Nous avons des indexes dépassant les 100Go comme nous en avons de moins de 1Go... la marge est grande, et il faudrait faire des templates au cas par cas pour affiner l'infra actuelle, mais ça me demanderait bien trop de boulot en plus de ma mission.
Sur la vidéo, tu parles du round robin, est-ce que l'allocation sur les serveur est intelligente en fonction de l'espace disque disponible?
Je me retrouve avec cette problématique où des serveurs sont arrivés à 85% et où d'autres sont aux alentours de 50%
Un rééquilibrage de charge serait idéal pour lisser l'espace occupé sur la totalité du cluster.

Merci encore pour toutes tes réponses, et travaillant dans une société qui est mentionnée dans la vidéo, avoir une certification dans la suite elasticsearch serait vraiment bénéfique je pense pour moi.

À très bientôt.

dadoonet · June 20, 2019, 12:53pm

Pas de rapport avec le round robin je pense. Mais pour répondre à ta question, Elasticsearch va décider de ne plus allouer de nouveaux shards sur un noeud en fonction de la taille dispo sur ce noeud. Regarde Disk-based shard allocation | Elasticsearch Guide [8.11] | Elastic

system · July 18, 2019, 12:53pm

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.

Topic		Replies	Views
Optimizing number of shards Elasticsearch	10	463	July 6, 2017
Configurer un nombre de shards éggal à1 et une nombre de réplicas égal à0 Elasticsearch	6	473	December 24, 2018
Index template Elasticsearch	5	368	January 19, 2021
Augmenter le nombre de shards Discussions en français	5	2247	July 6, 2017
Как поменять количество шардов? Вопросы на русском языке	19	4986	April 19, 2019

Template par défaut

Related topics