Depuis débutjanvier nous rencontrons régulièrement l'erreur "NoNodeAvailableException".
Nous avons la sensation que c'est également lié au logs suivants, lui aussi régulier depuis cette date :
23:56:34 t=elasticsearch[Golden Girl][transport_client_worker][T#5]{New I/O worker #5} l=WARN c=o.e.transport rid= url= query_string= method= m=[Golden Girl] Received response for a request that has timed out, sent [12ms] ago, timed out [0ms] ago, action [cluster:monitor/nodes/info], node [[#transport#-1][XX.XX.XX.XX][inet[localhost/127.0.0.1:9300]]], id [4781972]
De la façon dont nous le comprenons, le client ES rencontre un timeout avec ES et décide de supprimer le noeud des noeuds disponibles. Les requêtes suivantes lancent alors une NoNodeAvailableException.
Savez-vous s'il est possible d'augmenter ce timeout (et d'en connaitre la valeur) ?
Pour info nous sommes sur un ES 1.4.2 (oui c'est vieux, les upgrades ont été douloureux à chaque fois et nous avons repoussé jusqu'ici les suivants).
Nous n'avons qu'un seul noeud avec 5 shards.
Ce noeud est sur la même machine que les applications.
De votre expérience, quelle serait les métriques à regarder pour tenter d'expliquer ces timeout récents ?
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.