добрый день, я в данной теме новенький и хочу уточнить пару моментов:
правильно ли я понимаю что если у меня есть 2 дата ноды в кластере и каждый индекс имеем 1 праймери шард и один реплика шард то при выходе из строя любой дата ноды потери данных не произойдет ? т.к. у нас как бы "зеркалирование" данных:
можно ли добиться распределения данных по дата нодам не дублируя их? Т.е. более важна скорость работы кластера чем сохранность данных. Если говорить про 3 дата ноды, то вместо 1.5Т данных на каждой дата ноде иметь по 500G на каждой и при выход любой ноды 1/3 часть данных просто не будет отображаться в кибане, но на работе кластера не отразиться.
Hello @freeman999 , it would be really easy for us to understand the issue if it's written in English.
Nevertheless, for your questions:
Yes, your understanding is correct. In case of node failure, replica shard will be marked as primary shard.
If you don't want replica shards, you can always update your index template or log shipper and define number of primary shards = number of data nodes and replica_shard_count=0.
@Ayush_Mathur Thank you so much for you answers !!!
Please tell me where I can read about how to update my index template or log shipper and how to define the variables you've written about ?
Thank you again)
And it seems fluent-bit does not have index template where we can change number_of_shards and number_of_replicas. Should I create own Elastic Search index template ?
Yes, in case of fluentd and fluentd-bit, you cannot define template and index settings unfortunately.
In this case, create an index template in Kibana (essentially stored and followed by ES) where you can specify index settings.
In index template, you define an index pattern, for instance logstash* in your case. This setting makes sure that any index generated with index name following logstash* pattern must conform to test_1 index template.
To test this, you can create another index, say test_index, but it won't be created with settings and property mappings specified in your test_1 template.
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.