Здравствуйте!
Пользуюсь облачным решением, тариф - Memory 16 GB, Storage 384 GB.
В связи с увеличившейся нагрузкой (увеличилось количество запросов), планирую выбрать опцию 2 Data Centers.
Подскажите как это отразится на производительности кластера? Хорошая ли это мера для уменьшения времени агрегации данных по запросам?
Попутный вопрос, возможен ли переезд на 2 Data Centers с понижением тарифа? То есть я хочу сохранить стоимость понизив тариф до Memory 8 GB, Storage 192 GB но используя при этом 2 Data Centers.
Как распределяются индексы по дата центрам? Они дублируются или случайным образом попадают на тот или иной дата центр?
Спасибо!
Во-первых, это повысит доступность ваших данных: в случае выхода из строя сервера в одном DC ваш кластер будет продолжать работать (см 3). Также это повысит производительность так как с увеличением количества реплик, растёт и скорость обработки запросов на чтение (но не на запись).
Как я упомянул выше, переход на два сервера повысит производительность запросов на чтение, однако уменьшение объема каждого сервера может сказаться на производительности потому что оба сервера будут содержать то же количество индексов\шард и накладные расходы в общем увеличатся.
В случае с 2AZ мы конфигурируем кластер таким образом, чтобы как минимум одна реплика шарда была в другой AZ.
В любом случае, вы можете попробовать 2 по 8, и если будет мало, то расширится до 2х по 16.
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.