Изучаю технологию Hadoop для развертывания соответствующего кластера, в связи с этим возник вопрос
в архитектуре кластера Hadoop 1.x фигурирует Secondary Namenode которые содержит изменения fsimage и edits.
Рассматривая архитектуру Hadoop 2.x на примере Hortonworks увидел что вместо Secondary Namenode используется понятие Standby Namenode, который является полноценным standby (в случаем падение основной ноды берет управления на себя).
Теперь вопросы:
1) В hadoop 2.x вместо Secondary Namenode используется Standby Namenode ? или это и тоже ?
2) Производительность hadoop кластера зависит от наличия Secondary (Standby) Namenode ?
3) Можно ли развернуть пилотный проект без Secondary (Standby) Namenode ?
Получил ответ из других источников
1) с версии Hadoop 2.x появилась возможность использования полноценного StandBy вместо Secondary Namenode, так как он является полноценным standby и мождет использоваться в случае падения основной ноды. в то время как Secondary Namenode используется для восстановления основной ноды по логам, которые на него записываются
2) На производительность не влияет
3) Да можно, но в случае проблем с основной нодой восстановить кластер будет невозможно