@shmelfrol

Ceph или хадууп?

Здравствуйте, подскажите пожалуйста, что лучше использовать для хранения файлов ceph или хадуп. Хранить будем небольшие файлы - обычные офисные документы, может и большие файлы, но редко. Хотим реализовать веб-клиента и внутренне приложение для просмотра, скачивания и загрузки. Также на хадупе может быть возможно сделать какие-то распределенные вычисления? У нас ВУЗ и если хранение файлов можно совместить с какой-нибудь долей науки было бы неплохо.Основная цель - конечно, распределенная файловая система.
  • Вопрос задан
  • 228 просмотров
Пригласить эксперта
Ответы на вопрос 3
@voleg4u
http://www.voleg.info/
Добавьте в список NFS и CIFS. Классическая файлопомойка.
Ответ написан
Комментировать
Не работал с обоими, но, насколько понимаю, Hadoop заведомо не подходит, если речь только не об оффлайн хранении и обработке документов.
Похоже, что вам остается Ceph, который, кстати, реализует интерфейс S3.

Зато в MongoDB есть GridFS и она хорошо масштабируется. GridFS разбивает файлы и хранит их кусками 255 kB.
Еще есть GlusterFS и другие решения.
Ответ написан
Комментировать
Однозначно не hadoop.
Хадуп крайне не эффективно хранит файлы чей размер меньще размера блока
Хадуп точно не для online решений
Хадуп требует сложной и хорошо продуманной инфраструктуры
Накладные расходы на нормальный отказоустойчивый кластер, заставят вас рыдать в том случае если у вас меньше 250 Tb.
Хадуп это не про один раз настроил и забыл
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы