Какие есть аналоги hadoop для небольших объемов данных?

Question

Александр Ковальчук @mamut

web artisan

Какие есть аналоги hadoop для небольших объемов данных?

Сейчас я продумываю архитектуру ПО где нужно будет получат данные и обработав их хранить.
Данных максимум будет 2-3 ТВ и они будут приходить невиличкимы порциями в течение 3-5 лет.
Сервер будет один и потому просочились сомнения целесообразно ли будет использовать hadoop, пока это выглядит как запускать боинг для доставки пиццы.
Вот и поэтому заинтересовался вопросом которые могут быть аналоги?
Какие есть подходящие варианты для такого объема данных?
И если стоит брать hadoop то какие конфигурации будут подходящими?

Вопрос задан более трёх лет назад
3544 просмотра

3 комментария

Подписаться 6 Оценить 3 комментария

nirvimel @nirvimel

Зачем вам софт для распределенных вычислений?
У вас есть много серверов, ни один из которых по одиночке не справляется с объемами нагрузки?
Если это - не ваша ситуация, то Hadoop - решение не вашей проблемы.

Написано более трёх лет назад
Александр Ковальчук @mamut Автор вопроса

nirvimel: Вот и размышляю что бы было решением моей проблемы когда один сервер и не слишком объемные данные но нужно делать расчеты и выбирать данные

Написано более трёх лет назад
DuD @DuD

Александр Ковальчук: если 1 сервак и данных так мало то не надо все усложнять. Кладите в папки и читайте с диска. Весь этот набор BIGDATA ПО вам еще и поддерживать придется в течение всего времени хранения.

Написано более трёх лет назад

Решения вопроса 2

4 комментария

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Open Source

+1 ещё

Простой
Опенсорс ПО для склада, какие есть варианты?
- 2 подписчика
- 20 мар.
- 243 просмотра
4

ответа
Open Source

Средний
Платное open-source приложение?
- 1 подписчик
- 10 мар.
- 206 просмотров
3

ответа
Hadoop

+1 ещё

Средний
Как подключиться к удалённому hdfs из pyspark?
- 1 подписчик
- 03 янв.
- 17 просмотров
0

ответов
DevOps

+2 ещё

Средний
Возможно ли несколько Hadoop на одной машине?
- 1 подписчик
- 11 дек. 2024
- 82 просмотра
0

ответов
Open Source

Средний
Free open-source система менеджемнта инцидентов?
- 1 подписчик
- 16 окт. 2024
- 334 просмотра
1

ответ
Хабр

+1 ещё

Простой
Можно ли писать на хабре об opensource проекте над которым работаю?
- 1 подписчик
- 03 окт. 2024
- 244 просмотра
2

ответа
Open Source

Простой
Где проходит граница между опенсорсом и коммерческим продуктом, основанным на опенсорсе?
- 1 подписчик
- 28 сент. 2024
- 184 просмотра
5

ответов
Веб-разработка

+4 ещё

Средний
Кто знает приложение/сервис/движок/протокол под описанные задачи?
- 1 подписчик
- 22 авг. 2024
- 209 просмотров
5

ответов
Open Source

Простой
Возможно ли использование opensource проекта в коммерческих целях?
- 2 подписчика
- более года назад
- 651 просмотр
3

ответа
Open Source

Средний
Где можно найти готовые примеры записных книжек или руководств, составленных в CherryTree?
- 1 подписчик
- более года назад
- 75 просмотров
0

ответов
Показать ещё Загружается…

Ведущий разработчик С (Open source)

СберТех • Москва

от 300 000 ₽

Инженер баз данных

Сбер • Санкт-Петербург

До 100 000 ₽

Специалист по подбору персонала (IT)

Wanted • Москва

от 60 000 до 120 000 ₽

Зачем вам софт для распределенных вычислений?
У вас есть много серверов, ни один из которых по одиночке не справляется с объемами нагрузки?
Если это - не ваша ситуация, то Hadoop - решение не вашей проблемы.
nirvimel: Вот и размышляю что бы было решением моей проблемы когда один сервер и не слишком объемные данные но нужно делать расчеты и выбирать данные
Александр Ковальчук: если 1 сервак и данных так мало то не надо все усложнять. Кладите в папки и читайте с диска. Весь этот набор BIGDATA ПО вам еще и поддерживать придется в течение всего времени хранения.

Answer 1 · 2016-03-16 15:51:57

Apache Spark - по сути аналог (тот же Map Reduce).

Ну а для обработки и хранения: NumPy и Pandas.

Визуализация: Mathplotlib, seaborn.

P.S. Это всё Питоновский стек.

Answer 2 · 2016-03-17 00:23:15

Marklogic, Splunk, Elasticsearch.
Важно понять, может формат у файлов одинаковый и это все можно вообще в sql базу сунуть, собрать индексы и забыть.

Какие есть аналоги hadoop для небольших объемов данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт