Большие данные на домашнем компьютере?

Question

Dima231 @Dima231

Big data

Большие данные на домашнем компьютере?

Здравствуйте! Хотелось бы заняться изучением больших данных. Насколько мощным должен быть компьютер для работы с такими данными, именно для изучения этой темы?

Вопрос задан более трёх лет назад
538 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

DevOps

+2 ещё

Средний
Возможно ли несколько Hadoop на одной машине?
- 1 подписчик
- 11 дек. 2024
- 82 просмотра
0

ответов
Big data

+1 ещё

Средний
Откуда брать наборы данных для наполнения базы?
- 1 подписчик
- 10 дек. 2024
- 114 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Кто-нибудь запускал llama 3.1 405b?
- 1 подписчик
- 10 сент. 2024
- 253 просмотра
1

ответ
Искусственный интеллект

+1 ещё

Средний
Как можно максимально уменьшить размер данных?
- 3 подписчика
- более года назад
- 515 просмотров
1

ответ
Алгоритмы

+1 ещё

Простой
Как крупные веб сервисы хранят массивы данных?
- 1 подписчик
- более года назад
- 143 просмотра
1

ответ
Нейронные сети

+3 ещё

Средний
Какие есть стандартные наборы данных для тестирования и сравнения нейронных сетей?
- 1 подписчик
- более года назад
- 105 просмотров
2

ответа
PostgreSQL

+3 ещё

Средний
Какую БД выбрать для хранения и обработки большого кол-ва сообщений?
- 1 подписчик
- более двух лет назад
- 266 просмотров
1

ответ
Big data

Простой
Какой процент распознавания точности артикула штучного товара на витрине по его внешнему виду считается «хорошим» а какой — «отличным»?
- 1 подписчик
- более двух лет назад
- 108 просмотров
1

ответ
Big data

Средний
Как эффективно составить гистограмму слов (big data)?
- 1 подписчик
- более двух лет назад
- 124 просмотра
4

ответа
Python

+2 ещё

Средний
Как оптимизировать алгоритм SlopeOne в python?
- 1 подписчик
- более двух лет назад
- 131 просмотр
1

ответ
Показать ещё Загружается…

Frontend Developer - React

RSD

До 250 000 ₽

Golang Developer

ITK academy • Казань

от 75 000 до 120 000 ₽

Senior Node.JS Developer

RSD • Москва

До 400 000 ₽

Answer 1 · 2019-08-13 19:49:23

Для работы одного компьютера не хватит, нужен кластер. А для изучения работы с большими данными сами большие данные не нужны.

Answer 2 · 2019-08-13 21:08:39

Само понятие 'большие данные' подразумевает что данных ТАК МНОГО что обычные подходы и инструменты не катят.

Например (все цифры от балды, только чтобы показать порядок проблемы), вам надо обработать логи вашего веб сервера, ваши скрипты перелопачивают данные за сутки посещаемости - за пол часа на вашем домашнем компьютере. А теперь попробуйте обработать логи какого-нибудь avito или яндекс, даже нагрузив все ваши домашние компьютеры, телефоны, роутеры, компьютеры ваших друзей, родни и даже компы в вашем классе, ваш скрипт все равно не будет успевать их обрабатывать, так как их будет поступать больше на порядок.

Это и есть big data.

Т.е. задачи в этой области стоят такие, чтобы искать нестандартные подходы к решению, либо менять алгоритм, чтобы он позволил увеличить эффективность обработки на порядки (т.е. это не оптимизация кода а именно смена подхода), либо вам потребуется действительно большой кластер машин, а это дорого.

Чтобы изучать и экспериментировать, сами большие данные не нужны, хотя чтобы протестировать алгоритмы, выборки из них понадобятся.

Answer 3 · 2019-08-13 22:13:19

для изучения можно легкий ноутбук использовать, схемы и подходы одни и теже.
тотже Spark, можно запускать локально хоть на ноутбуке

Большие данные на домашнем компьютере?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт