Задать вопрос

x88 @x88

bigdata

Стратегии масштабирования Cassandra?

Доброго времени суток. Какие существуют стратегии масштабирования (или экспорта данных в warehouse) для Cassandra? Требуется хранить и обрабатывать (Spark) большие объемы логов (~ 30 млн записей в сутки). В документации указано, что для partition ограничение составляет 2млрд (cols x rows) ячеек, причем что имеется ввиду под partition не совсем понятно. Прошу подсказать по поводу того, что имеется ввиду под partition и какие подходы к решению данной задачи могут быть (пока что мне видится создание таблиц для каждого месяца, а затем join через spark, если временной промежуток запроса затрагивает несколько месяцев)?

Вопрос задан более трёх лет назад
342 просмотра

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science

13 месяцев

Далее
Яндекс Практикум

Аналитик данных расширенный

12 месяцев

Далее
Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

+1 ещё

Средний
Почему Apache Cassandra не отвечает на сообщение запуска?
- 1 подписчик
- 20 февр.
- 77 просмотров
0

ответов
Apache Cassandra

Средний
Как правильно создать таблицу сообщений пользователей?
- 1 подписчик
- 15 дек. 2024
- 36 просмотров
0

ответов
DevOps

+2 ещё

Средний
Возможно ли несколько Hadoop на одной машине?
- 1 подписчик
- 11 дек. 2024
- 93 просмотра
0

ответов
Big data

+1 ещё

Средний
Откуда брать наборы данных для наполнения базы?
- 1 подписчик
- 10 дек. 2024
- 124 просмотра
2

ответа
Нейронные сети

+1 ещё

Простой
Кто-нибудь запускал llama 3.1 405b?
- 1 подписчик
- более года назад
- 268 просмотров
1

ответ
Искусственный интеллект

+1 ещё

Средний
Как можно максимально уменьшить размер данных?
- 3 подписчика
- более года назад
- 521 просмотр
1

ответ
Алгоритмы

+1 ещё

Простой
Как крупные веб сервисы хранят массивы данных?
- 1 подписчик
- более года назад
- 152 просмотра
1

ответ
Нейронные сети

+3 ещё

Средний
Какие есть стандартные наборы данных для тестирования и сравнения нейронных сетей?
- 1 подписчик
- более двух лет назад
- 117 просмотров
2

ответа
Проектирование программного обеспечения

+3 ещё

Средний
Как лучше сделать архитектуру сервиса с Cassandra?
- 2 подписчика
- более двух лет назад
- 118 просмотров
1

ответ
PostgreSQL

+3 ещё

Средний
Какую БД выбрать для хранения и обработки большого кол-ва сообщений?
- 1 подписчик
- более двух лет назад
- 273 просмотра
1

ответ
Показать ещё Загружается…

Big Data / ETL Engineer

Oracul Analytics

от 300 000 до 450 000 ₽

Аналитик 1С (телеком)

LIAN • Москва

от 270 000 до 300 000 ₽

Продуктовый дизайнер

Юзтех

До 225 000 ₽