Несбалансированный Cassandra кластер

Question

max_mara @max_mara

Несбалансированный Cassandra кластер

Доброй ночи, Хабровчане. Как дела?

Мы с товарищем тестируем Кассандра кластер из двух датацентров по пять нод в каждом. Написали небольной скрипт, используя Faker что-бы забить кластер тестовыми данными. Сейчас в базе около 5 миллионов записей.

Мы создали keyspace HugeData используя NetworkTopologyStrategy = 3 на каждый ДЦ.

Проблема в том, что мы думали, что данные размажутся равномерно на 10-ти нодах, но на первом скриншоте видно, что только первые 6 забиты данными (оно и понятно, replication factor 3 на каждый ДЦ).
Возможно это из-за того, что кластер не сбалансирован? Почему кассандра забила только 6 нод, а не все 10?

Вот что показывает nodetool satus

[root@dc2rac1cs1 ~]# nodetool -h 10.1.10.75 status
Datacenter: DC1
===============
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address           Load       Owns   Host ID                               Token                                    Rack
UN  10.1.10.75        144.43 MB  60.0%  9bac71dd-1faf-42c8-a26c-d8fff47abf15        0                                                                 RAC1
UN  10.1.10.78        168.48 MB  2.5%   c9175995-54dd-4ef2-a4d1-5472d46d8477  2767011611056432740                      RAC1
UN  10.1.10.79        152.05 MB  2.5%   69c545ba-716c-4b51-92c1-760063addf00  3689348814741910320                      RAC1
UN  10.1.10.76        41.34 MB   0.0%   3d24f678-e3bf-42b0-b4b9-47346e290310  3689348814741910322                      RAC1
UN  10.1.10.77        51.81 MB   10.0%  796b196b-6f19-4479-a678-021fa472e107  7378697629483820644                      RAC1
Datacenter: DC2
===============
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address           Load       Owns   Host ID                               Token                                    Rack
UN  10.1.10.80        127.16 MB  2.5%   11b62771-319a-4afd-aeef-40854577d56a  461168601842738790                       RAC1
UN  10.1.10.82        149.95 MB  10.0%  ee7ddb5e-fe89-4faa-bab6-e5cb33501fd9  2305843009213693950                      RAC1
UN  10.1.10.83        146.12 MB  2.5%   7cdc6a59-577f-4b00-a217-c9e5bb5cd77e  3228180212899171530                      RAC1
UN  10.1.10.84        23.07 MB   2.5%   64c545c6-e82f-4983-b36b-1bfeed88af1e  4150517416584649110                      RAC1
UN  10.1.10.81        18.36 MB   7.5%   0c61d2a2-c255-48fe-b2e3-fac4670c008f  5534023222112865483                      RAC1

Вопрос номер 1) Как сбалансировать кластер?
2) Почему данные не размазываются равномерно?
3) Мы тестируем cassandra 1.2 и максимальный токен 2^63, а не 2^123. Ноды просто не запускаются с токеном, значение которого больше чем 2^63 (Java Exception). Неужели они уменьшили токен, но все еще не обновили документацию?

Вот еще пара скриншотов для затравки

P.S.: Если человекам будет интересно, я могу запустить несколько бенчмарков и позже написать статью о том, как мы подняли этот кластер и все результаты бенчмарковю

UPD: Проблема с токенами решена. В Cassandra начиная с версии 1.2 токен не от 0 до 2^126, а -2^63 До +2^63.
www.datastax.com/docs/1.2/initialize/token_generation
Сейчас попытаемся пересоздать токены и посмотрим, что будет.

Вопрос задан более трёх лет назад
5038 просмотров

8 комментариев

Подписаться 4 Оценить 8 комментариев

max_mara @max_mara Автор вопроса
P.S.: CQL запрос

SELECT COUNT (*) FROM Emails LIMIT 1000000;

выдал rpc_timeout, после чего первая нода умерла. После рестарта она безбожно начала обмениватся данными с остальными нодами и судя-по всему данные теперь размажутся ровным слоем по кластеру. Но вопрос все еще в силе: как сбалансировать данные вручную?
Написано более трёх лет назад
EugeneOZ @EugeneOZ

А кнопочку Rebalance уже нажимали?

Написано более трёх лет назад
max_mara @max_mara Автор вопроса

Кнопочка Rebalance доступна только в Enterprise версии, к тому-же мы хотим понимать физику процесса.

Написано более трёх лет назад
max_mara @max_mara Автор вопроса

Оставили клатер на ночь, судя по всему он начал распаковывать логи транзакций и физически писать данные в бд. Вот на что похож кластер сейчас

Написано более трёх лет назад
EugeneOZ @EugeneOZ

А меня оттолкнула низкая динамика развития Cassandra в целом и их хаотичность. Документация местами содержит информацию по версии 0.8. Сначала они делали schema-less и super-columns, потом зафигачили CQL и убрали super-columns. Эволюция это круто, конечно, но с такой стабильностью делать что-то на Cassandra опасно. Я переключился на Couchbase. И ещё жду выхода Redis Server.

Написано более трёх лет назад
max_mara @max_mara Автор вопроса

Хмм, вроде SuperColumns еще никуда не убрали. К тому-же меня привлекает то, что Cassandra успешно используется крупными компаниями. Хотя Redis то-же выглядит привлекательно.

Написано более трёх лет назад
EugeneOZ @EugeneOZ

Убрали, убрали: www.datastax.com/dev/blog/introduction-to-composite-columns-part-1. Крупные компании чем только не пользуются :)

Написано более трёх лет назад
relgames @relgames

Они предлагают использовать композитные ключи вместо super columns, но сами super columns никуда не исчезли.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Java-разработчик с нуля

12 месяцев

Далее
Яндекс Практикум

Фулстек-разработчик

16 месяцев

Далее
OTUS

PHP Developer. Professional

5 месяцев

Далее

Решения вопроса 1

3 комментария

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

+1 ещё

Средний
Почему Apache Cassandra не отвечает на сообщение запуска?
- 1 подписчик
- 20 февр.
- 78 просмотров
0

ответов
Apache Cassandra

Средний
Как правильно создать таблицу сообщений пользователей?
- 1 подписчик
- 15 дек. 2024
- 37 просмотров
0

ответов
DevOps

+2 ещё

Средний
Возможно ли несколько Hadoop на одной машине?
- 1 подписчик
- 11 дек. 2024
- 95 просмотров
0

ответов
Big data

+1 ещё

Средний
Откуда брать наборы данных для наполнения базы?
- 1 подписчик
- 10 дек. 2024
- 128 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Кто-нибудь запускал llama 3.1 405b?
- 1 подписчик
- более года назад
- 271 просмотр
1

ответ
NoSQL

+2 ещё

Сложный
Как правильно разрабатывать гибкую клиент серверную архитектуру и делать клиент серверные игры на Godot?
- 1 подписчик
- более года назад
- 140 просмотров
1

ответ
Искусственный интеллект

+1 ещё

Средний
Как можно максимально уменьшить размер данных?
- 3 подписчика
- более года назад
- 521 просмотр
1

ответ
Алгоритмы

+1 ещё

Простой
Как крупные веб сервисы хранят массивы данных?
- 1 подписчик
- более года назад
- 153 просмотра
1

ответ
SQL

+1 ещё

Простой
Какую бд лучше выбрать?
- 1 подписчик
- более года назад
- 122 просмотра
1

ответ
NoSQL

Простой
Реально на NoSQLсделать полноценный ИМ?
- 1 подписчик
- более года назад
- 255 просмотров
1

ответ
Показать ещё Загружается…

Golang Developer (Уфа)

TAGES • Уфа

от 50 000 до 143 400 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Фронтенд разработчик (Frontend developer)

Айдис

от 100 000 ₽

P.S.: CQL запрос

SELECT COUNT (*) FROM Emails LIMIT 1000000;

выдал rpc_timeout, после чего первая нода умерла. После рестарта она безбожно начала обмениватся данными с остальными нодами и судя-по всему данные теперь размажутся ровным слоем по кластеру. Но вопрос все еще в силе: как сбалансировать данные вручную?
Кнопочка Rebalance доступна только в Enterprise версии, к тому-же мы хотим понимать физику процесса.
Оставили клатер на ночь, судя по всему он начал распаковывать логи транзакций и физически писать данные в бд. Вот на что похож кластер сейчас
А меня оттолкнула низкая динамика развития Cassandra в целом и их хаотичность. Документация местами содержит информацию по версии 0.8. Сначала они делали schema-less и super-columns, потом зафигачили CQL и убрали super-columns. Эволюция это круто, конечно, но с такой стабильностью делать что-то на Cassandra опасно. Я переключился на Couchbase. И ещё жду выхода Redis Server.
Хмм, вроде SuperColumns еще никуда не убрали. К тому-же меня привлекает то, что Cassandra успешно используется крупными компаниями. Хотя Redis то-же выглядит привлекательно.
Убрали, убрали: www.datastax.com/dev/blog/introduction-to-composite-columns-part-1. Крупные компании чем только не пользуются :)
Они предлагают использовать композитные ключи вместо super columns, но сами super columns никуда не исчезли.

Answer 1 · 2013-01-30 08:18:58

Проблема была в токенах. У нас были токены от 0 до +2^63, а начиная с версии 1.2 токены идут от -2^63 до +2^63.
Мы решили пойти дальше и использовать виртуальные ноды (появились в версии 1.2), в этом случае Кассандра сама располагает ноды оптимальным образом по кольцу.

Предлагайте свои идеи бенчмарков, я позже статью напишу с результатами.

Answer 2 · 2013-01-29 09:40:29

dimian @dimian

Очень интересна данная тема, хотелось бы увидеть бенчмарки

Ответ написан более трёх лет назад

2 комментария

Answer 3 · 2017-02-28 01:23:29

Алексей Типа @KayzerSoze

Адекватен

Есть желание поближе познакомиться, с целью удовлетворения интереса в теме.

Ответ написан более трёх лет назад

Комментировать

Несбалансированный Cassandra кластер

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт