Как лучше сделать архитектуру сервиса с Cassandra?

Question

vanchenkin @vanchenkin

Как лучше сделать архитектуру сервиса с Cassandra?

Привет!

Сейчас архитектура такая: есть два микросервиса: первый собирает данные от клиента через вебсокет, передает второму по http, второй сохраняет эти данные в Cassandra.
Развернуто много инстансов и первого и второго микросервисов. Развернуто много нод кассандры, фактор репликации - 2.
Объем данных - терабайт в день. 90 МБ/с траффика в пике.
Скорость ответа сервисов и мгновенная запись не важна, важно записать данные.

Такая архитектура выглядит плохо:
- если упадет второй микросервис, то данные перестанут писаться
- если нагрузка станет слишком высокой, то микросервисы могут каскадно лечь
- сетевые ошибки при HTTP
- двойное потребление ресурсов из-за HTTP

В связи с этим появилось два варианта улучшения:
- смержить эти два микросервиса в один
- поставить между этими микросервисами надежную Kafka

Cassandra вроде как надежная, но тогда мы уходим от микросервисной архитектуры в сторону монолита, сервисы начинают выполнять несколько задач, что плохо.

С Kafka мы защитимся от пиков нагрузки, но появляется еще один сервис для мониторинга, еще одна связь в цепочке, места для возникновения ошибок. Но мы защитимся от падения Cassadra.

Постарался описать все ограничения, но если что - спрашивайте в комментариях, задачка интересная.

Какой вариант лучше выбрать? Или может есть другие варианты?

Вопрос задан более двух лет назад
119 просмотров

Комментировать

Подписаться 2 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

1C-разработчик

8 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Проектирование программного обеспечения

+1 ещё

Простой
Есть ли типовые архитектуры системы диспечерезации?
- 1 подписчик
- 07 нояб.
- 65 просмотров
2

ответа
Docker

+1 ещё

Простой
Откуда скачивать bitnami/kafka?
- 1 подписчик
- 29 окт.
- 553 просмотра
1

ответ
Python

+1 ещё

Простой
Python kafka не видит headers?
- 1 подписчик
- 29 сент.
- 151 просмотр
1

ответ
Проектирование программного обеспечения

Простой
Как правильно в EventDriven?
- 1 подписчик
- 26 сент.
- 123 просмотра
2

ответа
Java

+2 ещё

Простой
Какие есть варианты grpc service discovery с минимальным откликом?
- 1 подписчик
- 17 сент.
- 117 просмотров
0

ответов
1С

+1 ещё

Средний
Дашборд. Какую методу сбора данных и платформу выбрать для разработки?
- 1 подписчик
- 04 сент.
- 180 просмотров
4

ответа
Kafka

Сложный
Как в Apache Kafka изменить состав кворума в хранилище метаданных?
- 1 подписчик
- 22 авг.
- 27 просмотров
0

ответов
Проектирование программного обеспечения

Простой
Как в 2025 году приблизиться к полному CAP (не AP/CP/CA), а именно к CAP?
- 6 подписчиков
- 12 авг.
- 1218 просмотров
1

ответ
RESTful API

+2 ещё

Простой
Имеет ли смысл реализация REST API через RabbitMQ?
- 2 подписчика
- 11 авг.
- 323 просмотра
1

ответ
Проектирование программного обеспечения

+1 ещё

Средний
Сможет ли кластер minio выдержать 60000 клиентов, стримящих данные?
- 2 подписчика
- 03 авг.
- 395 просмотров
3

ответа
Показать ещё Загружается…

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Старший инженер

Гринатом • Петрозаводск

До 80 000 ₽

Project менеджер / Менеджер проекта

W3Promo • Москва

от 60 000 до 100 000 ₽

Answer 1 · 2023-06-04 14:56:50

Объем данных - терабайт в день. 90 МБ/с траффика в пике.
Скорость ответа сервисов и мгновенная запись не важна, важно записать данные.

Между первым и вторым сервисом можно поставить Kafka. Это позволит смягчить ситуацию частичной
недоступности пишущего сервиса. Я здесь далее по топику предполагаю что Kafka и Cassandra - это облачные
решения которые в приципе не падают. А если и падают то очень редко и по крайне жестким авариям датацентров.

В этом случае в качестве точек сбоя можно просто рассматривать два ваших микросервиса.

Еще вариант. Вообще убрать пишущий микро-сервис. Я не знаю как в кассандре. Но в bigdata есть огромное
число т.н. коннекторов. Это что-то типа драйвера который позволяет писать стриминг в базы и наоборот.
Например есть коннектор который пишет сразу из Kafka в таблицы Databricks. Скорее всего для кассандры
тоже есть нечто подобное. Мне кажется с коннектором архитектурно получается проще.

Как лучше сделать архитектуру сервиса с Cassandra?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт