Задать вопрос

mayton2019

Bigdata Engineer

1383

вклад
26

вопросов
2788

ответов
19%

решений

Ответы пользователя по тегу Kafka

Как запретить интансам получать данные из одной и той же партиции?

mayton2019 @mayton2019
Bigdata Engineer

Твоя задача может быть решена конфигурацией consumers вот как тут пишут https://www.baeldung.com/kafka-send-data-partition

Но мне кажется что тебе выгоднее решать такое разделением на топики а не на партишены.
Партишены - все таки больше для affinity, баланса нагрузки чем для разделения на бизнес-кейсы.

Ответ написан более года назад

2 комментария

2 комментария
Как часто стоит открывать и закрывать соединение при записи в БД из Kafka?

mayton2019 @mayton2019
Bigdata Engineer

В самом вопросе есть какой-то конфликт интересов. С одной стороны сессии БД надо экономить.
Тоесть нужно их закрывать. С другой стороны реакция на это сообщение в БД должна быть быстрой.

Мне кажется что без какого-то дополнительного SLA или штрафов со стороны бизнеса, этот вопрос
просто невозможно решить.

Я-бы еще этот вопрос рассмотрел в суточной нагрузке. Если например событие с кафки приходят
от кассовых аппаратов то их надо обработать обязательно в течение дня. Тоесть БД должна быть
открыта всегда. Ну а на ночь можно изменить режим работы косньюмеров и сделать их более
вялыми и дать возможность ночным джобам поработать в БД спокойно.

Ответ написан более года назад

Комментировать

Комментировать
Какие есть инструменты и решения для экстремально быстрой online-аналитики потоковых данных?

mayton2019 @mayton2019
Bigdata Engineer

При расчете аналитики (min/max/avg) и прочих оконных функций сам алгоритм имеет лаг.
Тоесть ты должен понимать что за 1 мс ты можешь анализировать данные в прошлом за окно
размером к примеру в 100мс.

Нельзя выводить точную аналитику на основе мгновенного значения.

Ответ написан более года назад

5 комментариев

5 комментариев
Используем kafka + spring boot, периодически listener перестает получать сообщения?

mayton2019 @mayton2019 Куратор тега Java
Bigdata Engineer

На производительность кафки влияет 4 сущности. Конфиг брокера, продюсера, консюмера и message configuration.
Очень сложно разбираться в том что у тебя происходит на основании такого странного теста. Скажи
сколько времени ты ждал этого загадочного listener. Как ты ждал. В какой лог смотрел. Почему
ты вообще решил что это проблема. Может продюсер ничего не производит. Короче дай картину
происходящего более подробную.

Ответ написан более двух лет назад

2 комментария

2 комментария
Как лучше сделать архитектуру сервиса с Cassandra?

mayton2019 @mayton2019
Bigdata Engineer

Объем данных - терабайт в день. 90 МБ/с траффика в пике.
Скорость ответа сервисов и мгновенная запись не важна, важно записать данные.

Между первым и вторым сервисом можно поставить Kafka. Это позволит смягчить ситуацию частичной
недоступности пишущего сервиса. Я здесь далее по топику предполагаю что Kafka и Cassandra - это облачные
решения которые в приципе не падают. А если и падают то очень редко и по крайне жестким авариям датацентров.

В этом случае в качестве точек сбоя можно просто рассматривать два ваших микросервиса.

Еще вариант. Вообще убрать пишущий микро-сервис. Я не знаю как в кассандре. Но в bigdata есть огромное
число т.н. коннекторов. Это что-то типа драйвера который позволяет писать стриминг в базы и наоборот.
Например есть коннектор который пишет сразу из Kafka в таблицы Databricks. Скорее всего для кассандры
тоже есть нечто подобное. Мне кажется с коннектором архитектурно получается проще.

Ответ написан более двух лет назад

2 комментария

2 комментария
Не запускается Kafka в docker-compose, как починить?

mayton2019 @mayton2019
Bigdata Engineer

Сравнительно недавно в Кафку завезли новый стандарт кворума на основе Raft-протокола. Это означает что Смотритель зоопарка будет скоро не нужен и его можно будет выкинуть нафик. А все ноды Кафки будут решать кворумные вопросы самостоятельно.

Ответ написан более двух лет назад

3 комментария

3 комментария
Можно ли с помощью Kafka объединять результаты задач на базе общего id?

mayton2019 @mayton2019
Bigdata Engineer

Автор не правильно формулирует задачу.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Самые активные сегодня

Drno
- 4 ответа
- 0 вопросов
VoidVolker
- 2 ответа
- 0 вопросов
Valdemar Smörman
- 1 ответ
- 0 вопросов
Олег Ткаченко
- 0 ответов
- 1 вопрос
rPman
- 1 ответ
- 0 вопросов
aero0
- 0 ответов
- 1 вопрос

Как запретить интансам получать данные из одной и той же партиции?

Как часто стоит открывать и закрывать соединение при записи в БД из Kafka?

Какие есть инструменты и решения для экстремально быстрой online-аналитики потоковых данных?

Используем kafka + spring boot, периодически listener перестает получать сообщения?

Как лучше сделать архитектуру сервиса с Cassandra?

Не запускается Kafka в docker-compose, как починить?

Можно ли с помощью Kafka объединять результаты задач на базе общего id?

Войдите на сайт