Стоит ли использовать kafka connect в проде?

Question

Skyline918 @Skyline918

Kafka

Стоит ли использовать kafka connect в проде?

В компании активно используются confluent кафка коннекторы из кафки в s3 (sink). В эксплуатации мы конкретно так замучились:
- странная модель рестартов, когда надо перезапускать через рест апи, соответственно мониторить гет запросами
- жрет много памяти
- какая-то ну просто супер непонятная модель настройки, документация треш. Развернуто оно в кубере хелм чартом, но банально разграничить чтобы один коннектор писал чз одни креды а другой через другие, не невозможно, но очень неудобно
- используется 3 внешних топика для хранения оффсетов не до конца понятно зачем, если есть протокол самой кафки. Одна консумер группа и 2 коннектора будут работать как 2 разных консумера

Хотя и круты они как минимум:
- группировкой в партиции по времени (+сжатие)
- ретраи, идемпотентность (вроде)

Что я хочу спросить:
- поделитесь пж опытом, мб мы просто как-то не так с этим работаем, не у нас одних же сложилось впечатление что это какой-то костыль с точки зрения реализации
- кто использует какие альтернативы
- мб есть какие-то советы, бест практис итп

Вопрос задан 12 мар.
108 просмотров

3 комментария

Подписаться 1 Средний 3 комментария

mayton2019 @mayton2019

Что у вас было раньше до Кафки?

Написано 12 мар.
Skyline918 @Skyline918 Автор вопроса

mayton2019, всегда была кафка насколько я знаю. Но уточню что вопрос не про саму кафку, вопрос про кафка коннектор "confluent kafka connect"

Написано 12 мар.
mayton2019 @mayton2019

По поводу этого. Мысли.

жрет много памяти

Кafka Connect - под крышечкой содержит различные имплементации синков и драйверов.
В данном случае вы используете s3. Поэтому ответы на вопросы надо искать в s3.

У меня есть личное неприятное воспоминание по поводу s3. Кажется его API может потреблять
чуть больше памяти чем вы думаете. Посмотрите какого размера файлы вы пишете в синк.
И сколько висят у вас в пуле в ожидании записи. Возможно требуется тюнинг.

Вообще бизнес смотрит на проблемы памяти с безразличием. Цена памяти в наше время дешевая.
Дешевле купить более толстую виртуалку +32Гб чем оплачивать 1 месяц работы для синьор-девелопер
или девопс.

Если вам сильно-сильно интересно - сделайте дамп памяти и посмотрите. Java, в отличие от других
runtime хранит очень много сведений о куче. Сможете понять что за бизнес-объекты у вас сожрали все.

Написано 12 мар.

Помогут разобраться в теме Все курсы

Яндекс Практикум

DevOps для эксплуатации и разработки

7 месяцев

Далее
Нетология

Java-разработчик с нуля

12 месяцев

Далее
OTUS

Microservice Architecture

5 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Docker

+1 ещё

Простой
Откуда скачивать bitnami/kafka?
- 1 подписчик
- 29 окт.
- 351 просмотр
1

ответ
Python

+1 ещё

Простой
Python kafka не видит headers?
- 1 подписчик
- 29 сент.
- 150 просмотров
1

ответ
Kafka

Сложный
Как в Apache Kafka изменить состав кворума в хранилище метаданных?
- 1 подписчик
- 22 авг.
- 26 просмотров
0

ответов
Docker

+1 ещё

Простой
Как написать локальный kafka со способом авторизации юзеров: username, password, SASL_SSL, SCRAM-SHA-512?
- 2 подписчика
- 26 апр.
- 892 просмотра
0

ответов
Android

+4 ещё

Средний
Взаимодействие приложения такси с сервером в реальном времени, какие протоколы и технологии использовать?
- 1 подписчик
- 04 янв.
- 353 просмотра
3

ответа
Kafka

Средний
Почему в списке консьюмеров топика новый консьюмер появился только после первого сообщения?
- 1 подписчик
- более года назад
- 39 просмотров
0

ответов
Selenium

+1 ещё

Средний
Есть ли пример авто-теста на Selenide для получения топика Kafka?
- 1 подписчик
- более года назад
- 57 просмотров
0

ответов
Kafka

Простой
Чем отличается Журнал коммитов и Топик в Kafka Apache?
- 1 подписчик
- более года назад
- 43 просмотра
1

ответ
Kafka

Средний
Как победить ошибку при коммите kafka producer transaction?
- 1 подписчик
- более года назад
- 45 просмотров
0

ответов
Показать ещё Загружается…

Full-Stack Разработчик (PHP 8 / Node JS / Vue JS / PostgreSQL)

Складно

от 150 000 ₽

Python developer

IT ATLAS • Москва

До 300 000 ₽

Big Data / ETL Engineer

Oracul Analytics

от 300 000 до 450 000 ₽

mayton2019, всегда была кафка насколько я знаю. Но уточню что вопрос не про саму кафку, вопрос про кафка коннектор "confluent kafka connect"
По поводу этого. Мысли.

жрет много памяти

Кafka Connect - под крышечкой содержит различные имплементации синков и драйверов.
В данном случае вы используете s3. Поэтому ответы на вопросы надо искать в s3.

У меня есть личное неприятное воспоминание по поводу s3. Кажется его API может потреблять
чуть больше памяти чем вы думаете. Посмотрите какого размера файлы вы пишете в синк.
И сколько висят у вас в пуле в ожидании записи. Возможно требуется тюнинг.

Вообще бизнес смотрит на проблемы памяти с безразличием. Цена памяти в наше время дешевая.
Дешевле купить более толстую виртуалку +32Гб чем оплачивать 1 месяц работы для синьор-девелопер
или девопс.

Если вам сильно-сильно интересно - сделайте дамп памяти и посмотрите. Java, в отличие от других
runtime хранит очень много сведений о куче. Сможете понять что за бизнес-объекты у вас сожрали все.

Стоит ли использовать kafka connect в проде?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт