Как правильно организовать микросервисную архитектуру средствами языка Golang?

Question

Mikkkch @Mikkkch

Как правильно организовать микросервисную архитектуру средствами языка Golang?

У меня в планах реализовать проект, суть которого будет заключена в двух сервисах. Один - интерфейс телеграм-бота, в нем осуществлены методы отправки сообщения, проверки обновлений и т.д. Второй - сервис парсинга данных с сайта.

Этот сервис также должен отслеживать новости, например: на сайте, публикующем игры, появился новый обзор, парсер считал информацию о нем, осуществил проверку по айдишнику на наличие и в случае, если такого обзора еще нет, сохранил данные о нем, допустим ,в redis (мне посоветовали его для этих целей).

Вот в чем загвоздка: частью совета были слова, относящиеся к тому, что нужно написать сервер. Как я полагаю, http-сервер. Но есть ли в нем надобность? Ведь ничто не мешает просто написать парсер, который будет запущен и в бесконечном цикле проверять наличие записи и в противном случае складывать данные.

Также я понятия малейшего не имею о том, как все это унифицировать, как избежать лишней проверки на новость в интерфейсе бота, когда парсер уже все проверил. Может как-нибудь отслеживать появляющуюся запись в редисе?

Вопрос задан более трёх лет назад
379 просмотров

13 комментариев

Подписаться 3 Средний 13 комментариев

Иван Шумов @inoise

В самом вопросе есть уже проблема - сервисная (да хоть нано-сервисная) архитектура не имеет никакого отношения к языку программирования. Это про интерфейсы, контракты и ограничение контекста

Написано более трёх лет назад
d'Ivan @2ord

На сайте, публикующем игры появился новый обзор
Каким образом об этом должен узнать ваш сервер?

Написано более трёх лет назад
Mikkkch @Mikkkch Автор вопроса

Роман Мирр, я реализовывал это разными способами, сохранял в файле айдишник, а потом в потоке сверял, сохранял в базу и т.д и т.п. Но меня интересует наиболее лучший способ организации.

Написано более трёх лет назад
d'Ivan @2ord

Mikkkch, мне любопытно, каким образом неподконтрольный вам сервер сообщает о новых обзорах вам на сервер. Или у вас есть какая-то общая интеграция?

Написано более трёх лет назад
Ivan Yakushenko @kshnkvn

Роман Мирр, написано-же - парсить будет.

Написано более трёх лет назад
d'Ivan @2ord

Ivan Yakushenko, ну да, периодически самому проверять тоже можно, только нужно еще разбирать sitemap.

Написано более трёх лет назад
Ivan Yakushenko @kshnkvn

Роман Мирр, зачем?

Написано более трёх лет назад
d'Ivan @2ord

Ivan Yakushenko, а как еще знать, что появилась новая статья XYZ?

Написано более трёх лет назад
Ivan Yakushenko @kshnkvn

Роман Мирр, гляди, какая магия есть:

скриншот

Заходишь раз в N минут и смотришь не появилось ли ничего нового.

Написано более трёх лет назад
d'Ivan @2ord

Ivan Yakushenko, похоже, что эта "магия" ничем не лучше sitemap и даже более ресурсоемка.

Написано более трёх лет назад
Ivan Yakushenko @kshnkvn

Роман Мирр, что там что там 1 запрос, а sitemap есть далеко не везде. Да, парсинг html дерева немного тратит CPU, но настолько немного, что я на vps за 200 рублей кручу в докере парсеры, которые пробегают страницы в ~100 потоков без каких либо проблем, а cpu не забивается под завязку, упираюсь чисто в лимит канала.

Написано более трёх лет назад
d'Ivan @2ord

Ivan Yakushenko, пожалуй, не столько ресурсов ЦПУ тратит, сколько ОЗУ, из-за необходимости держать дерево узлов всей страницы. Но в целом, согласен.

Написано более трёх лет назад
Ivan Yakushenko @kshnkvn

Роман Мирр, даже если нужно проверять обновления сразу на сотнях сайтов, то о ресурсах нет никакого смысла думать - слишком мизерные цифры. Можно начать думать о ресурсах начиная с десятков тысяч страниц, но это все решается очередями и мониторингом доступных ресурсов системы.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Go-разработчик с нуля

9 месяцев

Далее
Skillfactory

Профессия Backend-разработчик на Go

12 месяцев

Далее
Яндекс Практикум

Go-разработчик с нуля

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Go

Простой
Как должна выглядит правильная структура «внедрение зависимостей»?
- 1 подписчик
- 04 нояб.
- 207 просмотров
2

ответа
Go

Простой
Как пропустить поле при конвертации структуры в JSON?
- 1 подписчик
- 15 окт.
- 120 просмотров
0

ответов
Go

Простой
Можно ли получить исходное имя файла до переименования из fsnotify?
- 3 подписчика
- 09 окт.
- 212 просмотров
0

ответов
Go

+1 ещё

Простой
Какой наиболее привычный путь для удаленного хранения настроек линтинга в Go?
- 1 подписчик
- 30 сент.
- 155 просмотров
1

ответ
Go

Простой
GO + FYNE GUI как запустить скрипт после подтверждения в диалоговом окне dialog.ShowConfirm?
- 1 подписчик
- 24 сент.
- 121 просмотр
1

ответ
Go

Простой
GO + FYNE GUI — какой макет — Layout выбрать для desktop приложения? Как сделать сайдбар и контентную часть?
- 2 подписчика
- 22 сент.
- 108 просмотров
1

ответ
Java

+2 ещё

Простой
Какие есть варианты grpc service discovery с минимальным откликом?
- 1 подписчик
- 17 сент.
- 113 просмотров
0

ответов
Go

Простой
GO fyne serve выдает ошибку?
- 1 подписчик
- 13 сент.
- 104 просмотра
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент.
- 445 просмотров
1

ответ
React

+2 ещё

Простой
Как корректно загружать изображения с react на бэкенд через graphql?
- 1 подписчик
- 22 авг.
- 157 просмотров
1

ответ
Показать ещё Загружается…

Senior GO разработчик

SMALL

от 220 000 до 300 000 ₽

Разработчик PHP/Go

ЭТП ГПБ / VESNA

До 220 000 ₽

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

В самом вопросе есть уже проблема - сервисная (да хоть нано-сервисная) архитектура не имеет никакого отношения к языку программирования. Это про интерфейсы, контракты и ограничение контекста
На сайте, публикующем игры появился новый обзор
Каким образом об этом должен узнать ваш сервер?
Роман Мирр, я реализовывал это разными способами, сохранял в файле айдишник, а потом в потоке сверял, сохранял в базу и т.д и т.п. Но меня интересует наиболее лучший способ организации.
Mikkkch, мне любопытно, каким образом неподконтрольный вам сервер сообщает о новых обзорах вам на сервер. Или у вас есть какая-то общая интеграция?
Роман Мирр, написано-же - парсить будет.
Ivan Yakushenko, ну да, периодически самому проверять тоже можно, только нужно еще разбирать sitemap.
Ivan Yakushenko, а как еще знать, что появилась новая статья XYZ?
Роман Мирр, гляди, какая магия есть:

скриншот

Заходишь раз в N минут и смотришь не появилось ли ничего нового.
Ivan Yakushenko, похоже, что эта "магия" ничем не лучше sitemap и даже более ресурсоемка.
Роман Мирр, что там что там 1 запрос, а sitemap есть далеко не везде. Да, парсинг html дерева немного тратит CPU, но настолько немного, что я на vps за 200 рублей кручу в докере парсеры, которые пробегают страницы в ~100 потоков без каких либо проблем, а cpu не забивается под завязку, упираюсь чисто в лимит канала.
Ivan Yakushenko, пожалуй, не столько ресурсов ЦПУ тратит, сколько ОЗУ, из-за необходимости держать дерево узлов всей страницы. Но в целом, согласен.
Роман Мирр, даже если нужно проверять обновления сразу на сотнях сайтов, то о ресурсах нет никакого смысла думать - слишком мизерные цифры. Можно начать думать о ресурсах начиная с десятков тысяч страниц, но это все решается очередями и мониторингом доступных ресурсов системы.

Answer 1 · 2020-09-08 14:12:51

Не нужно смешивать все вопросы в кучу. Отвечаю на вопрос в заголовке.

Как правильно - зависит от масштаба проекта. Если он малый, то не нужно распыляться на много сервисов.

В архитектуре описывают задачи сервисов.

Вариант А (простой).
Процесс-демон сканера-парсера сайтов, пишущий в СУБД (реляционную или документо-ориентированную). Обновляет новые страницы. Можно использовать очереди (тот же Redis) для обработки парсинга.
cron-задача по очистке неактуальных записей.
Телеграм-бот, читающий с СУБД подготовленную информацию.

Вариант Б (сложнее).
Процесс-демон сканера сайтов. Занимается сканированием страниц и кладет сообщение в очередь контент страниц. Потенциально держит много соединений со сканируемыми сайтами, обрабатывает ошибки получения страниц и пробует повторно.
Процесс-демон парсера страниц. Занимается обработкой сообщений из очереди с контентом страниц, извлекает нужный контент и кладет в СУБД (upsert).
cron-задача по очистке неактуальных записей.
REST API для обработки запросов от Телеграм-бота, читающий с СУБД подготовленную информацию. Потенциально может потребоваться их большее количество.
Телеграм-бот обращается к REST API за получением информации и других действий.

В этом случае можно масштабировать каждый сервис отдельно, в зависимости от нагрузки. Само собой, вместо Go можно использовать любой подходящий язык XYZ.

Не претендую на правильность. Это больше размышления на тему как можно сделать.

Answer 2 · 2020-09-07 16:47:42

BATPYIIIKOB @BATPYIIIKOB

PHP, JS

https://github.com/micro/go-micro

https://github.com/go-kit/kit

Ответ написан более трёх лет назад

Комментировать

Как правильно организовать микросервисную архитектуру средствами языка Golang?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт