Как лучше реализовать данную архитектуру?

Question

Molex20021 @Molex20021

Проектирование программного обеспечения

Как лучше реализовать данную архитектуру?

Хочу написать свой агрегатор контента на go. Архитектурная идея состоит в следующем: при запросе к серверу от конкретного пользователя включается python скрипт, который парсит контент из источников и обновляет бд, затем пользователю выдаётся результат в виде обновленного контента.

Так вот, как такое можно реализовать? А именно, как запускать python скрипт при запросе по выдаче контента?

Вопрос задан более трёх лет назад
153 просмотра

1 комментарий

Подписаться 2 Средний 1 комментарий

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Проектирование программного обеспечения

Простой
Как в 2025 году приблизиться к полному CAP (не AP/CP/CA), а именно к CAP?
- 5 подписчиков
- 12 авг.
- 865 просмотров
1

ответ
Проектирование программного обеспечения

+1 ещё

Средний
Сможет ли кластер minio выдержать 60000 клиентов, стримящих данные?
- 2 подписчика
- 03 авг.
- 275 просмотров
3

ответа
C#

+1 ещё

Простой
Как спроектировать домены?
- 3 подписчика
- 26 июл.
- 160 просмотров
0

ответов
Проектирование программного обеспечения

Простой
Как общаются микросервисы в реальных проектах?
- 2 подписчика
- 13 июл.
- 6874 просмотра
5

ответов
PHP

+3 ещё

Простой
Как правильно построить сервис, создающий отложенные задачи на основе расписания из другого сервиса?
- 2 подписчика
- 11 мар.
- 362 просмотра
2

ответа
Проектирование программного обеспечения

Простой
Как рассмотреть все возможные сочетания во времени случайных событий?
- 1 подписчик
- 03 мар.
- 84 просмотра
2

ответа
Проектирование программного обеспечения

Средний
Как обосновать применение реляционной БД на интервью по System Design?
- 1 подписчик
- 02 мар.
- 181 просмотр
5

ответов
Проектирование программного обеспечения

Простой
Какую выбрать оболочку для совместной работы — визуализация архитектуры с возможностью описания PlantUML?
- 1 подписчик
- 27 февр.
- 65 просмотров
2

ответа
Проектирование программного обеспечения

+1 ещё

Простой
Как правильно спроектировать микросервисную архитектуру?
- 1 подписчик
- 10 февр.
- 230 просмотров
1

ответ
Проектирование программного обеспечения

Простой
Как организовать одностороннюю синхронизацию между двумя БД?
- 1 подписчик
- 18 янв.
- 131 просмотр
2

ответа
Показать ещё Загружается…

Заместитель начальника отдела разработки ПО и АСУ (Team Lead)

ГК «Турбулентность-ДОН» • Ростов-на-Дону

от 100 000 до 130 000 ₽

Главный специалист по проектированию РЗА

ЭЛСИ Энергопроект

от 150 000 ₽

Ведущий инженер-проектировщик РЗА

ЭЛСИ Энергопроект

от 130 000 ₽

Запускать python скрипт при помощи cron (или другого диспетчера задач) раз в 10 минут, а не при запросе и пусть себе обновляет бд.
А зачем вообще python? Go тоже прекрасно может парсить контент из источников и обновлять бд. А python может сам отвечать на http запросы. Зачем два языка?

Answer 1 · 2021-04-22 10:40:55

Когда пользователь ждет пока агрегатор выполнит свою работу - это нехорошо. Правильнее, чтобы первый захотел некоторый контент и сразу мог получить его, прямиком с БД, а в идеале с кэша частозапрашиваемого контента.
Для этого агрегатору необходимо регулярно выполнять свою работу независимо от посетителей, в фоне. Разумеется, пайплайн агрегатора должен заранее знать откуда заполучать контент или же одноразово получить список источников в начале, пройтись по ним и занести данные в БД. Затем регулярно обновлять с уже известных источников независимо от захода пользователей.

Ну а если в БД пусто и позарез нужно выдать контент, то остается плохой вариант - дать пользователю ждать, пока контент не будет скачан, обработан агрегатором и получен обратно. В данном случае, при попытке получения контента можно выдать сообщение, что мол, "Извините-с-с, заходите чуток позже" или же "Подождите 5 сек, я быстро-быстро". А когда свежий контент уже был обработан, то отправить назад контент по SSE/WebSocket. Или же short polling просто клиент будет периодично выполнять запросы к API с надеждой получить контент.
Вот здесь можно прочесть о способах взаимодействия

Поэтому я вижу такую архитектуру при работе с пользователем:

Client -> API -> cache/DB (read)
             \
              MQ
                 \
               [Aggregator]
                      \
                      DB (write)

Здесь [Aggregator] может означать как монолитный механизм скачивания-обработки, где все в одном, так и микросервисную архитектуру.

По мне, так бизнес-логику на Go писать не очень удобно и ее лучше осуществлять на более высокоуровневых языках. Так что в Go я бы реализовывал механизм скачивания контента и извлечения нужных частей, а в Python/Ruby/Perl и т.д. - логику самого агрегатора (смешение, композитинг контента).

Как лучше реализовать данную архитектуру?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт