Задать вопрос
@malvinfch

Какие технологии используются при WebScraping в режиме реального времени?

Допустим есть сайт агрегатор со строкой поиска, который возвращает результаты, согласно запросу пользователя, сщ 100 других сайтов. При этом запрос обрабатывается 3-4 секунды. Как это работает?
Я вижу вариант с ежедневным скрэпингом сайтов и сохранением результатов в БД. И затем запрос пользователя работает напрямую с БД.
Если запускать скрипт под каждый запрос и парсить в реальном времени, то в такое время явно не уложиться.
Какие еще есть варианты?
  • Вопрос задан
  • 163 просмотра
Подписаться 1 Простой 1 комментарий
Пригласить эксперта
Ответы на вопрос 1
@Verz1Lka
Web scraping expert
Как мне кажется, если тянуть данные из своей базы - 3-4 секунды слишком много.
А если параллельно отправить несколько запросов к API разных сайтов, то как раз так и получится.
Если говорим про scrapy, то можно использовать scrapyrt для подобного.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Aporia Севастополь
от 50 000 до 100 000 ₽
Clain Лимассол
от 5 000 €