Какие технологии используются при WebScraping в режиме реального времени?

Question

malvinfch @malvinfch

Какие технологии используются при WebScraping в режиме реального времени?

Допустим есть сайт агрегатор со строкой поиска, который возвращает результаты, согласно запросу пользователя, сщ 100 других сайтов. При этом запрос обрабатывается 3-4 секунды. Как это работает?
Я вижу вариант с ежедневным скрэпингом сайтов и сохранением результатов в БД. И затем запрос пользователя работает напрямую с БД.
Если запускать скрипт под каждый запрос и парсить в реальном времени, то в такое время явно не уложиться.
Какие еще есть варианты?

Вопрос задан более трёх лет назад
169 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Stepik

4в1—Парсинг, Асинхронность, Многопоточность, Многопроцессорность

2 месяца

Далее
Хекслет

Фронтенд-разработчик

10 месяцев

Далее
Stepik

FullStack Developer and Data Scientist (Python+JS+Data+CookBook)

4 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 626 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 396 просмотров
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 4 подписчика
- 05 мар.
- 1101 просмотр
4

ответа
Парсинг

Простой
Как спарсить Интернет Магазин?
- 1 подписчик
- 27 февр.
- 425 просмотров
4

ответа
Веб-разработка

+1 ещё

Средний
Как на сайте с фильмами найти медиаплеер и скачать это видео через код?
- 1 подписчик
- 13 февр.
- 514 просмотров
2

ответа
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек. 2025
- 549 просмотров
2

ответа
Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб. 2025
- 1224 просмотра
1

ответ
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 1 подписчик
- 20 нояб. 2025
- 873 просмотра
2

ответа
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб. 2025
- 504 просмотра
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт. 2025
- 366 просмотров
0

ответов
Показать ещё Загружается…

Answer 1 · 2019-02-11 16:29:26

Как мне кажется, если тянуть данные из своей базы - 3-4 секунды слишком много.
А если параллельно отправить несколько запросов к API разных сайтов, то как раз так и получится.
Если говорим про scrapy, то можно использовать scrapyrt для подобного.

Какие технологии используются при WebScraping в режиме реального времени?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт