Задать вопрос
@VitaliySm

Как парсить множество разных сайтов?

Есть паук, который должен переходить с одной общей страницы на страницы с разными доменами. В роли start_urls всегда будет одна страница. Как указывать allowed_domains? прописывать там домены не вариант, их может быть очень много.
  • Вопрос задан
  • 2488 просмотров
Подписаться 2 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Fullstack-разработчик на Python + нейросети
    20 месяцев
    Далее
  • Skillfactory
    Профессия Python-разработчик
    9 месяцев
    Далее
  • Яндекс Практикум
    Python-разработчик
    10 месяцев
    Далее
Решения вопроса 1
@VitaliySm Автор вопроса
проблема была в том, что я указывал allowed_domains = ["domain"], и поэтому паук не переходил на внешие ресурсы. указав таким образом allowed_domains = [], решил проблему.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы