Задать вопрос
@dmister
SEO-специалист

Как по списку URL-ов удалить страницы, в контенте которых будет текст «Не найдено»?

Друзья, приветствую

Есть список URL-ов сайта (больше 1000)

Задача:
1. узнать, в контенте каких URL-ов есть фраза "не найдено"
2. удалить из списка эти URL или пометить их как-то, чтобы вручную потом удалить.

Как и с помощью чего это можно сделать проще всего?

Спасибо.
  • Вопрос задан
  • 32 просмотра
Подписаться 1 Средний Комментировать
Помогут разобраться в теме Все курсы
  • Skillfactory
    Профессия Python-разработчик PRO
    12 месяцев
    Далее
  • Stepik
    Парсинг на Python для начинающих
    2 недели
    Далее
  • OTUS
    iOS Developer
    12 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
usdglander
@usdglander
Yipee-ki-yay
1. Взять n-ый урл из списка
2. Запросить через сURL контент страницы
3. Провести поиск в контенте по строке "не найдено"
4. Если результат был найден, то увеличить n на 1 и перейти к п. 1
5. Если результат найден не был, то добавить ссылку в файл, увеличить n на 1 и перейти к п. 1
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы