@smoboom

Как спарсить title c сайтов используя python?

Я новичок в python и ни как не могу понять как реализовать следующую задачу.
Есть txt файл с доменами(около 10 000 доменов), сохранены в верхнем регистре. Нужно:
- адреса доменов перенести в нижний регистр
- добавить вначале домена строку 'http://', чтобы домен потом вставить в requests
- сделать цикл, чтобы парсер собрал title с каждого домена(сайта)
- записать все в файл таблицу с двумя полями | url сайта | title сайта |
  • Вопрос задан
  • 204 просмотра
Пригласить эксперта
Ответы на вопрос 1
welcome32
@welcome32
Backend Python developer
1) Перевести строку в нижний регистр можно с помощью метода строки str.lower()
2) Добавить в начале строки можно так: link = r"https://" + link
3)
for link in links:
      [some parsing link site]

4) Ну это работа с файлами в Python
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы