@Shkarol

Почему не получается спарсить названия учебных заведений?

Есть сайт: https://net-school.cap.ru/authorize/login
На главной странице есть , который отвечает за выбор названия учебного заведения
Я пытаюсь спарсить эти названия, но не получается
Остановился на том, что request просто не видит этот тэг

Вот код:

# импортируем модуль
    import requests
    st_accept = "text/html" # говорим веб-серверу,
                            # что хотим получить html
    # имитируем подключение через браузер Mozilla на macOS
    st_useragent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 12_3_1) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/15.4 Safari/605.1.15"
    # формируем хеш заголовков
    headers = {
       "Accept": st_accept,
       "User-Agent": st_useragent
    }
    # отправляем запрос с заголовками по нужному адресу
    req = requests.get("https://net-school.cap.ru/authorize/login", headers)
    # считываем текст HTML-документа
    src = req.text
    print(src)
  • Вопрос задан
  • 220 просмотров
Решения вопроса 1
artkolev
@artkolev
Web-разработчик
Вот адрес по которому возвращается JSON совсеми элементами. Далее только распарсить его.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
Vindicar
@Vindicar
RTFM!
Ты хотя бы в браузере пробовал открыть исходный код страницы (обычно Ctrl-U)?
Это динамический сайт, там по умолчанию в body два с половиной скрипта, которые уже подтягивают остальной контент. Конечно, ты его не получишь одним запросом.
Выясняй, какой запрос скрипты делают для получения контента, и имитируй уже его. Консоль разработчика в помощь.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы