Почему не получается спарсить названия учебных заведений?

Question

Shkarol @Shkarol

HTML
Python

Почему не получается спарсить названия учебных заведений?

Есть сайт: https://net-school.cap.ru/authorize/login
На главной странице есть , который отвечает за выбор названия учебного заведения
Я пытаюсь спарсить эти названия, но не получается
Остановился на том, что request просто не видит этот тэг

Вот код:

# импортируем модуль
    import requests
    st_accept = "text/html" # говорим веб-серверу,
                            # что хотим получить html
    # имитируем подключение через браузер Mozilla на macOS
    st_useragent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 12_3_1) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/15.4 Safari/605.1.15"
    # формируем хеш заголовков
    headers = {
       "Accept": st_accept,
       "User-Agent": st_useragent
    }
    # отправляем запрос с заголовками по нужному адресу
    req = requests.get("https://net-school.cap.ru/authorize/login", headers)
    # считываем текст HTML-документа
    src = req.text
    print(src)

Вопрос задан более года назад
231 просмотр

1 комментарий

Подписаться 2 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
OTUS

HTML/CSS

3 месяца

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+2 ещё

Простой
Как сделать горизонтальный скролл стрелками?
- 1 подписчик
- вчера
- 109 просмотров
0

ответов
PHP

+2 ещё

Простой
Создание элемента с необычной формой и прозрачным фоном и рамкой?
- 1 подписчик
- 03 нояб.
- 130 просмотров
0

ответов
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 199 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 102 просмотра
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 110 просмотров
3

ответа
HTML

Простой
При клике на кастомную кнопку “Скачать” не происходит переход, хотя JS-обработчик отрабатывает. Как решить?
- 1 подписчик
- 29 окт.
- 163 просмотра
0

ответов
HTML

+1 ещё

Простой
Как создать карточки в рядах со смещением?
- 1 подписчик
- 28 окт.
- 108 просмотров
1

ответ
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 124 просмотра
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 236 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 393 просмотра
1

ответ
Показать ещё Загружается…

PHP-разработчик

FoodSoul • Калининград

от 180 000 до 250 000 ₽

Специалист технической поддержки (чат)

WebSoft

от 50 000 до 70 000 ₽

Senior Frontend-разработчик в команду управления доступами

SMALL

от 3 000 до 4 700 $

Попробуй использовать selenium, т.к. это динамический сайт(по словам Vindicar), и используя requests спарсить данные не получится. У меня не получилось зайти на сайт, но думаю можешь использовать метод find_elements(By.CSS_SELECTOR, "селектор"), который возвращает список всех найденных элементов.

Answer 1 · 2024-09-13 15:27:28

Артем Колеватов @artkolev

Web-разработчик

Вот адрес по которому возвращается JSON совсеми элементами. Далее только распарсить его.

Ответ написан более года назад

1 комментарий

Answer 2 · 2024-09-12 22:48:01

Ты хотя бы в браузере пробовал открыть исходный код страницы (обычно Ctrl-U)?
Это динамический сайт, там по умолчанию в body два с половиной скрипта, которые уже подтягивают остальной контент. Конечно, ты его не получишь одним запросом.
Выясняй, какой запрос скрипты делают для получения контента, и имитируй уже его. Консоль разработчика в помощь.

Почему не получается спарсить названия учебных заведений?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт