prumin
@prumin
Изучаю Java и мобильную разработку

Почему не парсится сайт?

Пытаюсь спарсить сайт
egecalc.ru/?rus=100&mat=100&soc=100&phy=100&his=10...
блоки с итоговыми результатами по вузам и тд.
но ничего ничего не получается.
Другие сайты парсятся, а этот нет.
Вот код:
public class ParseEgeCalc {
    private final static String URL = "http://egecalc.ru/?rus=100&mat=100&soc=100&phy=100&his=100&bio=100&che=100&lan=100&ict=100&geo=100&lit=100&sort_by=salary&city=all&page=1";

    public static void parser() throws IOException {
        Document doc = Jsoup.connect(URL).get();
        Elements el = doc.body().getElementsByClass("card card-outline-info");
        for(Element e : el)
            System.out.println(e.text());
    }
}


Если кто знает решение, подскажите плиз.
  • Вопрос задан
  • 200 просмотров
Решения вопроса 1
sergey-gornostaev
@sergey-gornostaev Куратор тега Java
Седой и строгий
Достаточно заглянуть в исходный код страницы, чтобы заметить, что блоков с классом card там нет, и понять, что они создаются JavaScript'ом. Jsoup не исполняет JavaScript. Либо анализируйте работу javascript-кода и выполняйте такие же запросы к бэкенду, либо используйте Selenium.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы