Ответы пользователя по тегу Vaadin
  • Как парсить данные с localhost:8080, используя Jsoup?

    azerphoenix
    @azerphoenix Куратор тега Java
    Java Software Engineer
    Я посмотрел на исходный код проекта и все стало на свои места.
    Во-первых, этот проект использует Vaadin. К сожалению, мне не доводилось использовать его, но я могу сказать следующее:
    Контент страницы формируется динамически на клиенте. JSoup не умеет работать с динамически формируемым контентом и потому, на момент парсинга документа там лишь:
    <div id="outlet"></div>
    Соответственно, чтобы спарсить динамический контент вам нужно:
    1) либо изучить внутренний АПИ и спарсить json, который возвращается извне. Зайдите во вкладку Network (Сеть) браузера и отфильтруйте XHR запросы и гляньте, на какой эндпоинт выполняется запрос и что возвращается в ответ.
    2) либо спарсить сайт при помощи Selenium. (запустить браузер, дождаться загрузки страницы, получить документ, получить List<WebElement>)
    Ответ написан
    1 комментарий