Viper029
@Viper029
Программирую за печенье

Как настроить парсинг сайта с JavaScript на C#?

Добры день, ребята-котята. Помогите, пожалуйста с таким вопросом. Есть сайт правительства, который выкладывает документы на свой сайт. На сайте есть JavaScript модуль, который выдает в таблице ссылки на документы.
5b6972a7d8441807606535.png
Чтобы получить ссылку, необходимо раскрыть выпадающий список и выбрать необходимый раздел с документом. Изначально, в исходном коде страницы нет всех ссылок на файлы. Они генерируются скриптом. Причем, он генерирует эти ссылки даже без доступа к интернету. Нужно только прогрузить этот модуль. Необходимо каким-то образом раскрыть все выпадающие списки, чтобы скрипт выдал в исходный код страницы ссылки на документы и я смог их вытащить своим парсером. Подскажите, есть ли возможность раскрыть все выпадающие списки каким-нибудь скриптом? В JavaScript я не очень шарю. Не знаю, можно ли публиковать ссылки. Если что, ссылка на данный раздел сайта на скриншоте.
  • Вопрос задан
  • 929 просмотров
Решения вопроса 1
@timokins
В твоем случае,
все очень просто.

Клиент отправляет запрос к серверу (можешь попробовать открыть ссылку в браузере)
<адрес сайта>/cw/dict/-doc10let
и получает ответ со всем списком (json). И по нему уже генерирует таблицу.

Ты можешь также сделать запрос, получить JSON и распарсить его.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@S0HardCore
Есть Selenium, есть WebBrowser, находишь нужные элементы и совершаешь click() по ним.
Ответ написан
Комментировать
alekciy
@alekciy
Вёбных дел мастер
Потребуется Selenium. Из C# общается к head-less бразуеру (это может быть PhantomJS, запускать с опцией webdriver) следует по Webdrive протоколу. На вскидку: Автоматизированное тестирование веб-приложения (MS....
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы