Задать вопрос
@NSGrid

Как выгрузить реестр арбитражных управляющих с почтой, телефоном и другими данными с сайта Росреестра?

На сайте Росреестра присутствует открытый реестр арбитражных управляющих - https://rosreestr.gov.ru/wps/portal/p/cc_ib_portal...

Перейдя по ссылке, необходимо вверху выбрать в меню пункт "Сводный государственный реестр арбитражных управляющих". Появится список, их чуть больше 23000 человек (см. скриншоты).

Если же в открытом списке нажать на любую фамилию арбитражного управляющего, то откроется его карточка с более подробными данными, в частности, его мобильный телефон, адрес электронной почты, почтовый адрес, СРО (саморегулируемая организация), в которой он состоит. См. также скриншот в конце, а ниже прямая ссылка на одного из арбитражников.

https://rosreestr.gov.ru/wps/portal/p/cc_ib_portal...

Внизу же под общим списком есть кнопка "Выгрузить". Она выгружает весь их список арбитражников в файле с расширением *.csv, который нормально открывается в Экселе и его можно править. Он содержит колонки ФИО, Регистрация, Статус, Дата регистрации и больше ничего.

Вопрос такой. Насколько реально, сложно или не сложно реализовать вариант парсинга (выгрузки) подобного же списка, но с дополнительными данными, а именно: мобильный телефон, e-mail, почтовый адрес, СРО. Напомню, эти данные есть почти у всех, если раскрыть карточку каждого арбитражника. То есть чтобы сразу получить готовую базу с контактами, не открывая карточку каждого человека.

Ведь, если у них на сайте реализован механизм выгрузки части сведений, но сведений указано больше при раскрытии каждой карточки, то может, можно и больше выгрузить данных, просто определенные поля (данные) не включены в механизм выгрузки и можно что-то сделать в коде, чтобы включить их?

67b49c97d9b34811882777.png
67b49c43b2493343158308.png
67b49ced6c4d9683080052.png
  • Вопрос задан
  • 66 просмотров
Подписаться 1 Средний Комментировать
Пригласить эксперта
Ответы на вопрос 1
VoidVolker
@VoidVolker
Dark side eye. А у нас печеньки! А у вас?
Насколько реально, сложно или не сложно реализовать вариант парсинга (выгрузки) подобного же списка, но с дополнительными данными

Реализуется достаточно легко, если там нет каптчи. Примерная логика:
  1. Получаем список ссылок на все страницы индекса
  2. По каждой ссылке получаем страницу индекса
  3. На странице индекса получаем ссылки отдельных карточек
  4. По ссылке карточки получаем страницу карточки
  5. На странице карточки собираем все нужные поля
  6. Сохраняем результат в удобном виде
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы