Как можно парсить ras.arbitr.ru на php или любом другом языке?

Добрый вечер!

У меня 2 вопроса:
1) возможно ли написать на php (или другом языке, но желательно php) парсер, который отправляет на ras.arbitr.ru параметры формы (фильтр), как на самом сайте, и получает в ответ список документов (в json, xml или любом другом)? какими методами возможно?
я не нашел api на сайте, может что-то я пропустил? или получится только функцией file_get_content()?

2) если вручную сохранить все документы в базу данных в текстовом формате, а их скажем миллион, то какую лучше бд выбрать - mysql или postgresql? будет ли более менее быстро работать поиск по базе данных например по фразе (в mysql это LIKE $search..)?
  • Вопрос задан
  • 5651 просмотр
Решения вопроса 1
Отправляете POST запрос ! В ответ приходит json.
Парсите.
fcd36f0ddebc423583a497fca6ac4dde.png68c8cf8f16a345cdb9a24ddba7401442.png2c48a2ec9efb4a72b9166a3fe69b05e4.png

После получения получения json парсите получаете что то типа того..
FileName: "А49-364-2015__20170930.pdf"
Id: "7e4efd11-dffb-4767-acae-d809f01bf5a9"

После фомируете ссылку вида kad.arbitr.ru/PdfDocument/id/FileName
У нас например типа http://kad.arbitr.ru/PdfDocument/7e4efd11-dffb-476...
Отправляем file_get_content получаем .pdf
5b3841b2330546919f0114b084257798.png2aa88fca51ae43c9ba6db1603b67f336.png
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@peregudov
В свое время тоже искали доступ к АПИ kad.arbitr.ru и ras.arbitr.ru. Официально не смогли получить, а на сайте капча - не обойти.
Остановились на сервисе, который долгое время уже предоставляет нам доступ к API arbitr.ru и разным другим АПИ данным на платной основе. У них даже можно бесплатно это проверить как работает: arbitr.mchanges.com
Ответ написан
Комментировать
ExileeD
@ExileeD
PHP/Python developer
1. Можно
2. Берите Postgresql
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы