Есть сайт госзакупок (рф) - вот ссылка допустим на такой заказ.
zakupki.gov.ru/epz/contract/printForm/view.html?co...
zakupki.gov.ru/epz/contract/printForm/view.html?co...
И идет оно причем в каком-то очень не понятном виде... Везде разное количество столбцов, строк и т.п.
Как извлечь только нужное - а именно -
Раздел IV. Информация о поставщиках (подрядчиках, исполнителях) по контракту
(там идут данные в виде таблицы).
Сейчас сделал какую-то левую схему через программу BAS (Browser automation studio) - но очень неудобную - оно снаала качает все в формате txt, я потом произвожу 7 замен и только потом получаю итоговый файл с данными - это просто издевательство какое-то... Может знаете что сделать тут можно? по идее же ничего сложного - сайт не сложный + не банит абсолютно даже при огромном количестве запросов...