@Davidaa_WoW

Какой лучший способ парсить html?

Итак суть следующая, нужно мне частенько парсить некоторый сайты, переносить всю необходимую инфу к себе в базу данных (естественно с их согласия), весь парсинг одноразовый, апдейты не нужны вообще. На данный момент делаю через сервис integromat, он в данном плане идеален - и свою цепочку построить можно, и внести куда надо, и через regex удобно парсить, единственная проблема заключается в том, что выходит слишком дорого - 1 сайт = 1 доллар, даже чуть больше. Так вот, есть ли какой-нибудь удобный и главное мощный софт для парсинга страниц? Желательно всё же по regex, знаю, что дурной тон, но мне так удобнее - иногда содержимое вытаскиваешь, иногда атрибуты. Можно также попробовать через код реализовать, вот только всё что я искал было слишком трудно, или не подходило под мои нужды. Финальный экспорт данных может быть хоть в csv, хоть в json, хотя даже в текстовик через \n, мне не принципиально.
  • Вопрос задан
  • 138 просмотров
Пригласить эксперта
Ответы на вопрос 1
Посмотри ZennoPoster, подходит для парсинга и не только.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы