Задать вопрос

Какое есть решения для парсинга контента большинства сайтов?

Добрый день!
Подскажите возможное решение следующей задачи.
Есть сайт для хранения различной информации и структурирование ее. Можно создавать свой контент, а можно взять и вставить ссылку на некий сайт (допустим хабр) и мое api должно спарсить контент статьи (не всю страницу, а только полезную ее часть). Одно дело если бы я знал заранее список возможных сайтов.. но нет. Это SaaS решение для структурирования данных компании и сбора полезных ссылок. Хорошее решение есть у raindrop.io, они умеют и с js сайтов получать полезный контент.
По сути задача сводится к тому чтобы получить контент статьи с любого сайта для сохранения у себя.
  • Вопрос задан
  • 1115 просмотров
Подписаться 7 Средний Комментировать
Пригласить эксперта
Ответы на вопрос 1
@alexdora
Топ-менеджер
Почти все парсеры которые нам были необходимы по роду деятельности мы создавали с нуля сами, под каждый конкретный сайт.
raindrop.io это сайт с монетизацией и ясно, что там под каждый сайт они в любом случае допиливают парсер. Вот так просто выдергивать можно ридер режим, но сегодня оно работает, а завтра уже нет. Вообще рынок парсинга очень сжат. Т.е кто умеет делать хорошие парсеры продают за дорого свою работу, а каких-то публичных парсеров всеядных и бесплатных – по пальцам пересчитать, если они вообще есть
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы