Вопрос к залу:
Есть ли в онлайне сервис, позволяющий спарсить веб-сайт и потом распарсить выдачу по колонкам/столбцам.
Например, закидываешь линк на чужой ЖЖ, а он (сервис) смотрит на повторяющиеся данные и пагинатор, давая на выходе таблицу данных с колонками:
-- названиепоста
-- ссылка на пост
-- дата
-- теги
-- текстпоста
-- кол-во комментов
С ЖЖ самый банальный пример. Интересует, скорей, парсинг веб-сайтов, где есть хорошая выдача по данным, но нет нормального фильтра (с логическими и/или/не). Под каждый случай руками неудобно писать;
Исключения формата auto.ru, которых мечтает спарсить каждый 18-летний автолюбитель-программист, понятны. Их мы не рассматривает, ибо там целая парсинг-война идет, хотя не в пользу авторов сайта )
Дальше, конечно, хочется увидеть инструмент с автоанализом данных (как вкладка на гугл-таблицах, см картинку), но это второй вопрос.
Есть что-то похожее или руками скрипт написать будет быстрее? Благо, сейчас целые библиотеки есть