@BoBaHPyt
Программист

Универсальный парсер сайтов на базе cms prom, нужен ли пользователю?

Когда-то для набора опыта написал пару парсеров сайтов на базе известных cms, при сегодняшних тестах, самым удачным из них оказался парсер сайтов на базе cms prom.
Характеристика парсера:
При тестах удалось спарсить 10/10 сайтов.
Для начала парсинга нужно ввести только url сайта, все шаблоны сборки данных уже заложены в парсер.
Потдерживает как синхронное так и асинхронное выполнение.
Парсит в csv следующие данные: url, название, цена, описание, изображения в оригинальном размере (каждое изображение в отдельном столбце), характеристики (название столбца = название характеристики, значение столбца = значение характеристики), хлебные крошки.
Суть вопроса:
Как уже сказал выше, для парсинга нужно ввести только url сайта, либо отдельной категории сайта -> с парсингом справится даже пользователь, способный худо бедно отредактировать excel таблицу.
Удастся ли хотя бы маломальски манетизировать парсер на данном этапе? При малейших намеках на прибыль я готов уделить ему время, и добавить пару фич, к примеру экспорт в разные форматы такие как yml. А также заняться парсерами других cms, чтобы они работали стабильно и так же имели прикольные фичи, но нужно ли это кому-нибудь, кроме меня?
Есть ли площадки (желательно украинские), на которых можно было бы обратить внимание на данный парсер (чтобы им хоть кто-нибудь начал пользоваться :))?
  • Вопрос задан
  • 105 просмотров
Пригласить эксперта
Ответы на вопрос 1
Jump
@Jump
Системный администратор со стажем.
Нет.
Потому что не бвывает универсальных парсеров.
Бывают парсеры которые умеют парсить один конкретный сайт.

А все остальное - надо изучать структуру и логику работы конкретного сайта и писать код. В общем нужен программист. А программисту легче набросать парсер самому на пайтоне, чем пытаться разобраться в интерфейсе чужой программы.
CMS на которой сделан сайт тут вообще никак не интересна и не влияет на процесс.

И если вы хотите предлагать парсер как готовый продукт для пользователя - то как пользователь узнает что такое CMS и какая именно CMS используется на нужном ему сайте? Пользователи вообще не знают таких страшных слов.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы