Универсальный парсер сайтов на базе cms prom, нужен ли пользователю?
Когда-то для набора опыта написал пару парсеров сайтов на базе известных cms, при сегодняшних тестах, самым удачным из них оказался парсер сайтов на базе cms prom. Характеристика парсера:
При тестах удалось спарсить 10/10 сайтов.
Для начала парсинга нужно ввести только url сайта, все шаблоны сборки данных уже заложены в парсер.
Потдерживает как синхронное так и асинхронное выполнение.
Парсит в csv следующие данные: url, название, цена, описание, изображения в оригинальном размере (каждое изображение в отдельном столбце), характеристики (название столбца = название характеристики, значение столбца = значение характеристики), хлебные крошки. Суть вопроса:
Как уже сказал выше, для парсинга нужно ввести только url сайта, либо отдельной категории сайта -> с парсингом справится даже пользователь, способный худо бедно отредактировать excel таблицу.
Удастся ли хотя бы маломальски манетизировать парсер на данном этапе? При малейших намеках на прибыль я готов уделить ему время, и добавить пару фич, к примеру экспорт в разные форматы такие как yml. А также заняться парсерами других cms, чтобы они работали стабильно и так же имели прикольные фичи, но нужно ли это кому-нибудь, кроме меня?
Есть ли площадки (желательно украинские), на которых можно было бы обратить внимание на данный парсер (чтобы им хоть кто-нибудь начал пользоваться :))?
Нет.
Потому что не бвывает универсальных парсеров.
Бывают парсеры которые умеют парсить один конкретный сайт.
А все остальное - надо изучать структуру и логику работы конкретного сайта и писать код. В общем нужен программист. А программисту легче набросать парсер самому на пайтоне, чем пытаться разобраться в интерфейсе чужой программы.
CMS на которой сделан сайт тут вообще никак не интересна и не влияет на процесс.
И если вы хотите предлагать парсер как готовый продукт для пользователя - то как пользователь узнает что такое CMS и какая именно CMS используется на нужном ему сайте? Пользователи вообще не знают таких страшных слов.
Программисты тоже разные бывают, кому-то писать свой парсер может оказаться лень, а какой-нибудь параметрический запрос на том же yaml или json на готовой площадке чуточку проще.