Куда копнуть для создания мониторинга электронных СМИ для личных целей?
В общем задача такая...
В организации время от времени возникает потребность мониторить электронные СМИ. Обычно эти СМИ местного значения (что-то типа "Вестник Усть-Подклюйска").
Конечно, есть специализированные конторы, которые с радостью предоставляют такие услуги. Они конкурируют друг с другом и оттого цены подчас весьма невысоки.
Результат предоставляют в виде, напоминающим обычную подборку агрегатора (по сути, им и являются).
Но итог не шибко удобный.
Вопрос у меня такой - что нужно для того, чтобы сделать это самостоятельно?
Те, что делают нормальный мониторинг, стремятся переплюнуть Палантир в отдельно взятой стране, берут за работу совсем другие деньги.
Не дешевые.
Я сначала на них бы посмотрел. Самому реализовать будет куда как дороже.
Для прокачивания технических скиллов только и имеет смысл самому делать.
Допустим, для прокачивания. Вырастить себя или взять кого-то из работников и дать направление ему. Не суть. Сейчас мне непонятно куда копать.
После нескольких часов поверхностного копания слишком много каши в голове.
1. Брать запросы с Гугла или Яндекса, по ним лезьть в результаты и их обрабатывать
2. Вручную искать эти СМИ и мониторить тупо их уже.
other_letter:
> Брать запросы с Гугла или Яндекса, по ним лезьть в результаты и их обрабатывать
Нет. Мало того, что они там уже фильтрованные по своим признакам, например, по региональному не так как вам это надо, а так как надо Яндексу/Гуглю - так вам еще никто и не даст выполнять МНОГО запросов.
other_letter:
> Вручную искать эти СМИ и мониторить тупо их уже.
Это не тупо, это нормально.
СМИ не так уж и много.
Тем более, что вас интересуют местные.
Добавите их в свой поисковый индекс вручную раз - это не много работы, если дальнейшее делает автоматика.
Все зависит на каком уровне вы это хотите сделать. И какие у вас возможности. Хотите/будете ли делать свой "почти аналог поисковика на собственном ПО" или обойдетесь имеющимся. Существуют сервисы (мне не понравились), которые позволяют делать свой собственный узконастроенный поисковик. Или существуют сервисы, которые позволяют реализовать часть его функцинала (80legs, например) - сбор данных, а анализом данных уже ваше ПО занимается.