Как написать телеграм бот, способный парсить указанную информацию с новостных сайтов?
Поставил себе задачу написать телеграм бот со следующим функционалом:
Этап 1: мне должно приходить сообщение о каждом упавшем метеорите следующего вида:
Локация: страна-регион-город;
Дата;
Эту информацию нужно собирать из новостных сайтов (условно мировой топ 100) по ключевым словам: тип объекта: метеорит; локация: страна-регион-город. То есть появилась информация в СМИ о новом упавшем объекте — бот мне об этом сообщает.
Этап 2: на втором этапе планирую отобразить собранные данные на карте мира.
Знаю питон на уровне написания элементарных программ. Задача не кажется сверхсложной, но хочу получить совет от опытных.
Подскажите, пожалуйста, следующее:
1) дорожную карту для реализации данной задумки, хотя бы крупными мазками;
2) оптимальное решение на ваш взгляд;
3) в какую сторону копать и что изучить, чтобы решить эту задачу самому.
Я конечно не профи. Но могу подсказать направление. Ну во первых, тебе нужно парсить страницы этих сайтов. С какой то переодичностю, и выцеплять нужные заголовки при помощи регулярных выражений.
Есть множество сейчас готовых библиотек для всего чего хочешь. не пиши велосипеды.
Используй Telegraf(библиотека) - по моему она тоже есть на питоне(хотя не уверен), для взаимодействия с ботом телеграмма.
по поводу координат и тдп. - вопрос уже в другом. в каком виде данные о геолокации брать будешь? по именам городов?
Приветствую вас! Благодарю за ответ.
Насчёт библиотек и создания велосипеда — совет ценный, спасибо.
Насчёт локаций: да, по названиям городов, так как другой информации СМИ обычно не указывают. Первое что приходит в голову — дать базу городов на сравнение, если во время перебора находит в тексте новости город, указанный в базе, то передаёт его нам.