Какую информацию стоит изучить для бота, собирающего информацию ( определенные слова) с сайтом-СМИ?
Для интереса хочу написать бота, который бы собирал упоминания нужных слов с сайтов-СМИ. Типа NYTimes, WP и других. Проблема в том, что максимум писал бота для игр ( ВоВку) лет 5 назад.
Буду очень признателен, если укажете какие источники стоит детально изучить.
Хороших выходных!
Можно почитать про Data mining. Для простой задачи хватит того что сказал boomwest.
Есть интересные онлайн курсы от Яндекса - "Школа анализа данных": shad.yandex.ru
и от Computer Science Center курс по анализу данных: compscicenter.ru/syllabus