Прошу прощения за офтоп, но лично меня вдохновляет что лет через 10 этот вопрос будет звучать настолько же просто как и вопрос про примитивного бота для Telegram.
Основной подход к таким задачам в настоящий момент это reinforcement learning (обучение с подкреплением). Советую поискать статьи на хабре по этим ключевым словам.
tensorflow и pythorch две основные библиотеки которые сейчас используются.