Если правда, что вы "Плохо разбираюсь
именно в этой части МЛ", т.е. - в других разделах разбираетесь хорошо - то даю наводку. Задача относиться к задачам классификации. Сначала проводиться векторизация текста, потом применяются в общем-то стандартные процедуры обучения с учителем. Задача пожалуй одна из самых простых в области NLP. Для текстов - в том числе как коротких сообщений так и для полнотекстовых- решается довольно давно и довольно успешно. Когда-то кажется Reuters хвастался, что сумел заменил около 100 человек, классифицирующих тексты по разделам на одну программу NLP. Так у них еще и многоклассовая классификация.
Информации по проблеме вообще, и именно по этой задачи в интернете более чем достаточно. Да и в книгах она уже описана, вплоть до реализаций, например
S. Bird, E. Klein, E. Loper. Natural Language Processing with Python
B. Bengfort, R. Bilbro, T. Ojeda. Applied Text Analysis with Python
и еще:
https://medium.com/sciforce/top-10-books-on-nlp-an...
https://towardsdatascience.com/top-nlp-books-to-re...
https://www.tableau.com/learn/articles/natural-lan...
При таком обилии и подробности изложения информации в общем не очень понятно, какая именно вам помощь нужна. Только не "расскажите мне как решать эту задачу", а "вот таким методом решаю эту задачу и мне тут непонятно вот этот вопрос". Задавайте - может и поможем.