Как проще всего научить бота отвечать?

Есть у меня база данных в MySQL в которой 4млн строк с сообщениями из чатов телеграма. Все сообщения из русскоязычных чатов
5e8cfeb938e8d795328042.jpeg

Сейчас бот на каждое сообщение которое он "прочитал" бросает кубик и если выпал шанс -
1) берет исходное сообщение на которое он "стригерился"
2) разделяет его по пробелам
3) берет все слова длиннее 3х символов
4) Идет в sphinx (который проиндексировал ту самую базу с сообщениями) и достает все сообщения в которых встречается любое из слов исходного сообщения
5) "тренирует" модель цепи Маркова.
6) Если цепь маркова дала результат - отвечает результатом. Иначе берет случайное сообщение из выборки пункта 4

Как результат имеем почти 90% вероятность что он ответит просто чужим сообщением, а не результатом из цепи Маркова.

5e8d00d2644be122721607.jpeg

Собственно вопрос. Какой самый простой способ улучшить алгоритм? Бот чисто развлекательный. Хочется чтобы бот отвечал хоть как то интересно(даже если не совсем правильно, пускай путает склонения, орфографию, грамматику но соблюдает тему или просто веселил народ своей кривой речью). Я не знаком с современными ML, NN технологиями. Но задача не выглядит ОЧЕНЬ сложной. Как бы вы реализовали разговорного бота?

Бот на NodeJs. готов взять в аренду тачку для обучения любой модели. Все что нагуглилось либо устарело либо не ложиться на мои данные.
  • Вопрос задан
  • 266 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы