Это задача
NLP - Natural Language Processing
Если вкратце, то работа ведется в несколько этапов:
1. Преобразование звука в текст
2. С помощью NLP этот текст обогащается:
- Форматируется
- Убирается мусор
- Выделяются ключевые слова
3. Готовый текст подается на вход другой нейронке, которая используя свою базу данных (история, контекст) понимает немерение
Собственно, сама работа ведется в последней части. Как эти нейронки работают - другой вопрос. Просто обучают на своих наборах данных