Для решения этой задачи подходит векторизация.
Вкратце, слово представляется вектором из других слов (базовых) его описывающих. Тогда близость слов можно описать близостью векторов, его описывающих (косинусная близость). Это была теория.
Практика
здесь:
- Обзор различных техник этого метода
- Ссылки на питоновские библиотеки
- Есть уже готовые фреймворки и предобученные модели