Добрый день.
Являюсь новичком в области ML, медленно осваиваю область, с углублением в PyTorch.
Возникла задача, в области анализа текста, к которой пока не знаю как подойти.
Суть задачи:
Есть заготовленные и размеченные фразы. Например: "осуществляется передача данных".
Если в тексте встречается фраза с похожей сутью - необходимо ее обнаружить и далее выполнить некоторый пул действий.
Проблема 1:
Во множестве произвольных текстов, суть данного примера может быть изложена по другому.
Например: "данные передаются", "передаются данные", "данные отправляются", "отправляется запрос" и т.д.
Проблема 2:
Для обучения, будет доступны 1-2 варианта фразы и я не могу пока понять, как на малом объеме можно построить обучение.
Например: только 2 фразы "осуществляется передача данных" и "передача данных осуществляется" будут мне доступны и ссылаться на один класс (idшник), к которому привязано последующее действие.
Я принял некоторые попытки на torchtext, пытаясь классифицировать, но они оказались не удачными.
Я разделяю вашу току зрения, поэтому смотрю курс лекций от ШАД (Курсы яндекса по ML), но всегда же хочется попробовать на практике то, о чем узнал.
Благодарю за ссылки.