Язык не критичен. Проблема звучит следующим образом. Есть много кусков текста вида:
Постановление отменено, Отказано, Не верно поданы документы, Не верный номер и тд
Кусков много и к словарю их свести нельзя. Матчить по паттерну "отмен" и "не[подх | верно | корр]" мне кажется не лучшим вариантом.
Мне нужно по кускам понять, что идет какое-то отрицание и выставить флаг False.
Есть ли еще какие-то варианты? Нужно ли тут NLP в чистом виде? Или есть еще средства?
Незнаю, так себе идея конечно, но можно куски
проиндексировать в полнотекстовый поиск,
а затем проставлять флаги по совпадениям фраз:
"Постановление отменено", "Отказано", "Не верно поданы документы", "Не верный номер"
Если что-то указано, то явно должен быть статус у документа.
Если есть статус - можно сделать "вычитание": "не положительный" - значит "отрицательный".
Осталось найти все "положительные" (утверждённые) статусы.