@beduin01

Нужен ли мне NLP?

Язык не критичен. Проблема звучит следующим образом. Есть много кусков текста вида:
Постановление отменено, Отказано, Не верно поданы документы, Не верный номер и тд

Кусков много и к словарю их свести нельзя. Матчить по паттерну "отмен" и "не[подх | верно | корр]" мне кажется не лучшим вариантом.

Мне нужно по кускам понять, что идет какое-то отрицание и выставить флаг False.

Есть ли еще какие-то варианты? Нужно ли тут NLP в чистом виде? Или есть еще средства?
  • Вопрос задан
  • 139 просмотров
Пригласить эксперта
Ответы на вопрос 2
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Если что-то указано, то явно должен быть статус у документа.
Если есть статус - можно сделать "вычитание": "не положительный" - значит "отрицательный".
Осталось найти все "положительные" (утверждённые) статусы.
Ответ написан
begemot_sun
@begemot_sun
Программист в душе.
Не знаю, можно ли наивный байесовский классификатор называть NLP.
Но скормите такого рода тексты ему, пусть обучится.

Пример кода: https://github.com/loguntsov/bayes

можете поиграться на ваших данных.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы