@beduin01

Нужен ли мне NLP?

Язык не критичен. Проблема звучит следующим образом. Есть много кусков текста вида:
Постановление отменено, Отказано, Не верно поданы документы, Не верный номер и тд

Кусков много и к словарю их свести нельзя. Матчить по паттерну "отмен" и "не[подх | верно | корр]" мне кажется не лучшим вариантом.

Мне нужно по кускам понять, что идет какое-то отрицание и выставить флаг False.

Есть ли еще какие-то варианты? Нужно ли тут NLP в чистом виде? Или есть еще средства?
  • Вопрос задан
  • 140 просмотров
Пригласить эксперта
Ответы на вопрос 2
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Если что-то указано, то явно должен быть статус у документа.
Если есть статус - можно сделать "вычитание": "не положительный" - значит "отрицательный".
Осталось найти все "положительные" (утверждённые) статусы.
Ответ написан
begemot_sun
@begemot_sun
Программист в душе.
Не знаю, можно ли наивный байесовский классификатор называть NLP.
Но скормите такого рода тексты ему, пусть обучится.

Пример кода: https://github.com/loguntsov/bayes

можете поиграться на ваших данных.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Wanted. Санкт-Петербург
До 120 000 ₽
Wanted. Санкт-Петербург
от 80 000 до 150 000 ₽
от 60 000 до 120 000 ₽
21 нояб. 2024, в 15:58
1000 руб./за проект
21 нояб. 2024, в 15:58
30000 руб./за проект
21 нояб. 2024, в 15:49
30000 руб./за проект