@AleksandrKu
Разработчик

Как извлечь данные о сущности из текста?

Дано: текст с данными о сущности, допустим, объявление - "Продам стиральную машину Ariston HotPoint v32.01 бывшая в употреблении, состояние отличное. Звонить 79871233445, Алексей. 7000 рублей".
Нужно извлечь данные из текста, такие как: название, модель, состояние, контакт и цена.

Какие алгоритмы, библиотеки, фреймворки, технологии можно для этого использовать?
  • Вопрос задан
  • 352 просмотра
Пригласить эксперта
Ответы на вопрос 1
Я думаю, что нужны следующие инструменты для разбора текста:
  1. лингвистический анализ и обработка текста, Расширенный курс обработки естественного языка
  2. генератор парсера для текста естественного языка
  3. составление словаря атрибутов: имена собственные, валюта, города. По заданным классам атрибутов текста выяснять порядок для разбора текста. К примеру, в заданном предложении определяется наличие действия ("куплю"/"продам"/"обменяю"), затем "состояние", контакт ("звонить" и многозначный номер "79871233445", местного формата), имя "Алексей", цифры "7000" + валюта "рублей". Наименование - самое сложное для определения и потому, возможно, имеет смысл определять этот атрибут последним.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы