Как получить из текста определенные параметры?

Есть база данных с описаниями объектов недвижимости. Задача состоит в том, чтобы создать программу, которая сможет выделять необходимые параметры из текста.

Например, в описании может быть указано "общая площадь - 50м2" или "площадь 50/20/10" и т.д. Необходимо учитывать эту разницу в написании.

При помощи каких технологий это можно реализовать? В идеале, это если бы механизм был самообучаемый. Интересны примеры на Python.
  • Вопрос задан
  • 786 просмотров
Решения вопроса 1
leahch
@leahch
3D специалист. Dолго, Dорого, Dерьмово.
Самый простой способ - из всей базы данных выдернуть все паттерны использования, наверняка их будет около 30-40. Вот эти паттерны и запрограммировать. Собственно, за словом "площадь" ищем вперед на 2-3 слова, начинающихся с цифры.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
begemot_sun
@begemot_sun
Программист в душе.
Томита парсер от Яндекса.
Делаете грамматику, и он способен выделить факты согласно этой грамматики.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы