@MagoVinch

Как получить дату и время из текста на python?

допустим есть строки типа "после завтра в 5 30", "в следующий вторник после 3"
и из этого нужно получить дату исходя из опорной и время
Какие есть паттерны решения этой задачи?
  • Вопрос задан
  • 1308 просмотров
Пригласить эксперта
Ответы на вопрос 5
leahch
@leahch
3D специалист. Dолго, Dорого, Dерьмово.
Здесь совсем нечеткая логика, скоре всего вам нужно будет парсить фразы на лексемы, затем определять грамматику самой фразы. Причем "после завтра в 5 30" и "завтра после 5 30" хоть и отличаются на одну букву, а промахнуться можно на сутки :-)
ну и наверняка не обойдется без какой нибудь векторной математики, типа какое действие за каким следует и к чему относится.
Ну и как минимум нужно много, очень много тестовых образцов. Например "вчера он сказал, что завтра будет дождь, дождя не было", "два дня назад от третьего воскресенья октября".
Ответ написан
@alex-t
Прогр. в команде rco.ru
Ого... Это в общем-то серьезный разбор текста, надо обычно не только время из текста выделить, но еще и найти к какому факту это упоминание времени относится, своими силами за несколько лет можно сделать... Наша фирма как раз ставит недешевую и достаточно нагружающую комп (код на С++) систему, которая это делает.
Ну если на вход уже поступают только строчки времени, то задача обозрима. За несколько недель работы 90% строчек будут определяться, думаю :)
Ответ написан
есть технология ABBYY Compreno, которая как раз специализируется на анализе текста. У неё есть API, выдающий в ответ не особо сложный XML.
https://www.abbyy.com/ru-ru/isearch/compreno/
Можно поспрашать у них, глядишь не придётся велосипед изобретать. Только возможно это будет стоить денюжку. Но за спрос-то, денег не берут)
Ответ написан
Комментировать
Парсите строку с помощью регулярок
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы