librown
@librown
На-все-руки-мастер и немного кодер

Как вырезать из строки контактные данные?

Привет! Есть маркетплейс, и модуль переписки поставщика с клиентом. Нужно парсить все сообщения и вырезать: емейлы, телефоны, урлы.

Я написал базовую функцию, которая справляется с задачей. Но когда клиенты начинают её обходить и пишут что-то в стиле:

mybox собака майл.ру
Плюс семь 912 семьсот четырнадцать семьдесят один девяносто девять
Смс 7.9.1.2.1.2.3.4.5.6.7

...то мой парсер бессилен. Может кто сталкивался с хорошим готовым решением? Из тех, что я видел - идеально сделан парсер на AirBnB, его обмануть ну очень сложно.

P. S. Я конечно понимаю, что 100% распознавания контактов никогда не сделать, но мне нужно отсеить максимально большое кол-во таких "хитрецов".
  • Вопрос задан
  • 278 просмотров
Пригласить эксперта
Ответы на вопрос 2
myfirepukan
@myfirepukan
Жарим поиск
Ну вот начинайте дополнять свой парсер словами "собака" числительными, странным сочетаниями всякими типа 3 цифры через точку, со временем у вас будет система которая различает почти всё.
Ответ написан
Комментировать
kawabanga
@kawabanga
На fl.ru несколько лет назад была неудачная идея - читать все сообщения пользователей.

А так, по мне, так шанс сделать такой парсер - утопичная идея. в крайнем случае можно картинку прислать, или вместо знаков препинания в конце предложения цифру давать. У вас нет шансов предотвратить передачу контактных данных. Смиритесь с этим. И делайте ваш сервис более интересным.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы