Привет! Есть маркетплейс, и модуль переписки поставщика с клиентом. Нужно парсить все сообщения и вырезать: емейлы, телефоны, урлы.
Я написал базовую функцию, которая справляется с задачей. Но когда клиенты начинают её обходить и пишут что-то в стиле:
mybox собака майл.ру
Плюс семь 912 семьсот четырнадцать семьдесят один девяносто девять
Смс 7.9.1.2.1.2.3.4.5.6.7
...то мой парсер бессилен. Может кто сталкивался с хорошим готовым решением? Из тех, что я видел - идеально сделан парсер на AirBnB, его обмануть ну очень сложно.
P. S. Я конечно понимаю, что 100% распознавания контактов никогда не сделать, но мне нужно отсеить максимально большое кол-во таких "хитрецов".