Стоит задача - скрывать контактные данные у пользовательских сообщений (эл. почта, сайт и телефон).
Понятно, что простые регекспы не подойдут, ибо никто не менял
munging.
Думаю над оптимальным алгоритмом. Пока остановился на н-грамах, нахождение подозрительного токена (напр. больше 2-3 цифр | @ | [at] | at " dot ) и осмотр соседних.
В общем, посоветуйте, кто сталкивался, по какому пути пойти, или, может, вообще что-то есть готовое ... или библиотеки какие в помощь.