Задать вопрос
@bamboozle

Существуют ли общедоступные инструменты для проверки текста на спам или базы «спам-фраз» для самостоятельной проверки?

Есть сервис, который обладает функционалом, позволяющим сгенерировать письмо для нужного адреса. Например, можно пригласить других присоединиться к использованию сервиса, либо просто зарегистрироваться по имейлу и ждать письма с подтверждением. С недавних пор этим начали активно пользоваться спамеры. Текст писем генерируется сервисом, однако спамерам достаточно имени пользователя, в которое они включают ссылки и прочий мусор. Язык спама в основном китайский и русский. Первая мысль была: наверняка есть сервисы или инструменты для автоматической проверки текста и детекта спама.
Увы, все оказалось не так просто. Гугл с радостью выдал spam assassin как самый популярный инструмент, однако он:
  • рассматривает в первую очередь заголовки, данные отправителя и т.д., а нас интересует только текст (наверняка можно настроить)
  • кажется, еще не понимает спама, связанного с криптовалютами (наверняка можно решить плагинами)
  • самое главное - работает только с английским


Дальнейшие поиски инструментов или хотя бы готовых баз текстов для нужных языков (в первую очередь русского) ни к чему не привели и, похоже, придется городить велосипед. Но все же кажется, что подобная задача уже должна быть давно решена.

Платные решения тоже подойдут.
  • Вопрос задан
  • 116 просмотров
Подписаться 1 Средний Комментировать
Пригласить эксперта
Ответы на вопрос 2
@noma
SpamAssasin локальный.
Он настраивается.
В том числе и поддерживает русский и пр. что вам надо.

Готовых баз быть не может.
То есть какая то основа есть, но потом - это нужно настраивать и подгонять под себя.
Все эти спамо-фильтры должны обучаться регулярно. Поэтому вам нужно предусмотреть ручную передачу писем SpamAssasin в случае ошибок (обучение на спам или на "неспам")
Ответ написан
К сожалению, таким образом вы проблему не устраните. Надежный способ решния - только устранить пользовательский контент (UGC) до валидации адреса. Достаточно подробно в т.ч. с описанием решений, в этой статье.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы