@PippiLongstocking

Модерация сообщений в чате — удаление наркосленга, какие есть готовые решения?

Добрый день!
У меня есть чат. В чате есть самописный бот с разными фичами. Сообществе есть большое количество людей, бывших зависимыми от наркотиков. Хочется добавить фичу в бота (написан на питоне, но я могу и впилить REST/gRPC/etc клиент к внешнему сервису), которая позволит детектить сообщения, содержащие что-то про наркотики и удалять их, т.к. видеть наркошутки, разные отслылки крайне некомфортно для тех, кто завязал.

Какие есть готовые/хорошие решения? Чат русскоязычный, именно поэтому спрашиваю тут, а не на stackoverflow
Так же не очень всё же хочется внешний сервис - чат закрытый, возможно, эти сообщения, которые бот будет отправлять через API на проверку, потом где-нибудь всплывут. Но проприетарное/бинарное решение, которое можно запустить локально, подойдёт, если не слишком дорогое

Велосипед, написанный самостоятельно тоже подойдёт, но хотелось бы знать, как это правильно написать. Например, где взять датасет со сленгом?
  • Вопрос задан
  • 131 просмотр
Пригласить эксперта
Ответы на вопрос 1
hottabxp
@hottabxp
Сначала мы жили бедно, а потом нас обокрали..
1) Готовых хороших решений скорее всего нет, так как задача - узкоспециализированная.
2) Готовых решений в принципе не может быть, так как, во-первых, - наркозависимые могут использовать вполне обычные для нас слова, но они будут означать совершенно другое. Во вторых - они каждый день придумывают новые слова для шифрования между собой.

Викисловарь - Сленг наркоманов

Думаю, тут даже нейросеть не поможет) Вот несколько слов из викисловаря:
Фен, Вася, Витя, Аптека, Атом, Дима, Камень, Твёрдый, Медицина, Москва, Сахар ...

А теперь попробуйте определить...
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы