Задать вопрос
@kolya2_romanov

Как написать детектор бреда на Python?

Я хочу чтобы я куда-то передавал строку типа "asdasfgasgfasgfasgas" или "лололололол)))" и программа вычисляла, бред это или нет. То есть чтобы на "Французские булочки", например" она реагировала не как на бред, а на "лелелелле" как на бред. С помощью чего это можно реализовать?
  • Вопрос задан
  • 554 просмотра
Подписаться 3 Средний 14 комментариев
Пригласить эксперта
Ответы на вопрос 6
firedragon
@firedragon
Не джун-мидл-сеньор, а трус-балбес-бывалый.
Атр я рж с вс и в тки хтите брд пределит?

Между прочим вы восстановите эту фразу
Ответ написан
solotony
@solotony
покоряю пик Балмера
вариант 1 - создать словарь и проверять наличие введенных слов в словаре (с поправкой на морфологию и на ошибки)

вариант 2 - сделать нейросеть и обучить ее. тут можно наобучать как на морфологию (то есть ловить afasfasfsd), так и на "смыслы" (то есть ловить "Спичка в библиотеке работает") - второй случай сложнее, но реализуемо.

вариант нейросети не исключает предварительную обработку словарем, морфологией, ошибками
Ответ написан
Комментировать
gbg
@gbg
Любые ответы на любые вопросы
Минимальный детектор бреда - это анализатор устройства слов по ряду формальных признаков
1) Слова на естественном языке не содержат цифр
2) Слова не содержат повторений букв больше двух подряд
3) В большинстве слов не содержится подряд больше двух согласных или больше двух гласных. Исключения можно поместить в словарь
4) Большинство слов не содержат циклических повторов групп символов.
Ответ написан
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
С помощью чего это можно реализовать?
токены перестановок + regex.
Ответ написан
@newvasyuki
Задача явно для машинного обучения и нейросетей. Задача классификации, supervised learning. Похожа на задачу детекции спам/не спам (ham). Пробуйте, мож че получиться.
Ответ написан
Комментировать
Согласен с комментами, ответ зависит от контекста и определения слов «бред» и «смысл».

Но в вашими примерами (
"asdasfgasgfasgfasgas" или "лололололол)))" VS "Французские булочки"
) справится spell checker. Например, https://pypi.org/project/pyspellchecker/
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы