Как написать детектор бреда на Python?

Question

kolya2_romanov @kolya2_romanov

Как написать детектор бреда на Python?

Я хочу чтобы я куда-то передавал строку типа "asdasfgasgfasgfasgas" или "лололололол)))" и программа вычисляла, бред это или нет. То есть чтобы на "Французские булочки", например" она реагировала не как на бред, а на "лелелелле" как на бред. С помощью чего это можно реализовать?

Вопрос задан более трёх лет назад
562 просмотра

14 комментариев

Подписаться 3 Средний 14 комментариев

Пашенька @like-a-boss

А норм, спс, ваще агонь! – это бред или нет?

Написано более трёх лет назад
rPman @rPman

это является бредом?

Величина, оторванная в область дипломатии, даёт свои колебания на всю дипломатию. А Илья Муромец даёт колебания только на семью на свою. Спичка в библиотеке работает. В кинохронику ходят и зажигают в кинохронике большой лист. В библиотеке маленький лист разжигают. Огонь… э-э-э… будет вырабатываться гораздо легче, чем учебник крепкий.

Написано более трёх лет назад
Роман @lastuniverse

поддержу Пашенька, для примера того же клевербота взять, каждая его фраза одновременно и бред и не бред.

Написано более трёх лет назад
kolya2_romanov @kolya2_romanov Автор вопроса

Бред рассматривать как строчку, вообще не имеющую смысла, то есть в ней нет осмысленных слов, просто "улюлю" "абябяб" "крфылда88))рдфлыа"

Написано более трёх лет назад
Antonio Solo @solotony

Варкалось. Хливкие шорьки
Пырялись по наве,
И хрюкотали зелюки,
Как мюмзики в мове.

бред ?

Написано более трёх лет назад
Роман @lastuniverse

Antonio Solo, rPman, даже гугл с такими "оссмысленными" генерациями, основанными на цепях маркова почти год не мог ничего сделать (вываливалось периодически в результатах поиска)

Написано более трёх лет назад
Пашенька @like-a-boss

kolya2_romanov, не имеющую смысла для кого? Кто-то может в чём угодно найти смысл, кто-то – нет, в силу более узкого восприятия или иных факторов. Вы сами не можете дать критерии того, что является бредом, и, в данном случае, это нормально. Тогда как же это сможет сделать программа? Программа – это алгоритм действий, написанный человеком.

Написано более трёх лет назад
Сергей П @trapwalker Куратор тега Python

kolya2_romanov, в смысле?! "улюлю" - это не бред! Это когд аты бежишь маленький красный с деревянной винтовкой, а в кустах белые залегли и громко отстреливаются.

Написано более трёх лет назад
Пашенька @like-a-boss

Роман, Цепи Маркова нормально заходили ему в виде дорвеев в дветысячишестых и, наверное, ещё много лет (:

Написано более трёх лет назад
Роман @lastuniverse

Пашенька, ну так я про те времена и говорю)

Написано более трёх лет назад
Роман @lastuniverse

Роман, с намеком на то, что одна из крупнейших компаний, имеющая в своем распоряжении мощнейшие синтаксические, семантические, лексические и контекстные анализаторы не могла справится с данной задачей. А тут чувак имея пенек и питон, не имея контекста, а имея отдельные, выдранные из контекста наборы букв хочет определить бред/небред)))

Написано более трёх лет назад
Antonio Solo @solotony

"улюлю" - это не бред! Это когд аты бежишь маленький красный с деревянной винтовкой, а в кустах белые залегли и громко отстреливаются.

Сергей Паньков, но это будет бредом, если ты позвонишь в службу поддержки банка

Написано более трёх лет назад
Сергей П @trapwalker Куратор тега Python

Antonio Solo, если это секретное слово для уатентификации клиента, то отнюдь.
Короче, суть в том, что любое сочетание байтов, букв, вспышек света, электрических импулсов, клубов дыма, звуков очень сильно связано с контекстом и может считаться бредом или полезным сообщением в зависимости от контекста, от информации, которой владеет получатель, от интерпретации.
Автор вопроса наивно оставил за скобками определение смысла. Что такое осмысленное сообщение, каковы его критерии? Это очень сложный вопрос.

Скорее всего автору не требуетя решать сложные философские вопросы о том что такое бред, а что такое нет.
Скорее вего можно обойтись простой проверкой по словарю или проверкой частотсности вхождения символов на соответствие частотных показателей конкретного языка, или, если есть большая обучающая выборка, можно обучить нейронную сеть, или вообще оценивать дианмику набора символов, если они приходят с клавиатуры, а може быть имеет смысл оценивать другие критерии, например тайминги действий и паттерны поведения пользователя.

Но атвор вопроса нашел "самый простой" способ решения и озадачил им нас: "построить сильный ИИ, которому бы не скучно было классифицировать для него (автора вопраса) строки по стеени бредовости".
По мне, так автора бы такой ИИ точно зарубил бы.

Написано более трёх лет назад
Adamos @Adamos

Antonio Solo, заткнись и слушай! Это ключевая фраза!

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 6

9 комментариев

Роман @lastuniverse

по мне так фраза "автор я ржу с вас и вы таки хотите бред определить" достаточно бредовая и с полным набором букв)))))

Написано более трёх лет назад
Владимир Коротенко @firedragon

Роман, Но несмотря на шум вы определили ее дословно. А вот что то машинное справится с трудом

Написано более трёх лет назад
Роман @lastuniverse

Владимир Коротенко, дайте мне комп с многомного оперативки)) и не меньшим количеством терафлопсов и я решу эту задачу алгоритмически))))

Написано более трёх лет назад
Loli E1ON @E1ON

Написано более трёх лет назад
Alex @alexjet73

пока не прочитал коммент Романа ничего не понял кроме "определит"))

Написано более трёх лет назад
Antonio Solo @solotony

ничего принципиально невозможно в вашей задаче нет.

1) получение из ошибок возможные оригиналы -для каждого слова массив оригиналов.
2) имея оригиналы - восстановление наиболее вероятной последовательности, используя корпус текстов

С другой стороны если рассматривать нормальное общение людей, то вполне допустимо считать это за бред. По крайней мере я просто игнорю сообщения, если речь собеседника недостаточно грамотна и содержит кучу всякого мусора.

Написано более трёх лет назад
Владимир Коротенко @firedragon

Antonio Solo, лол да вы сноб! А как же кащениты, хацкеры и прочие? И до кучи вы сейчас обидели индусов и чёрных братьев говорящих на эбони

Написано более трёх лет назад
Antonio Solo @solotony

Владимир Коротенко, есть немного. если кого обидел - всем прощаю.

p.s. сам когда-то был подписан на кащенко.локал ... и было ведь время..

Написано более трёх лет назад
Владимир Коротенко @firedragon

Antonio Solo, чёрные братья и феминисторши это практически на краю

Написано более трёх лет назад

Комментировать

3 комментария

4 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 199 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 212 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 73 просмотра
1

ответ
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 288 просмотров
3

ответа
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 104 просмотра
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 96 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 117 просмотров
1

ответ
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 185 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 463 просмотра
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 3 подписчика
- 05 мар.
- 986 просмотров
4

ответа
Показать ещё Загружается…

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

Junior AI Automation Engineer / AI-инженер (junior)

OPENCITY • Москва

от 50 000 ₽

А норм, спс, ваще агонь! – это бред или нет?
это является бредом?

Величина, оторванная в область дипломатии, даёт свои колебания на всю дипломатию. А Илья Муромец даёт колебания только на семью на свою. Спичка в библиотеке работает. В кинохронику ходят и зажигают в кинохронике большой лист. В библиотеке маленький лист разжигают. Огонь… э-э-э… будет вырабатываться гораздо легче, чем учебник крепкий.
поддержу Пашенька, для примера того же клевербота взять, каждая его фраза одновременно и бред и не бред.
Бред рассматривать как строчку, вообще не имеющую смысла, то есть в ней нет осмысленных слов, просто "улюлю" "абябяб" "крфылда88))рдфлыа"
Варкалось. Хливкие шорьки
Пырялись по наве,
И хрюкотали зелюки,
Как мюмзики в мове.

бред ?
Antonio Solo, rPman, даже гугл с такими "оссмысленными" генерациями, основанными на цепях маркова почти год не мог ничего сделать (вываливалось периодически в результатах поиска)
kolya2_romanov, не имеющую смысла для кого? Кто-то может в чём угодно найти смысл, кто-то – нет, в силу более узкого восприятия или иных факторов. Вы сами не можете дать критерии того, что является бредом, и, в данном случае, это нормально. Тогда как же это сможет сделать программа? Программа – это алгоритм действий, написанный человеком.
kolya2_romanov, в смысле?! "улюлю" - это не бред! Это когд аты бежишь маленький красный с деревянной винтовкой, а в кустах белые залегли и громко отстреливаются.
Роман, Цепи Маркова нормально заходили ему в виде дорвеев в дветысячишестых и, наверное, ещё много лет (:
Пашенька, ну так я про те времена и говорю)
Роман, с намеком на то, что одна из крупнейших компаний, имеющая в своем распоряжении мощнейшие синтаксические, семантические, лексические и контекстные анализаторы не могла справится с данной задачей. А тут чувак имея пенек и питон, не имея контекста, а имея отдельные, выдранные из контекста наборы букв хочет определить бред/небред)))
"улюлю" - это не бред! Это когд аты бежишь маленький красный с деревянной винтовкой, а в кустах белые залегли и громко отстреливаются.

Сергей Паньков, но это будет бредом, если ты позвонишь в службу поддержки банка
Antonio Solo, заткнись и слушай! Это ключевая фраза!

Answer 1 · 2020-11-06 13:42:35

Владимир Коротенко @firedragon

Не джун-мидл-сеньор, а трус-балбес-бывалый.

Атр я рж с вс и в тки хтите брд пределит?

Между прочим вы восстановите эту фразу

Ответ написан более трёх лет назад

9 комментариев

Answer 2 · 2020-11-06 13:45:19

вариант 1 - создать словарь и проверять наличие введенных слов в словаре (с поправкой на морфологию и на ошибки)

вариант 2 - сделать нейросеть и обучить ее. тут можно наобучать как на морфологию (то есть ловить afasfasfsd), так и на "смыслы" (то есть ловить "Спичка в библиотеке работает") - второй случай сложнее, но реализуемо.

вариант нейросети не исключает предварительную обработку словарем, морфологией, ошибками

Answer 3 · 2020-11-07 15:15:56

Минимальный детектор бреда - это анализатор устройства слов по ряду формальных признаков
1) Слова на естественном языке не содержат цифр
2) Слова не содержат повторений букв больше двух подряд
3) В большинстве слов не содержится подряд больше двух согласных или больше двух гласных. Исключения можно поместить в словарь
4) Большинство слов не содержат циклических повторов групп символов.

Answer 4 · 2020-11-06 18:29:50

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

С помощью чего это можно реализовать?

токены перестановок + regex.

Ответ написан более трёх лет назад

4 комментария

Answer 5 · 2020-11-07 13:09:16

Задача явно для машинного обучения и нейросетей. Задача классификации, supervised learning. Похожа на задачу детекции спам/не спам (ham). Пробуйте, мож че получиться.

Answer 6 · 2020-12-04 12:50:54

Согласен с комментами, ответ зависит от контекста и определения слов «бред» и «смысл».

Но в вашими примерами (

"asdasfgasgfasgfasgas" или "лололололол)))" VS "Французские булочки"

) справится spell checker. Например, https://pypi.org/project/pyspellchecker/

Как написать детектор бреда на Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт