Задать вопрос
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com

Как валидировать абсурдные суждения/предложения?

Пример:
Воздушный слон грелся на зелёном облаке во время сияющего круглого куба, где квадратные деревья спускались с левого колеса, перешагивающего через сферического коня в вакууме.

Есть какие-либо методики (теория) и наработки (код) в этом направлении (больше всего - теория интересует)?

Заранее, Благодарю всех откликнувшихся.
  • Вопрос задан
  • 663 просмотра
Подписаться 6 Сложный 4 комментария
Решения вопроса 1
xmoonlight
@xmoonlight Автор вопроса
https://sitecoder.blogspot.com
Таблица истинности всех валидных натуральных свойств объектов с учётом корректности логических отношений каждого из свойств между собой.

Пример: Воздушный слон

Логика рассуждения (алгоритм работы кода):
1. Слон -> животное, перемещается, шагая по плотной поверхности, дышит воздухом (частично им наполнен)
2. Воздушный -> Воздух -> опирается на любую поверхность (снаружи), заполняет любое свободное пространство (изнутри).
3. Воздушный -> Наполняет изнутри или окружает объект со всех сторон.

Выводы:
1. Слон не состоит на 100% из воздуха.
2. Слон не окружён воздухом со всех сторон.

Итог: Воздушный слон - невозможен, суждение абсурдно.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 7
@Dmtm
Android
только статистикой, при распознавании мы вынуждены предполагать что текст для говорящего имеет смысл, а делать вывод об абсурдности - только через накопление типичных использованных свойств
т.е. после обучения на 10000 текстов - для объектов будут выделены типичные свойства
и если скажем обучать на авангардных стихах то исходный пример - будет осмысленным, это нормально
абсурдность = мнение большинства, т.е. статистика
Ответ написан
Комментировать
daemonhk
@daemonhk
ПсиХоПат
Мне вот просто интересно как вы без словаря собрались это делать? Понятное дело, что к объекту можно применить чуть ли не все прилагательные (слон может быть и раненным, и влюбленным, и больным, и индийским, и дрессированным, и т.д.).

Вариант первый - составление пар. Есть 3 таблицы - существительные, прилагательные и их отношения, в которых также пишется статус пары (верно/ложно), типа "Индийский слон" - верно, "Жидкий слон" - ложно. При этом стоит учесть, что некоторые группы прилагательных, например, сравнительные (или как их там?) применимы к 99% существительных - БОЛЬШОЙ куст, БОЛЬШОЙ нос, БОЛЬШИЕ проблемы, МАЛЕНЬКИЙ рост, МАЛЕНЬКИЕ возможности, и т.д.

Вариант второй - научить ИИ языку, чтобы он понимал контекст, словоформы, потому что в первый вариант нужно еще добавить этот самый контекст, например "квадратные деревья спускались с левого колеса". Либо разбивать на пары "существительное - прилагательное" и если хоть одна пара ложная, то значит и все предложение ложное.

P.S. Обычно такой бред говорят/пишут больные, у которых проблемы с головой, не помню как называется болезнь, конкретно, но может ТС как раз для этого и хочет приблуду сделать, я хз))
P.S.S. В ИИ не шарю, понимаю, что словари должны быть просто огромными, я обычный диванный теоретик, пробегающий мимо))
Ответ написан
Word embeddings на большом корпусе текстов выявляет расстояния между встречающимися словами и в т.ч. определяет, что "щенок" для "собаки" это то же, что "котёнок" для "кошки". Фразе можно давать "вес осмысленности" как функцию близости составляющих её слов. Меньше вес — вероятнее бессмыслица.

Результат зависит от того, какие тексты исползовать для обучения. Если скормить научные публикации и если детскую библиотеку сказок и фэнтези, оценки расстояния "воздушный" и "слон" получатся разными.

Ещё одна слабость в том, что модель никак не различает множественные значения слов: «смотрел на облако» и «залил на облако». P.s. и «смотрел на залив» )
Ответ написан
profesor08
@profesor08
У каждого объекта есть свой набор свойств. Значит найди в предложении части [свойство] [объект], а потом проверяй, есть ли у объекта данное свойство, если есть - норм, если нет - абсурд. Либо на оборот, у каждого свойства есть список объектов, которыми им обладают. Так и проверяй.
Ответ написан
dllweb
@dllweb
Это вы наверное хотите кривой перевод с одного из сервисов причесать?
Вряд ли получится понять где абсурдные суждения/предложения. Увы
Ответ написан
deeppsycoder
@deeppsycoder
клинический психолог
У BERT есть режим проверки логичности двух фраз. Думаю, можно это использовать.
Ответ написан
Комментировать
zabudkin
@zabudkin
Инженер-системотехник, программист, админ, ТПУ!!!!
Я бы поступил проще и вернее.
Берём последние символы от всех слов, что есть в предложении, но до символов а,е,и,у.
Если в предложении у всех слов с конца на скажем три символа вперёд, ну то есть substr -3, и там есть кто-то из них, и их много в общем предложении, скажем 3 или 5, то спам однозначно.

И никакой ИИ не нужен и словари тоже.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы