Разбивка текста на смысловые части?

Есть ли сервис или алгоритм который может сделать разбивку предложения на смысловые части?
  • Вопрос задан
  • 6071 просмотр
Решения вопроса 1
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Единственно-верный вариант здесь: построение "дерева" связей между частями речи (внутри одного предложения), собранное из множества разных текстов с помощью человека на конкретных эталонных примерах.

Т.е., алгоритму нужно чётко знать: где какая часть речи может находиться внутри предложения (с наибольшей долей вероятности) относительно других частей речи (расположенных вокруг, до, после или отсутствующих вовсе).

А задача такого плана решается исключительно только с помощью создания и обучения НС.

Пример:
Подаём текст на анализ: "Сервер не включался из-за сломанного блока питания."
Отправляем на вход: "Почему не включался сервер?"
Получить должны: "Был сломан блок питания."
или
Отправляем на вход: "Блок питания был сломан?"
Получить должны: "Да."

Возможно, что автор имел ввиду разделить и заменить местоимения на цельно-выраженные сущности.
"Вот дом, который построил Джек":
1. "Дом" ("вот" - удаляем, т.к. это частица)
2. "Дом построил Джек" ("который" заменяем на управляющее существительное "Дом")

scheme-parts.png

PS: По ссылкам от Mikhail есть только простой шаблонный/словарный поиск с использованием правил и регулярных выражений - это не решение задачи в том виде, в котором возможно добиться правильной работы и корректного результата.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@Ostrie_Brevna
IT engeneer
Перед разбивкой на смысловые части ("семантический" разбор) имеет смысл научиться делать его синтаксический разбор, в результате которого предложение будет представлено в более "компьютерочитаемом" виде. Алгоритмов на то и то масса, реализаций тоже, литература уходит своими корнями глубоко в прошлый век. Можете начать смотреть здесь:
https://habrahabr.ru/post/148124/
https://nlpub.ru/Обработка_текста
otipl.philol.msu.ru/~soiza/testsynt/files/info-par...
https://tech.yandex.ru/tomita/doc/dg/concept/inter...
Программы по извлечению информации (фактов) из текста
https://dmkpress.com/catalog/computer/databases/97...
Ответ написан
sim3x
@sim3x
К разбивке на смысловые части задача
Длинные предложения невозможно произнести на одном дыхании

не имеет никакого отношения

Считаем количество слогов (гласных букв)
И для каждого человека считаем его макс количество гласных за вздох
Разбиваем текст

В общем случае задача - разбить текст на "смысловые части" не реализуема
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы