Разбивка текста на смысловые части?

Question

korvova @korvova

Алгоритмы

Разбивка текста на смысловые части?

Есть ли сервис или алгоритм который может сделать разбивку предложения на смысловые части?

Вопрос задан более трёх лет назад
7385 просмотров

10 комментариев

Подписаться 17 Оценить 10 комментариев

Александр Пожарский @alex4321

Для начала - какого рода "смысловые части"? Если речь о относительно слабо связанных друг с другом блоках (читай - набор сущностей в одном блоке слабо перекликается с другими)?

Написано более трёх лет назад
korvova @korvova Автор вопроса

Александр Пожарский:
Длинные предложения невозможно произнести на одном дыхании, поэтому они делятся на части - смысловые отрезки. Смысловой отрезок может состоять из одного слова, группы слов, придаточного предложения или простого нераспространенного предложения.

Например, в предложении: "Вот дом, который построил Джек" может быть две смысловые группы - одна выражена группой слов: "Вот дом", а другая - придаточным предложением: "который построил Джек".

Если мы каждую смысловую группу разделим ещё на какие-нибудь отрезки, то это приведёт к нарушению смысла данного предложения.

Вот мне интересно если такие алгоритмы или сервесы которые научились это делать, мне кажется тут без нейронки не обойтись:(?

Написано более трёх лет назад
Александр Пожарский @alex4321

korvova: А не достаточно ли будет разбивки на отдельные простые предложения в сложном (complex sentence же). OpenNLP вроде может в такое.

Написано более трёх лет назад
korvova @korvova Автор вопроса

Александр Пожарский: спасибо большое за наводку! Вроде то.

Написано более трёх лет назад
Денис Широкопояс @denis24

Интересно действительно узнать, зачем Вам создавать программу, которая будет сама создавать простые тексты?

Написано более трёх лет назад
Saboteur @saboteur_kiev

А почему бы просто не посмотреть пару видеокурсов ораторского мастерства, и не научиться произносить сложные предложения не теряя дыхание?

Написано более трёх лет назад
korvova @korvova Автор вопроса

Денис Широкопояс: Денис Широкопояс: Вообще пытаюсь написать программу которая будет отображать, что написано в тексте. Кидаешь рассказ в она рисует экскизы того что написано. На первом этапе Реализацию вижу такую:
1) Разбиваем текст на смыслы.
2) Вставляем смысловую фразу в поиск по картинкам, выдергиваем оттуда картинку. вставляем под смысловой частью эту картинку и т.д.

Я сделал это вручную посмотреть как будет выглядеть, выглядит очень круто, фактически на основе текста программа делает комикс из картинок, что очень быстро воспринимается и запоминается. Конечно все очень сыро и много косяков, но написав качественную НС должно получиться очень интересно)

Написано более трёх лет назад
korvova @korvova Автор вопроса

Юрий: это конечная задача)

Написано более трёх лет назад
Денис Широкопояс @denis24

korvova: Действительно интересно...

Написано более трёх лет назад
private_tm @private_tm

korvova: а разбивка знаками препинания не есть разбивка и на смысловые части?(возможно глупый вопрос)

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Go-разработчик с нуля + нейросети

9 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Простой
Стоит ли читать книгу «Грокаем алгоритмы»?
- 1 подписчик
- 27 мая
- 322 просмотра
0

ответов
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 387 просмотров
3

ответа
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 220 просмотров
1

ответ
Алгоритмы

Простой
Какие данные берет функция для генерации случайного числа?
- 1 подписчик
- 18 февр.
- 280 просмотров
4

ответа
C++

+1 ещё

Простой
Почему не решает задачу?
- 1 подписчик
- 05 февр.
- 427 просмотров
1

ответ
Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт. 2025
- 405 просмотров
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт. 2025
- 295 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 251 просмотр
2

ответа
Алгоритмы

Простой
Как открыть файл сжатый с помощью алгоритма Brotli на пк?
- 1 подписчик
- 19 окт. 2025
- 235 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт. 2025
- 391 просмотр
1

ответ
Показать ещё Загружается…

Для начала - какого рода "смысловые части"? Если речь о относительно слабо связанных друг с другом блоках (читай - набор сущностей в одном блоке слабо перекликается с другими)?
Александр Пожарский:
Длинные предложения невозможно произнести на одном дыхании, поэтому они делятся на части - смысловые отрезки. Смысловой отрезок может состоять из одного слова, группы слов, придаточного предложения или простого нераспространенного предложения.

Например, в предложении: "Вот дом, который построил Джек" может быть две смысловые группы - одна выражена группой слов: "Вот дом", а другая - придаточным предложением: "который построил Джек".

Если мы каждую смысловую группу разделим ещё на какие-нибудь отрезки, то это приведёт к нарушению смысла данного предложения.

Вот мне интересно если такие алгоритмы или сервесы которые научились это делать, мне кажется тут без нейронки не обойтись:(?
korvova: А не достаточно ли будет разбивки на отдельные простые предложения в сложном (complex sentence же). OpenNLP вроде может в такое.
Александр Пожарский: спасибо большое за наводку! Вроде то.
Интересно действительно узнать, зачем Вам создавать программу, которая будет сама создавать простые тексты?
А почему бы просто не посмотреть пару видеокурсов ораторского мастерства, и не научиться произносить сложные предложения не теряя дыхание?
Денис Широкопояс: Денис Широкопояс: Вообще пытаюсь написать программу которая будет отображать, что написано в тексте. Кидаешь рассказ в она рисует экскизы того что написано. На первом этапе Реализацию вижу такую:
1) Разбиваем текст на смыслы.
2) Вставляем смысловую фразу в поиск по картинкам, выдергиваем оттуда картинку. вставляем под смысловой частью эту картинку и т.д.

Я сделал это вручную посмотреть как будет выглядеть, выглядит очень круто, фактически на основе текста программа делает комикс из картинок, что очень быстро воспринимается и запоминается. Конечно все очень сыро и много косяков, но написав качественную НС должно получиться очень интересно)
korvova: а разбивка знаками препинания не есть разбивка и на смысловые части?(возможно глупый вопрос)

Answer 1 · 2017-01-09 17:01:44

Единственно-верный вариант здесь: построение "дерева" связей между частями речи (внутри одного предложения), собранное из множества разных текстов с помощью человека на конкретных эталонных примерах.

Т.е., алгоритму нужно чётко знать: где какая часть речи может находиться внутри предложения (с наибольшей долей вероятности) относительно других частей речи (расположенных вокруг, до, после или отсутствующих вовсе).

А задача такого плана решается исключительно только с помощью создания и обучения НС.

Пример:
Подаём текст на анализ: "Сервер не включался из-за сломанного блока питания."
Отправляем на вход: "Почему не включался сервер?"
Получить должны: "Был сломан блок питания."
или
Отправляем на вход: "Блок питания был сломан?"
Получить должны: "Да."

Возможно, что автор имел ввиду разделить и заменить местоимения на цельно-выраженные сущности.
"Вот дом, который построил Джек":
1. "Дом" ("вот" - удаляем, т.к. это частица)
2. "Дом построил Джек" ("который" заменяем на управляющее существительное "Дом")

PS: По ссылкам от Mikhail есть только простой шаблонный/словарный поиск с использованием правил и регулярных выражений - это не решение задачи в том виде, в котором возможно добиться правильной работы и корректного результата.

Answer 2 · 2017-01-09 13:24:42

Перед разбивкой на смысловые части ("семантический" разбор) имеет смысл научиться делать его синтаксический разбор, в результате которого предложение будет представлено в более "компьютерочитаемом" виде. Алгоритмов на то и то масса, реализаций тоже, литература уходит своими корнями глубоко в прошлый век. Можете начать смотреть здесь:
https://habrahabr.ru/post/148124/
https://nlpub.ru/Обработка_текста
otipl.philol.msu.ru/~soiza/testsynt/files/info-par...
https://tech.yandex.ru/tomita/doc/dg/concept/inter...
Программы по извлечению информации (фактов) из текста
https://dmkpress.com/catalog/computer/databases/97...

Answer 3 · 2017-01-09 18:28:51

К разбивке на смысловые части задача

Длинные предложения невозможно произнести на одном дыхании

не имеет никакого отношения

Считаем количество слогов (гласных букв)
И для каждого человека считаем его макс количество гласных за вздох
Разбиваем текст

В общем случае задача - разбить текст на "смысловые части" не реализуема

Разбивка текста на смысловые части?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт