Как разбить текст на предложения?

Question

Andrey Kobyshev @yokotoka

Python guru

Как разбить текст на предложения?

Есть сплошной поток текста, полученный на выходе системы распознавания речи.

Нужно этот сплошной поток текста автоматически преобразовать в более-менее читаемый вид - с правильной пунктуацией и разделением на предложения, абзацы. Для простоты пока положим, что это нужно только для русского или английского языка.

Какие существуют алгоритмы, подходы, библиотеки, наработки, литература, где подобная задача или её части уже решены?

Вопрос задан более трёх лет назад
1127 просмотров

Комментировать

Подписаться 6 Сложный Комментировать

Answer 1 · 2018-03-10 18:23:57

в таком виде задачка скорее всего решается нейросетями после долгого обучения
но имхо грубо разметить если есть сопоставление звука и текста можно по паузам

Как разбить текст на предложения?

Войдите на сайт