@SemenPPP

Есть нейронка, которая корректирует текст после транскрибации аудио?

Сейчас есть ряд инструментов транскрибации аудио- файлов, после которых на выходе получается "мешок слов": текст не содержит знаков препинаний + нет деления на абзацы (смысловые единицы) + содержит грамматические ошибки.

Логично предположить, что раз нейронки уже умеют генерить текст на заданную тему с нуля, то они вполне могут откорректировать подобную словарную кашу в удобочитаемый текст, задав форму с помощью знаков препинания и абзацев + самостоятельно исправить большую часть ошибок. Ведь в подобных текстах значительно больше исходной информации, чем просто заданная тема, поэтому и сделать это нейронке будет проще.

Кстати, тоже самое относится к распознаванию pdf- файлов / картинок: после этого процесса также нужно вручную исправлять ошибки OCR, чего хотелось бы избежать. В подобном тексте присутсвуют как синтаксические ошибки (отсутствующие либо лишние знаки припинания), так и грамматические ошибки.

Есть такие обученные нейронные сети?
  • Вопрос задан
  • 276 просмотров
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
таких нейронок нет и будут не скоро - вектора миллиардные
скорее уж классическими NLP методами, на MS Word можешь посмотреть чего Микрософт достиг
уже не мультик анальный, но и... да собственно мало что и, лет за 20 достижений пшик

все что могут нейронки сегодня - это переводы, т.е. вероятносные сопоставления одних векторов другим

все

увелчились мощности - стали лучше переводить с английского на английский (GPT, ага) но понимать смысл по-прежнему никак ибо надо еще порядка на 2 увеличить
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы