Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Question

Вадим Соловьёв @VadimSoloviev

Человек из касты создателей

Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Ищу софт который позволит в считанные секунды выполнить коррекцию правописания спаршенного с форума текста на русском и английском языках.
Открыл текст, нажал 1 или 2 кнопочки для разных языков - получил готовый результат.
Ищу софт который действует по принципу не навреди и корректирует только те слова в опечатках которых он уверен с высокой долей вероятности и который не заставляет пользователя просматривать километровый текстовый файл предлагая ему вручную подтверждать коррекцию 1000 неверно написанных слов. В первую очередь он должен уметь автоматически корректировать орфографию и опечатки так как итоговый текст будет подвергнут речевому синтезу. И когда синтезатор речи читает текст с опечатками это прям очень критично. Волей неволей встаёт вопрос о том что бы уменьшить их количество настолько насколько это вообще возможно автоматическим способом.

Вопрос задан более трёх лет назад
236 просмотров

1 комментарий

Подписаться 1 Средний 1 комментарий

Решения вопроса 2

1 комментарий

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Chrome

+2 ещё

Простой
Какие есть RSS клиенты с уведомлением о новом контенте?
- 1 подписчик
- вчера
- 67 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

Средний
Duolingo сайт не загружается. Надо DNS настроить?
- 1 подписчик
- 29 апр.
- 143 просмотра
1

ответ
Linux

+1 ещё

Простой
Можно ли настроить программный RAID в ORICO-9958C3?
- 2 подписчика
- 23 мар.
- 324 просмотра
2

ответа
Программное обеспечение и интернет-сервисы

Средний
Из-за чего не заходит на сайт через burp suite?
- 1 подписчик
- 19 мар.
- 133 просмотра
0

ответов
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Существуют ли ремонтно-инструментальные LiveDVD/USB, пригодные для работы с современными ноутами, требующими RST driver?
- 2 подписчика
- 19 мар.
- 309 просмотров
2

ответа
Компьютерные сети

+2 ещё

Простой
Обновление Samsung скачивается через браузер, но не скачивается без VPN в системе. Почему?
- 1 подписчик
- 19 мар.
- 1651 просмотр
2

ответа
Программное обеспечение и интернет-сервисы

Простой
Не открывается сайт генератора GRID?
- 1 подписчик
- 11 мар.
- 115 просмотров
0

ответов
Программное обеспечение и интернет-сервисы

Сложный
Почему не открывается определенный сайт ни через мобильное устройство, ни на компьютер (провайдер БиЛайн)?
- 1 подписчик
- 21 февр.
- 313 просмотров
2

ответа
Windows

+1 ещё

Простой
Windows 11 не пускает без интернета, а интернет могу включить только в параметрах, до которых мне не добраться, как исправить?
- 1 подписчик
- 15 февр.
- 738 просмотров
3

ответа
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Где можно хранить в интернете архивы бесплатно?
- 1 подписчик
- 02 февр.
- 417 просмотров
5

ответов
Показать ещё Загружается…

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Руководитель IT / Head of IT

Сигма • Волгоград

от 160 000 до 200 000 ₽

Менеджер по качеству (эквайринг, терминалы, ККТ, банкоматы, АДМ)

ИТ-Холдинг Т1 • Санкт-Петербург

До 130 000 ₽

Вадим Соловьёв дорогой пользователь, настоятельно рекомендуем еще раз обратить самое пристальное внимание на п. 3.1 регламента работы сервиса (и, в особенности, на его последний абзац).
В противном случае, ваши вопросы будут удаляться по причине тег-спама, а систематические нарушения приведут к блокировке учетной записи.

Answer 1 · 2018-12-15 22:01:36

На английском есть www.grammarly на русском могу ошибаться, но ничего такого нет, все проверяльщики как минимум сленгом не владеют.
Думал для русского такое сделать как pet-project но пока всё упирается во время.

Answer 2 · 2018-12-15 23:06:50

Для решения этой проблемы есть фундаментальное препятствие.
Для разработки подобного софта нужен общедоступный корпус языка (набор размеченных текстовых данных), создание которого - задача для лингвистов. Далее, этот набор данных должен быть интегрирован в достаточно специфическое ПО. А еще он должен быть доступен для разработчиков.

В случае русского языка, случилось закономерное: государственные институты занялись этой проблемой, но программную часть стал делать Яндекс. Это их традиционная манера - подмять под себя данные, которые созданы на деньги налогоплательщиков, превратив это либо в закрытый, либо в коммерческий продукт. Например, так происходит с данными о пробках, которые собираются гос. организациями, с данными о местоположении общественного транспорта и т.п. Результат - национальный корпус русского языка - закрытый проект с чертами коммерческого.

Потому такая штука как открытый корпус русского языка делается параллельно на добровольной основе www.opencorpora.org
Этого набора данных пока недостаточно для разработки того, о чем вы мечтаете.

Существует ли на мировом рынке софт для быстрой, автоматической коррекции правописания текстовых файлов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт