Задать вопрос

Руслан Корсунов

2

вклад
8

вопросов
3

ответа
33%

решений

Ответы пользователя по тегу Распознавание текста

Хорошие современные SaaS-решения для транскрибирования текста из аудиозаписей на русском языке?

Руслан Корсунов @ruslan6565

Яндекс.Облако - предоставляет API для распознавания речи на русском языке с точностью до 95%. Стоимость услуг зависит от количества обработанных минут.

Ответ написан более двух лет назад

Комментировать

Комментировать
Чем обработать DJVU, PDF книги?

Руслан Корсунов @ruslan6565

Для распознавания текста и извлечения информации из оглавления книг можно использовать OCR (оптическое распознавание символов) и NLP (обработка естественного языка) технологии. Например, для распознавания текста в формате DJVU или PDF можно использовать библиотеку Tesseract OCR. Она позволяет извлекать текст из изображений и PDF-файлов, а также сохранять результаты в текстовый файл. Для обработки полученного текста можно использовать библиотеку NLTK (Natural Language Toolkit). Она предоставляет инструменты для обработки естественного языка, такие как токенизация, стемминг, лемматизация и т.д. Для извлечения информации из оглавления книг можно использовать регулярные выражения или библиотеку BeautifulSoup для парсинга HTML-страниц. Для сохранения каждого раздела и картинок в отдельные файлы можно использовать библиотеку PyPDF2 для работы с PDF-файлами или библиотеку Pillow для работы с изображениями. В целом, для автоматического выполнения данной задачи необходимо написать скрипт на языке программирования, который будет использовать вышеупомянутые библиотеки и алгоритмы для обработки книг. Наверно я понятно объяснил.

Ответ написан более двух лет назад

2 комментария

2 комментария

Самые активные сегодня

guatemala812
- 1 ответ
- 1 вопрос
ky0
- 2 ответа
- 0 вопросов
newked
- 0 ответов
- 1 вопрос
DevilDuncan
- 0 ответов
- 1 вопрос
Dmitry
- 1 ответ
- 0 вопросов
Yappy1
- 1 ответ
- 0 вопросов

Хорошие современные SaaS-решения для транскрибирования текста из аудиозаписей на русском языке?

Чем обработать DJVU, PDF книги?

Войдите на сайт