Возможно ли программно определить шрифт текста в pdf?

Хочу попробовать перевести книгу с помощью гугл переводчика , в последнее время он стал переводить очень даже не худо! Как все мы знаем в книгах обычный текст отличается от всего (идентификаторов, кода, терминов...) определенным шрифтом.
Так вот я подумал почему бы не переводить книги ? Выбор ЯП разнится между C и Py
Если у кого есть мысли по данному поводу, вы очень поможете в продвижении вопроса)
  • Вопрос задан
  • 118 просмотров
Решения вопроса 1
@carakan
Pdf достаточно сложная штука. Там несколько слоёв. В частности есть текстовый и графический. Текст может быть и там и там. В особо сложных случаях одновременно. Текстовый слой, конечно, хранит информацию о шрифтах. Не радномно же он выбирается. Текст с картинки распознать можно только с помощью ocr. Все известные мне решения с приемлемым качеством распознавания проприетарные.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
sotvm
@sotvm
Умный поймёт, а дураку и так всё равно.
шрифт текста ,к этому ,не имеет никакого отношения
Ответ написан
@12rbah
На питоне можно выбрать текст используя библиотеки для работы с pdf, сохранить его в txt и закинуть в переводчик.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы