Возможно ли программно определить шрифт текста в pdf?

Question

Виктор Дубров @victor1985

Возможно ли программно определить шрифт текста в pdf?

Хочу попробовать перевести книгу с помощью гугл переводчика , в последнее время он стал переводить очень даже не худо! Как все мы знаем в книгах обычный текст отличается от всего (идентификаторов, кода, терминов...) определенным шрифтом.
Так вот я подумал почему бы не переводить книги ? Выбор ЯП разнится между C и Py
Если у кого есть мысли по данному поводу, вы очень поможете в продвижении вопроса)

Вопрос задан более трёх лет назад
129 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 2

6 комментариев

Виктор Дубров @victor1985 Автор вопроса

А что имеет? Как отличать текст?

Написано более трёх лет назад
SVM @sotvm

конвертировать
не забываем,что пдф может быть не только в текстовом виде,
а как картинка

Написано более трёх лет назад
dollar @dollar

Почему вы не ставите пробелов после запятых, а иногда даже ставите пробел перед запятой? Ведь так не принято.

Написано более трёх лет назад
SVM @sotvm

dollar,
не учи меня программировать

Написано более трёх лет назад
dollar @dollar

SOTVM, это не программирование, это русский язык.
И я не учу, а спрашиваю.

Написано более трёх лет назад
SVM @sotvm

dollar,
я был двоешником
пишу как умею

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 716 просмотров
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 538 просмотров
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 617 просмотров
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1338 просмотров
10

ответов
Программирование

Простой
Как создать и использовать свою кодировку знаков?
- 1 подписчик
- 02 июн.
- 727 просмотров
4

ответа
Программирование

+1 ещё

Простой
Проект для программирования?
- 2 подписчика
- 27 апр.
- 876 просмотров
9

ответов
Программирование

Простой
Олимпиадное программирование — с чего начать?
- 1 подписчик
- 18 апр.
- 599 просмотров
2

ответа
Программирование

Простой
Как управлять/хранить изображения для UI?
- 1 подписчик
- 10 апр.
- 314 просмотров
1

ответ
Программирование

+1 ещё

Простой
Стоит ли поступать в вуз на программу по математике, если в будущем хочешь иметь профессию, связанную с программированием?
- 4 подписчика
- 07 мар.
- 3556 просмотров
7

ответов
Программирование

Простой
Как можно оптимизировать загрузку данных?
- 1 подписчик
- 14 февр.
- 405 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2020-12-30 15:01:50

Pdf достаточно сложная штука. Там несколько слоёв. В частности есть текстовый и графический. Текст может быть и там и там. В особо сложных случаях одновременно. Текстовый слой, конечно, хранит информацию о шрифтах. Не радномно же он выбирается. Текст с картинки распознать можно только с помощью ocr. Все известные мне решения с приемлемым качеством распознавания проприетарные.

Answer 2 · 2019-12-26 12:38:21

SVM @sotvm

Умный поймёт, а дураку и так всё равно.

шрифт текста ,к этому ,не имеет никакого отношения

Ответ написан более трёх лет назад

6 комментариев

Answer 3 · 2019-12-26 15:30:25

На питоне можно выбрать текст используя библиотеки для работы с pdf, сохранить его в txt и закинуть в переводчик.

Возможно ли программно определить шрифт текста в pdf?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт