Задать вопрос
@Don_Sudak

Как получить из pdf файла информацию о character spacing и word spacing?

Использовал Pymupdf столкнулся с проблемой получения информации о тексте в пдф файле
Спросил в дискорд канале библиотеки о возможности получения информации об интервалах, но мне ответили что библиотека не умеет работать с ними
Возможно есть другие бибилиотеки, которые могут это?
P.S. Пытался посмотреть в других библиотеках но не нашёл. Возможно что-то пропустил....
  • Вопрос задан
  • 108 просмотров
Подписаться 1 Средний 1 комментарий
Ответ пользователя mayton2019 К ответам на вопрос (2)
mayton2019
@mayton2019
Bigdata Engineer
Судя по описанию Pymupdf (Python) использует MuPdf (C) https://mupdf.com/ следовательно все ответы на вопросы надо искать там.

Сам вопрос звучит странно
character spacing и word spacing

автор хочет узнать из PDF документа есть ли информация о межбуквенном расстоянии прочее.

Это расстояние может быть не свойством документа а неким дефолтным свойством шрифта например.
Ответ написан