Как узнать цвет выделения у символа в документе, используя python?
В документе pdf нужно узнать цвет у выделения у каждого символа. Куда копать чтобы решить эту задачу? Pdfminer не подходит(прочитал, что он не про цвета). PyPDF, python-docx(конвертировал pdf в docx, с сохранением форматирования) - не могу там найти нужный функционал.
Как я понял, с PDF файлом такое сделать не получится(только если очень не помучаться), так как там нет "выделения". Там есть наложение разноцветных линий под текст. Поймете, о чем я говорю, когда попробуете конвертировать pdf в html.
А вот с вордовскими форматами такое получится.