Задать вопрос
Elena0394
@Elena0394

Есть ли возможность получить читаемый текст?

ссылка на файл не могу получить из него текст, при копировании получаются иероглифы. Есть ли возможность парсить файл и получать читаемый текст?
  • Вопрос задан
  • 121 просмотр
Подписаться 1 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 5
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
Распознаванием текста с изображения. FineReader или какой-нибудь онлайн сервис.
Ответ написан
Комментировать
Adamos
@Adamos
Это не "иероглифы", это тот самый текст, только в ужатой кодировке - символы идут под другими номерами.
При большом желании можно попробовать подобрать соответствие каждой букве и "расшифровать" текст.
Но не исключено, что на другой аналогичной PDF номера символов будут иными.
Так что чисто графическое распознавание и проще, и надежнее.
Ответ написан
yakovlev_13
@yakovlev_13
Шаманство, экзорцизм и некромантия.
pdf24 toolbox - вот эта прога сносно перекодировала. Что-то придётся поправить конечно, но результат есть

spoiler
655c6d52f0208059533717.jpeg
Ответ написан
Комментировать
@rPman
tesseract может это распознать (шрифт ему знаком) но у него проблемы с таблицами, он все сливает в один сплошной текст (да корявый)
Штатный linux OCRFeeder + tesseract

Интегрированная  сыстема  манеджмыента сертифицирована на соответствия требованиям ГОСТ Р МСО 9001-2015, ГОСТ Р ИСО 15183-20415, ГОСТ Р ИСО 14001-20165, ГОСТ Р ИССУМаК 27СКИ -2006, ОНЗАЗ 18001:2007, ВА ЗА ВОСКОМ
№ направления‘дата:Фамилия: ЛПУИмя: Доктор.Дата рождения: 
Адрес пациентаПол: 
  
  
  
Наименование исследования Результат Ед. изм. — Нормальные значения 
  
ИММУНОЛОГИЧЕСКИЕ ИССЛЕДОВАНИЯ 
  
Лимфоциты, % 39.1 % 18.2-47.4 Лимфоциты (иммунограмма) 2.00 10*9/л 1.16-3.18 Т-лимфоциты СОЗ, % 76.40 % 55.00-80.00 Т-лимфоциты СОЗ 1.53 10*9/л 0.80-2.20 Лейкоцитарно-Т-ЛФ индекс 3.3 - 4.0-7.0 Т-хелперы СОЗ/СО4, % 43.60 % 31.00-51.00 Т-хелперы СОЗ/СО4 0.87 10*9/л 0.60-1.60 Т-цитотоксические СОЗ/СО8, % 30.20 % 19.00-37.00 Т-цитотоксические СОЗ/СО8 0.60 10*9/л 0.30-0.80 Иммунорегуляторный индекс 1.444 1.200-2.500 СО4/СО8 
В-лимфоциты СО19, % 10.70 % 5.00-20.00 В-лимфоциты СО19 0.21 10*9/л 0.10-0.50 МК-клетки СО16/СО56, % 12.90 % 6.00-20.00 МК-клетки СО16/СО56 0.26 10*9/л 0.07-0.73 Т-киллерь(Т-МК) СО3/СО16/С056 0.242 + 10*9/л 0.005-0.200 Т-киллеры(Т-МЮ) СО3/СО16/СО56, % 12.10 + % 0.00-10.00 НГА-ОБ+ активированные Т- 10.20 % 0.00-12.00 лимфоциты СОЗ/НГА-ОК, % 
НГА-ОБ+ активированные Т- 0.20 10*9/л 0.00-0.20 лимфоциты СОЗ/НГА-ОБ. 
Фамилия И.О.врача, проводившего Никитина Л.В. 
исследование

если можешь в своем коде разобрать кадр на строки то можно на питоне быстренько написать приложение которое будет эти кусочки отправлять на распознавание, но или вот первая попавшаяся статья с примерами
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы