Что такое OCR-версия книги?

Question

Tomaszz @Tomaszz

Электронные книги

Что такое OCR-версия книги?

На торренте нахожу раздачи без упоминания OCR и в самом топике ссылка на ту же книгу, но уже с пометкой OCR, причём книга довольно неновая, 80-х годов. Разве не все электронные книги, тем более старые, являются OCR? Или имеется в виду, что в первом случае книжка набрана вручную?

Вопрос задан более трёх лет назад
374 просмотра

6 комментариев

Подписаться 1 Простой 6 комментариев

Lynn «Кофеман» @Lynn

Могут быть просто нераспознанные картинки

Написано более трёх лет назад
Tomaszz @Tomaszz Автор вопроса

Алексей Тен, в смысле?

Написано более трёх лет назад
Tomaszz @Tomaszz Автор вопроса

То есть в OCR версии могут отсутствовать некоторые графические элементы, какие-нибудь знаки не относящиеся к тексту и знакам препинания?

Написано более трёх лет назад
ⓒⓢⓢ @JRK_DV

Tomaszz, книга без OCR - может быть вся страница это единая картинка (скан), выделить слово\текст не сможете.
OCR - это тот же скан только распознанный в текст (программно или вручную), выделить слово\текст можете

Написано более трёх лет назад
Tomaszz @Tomaszz Автор вопроса

JRK_DV, спасибо. Ваш комментарий и есть ответ.

Написано более трёх лет назад
Виктор @nehrung

Tomaszz, есть ещё один нюанс. При упоминании об OCR иногда используется презрительная интонация - типа "ну какой ещё безошибочности вы хотите, это же OCR". Это потому, что стремясь побыстрее отсканировать и выложить только что появившийся текст, многие OCRщики пренебрегают весьма нудной и тягомотной стадией вычитки и ручного исправления ошибок распознавания, выкладывают как получилось. А OCR - технология не безошибочная, ошибок бывает много.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Дизайнер интерфейсов

9 месяцев

Далее
Stepik

Онлайн-курс «Фигма для редакторов»

2 недели

Далее
Нетология

Графический дизайн и коммуникации

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

5 комментариев

Tomaszz @Tomaszz Автор вопроса

Из контекста, наверное, ясно, что я понимаю что такое OCR. Вопрос в том, почему книги раздаются как OCR и не OCR?

Написано более трёх лет назад
Tomaszz @Tomaszz Автор вопроса

Что-то я сомневаюсь, что книга 80 года издания, изначально была в цифровом виде. Макет её выложили, ага.

Написано более трёх лет назад
АртемЪ @Jump

Вопрос поставлен достаточно четко и не двусмысленно- "Что такое OCR-версия книги?"

Вопрос в том, почему книги раздаются как OCR и не OCR?
Это уже другой вопрос.
Ответ на него знают только те, кто оформляет раздачи. Спрашивайте у них чем они руководствуются в этом вопросе.

Написано более трёх лет назад
АртемЪ @Jump

Tomaszz, Ну разумеется книга 80х годов изначально была не в цифровом виде. Оцифровали ее позже.
Но почему именно OCR?

Написано более трёх лет назад
Tomaszz @Tomaszz Автор вопроса

АртемЪ, есть заголовок вопроса и сам вопрос, который находится в содержании топика. А также понятие здравого смысла.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Электронные книги

Простой
Как установить цвет и фон системных сообщений в moon reader?
- 1 подписчик
- 08 июн.
- 47 просмотров
0

ответов
Электронные книги

+1 ещё

Средний
Какое пособие для линейной алгебры выбрать?
- 1 подписчик
- 02 мар.
- 151 просмотр
1

ответ
Электронные книги

+1 ещё

Средний
Какой есть нормальный рабочий opds-менеджер для андроид 14?
- 1 подписчик
- 24 янв.
- 173 просмотра
1

ответ
JavaScript

+2 ещё

Простой
Как скачать защищенный PDF полностью?
- 5 подписчиков
- более года назад
- 1493 просмотра
1

ответ
HTML

+2 ещё

Сложный
Можно ли вытащить отсюда пдф-ку?
- 1 подписчик
- более года назад
- 466 просмотров
1

ответ
Электронные книги

Простой
Читалка электронных книг для чтения одной книги со смартфона и с ПК существует?
- 1 подписчик
- более года назад
- 530 просмотров
3

ответа
Электронные книги

Средний
Как правильно добавить меню для файла docx?
- 1 подписчик
- более года назад
- 77 просмотров
0

ответов
Электронные книги

Простой
Как отладить браузерное приложение для PocketBook на компьютере?
- 1 подписчик
- более года назад
- 377 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Как скачать защищенный от скачивания PDF-файл с сайта?
- 5 подписчиков
- более года назад
- 18901 просмотр
1

ответ
Android

+2 ещё

Простой
Какие есть читалки для Android и Windows с возможностью синхронизации книг всех форматов?
- 4 подписчика
- более года назад
- 511 просмотров
1

ответ
Показать ещё Загружается…

Frontend Developer/ Vue.js

DevTeam.Space • Москва

от 1 000 до 3 000 $

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Могут быть просто нераспознанные картинки
То есть в OCR версии могут отсутствовать некоторые графические элементы, какие-нибудь знаки не относящиеся к тексту и знакам препинания?
Tomaszz, книга без OCR - может быть вся страница это единая картинка (скан), выделить слово\текст не сможете.
OCR - это тот же скан только распознанный в текст (программно или вручную), выделить слово\текст можете
JRK_DV, спасибо. Ваш комментарий и есть ответ.
Tomaszz, есть ещё один нюанс. При упоминании об OCR иногда используется презрительная интонация - типа "ну какой ещё безошибочности вы хотите, это же OCR". Это потому, что стремясь побыстрее отсканировать и выложить только что появившийся текст, многие OCRщики пренебрегают весьма нудной и тягомотной стадией вычитки и ручного исправления ошибок распознавания, выкладывают как получилось. А OCR - технология не безошибочная, ошибок бывает много.

Answer 1 · 2019-03-23 10:32:23

Разве не все электронные книги, тем более старые, являются OCR?

Не все.

Что такое OCR-версия книги?

Книга которую отсканировали и программно распознали.

Что такое OCR-версия книги?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт