На торренте нахожу раздачи без упоминания OCR и в самом топике ссылка на ту же книгу, но уже с пометкой OCR, причём книга довольно неновая, 80-х годов. Разве не все электронные книги, тем более старые, являются OCR? Или имеется в виду, что в первом случае книжка набрана вручную?
Tomaszz, книга без OCR - может быть вся страница это единая картинка (скан), выделить слово\текст не сможете.
OCR - это тот же скан только распознанный в текст (программно или вручную), выделить слово\текст можете
Tomaszz, есть ещё один нюанс. При упоминании об OCR иногда используется презрительная интонация - типа "ну какой ещё безошибочности вы хотите, это же OCR". Это потому, что стремясь побыстрее отсканировать и выложить только что появившийся текст, многие OCRщики пренебрегают весьма нудной и тягомотной стадией вычитки и ручного исправления ошибок распознавания, выкладывают как получилось. А OCR - технология не безошибочная, ошибок бывает много.