galeev_roman
@galeev_roman

Какие технологии использовать для написания онлайн-ридера электронных версий журналов?

Есть задача написать онлайн-ридер электронных версий журналов, продаваемых организацией. Сейчас похожие используются у сайтов pressa.ru/ и ru.zinio.com/, они сделаны на adobe flash и представляют собой .swf. Каждая страница журнала также подгружается в виде .swf. Подскажите, есть ли смысл использовать эту же технологию или есть более предпочтительные варианты.
  • Вопрос задан
  • 3521 просмотр
Пригласить эксперта
Ответы на вопрос 4
KrasivayaSvo
@KrasivayaSvo
Лет 5 назад был озабочен такой проблемой. Из того, что осталось в голове, так это общие алгоритмы работы.
Забота там заключается в следующем
на входе вы имеете pdf-ку, которую нужно трансформировать во что-то что можно показать в браузере без плагинов.
Варианта там 2:
1) показывать каждую страницу как изображение
2) распознавать текст в pdf-ке.
Распознавать текст можно, но очень сложно (на хабре были статьи как вытащить текст из pdf), но при этом при OCR очень велика вероятность ошибок, что негативно скажется как на поставщике pdf-ки (СМИ) так и на читателе.
Остаются только изображения.
Тут имеются следующие проблемы:
1) файл с изображением должен быть не очень большим, но при этом текст должен нормально читаться, то есть нужно «подобрать» качество сжатия.
2) необходимо 2-3 версии изображения: 1 — маленькое превью для списка страниц, 2 — превью страницы на развороте, 3 — полноценная картинка страницы с читаемым текстом (показывается при клике на превью страницы на развороте)
Соответственно получаем на выходе, что pdf-ку нужно преобразовать в jpg-ги, чтобы потом их можно было куда-то подгрузить.
Ну а дальше остается во флешку только их подгружать.
Совсем забыл. В pdf-ке у вас еще будет куча страниц, то есть нужно будет ее «разделить» на страницы.
Таким образом у вас будет две задачи:
1) преобразовать pdf постранично
2) показать пользователю результат

В моем случае я брал pdf с помощью ghostscript раскладывал ее на страницы и большие jpg, а потом с помощью convert из ImageMagik трансформировал в картинки размером 60х40, 150х100 и 300х200.

В настоящее время можно попробовать реализовать показ на HTML5, но, честно, я такого опыта не имею.

Если будут какие-то вопросы, то обращайтесь, по мере возможностей — подскажу.
Ответ написан
dutchakdev
@dutchakdev
html + (php|python|nodjs) + обычный себе mysql
Этого вполне хватит!
Ответ написан
d4rkr00t
@d4rkr00t
Есть вот такая штука www.turnjs.com/ как раз html5. Каждая страница отдельная картинка
Ответ написан
Apitron
@Apitron
Для борьбы от скриншотеров можно добавлять вотермарку на изображение, мало кто захочет себе в «коллекцию» помеченные картинки, а сидеть руками убрать с каждой страницы — трудозатратно.
Вместо флэша можно использовать ещё одну, почти умершую, технологию MS Silverlight.

Я делал буклет для спортивного магазина с растеризацией PDF документа, на базе примера WPF Viewer-а из Apitron.PDF.Rasterizer.
У библиотеки есть возможность масштабировать оригинальное изображение, генерировать маленькие изображения обложек, сохранять в стандартных графических форматах PNG, JPEG, BMP. Я сам делал простую линейную навигацию, но в последней версии добавлен API для навигация и по закладкам.

Есть пример приложения для Windows Phone
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы