Лет 5 назад был озабочен такой проблемой. Из того, что осталось в голове, так это общие алгоритмы работы.
Забота там заключается в следующем
на входе вы имеете pdf-ку, которую нужно трансформировать во что-то что можно показать в браузере без плагинов.
Варианта там 2:
1) показывать каждую страницу как изображение
2) распознавать текст в pdf-ке.
Распознавать текст можно, но очень сложно (на хабре были статьи как вытащить текст из pdf), но при этом при OCR очень велика вероятность ошибок, что негативно скажется как на поставщике pdf-ки (СМИ) так и на читателе.
Остаются только изображения.
Тут имеются следующие проблемы:
1) файл с изображением должен быть не очень большим, но при этом текст должен нормально читаться, то есть нужно «подобрать» качество сжатия.
2) необходимо 2-3 версии изображения: 1 — маленькое превью для списка страниц, 2 — превью страницы на развороте, 3 — полноценная картинка страницы с читаемым текстом (показывается при клике на превью страницы на развороте)
Соответственно получаем на выходе, что pdf-ку нужно преобразовать в jpg-ги, чтобы потом их можно было куда-то подгрузить.
Ну а дальше остается во флешку только их подгружать.
Совсем забыл. В pdf-ке у вас еще будет куча страниц, то есть нужно будет ее «разделить» на страницы.
Таким образом у вас будет две задачи:
1) преобразовать pdf постранично
2) показать пользователю результат
В моем случае я брал pdf с помощью ghostscript раскладывал ее на страницы и большие jpg, а потом с помощью convert из ImageMagik трансформировал в картинки размером 60х40, 150х100 и 300х200.
В настоящее время можно попробовать реализовать показ на HTML5, но, честно, я такого опыта не имею.
Если будут какие-то вопросы, то обращайтесь, по мере возможностей — подскажу.