Алгоритм работы построен неверно, ибо исходит из ошибочной предпосылки возможности 100% корректной конвертации PDF в HTML.
Лучше бы вам вернуться к ТЗ и изложить его.
Есть, например, возможность использовать PDF как подложку для нового PDF.
Кроме того, формат PDF предусматривает поля для заполнения (формы в PDF обычно делаются именно с их использованием).
А ваша идея - это колхоз на костылях, нормального результата она не даст, только время потратите.