Есть ли возможность прочитать таблицу из PDF и перенести в HTML, и как?

Question

AbaGardon @AbaGardon

HTML
PDF

Есть ли возможность прочитать таблицу из PDF и перенести в HTML, и как?

Есть задача перенести все таблицы которые есть в PDF файле на сайт чтобы было все на HTML таблицах.
Вопрос:
Есть ли возможность прочитать таблицу из PDF и перенести в HTML, и как ?

Вопрос задан более трёх лет назад
191 просмотр

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Академия Эдюсон

Frontend-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Инженер по тестированию + ИИ

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

HTML

+2 ещё

Простой
Как запретить формирования ссылок вида /tel:?
- 2 подписчика
- 01 июл.
- 271 просмотр
2

ответа
HTML

+1 ещё

Средний
Как выставить элементу ширину по содержимому при переносах?
- 1 подписчик
- 30 июн.
- 151 просмотр
1

ответ
HTML

+3 ещё

Средний
Как создать каркас верстки который будет считаться по высоте, а не по ширине?
- 4 подписчика
- 26 июн.
- 350 просмотров
3

ответа
JavaScript

+2 ещё

Простой
Не работает тень + слайдер, есть варианты?
- 2 подписчика
- 21 июн.
- 192 просмотра
1

ответ
HTML

+1 ещё

Простой
Как оформить так карточку типа бенто стиль?
- 1 подписчик
- 13 июн.
- 232 просмотра
3

ответа
HTML

+2 ещё

Простой
Как блок уведомлений поднять выше dialog?
- 2 подписчика
- 21 мая
- 193 просмотра
2

ответа
HTML

+1 ещё

Простой
Как свг заменить на фон?
- 1 подписчик
- 08 мая
- 297 просмотров
1

ответ
HTML

+1 ещё

Простой
Чем препроцессить в HTML сокращения?
- 2 подписчика
- 04 мая
- 350 просмотров
1

ответ
JavaScript

+1 ещё

Простой
Почему у поля input атрибут required не срабатывает?
- 2 подписчика
- 01 мая
- 390 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Как обновлять данные массива, чтобы по нажатию на кнопку на странице добавлялся еще один элемент массива?
- 3 подписчика
- 12 апр.
- 764 просмотра
4

ответа
Показать ещё Загружается…

Answer 1 · 2018-12-17 20:53:55

Wentixon @Wentixon

С помощью скрипта на сервере. Погуглите pdf to html + ваш язык

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2018-12-18 00:25:09

PDF, как правило, не хранит структуру документа, это, по большей части, векторный графический формат, а не семантический. Потому, самый эффективный способ - распознавание через OCR. Всякого рода средства, которые пытаются извлекать таблицы просто на основании положения текста работают, конечно, быстрее, а результат дают хуже. Так что решайте, шашечки или ехать.

Answer 3 · 2019-01-15 11:01:57

Нет, такого конвертера нет. Более того, некоторые PDF вообще являются сканами документов (картинками). Поэтому о каком универсальном конверторе может идти речь? Другое дело распознавание (OCR). В принципе это самое реалистичное, что вы можете использовать. Если же документ явно является оцифрованным (текст, векторная графика), то можно попробовать утянуть фрагментарно и вставить это куда-то с попыткой сохранения структуры. Но часто такие попытки оканчиваются неудачей. Хотя иногда не получается утянуть при использовании Acrobat Reader, но получаются при использовании Foxit Reader... Успехов.

Есть ли возможность прочитать таблицу из PDF и перенести в HTML, и как?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт