Как в C# Windows Form прочитать названия сепараций в PDF файле?

Question

domanskiy @domanskiy

C#

Как в C# Windows Form прочитать названия сепараций в PDF файле?

Есть проект на C# Windows Form
Простая форма с кнопкой текстовым полем и компонентом COM Акробат Ридера для отображения PDF файла на форме.

private void button2_Click(object sender, EventArgs e)
            {
            string pFile = textBox1.Text;
                string filePath = @"\\TS\Obmen\Штампы\D\" + pFile + ".pdf";
                this.axAcroPDF1.LoadFile(filePath);
                this.axAcroPDF1.src = filePath;
                this.axAcroPDF1.setShowToolbar(true); // показать/отключить панель инструментов
                this.axAcroPDF1.setView("FitH");
                this.axAcroPDF1.setLayoutMode("SinglePage");
                this.axAcroPDF1.Show();
            }

Нужно прочитать названия сепараций из XMP данных PDF файла, записать в переменную массива и вывести массив в Label1 через запятую.
Как это реализовать и с помощью какой библиотеки.

Вопрос задан более трёх лет назад
92 просмотра

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Разработчик игр на Unity

13 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unity + ИИ

6 месяцев

Далее
Stepik

PRO C#. Профессия "Backend разработчик"

4 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

+4 ещё

Сложный
Как сделать правильную перемотку видео в Flyleaf (wpf)?
- 3 подписчика
- 15 июн.
- 189 просмотров
1

ответ
C#

+1 ещё

Средний
Как передать изображение на принтер TSC?
- 1 подписчик
- 12 мая
- 134 просмотра
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 362 просмотра
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 104 просмотра
1

ответ
C#

+2 ещё

Простой
Как заставить кнопки в ScrollView корректно перераспределять остальные элементы при анимации?
- 1 подписчик
- 10 апр.
- 102 просмотра
1

ответ
C#

Простой
Как прочесть без блокировок в многопоточном приложение 16 байт структурное значение?
- 1 подписчик
- 30 мар.
- 189 просмотров
1

ответ
C#

+1 ещё

Средний
Как убрать проблему, из-за которой карта не возвращается в руку?
- 1 подписчик
- 18 мар.
- 303 просмотра
1

ответ
C#

Средний
Как скачать видео из MAX с параметрами C# GET?
- 2 подписчика
- 14 мар.
- 402 просмотра
0

ответов
C#

+1 ещё

Простой
Как переопределить стиль WPF-компонентов из подключенной библиотеки?
- 1 подписчик
- 02 мар.
- 122 просмотра
1

ответ
C#

Средний
Как в JsonSerializer.Deserialize игнорировать ошибки десериализации битого json?
- 3 подписчика
- 29 янв.
- 278 просмотров
1

ответ
Показать ещё Загружается…

Сепараций? Что это такое? Гугл не в курсе.

Answer 1 · 2019-03-05 15:13:06

В общем случае никак! pdf это считай картинка с опционально текстовой информацией.

В вашем случае можно попробовать конвертировать pdf файл в картинки, вырезать из определенной области кусок (imagemagic) и отправить его на распознавание с помощью того же tesseract.

Answer 2 · 2019-03-05 15:46:19

Я смог вытащить весь XMP код. Это по сути XML

PdfReader pdf = new PdfReader(filePath);
            string metadataXml = System.Text.Encoding.Default.GetString(pdf.Metadata);
            label1.Text = metadataXml;

Вот теперь гадаю, как вывести допустим по xpath из этого XML вытащить значение
//xmpmeta/RDF/Description/inks/Seq/li[1]/egname

Как в C# Windows Form прочитать названия сепараций в PDF файле?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт