Какой open-source PDM/PLM работает с PDF/скан + слой текста?

Question

Propieller @Propieller

PDF

Какой open-source PDM/PLM работает с PDF/скан + слой текста?

Есть желание заиметь систему хранения/работы с документацией.
Сейчас документация - свалка из сотен Гб сканированных в PDF документов по разным каталогам. К некоторым документам в этих же каталогах есть файлы сканов изменившихся в ходе проектирования/эксплуатации страниц документа. Корневой уровень - по системам/подсистемам/задачам при проектировании. В названии каталога или файлов может присутствовать текстовое описание о том, что внутри. Обычно же название файлов и каталогов что-то вроде kakoy-to-tekst-XYYZ-esche-tekst, причем XYYZ - код данного документа, по которому его можно найти по ссылкам в каких-то других документах. Внутри - PID-диаграммы, схемы подключения, алгоритмы, текстовые описания. Иногда вместе с документом хранится скан сопроводительного письма с перечнем переданных документов. Таким образом, чтобы найти инфу о подключении или алгоритме какого-то устройства - примерно прикидываешь к какому куску проекта оно относится и начинаешь просматривать там всё подряд, пока не найдешь отсылку на необходимое.

Как решение - наверно это будет какая-то разновидность PDM (Product Data Management).
Надо:
- по всем файлам свалки - распознать и сложить слоем в pdf текстовые данные (для осуществления возможности текстового поиска)
- вести в интранет базу с соответствием Barcode <-> пачка соответствующих документов, чтобы сфоткав с телефона Barcode можно было быстро найти и посмотреть соответствующие документы с телефона (интранет wifi) или любого интранет компа
- иметь возможность посмотреть как актуальную версию документа, так и любую из истории изменений
- open source (1. потому что проблемы негров кошелька руководства не касаются, 2. потому что скорее всего придется допиливать под себя)

Вопрос задан более трёх лет назад
569 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

1С-программист

10 месяцев

Далее
Skillbox

Профессия 1C-разработчик

8 месяцев

Далее
Hi-TECH Academy

KL 004.2.4 Kaspersky SD-WAN

2 дня

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб.
- 448 просмотров
4

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 182 просмотра
0

ответов
Windows

+1 ещё

Простой
Как вернуть встроенный предпросмотр PDF в Windows?
- 2 подписчика
- 25 окт.
- 2030 просмотров
3

ответа
PDF

+1 ещё

Простой
Как в PDF поставить штамп или сделать визуализацию ЭП при трехстороннем и более подписании?
- 2 подписчика
- 25 сент.
- 2492 просмотра
5

ответов
Windows

+4 ещё

Простой
Существует ли виртуальный PDF принтер со встроенным эффектом сканера?
- 4 подписчика
- 24 сент.
- 5650 просмотров
2

ответа
PDF

Простой
Есть ли альтернатива wkhtmltopdf?
- 1 подписчик
- 28 июл.
- 181 просмотр
2

ответа
Docker

+1 ещё

Простой
Как установить wkhtmltopdf на ларавель?
- 1 подписчик
- 28 июл.
- 163 просмотра
1

ответ
Python

+3 ещё

Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
- нет подписчиков
- 23 июн.
- 432 просмотра
2

ответа
PDF

Простой
PDF Стилер (Или вредоносный код) возможно?
- 1 подписчик
- 06 июн.
- 198 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

+2 ещё

Простой
Какое ПО может посчитать количество страниц PDF документов в папке?
- 1 подписчик
- 28 апр.
- 446 просмотров
3

ответа
Показать ещё Загружается…

Графический дизайнер

Estate Barcelona

от 100 до 200 €

Junior Backend Developer (NestJS) One Day Offer

critica agency

До 50 000 ₽

Python Developer

DevTeam.Space • Москва

от 1 500 до 3 000 $

Answer 1 · 2019-01-15 10:12:38

У нас немного другая задача. Электронный архив, сканы "человеческих" документов. Но возможно общие с вашим проектом черты есть. Сначала мы реализовали видимо очень похожую на вашу просто свалку документов в кучу, с разделением по объектам учёта, которую тоже как у вас приходилось просматривать всю, когда что-то требовалось найти. Затем мы внедрили жёсткую кодификацию документов, которая уже позволяет чётко определять есть ли в конкретном деле документ нужного вида, и при необходимости сразу открыть его. При этом мы используем сразу два основных типа хранения документов. PDF и JPEG. В основном даже дела сканируются и редактируются в JPEG, а уже затем переводятся в PDF. При чем, как и вам, нам хотелось чтобы весь проект базировался на бесплатном софте. В общем то у нас это всё получилось. Вообще наш проект получился практически полностью бесплатным, за исключением оборудования и оплаты работ сотрудников.

Какой open-source PDM/PLM работает с PDF/скан + слой текста?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт