@Propieller

Какой open-source PDM/PLM работает с PDF/скан + слой текста?

Есть желание заиметь систему хранения/работы с документацией.
Сейчас документация - свалка из сотен Гб сканированных в PDF документов по разным каталогам. К некоторым документам в этих же каталогах есть файлы сканов изменившихся в ходе проектирования/эксплуатации страниц документа. Корневой уровень - по системам/подсистемам/задачам при проектировании. В названии каталога или файлов может присутствовать текстовое описание о том, что внутри. Обычно же название файлов и каталогов что-то вроде kakoy-to-tekst-XYYZ-esche-tekst, причем XYYZ - код данного документа, по которому его можно найти по ссылкам в каких-то других документах. Внутри - PID-диаграммы, схемы подключения, алгоритмы, текстовые описания. Иногда вместе с документом хранится скан сопроводительного письма с перечнем переданных документов. Таким образом, чтобы найти инфу о подключении или алгоритме какого-то устройства - примерно прикидываешь к какому куску проекта оно относится и начинаешь просматривать там всё подряд, пока не найдешь отсылку на необходимое.

Как решение - наверно это будет какая-то разновидность PDM (Product Data Management).
Надо:
- по всем файлам свалки - распознать и сложить слоем в pdf текстовые данные (для осуществления возможности текстового поиска)
- вести в интранет базу с соответствием Barcode <-> пачка соответствующих документов, чтобы сфоткав с телефона Barcode можно было быстро найти и посмотреть соответствующие документы с телефона (интранет wifi) или любого интранет компа
- иметь возможность посмотреть как актуальную версию документа, так и любую из истории изменений
- open source (1. потому что проблемы негров кошелька руководства не касаются, 2. потому что скорее всего придется допиливать под себя)
  • Вопрос задан
  • 473 просмотра
Пригласить эксперта
Ответы на вопрос 1
A1ejandro
@A1ejandro
youtube блогер, ИТ-специалист
У нас немного другая задача. Электронный архив, сканы "человеческих" документов. Но возможно общие с вашим проектом черты есть. Сначала мы реализовали видимо очень похожую на вашу просто свалку документов в кучу, с разделением по объектам учёта, которую тоже как у вас приходилось просматривать всю, когда что-то требовалось найти. Затем мы внедрили жёсткую кодификацию документов, которая уже позволяет чётко определять есть ли в конкретном деле документ нужного вида, и при необходимости сразу открыть его. При этом мы используем сразу два основных типа хранения документов. PDF и JPEG. В основном даже дела сканируются и редактируются в JPEG, а уже затем переводятся в PDF. При чем, как и вам, нам хотелось чтобы весь проект базировался на бесплатном софте. В общем то у нас это всё получилось. Вообще наш проект получился практически полностью бесплатным, за исключением оборудования и оплаты работ сотрудников.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы