Как бороться с растаскиванием/многократным дублированием файлов/папок на файловом сервере?
Коллеги, приветствую!
Подскажите пожалуйста, кто как бореться с растаскиванием/многократным дублированием файлов/папок на файловом сервере? Когда, допусти пакет документов по договору, через одного старается задублировать у себя в папке на сетевом ресурсе....
Понятно, что можно подключить административный ресурс, но интересуют в первую очередь технические решения.
Административный ресурс бывает разным. Если просто всех поругать - это, конечно, работать не будет.
А вот если разобраться, почему в рабочем процессе кому-то требуется дублировать файлы и разводить бардак - можно прийти к внедрению онлайн-офиса, например... а лучше, конечно - CRM. Чтобы работать с информацией, а не преодолевать.
Поддерживаю насчет CRM ЭДО (системы электронного документооборота). Но если "здесь и сейчас", без бюджета, без внедрения и чисто технически, то раскладывается на два пункта:
1. поиск дубликатов;
2. замена найденных дубликатов на hard link'и.
В свою очередь, поиск дубликатов - это:
1.1. поиск файлов одинакового размера;
1.2. среди них поиск файлов с одинаковым хешем.
Если суммарный объём файлов слишком велик для частого такого поиска, то сокращаем работу:
1.1a. поиск файлов одинакового размера и при этом с одинаковым именем;
1.2. среди них поиск файлов с одинаковым хешем; в этом случае приносим в жертву скорости (оставвляем ненайденными) переименованные дубликаты.
Зависит от бизнеса. Я своим подопечным настрогал несколько внутренних систем на замену копания в офисных файликах, при этом документооборот им никуда не впился.
Смотря какое определение давать "документу". По мне так всякое взаимодействие в бизнесе, если оно не в устной форме, значит в форме какого-то документа, бумажного или электронного. А взаимодействие в форме электронных документов - это по определению и есть электронный документооборот (как процесс), даже если никакая специальная система для этого не внедрена.
hint000, рабочие материалы в офисном формате - это не документы.
Попытки учета, накопления и анализа информации в файликах Ёкселя - это не взаимодействие.
Учетка в цеху, которая нужна только для взаимодействия менеджера и мастера, не требует оборота и хранения (собственно, заменяется генерируемой страницей сайта, когда система обработки прочей информации выстроена).
И так далее.
Ну нечего моим "оборачивать" ;)
Если дело только в трате места (файлы read only), дешевле всего купить ещё один диск, и пусть себе развлекаются.
Если дело в том, что возникают разные версии документов и за изменениями потом трудно следить, а форки — сливать, надо научить юзеров версионному контролю. Чисто техническими средствами эта задача в принципе не решается. Нужно обучение юзеров.
Раньше, в старых версиях, MS Office был дружественным к версионному контролю. У него был версионный сервер, назывался SharePoint. Обычный вордовский документ можно было заблокировать для изменений другими, внести изменения, закоммитить с комментарием, разблокировать для изменений другими. (Ни распределённости, ни одновременного редактирования не было — это было больше похоже на Visual SourceSafe, чем на git). Затем можно было посмотреть историю изменений. Причём, она была интегрирована с внутривордовским дифф-вьювером, где куски текста разных авторов обозначались разными цветами и комментариями на полях. Разумеется, после показа юзерам, как это удобно, они переставали делать локальные копии и начинали создавать общие документы на Шарике и чекаутить и чекинить их.
В наши дни, как я слышал, там всё стало плохо. Всех загоняют в облака. А использовать git для бинарных офисных документов неудобно. Так что, лучше всего отказываться от документов вообще, превращая их в наборы записей, и генерируя из них отчёты для печати. Какой софт использовать для этого — это отдельный вопрос, и очень большой. Главное — двигаться в ту сторону.
Извините, что ответ чересчур глобальный и не тот, что вы ищете, но по моему опыту волшебной палочки чисто технического решения для таких проблем не существует.
Если хочется решить проблему неэффективного использования места, то можно включить сжатие / дедупликацию на уровне файловой системы.
Если хочется решить проблему беспорядка, то думайте над внедрением какой-нибудь учетной системы для документов и учите сотрудников ею совместно пользоваться.
Зависит от того, какие именно документы там лежат.
Но вообще то, проблема и решение зависит от причины, зачем пользователи это делают. Возможно использовать общий файл им не удобно? Общий файл одновременно сложно использовать по причине программы, его открывающей?
Решение может оказаться на столько дорогим (переделать программу) что проще подключить административный ресурс, а следить за исполнением внешними скриптами... Кстати, теми же скриптами можно около дубликата создать ссылку на оригинал?
Как уже писали выше, это нужно решать внедрением документооборота.
А технически, для более расширенного управления файлами, включая в том числе их классификацию и управление классами - для Windows Server есть FSRM.