Довольный Жизнью , это подходит для 100% совпадения. А у дубликаты документа с 99% совпадения не будут найдены.
Кроме того, для определения 100% совпадения вместо комбинации MD5 и SHA1 проще просто взять SHA-256/BLAKE2.
Василий Банников
А меня нередко приглашают отвечать на вопросы по Паскалю :)).
Но я обычно просто игнорирую, поскольку часто это похоже на вопрос-задание.
Onigire, из-за эфемерности файловой системы контейнера приложения файлы будут храниться лишь до следующего перезапуска. Для работы с файлами предполагается подключение облачных хранилищ типа S3. Если же просто хранить/читать файлы, то можно использовать документо-ориентированные СУБД либо BLOB в реляционных СУБД.
Контейнеры в Heroku используются чисто вычислительно. В них хранится чисто приложение и файлы настроек. Для остального нужно выносить работу со сторонними хранилищами.
Или, если не особо жалко потерять файлы, то сохранять в локальное хранилище контейнера и сразу же пользоваться им для выдачи и прочих целей.
Владимир Коротенко, но не архивы Аутлуком. Сильно попахивает от такого выбора, данное решение скорее смахивает на костыль и выглядит как временное.
Вот если автору вопроса важна производительность и эффективность персонала и работы с клиентами, то он, возможно, взвесил бы внедрение некоторой системы.
А каким образом сейчас файлы приходят в сетевую папку? Их отправляет туда какой-то человек вручную или же есть автоматический процесс (программа)?
Опишите подробнее какие файлы, кому предназначены и т.д. И тогда, возможно кто-то найдет лучшее решение, чем вы имеете сейчас.
Владимир Коротенко уже написал примерно то же, что и сам планировал, в качестве простейшего решения.
Вам стоит пересмотреть свои бизнес-процессы. Уж слишком примитивно это сейчас работает: гонять какие-то архивы по Аутлуку - никуда не годится. Вам, скорее всего, нужна какая-то система обработки заказов или что-то в таком духе?
Кроме того, для определения 100% совпадения вместо комбинации MD5 и SHA1 проще просто взять SHA-256/BLAKE2.