Есть ли программа, которая сравнит два диска на наличие дубликатов файлов (побайтно!) и покажет файлы, НЕ имеющие двойников?
Есть задача наведения порядка на большом, старом, забитом диске - для этого на некоем другом диске формируется правильная (отличная от изначальной) структура каталогов, туда все файлы копируются, при необходимости их наименования приводятся в соответствие неким шаблоном.
Задача: найти те файлы, которые не были скопированы (напоминаю, имена и пути к файлам могут отличаться).
Программу, показывающую именно дубли нашел (Duplicate File Link and Search), как при помощи е результатов решить инверсную задачу - не придумал
Такие задачи решают скриптами за 5 минут. И да, в вашем ТЗ есть неточности, нужно ли проверять файлы с разными именами и путями? нужно ли учитывать дубликаты в пределах одного диска (условный пример c:\path1\file.txt и c:\path1\subpath1\file.txt на одном диске но на другом диске нет этого файла, нужно ли проверять на дубликат, я могу догадаться что нет, и это даже вредно но мало ли)
формируется правильная (отличная от изначальной) структура каталогов
Еще беда в том что обычно нужны не файлы а их группы, условно инсталятор с кучей файлов, он должен рассматриваться как единое целое, а в другом каталоге просто набор картинок, каждый по отдельности? определить это автоматически не просто.
p.s. я бы собрал хеши файлов на каждом диске, записывая их в два соответствующих файлика src.list и dst.list построчно - md5хэш пробел путь с именем файла (можно использовать любой другой хеш, на ваше усмотрение и вопрос паранои по поводу коллизий) а затем написал бы простой скрипт для сравнения этих файлов на предмет - какие хеши из второго файла отсутствуют в первом (в зависимости от выбранного языка это строк 5-10). Такой скрипт сейчас даже бесплатные ИИ пишут на ура