поиск полных дубликатов.
если не лень разбираться, то тут есть нужное:
https://github.com/akeneo/pim-community-dev/tree/m...
https://github.com/akeneo/pim-community-dev/tree/m...
с каждый файлом, добавляется его хеш $sha1 = sha1_file($rawFile->getPathname());
в репозитории можно искать по хешам:
$newFile = new \SplFileInfo('path\to\file.jpg');
$hash = sha1_file($newFile->getPathname());
$repositoryFileInfo = $this->getContainer()->get('akeneo_file_storage.repository.file_info');
$savedFile = $repositoryFileInfo->findOneBy(['hash' => $hash]);