jalpy
@jalpy
sdfdfg

Как проверить хеш суммы файлов в линукс?

Добрый день, имеется в каталоге около 500 тхт файлов, некоторые содержимым похожи, надо проверить хеш суммы чтобы выявить похоже и файлы, как это реализовать?
  • Вопрос задан
  • 1757 просмотров
Пригласить эксперта
Ответы на вопрос 5
Djaler
@Djaler
Сеньор-помидор
Хеш-сумма будет одинаковой только у абсолютно одинаковых файлов. Похожие ею не отследить
Ответ написан
Комментировать
Сравнить текстовые файлы по содержимому можно с помощью утилиты diff.
https://www.opennet.ru/man.shtml?topic=diff&catego...
Ответ написан
Комментировать
@vilgeforce
Раздолбай и программист
Можете использовать нечеткие хэши, например ssdeep
Ответ написан
Комментировать
fox_12
@fox_12
Расставляю биты, управляю заряженными частицами
Опеределитесь со значением "похожие".
Похожие по смыслу и похожие за вычетом, скажем, - количества пробелов - это разные вещи....
Хеш-суммами вы можете только точные совпадения определить.
Ответ написан
Комментировать
vaut
@vaut
Хеш суммы можно считать с помощью md5sum (быстрый но возможны коллизии) и sha256sum (считается надежным). Есть и другие реализованные алгоритмы но их обычно не используют.
Одинаковая хеш сумма только при полном совпадении файлов: один измененный бит и хеш сумма совершенно другая. У md5 возможны коллизии (два файла соответствуют одному хешу), но шанс на это нарваться исчезающе мал.
На баше это можно сделать примерно так:
find -name  "*txt" -exec sha256sum {} \; | sort | uniq -D -w 65
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы