Хеш суммы можно считать с помощью md5sum (быстрый но возможны коллизии) и sha256sum (считается надежным). Есть и другие реализованные алгоритмы но их обычно не используют.
Одинаковая хеш сумма только при полном совпадении файлов: один измененный бит и хеш сумма совершенно другая. У md5 возможны коллизии (два файла соответствуют одному хешу), но шанс на это нарваться исчезающе мал.
На баше это можно сделать примерно так:
find -name "*txt" -exec sha256sum {} \; | sort | uniq -D -w 65