Подобное может быть востребовано например для ролика дублирования кода (только надо искать в своей кодовой базе, а не в чужой) - такое есть например в resharper
https://www.jetbrains.com/help/resharper/dupFinder.html
Ещё может быть полезно для поиска заимствования в коде который принадлежит другим. Например, если кто-то скопипастил кусок кода из проекта лицензированного под GPL то вся программа в которую скопипастили этот кусок тоже должна лицензироваться под GPL. Я думаю, что поиск таких кусков тоже может быть востребован корпорациями чтобы уменьшить риск случайного нарушения GPL и других лицензий. И дальнейших исков.
Вот ещё нашел нечто
theory.stanford.edu/~aiken/moss
Так что, если сделаете алгоритм применение ему можно найти.