Библиотеки специфичной навряд ли найдете, но алгоритм предельно прост:
# Критерии
def isdigits(str):
for i in str:
if not i.isdigit()
return False
return True
def istext(str):
# какая-то логика
token = ("type_of_token", "value_of_token", len("value_of_token"))
def process_link(link):
tokenlist = []
for i in link.split('/'):
if isdigit(i):
tokenlist.append(("digit", i, len(i))
if istext():
tokenlist.append(("text", i, len(i))
return tokenlist
Остается только получить список токенов для каждой ссылки и посчитать похожие варианты)