Приветствую.
Вынес в отдельную функцию хеширование URL адреса для поиска совпадений в базе данных. Хочу обрабатывать ситуацию, когда на вход этой функции подается не оригинал URL, а уже хешированная строка, чтобы функция ее еще раз не захешировала случайно.
Проверять по наличию протокола (https или http) или зоны (.com, .ru) в строке мне не кажется хорошей идеей, потому что невозможно описать все возможные варианты URL (например, относительные пути вообще не прокатят).
Если попробовать распарсить хэш от URL с помощью urllib.parse.urlparse, то результат такой:
ParseResult(scheme='', netloc='', path='d8058d63868cb6d89211e6ec5a12ccf8', params='', query='', fragment='')
Поделитесь, как бы вы решали такую задачу?