Зачем в сервисах типа github или jsfiddle у записи генерируется не порядковое число, а хеш?

Question

accountnujen @accountnujen

Веб-разработка

Зачем в сервисах типа github или jsfiddle у записи генерируется не порядковое число, а хеш?

При создании gist.github генерируется вот такая ссылка

https://gist.github.com/akhilanandbv003/fd4f3898bb7b9c36f7b9a8c198e01548

При создании jsfiddle такая:
https://jsfiddle.net/vu9tsmd2/

В первом случае виден md5. Во втором возможно часть хеша. Либо что-то другое короткое.

Вот хотелось бы понять, с какой целью делаются такие ухищрения? Почему бы просто не выдавать id записям, как условно здесь: vk.com/id1? От чего можно защититься таким образом, если в любом случае все эти данные хранятся в общем доступе, а в случае с github, если gist будет секретным, то знание его md5 ссылки никаким образом не сможет помочь в его открытии.

Для меня это выглядит, как какая-то лишняя энергозатрата. В начале захешировать, затем искать по хешу... Она мизерная, разумеется, но зачем? Плюс коллизии...А учитывая такой короткий размер в jsfiddle - они необратимы. То есть теперь придётся перед записью ещё проверять БД, а нет ли ещё записей с таким же именем и здесь энергозатраты по более будут, чем просто с хешированием.

Вопрос задан более трёх лет назад
149 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
ProductStar

Профессия: Web-разработчик

8 месяцев

Далее
Skillfactory

Профессия Веб-разработчик

12 месяцев

Далее

Решения вопроса 2

6 комментариев

accountnujen @accountnujen Автор вопроса

Поэтому хэш коммита в ссылке - естественное и логичное решение.

хеш коммита - это риск коллизии. Даже с солью в виде времени.

Спасибо за ответ

Написано более трёх лет назад
Михаил @Akela_wolf

accountnujen, как я уже написал, шанс коллизии по хэшу в случае гита ничтожно мал.

Написано более трёх лет назад
accountnujen @accountnujen Автор вопроса

Михаил, https://habr.com/ru/post/113127/

Написано более трёх лет назад
Михаил @Akela_wolf

accountnujen, ну и? MD5, обратите внимание. А этот алгоритм хэширования уже давно считается далеко не лучшим, в том числе из-за вот такого. Гит использует хэш SHA-1 (устаревший) или SHA-256 (новый)

Написано более трёх лет назад
accountnujen @accountnujen Автор вопроса
не подумал, что там не md5. Прошу прощения.

Подскажите, а данных в случае использования php pdo может быть только такая?

$pdo->prepare("SELECT data FROM db_main WHERE hash = ?");

Или можно как-нибудь оптимизировать поиск по хешу?

Я погуглил quad tree и octree, но там ничего с php pdo не нашлось...
Написано более трёх лет назад
Михаил @Akela_wolf

accountnujen, создайте в БД индекс по полю hash - вам этого на миллион записей в таблице хватит. Когда будет больше - тогда и придет время о чем-то думать.

Написано более трёх лет назад

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

Средний
Какие есть программы/инструменты для создания веб каталога запчастей?
- 3 подписчика
- 08 дек.
- 416 просмотров
4

ответа
Веб-разработка

Простой
Ограничение в РФ, как обойти и не потерять клиентов?
- 1 подписчик
- 08 дек.
- 424 просмотра
5

ответов
JavaScript

+2 ещё

Простой
Элемент стилизации на js, как сделать чтобы не было резкой смены картинки фона?
- 1 подписчик
- 27 нояб.
- 220 просмотров
1

ответ
Веб-разработка

+1 ещё

Простой
Как включить ai ассистента в dev-tools в рф?
- 1 подписчик
- 25 нояб.
- 287 просмотров
0

ответов
Веб-разработка

+1 ещё

Простой
Подойдет ли desktop-ubuntu для разворачивания web- сервера?
- 2 подписчика
- 25 нояб.
- 638 просмотров
5

ответов
WordPress

+2 ещё

Простой
Как создать сайт с музыкой?
- 2 подписчика
- 24 нояб.
- 599 просмотров
5

ответов
Веб-разработка

Простой
Какие есть аналоги иностанных web песочниц типа JSFiddle, codepen ...?
- 1 подписчик
- 16 нояб.
- 374 просмотра
1

ответ
Веб-разработка

+1 ещё

Простой
Как реализовать хранение денег пользователей на сайте?
- 2 подписчика
- 15 нояб.
- 729 просмотров
6

ответов
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 406 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Почему не работает хостинг Weather API?
- 1 подписчик
- 11 нояб.
- 322 просмотра
0

ответов
Показать ещё Загружается…

Fullstack Next.js Cursor Developer

Nocodered

от 60 000 до 120 000 ₽

SEO-специалист (Сеть образовательных проектов)

Профессиональный Стандарт • Москва

До 100 000 ₽

PHP / WordPress разработчик ACF, Elementor (удаленный, свободный график)

Nomadic Soft

от 1 200 до 1 800 $

"vu9tsmd2" * 4 = "vu9tsmd2vu9tsmd2vu9tsmd2vu9tsmd2"
"fd4f3898bb7b9c36f7b9a8c198e01548" ~ "vu9tsmd2vu9tsmd2vu9tsmd2vu9tsmd2"

Answer 1 · 2022-02-01 05:01:50

Это зависит от того как организована система хранения. Может получиться так, что искать по хэшу она будет быстрее чем по обычному числу т.к., например, может использоваться quad tree или octree. Если использовать число, то старшие биты будут плюс-минус одинаковы, что приведет к тому что данные скопятся в одной из веток дерева, а другие будут пустыми. А если дерево еще и распределенное - это будет означать что данные неравномерно распределены по нодам. Хэш такую проблему решает сразу. Для гита вероятность коллизий хэша пренебрежимо мала, практически нулевая.

В случае гитхаба, вероятно, данные хранятся в гит-репозитории. Поэтому хэш коммита в ссылке - естественное и логичное решение. Насчет фиддла сказать не могу - но в принципе тоже, скорее всего, что-то аналогичное, только закодировано не в 16-ричную систему, а в 32-ричную (5 * 8 = 40 бит)

Плюс хэш можно генерировать независимо от хранилища (по содержимому + времени, например). А для генерации последовательных идентификаторов нужно обращаться в систему хранения, которая должна следить за их уникальностью и, таким образом, может стать "узким местом".

Answer 2 · 2022-02-01 11:31:55

Также не следует забывать, что использование простых порядковых id является в определенном смысле уязвимостью, поскольку позволяет легко парсить содержимое и снимать важные для бизнеса метрики - вроде динамики публикации контента и роста новых юзеров.

Зачем в сервисах типа github или jsfiddle у записи генерируется не порядковое число, а хеш?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт