Недавно запушил публичный репозиторий, в котором содержались данные для авторизации в Google Cloud Platform (репозиторий тестовый, да и за свой free доступ я не очень боюсь). Как только репозиторий улетел на GitHub, мне сразу прилетело сообщение на почту, что данные скомпрометированы. Как они это поняли? Это какое-то сотрудничество с GitHub? По типу: если в чьём-то репозитории вы найдёте то и то, то делайте репорт в гугл...
Уверен, что гугл сканирует гитхаб. Запросто, что в качестве фишки - сделали такой сервис, чтобы потом их не поливали грязью в стиле "хакеры взломали гугл, слили кучу данных".
Григорий Боев, мне всё же, кажется, что гитхаб сканит репу и репортит каким-то партнёрским облачным платформам, но пока что ни подтвердить ни опровергнуть не могу.
Dmitriy Grape, корпорации пылесосят данные до которых могут дотянуться, даже которые пока бесполезные, например https трафик (есть видос недавный от Derek Muller по этому поводу). Есть ещё видосы Масаловича (aka кибердед), удивляет иногда какие данные собираются и обрабатываются.
Есть сервисы, которые постоянно сканируют все новые репы на оплошности с логин/паролями, ключами, всякими подобными штуками. Кто быстрее поймает вашу оплошность, тот вам и отрепортит, и в некоторых можно зарегистрироваться и автоматом косяки устранять прям кноповкой из сервиса.
Естественно, когда вы входите во вкус, они начинают хотеть немножечко денежек.