Базы данных у googl'a?

Question

RSalo @RSalo

Базы данных у googl'a?

Всем привет. Меня очень интересует вопрос, сколько весят и как быстро делает свои бэкапы гугл во время очередного апдейта сервиса(ов)? Ведь у них downtime'a вообще практически наверное нет при обновлениях. Даже если у них делается снэпшот базы, накатываются на нее всякие инсерты/апдейты/тригерры, то судя по всему, это занимает довольно длительное время и если будет какой-то фейл и нужно сделать откат, то все данные после снэпшота считаются потерянными, что недопустимо для гугла. Может у них там работают какие-то маги и чародеи?=)
Хотелось бы тоже так делать, но что-то не могу додумать как сделать.
Были еще мысли вот таким образом делать:

master(m1)<->master(m2)->slave(s2)->slave(s3)

m1 - используем как резерв основной m2. В s2 накатываем все изменения для обновления и вешаем нужные триггеры на обновление новых полей, если вдруг изменится наша структура базы. s3 - резервная копия s2, которая потом промоутится и чистится от всякого мусора(лишних полей, типов и т.п., если изменилась структура бд) и используется как основная база при обновлении. Но тут все равно стоит вопрос, что теряются данные из-за лага записи в слейвы и асинхронности записи + появляются 4 лишние базы.
Уже всю голову сломал, мучаясь с этим вопросом, может кто дать совет на свежую голову, чтобы было всё без потерь данных и с минимальным downtime'ом?=)

P.S. кажись придумал выход. Нужно делать блокировку таблицы на запись в бд и на бэке/фронте продумать решение, которые бы не давала пользователю делать действия на запись/обновление чего-угодно, до того момента, пока все слейвы не догонят мастера и не будет завершен промоут слейва и переключение на него, в качестве основной базы. Но это так себе решение. При большой базе и достаточно большом количестве записей в секунду, неизвестно, сколько времени будут слейвы догонять мастера...

Вопрос задан более трёх лет назад
658 просмотров

Комментировать

Подписаться 3 Средний Комментировать

Решения вопроса 2

25 комментариев

RSalo @RSalo Автор вопроса

Какие, если не секрет? Хотя бы намек какой-нибудь=)

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, queue (message brokers, event-driven-design), stand-by replicas, replica promotion и тому подобные техники

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, ах да, я совсем забыл о том что гугл в свое время переделал сильно движок то ли MySQL то ли MariaDB до неузнаваемости, а потом запустил еще несколько. Сейчас Базы данных могут не требовать обновления схемы, между прочим

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, сейчас смотрю, что есть ClusterControl, который вроде бы умеет с репликами работать. Или есть в AWS какие-то решение "из коробки"? Может кроме ClusterControl есть еще что-нибудь толковое?

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, мы вроде тут про Google говорим? в AWS много интересных вещей в этом плане

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, ага, я бы хотел бы какое-нибудь решение(желательно на базе AWS'a), чтобы как у гугла не было бы downtime'a и потери данных при апдейтах базы=)

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, и про сам гугл тоже очень интересно по ходу узнать

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, ну, у тебя есть 2 варианта - изучить AWS плотно самостоятельно или отдать денег за консультацию/проектирование)

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, сам по себе вопрос не имеет отношения именно к google - все такие задачи решаются в разных организациях любого размера примерно одними и теми же способами. Софт может отличаться, а идея нет

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, да, случайно получилось, что один вопрос перерос в два. AWS я немного уже попробовал. Знаю, что в инстансах у баз идет синхронная запись, если включено несколько зон доступности. Есть кривая идея как-то через CLI сделать одну зону недоступной и использовать эту базу в качестве синхронной реплики, но это не точно=)

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, вы про RDS) и вы не можете это сделать от слова совсем) к stand-by replicas в multi-az deployment не имеет доступ вообще никто. И нет ни единого шанса сделать зону недоступной)

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, я кажется нашел решение. Не знаю еще как в постгресе, но в мускуле можно включить sync_binlog и тогда не должно быть отставаний на слейве. Нужно будет поэкспериментировать=)

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, отставания происходят исключительно из-за сети и дисков, не более. Репликация, если память не изменяет, и так на основе binlog происходит) если нужна база без отставания в репликах - rds Aurora. Она вообще иначе работает, но все тот же SQL oltp

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, не, отставания не так работают, хотя бы потому, что это влияло бы на транзакции. Аврора - это судя по всему тот же бинсталк, но не для всего приложения, а только для бд. Если лень настраивать всякие балансировщики и инстансы, то прямой путь туда=)
Я тут еще нагуглил, что в мускуле sync_binlog версии <= 5.7.6 значение по-умолчанию 0, а уже после >= 5.7.7 и в версии 8+ значение по-умолчанию уже 1 т.е. синхронизация уже включена. Получается, что я зря так переживал и ломал голову, если в новых версиях дефолтно синхронизация включена. Вопрос отпал, нужно проверять=)

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, могу посоветовать поизучать плотнее по тому что 1. про аврору вы не в курсе от слова совсем, а я изучал ее архитектуру с момента первой альфы 2. в rds все базы из коробки имеют тюнинг и там есть фиксированный набор параметров, который называется parameter group для возможной настройки под себя. Ставлю на то что binlog там включен)

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, 1. да, сейчас попробовал аврору - крутая штука. отдельный кластеры баз для регионов можно создавать. недооценил сервис=) 2. ты тут прав. там ведь версия базы уже 5.7.12 и даже опция sync_binlog помечена как unmodifiable=)

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, я уже почти год роюсь в потрохах AWS - там много интересного и то что на поверхности это мелочи. Про аврору прочитай архитектуру - она основана на аппаратной дисковой репликации с конценсусом нескольких блоков данных

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, будет чем вечером себя занять=) сейчас нужно читануть, можно ли перевести RDS под аврору. Ибо аврора дороговато на начальных этапах стоит

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

читка заняла одну минуту. нужно просто тупо снэпшот в аврору будет кинуть - готово:D

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, Aurora это и есть RDS. Это один из 6и типов баз этого сервиса. Имеет обратную совместимость с MySQL и Postgres, но есть небольшие ограничения - можно посмотреть в доках, но в основном они MySQL не затрагивают. Сложности начинаются в Serverless Aurora. Ее я пока не поборол - есть свои прибабхи. А вообще - если уже есть MySQL RDS то, вроде, можно сделать Aurora Replica и promote to Aurora Cluster. Так будет минимальный простой

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, из плюсов авроры - она изначально High Available и Fault Tolerant. Даже если упал сервер или зона она будет до последнего промоутить мастер на одну из реплик и поднимать в фоне запасные)

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, спасиб. По поводу авроры - это уже потом будут мои следующие вопросы=) Очень выручил;)

Написано более трёх лет назад
Иван Шумов @inoise

RSalo, обращайся) но только не за архитектурой - это сейчас денег стоит

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, ага, уже видел, что можно для отказоустойчивости тиры назначать, в каком порядке промоутить в случае фейла. Нужно еще доки мне читануть на эту тему=)

Написано более трёх лет назад
RSalo @RSalo Автор вопроса

Иван Шумов, да не, архитектуру я сам могу как-нибудь построить(возможно, что местами даже и не очень, но на шишках научусь). У меня вопросы по самой сути, а что и как там - это я уже сам=)

Написано более трёх лет назад

Комментировать

Пригласить эксперта

Ответы на вопрос 2

7 комментариев

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 1 подписчик
- 14 окт.
- 181 просмотр
4

ответа
Google

+1 ещё

Простой
Как заставить работать Google meet?
- 1 подписчик
- 10 окт.
- 241 просмотр
1

ответ
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 302 просмотра
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент.
- 431 просмотр
1

ответ
Google

+1 ещё

Простой
Почему никто не может позвонить мне в Meet?
- 1 подписчик
- 04 сент.
- 738 просмотров
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 203 просмотра
1

ответ
Google

Простой
Что считается активностью аккаунта Google?
- 1 подписчик
- 26 авг.
- 295 просмотров
3

ответа
Google

+1 ещё

Простой
Можно ли сдать экзамены на сертификаты Google из России?
- 3 подписчика
- 13 авг.
- 278 просмотров
0

ответов
Google

+2 ещё

Простой
Почему Postfix не может отправить письмо в yandex?
- 2 подписчика
- 05 авг.
- 453 просмотра
2

ответа
Chrome

+2 ещё

Простой
Как почистить железо для гугл/ютуб?
- 1 подписчик
- 13 июл.
- 749 просмотров
0

ответов
Показать ещё Загружается…

Art Director (TV, Youtube, Реклама)

SDL • Москва

от 190 000 ₽

Системный аналитик (Мои Сервисы)

Сбер • Москва

от 300 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2019-05-12 23:26:58

Иван Шумов @inoise

Solution Architect, AWS Certified, Serverless

Какой вы наивный. Это вообще не так работает. На таких масштабах другие правила

Ответ написан более трёх лет назад

25 комментариев

Answer 2 · 2019-05-13 00:50:44

RSalo @RSalo Автор вопроса

Попробую включить sync_binlog, может поможет решить вопрос.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2019-05-12 23:39:00

Александр @AleksandrB

Совсем недавно вывел "Hello world"

У них там вроде RAID используется. Данные одновременно записываются на несколько дисков.

Ответ написан более трёх лет назад

7 комментариев

Answer 4 · 2019-05-13 09:11:17

Конечно, Александр прав, я хоть и очень далек от этого пока что, потому что только начинаю, но посмотрел как ютуб с этим справляется, у него в год до 7 Петабайт данных грузятся, и ни одного потерянного видео, есть даже те которые загрузились в первой 10ке. Одновременно записывается несколько копий на разные сервера, и при обновлении или даже переносе данных просто переключаются с одного на другой. то есть получается ты залил 1но видео а у них загрузилось 3и копии.

Базы данных у googl'a?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт