Pgpool2 multy-master mode где искать мануалы по настройке? Как вы масштабируете базу(под запись)?

Question

gremlintv2 @gremlintv2

Pgpool2 multy-master mode где искать мануалы по настройке? Как вы масштабируете базу(под запись)?

Не могу найти толковый мануал по настройке multy-master mode в том числе на оф. сайте, подскажите что спрашивать гугл... С вашего личного опыта: какие есть угрозы при такой балансировке базы? Сильно ли нагружает сервер процес синхронной репликация? Есть ли возможность регулировать таймаут(задержку) репликации? Правда ли что репликация на уровне утилит типа pgpool, repmgr, skytools еще сыровата и чаще всего используеться репликация на уровне приложения, а не утилит?
Сейчас читаю эту статейку https://habrahabr.ru/post/263225/ возможно она решит поставленую задачу

Вопрос задан более трёх лет назад
988 просмотров

4 комментария

Подписаться 2 Сложный 4 комментария

sim3x @sim3x

Шардированием

Сразу замечу, что стоит избегать таких юзкейсов любой ценой

Так что опишите свой кейc поподробнее

Написано более трёх лет назад
gremlintv2 @gremlintv2 Автор вопроса

sim3x, горизонтальным или вертикальным? Если горизонтальным, что используете в качестве балансера?

Написано более трёх лет назад
sim3x @sim3x

gremlintv2, я

стоит избегать таких юзкейсов любой ценой

так что
опишите свой кейc поподробнее

Написано более трёх лет назад
gremlintv2 @gremlintv2 Автор вопроса

Что такое юзкейсы?

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Hi-TECH Academy

Администрирование PostgreSQL 16. Базовый курс

3 дня

Далее
OTUS

PostgreSQL. Advanced

4 месяца

Далее
Учебный центр IBS

QPT PostgreSQL 16. Оптимизация запросов

1 неделя

Далее

Решения вопроса 1

4 комментария

gremlintv2 @gremlintv2 Автор вопроса

Поделитесь пожалуйста советом как вы "распиливаете" базу штатной потоковой репликацией. Т.е. приложение обращаеться к основной мастер базе, а уже она определяет куда писать на уровне самой базы? Не до конца понимаю как вы конфигурируете кластеры.
Т.е. приложение само изначально понимает в какую базу, на каком сервере, какие данные писать или за него это делает postgres?

Написано более трёх лет назад
Melkij @Melkij

Поделитесь пожалуйста советом как вы "распиливаете" базу штатной потоковой репликацией

Никак. Кластера полностью независимые между собой.

Приложение само решает, в какой кластер ему идти и так же само решает на какой тип машины идти: мастер, online реплика или slow реплика для возможно длительных запросов
Мастер никаким роутингом не занимается.

Написано более трёх лет назад
anton13ms @anton13ms

Melkij,
А можно, дать пояснения, для совсем не следующих в тонкостях работы с БД?
Вы хотите сказать, что пишите данные на разные сервера? А потом сервера между собой реплицируются или как?
Я правильно понимаю ваше предложение?

Дело в том, что я ни как понять не могу, вот есть pgpool используется для балансировки и высоко доступности, так же у него есть возможность и БД реплицировать, но на сколько я понимаю, это он делает не очень надежно...
Ну допустим реплицировать можно с помощью Streaming Replication...
На сколько это все правильно? Или есть проще и надежнее вариант?

А если проще задать вопрос, в каких случаях стоит заморачиваться с репликацией данных и pgpool?

Написано более трёх лет назад
Melkij @Melkij

А если проще задать вопрос, в каких случаях стоит заморачиваться с репликацией данных и pgpool?

pgpool - только если хотите чтобы было больно в эксплуатации. В общем не надо pgpool.
репликация через streaming replication - думаю мне хватит одной руки пересчитать базы (из нескольких сотен) где у production базы *нет* реплики. Хотя бы один hot standby нужен для любой важной базы.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- 16 часов назад
- 60 просмотров
1

ответ
PostgreSQL

Простой
Почему не рабоатет npx prisma generate?
- 1 подписчик
- 02 дек.
- 217 просмотров
2

ответа
Windows

+1 ещё

Средний
Работа PostgreSQL на процессорах с гетерогенной архитектурой под Windows?
- 2 подписчика
- 29 нояб.
- 432 просмотра
4

ответа
Windows

+1 ещё

Средний
Почему не создается логическая репликация на Windows 10 и падает воркер?
- 5 подписчиков
- 17 нояб.
- 360 просмотров
1

ответ
PostgreSQL

Простой
Как сделать поиск определенного значение в строке отобранной SELECT * FROM?
- 1 подписчик
- 13 нояб.
- 250 просмотров
2

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 230 просмотров
1

ответ
CentOS

+1 ещё

Простой
BitrixVM 9 отправляет почту всегда через smtp account configuration for default?
- 1 подписчик
- 11 нояб.
- 73 просмотра
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 86 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 264 просмотра
2

ответа
PostgreSQL

Средний
Как получить данные и обновить записи в таблицах-источниках?
- 1 подписчик
- 05 нояб.
- 115 просмотров
1

ответ
Показать ещё Загружается…

DWH Analyst

Анвио Парк

от 200 000 до 300 000 ₽

Golang Developer

SMALL

от 280 000 до 350 000 ₽

Golang Developer

SMALL

До 370 000 ₽

Шардированием

Сразу замечу, что стоит избегать таких юзкейсов любой ценой

Так что опишите свой кейc поподробнее
sim3x, горизонтальным или вертикальным? Если горизонтальным, что используете в качестве балансера?
gremlintv2, я

стоит избегать таких юзкейсов любой ценой

так что
опишите свой кейc поподробнее

Answer 1 · 2017-11-16 21:13:15

Как вы масштабируете базу(под запись)?

В основном никак. У нас нет баз на столько десятков террабайт данных чтобы внятно настроенный единственный мастер с парой обычных потоковых ro-реплик не справлялся.

Если у вас столько данных пишется что одного мастера действительно мало - то репликация вам не подходит по своему определению, она не про масштабирование записи, а только чтения и high availability (репликация = копия. Копию нельзя сделать, если писать не все данные).

А те базы что у нас распиливались - распиливались они не потому что в мастер упёрлись:
Что-то пилится на горячее-архивное: отдельные одна или несколько машин на более дешёвых (медленных) дисках, куда переносятся данные старше какого-то времени, к которым обращаются редко.
Что-то пилится на части функционально. Например, сайт - один кластер, данные для окружающих некритичных сервисов - другой кластер. Или данные ru-сайта - один кластер, данные нескольких других стран - отдельные базы на другом кластере.

Ещё можно пилить по каким-нибудь другим динамическим критериям. Например, данные всех пользователей от 1 до 1000 - на один кластер, от 1000 до 2000 - на другой. Плюс пара машин с данными координатора какой id на какой машине и авторизации. Это уже эталонное горизонтальное масштабирование. Крайне редко кому действительно нужно и собирается типично вручную с пониманием что и зачем делается.

Сильно ли нагружает сервер процес синхронной репликация?

Железо - не очень. Со стороны приложения кажется что очень. Потому что латентность коммита локально и согласовать коммит с даже хотя бы одной синхронной репликой - вещи очень сильно расходящиеся по латентности.

чаще всего используеться репликация на уровне приложения

Репликация чаще всего используется штатная потоковая.
Запросы от приложения удобнее направлять именно из приложения не из-за сырости прокси, а потому что именно приложению лучше знать, нужно ли запрос отправлять на реплику (и если реплику - то какую, боевую? отдельную для медленных запросов аналитики?) или его вообще можно выполнять только на мастере.

какие есть угрозы при такой балансировке базы?

В смысле при мультимастере? Кучу головной боли вам доставит CAP теорема, из-за которой внятного мультимастера нет.
Самое весёлое - split brain, когда у вас образовались противоречащие друг другу данные на двух мастерах.
Или триггерная репликация внезапно встала колом и надо разбираться, из-за чего.
Отправлять пишущие запросы синхронно на несколько хостов и предполагать, что там будут сходиться данные в итоге - это надо быть или большим оптимистом или очень внимательно проверять каждый запрос на предмет что именно он будет делать и как себя поведёт при конкурентном доступе.

Pgpool2 multy-master mode где искать мануалы по настройке? Как вы масштабируете базу(под запись)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт