Как лучше организовать отказоустойчивый кластер PostgreSQL?

Question

Максим Гришин @vesper-bot

Любитель файрволлов

Как лучше организовать отказоустойчивый кластер PostgreSQL?

Потребовалось развернуть постгрес 9.6 под 1С. Взял их дистрибутив, развернул на ВМ под centos7, настроил репликацию на вторую такую же, теперь думаю о том, как из этого правильно сделать кластер. Хостов в системе (гипервизоров) всего два, stonith недоступен (или я его не умею готовить, но в двуххостовом кластере при разрыве сети происходит либо stonith deathmatch либо split brain, так что он мало что решает), так что пока мысли только о какой-нибудь конфигурации с удаленной третьей нодой в другой сети. В то же время из хостов собран кластер Microsoft, на котором можно поднимать ВМки, то есть можно формально сделать ВМ с постгресом кластерной и решать вопросы падения ресурсов через кластерную службу (в предположении, что падать будет не постгрес, а аппаратная часть). Третий хост в кластер не поставить - не хватает FC-подключений к хранилищу, поставить отдельно можно, но дорого (с) начальник. Стоит ли в таком раскладе вообще маяться с отказоустойчивостью, а если её делать, то как именно? Желательно, чтобы потеря одной ВМ или одного гипервизора не отключала постгрес целиком и не приводила к потере данных.

Вопрос задан более трёх лет назад
8359 просмотров

Комментировать

Подписаться 12 Простой Комментировать

Помогут разобраться в теме Все курсы

Учебный центр IBS

AL-1802 Администрирование Astra Linux Special Edition 1.8

2 недели

Далее
Skillbox

Linux для робототехников

3 месяца

Далее
Skillfactory

Профессия C++ разработчик

11 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 4

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+1 ещё

Простой
На чем практиковаться начинающему админу?
- 2 подписчика
- вчера
- 293 просмотра
2

ответа
Windows

+1 ещё

Средний
Работа PostgreSQL на процессорах с гетерогенной архитектурой под Windows?
- 2 подписчика
- вчера
- 182 просмотра
3

ответа
Windows

+1 ещё

Простой
Windows XP активация как решить без потери памяти?
- 2 подписчика
- 27 нояб.
- 516 просмотров
6

ответов
Linux

+2 ещё

Простой
В shinobi отображаются видео только за 24 часа, как увидеть все?
- 3 подписчика
- 27 нояб.
- 145 просмотров
0

ответов
Linux

+1 ещё

Средний
Почему не монтируются сетевые шары при VPN?
- 3 подписчика
- 23 нояб.
- 712 просмотров
1

ответ
Linux

+2 ещё

Средний
StrongSwan IKEv2/IPSec и fail2ban, как правильно настроить?
- 2 подписчика
- 22 нояб.
- 417 просмотров
0

ответов
Программирование

+2 ещё

Средний
Возможно ли написать программу, которая будет удалять все данные с дисков?
- 3 подписчика
- 19 нояб.
- 780 просмотров
10

ответов
Linux

+2 ещё

Простой
Какие подходящие характеристики для VPN?
- 1 подписчик
- 19 нояб.
- 945 просмотров
3

ответа
Linux

Сложный
Как вылечить инфокиоск?
- 1 подписчик
- 19 нояб.
- 480 просмотров
1

ответ
Windows

+1 ещё

Средний
Почему не создается логическая репликация на Windows 10 и падает воркер?
- 5 подписчиков
- 17 нояб.
- 335 просмотров
1

ответ
Показать ещё Загружается…

DevOps

IT ATLAS • Москва

от 200 000 до 250 000 ₽

Сетевой инженер, OpenWrt, Linux

Ростовский завод электроники • Санкт-Петербург

от 20 000 до 60 000 ₽

Специалист первой линии технической поддержки

Петрович-Тех

До 52 882 ₽

Answer 1 · 2018-04-20 13:58:35

В итоге сделал так:
Три ВМ, одна кластерная на хранилище с ролью master, две на локальных дисках гипервизоров с ролями hot standby, настроил потоковую репликацию через wal sender в режиме "записать одну копию, потом завершать транзакцию" (параметр synchronous_standby_names = '1 (*)' ), и получил примерно искомое - в случае падения одного из гипервизоров ложится одна реплика и возможно мастер, но мастер поднимается на второй ноде и с оставшейся репликой вполне успешно сохраняет данные. Узким местом остается сам мастер, если в нем какое-либо повреждение, постгрес ляжет как целое, но по крайней мере можно будет вытащить данные с реплики и поднять мастер ещё раз.

Answer 2 · 2017-12-21 12:37:47

Существует спектр решений. Проблема в том, что надо выбрать наиболее подходящую для вас. Тут кратко расписаны варианты postgresql.leopard.in.ua/html
У заказчика были специфические требования. Ему нужно было, чтобы решение работало в docker swarm.
Рассматривались RepMgr, Patroni, Stolon. Больше всего понравился https://github.com/sorintlab/stolon.
Пол года полёта, база 30 гиг. около 50 пользователей. Полёт нормальный.

Answer 3 · 2017-12-21 08:35:55

Я данный вопрос решаю с помощью pgpool на третьей виртуалке. Все подключение через него.

Answer 4 · 2017-12-15 10:50:54

СтОит или нет зависит от требований.
Не зная этих требований нельзя ответить, что правильнее.
У кластера есть вполне определённые цели и, вполне возможно, что вы занимаетесь оверинжинирингом и вам достаточно будет просто бекапы снимать с правильной частотой без всяких кластеров.

Answer 5 · 2017-12-22 12:06:45

Nigatiff @Nigatiff

Вот тут отличная статья на Хабре под решение вашей проблемы.

Ответ написан более трёх лет назад

Комментировать

Как лучше организовать отказоустойчивый кластер PostgreSQL?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт