Кластеризация базы данных

Question

darkslesh @darkslesh

Кластеризация базы данных

Читал в сети, что ВКонтакте использует MySQL в роли основного хранилища. Да и многие другие проекты используют MySQL. Интересен вопрос в том, как это реализовано с технической стороны?
Не именно как у них, а то, как это вообще можно спроектировать, главные требования:

Использование бесплатных баз данных
Прозрачная работа с базой (т.е. скрипты не должны знать как и что там устроено и подключаться или к одному серверу всегда или к случайному в кластере)
При выходе из строя одного сервера, чтобы работа продолжалась и данные не были бы утеряны
Большая производительность (обрабатывалось очень большое кол-во запросов)
Хорошая расширяемость (без отключения системы можно было бы добавить или убрать сервер)

При этом ограничения следующие:

База относительно не большая (максимум 8 гигов, хотя не факт что может стать больше)
Почти все таблицы связаны через внешние ключи
Запросы относительно простые (наибольшее кол-во SELECT. Чуть меньше Insert и очень мало Update)
Запросы примитивные и чаще всего затрагивают 1-2 таблицы

Вот собственно говоря вопрос: Какими средствами лучше это реализовать?

Сам склоняюсь к memcached + MySQL(InnoDB) + NDB, но вот с NDB что-то не ясно, многие плюются но не объясняя что и как, но часто мелькает информация что если база станет больше чем ОЗУ на каком-нибудь сервере, то всё загнется (к тому же так и не понял как там реализована система хранения, т.к. судя по документации всё хранится в памяти), а также нет поддержки внешних ключей, а без них будет довольно сложно жить. С репликацией тоже дело не особо понятное (там есть дублирование данные, но всё равно обращения идут только на master ).
Главная задача: надежное хранение +отказоустойчивость и приемлемая скорость при большой нагрузке (порядка 10к запросов в секунду). Кто что может посоветовать или дать ссылку на статью или документацию.

Вопрос задан более трёх лет назад
7182 просмотра

Комментировать

Подписаться 9 Оценить Комментировать

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 130 просмотров
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 105 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 362 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 246 просмотров
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 215 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 223 просмотра
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 317 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 166 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 222 просмотра
1

ответ
MySQL

Средний
Почему время в mysql опережает на пару секунд?
- 4 подписчика
- 06 янв.
- 450 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2011-10-05 05:55:05

К кластеризации админ приходит с одной из двух проблем
1. Боттлнеки, которые невозможно/нецелесообразно компенсировать наращиванием мощности одного сервера
2. Построение высокодоступного сервиса (High-availability)

Соответственно, первое будет очень дорого и геморно. Я чес говоря сталкивался с реально большими нагрузками, но при правильной организации структуры БД, железо все держало. Проще реально оптимизировать структуру в этом случае, чем пробивать всякие там NDB и мастер-мастер репликации.

Второе сводится к построению master/slave кластера, который автоматом меняется ролями в случае сбоя. Не рекомендую репликацию. Можете глянуть в сторону DRBD || GFS || GPFS + Heartbeat || Pacemaker

Кластеризация базы данных

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт