Будет ли работать mysql с нагрузкой примерно триллион записей?

Question

billgeits976455 @billgeits976455

Будет ли работать mysql с нагрузкой примерно триллион записей?

Добрый день! Знаю вопрос звучит странно, но предположим что у нас есть база данных с триллионом записей, будет ли она нормально функционировать и как это скажется на время ответа от базы?

Заранее благодарю!

Вопрос задан более трёх лет назад
2332 просмотра

1 комментарий

Подписаться 9 Оценить 1 комментарий

Решения вопроса 3

5 комментариев

Комментировать

3 комментария

Пригласить эксперта

Ответы на вопрос 6

Комментировать

11 комментариев

Therapyx @Therapyx

А чем постгре так отличается, что явно будет?)

Написано более трёх лет назад
AlikDex @AlikDex

Therapyx: потому что рассчитан на ахулиард ;D А триллион это так, мелочи )))

Написано более трёх лет назад
Александр Таратин @Taraflex

Therapyx: Маркетингом, наверное

Написано более трёх лет назад
Влад Пасечник @jumper423

Therapyx: MySQL это детский сад просто. А для таких объёмов использовать детсад как-то неразумно. Но это не вдаваясь в подробности.

Написано более трёх лет назад
wittyrider @wittyrider

Влад Пасечник: Много слышу такое мнение на тостере.
Можете обяснить на пальцах преимущество PostgreSQL над MySQL?

Написано более трёх лет назад
wittyrider @wittyrider

Но это не вдаваясь в подробности.

Вед именно подробности интересно же... рассказывайте :)

Написано более трёх лет назад
AlikDex @AlikDex

вы что, всерьез восприняли цифру триллион? (12 нулей, даже не миллиард :D)

Написано более трёх лет назад
Влад Пасечник @jumper423

wittyrider: Я сомневаюсь что лучше скажу чем здесь написано, по этому вот смотрите habrahabr.ru/company/mailru/blog/248845

Написано более трёх лет назад
Оптимус Пьян @marrk2

wittyrider: гуглите простые запросы "достоинства postgreSQL" сравнение мускуля и постгри

Написано более трёх лет назад
Макс @MaxDukov

Therapyx: "А чем постгре так отличается, что явно будет?)" - не иначе, что там байт покороче. 7,5-7,7 бита. И легче.

Написано более трёх лет назад
Антон Зеленский @zelibobla

Влад Пасечник: Статья, на которую вы сослались, не имеет никакого отношения к контексту, в котором вас попросили объяснить вашу позицию.
Уточню: почему вы считаете, что PostgreSQL лучше справится с задачей в триллион записей, чем MySQL?
То есть, пожалуйста, не надо про репликацию, качество синтаксиса и документации.

Расскажите нам, пожалуйста, про преимущество в производительности и партиционировании – то есть в том, что имеет прямое отношение в вопросу, который задал топикстартер.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 20 авг.
- 76 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 147 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 145 просмотров
1

ответ
PHP

Простой
После переезда на новый хостинг перестал работать сайт?
- 1 подписчик
- 13 авг.
- 338 просмотров
4

ответа
PHP

Простой
Чем собирать статистику запросов от клиентов на сервере?
- 1 подписчик
- 13 авг.
- 278 просмотров
6

ответов
PHP

+1 ещё

Средний
Как работать с подключениями к БД в долгоживущих приложениях с EntityManager в RoadRunner?
- 2 подписчика
- 07 авг.
- 178 просмотров
1

ответ
MySQL

Простой
Как свзять столбцы по внешнему ключу?
- 1 подписчик
- 06 авг.
- 110 просмотров
1

ответ
MySQL

Простой
Как подсчитать количество строк в sql запросе?
- 1 подписчик
- 05 авг.
- 225 просмотров
1

ответ
Программирование

Простой
Оператор, операция, функция, процедура — что всё это значит?
- 1 подписчик
- 05 авг.
- 287 просмотров
2

ответа
PHP

Сложный
Как напечатать чек с маркировкой через атол?
- 4 подписчика
- 01 авг.
- 241 просмотр
0

ответов
Показать ещё Загружается…

PHP-developer / PHP-разработчик

Wanted

До 250 000 ₽

PHP-разработчик

Wanted

До 300 000 ₽

Backend developer (PHP)

Wanted • Казань

До 150 000 ₽

Спасибо всем за помощь! В основном планировались только операции извлечения данных, как правило в каждой строчке их очень мало.
Еще раз спасибо!

Answer 1 · 2015-09-02 13:54:59

вообще триллион записей по 1 байту - это уже террабайт. т.е. тут мы говорим о БД с объемом даже не в десятки - в сотни террабайт. Очень IMHO - но тут говорить о любом SQL вообще странно. Может быть хадуп?

Answer 2 · 2015-09-01 22:53:37

Конечно, все зависит от многих условий, но в общем случае при таких объемах нужно дробить таблицы (partitioning). Как следствие, сначала нужно будет с каждой таблицы выбрать нужные данные, а далее проводить с ними какие-то операции - джойны и т.д.

Answer 3 · 2015-09-02 09:13:33

Предположим у вас в таблице более 10^12 записей много полей и таких таблиц несколько. Работать такая база будет, но при соблюдении ряда мер. Во-первых, от релятивности придется отказаться, перестройка индексов при изменениях будет чрезвычайно ресурсоёмка. Во-вторых, требования к качеству запросов будут выше, обычный LEFT JOIN по такой таблице, и ответ может быть очень нескоро. Плюс некоторые другие проблемы, касающиеся поддержки базы.

Я бы выбрал PostgreSQL.

Answer 4 · 2015-09-01 23:13:41

Плохо раскрыли вопрос. Триллион записей в одной таблице или в миллионе таблиц по немного. Какие операции в основном нужно делать. Какая структура данных и тд и тп. Какие мощностями располагаете. Для такого большого количества записей очень много надо учесть. Может Вам больше подойдёт что-то из NoSQL.

Answer 5 · 2015-09-01 22:46:40

Руслан Федосеев @martin74ua Куратор тега MySQL

Linux administrator

stackoverflow.com/questions/1276/how-big-can-a-mys...

Ответ написан более трёх лет назад

Комментировать

Answer 6 · 2015-09-01 23:12:29

Проблема врятли будет в самой базе данных. Как правило всё упирается в три вещи:

1. Сами запросы и оптимизация их.
2. Конфигурация базы данных и самого сервера. Ну и правильно расставленные индексы.
3. Ресурсы сервера с базой данных.

Answer 7 · 2015-09-10 17:24:26

Обычно, когда оперируют данными такого объема, идет деление на уровне приложения.
К примеру, записи с 1-1м лежат на одном сервере, данные с 1м-2м на другом и т.д. MySQL справиться с такой задачей, Facebook справляется. Но JOIN-ы Вы делать не сможете, а для связки Ваших данных, нужно будет реализовывать скриптовый сервер.

Главное понять данные каких типов будут храниться, возможно для Ваших задачь, MySQL, просто не подходит

Answer 8 · 2015-09-10 23:28:58

Если у Вас чисто теоретический вопрос - тогда так и отвечу без конкретных реализаций))) Работать будет относительно быстро, если регулярно осуществлять партицирование или сегментирование (почитайте в интернетах, очень полезная вещь даже для небольших БД). В кратце - это разделение всей БД по партициям, с которыми мускулу намного легче работать, чем с одной крупной БД. Сам мускул предоставляет отличные инструменты для этого. Более того, он сам определяет в какой партиции хранятся нужные данные уже в момент запроса. Так же при этом не накладывается совершенно никаких ограничений в работе с джоинами и индексами. Единственный минус заключается в том, что его нужно осуществлять вручную. Хотя для этого достаточно запускать простенький скрипт на кроне, который будет выполнять около сотни запросов партицирования всего раз в месяц. Нагрузки он этим почти не создаст, однако сам мускул Вам будет очень благодарен, что вы разгружаете его от ненужной работы по тасканию тяжеленных баз. Еще иногда с связке с ним реализуется шардинг, когда автоматически создается новая таблица в БД, когда в старой накопилось какое-то количество записей (как правило 10 000), c именами table1, table2, table3 и т. д. В этом случае разные БД можно вообще разнести по разным серверам, однако в большинстве случаев из-за некоторых субъективных факторов его реализация как правило неосуществима, поэтому в большинстве случаев повсеместно используется партицирование.
Также, как уже было сказано ранее - неизвестно, в каких условиях будет пользоваться Ваша БД: если запросов на добавление больше, чем на чтение - нужно пользовать MyISAM, иначе InnoDB, разница замечается. Сильно.

Answer 9 · 2015-09-01 22:43:54

PostgreSQL будет ))) MySQL ну может в принципе наверное, возможно даже один индекс по id довольно долго будет перестраиваться при вставке новых записей.

Будет ли работать mysql с нагрузкой примерно триллион записей?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт