Как верно проектировать базу данных?

Question

Артем Кисленко @webwork

Как верно проектировать базу данных?

Здравствуйте.
Вопрос в следующем: есть проект, который содержит достаточно много таблиц (не сотни, конечно, десятки, но работать уже не комфортно). Периодически встают задачи, которые требуют добавления новых таблицы или колонок и т.д. Существует дилема (для меня) создавать нормализованные таблицы или нет. Просто, если да, тогда это еще добавится 3-4 таблицы, а если нет, тогда всего одна, или вообще все данные в одну колонку запихнуть.
Хотелось бы узнать субъективное (личное мнение) разработчиков, потому что ответ на этот вопрос обычно звучит следующим образом - смотрите сами, в зависимости от вашего проекта, опыта и т.д.
Спасибо.

Вопрос задан более трёх лет назад
565 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее
Академия Эдюсон

FullStack-разработчик: тариф PRO

14 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Решения вопроса 5

3 комментария

Melkij @Melkij

Всего лишь десятки миллионов? Для postgresql? Вы размещаетесь на raspberry pi?

Написано более трёх лет назад
mletov @mletov

Melkij: Ок, озвучьте другую цифру, начиная с которой стоит задумываться о денормализации)

Написано более трёх лет назад
Melkij @Melkij

Когда не укладываетесь в желаемую производительность - вот тогда и денормализовывать. Какую-то аггрегацию нередко оправдано добавлять сразу, как появилась необходимость её выводить на веб-морде, например, статистику чего-нибудь для графиков. Меняется только хвост, а начало статично. При том, таблиц аггрегации может быть и несколько. Это может быть и материализованное представление, когда наконец сделают инкрементное обновление - но тоже своего рода таблица. Теоретически, это денормализация, вот только для исходных данных нормальная форма остаётся как есть. Добавляется только предварительно рассчитываемый аггрегат.

Написано более трёх лет назад

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+3 ещё

Средний
Как организовать автоматическую выдачу цифровых товаров после оплаты на чистом PHP?
- 2 подписчика
- 20 апр.
- 239 просмотров
3

ответа
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 224 просмотра
2

ответа
PostgreSQL

Простой
Запрос с 1 условием для выбора источника данных?
- 1 подписчик
- 08 апр.
- 132 просмотра
2

ответа
Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 238 просмотров
3

ответа
PostgreSQL

+1 ещё

Средний
Как в PostgreSQL организовать синхронизацию данных между геораспределенными копиями?
- 1 подписчик
- 25 мар.
- 257 просмотров
3

ответа
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 318 просмотров
2

ответа
PostgreSQL

Простой
Как оптимизировать запрос с фильтром?
- 2 подписчика
- 13 мар.
- 314 просмотров
1

ответ
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 146 просмотров
2

ответа
PostgreSQL

+1 ещё

Простой
Как работает Housekeeper в Zabbix?
- 1 подписчик
- 07 мар.
- 254 просмотра
3

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 223 просмотра
1

ответ
Показать ещё Загружается…

Системный администратор Linux (SysOps)

НТЦ ПРОТЕЙ • Санкт-Петербург

До 200 000 ₽

Fullstack PHP Laravel/VueJS разработчик

Emsoft

До 150 000 ₽

PHP и Node.js разработчик

TripShock Adventures

от 1 000 до 2 500 $

Answer 1 · 2016-07-01 06:18:46

Все упирается в объемы данных. Если предполагаемое количество записей не будет исчисляться миллионами или даже десятками миллионов, то лучше придерживаться нормализации. Бардака будет меньше. Иначе да, денормализация или всякие решения типа nosql.

Так же свою лепту вносит заказчик.
Например, нужно выводить сводные данные за некие отчетные периоды. С т зрения программирования, лучше считать динамически на основе правильно нормализованной базы. Добавилась в период строчка - пересчитатли общий результат за этот период. Но, с т зрения учета, заказчики часто требуют, что если период закрылся - то результаты по нему не пересчитывают, даже если в этот период впихнули еще строчек задним числом. Приходится добавлять еще одну таблицу вопреки нормализации.

Answer 2 · 2016-07-01 09:30:10

или вообще все данные в одну колонку запихнуть.

На клиенте "объект" можно распарсить из любого вида, даже если это одна колонка сжатых данных в gzip.

Вопрос в индексах, вам нужно хранить данные так, что-бы можно было сделать на них индексы, и любые запросы выполнялись мгновенно.
В итоге если вам надо добавить например список телефонов к элементу таблицы, и вам не нужно делать по ним поиск, проверку уникальности, группировки и т.п. то нет смысла плодить отдельную таблицу под них, удобнее использовать json или массив. (хотя в некоторых БД уникальность и поиск можно сделать и для json/массива).

В итоге будет быстрее работать, т.к. нет JOIN, экономия RAM т.к. нет доп. индекса для JOIN, да и вообще удобней т.к. меньше сущностей.

Answer 3 · 2016-07-01 09:37:32

Если нужна таблица - должна быть таблица.

Postgresql предоставляет шикарную возможность разделить базу данных на схемы. Есть пачка таблиц, описывающая какую-нибудь сущность? Перенесите их в отдельную схему и пусть не мешаются в public. Таблицы аггрегации? Выкиньте их в отдельную схему.
Замечательно помогает, если становится многовато таблиц (несколько десятков разве много?).
Правда, если вы любитель всякого орм, ваша библиотека может не уметь схемы.

Answer 4 · 2016-07-01 12:30:11

Пугаться "большого" количества таблиц не стоит, особенно если "большое" - это десятки.
Если вам некомфортно работать с таким числом таблиц , настройте свои инструменты ( или возьмите нормальные, если текущие не тащат )

Answer 5 · 2016-07-01 11:30:12

Конечно нормализованные. На денормализованных таблицах у Вас Join не будет и Вам придется либо синхронизировать теоретически идентичные данные в разных полях, либо пилить свой движок SQL.

Как верно проектировать базу данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт