Нормализация БД. Зло или добро?

Question

Anton @MoonMaster

Программист и этим все сказано

Нормализация БД. Зло или добро?

Добрый день!

Недавно смотрел интересную презентацию человека, который реализовал свой стартап до полноценного проекта. В этом проекте он использовал БД Postgres. Все конечно было интересно, но он сказал одну вещь, которая меня шокировала. Он сказал так: "Нормализация это зло! В некоторых случаях (этот процент небольшой) и при необходимости используйте нормализацию БД." Я никогда еще не делал проекты связанные с запросом данных в БД или вообще работой с БД, но проходил теорию по данному вопросу (в университете). И у меня возник вполне резонный вопрос: действительно ли нормализация БД является не лучшим союзником в реализации своего проекта (программы)?

Вопрос задан более трёх лет назад
3346 просмотров

5 комментариев

Подписаться 10 Оценить 5 комментариев

Валерий Рябошапко @valerium

То есть человек вот так вот опроверг сходу прописную истину и никак это не аргументировал?

Написано более трёх лет назад
Anton @MoonMaster Автор вопроса

Он аргументировал. Он начал рассказывать о том, как НФ (нормальные формы) существуют, как к ним придти. И он сказал, что привел свои данные в БД к 5НФ. И программа спокойно работала с данными. Но потом как данных становилось все больше он заметил существенное торможение своей программы. И как он сказал, привел свою БД в 2 НФ и у него все стало работать очень быстро по сравнению с тем что было. И дал еще совет, МАКСИМУМ нужно доводить до 4 НФ, да и то не всегда.

Написано более трёх лет назад
Валерий Рябошапко @valerium

Антон: ну, собственно, вот и ответ на Ваш вопрос :-)

Написано более трёх лет назад
mib @mib

нормализация данных ведет к экономии места - это хорошо,
но так-же ведет и к усложнению запросов джойнами и к увеличению времени обработки запросов, ведь каждый джойн - это вложенный цикл

Написано более трёх лет назад
Валерий Рябошапко @valerium

mib: старая как мир борьба между скоростью и объёмом :-)

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 3

Комментировать

4 комментария

entermix @entermix

Иногда, как раз после того, как проект вырос и приходится делать денормализацию))

Написано более трёх лет назад
Therapyx @Therapyx

entermix: это в каких еще таких случаях? )

Написано более трёх лет назад
entermix @entermix

Therapyx: В тех случаях, когда на БД производится высокая нагрузка при выборке данных, почитайте ответы других пользователей, там уже писали про это )

Написано более трёх лет назад
coodan @coodan

entermix: довольно грубое решение.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 5

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 924 просмотра
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 608 просмотров
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 690 просмотров
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1395 просмотров
10

ответов
Программирование

Простой
Как создать и использовать свою кодировку знаков?
- 1 подписчик
- 02 июн.
- 730 просмотров
4

ответа
Базы данных

Средний
В чем разница между логической и физической модели в БД?
- 1 подписчик
- 27 мая
- 307 просмотров
3

ответа
Программирование

+1 ещё

Простой
Проект для программирования?
- 2 подписчика
- 27 апр.
- 884 просмотра
9

ответов
Программирование

Простой
Олимпиадное программирование — с чего начать?
- 1 подписчик
- 18 апр.
- 601 просмотр
2

ответа
Программирование

Простой
Как управлять/хранить изображения для UI?
- 1 подписчик
- 10 апр.
- 315 просмотров
1

ответ
Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 293 просмотра
3

ответа
Показать ещё Загружается…

То есть человек вот так вот опроверг сходу прописную истину и никак это не аргументировал?
Он аргументировал. Он начал рассказывать о том, как НФ (нормальные формы) существуют, как к ним придти. И он сказал, что привел свои данные в БД к 5НФ. И программа спокойно работала с данными. Но потом как данных становилось все больше он заметил существенное торможение своей программы. И как он сказал, привел свою БД в 2 НФ и у него все стало работать очень быстро по сравнению с тем что было. И дал еще совет, МАКСИМУМ нужно доводить до 4 НФ, да и то не всегда.
Антон: ну, собственно, вот и ответ на Ваш вопрос :-)
нормализация данных ведет к экономии места - это хорошо,
но так-же ведет и к усложнению запросов джойнами и к увеличению времени обработки запросов, ведь каждый джойн - это вложенный цикл
mib: старая как мир борьба между скоростью и объёмом :-)

Answer 1 · 2015-08-21 18:21:43

Сильно зависит от масштаба проекта. Не стоит бросаться из крайности в крайность.
Для мелких проектов нормализация делает работу проще.
Но когда речь идет об огромных объемах данных и высокой частотой запросов, нормализация становится врагом. Даже простые JOIN увеличивают время выполнения запросов на порядок. Поэтому денормализация БД, внесение избыточности - обычная практика для HiLoad.

Answer 2 · 2015-08-21 18:24:20

Нормализация ради нормализации - зло в подавляющем большинстве случаев! Нормализация, как часть продуманного проектирования или рефакторинга модели данных - однозначно добро. Структура БД должна быть, по возможности, оптимальной для запросов, выполняемых на ней приложением, а вовсе не соответствовать какой-то там нормальной форме :) Это "оптимально" может в каждом конкретном случае зависеть от кучи факторов, начиная от самих запросов и особенностей конкретной использованной СУБД, и вплоть до объемов доступной памяти и скорости обращения к диску.

Answer 3 · 2015-08-21 18:23:53

По мне так - везде найдется тот, кто будет критиковать даже самый лучше вещи в мире.
И вот это видимо и есть такой случай. Ниразу не видел, чтобы нормализацию выставляли в плохом свете. Конечно, если ваш проект, программа на столько маленькая, что можно обойтись и без нормализации и при этом останется такое же удобство, быстродейственность, то это да - нормализация мб и не нужна. Но у проектов есть чудесное свойство, а именно развиваться :) И вот лучше такие вещи продумывать заранее, ежели потом держаться за голову.

Answer 4 · 2015-08-21 18:22:55

Все зависит от контекста высказывания (задачи разные бывают). Бросаться в крайности это глупо (только ситхи все возводят в абсолют (с) Оби)

Нормализация это не зло, нормализация это замечательно, но на больших нагрузках частенько приходится производить денормализацию. Опять же обычно это не значит что данные мы в нормальной форме больше не храним, просто мы попутно формируем и агрегации денормализованных данных для ускорения выборки.

p.s. уточните о чем был проект или скиньте ссылку, любопытно посмотреть на безумца или понять его хотя бы.

Answer 5 · 2015-08-21 22:52:13

Видите ли в чем дело - нормализация это не столько для СУБД и не для приложения ее использующего. Это больше для вас, для разработчика (БД и/или приложения), и для целостности и согласованности данных.

Безусловно, в продакшене идеальна та БД, структура которой позволяет выполнить наиболее частые (или тяжелые) запросы к БД максимально экономно с точки зрения аппаратных ресурсов (меньше чтений блоков с диска, меньше джоинов, наиболее эффективное использование индексов), и такая структура вовсе не обязательно должна быть в высокой нормальной форме. Однако, есть и другой вопрос - какая БД идеальна для вас, как для разработчика? Избыточность в базе - потенциал для ошибок. Если какую-либо информацию нужно обновить в двух местах (например, цену товара в чеке и общую стоимость заказа) - вы всегда имеете возможность где-то забыть это сделать.

Именно по причине несовпадения двух структур БД: максимально нормализованной, удобной для разработчика/проектировщика, и оптимизированной для выполнения запросов - стандартный цикл проектирования БД включает в себя этап нормализации до опредленного уровня (хотя бы до 3нф), и последующей денормализации для ускорения конкретных запросов (также, как и построение необходимых индексов). Т.к. денормализация требует усложнения логики работы с базой (те самые обновления в нескольких местах), эту логику (чаще всего это хранимки или триггеры, реже - на стороне приложения) нужно реализовывать максимально аккуратно и формально. Это похоже на написание кода на высокоуровневом языке и последующая его компиляция под конкретную платформу с максимальными оптимизациями. Единственное важное отличие - особенности целевой платформы известны заранее, и компилятор, учитывающий эти особенности, можно написать один раз, а вот особенности работы БД в каждой задаче - свои, поэтому в каждом случае нужно проводить работу по оптимизации БД с нуля.

Нужно отметить, что в современных системах денормализация схемы - не единственный и не всегда лучший способ повышения производительности. Кэширование часто используемых данных в каком-нибудь memcached - иногда проще и эффективнее, чем денормализация БД и поддержка ее согласованности.

Answer 6 · 2015-08-27 14:42:26

Давайте разбираться.

В нормализованной бд (в общем случае) выборка по произвольным параметрам будет работать пошустрее. Проще добавлять и изменять данные.
Ненормализованная может дать очень большой выигрыш для четко очерченного круга запросов по выборке данных (не нужны лишние джойны, уже готова сортировка и прочее). Но если вам понадобится что-то нестандартное - готовьтесь к любому исходу. Скорей всего запрос будет работать очень медленно.

В нормализованной БД, запрос до определенной степени можно оптимизировать. Я видел, как хранимая процедура (очень большая) ускорялась с 2 часов до 5 минут с помощью подходящих индексов и правильных джонов, но оптимизацию проводил SQL-кунг-фу сэнсэй, он знал, что покрутить.
В денормализованной - вы так уже не сделаете, придется менять структуру данных.

Я бы старался нормализовать данные, но не до академического фанатизма, а до той степени, когда таблицы не вызывают отвращения ни у меня, ни у оптимизатора запросов используемой СУБД.

Answer 7 · 2015-08-23 18:39:04

Согласен. Очень плохая практика, и ее рост ничего не доказывает.

Чай, не в каменном веке живем и есть уйма способов повышения производительности - от кэширования и до предварительной аггрегации данных. Но никакое повышение производительности не стоит нарушения целостности данных. К чему производительнее выдавать мусор?

Чувак просто слышал звон, да не знает где он. Взял мощную СУБД, а освоить мозгов не хватило. Вот и хвастается теперь своим невежеством, полагая, что он самый умный, а остальные дураки все.

Answer 8 · 2015-08-21 18:23:52

Если у тебя ещё нет опыта работы, то сделай чтобы он появился.
А то сейчас ты можешь сделать преждевременный вывод, и возможно он будет ошибочным.

А на счёт зло добро, не знаю...
ИМХО, смотря до какой степени проводить нормализацию

Нормализация БД. Зло или добро?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт