MS sql. Тысяча таблиц или одна большая?

Question

paz @paz

SQL Server

MS sql. Тысяча таблиц или одна большая?

Добрый день, уважаемые знатоки MS SQL

Имеется база куда с большой частотой пишутся данные по 2-3 тысячам сущностей. Пишется все в несколько таблиц. Объем базы больше 1тб, рост около 50-60 гб/ месяц.

С ростом базы начались проблемы по скорости при вставке. Также, т.к. база должна быть онлайн 24х7 возникали проблемы при необходимости переиндексации или диагностики базы (необходим был монопольный доступ)

Есть идея сделать на каждую сущность свою таблицу данных. Даст ли это прирост скорости при вставке (индекс на таблицу меньше) или наоборот заставит систему держать больше индексов в памяти? также, это дало бы удобство при переносе данных и распределении данных на несколько баз. Вся бизнес логика работает по сущностно, выборки идут только по ключу сущности.

По использованию базы: пишется постоянно практически в каждую сущность с интенсивностью раз в 1-5 секунд. Читается по разному, в зависимости от активности пользователей, в основном нечасто, но выборка должна быть быстрой, чтобы получить строк 20-30 тыщ за пару секунд. Хранилище на ssd.

Вопрос задан более трёх лет назад
1212 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Merion Academy

Базы данных с нуля

2 месяца

Далее
OTUS

SQL для разработчиков и аналитиков

3 месяца

Далее
Сетевая Академия ЛАНИТ

Администрирование баз данных SQL Server

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 3

6 комментариев

paz @paz Автор вопроса

Никаких джоинов нет. В систему просто сыпятся данные с датчиков. пользователи берут отчеты за интервал времени - просто сгружаются данные и на клиенте считается математика. вобщем нужно быстро писать, быстро отдавать по одному ключу - времени. никаких навороченных выборок не нужно.

Написано более трёх лет назад
paz @paz Автор вопроса

Ну и возникает проблема большой базы, как хранить, как бекапить и как выделить часть данных, которые чаще всего используются и должны работать быстрее, чем архивные

Написано более трёх лет назад
nApoBo3 @nApoBo3

paz: Если в таблице один индекс по времени, и нет ограничений, то вставка данных не должна значительно замедляется с ростом их кол-ва. В зависимости от структуры данных возможно можно отказаться от индекса по времени, заменив его rcid метками. В данном случае проще разделить данные не по сущностям, а по времени.

Написано более трёх лет назад
paz @paz Автор вопроса

nApoBo3: что такое rcid метки? гугль не знает :) Тогда еще вопрос. У меня в базе около 5 млрд записей. Появляется задача часть данных вынести на быстрые носители, критерий отбора по сущностям и по времени. Если одна таблица то как такое средствами mssql сделать? Вообще любые манипуляции с большими таблицами это гемор. сейчас при выполнении DBCC CHECKDB нам надо останавливать все и не факт что это перелопатится за ночь :)

Написано более трёх лет назад
nApoBo3 @nApoBo3

paz: автоинкриментный первичный ключ. Если выборка у нас не произвольная, а ступенчатая, то можно начало каждой ступеньки заносить во внешнюю таблицу, и делать выбоку по данному значению, такое хитрое партицирование получается. Если бить надо по сущностям, то несколько таблиц. Возможно имеет смысл, выделить отдельный сервер для выборок и реплицировать его.

Написано более трёх лет назад
nApoBo3 @nApoBo3

paz: возможно вообще имеет смысл разделить базу на несколько, не зная структуру данных и задачи сказать сложно.

Написано более трёх лет назад

Комментировать

2 комментария

paz @paz Автор вопроса

неправильная архитектура - не нужно писать raw логи в бд

а я и не пишу RAW, пакеты парсятся и пишутся в бд

для каждого датчика своя таблица

датчик или прибор? У нас в системе есть несколько тысяч приборов, которые шлют данные. в каждом приборе несколько датчиков.
делать таблицу на отдельный прибор или на отдельный датчик?

Написано более трёх лет назад
sim3x @sim3x

paz:
>я и не пишу RAW, пакеты парсятся
хорошо, но нужно пойти дальше

нужно нормализировать схему хранениния

если есть несколько приборов с одинаковыми датчиками, но датчики могут стоять только на данных приборах, то делаем таблицу для данных приборов с полями в виде их датчиков

если в ножестве приборов есть одинаковые датчики и часто нужно агрегировать данные по датчикам, а не по приборам, то делаем таблицу с приборами и таблицу с датчиками и привязываем датчики к приборам

подробнее см 3-я формальная форма, Форма Бойса-Кодда

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 204 просмотра
1

ответ
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 186 просмотров
2

ответа
Системное администрирование

+3 ещё

Простой
Не удается подключить сервер к консоли администрирования 1С. В чем может быть проблема?
- 3 подписчика
- 26 сент.
- 246 просмотров
3

ответа
SQL Server

+2 ещё

Средний
Может ли тормозить 1С из-за отключенного кэширования записи на диск на сервере с 1С+MSSQL?
- 5 подписчиков
- 20 авг.
- 497 просмотров
3

ответа
1С

+1 ещё

Средний
Как правильно протестировать регламентные задания для обслуживания баз данный MSSQL?
- 2 подписчика
- 20 авг.
- 215 просмотров
1

ответ
SQL Server

Средний
Возможно ли в UPDATE «видеть» результат обновления предыдущих строк?
- 2 подписчика
- 01 авг.
- 137 просмотров
1

ответ
SQL Server

+2 ещё

Простой
Как создать связанный Oracle сервер с Ms SQL server?
- 1 подписчик
- 05 июн.
- 128 просмотров
0

ответов
SQL Server

+1 ещё

Простой
Как создать XML определенного формата из таблицы с помощью FOR XML PATH?
- 2 подписчика
- 14 мая
- 90 просмотров
0

ответов
1С

+1 ещё

Простой
Как обойти ошибку создания уникального индекса?
- 1 подписчик
- 06 мая
- 179 просмотров
4

ответа
PHP

+1 ещё

Простой
Как добавить данные в бд с помощью php sqlsrv?
- 1 подписчик
- 18 апр.
- 188 просмотров
2

ответа
Показать ещё Загружается…

Технический руководитель/Technical Lead(государственная информационная система)

ЛАНИТ • Москва

До 400 000 ₽

Go-разработчик / Backend Developer (Golang)

Karma8

До 500 000 ₽

Системный аналитик

UDS Media • Санкт-Петербург

До 200 000 ₽

Answer 1 · 2015-07-14 08:15:57

Проблемы со скоростью вставки с чем связаны?
Несколько таблиц по идее должны быть быстрее по целому ряду причин, но может вырасти кол-во джойнов на выборке, что скажется на производительности. Плюс возможно потребуется дополнительные проверки значений которые обеспечивались уникальными ключами, что сведет все плюсы на нет.
В любом случае это потребует пересмотра архитектуры базы и приложения, и не факт, что на выходе будет быстрее.
Возможно имеет смысл сделать разделение таблиц не по сущностям, а по каким то другим признакам, не зная структуры базы сказать сложно.
А может надо просто разделить объекты на чет-нечет и раскидать на два сервера.

Answer 2 · 2015-07-14 08:51:13

Разными таблицами должно быть лучше, ещё можете попробовать партицирование и сжатие.

получить строк 20-30 тыщ за пару секунд

Если у вас данные выбираются пачками, например по дням, то можно их хранить по дням при этом сжимать (если там текст, то сжать можно в 10-30 раз), таким образом выборка будет быстрее (экономия io), занимаемое место и индекс будет сильно меньше.

Answer 3 · 2015-07-14 14:37:05

В систему просто сыпятся данные с датчиков. пользователи берут отчеты за интервал времени - просто сгружаются данные и на клиенте считается математика. вобщем нужно быстро писать, быстро отдавать по одному ключу - времени. никаких навороченных выборок не нужно.

неправильная архитектура - не нужно писать raw логи в бд
для каждого датчика своя таблица

как бекапить

никак - поднимай репликацию

как выделить часть данных, которые чаще всего используются и должны работать быстрее, чем архивные

определи период, через, который данные отправляются в архив
разбей их на периоды (за месяц или за неделю)
оставь в виде статических файлов

И еще
У тебя не бигдата - у тебя неправильная архитектура

MS sql. Тысяча таблиц или одна большая?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт