Сжатие БД в MS SQL?

Question

Meshko @Meshko

Сжатие БД в MS SQL?

Поставлена задача каким-то способом высвободить свободное место на диске.

БД уже отшринкованы, встал вопрос - попробовать попользоваться функцией: compression.

У меня вопрос, как с помощью compression уменьшить размер БД? Это функция предполагает запускать compression для определенных таблиц? А если я хочу скомпрессировать всё сразу?

Вопрос задан более года назад
692 просмотра

1 комментарий

Подписаться 2 Средний 1 комментарий

Помогут разобраться в теме Все курсы

OTUS

MS SQL Server Developer

5 месяцев

Далее
Merion Academy

Базы данных с нуля

2 месяца

Далее
Сетевая Академия ЛАНИТ

Администрирование баз данных SQL Server

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 229 просмотров
1

ответ
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 197 просмотров
2

ответа
Системное администрирование

+3 ещё

Простой
Не удается подключить сервер к консоли администрирования 1С. В чем может быть проблема?
- 3 подписчика
- 26 сент.
- 271 просмотр
3

ответа
SQL Server

+2 ещё

Средний
Может ли тормозить 1С из-за отключенного кэширования записи на диск на сервере с 1С+MSSQL?
- 5 подписчиков
- 20 авг.
- 498 просмотров
3

ответа
1С

+1 ещё

Средний
Как правильно протестировать регламентные задания для обслуживания баз данный MSSQL?
- 2 подписчика
- 20 авг.
- 219 просмотров
1

ответ
SQL Server

Средний
Возможно ли в UPDATE «видеть» результат обновления предыдущих строк?
- 2 подписчика
- 01 авг.
- 138 просмотров
1

ответ
SQL Server

+2 ещё

Простой
Как создать связанный Oracle сервер с Ms SQL server?
- 1 подписчик
- 05 июн.
- 132 просмотра
0

ответов
SQL Server

+1 ещё

Простой
Как создать XML определенного формата из таблицы с помощью FOR XML PATH?
- 2 подписчика
- 14 мая
- 91 просмотр
0

ответов
1С

+1 ещё

Простой
Как обойти ошибку создания уникального индекса?
- 1 подписчик
- 06 мая
- 188 просмотров
4

ответа
PHP

+1 ещё

Простой
Как добавить данные в бд с помощью php sqlsrv?
- 1 подписчик
- 18 апр.
- 188 просмотров
2

ответа
Показать ещё Загружается…

Node.js backend разработчик (Middle+/Senior)

DataLouna

от 250 000 до 350 000 ₽

Системный аналитик

ITK academy • Казань

от 75 000 до 130 000 ₽

Junior Go Developer

ITK academy • Нижний Новгород

от 75 000 до 120 000 ₽

как с помощью compression уменьшить размер БД? Это функция предполагает запускать compression для определенных таблиц? А если я хочу скомпрессировать всё сразу?

https://learn.microsoft.com/en-us/sql/relational-d...

Но при нынешних ценах на дисковое пространство попытка добыть пару лишних мегабайт сжатием - крайне неразумное занятие. Дополнительные процессорные ресурсы на него стоят куда как дороже.

Answer 1 · 2024-09-13 10:49:38

Но при нынешних ценах на дисковое пространство попытка добыть пару лишних мегабайт сжатием - крайне неразумное занятие. Дополнительные процессорные ресурсы на него стоят куда как дороже.

люто плюсую.

Но если прямо очень нужно, то советую вместо сжатия средствами БД, попробовать сжать средствами файловой системы (например btrfs - zstd, 16 уровней сжатия), можно поиграть с разным размером кластера, что может сильно повлиять на результат... особенно если в базе данных соседние поля с одинаковыми данными, а движок их упаковывает независимо.

Скорость записи в базу данных на сжатом диске сильно упадет, особенно если делать большой размер кластера (так как это увеличивает степень сжатия), но вот скорость чтения, особенно с hdd, даже может подрасти (особенно при хорошей степени сжатия), но должно много всего совпасть.

spoiler

Можно придумать абсурдно дикую комбинацию файловых систем и bcache, когда быстрый несжатый диск ssd (который не жалко или с хорошим ресурсом на запись) выставлен как кеш к диску, который будет размещен на сжатом хранилище, типа cloop, в этом случае запись на медленный носитель будет отложена на потом, а данные будут быстро складываться на ssd кеш.. пока скорость поступления данных на запись в этом буфере не превысит скорость записи на сжатый носитель, конструкция будет работать очень эффективно (занимая ресурсы процессора само собой, но там скорее всего однопоточная реализация будет).

НАСТОЯТЕЛЬНО рекомендую файлы индексов не сжимать, за исключением случаев, когда они целиком и полностью влезают в оперативную память и запись в базу данных не производится.

ОБЯЗАТЕЛЬНОЕ тестирование всей конструкции на реальных данных перед запуском в продакшен, иначе можно получить проблему, и конечно же бакапы, без них ничего делать даже не начинай.

p.s. наилучшее сжатие можно получить, если грамотно его реализовать на стороне самого приложения, ведь его разработчик знает, где какие данные как лежат, как их можно эффективно перераспределить и главное, есть библиотеки типа того же zstd, когда можно держать несколько словарей для сжимаемых данных, специально собранных под свои наборы данных,.. отличный пример сжатие xml/json файлов, где теги/атрибуты могут занимать до 90% пространства,.. и при маленьком размере сжимаемого куска, словарь на них будет в каждом куске свой.. а вот общий словарь для всего пакета файлов позволит на порядок сократить их объем.

p.p.s. само собой, замена xml/json на правильно созданный protobuf исключит эту проблему в зачатке

Answer 2 · 2024-09-13 11:47:15

Я просоединяюсь к совету выше. На тему того что самое эффективное уплотение информции
можно сделать на уровне разработки приложения.

Я-бы предложил не сжимать всю базу а проанализировать, какие таблицы и какие поля занимают
80% всего пространства. (Процены я взял с головы по принципу Паретто. Вы можете взять любой
процент. Можно 90 или 70 не суть важно. Важно чтобы не закапыватья м мелочах.)

Из опыта других БД. (Не MS-SQL). Часто бывало что потребителем места были BLOB-поля где
лежали какие-то несуразные и никому не нужные документы. Аттачменты. Картинки. Копии
email из переписок с пользователем и многое другое. Были ситуации когда причиной роста
БД были старые архивные записи в таблице которые почему-то были забыты. Они должны
были удаляться но из за бага не удалялись.

Хорошая практика в данном случае - убрать из БД все длинные текстовые документы
или положить их в gzip на уровне самого приложения например. Обычно такие поля
не участвуют напрямую в операциях OLTP и их сжатие ни на что особо не влияет.

Почти все современные БД имеют очень хорошую плотность информации на мегабайт
и если админ что-то там шринковал или уплотнял - то это носит временную меру. Через
некоторое время БД возвращается к той плотности как и была раньше вследствие
updates например.

По поводу ROW level/block level сжатия. Я не специалист в MS_SQL, но обычно это надо
предварительно тестировать под нагрузкой на PROD для всех DBMS в общем то.
Велика вероятность падения производительности а это, сами понимаете слишком
большая цена за экономию. И диски в наше время значительно дешевле скажем чем 10 лет назад.

Answer 3 · 2025-03-05 18:13:50

ещё есть такая штука как columnstore
это колоночный формат хранения, куда более компактный, чем традиционный строковый
но надо тестить, так как это в некотором роде как архив - накладные расходы на запись и извлечение есть, плюс надо делать ребилд, чтобы сохранялась компактность
но плюсы, если достаточно ЦПУ, а диска псп мало могут оказаться весомыми
т. е., clustered columnstore index, обычные b-tree индексы при этом также могут быть, самой rowstore-based таблицы как бы и нет; желательно партицированный - чтобы архив не рос бесконечно и накладные расходы на запись/извлечение тоже
и вопрос, куда это применять:
в таблицу:
1) большую
2) где много неуникальных значений в колонках
т. е. выбрать какие-то таблицы, исходя из логики приложения
взять запросы на них
создать сбоку/на тесте колумнстор таблицу и попробовать погонять на ней эти запросы

Сжатие БД в MS SQL?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт