Как clickhouse использует ОЗУ при обработке запроса?

Question

Ryabos @Ryabos

ClickHouse

Как clickhouse использует ОЗУ при обработке запроса?

На обработку запроса

select * from my_table limit 10000000 INTO OUTFILE 'test1';

ушло 373 Мб ОЗУ. А если ещё сджойнить маленькую таблицу, то на обработку 10М записей уходит 410 Мб. Если запросить 30 миллионов записей из пересечения таблиц, на обработку уйдёт 430 Мб.

Почему зависимость между запрашиваемым объёмом данных и потребляемой памятью нелинейна? Засчёт чего это достигается? Предположения у меня и у самого есть, но точного ответа я нигде не нашёл, а в исходниках не разобрался.

Вопрос задан более двух лет назад
100 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

REBRAIN

ClickHouse для дата-инженеров

2 месяца

Далее
Школа Больших Данных

Подготовка к сертификации ClickHouse Certified Developer

1 день

Далее
Яндекс Практикум

Мидл Python-разработчик: индивидуальные проекты

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Запрос на создание таблицы в clickhouse Yandex выдает ошибку 400 Bad Request, что не так с моим запросом?
- 2 подписчика
- 13 нояб. 2025
- 316 просмотров
4

ответа
ClickHouse

Средний
Почему Clickhouse читает много строк?
- 1 подписчик
- более года назад
- 186 просмотров
2

ответа
Logstash

+1 ещё

Средний
Возможно ли сделать систему логирования из ClickHouse, Logstash и Grafana?
- 1 подписчик
- более года назад
- 245 просмотров
3

ответа
Docker

+2 ещё

Средний
Почему не могу подключиться к Clickhouse из интерфейса PHPStorm?
- 1 подписчик
- более года назад
- 234 просмотра
1

ответ
Docker

+3 ещё

Средний
Ошибка с неизвестной таймзоной?
- 1 подписчик
- более года назад
- 557 просмотров
3

ответа
WordPress

+2 ещё

Простой
Как перенаправить все select запросы из wp mysql в clickhouse?
- 1 подписчик
- более года назад
- 174 просмотра
0

ответов
PHP

+4 ещё

Средний
Как организовать журнал событий в распределённой системе правильно?
- 2 подписчика
- более года назад
- 272 просмотра
2

ответа
ClickHouse

Простой
Memory limit в Clickhouse. Как бороться?
- 1 подписчик
- более двух лет назад
- 158 просмотров
0

ответов
ClickHouse

Средний
Как работать с ReplacingMergeTree в Clickhouse?
- 1 подписчик
- более двух лет назад
- 90 просмотров
2

ответа
ClickHouse

Простой
Как в ClickHouse выбрать данные с БД учитывая тайм зону?
- 2 подписчика
- более двух лет назад
- 259 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2023-11-29 19:22:36

Кликхаус относится к классу column-oriented dbms. Это означает что data-row как таковой отсуствует.
Строк нет. Но есть столбцы которые хранятся физически консолидировано. И когда ты указываешь
SELECT * то это заставляет кликхаус сделать гораздо больше действий чем надо на самом деле. В
силу этой колоночатой организации. Сами строки - виртуальны и чтобы их сформировать кликхаус
должен вычитать физических данных гораздо больше чем реляционка. Столбец - больше чем ячейка.

Чтоб такая система работала эффективно ты должен ее грузить аналитическими запросами типа

select avg(amount) from my_table;
Тогда кликхаус сработает быстрее чем Oracle или PG. В силу этой особенности формата.

А то что ты делаешь - экспорт во внешние файлы лучше вообще не делать. Или делать редко
или как-то по другому. Явно это не сильная сторона такой системы.

Как clickhouse использует ОЗУ при обработке запроса?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт