Как clickhouse использует ОЗУ при обработке запроса?

Question

Ryabos @Ryabos

ClickHouse

Как clickhouse использует ОЗУ при обработке запроса?

На обработку запроса

select * from my_table limit 10000000 INTO OUTFILE 'test1';

ушло 373 Мб ОЗУ. А если ещё сджойнить маленькую таблицу, то на обработку 10М записей уходит 410 Мб. Если запросить 30 миллионов записей из пересечения таблиц, на обработку уйдёт 430 Мб.

Почему зависимость между запрашиваемым объёмом данных и потребляемой памятью нелинейна? Засчёт чего это достигается? Предположения у меня и у самого есть, но точного ответа я нигде не нашёл, а в исходниках не разобрался.

Вопрос задан более года назад
89 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Logstash

+1 ещё

Средний
Возможно ли сделать систему логирования из ClickHouse, Logstash и Grafana?
- 1 подписчик
- 26 янв.
- 138 просмотров
3

ответа
Docker

+2 ещё

Средний
Почему не могу подключиться к Clickhouse из интерфейса PHPStorm?
- 1 подписчик
- 21 нояб. 2024
- 127 просмотров
1

ответ
Docker

+3 ещё

Средний
Ошибка с неизвестной таймзоной?
- 1 подписчик
- 19 нояб. 2024
- 260 просмотров
3

ответа
WordPress

+2 ещё

Простой
Как перенаправить все select запросы из wp mysql в clickhouse?
- 1 подписчик
- 16 нояб. 2024
- 139 просмотров
0

ответов
PHP

+4 ещё

Средний
Как организовать журнал событий в распределённой системе правильно?
- 2 подписчика
- 10 сент. 2024
- 252 просмотра
2

ответа
ClickHouse

Простой
Memory limit в Clickhouse. Как бороться?
- 1 подписчик
- 17 июн. 2024
- 123 просмотра
0

ответов
ClickHouse

Средний
Как работать с ReplacingMergeTree в Clickhouse?
- 1 подписчик
- 16 июн. 2024
- 67 просмотров
2

ответа
ClickHouse

Простой
Как в ClickHouse выбрать данные с БД учитывая тайм зону?
- 2 подписчика
- более года назад
- 190 просмотров
1

ответ
PHP

+2 ещё

Простой
Как ускорить выполнение запроса?
- 1 подписчик
- более года назад
- 200 просмотров
0

ответов
PHP

+2 ещё

Простой
Как решить проблему с подключением к Clickhouse из php?
- 2 подписчика
- более года назад
- 749 просмотров
1

ответ
Показать ещё Загружается…

Маркетинговый аналитик Middle+/Senior в аналитический стартап по маркетплейсам

ТОРГСТАТ

от 150 000 до 250 000 ₽

Database Administrator

Wanted.

До 5 000 $

С# Backend developer

Wanted.

До 200 000 ₽

Answer 1 · 2023-11-29 19:22:36

Кликхаус относится к классу column-oriented dbms. Это означает что data-row как таковой отсуствует.
Строк нет. Но есть столбцы которые хранятся физически консолидировано. И когда ты указываешь
SELECT * то это заставляет кликхаус сделать гораздо больше действий чем надо на самом деле. В
силу этой колоночатой организации. Сами строки - виртуальны и чтобы их сформировать кликхаус
должен вычитать физических данных гораздо больше чем реляционка. Столбец - больше чем ячейка.

Чтоб такая система работала эффективно ты должен ее грузить аналитическими запросами типа

select avg(amount) from my_table;
Тогда кликхаус сработает быстрее чем Oracle или PG. В силу этой особенности формата.

А то что ты делаешь - экспорт во внешние файлы лучше вообще не делать. Или делать редко
или как-то по другому. Явно это не сильная сторона такой системы.

Как clickhouse использует ОЗУ при обработке запроса?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт