Все сервисы Хабра

Сообщество IT-специалистов

Ответы на любые вопросы об IT

Профессиональное развитие в IT

Удаленная работа для IT-специалистов

Войти на сайт
  • Все вопросы
  • Все теги
  • Пользователи

Хабр Q&A — вопросы и ответы для IT-специалистов

Получайте ответы на вопросы по любой теме из области IT от специалистов в этой теме.

Узнать больше
другие проекты хабра
  • Хабр
  • Карьера
  • Фриланс
Задать вопрос
denyWhite

Денис Белов

  • 2
    вклад
  • 0
    вопросов
  • 3
    ответа
  • 67%
    решений
Ответы
  • Информация
  • Ответы
  • Вопросы
  • Комментарии
  • Подписки
  • Нравится
  • Какой язык стоит использовать для создания юзербота в Телеграм?

    denyWhite
    Денис Белов @denyWhite
    Если не Python, то Go.

    Вот годная библиотека https://github.com/go-telegram-bot-api/telegram-bot-api
    Ответ написан более года назад
    1 комментарий
    1 комментарий
  • Правильное создание таблицы в clickhouse?

    denyWhite
    Денис Белов @denyWhite
    Движок SummingMergeTree при слиянии кусков данных с одинаковым ключом сортировки заменяет на одну, которая хранит только суммы значений из столбцов с цифровым типом данных.

    CREATE TABLE IF NOT EXISTS hits (
            event_date Date DEFAULT toDate(now()),
            page_id Int32,
            country FixedString(2),
            is_private Int8,
            views Int32,
            rating Int32,
            rating_amount Int32
        )
        engine = SummingMergeTree PARTITION BY toYYYYMM(event_date)
            ORDER BY (event_date, page_id, country, is_private)
            SETTINGS index_granularity = 8192;


    В этом случае при слиянии кусков, поля views, rating, rating_amount будут суммироваться.
    Ответ написан более года назад
    Комментировать
    Комментировать
  • Как в clickhouse игнорировать или заменять повторяющиеся данные?

    denyWhite
    Денис Белов @denyWhite
    Из документации ClickHouse
    Дедупликация данных производится лишь во время слияний. Слияние происходят в фоне в неизвестный момент времени, на который вы не можете ориентироваться. Некоторая часть данных может остаться необработанной. Хотя вы можете вызвать внеочередное слияние с помощью запроса OPTIMIZE, на это не стоит рассчитывать, так как запрос OPTIMIZE приводит к чтению и записи большого объёма данных.

    Таким образом, ReplacingMergeTree подходит для фоновой чистки дублирующихся данных в целях экономии места, но не даёт гарантии отсутствия дубликатов.


    В запросе делайте группировку по ключу сортировки, если важно получать данные без дубликатов.
    Ответ написан более года назад
    1 комментарий
    1 комментарий
Оценили как «Нравится»
Самые активные сегодня
  • pindschik
    pindschik
    • 5 ответов
    • 0 вопросов
  • yarkov
    Алексей Ярков
    • 5 ответов
    • 0 вопросов
  • saboteur_kiev
    Saboteur
    • 5 ответов
    • 0 вопросов
  • Drno
    • 5 ответов
    • 0 вопросов
  • CityCat4
    CityCat4
    • 5 ответов
    • 0 вопросов
  • seoforfood
    Станислав Шарапов
    • 4 ответа
    • 0 вопросов
  • © Habr
  • О сервисе
  • Правила
  • Обратная связь
  • Блог

Войдите на сайт

Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации