Ответы пользователя по тегу Apache Cassandra
  • Чем формально Cassandr-овская модель данных отличается от MongoDB?

    @lega
    В монго данные (поля одного документа) хранятся "кучкой", а в касандре "строка" разорвана - поля хранятся в разных местах, таким образом в касандре легко добавлять/удалять колонки (делать миграции), так же можно получить экономию для колонок с повторяющимися данными, например колонка с true/false может быть размером в 2 элемента, даже если "строк" миллионы, но как минус - "собирать" "строку" нужно из разных мест, а это может быть медленнее чем загрузить одну "кучку" как в монге.
    По объемам, в касандре не нужно хранить имена и тип полей - экономия, зато в монге происходит сжатие кучки, в итоге экономней может быть как та так и другая бд, зависит от данных.
    Я думаю (в плане модели данных) кассандру можно поместить где-то между монгой и mysql.
    Ответ написан
    3 комментария
  • Как организовать в Linux с 10 000 000 000 (миллиардами) inodes, быстрый доступ к ним и их обработку (Линукс замена бд)?

    @lega
    Классическая фс для этого не подходит, если у вас размер данных на "хеш" небольшой, например до 100 байт, то просто сделайте большой файл на 400гб и пишите данные по индексу, при этом хеш не нужен. С нормальным ssd можно будет писать до 1М записей в сек. обычным скриптом. При этом 75% места будут "простаивать". Если хотите сэкономить места, тогда нужно использовать индекс, например заюзать leveldb или т.п.
    Ответ написан
    9 комментариев