Комментарии пользователя kazmiruk — Хабр Q&A

Задать вопрос

Комментарии

Как организовать отношение NoSQL хранилищ на сервере?

kazmiruk @kazmiruk Автор вопроса

Накладные расходы будут заключатся в том, что ключом будет текстовое поле (чтобы был аналог key-value). Пусть даже мы возьмем хеш-ключ с высокой селективностью. Получим бинарное дерево. А поиск в бинарном дереве имеет скорость O(log2(N)), что в принципе очень хорошо. Пусть сюда же будет хранение кеша (что несомненно увеличивает скорость обработки запроса), но не знаю, как в посгрес, но мускуль обрабатывает запрос прежде чем отдать ответ из кеша, чтобы понять что ответ не изменился. Отсюда следующие накладные расходы: мы храним таблицу на жестком диске, мы храним индекс, мы храним кеш, мы делаем запрос к жесткому диску, если нет в кеше, мы каждый раз обрабатываем sql-запрос, чтобы понять какие данные хотим получить. Для хеш-таблицы (именно такие key-value я рассматриваю) мы имеем скорость выборки O(1), все данные всегда в памяти + если нам необходимо, то сбрасываем дампы на диск. Конечно, есть еще memory хранилища в РСУБД, но я все таки предпочту использовать специализированное решение, чем делать свой велосепед. В целом, я думаю можно настоить мускуль\постгрес на приемлемые скорости работы, но все таки это решение похоже на забивание гвоздей телескопом.

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

В принципе есть возможность все уместить в память для кеша. Если перестанет умещаться, то вертикальное масштабирование, а потом горизонтальное. А что Вы скажете про монго? Вроде как гибридное решение он вполне не плох. Часто используемые данные в памяти, остальные на диске + автошардинг из коробки (на прошлом проекте использовали самописный шардинг для mysql — это ад. Все дико неудобно, постоянно надо думать о том на какой шарде что находится. в монго тоже не стоит забывать, но для простых случаев даже не обязательно думать о том, что у нас несколько серверов)

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Ну и скорость работы у него — одна из самых высоких. По некоторым бенчмаркам его обходит только мемкеш (и то не по всем, поэтому сомневаюсь в их честности)

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Ну сам еще не до конца определился, но вроде все сводится к тому, что идеальное хранилище для сессий — редис. Подводных камней по отзывам сильно не заметно + к концу года обещают первый стейбл кластера, что позволит не писать свою обертку с использованием консистивного хеша, а заюзать все из коробки для горизонтального масштабирования и высокой доступности.

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Беркли ссудя по бенчмаркам мне вообще не подойдет. Какой-то медленный он.

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Интересное решение, но уж слишком много нужно писать для его запуска, нет времени, чтобы разобраться досконально, а не разобравшись можно написать фигню ) Но спасибо )

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Наверное все таки беспокоит. Люблю все контролировать )

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Токио судя по бенчмаркам и отзывам вообще не рассматриваю. Уж очень много постов о том, что он кривой при больших нагрузках. если отзывов много, значит так и есть.

Написано более трёх лет назад
Как организовать отношение NoSQL хранилищ на сервере?

kazmiruk @kazmiruk Автор вопроса

MySQL или PostgreSQL для ключ значения? Накладные расходы, кажется, будут сильно значительными. Или Вы знаете какой-то секрет?

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Я просто исходил из того, что моного шардится и находится на другом сервере. По этому пункту они в с кешом в равных условиях. Но если кешу требуется O(1) как хеш таблице, то mongo явно больше, так как там используется b-tree (получается o(logN), поравьте если я ошибаюсь), а кеширования запросов вроде нет. Вот отсюда и возник вопрос кеширования результатов запросов к монго.

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

А что сделает редис, если ему запретить писать на диск при нехватке памяти? Начнет вытеснять старые данные?

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Хм. А если таких запросов будет миллион? Каждый раз считать и тратить на это 1 мс? Или один раз посчитать и кинуть в кеш, а потом брать оттуда. Или Mongo использует что-то для кеширования результатов?

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

www.percona.com/live/mysql-conference-2012/sessions/caching-memcached-redis Вот кстати очень интересные результаты. Мемкешд медленней, но стабильней, а редис большую часть времени был быстрее, но периодами проседал ниже мемкешда. Правда потом был тест разных версий редиса. Там вроде ситуация улучшилась

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

А есть ли какие-то бенчмарки надежные по скорости? Просто облазил все и везде результаты разные. Очень смущает то, что мемкешд простой как веник, но медленней, чем redis, у которого функциональных возможностей на порядок больше. Если действительно так, то именно такое решение и буду использовать.

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Ну не прямых селектов. Аггрегаций. На сколько я понимаю быстрее залезть в хештаблицу и взять значение, чем вызывать мап\редьюс. Или я не прав? Все таки монго хоть и хранит все данные в памяти, но алгоритм их выборки не может быть быстрее O(1) (насколько помню из универского курса такой для хеш таблиц)

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Да и если честно какие-то нереальные цифры… 1 000 000 операций в секунду. Можно где-то на бенчмарки посмотреть? Особенно интересует по чтению.

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Ну хотя бы объясните почему Вы его хвалите. Если первый пункт мне понятен и я в принципе согласен, то второй — не понятно совсем. Ладно редис, но почему монго? Разве это будет эффективно для кеша данных? Вы же когда разрабатывали такую архитектуру из чего-то исходили, а не просто сказали «А здесь мы будем использовать редис. потому что так прикольно». Вот именно эти рассуждения мне и интересны.

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

С Mongo уже определился. Hbase как бы не привлекал (не хочу начать сравнивать и расстраиваться )), но на монго уже часть проекта написано ) переделывать пока не хочется

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Но о протухании данных надо будет заботиться самому, так как там, на сколько я знаю, нет механизма инвалидации по времени? Или я не прав? В итоге, при хранении сессии мне нужно будет заботиться о том, чтобы чистить от старых сессий, пользователи которых уже не заходят?

Написано более трёх лет назад
Какое key-value хранилище лучше?

kazmiruk @kazmiruk Автор вопроса

Нет, не картинки и текст ) Все таки склоняюсь к связке как описал выше в ответе.

Написано более трёх лет назад

Самые активные сегодня

Илья Рупасов
- 7 ответов
- 0 вопросов
Valdemar Smörman
- 2 ответа
- 0 вопросов
vylek
- 2 ответа
- 0 вопросов
Михаил Лялин
- 2 ответа
- 0 вопросов
Василий Банников
- 2 ответа
- 0 вопросов
roskomnazar
- 0 ответов
- 1 вопрос