Ответы пользователя lega по тегу «Базы данных»

Задать вопрос

Ответы пользователя по тегу Базы данных

База данных для записи 1.5М записей/с?

lega @lega

Используйте хеш таблицу в памяти. Если нужна сортировка тогда avltree.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как сделать двустороннее реагирование на изменение данных в БД MongoDB (AngularJS)?

lega @lega

Через oplog - это грязный хак.
У вас есть код который пишет в базу, вот пусть он и "оповещает" об изменениях, с доставкой через websocket.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Лучшая база данных для высоконагруженного проекта?

lega @lega

Сохраните данные в 1000 файлов и раздавайте через nginx (или как кеш).

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
MongoDB выборка на шардинге, ищет параллельно по всем нодам?

lega @lega

Они размазываются по всем нодам по id

Зачем по id?

Сделайте уникальный индекс (шардинг) по username, тогда запрос будет к конкретному шарду в котором это имя (есть или должно быть). И при добавлении не нужно будет проверять, т.к. дубль имени не запишется (будет ошибка).

Ответ написан более трёх лет назад

Комментировать

Комментировать
MongoDB: как осуществить поиск?
lega @lega
Используйте словарь вместо массива:
{ data1: {key1: value1, key2: value2}, data2: {key2: value2, key2: value2} }

db.col.update(match, {$set: {'data2.key2': value2}})

PS: если бы вы привели что у вас там хранится и что нужно получать, можно было бы лучше подобрать структуру и запросы.

Ответ написан более трёх лет назад

4 комментария
4 комментария
Где найти большие структурированные данные?

lega @lega

https://www.freebase.com/

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как реализовать пересечение двух множеств (много данных)?

lega @lega

Можно попробовать sphinxsearch (или эластик), он ищет с сортировкой по релевантности, т.е. сверху будут наибольшие пересечения ключей, но он может сильно задуматься если там много пересечений.
Либо попробовать сделать обратный индекс с сортировпнными сайтами, за один проход вычислять пересечение по сайту, все сайты раскидать по нодам, результат скидывать в БД для сортировки.

Сколько в среднем ключей у сайта?

Ответ написан более трёх лет назад

7 комментариев

7 комментариев
Оптимальный способ хранения небольших растровых изображений. Объем > 400 Gb. БД или FS?

lega @lega

Можно взять MongoDB, плюсы такие:
* При большой нагрузке или объеме можно будет данные разлить по шардингу. Это так же может помочь сэкономить, например можно вместо одного сервера DO за $480 можно взять 24 минимальных виртуалки за $120, + будет больше ядер и трафика.
* Можно хранить доп. параметры, теги, (атрибутивную информацию) и прочее вместе с файлом, таким образом тайл и все с ним связанное будет в одном блоке данных, в отличие от применения *sql. Это хорошо для производительности, т.к. меньше индексов и меньше обращений к ФС.
* Можно сделать доп. индексы
* Можно использовать гео-индексы, выборка тайлов по радиусу и т.п.
* Так же для данной задачи (вполне возможно) достаточно атомарных комитов, они лучше по производительности чем полноценные транзакции.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Хранение данных: обычный объект или ключ как значение?

lega @lega

Обычно удобнее что-б ключи были фиксированные - не нужно гадать/перебирать, что-б получить значение.
Проблема может возникнуть если вы в будущем добавите ещё по стране в каждый элемент или т.п.
Памяти это (почти) не сэкономит. Проблем с хранением не возникнет.

Если расширять не планируется и хорошо подходит под текущие запросы, то никаких проблем.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как осуществить удаленный доступ к MongoDB?

lega @lega

Ещё можно сделать ssh тунель в одну команду, я так иногда автоматические дампы с удаленного сервера делаю.
Так же можно настроить openvpn или т.п.
Эти способы лучше по безопасности и удобнее если у клиента динамический ip.

PS: В mongodb не рекомендуют использовать авторизацию по логину+паролю.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какой принцип использовать для хранения данных в MongoDB?

lega @lega

В будущем потребуется хранить и редактировать огромные объёмы информации

На счет объемов, у вас наверняка для книг будут картинки (постеры), дак вот они могут занимать большую часть хранилища (+ большую часть расхода), я работал с одним книжным сайтом - на каждую книгу с отзывами (~4kb) есть несколько картинок (~120kb), т.е. ~97% (от книг) это картинки.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Какой принцип использовать для хранения данных в MongoDB?

lega @lega

Зависит от использования, например если отзывы будут выводится на странице книги и больше с ними ничего не будет происходить, то их удобно сделать вложенными, + экономия на запросах, одним запросом будет доставаться книга и отзывы.
А вот авторов лучше (можно) в отдельную коллекцию, т.к. их данные будут изменятся (имя, фотка, описание, теги?), Хотя если эти изменения очень редкие или вовсе нет, то можно сделать вложенными, при этом будет больший расход диска, но экономия на запросах.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Самые активные сегодня

rPman
- 5 ответов
- 0 вопросов
Алексей Федяев
- 5 ответов
- 0 вопросов
Сергей Соловьев
- 4 ответа
- 0 вопросов
Tm
- 2 ответа
- 2 вопроса
LAG_LAGbI4
- 3 ответа
- 1 вопрос
Анатолий Куликов
- 3 ответа
- 0 вопросов

Войдите на сайт