Какая NoSQL более производительна: MongoDB или Cassandra?
Выбираю себе максимально легковесную БД для хранения большого количества данных(например хранить текст 50 000 документов по 300 кб каждый), что бы она могла стабильно и без особых тормозов работать не только на hi-end пк, а как минимум на пк с 4гб ОЗУ и подобного уровня прочими компонентами.
Итого выбор пал между MongoDB И Cassandra, как между самыми(на мой взгляд, поправьте если это не так) производительными вариантами.
Задачи: Поиск по документам(найти в файле N-текст и вывести все файлы где он найден и т.д.), замена текста в этих самых файлах и может ещё несколько, но также связанные с обработкой текста
Но я не знаю в чём особенности поведения каждой:
1. Какая БД из них более легковесна и производительна при таких объемах данных?
Монга на старте аллоцирует половину свободной памяти, и это практически не настраивается. Так что явно не лучший вариант для "4гб ОЗУ"
Быстрая БД понятие относительное. Одна будет быстрее писать, другая быстрее читать. Одна будет быстрее работать с малыми порциями данных, даже если они будут приходить очень часто, другой предпочтительно для производительности работать с большими объемами за раз, но реже.
Евгений Ромашкан, Только в интернете нашёл информацию насчёт них и исходя из этого сделал выбор. Вот парочка, хоть и на англ:
Бенчмарк: https://www.datastax.com/products/compare/nosql-pe...
Статья сравнение: https://logz.io/blog/nosql-database-comparison/ Дмитрий Беляев, Спасибо за информацию.
Под быстрой БД в моём случае я понимаю ту, которая может максимально быстро находить N-документы с необходимым X-текстом, где Х-введённая юзером фраза и выводить их на экран. Остальное ниже в приоритете, но скорость "замены найденного текста" тоже важна
Kizzeon, Может мне вообще больше подходит реляционная БД, но я не пользовался большинством из них. Кроме "создать поле в phpMyAdmin и управлять им из CMS" я никак не работал с БД, хотя и готов обучатся
Kizzeon, с полнотекстовым поиском вроде как очень быстро ElasticSearch работает, но не уверен, что она самая быстрая и оптимальная для других условий.
А вообще, для условий "БД на компе у обычного юзера" - SQLite обычно топ, так как не требует дополнительной инфраструктуры в виде установленной СУБД