используя nosql-базы
Шаг 1. Убрать из лексикона термин "NoSQL". Хотя бы временно.
как наиболее правильно хранить пользовательские данные, комментарии, лайки, медиа-данные.
Шаг 2. Выписать или запомнить три важнейших свойства любой СУБД:
- модель данных: что является элементом данных, что является коллекцией элементов, чего в СУБД должно быть постоянное количество, есть ли схема и в каком виде, как обеспечиваются связи между элементами данных на уровне модели;
Пример: MongoDB, элемент данных - документ, описывается как JSON-документ с некоторыми специфичными для Монги расширениями. Коллекция элементов - коллекция документов. Количество коллекций более-менее постоянное, количество документов растёт.
- ограничения и гарантии физической реализации модели данных - какие операции какую сложность имеют, какую цену (в плане пространства на устройстве хранения и процессорного времени) имеет каждая используемая структура данных или алгоритм; какие параметры как будут расти во время эксплуатации БД.
Пример: графовые БД, имеющие "настоящий" графовый движок, т.е. такой, который хранит физические ссылки из одной вершины на другую, гарантируют константное время выборки связанных вершин. В связи с этим их выгодно использовать для сильносвязанных нечасто изменяющихся данных (графы друзей в социалочках и т.п.)
- инструментарий логического и физического уровня: по сути это предыдущие пункты более подробно - какие структуры данных доступны, в частности какие есть индексы, какие способы выборки/фильтрации/сортировки присутствуют; для чего гарантируется транзакционность (особо важный вопрос); где находится база в CAP диаграмме; какие есть средства логического уровня, например представления (view);
Вспомните любую социальную сеть, где над каждым постом есть куча комментариев, лайков, репостов
Шаг 3. Научиться ставить задачу с точки зрения обрабатываемых данных:
- какие данные будут иметь постоянный объем или расти медленно, а какие - быстро и постоянно;
- какие будут запросы к данным, что будет выбираться как есть, а что нужно будет дополнительно агрегировать;
- какие запросы будут плановые, а какие придётся выполнять внепланово;
- какой нужен уровень доступности, какова ценность хранящихся данных и цена простоя.
Шаг 4. Ознакамливаться с СУБД здесь:
nosql-database.org и выбирать нужную с учётом:
- вашей задачи;
- порога вхождения;
- наличия доступных специалистов.