Стоит задача сделать небольшой проект для академических целей.
Суть проекта — специализированный счетчик посещаемости. В принципе подошли бы GA / ЯМ, но оттуда не вытащить «сырые данные», а именно «посетитель X — открытие страницы Y — timestamp» (если я не прав — буду благодарен за исправление). Над собранными данными планируется применять алгоритмы для графов (остовное дерево, кратчайшие пути и т.д.)
Пока склоняюсь к Node.js + mongo (по поводу базы наибольшие сомнения).
Использовать буду на паре сайтов с суммарной посещалкой около 5 000 уников в сутки.
В яндекс.метрике есть вебвизор, в котором логируются все действия конкретного посетителя, в том числе и последовательность переходов. Посмотрите, если ли там API что бы вытащить эти данные.
Самое простое, но далеко не самое точное, это парсить дефолтные access логи. В данном случае может помочь тот же nginx с модулем HttpUseridModule, который уже идентифицирует конкретного пользователя, а дальше парсинг этих логов.
Ну а для внешнего решения да, можно использовать node.js, здесь уже важна асинхронность работы бд, в данном случае тот же mysql вам уже не подойдет в принципе. Монго же должна подойти, можно еще попробовать редис, но сбрасывать данные всё же куда-то рано или поздно придется. С другой стороны если вас сильно не пугает потеря информации к примеру за несколько секунд или минут, то можно накапливать данные в node.js и скидывать в бд периодически.