У всех разная реализация — зависит от архитектуры кластера, от модели данных.
В Couchbase, например, юзер пишет на JavaScript функции Map, Reduce.
В Hadoop можно писать их на Java, C++ и даже использовать сторонние исполяемые файлы.
SQL можно тоже представлять как разновидность Map.
Архитектура кластера может очень сильно менять реализацию.
И для развлечения и прикола написать на PHP документо-ориентированную базу данных.
Сколько времени зря потратите…
Лучше гуглите на тему «алгоритмы хранения и сортировки данных».