Для личного, учебного проекта хочется написать свою СУБД. Скорее всего реляционную (по большей части). Конечно, можно взять готовое решение, но неинтересно.
Хочется много теории. Готов читать про новые-модные решения, главное - про архитектуру. Жутко интересно как устроенно.
На первых порах требования такие:
- транзакции
- репликации
- хранение в файлах - свой формат, наверное
- http/socket доступ по сети ну это тупо технический аспект
Писать буду на Java. Никаких С/C++ или другого. Да, больше памяти(можно холиварить до конца 2038 года), но больше надежность. Плюс, когда свое и знаешь узкие места, то работает как часики. До чертиков восторгаюсь Hadoop, MongoDB.
Верю, что на хабре есть специалисты в области IR и БД. И как каждый специалист имеет любимую книгу по своему предмету. С каждого по книжке - и багаж знаний для построения есть.
Пока определил для себя: Managing Gigabytes: Compressing and Indexing Documents and Images.
Есть бумажная Introduction to Information Retrieval, на русском, зачитанная до дыр.