Для себя хочу написать удобный поисковый сервер для загруженных в него документов.
Общий размер всех документов не превышает 10ГБ.
Документы в DOC, XLS, DOCX, XLSX, PDF(текстовой) и другие популярные текстовые форматы
Знаю что у яндекса есть подобный продукт, но он невероятно глючный и постоянно крошится.
1. C++ подойдёт для такого сервера?
2. В чём лучше хранить текст файлов?
3. Что нужно прочитать, что бы правильно сделать индексацию текста?
4. Ваши рекомендации.