В СУБД индекс - это объект какой повышает производительность в поиске по какому то полю.
Solr - я знаю, что "коллекции" - это как таблицы в субд, документы - как записи в субд, а индекс - что это? Иногда читаю, и то ли не понимаю, то ли что, но как то понимаю что индекс это аналог коллекции. Но понятно, что это не так. Кто то может пояснить что же такое индекс в Solr?
Индекс в SOLR - это аналог глоссария в книге: уникальные последовательности символов, внутри которых присутствуют ссылки на сами документы, где эти последовательности встречаются.
Это обычая таблица связей, где записи упорядочены по алфавиту и увеличению длины, образуя "плоское дерево".
Но в случае, к примеру, реляционной СУБД еще можно как то жить и без индекса (но плохо).
То в случае полнотекстового поиска Solr, SphinxSearch - без индекса вообще бессмысленно.
Если вернуться к коллекциям - некоторые виды коллекций существуют только в виде индексов.
Если же обратится к классике БД - индекс для ускорения поиска и сами данные - это разные вещи.
Индекс можно безболезненно удалять и пересоздавать (генерировать заново на основании данных).
Это будет влиять только на скорость поиска.
А вот с некоторыми видами коллекций так не получится. Для них индекс и есть те самые данные. Удалишь индекс - больше ничего и не найдешь.
Насчет БД не совсем корректно. Это вы описали некластерный индекс. Кластерный точно также означает ,что таблица в принципе существует в виде этого индекса