Meliborn:
mysql vs sphinx - дело не в скорости, а в качестве поиска
Томита - инструмент для разбора есстественного языка, поиск по тому что томита даст тебе нужно будет делать самому. И яндекс не дает исходников к нему. так что фраза "нет реализации под нужный язык" вообще непонятна. Если что, то Томита предназначена для разбора русского
"Думаю может делать лемматизцию и для каждой записи, по которой будет идти поиск, генерировать индекс на основе колонок, по которым будет поиск" - что никак не приблизит тебя к тому, что нужно делать natural language processing
hrvasiliy: для полного прояснения ситуации лучше поискать материал по теории баз данных = неизучение данного материала на ранних етапах обучения программингу может привести к проблемам в будущем
"Я сомневаюсь, что я на пути к денормализации"
"4 типа транспорта - это 4 таблицы"
ага
"все товары хранятся в одной таблице?" в общем случае - да
"В любом случае все делится на категории, у которых разные параметры. " - нет
"Взять юлмарт" - магазины с большой аудиторией иногда оптимизируются с помощью денормализации
"вряд ли" - без инсайда не стоит придумывать