Meliborn:
mysql vs sphinx - дело не в скорости, а в качестве поиска
Томита - инструмент для разбора есстественного языка, поиск по тому что томита даст тебе нужно будет делать самому. И яндекс не дает исходников к нему. так что фраза "нет реализации под нужный язык" вообще непонятна. Если что, то Томита предназначена для разбора русского
"Думаю может делать лемматизцию и для каждой записи, по которой будет идти поиск, генерировать индекс на основе колонок, по которым будет поиск" - что никак не приблизит тебя к тому, что нужно делать natural language processing
hrvasiliy: для полного прояснения ситуации лучше поискать материал по теории баз данных = неизучение данного материала на ранних етапах обучения программингу может привести к проблемам в будущем