Как сделать индексацию контента для дальнейшего поиска по ней?
Доброго времени суток.
Недавно прочитал статью на хабре о том, как сделать поиск на php с учетом морфологии. И там был пункт про создание индексации контента сайта, для того что бы поиск осуществлять именно по этой таблице, а не по самим статьям.
Еще говорилось что использовать LIKE не очень хорошая затея, если статей или продуктов очень много. Что это грузит сервер.
Хотелось бы понять общие принципы как сделать такую индексацию? Это нужно перебирать каждое слово продукта, отбрасывать ненужные предлоги, союзы и записывать его в таблицу индексации и присваивать каждой строке ID продукта?
Знаю что есть Sphinx и ElasticSearch, но хотелось бы разобраться самому как это все работает, в целях, так сказать, самообразования :)