Как сделать индексацию контента для дальнейшего поиска по ней?

Доброго времени суток.
Недавно прочитал статью на хабре о том, как сделать поиск на php с учетом морфологии. И там был пункт про создание индексации контента сайта, для того что бы поиск осуществлять именно по этой таблице, а не по самим статьям.
Еще говорилось что использовать LIKE не очень хорошая затея, если статей или продуктов очень много. Что это грузит сервер.
Хотелось бы понять общие принципы как сделать такую индексацию? Это нужно перебирать каждое слово продукта, отбрасывать ненужные предлоги, союзы и записывать его в таблицу индексации и присваивать каждой строке ID продукта?

Знаю что есть Sphinx и ElasticSearch, но хотелось бы разобраться самому как это все работает, в целях, так сказать, самообразования :)
  • Вопрос задан
  • 131 просмотр
Пригласить эксперта
Ответы на вопрос 1
al_gon
@al_gon
Основная структура практически во всех (99%) современных поисковиках это инвертированный индекс
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы