Есть блог на Yii. Для каждого поста задан набор тегов, ключевых слов. Хранятся в виде tag1, tag2, tag3,… При этом некоторые теги встречаются в разных словоформах, т.е. в разных падежах, числах.
Каким образом грамотно и с наименьшими нагрузками для конкретного поста найти похожие посты, основываясь на совпадении наибольшего количества тегов? Желательно, с возможностью задавать минимальный % совпадений.
Я бы попробывал пройтись по тегам стеммером портера
что бы выделить «одинаковые теги», ну а дальше дело техники.
Ну и да. Как подсказал hell0w0rd, теги всё же нужно вынести в отдельную таблицу.