Как организовать хранение ключевых слов и их поиск в тексте?
Задача примерно следующая - поступает нам заявка на какое-нибудь направление, допустим
"Хочу в турцию" или "мне нужна турция" ну и вариации возможные.
Нужно попытаться определить что за направление указано в тексте.
У меня пока идея следующая. Создать таблицу направлений типа "id, name, keywords" где хранить данные в виде
1,Турция, "турцию,турция,турции,турц"
И при проверке текста брать каждое направление и через strpos проверять по очереди есть ли ключевые слова в тексте.
Предположительно так должно работать, с вариациями ключевых слов поработать конечно придется, но вот думаю что решение топорное какое-то получается. список направлений и ключевых хоть и не очень большой будет, но все же.
Может быть есть какое-то более изящное и правильное решение?
Берём запрос, выкидываем короткие слова (короче трёх символов), выкидываем известные ненужные (просто, какбе, пожалуйста, козлы, скорее, типа), оставшиеся прогоняем через стеммер и оставляем только существительные, приводим к нормальной форме и ищем.
Леонид Сысолетин: не могли бы вы единственное подсказать как в centos ей воспользоваться) на сервер ее хочу установить, думал достаточно будет в папку положить. из репозитория только устанавливал пакеты, мало опыта.
Федор: Дык а чего там? Качаем нужный архив, распаковываем, это - один бинарник. Кладём в папочку, к которой есть доступ у сервера - и exec('./mystem bla-bla-bla')