Как пополнить словарь для автоопределения категории?
Суть задачи заключается в следующем, Есть сайт и у него есть множество категорий, нужно сделать так, чтобы при загрузке товара с описанием, на его основе сайт автоматически выбирал и подставлял ему нужную категорию.
Для этого решил использовать Sphinx и для этого составил отдельную таблицу, в которой завел 3 поля (ID, BODY, SECTION_ID) в BODY хранится текст, а в SECTION_ID ссылка на категорию.
Изначально составлял базу на основе описаний уже имеющихся товаров, но так получилось, что сайт новый и товаров много только в 5 категориях из 60. По итогу получил, что автоопределение выдает чаще те категории в которых больше всего товаров.
В итоге решил что индексировать текст товаров не особо подходит и нужно как-то набивать словарь именно категорий.
Категория имеет название "Stamps -> Russian -> Russian Empire (1857-1917)". Есть какие-нибудь варианты автоматизированно набить словарь категории имея только такое название? И буду рад если кто-нибудь подскажет оптимальную настройку Sphinx для такого рода поиска (Поисковый запрос может быть длинной больше 1000 символов)
Подобные вещи делаются на основе характеристик товара т.е. "Stamps" - тип товара, Russian - страна, Russian Empire (1857-1917) - дата.
По итогу получил, что автоопределение выдает чаще те категории в которых больше всего товаров.
чтобы такого не происходило задай вес категорий больше чем у товаров, как это реализуется в Sphinx я не подскажу, могу только показать на абстрактных примерах подобного морфо поиска.