Как на php написать нейронную сеть для сопоставления товаров из прайсов?
Есть несколько прайсов.
Там могут быть разные названия одного товара на сайте.
Нужно, чтобы автоматически соотносились товары на сайте и товары из прайсов.
Названия могут быть такого рода:
книга о php (русский язык)
книга о php (английский язык)
(русский язык) "книга о php" издательство БББ
и т.п..
Т.е. названия могут иметь разные вариации.
С чего бы начать построение и какие варианты есть? :)
Сейчас сопоставление происходит по принципу similar string и других условий выборки, но дается не совсем точный результат. Хотелось бы увеличить точность сопоставления товаров.
Спасибо.
levenstein не подходит вообще, он часто кардинально не подходящие товары отображает как похожие. Эту функцию отсеяли вместе с использованием метафонов. Да и сторонние сервисы точно не нужны