Обучаемый поиск, как лучше реализовать?

Question

E N @nefedovgeka

Обучаемый поиск, как лучше реализовать?

Есть проект, в котором 1,5 млн товаров, у каждого товара список свойств, товарных предложений нескольких поставщиков, в общем один товар содержит довольно много семантики для нормального поиска.
Поиск сделали на основе сфинкса (стандартный полнотекст посгресса не подошёл из-за ограничения количества полей которым можно задавать разный вес), запилили кучу отраслевой логики, чтобы поиск понимал основные понятия отрасли, в общем все работает круто, во всяком случае ничего лучше по отрасли не видел.
НО он не учится! А хочется чтобы учился.
Поиск в основном служит для обработки сметных просчетов, в систему загружаются списки до 400 позиций и система по ним подбирает нужный товар, потом человек проходится по подобранным и корректирует, если система подобрала не то что нужно, вроде все хорошо, но нужно чтобы система запоминала при корректировке запрос, чтобы потом выдавать то что нужно.
Как я это вижу: сделать отдельный индекс, куда будут падать все слова из запросов и назначить в нем максимальный балл например 50, когда будет падать первый запрос, то каждому из слов будет назначаться по 1 баллу и после того как упадет 50 запросов то часть слов будет иметь 50 баллов а часть меньше, а ошибочные запросы вообще по 1 баллу, но как быть с накоплением ошибочных запросов? ведь из 1000 запросов будет уже возможно по 20 баллов у ошибочных слов.
В общем подскажите не программисту и не математику как тут быть, как лучше сделать "умный" индекс.

Вопрос задан более трёх лет назад
461 просмотр

5 комментариев

Подписаться 6 Сложный 5 комментариев

sim3x @sim3x

А на основе чего поиск будет учиться?

Кейс
Юзер ввел список из 100 позиций
Сфинкс отдал ему Х(сколько) позиций из вашей БД
Что дальше происходит?

Написано более трёх лет назад
Дмитрий Сергеев @JetMaster

> В общем подскажите не программисту и не математику как тут быть

не жалеть дублоны, поскольку каждый должен заниматься своим делом.

Написано более трёх лет назад
E N @nefedovgeka Автор вопроса

sim3x, на 100 введенных позиций сфинкс отдаст 100 ответов и человек проверит все ли верно и добавит все в корзину, на основе данных корзины и нужно учить.

Написано более трёх лет назад
E N @nefedovgeka Автор вопроса

Дмитрий Сергеев, Дублоны и не жалеются, каждый занимается своим делом, я пишу из, программист пишет код.

Написано более трёх лет назад
E N @nefedovgeka Автор вопроса

ТЗ

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Machine Learning: тариф Базовый

7 месяцев

Далее
Нетология

Инженер машинного обучения с нуля

14 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 93 просмотра
1

ответ
Elasticsearch

Простой
Как настроить workflow (n8n v2.3.5) для работы Chat->AI Anget ->Model-Elastcsearch?
- 2 подписчика
- 02 мар.
- 116 просмотров
0

ответов
Нейронные сети

+1 ещё

Простой
Какую нейронку с API и web поиском можете посоветовать?
- 1 подписчик
- 01 мар.
- 151 просмотр
1

ответ
Поисковая оптимизация

+3 ещё

Простой
Как продвинуть сайт в поиске?
- 2 подписчика
- 25 февр.
- 628 просмотров
4

ответа
Elasticsearch

Средний
Как правильно удалять старые данные из индексов elasticsearch?
- 1 подписчик
- 06 февр.
- 150 просмотров
1

ответ
Машинное обучение

Простой
Необходимо разработать модель классификации, поможете с выбором парадигмы решения задачи?
- 2 подписчика
- 22 янв.
- 135 просмотров
0

ответов
Машинное обучение

+1 ещё

Средний
Может, у кого-то есть дампы с реальными наименованиями товаров/услуг и кодами ОКПД2 для обучения NLP-модели?
- 1 подписчик
- 16 янв.
- 119 просмотров
0

ответов
Поисковые системы

Простой
Эффективны ли программы, защищающие фото и видеофайлы от систем поиска по лицу?
- 1 подписчик
- 11 янв.
- 183 просмотра
3

ответа
Машинное обучение

Простой
Можно ли получить сразу полный список чего-либо от LLM по определённому критерию?
- 1 подписчик
- 28 дек. 2025
- 119 просмотров
1

ответ
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек. 2025
- 312 просмотров
1

ответ
Показать ещё Загружается…

PHP и Node.js разработчик

TripShock Adventures

от 1 000 до 2 500 $

Golang Developer

Правое полушарие Интроверта

от 200 000 до 300 000 ₽

Системный архитектор

ГК «ЭФКО» • Москва

До 360 000 ₽

А на основе чего поиск будет учиться?

Кейс
Юзер ввел список из 100 позиций
Сфинкс отдал ему Х(сколько) позиций из вашей БД
Что дальше происходит?
> В общем подскажите не программисту и не математику как тут быть

не жалеть дублоны, поскольку каждый должен заниматься своим делом.
sim3x, на 100 введенных позиций сфинкс отдаст 100 ответов и человек проверит все ли верно и добавит все в корзину, на основе данных корзины и нужно учить.
Дмитрий Сергеев, Дублоны и не жалеются, каждый занимается своим делом, я пишу из, программист пишет код.

Answer 1 · 2019-09-10 21:44:19

Dimonchik @dimonchik2013

non progredi est regredi

Машинлернера с задачей о рюкзаке и опытом оптимизационных задач

поиск тут вообще до

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2019-09-19 11:18:51

Я бы так и делал:

Создать доп. индекс или индексы где лежат помеченные документы (запросы/продукты) но без весов на конкретые термы(слова), а скорее на фичи.
Плюс индексы где лежат помеченные документы, которые совсем не подходят.

Тоесть два класса спомогательных документов, к которым так же идет запрос, если ответ однозначный, то поиск из основного индекса не происходит.

Много не известных деталей: каков поиск сам по себе: с учётом ошибок или без, транслитерация и т.д.
Какой именно движок будет выбран, синхронизация, спомогательных индексов с основным. Но это детали.

Обучаемый поиск, как лучше реализовать?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт