Как сделать выборку по максимальному совпадению полей?

Question

Юрий Татаркин @tomasoyer

web разработчик

PHP
MySQL

Как сделать выборку по максимальному совпадению полей?

Есть задумка выводить в блок похожих, товары по принципу наибольшего совпадения по характеристикам.

С точки зрения mysql имеются 2 таблицы, в первой лежат "товары" во второй характеристики в виде

id, id_tovar, name, value

Где:
id - уникальный id записи
id_tovar - id записи из таблицы товара
name - Наименование характеристики (например длинна, цвет и т.п.)
value - значение характеристики (например 1метр, красный и т.п.)

Характеристик у товара может быть произвольное количество. В среднем от 5 до 15. По сути требуется отсортировать товары по максимальному совпадению харрактеристик. Сначала идут с полным совпадением, потом совпадающие по -1 свойству и так далее.

На просторах интернета был обнаружен совет:

Вам помогут CROS JOIN и функция IF(). Суть такова: вы получаете декартово произведение двух таблиц, для каждой строки вычисляете количество совпадающих полей и сортируете по количеству совпадений.
select p2.id,
       if(p1.width = p2.width, 1, 0) +
       if(p1.height = p2.height, 1, 0) +
       if(p1.color = p2.color, 1, 0) +
       if(p1.education = p2.education, 1, 0) as matching_fields
from profile1 p1
cross join profile2 p2
where p1.id = 6
order by matching_fields desc;
sqlfiddle.com/#!2/417c25c/9

Подскажите, где посмотреть реализации подобного или почитать теорию по решению этой задачи.

Вопрос задан более трёх лет назад
493 просмотра

1 комментарий

Подписаться 3 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как исправить ошибки шаблона WP?
- 1 подписчик
- 14 июл.
- 100 просмотров
1

ответ
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 1 подписчик
- 17 июн.
- 206 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 460 просмотров
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 250 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 192 просмотра
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 154 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2470 просмотров
8

ответов
MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 131 просмотр
1

ответ
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 345 просмотров
6

ответов
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 107 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2015-06-21 23:04:59

А что вам нужно посмотреть-то? В запросе принцип работы показан же, если есть совпадение, то увеличиваем вес на 1 иначе на 0 и в конечном счете сортируем по сумме веса.

Если хотите про JOIN-ы прочесть, то - potapov.com.ua/library/21 , или еще лучше:

Answer 2 · 2015-06-21 23:02:42

В таких вещах я бы сначала подумал что я экономлю - место, запросы или процессор.
Возможно идея плохая, но я бы заранее считал похожесть параметров в процентах например (или каком-то другом обобщённом показателе) и хранил бы это значение в отдельном поле.

Ещё я бы заранее определил что такое похожие товары - какие критерии похожести? (цвет, например, на мой взгляд в этом параметре не должен участвовать). Можно отдать выбор посетителю типа: найти похожие телевизоры по размеру или найти похожие по функционалу.

Можно запрашивать все параметры товара и если 80% параметров или больше одинаковы - товары похожи.
Если параметры числовые, можно для телевизора с диагональю 100 см. искать в базе телевизоры с диагональю от 95 до 105 см, т.е. +- 10%

Есть ещё такая идея: каждому товару заранее присвоить похожие и при выводе на экран просто выводить из этого поля. Похожие товары пересчитывать один раз при добавлении, обновлении ассортимента или раз в неделю по крону. В этом случае хорошо то что системных ресурсов и запросов на такой скрипт можно не жалеть.

Как сделать выборку по максимальному совпадению полей?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт