Поиск похожих данных в Mysql?

Question

Айжарык @aizhar777

MySQL
Sphinx

Поиск похожих данных в Mysql?

Добрый вечер!
Пытаюсь найти, более подходящий способ поиска похожих анкет.
У каждого пользователя есть своя анкета,
В таблице есть только 4 тестового поля
это ФИО и коротко о себе,
и остальные поля int от 0 до 3, до 2 и либо 0 либо 1,
поля enum('N','Y')
и ретинг анкеты(не показывается и рассчитывается внутри сайта) от -1000 до 1000,
То есть:
Table:

name | lastname | about | location | col1 | col2 | col3 | col4 и.т.д.
------------------------------------------------------------------------
вася | пупкин | text | loc_id | 0 | 1 | 3 | 0 и.т.д.

так же могу вытащить некоторое кол-во анкет которые нравятся пользователю.

Первыми мыслями было, брать самую популярную анкету по location и на ее основе производить выборку. Потом мне показалось это не очень хорошей идеей, я начал изучать Sphinx и понял что с ним нужно попрактиковаться как минимум несколько дней что бы нормально им пользоватьсья, да и по началу сил Mysql должно хватить.
Сейчас когда писал вопрос пришла мысль, что возможно в Mysql есть возможность усреднить результаты поиска исключив из результата менее похожие и оставляя похожие (друг на друга)? Или может я не туда копаю?
Помогите советом?
И стоит ли оказываться от Sphinx?

Вопрос задан более трёх лет назад
328 просмотров

3 комментария

Подписаться 1 Оценить 3 комментария

Айжарык @aizhar777 Автор вопроса

RU: Спасибо за совет, год рождения уже есть, думал что бы хранить гороскоп в таблице, сейчас узнаю его при передачи данных view, в любом случае спасибо, буду пересматривать структуру таблиц

Написано более трёх лет назад
Айжарык @aizhar777 Автор вопроса

RU: Сейчас выдачи похожих анкет нету, Ну я имел ввиду что его ищу, все эти int в таблице уже как бы могут многое сказать, например 0 = живет один, 1= в своей кв и.т.д . Тоже думал реализовать интересы, но отложил так как cтруктура базы реляционная больших проблем не составит

Написано более трёх лет назад
Айжарык @aizhar777 Автор вопроса

Более подходящию для данной структуры данных в таблице

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 135 просмотров
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 118 просмотров
1

ответ
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 193 просмотра
1

ответ
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 365 просмотров
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 250 просмотров
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 219 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 226 просмотров
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 320 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 169 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 225 просмотров
1

ответ
Показать ещё Загружается…

RU: Спасибо за совет, год рождения уже есть, думал что бы хранить гороскоп в таблице, сейчас узнаю его при передачи данных view, в любом случае спасибо, буду пересматривать структуру таблиц
RU: Сейчас выдачи похожих анкет нету, Ну я имел ввиду что его ищу, все эти int в таблице уже как бы могут многое сказать, например 0 = живет один, 1= в своей кв и.т.д . Тоже думал реализовать интересы, но отложил так как cтруктура базы реляционная больших проблем не составит
Более подходящию для данной структуры данных в таблице

Answer 1 · 2015-01-01 00:19:14

Данная проблема называется "k-nearest neighbors", и существует очень много способов ее решения.

В целом они все сводятся к этому:

Сначала нужно определить функцию расстояния для элементов из таблицы (т.е. юзеров). Это может быть как Эвклидово расстояние, так и любое другое (например, cosine или jaccard для слов из описания)
Затем для каждого из юзеров находим N самых близких на основе этой функции
Сравнивать всех пользователей со всеми - задача затратная, поэтому часто используются индексы для ускорения этого процесса. На уровне БД это может быть R-tree или quad-tree, а на уровне приложения - Locality Sensitive Hashing.

Поиск похожих данных в Mysql?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт