Как индексировать одна ко многим таблиц на sphinx?

Question

Марат Долотов @bemulima

ФуллСтекРазработчик

Sphinx

Как индексировать одна ко многим таблиц на sphinx?

Есть таблица одна ко многим parent и child.

parent
- id
- name
- age

child
- id
- parent_id
- name
- age

если в конфиге source написать:

source mainSourse
{
	sql_query = \
        SELECT row_number() OVER () AS id, p.id as parent_id, p."name" as parent_name, \
        p.age as parent_age, ch.id as child_id, ch.name as child_name, ch.age as child_age\
        FROM parent p\
        JOIN child ch ON ch.parent_id=p.id\

        sql_field_string = parent_name
        sql_field_string = child_name
        sql_attr_uint = parent_age
        sql_attr_uint = child_age
}

то если у одного родителя более одного детей то в sphinx отобразить их так:

| id | parent_id | parent_name | parent_age | child_id | child_name | child_age |
|  1 |              1|                    a |                 35|            1|                aa|               2|
|  2 |              1|                    a |                 35|            2|                ab|               3|
|  3 |              1|                    a |                 35|            3|                ac|               4|
|  4 |              1|                    a |                 35|            4|                ad|               5|

т.е. данные родителя повторяются этим самым занимает место на диске. При поиске по имени родителя если у родителя больше одного ребенка то количество родителя равен к количестве детей. А при поиске по имени ребенка нормально, одна запись. Подскажите как правильно индексировать подобные данные или так и должно быть?

Вопрос задан более трёх лет назад
109 просмотров

Комментировать

Подписаться 2 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 194 просмотра
1

ответ
Sphinx

Простой
Возможно ли настроить wordforms в Manticore с добавлением нескольких синонимов к указанному слову, а не только один?
- 1 подписчик
- 06 окт. 2025
- 99 просмотров
1

ответ
Sphinx

+1 ещё

Простой
Не ставится Sphinx в виртуальной машине Bitrix 7.5.5?
- 1 подписчик
- 14 авг. 2025
- 77 просмотров
0

ответов
Sphinx

Средний
Как указать --skip-ssl в конфиге manticore?
- 3 подписчика
- более года назад
- 378 просмотров
1

ответ
Linux

+2 ещё

Простой
Как установить Sphinx на Alma Linux 9?
- 1 подписчик
- более года назад
- 186 просмотров
4

ответа
PHP

+1 ещё

Средний
Как заставить sphinxsearch 3.6.1 выводить несколько полей?
- 1 подписчик
- более года назад
- 111 просмотров
2

ответа
1С-Битрикс

+1 ещё

Сложный
Как сделать чтобы sphinx выдавал сперва точные совпадения а потом остальные?
- 1 подписчик
- более года назад
- 214 просмотров
1

ответ
Sphinx

Простой
Какие существуют ограничения на количество записей у real time индексов manticoresearch?
- 6 подписчиков
- более двух лет назад
- 381 просмотр
0

ответов
CentOS

+1 ещё

Простой
Почему SPHINX не стартует после остановки какой-то службы?
- 1 подписчик
- более двух лет назад
- 142 просмотра
1

ответ
Sphinx

Средний
Почему текстовое поле из real time индекса пустое при запросе?
- 1 подписчик
- более двух лет назад
- 68 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2020-02-16 04:38:05

Предлагаю посмотреть со стороны корректировки архитектуры для конкретного случая.
Таблицы parent и child можно объединить в одну - family, получив структуру аналогичную таблице child.
- id
- parent_id
- name
- age

Получим что-то вроде:
--------------------------------
id | parent_id | name | age
--------------------------------
1 | 0 | Отец | 30
2 | 1 | Дочь | 9
3 | 1 | Дочь2 | 7
4 | 0 | Отец2 | 41
5 | 4 | Дочь3 | 12

Тогда в самом индексе получим три поля:
- name
- age
- parent_id

Ищем среди родителей:
WHERE parent_id = 0 AND MATCH('@name "Отец"')

Ищем среди детей:
WHERE parent_id > 0 AND MATCH('@name "Дочь"')

Есть еще минимум 1 вариант избегания дублей информации - группировать по необходимому признаку и конкетировать поля с помощью MySQL функции GROUP_CONCAT использовав разделитель для дальнейшего обращения в массив.
Например, при группировке по полю parent_name нужно конкетировать 3 поля - child_id, child_name, child_age:

SELECT \
        row_number() OVER () AS id, \
        p.id as parent_id, \
        p."name" as parent_name, \
        p.age as parent_age, \
        GROUP_CONCAT(ch.id SEPARATOR '|') as child_id, \
        GROUP_CONCAT(ch.name SEPARATOR '|') as child_name, \
        GROUP_CONCAT(ch.age SEPARATOR '|') as child_age\
FROM parent p\
JOIN child ch ON ch.parent_id=p.id\
GROUP BY parent_id

При SELECT * FROM index WHERE parent_id = 1 получим что-то подобное:
----------------------------------------------------------------------------
id | parent_id | parent_name | child_id | child_name | child_age
----------------------------------------------------------------------------
1 | 1 | Отец | 1|2|3 | aa|ab|ac | 2|3|4

После выполнения запроса конкетированые строки нужно обработать для нормальной работы с child_* полями.

В целом, способ и саму необходимость каких-либо изменений хорошо определять опираясь на конкретные задачи.

Как индексировать одна ко многим таблиц на sphinx?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт