Какая БД наиболее оптимальна для выборки на основе побитового XOR?

Question

Константин @bergsteiger

Базы данных

Какая БД наиболее оптимальна для выборки на основе побитового XOR?

Приветствую всех знающих и заинтересованных!
Буду крайне признателен за полезные рекомендации по решению задачи или указание вектора "куда копать".

Исходные: имеется большой массив строк [все по 32 байта] - ориентировочно over 100 млн.
Задача: опишу запросом MySQL

SELECT str FROM tbl WHERE BIT_COUNT(str ^ :search) / 256 <= :pc

Пример:

a = X'fffffffffff727d9181b191bf95ffc1f981f981f98399839ffffffffffffffff' // искомая строка
b = X'ffffffffffe407e9181b191bf91ffe1f981f981f98399839ffffffffffffffff' // одна из строк в БД
r = X'0000000000132030000000000040020000000000000000000000000000000000' // результат побитового XOR
c = 8 // число установленных бит в результате

если :pc = 0.05, то будет выбрана строка "b" из базы, т.к. 8 / 256 = 0.03125

Сейчас занимаюсь тестированием этого дела, используя MySQL. Но, что-то мне подсказывает, что результат меня не удовлетворит.
Подскажите, пожалуйста, инструмент и/или алгоритм, который ускорит процесс поиска...но не ценой вложения больших временных ресурсов на изучение и внедрение - вопрос времени стоит достаточно остро.

Вопрос задан более трёх лет назад
2290 просмотров

2 комментария

Подписаться 4 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Нетология

DevOps-инженер с нуля

15 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

3 комментария

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Средний
В чем разница между логической и физической модели в БД?
- 1 подписчик
- 27 мая
- 314 просмотров
3

ответа
Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 301 просмотр
3

ответа
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 177 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- 21 дек. 2025
- 173 просмотра
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб. 2025
- 124 просмотра
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб. 2025
- 312 просмотров
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб. 2025
- 246 просмотров
1

ответ
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 257 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт. 2025
- 288 просмотров
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент. 2025
- 392 просмотра
1

ответ
Показать ещё Загружается…

Можете пример привести (для наглядности) и что требуется получить....
Написал, надеюсь прояснит вопрос.

Answer 1 · 2014-10-03 21:09:59

Один из вариантов решения (он не лучший!):
Тут отвечал про хеширование строк.
Для нахождения максимального совпадения строк...
Конечно, это не очень красиво, но вполне работоспособно....

Answer 2 · 2014-10-04 15:19:26

Никакая.
Ваш запрос - это всегда full scan, для него даже функциональный индекс невозможно построить (в MySQL их, правда, нет, но есть в MariaDB и в PostgreSQL).
Вам нужно менять алгоритм так, чтобы он искал не путем перебора всей таблицы.

Какая БД наиболее оптимальна для выборки на основе побитового XOR?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт