Как хранить номера авто казахстанского учета в базе данных чтобы максимально быстро найти номер в БД?

Question

wjkwza @wjkwza

Проектирование баз данных

Как хранить номера авто казахстанского учета в базе данных чтобы максимально быстро найти номер в БД?

номера в формате 111AAA11(новые) или A111AAA(старые)
если убрать 11 в конце и А в начале (признак региона)
остается 111AAA

26 букв англ.алфавита, в 3 ряда 26^3=17576 плюс умножить на 1000 получаем 17,5 миллионов элементов на БД одного региона (регионов 20) номеров нового образца (есть еще старые)

сам думал хранить так:
преобразовать буквы в ASCII и добавить цифры,

пример: AAA111 656565111 (656 565 111)

и перед каждым запросом типа 123ABC12

сначала определить регион и БД для региона, потом буквы в ASCII + цифры номера и сделать запрос в БД

все что я знаю это поиск чисел быстрее поиска строк

но мне кажется даже это слишком громоздкое решение и я в силу своей некомпетентности не могу даже правильно загуглить, ChatGPT советует хэшы и индексирование

Доп.инфо: Автомобилей в Казахстане около 5 миллионов и допустим 1 миллион номеров будет храниться в БД в начальное время
Насчет стека: я рад любому стеку, но сам пока только на Pythonе умею

Вопрос задан более года назад
127 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Нетология

Продвинутый SQL

5 недель

Далее
Академия Eduson

SQL-разработчик: тариф Базовый

3 месяца

Далее

Решения вопроса 2

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

API

+1 ещё

Простой
Точь в точь ли маппятся поля json-сущности на поля в таблицах базы данных?
- 1 подписчик
- 05 июл.
- 237 просмотров
2

ответа
Проектирование баз данных

Простой
Правильно ли построена ER диаграмма?
- 1 подписчик
- 11 мая
- 265 просмотров
1

ответ
Информационная безопасность

+2 ещё

Простой
Данная схема реализации базы данных подходит под рамки 152-ФЗ?
- 1 подписчик
- 17 апр.
- 560 просмотров
2

ответа
PostgreSQL

+1 ещё

Простой
Проектирование БД: чем сейчас люди пользуются?
- 1 подписчик
- 09 апр.
- 483 просмотра
4

ответа
Проектирование баз данных

Простой
Как лучше сделать базу данных?
- 1 подписчик
- 07 мар.
- 333 просмотра
5

ответов
Проектирование баз данных

Средний
Как спроектировать dwh звезда?
- 1 подписчик
- 05 мар.
- 74 просмотра
1

ответ
Проектирование баз данных

Средний
Выбор между SQL и NoSQL документооринтированной базой данных?
- 2 подписчика
- 01 мар.
- 1004 просмотра
2

ответа
Проектирование баз данных

Простой
Как лучше обновлять счётчик записей?
- 1 подписчик
- 27 февр.
- 146 просмотров
4

ответа
Проектирование баз данных

Простой
Как организовать таблицу для хранения ответов теста?
- 2 подписчика
- 21 февр.
- 298 просмотров
2

ответа
Проектирование баз данных

Простой
Как хранить данные о недвижимости?
- 1 подписчик
- 17 февр.
- 195 просмотров
1

ответ
Показать ещё Загружается…

React Native разработчик в VSRAP

VSRAP Shop • Санкт-Петербург

от 150 000 до 220 000 ₽

Системный аналитик

Bitbanker.ru

от 240 000 ₽

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Вы занимаетесь преждевременной оптимизацией. В данном случае не нужно ничего велосипедить вообще.

Answer 1 · 2024-01-05 19:46:37

1. Тег "Оптимизация SQL-запросов", значит у тебя СУБД? Какая?
2. Ты придумал себе проблему на ровном месте, 5 миллионов не сильно много, можно поднять тестовый стенд и проверить как будет работать без индексов, потом добавить индекс по умолчанию
3. Если поиск по полному номеру, то практически любой индекс будет работать очень быстро, если по подстроке, то начинается куча нюансов, тут уже надо отталкиваться от user story
4. Если не устраивает, то читаешь какие виды индекса есть у данной СУБД, экспериментируешь, смотришь планы запросов, оптимизируешь и т.п

Answer 2 · 2024-01-05 20:00:03

Тебе ничего не надо придумывать. Все уже придумано и база умеет индексировать.

create table autonumbers(autonumber varchar(30), region varchar(30));

create index idx1 on autonumbers(autonumber);
create index idx2 on autonumbers(region );

Запросы:

поиск номеров в регионе (индексированный)
select .... where region = 'Астана';

точный поиск номера по полному совпадению

select .... where autonumber= '111AAA11';

все что я знаю это поиск чисел быстрее поиска строк

Это слабое утверждение для баз данных. БД это на 80% IO bounded приложение
и его нагрузка будет зависеть от дисковой подсистемы и от удачного расположения
искомых строк в блоках БД.

Мой личный опыт эксплуатации БД Oracle например показывает что практически
нет разницы между varchar / number. Хотя многие DBMS (Postgresql) поддерживают
примитивные типы данных, но когда строка (datarow) длинная - то практически
безразлично будет ли у тебя integer, biginteger, decimal.

Важнее сделать систему просто правильной, а ужимать и утрамбовывать инфу в примитивы
это - более поздняя оптимизация. Попробуй загрузи свои номера в макет и поэкспериментируй.

Как хранить номера авто казахстанского учета в базе данных чтобы максимально быстро найти номер в БД?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт