Красивые URL и поиск по БД — как вы с этим работаете?

Question

NewTypes @NewTypes

На себя

Красивые URL и поиск по БД — как вы с этим работаете?

Я имею ввиду классическую задачу - найти slug страницы, поле в таблице БД ответственное за красивые URL. Допустим мне нужна страница site.com/pretty-url и я начинаю искать в поле slug значение "pretty-url". Но ведь это же затратно (или БД сама за меня решит эту проблему быстрого поиска? Учитывая, что для каждой записи изначально проставлены ID).

Не знаю, высосал ли я эту проблему или нет, но на мой обывательский взгляд это головная боль больших баз, которая была бы меньше, если бы я обращался сразу по ID без красивых урлов.

Вопрос задан более трёх лет назад
3695 просмотров

2 комментария

Подписаться 3 Оценить 2 комментария

FanatPHP @FanatPHP

Чем так принципиально отличается задача поиска по '1234567809' от поиска по 'pretty-url', что последний будет происходить медленнее первого?

Написано более трёх лет назад
NewTypes @NewTypes Автор вопроса

Относительно сравнения поиска по числу и поиска по тексту. Я полагаю, что первое происходит быстрее, так как если бы я проектировал БД, то изначально закладывал возможность поиска по числовым ключам с минимальным процессорным временем. Разбивкой на диапазоны итп. Что-то вроде различия инструментов. На ум приходит инвертированный индекс и поиск релевантных документов - без него мы бы тратили кучу времени. Я вот об этом. Хотелось бы знать, существуют ли решения такого рода для данной задачи?

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 10

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Поисковая оптимизация

Сложный
Стало заходить много ботов на сайты, какими способами заблокировать их?
- 1 подписчик
- 01 июл.
- 187 просмотров
2

ответа
Поисковая оптимизация

Простой
Зачем iframe-tasks заходит на отсутствующие товары в ИМ?
- 1 подписчик
- 30 июн.
- 78 просмотров
3

ответа
Поисковая оптимизация

Простой
Какой будет правильный Robots.txt для Wordpress (привел пример структуры)?
- 1 подписчик
- 14 июн.
- 116 просмотров
5

ответов
Поисковая оптимизация

Сложный
Индексация http при настроенном редиректе на https?
- 1 подписчик
- 08 июн.
- 129 просмотров
1

ответ
Поисковая оптимизация

Простой
Как лучше кластеризировать ключевики?
- 1 подписчик
- 05 июн.
- 88 просмотров
1

ответ
Поисковая оптимизация

Простой
Где покупать ссылки и как анализировать ссылочный профиль?
- 1 подписчик
- 05 июн.
- 97 просмотров
1

ответ
MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 138 просмотров
1

ответ
Поисковая оптимизация

Простой
Удалять ли отсутствующие товары в магазине?
- 2 подписчика
- 11 мая
- 219 просмотров
4

ответа
Поисковая оптимизация

+1 ещё

Средний
Как правильно организовать мультиязычные URL в Next.js для SEO?
- 1 подписчик
- 07 мая
- 134 просмотра
2

ответа
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 119 просмотров
1

ответ
Показать ещё Загружается…

Чем так принципиально отличается задача поиска по '1234567809' от поиска по 'pretty-url', что последний будет происходить медленнее первого?
Относительно сравнения поиска по числу и поиска по тексту. Я полагаю, что первое происходит быстрее, так как если бы я проектировал БД, то изначально закладывал возможность поиска по числовым ключам с минимальным процессорным временем. Разбивкой на диапазоны итп. Что-то вроде различия инструментов. На ум приходит инвертированный индекс и поиск релевантных документов - без него мы бы тратили кучу времени. Я вот об этом. Хотелось бы знать, существуют ли решения такого рода для данной задачи?

Answer 1 · 2013-11-14 23:21:34

Если есть индекс на этом поле, то скорость поиска будет примерно такая же как и при доступе по id. Там точно такой же индекс, только не по тексту а по числу.

Answer 2 · 2013-11-14 23:18:07

Вашу озабоченность можно понять. Для начала поставьте индекс у данного поля для того, чтобы запрос с поиском страницы по ее URL проходил быстрее (все равно ведь данные ищете, если не по этому полю, то по id). В идеале - кеширование.

Answer 3 · 2013-11-14 23:38:05

Основной минус хранения красивого урла в БД - это дополнительный запрос. если страниц которым требуется такой урл не много, то по-моему проще его хранить в простом массиве, в отдельном файле

return array('my_castom_url_page' => 'real_url_page', ...);

Answer 4 · 2013-11-14 23:43:45

Если посещаемость сайта не несколько миллионов человек в сутки, беспокойство лишнее. Знаю это не по теории, а из практики, у меня так работают сайты примерно c 2000 года, проблем c быстродействием поиска не наблюдается. Если же посетителей становится много, наверняка захочется сделать кеширование в redis например. Лучше подумать, что произойдет, когда захочется сделать иерархию (/uri, /uri/suburi и т.д.). Тут тоже проблемы особо нет, но задача точно поинтереснее.

Answer 5 · 2013-11-15 00:01:35

Не очень понятны эти идеи про разность индексов. Да, индекс по четырем байтам целочисленного поля получится меньше и за счет этого быстрее, чем индекс из первых, скажем, 20-и символов текстового. Но разница будет не настолько значительная.

Для компьютера и число и строка - это набор байт. Что конкретно в эти байты записано - ему всё равно. Поиск по упорядоченному набору байт будет производиться одинаково.

Не стоит заранее переживать за производительность. От этого одни проблемы.

Answer 6 · 2013-11-15 01:05:11

В данном случае, зачем сразу к БД лезть? Ведь есть такая вещь как кеши. В качестве ключа использовать "префикс" + CRC32(URL).

Answer 7 · 2013-11-15 13:10:19

Как вариант, можно работать с урлом такого вида site.com/id/pretty-url, и попросту игнорировать часть "pretty-url". Посмотрите по новостным сайтам - некоторые именно так работают.

Upd. Не заметил ваш комментарий выше. Тогда да, индексирование по полю урла будет работать сносно.

Answer 8 · 2013-11-15 19:05:16

afiskon @afiskon

SELECT ... FROM articles WHERE slug = .... (LIMIT 1) ну и индекс по полю slug конечно же!

Ответ написан более трёх лет назад

Комментировать

Answer 9 · 2013-11-17 00:33:26

Только не следует забывать, что индекст по текстовому полю ограничивается по длине в Х символов. Если Х будет мало (величина зависит от используемых урлов), то выигрыш от индекса можно и не получить.

Answer 10 · 2013-11-29 10:20:42

Для быстрого поиска по БД, если выборка осуществляется по текстовому полю, в вашем случае по "красивому" урл-у, предлагаю два варианта:
Вариант 1. Индексация поля, как FULLTEXT с фиксированной длиной, к примеру 255 символов.
Минусы: Избыточный индекс + проблема СУБД MySQL в использования FULLTEXT индекса на движке InnoDB (доступно MySQL >= 5.6).

Вариант 2. Добавить добавить дополнительное поле с бинарный хэшом этого урл-а.
Как сделать:
Предположим, что в таблице articles, существует поле url, создаём дополнительное поле url_hash с типом "binary" длиной 16.
Запрос на добавление бинарного хэша
UPDATE articles SET url_hash=UNHEX(MD5(url));
Запрос на выборку по бинарному хэшу

SELECT * 
FROM articles
WHERE url_hash =  UNHEX(MD5('pretty-url'));

Если данных много, то во избежании коллизий можно добавить префикс к хэшу, к примеру, название таблицы:
UNHEX(MD5(CONCAT('pretty-url', 'articles')))
Плюсы: Быстрый индекс с фиксированной длиной.
Минусы: Избыточные данные в виде дополнительного поля.
Данный вариант, считается Best практикой:
MySQL binary against non-binary for hash IDs
Тест производительности

Красивые URL и поиск по БД — как вы с этим работаете?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт