SELECT WHERE IN: Подскажите оптимальный вариант взаимодействия PHP — MySQL

Question

gtAlexandr @gtAlexandr

PHP
MySQL

SELECT WHERE IN: Подскажите оптимальный вариант взаимодействия PHP — MySQL

Здравствуйте.

Как сделать правильней, как сделать оптимальней?

1 вариант:

Получаем результат первого запроса:
SELECT `ID` FROM `TABLE_A`WHERE `FIELD_C` = '123';

Подставляем рез-т первого запроса во второй запрос:
SELECT * FROM `TABLE_B` WHERE `FIELD_A` IN ('результат 1-ого запроса');

Итого транзакций: 2
Возникает вопрос: а если результатом первого запроса будет 1k идентификаторов?

2 вариант:

SELECT * FROM `TABLE_B` WHERE `FIELD_A` IN (SELECT `ID` FROM `TABLE_A`WHERE `FIELD_C` = '123');

Итого транзакций: 1
Возникает вопрос: не является ли этот запрос сложным?

Смысл моего вопрос в следующем: в статьях про архитектуру высоконагруженных систем (например, таких как twitter) рекомендуется при взаимодействии с БД использовать простые запросы, а формирование результата проводить на вычислительных серверах (их проще масштабировать).
Так вот, что лучше:
— 1 вариант с двумя простыми запросами к БД, но, возможно, сложным для разбора вторым запросом, если кол-во передаваемых идентификаторов, например тысяча?
— 2 вариант с одним запросом, но вложенным?

Спасибо за ответы!

Вопрос задан более трёх лет назад
26419 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 8

Комментировать

4 комментария

shagguboy @shagguboy

bugs.mysql.com/bug.php?id=9090.

Написано более трёх лет назад
gtAlexandr @gtAlexandr Автор вопроса

Спасибо, попробую INNER JOIN
Хотя JOIN'ы меня очень смущают, потому как часто читал статьи по оптимизации в которых не рекомендуется их использовать.

Написано более трёх лет назад
Анатолий @taliban

inner join != left join. inner join синоним перечисления таблиц через запятую:
select * from tableA join tableB using (someFiled)
и
select * from tableA, tableB
where tableA.someField = tableB.someField
Эти две записи синонимы, так что inner join-ов бояться не следует.

Написано более трёх лет назад
Алексей Сундуков @alekciy

inner join != left join по определению.
Не вижу, почему нужно боятся left join.

P.S. При inner в результирующую таблицу могут попасть не все записи.

Написано более трёх лет назад

2 комментария

Комментировать

6 комментариев

egorinsk @egorinsk

Касательно

> Возникает вопрос: а если результатом первого запроса будет 1k идентификаторов?

Ну в этом случае все равно у вас код, который эти записи будет отображать в шаблоне, будет тормозить гораздо сильнее, чем код выборки 1000 записей из БД. Так что не стоит беспокоиться.

При использовании сложных запросов риск появления необъяснимых тормозов возрастает в разы.

Написано более трёх лет назад
shagguboy @shagguboy

>нельзя будет сделать дешевую оптимизацию разнесением таблиц на разные сервера
очень хочу узнать про проект в котором это таки понадобилось сделать.

Написано более трёх лет назад
egorinsk @egorinsk

> очень хочу узнать про проект в котором это таки понадобилось сделать

А что не так с этим вариантом? Есть такой проект, (даже думаю не один), где сервер БД не выдерживает нагрузки (даже с учетом мемкеша, правильных индексов и прочего, так как там в секунду много хитов и большие размеры таблиц, много пользователей) и таблицы раскиданы по нескольким серверам. Что за проект, называть не хочу.

Написано более трёх лет назад
shagguboy @shagguboy

у нас есть секретные приборы, но мы про них не расскажем. понятно.

Написано более трёх лет назад
egorinsk @egorinsk

Если у вас есть какой-то проект, где начинаются проблемы с нагрузкой на БД, вы можете протестировать этот способ, и убедиться, что он работает, при правильном подходе. Если у вас такой задачи нет, смысл что-то обсуждать? Доказывать, что 2 или 3 сервера могут обработать больше запросов, чем 1, я не вижу смысла.

Написано более трёх лет назад
shagguboy @shagguboy

>Доказывать, что 2 или 3 сервера могут обработать больше запросов, чем 1
а жаль. потому что обычно получается наоборот и два три сервера работают заметно медленнее чем один, написание слоя абстракции от того что у вас несколько серверов занимает нереальное время, а администрировать это вообще невозможно.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 1 подписчик
- 17 июн.
- 198 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 445 просмотров
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 246 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 190 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 153 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2462 просмотра
8

ответов
MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 127 просмотров
1

ответ
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 338 просмотров
6

ответов
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 104 просмотра
1

ответ
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 182 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2012-01-19 12:33:54

>в статьях про архитектуру высоконагруженных систем (например, таких как twitter)
пока у вас нет нагрузок как у Твиттера, не делайте так. только усложните себе жизнь, написанием своих собственных джойнов на php

Answer 2 · 2012-01-19 12:27:55

shagguboy @shagguboy

лично я за inner joib потому что in (до версии 6 точно) оптимизируется как depend subquery.

Ответ написан более трёх лет назад

4 комментария

Answer 3 · 2012-01-19 11:52:23

Если таблицы однотипные (это касается и полей, и движков) и не используется (не эффективно) кэширование, то лучше 2 вариант.
В остальных случаях 1 вариант.

Answer 4 · 2012-01-19 13:13:29

Вообще, если уж начали про архитекруту, то просто сделайте так:
tableB->getAll();
Как внутри все будет работать пока что Вас не должно волновать, главное чтоб этот метод (функция) возвращала _всегда_ одни и те же данные. Потом когда (если?) будет тормозить, или Вас будет что-то не устраивать Вы этот метод переделаете как душа пожелает.
Так что не важно что именно вы сделаете, главное выделяйте такие спорные вопросы в одном месте, которое _всегда_ возвращает одни и те же данные, как бы Вы его не меняли.

Answer 5 · 2012-01-19 13:10:50

Если выбрать второй вариант, нельзя будет сделать дешевую оптимизацию разнесением таблиц на разные сервера. То есть в этом случае с ростом нагрузки придется покупать массивы дисков, многопроцессорные ядра и прочую хрень. А потом ломать руки архитектору и переписывать весь код.

А в первом случае банально разносим таблицы по серверам и еще годик бездельничаем.

Также, с первым вариантом, сущности можно дергать частично из кеша мультизапросом. А второй вариант хрен закешируешь.

Так что не слушайте джойнеров, потом жалеть будете.

Answer 6 · 2012-01-19 13:42:20

Я за вариант 2. если нет варианта 3.
Вариант 1 может иногда не работать из-за попадания на лимиты:

можно попасть на 2 лимита
1. превышение максимальной длины запроса
2. превышение максимального количества параметров в IN. да, там тоже есть ограничения

Ограничения есть не только в мускуле, но и в оракле, постргессе и других БД.

Вариант 2 ещё к тому же и тормознутый, если у нас много записей во внешнем запросе.

Простые запросы будут работать быстрее:
select * from table1,table2 where условия
или запрос через
join
select * from table1 join table2 on условие where условия

какие из них, будет работать быстрее смотрите сами. Настройки БД подпиливаются под данные и под запросы, которые будут исполняться на этих данных.

Answer 7 · 2012-01-19 14:10:26

>а если результатом первого запроса будет 1k идентификаторов?
а проверить что же будет?

Answer 8 · 2012-01-20 10:43:56

Цель таких оптимизаций — это сделать так, чтобы база делала как можно меньше, а приложение, которое работает с базой, как можно больше. Ведь базу трудно масштабировать, а серверов, на которых крутится приложение, добавить легко.

Если у вас один сервер под приложение и под базу, то такая оптимизация вредна, потому что приложение не сделает быстрее то, что сделает база в большинстве случаев. Поэтому надо использовать inner join.

Если Вы интересуетесь из академических соображений или уже готовы к закупкам новых серверов, то первый вариант лучше.

SELECT WHERE IN: Подскажите оптимальный вариант взаимодействия PHP — MySQL

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт