Стена соцсети: выборка данных

Question

excalibur @excalibur

PHP
MySQL

Стена соцсети: выборка данных

Речь пойдет о стене соцсети, к примеру, как на вконтакте или фэйсбуке, т.е. запись на стене может содержать в себе разный тип контента: новость, запись в блог, несколько изображений, опрос и т.д.

Я пока остановился на следующей структуре базы данных:

Таблица «wall»:

id | description
1 | «Это описание первой записи на стене»
2 | «А это уже вторая запись на стене»

Таблица «wall_element»:

id | wall_id | component | element | element_id
1 | 1 | image | item | 1
2 | 1 | image | item | 2
3 | 1 | image | item | 3
4 | 2 | catalog | item | 1
5 | 2 | catalog | item | 2
6 | 2 | catalog | shop | 1
7 | 2 | catalog | shop | 2

Примеры записей как и примеры структур таблиц абстрактные. Думаю с таблицей «wall» все понятно. Таблица «wall_element» содержит список прикрепленных разных типов контента, которые добавлены в запись на стену. Поля в таблице означают следующее:

wall_id — id записи на стене,
component — название компоненты. Компоненты у меня — это, к примеру, каталог, изображение, новость, блог…
element — это структурная единица компоненты, например, в компоненте «catalog» могут быть несколько таких структурных единиц, например «item» или «product» — это сам товар, «shop» — это магазин, «catagory» — категория товара и т.д. Тоже с компонетой «image», которая отвечает за загрузку и отображение фото.
element_id — это id структурной единицы комопненты, т.е. id товара, магазина, фото, записи в блог, новости и т.д. Струткрутрные единицы компонеты также имеют свои таблицы, например, catalog_product, catalog_shop, image_item, blog_item, news_item и т.д. в которых и находится информация о них.

Вопрос: Как правильно вытянуть информацию из БД? Одним запросом здесь не обойтись, а если и можно как-то, то не хочется, так как запрос будет тяжелым. Из таблицы «wall_element» я получу id, например, всех фото, или всех видео, которые прикреплены к записи на стену. Какими именно запросами лучше всего вытаскивать эти id? И какими запросами вытаскивать данные из таблицы image_item, т.е. как потом вытащить данные о фото?

P.S. Как все вытащить я, конечно, знаю, но нужны другие точки зрения и желательно более опытных разработчиков.

UPD: Все таки напишу как я это вижу:

1) Сделаю первый запрос, которым вытаскиваю 10-20 записей из таблицы «wall» — запрос очень легкий, даже при несколько миллонов записей проблем не должно возниктуть.

2) В цикле по этим 10-20 записям вытаскиваю данные из таблицы «wall_element». В каждой итерации я буду получать список фото, записей в блог, новостей и т.д. Теперь нужно обработать эти данные, т.е. отдать их каждой компоненте, к которой они принадлежат и получить обратно html. Но нужно как-то еще погрупировать вот те самые 20фото — и получать информацию с таблицы «image_item» или 20 запросами (очень легкими, поскольку запрос будет идти по id) или как-то более елегантно одним запросом… Вот так в одной итерации я собираю html разных структурных единиц компонент…

Т.е. здесь есть плюсы в том, что запросы легкие, а минусы в том, что запросов будет много для рендеринга страницы… Кэширование, конечно, никто не отменял, но нужно сначала сделать все как можно правильней…

Вопрос задан более трёх лет назад
4521 просмотр

Комментировать

Подписаться 5 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 8

14 комментариев

Дмитрий Гукетлев @Yavanosta

Соврал. wall_element надо джойнить не через INNER а LEFT.
LEFT JOIN wall_element we_bp
LEFT JOIN wall_element we_i

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

За ответ однозначно "+", а пока прочту еще раз и постараюсь все понять…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Согласно запросу я 10 фото не вытяну, а просто буду знать, что к записи прикреплены какие-то фото и сообщу об этом куда нужно, после чего одним запросом я вытащу те фото, которые прикреплены к записи на стену, правильно? И еще не понял почему группировка по «w.description»?

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Как Вы думаете, возможны какие нибудь альтернативы для джойно в данном случае?

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Да, все так. Группировка по id и дескрипшен потому, что можно выбирать только поля, которые входят в группировку или не обрабатываются агрегатной функцией.

Объясниете, что вы понимаете под альтернативой джоинам? Вам слово не нравится? :-)

Альтернатива для INNER JOIN есть — можно перечислить таблицы в поле from и условия вынести в WHERE. Но выполняться такой запрос будет точно также как и записанный с помощью JOIN. Убедиться можете посмотрев план запроса. С LEFT JOIN такой фокус не прокатит. По крайней мере я на знаю как это сделать.

Почитайте вот это еще:
dev.mysql.com/doc/refman/5.0/en/optimization.html

Хотябы вот этот раздел:
dev.mysql.com/doc/refman/5.0/en/select-optimization.html

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>Вам слово не нравится? :-)
Нет, слова в порядке))

Я о том, что если я все равно буду делать по запросу к каждой записи на стену, то есть ли смысл делать множество джойнов к разным таблицам в первом запросе? Хотя я могу ошибаться, может я что-то упускаю…

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Если вы делаете джоины, то после первого запроса вы УЖЕ знаете, что у вас есть в какой записи. Т.е. смотрите, если у вас в записи только картинки, то вы делаете второй запрос на картинки. Имея в среднем один тип контента на запись и 10 типов контента, вы экономите в среднем 9 запросов. (если вы после первого запроса видите, что у вас нет постов блога, то их не надо запрашивать).

Если вы не делаете джоины, вы знаете только список записей на стене и должны сделать на каждую запись столько запросов, сколько у вас типов контента. Если 10 — то 10 запросов.

Вы так боитесь джоинов, просто удивительно. У вас что нагрузки планируются гигантские или вы для самообразования? Может проще пару лишних серверов в аренду взять или памяти докупить? Или ССД. Или сделайте персистент вью, с пересчетом раз в минуту. Или key-value хранилище?

Первое, что бы я сделал имея перспективы высоких нагрузок — отказался бы от MySQL хотя бы в пользу PostgreSQL. И от php за одно тоже.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

На счет джойнов согласен, есть в них и плюс. Не боюсь их, а просто «некрасиво» с точки зрения проектирования системы, так как в данном случае модель стены должна быть вкурсе о том, какие типы контента в системе. Ну вот, мы и подошли к той черте, где Вы сами уже понимаете, что Ваш предыдущий ответ «сджойните все» не будет полным, поскольку останется еще много подводных камней.

>Если вы не делаете джоины, вы знаете только список записей на стене и должны сделать на каждую запись столько запросов, сколько у вас типов контента. Если 10 — то 10 запросов.

Да, согласен! Но так или иначе запросы придется все равно задавать, чтобы дополнительно вытянуть те 10 фото, те 3 опроса, те 5 видео, которые лежат в записи на стене. Вот потому я и ищу лучший путь решения…

А Вы согласны, что Ваш ответ/комментарий habrahabr.ru/qa/37525/#comment_178863 был неполным? :)

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>У вас что нагрузки планируются гигантские

Наступает моммент, что при кривых запросах гуглбот создает «ддос» атаку и тогда сервер просто ложиться… и ты бросаешь все свои дела, чтобы переписать запросы и на будущее получаешь хороший урок.

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

> Да, согласен! Но так или иначе запросы придется все равно задавать, чтобы дополнительно вытянуть те 10 фото, те 3 опроса, те 5 видео, которые лежат в записи на стене. Вот потому я и ищу лучший путь решения…
Вы издеваетесь что ли надо мной? Да ну вас, ей богу, куда подальше. Я вам дал решение с одним запросом, вы нос воротите, я написал решение с количеством запросов по количеству типов контента — вам снова не так. Дал решение с количеством запросов по количеству записей, вы снова недовольны. Какое еще решение вы хотите? Сформулировать можете вообще?

>А Вы согласны, что Ваш ответ/комментарий habrahabr.ru/qa/37525/#comment_178863 был неполным? :)
я согласен с тем, что у вас низкий уровень компетенции по части работы с БД и вообще выражения своих мыслей. Удивительно как вы вообще умудряетесь собеседования проводить и какие-то выводы делать «по опыту».

> Наступает моммент, что при кривых запросах гуглбот создает «ддос» атаку и тогда сервер просто ложиться… и ты бросаешь все свои дела, чтобы переписать запросы и на будущее получаешь хороший урок.
ох ну блин, вообще, напугали «неопытного студента» гугл ботом. Кэширование на уровне nginx, key\value стораджа запретили чтоли? Вы решаете задачу не тем инструментом.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

ok

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Прошу прощения за эмоции, но это уже правда как-то странно выглядит. Я предложил вам три решения на выбор и описал плюсы и минусы каждого, а вы вместо «спасибо» просите чего-то «более элегантного» и тыкаете меня носом в то, что я где-то раньше, до того как вы вообще описали схему БД вам неправильно говорил. Неприятно знаете ли.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Извините, я конечно же благодарен за помощь.

Спасибо!

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Пожалуйста. Также, повторно, извиняюсь за эмоциональность.

Написано более трёх лет назад

4 комментария

excalibur @excalibur Автор вопроса

Да, этот подход имеет право на жизнь! Здесь, конечно, есть много минусов, но вполне подходит для решения моего вопроса!
Спасибо! А как бы Вы сделали, если бы стояло условие не кешировать прикреепленные елементы к записи на стене полем wall_record_content? Здесь минус в том, что сложно будет отследить удаленные записи из базы данных, а кешировать я могу в файлах, к примеру, — это на первое время…
Можно, конечно, проверять, существует ли фото в БД или удалено…

Написано более трёх лет назад
jarvis @jarvis

Ничего не удалять, добавить поле deleted, и если пользователь «удалил» пост, устанавливать в это поле значение true и не выводить в шаблоне этот пост.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Да, сргласен на счет поля «deleted» — использую его в некотрых своих таблицах.
На счет «кеширования»: а если все же попробовать обойтись без поля «wall_record_content» и тянуть контент из теблиц (т.е. из таблицы фото, видео)? То какой алгоритм Вы бы предложили?

Написано более трёх лет назад
jarvis @jarvis

Ой, случайно промахнулся. Ответ смотрите ниже. Надеюсь у меня получилось все объяснить.

Написано более трёх лет назад

3 комментария

excalibur @excalibur Автор вопроса

Я имел ввиду, что поле wall_record_content — это уже, по сути, кэш более сложного запроса, т.е. если отказаться от этого поля, то придется использовать дополнительные таблицы (т.е. wall_element), как я написал в вопросе. Вы все правильно пишете, я сам рассматривал такой вариант (читал на стэковерфлов о таком способе, хотя там писали о «social activity stream», где не нужно было группировать фото в одну запись, но тем не менее информация там была полезной для проектирования именно стены) с использователем поля, которое местило бы в json всю необходимую информацию. Но хотел бы еще понять как все реализовать, если держать эти json-данные как записи в других таблицах, т.е. таким способом, каким я предположил буду использовать, хотя так будет более высокая нагрузка на мускуль.

Написано более трёх лет назад
jarvis @jarvis

Я собственно в своем способе и пытаюсь уйти от множества таблиц к одной :) А вы наоборот возвращаетесь к множеству. А почему вы хотите делать именно через таблицу wall_element? Пускай все лежит в одной таблице. Просто ваш способ сильно увеличивает нагрузку на БД, усложняет запросы и не сильно упрощает работу.

"+" моего
1)1 таблица, один запрос на всю стену при выводе + шардинг. Очень легкий и быстрый запрос. Уменьшается нагрузка на БД. Я думаю база вполне долго сможет держать нагрузку при такой архитектуре, хоть до 100 млн пользователей.
2)легко изменять тело записи на стене
3)одинаково выводятся и обрабатываются как посты с одними фотографиями, так и только текстовые, аудио, так и смешанные. Все унифицировано.
4) Красиво на мой взгляд)
5) Упростит поиск(если вы захотите его добавить)
"-"
1)сложнее в реализации
2)данные дублируются во многих местах(это на самом деле нормально)
wall_record_content действительно дублирует некоторые записи из таблиц images, videos и т.д. Это нормально, в условиях больших данных нормализация не нужна. Данные должны дублироваться во многих местах. Жесткие диски стоят дешевле оперативной памяти. Нет ничего зазорного в том, что некоторые записи содержат в себе части других записей из других таблиц. Так работают все соц сети.

По похожему принципе вам следует сделать и друзей, и личные сообщения. и новости aka «social activity stream». Иначе при росте вас завалит.

А как сделать через wall_element вам предложили выше. Можно конечно попробовать составить запрос без джойнов, но он будет довольно длинный.
Тут все упирается в нагрузку, если у вас она пока небольшая, и пользователей немного то можете сделать через джойны, как вам предложили выше. Шардинг тоже пока не потребуется. Но в конце-концов вы упретесь в производительность БД и запросы будут выполняться очень долго. Один из альтернативных способов я предложил в своем первом ответе.

Но если проект станет большим, то рано или поздно вам придется перейти на другой способ и снова все переделывать.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

С Вами трудно не согласиться :)

Меня именно производительность и интересует. Потому множество джойнов не подходит. Я смотрю в сторону вытаскивания данных из таблиц по их id — таких запросов будет намного больше, чем просто использовать джойны, но такие запросы будут очень быстрыми и рост БД не особо повлияет на производительность. Мне так или иначе придется кэшировать данные. Я точно знаю, что предложенный Вами способ легко выдержит выборку по 1.5М записей, думаю при возростании количества строк такой таблицы ничего особо не изменится. О подобной структуре БД писал владелец соцсети. Он писал, что при 15М записей в таблице все работает отлично. Через некоторое время он сделал апдейт ответа и написал, что теперь у него 60М записей и все работает без изменений. Это я все к тому, что понимаю все плюсы предложенного Вами варианта.

Написано более трёх лет назад

1 комментарий

28 комментариев

excalibur @excalibur Автор вопроса

У меня есть идентификатор и пользователя который создал, и идннтификатор пользователя на чей стене была создана запись и тип стены (или это пользовательская или же сообщество) не столь важно… Структура таблиц же абстрактная… Укажете свое поле-идентификатор пользователя — я пойму… Было бы все так просто, вопрос я бы не задавал… Не так просто описать несколькими предложениями, то что у меня есть, почему оно есть, почему именно так и т.д. Например, как вижу я все это:

1)… я лучше сделаю апдейт вопроса, посмотрите через несколько минут в сам вопрос…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Написал дополнение к вопросу.

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

> В цикле по этим 10-20 записям вытаскиваю данные из таблицы «wall_element».
Нет. Так не делают в реляционных СУБД. Для этого придумали джоины. Почитайте пожалуйста теорию.

>Но нужно как-то еще погрупировать вот те самые 20фото
Для того чтобы группировать есть GROUP BY. Для того чтобы сортировать ORDER BY.

>или как-то более елегантно одним запросом
джоины

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Нет, Вы не поняли… ну ладно… У меня опыта работы с мускулем несколько лет, и что такое джойны, группирование, сортировка я знаю… Ну не панацея джойн… Ну не вытащите Вы все то о чем я писал одним джойном… Компонента «wall», т.е. ее модели не должны ничего знать о моделях других компонент… В будущем будут добавлены или удалены новые/старые компоненты, тогда при каждом обновлении мне придется править код модели стены. Это неправильно с точки зрения проектирования (может быть это всего лишь моя точка зрения, но я считаю ее правильной). Компоненты должны быть несвязанными или слабосвязанными… А перекладывать логику на модели также неправильно…

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Вы пишите очень много, и очень не хочется во все это вникать. Теперь вопрос из области БД уже перешл в область объектной модели. Вы можете сформулировать коротко и понятно? Что надо сделать?

Вам нужно, чтобы код отвечающий за рендеринг компонента стены был независимым? Тогда само по себе напрашивается следующее решение: ответственность за «добывание» из БД данных для рендеринга перекладываете на код, который им занимается. Основной код передает ему идентификатор стены, а рендерер сам достает уже откуда хочет нужные данные. Естественно, придется хранить данные каждого компонента в своей таблице. Картинки в одной, ссылки в другой, что-то еще в третьей.

Зато получаете полную свободу: рендереры полностью независимы по данным и по алгоритму. Их можно удалять, менять, изменять, добавлять не боясь ничего испортить. Может какие-то рендереры будут вообще не в БД данных хранить, а в мемкеше, или в текстовых файликах. Полная назависимость. Ну и в минусе также полная независимость и несвязанность.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>Вы пишите очень много, и очень не хочется во все это вникать.
Это я и сам понимаю)) Но и в двух словах это не объяснить…

Что мне нужно в ответе, так это то, что делать, как делать, а как не делать, потому что наткнусь на то, то и то… Т.е. хотелось услышать ответ от того, кто уже делал стену, т.е. кто поймет о чем я, не читая описания вопроса, а скажет: «Я вот это делал у себя так, так и вот так… А так не делал, потому что '........'»…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

И кстати

>Вы можете сформулировать коротко и понятно? Что надо сделать?
Да, конечно же могу! Нужно написать стену ;)

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Вы так говорите, как будто «далал стену» это такие уникальные знания, доступные только избранным, передающиеся от внеземных цивилизаций и только половым путем.

А человек который делал форум или сайт новостей вас устроит? Или думаете там что-то другое? Я вам уже два решения предложил. Именно в стиле «делайте так-то», а вы все хотите что-то другое. Я уже не пойму что.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Да нет, вопрос Вы правильно поняли… Я знаю, что где хранить, но не совсем определился каким самым лучшим способом это все достать из БД… Как рендерить то, что я достану из БД — с этим вроде как тоже определился…

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Блин ну я хз. Если вы определились с структурой БД и структурой модулей, то тогда что вам надо сделать вообще? SQL запрос написать? Я уже написал, сджойните две таблицы и все. Ну или вытаскивайте все по одной записи в цикле если так хотите. Или переместитесь в 2013 год и начните использовать ORM. Разницы никакой.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Вот смотрите, тот запрос, что Вы предложили, с ним все в порядке, он мне даст список в перемешку идентификаторов разного типа контента, т.е. будет список, например, с первыми 10 изображениями, дальше 3 товара из каталога, дальше снова 5 изображений и т.д. Дальше мне нужно делать запросы к таблицам фото, товаров и т.д. Вы написали «две таблицы и все» у меня дополнительных таблиц будет больше 10 (фото, товары, блоги и т.д.)… Вы правильно поняли мой вопрос, только я не понял Вашего ответа о «сджойните 2 таблицы»…

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Ну так сджойните все.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Использую ZF, Zend_Table… Что такое ORM — понятия не имею… как этот подход мне поможет?

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Сджойнить все 10 таблиц? Я же не просто так пишу о производительности))

Написано более трёх лет назад
Никита Гусаков @hell0w0rd

Да почитайте вы уже про JOIN. ru.wikipedia.org/wiki/Join_(SQL) — студентов кстати этому учат. Не знаете что такое ORM — еще и ru.wikipedia.org/wiki/ORM почитайте

Написано более трёх лет назад
Никита Гусаков @hell0w0rd

А что производительность? Это лучше, чем тащить несколькими запросами. Если хотите — используйте подзапросы, но они медленнее джоинов, тк не используют индексы.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>Вы так говорите, как будто «далал стену» это такие уникальные знания, доступные только избранным, передающиеся от внеземных цивилизаций и только половым путем.

Нет, конечно, но тот, кто делал стену задавался теми же вопросами, что и я… Задавал те же вопросы гуглу что и я о «user activity stream» о просмотре новостей друзей, о постройке связей между друзьями соцсети и т.д. Читал те же вопросы-ответы на стэковерфлов и сделал для себя определенные выводы, которые я хотел бы с удовольствием услышать…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

GusakovNick, хорошо, спасибо!

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Ох ну блин я не могу. У вас банальнейшая задача вывести из БД десяток записей, а вы тут развели «user acitivity stream».

Кстати да, сджоинить 10 таблиц на порядки быстрее чем делать 100500 запросов в цикле. Что такое ORM почитайте, это вам поможет. Все, на этом я считаю дискуссию оконченной. Можете считать, что моего опыта тут недостаточно.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Хорошо, спасибо!

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

>GusakovNick
подзрапросы могут использовать индексы, а могут не использовать. Это зависит от запроса и индексов. Точный ответ может дать только EXPLAIN

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Числовые индексы быстрее чем текстовые… У меня индексы есть также и текстовые… Но приводить полный список всех полей и индексов нету смысла так как и так много написано, а «Вы пишите очень много, и очень не хочется во все это вникать.»…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>Что такое ORM почитайте, это вам поможет
И все таки, чем именно оно мне поможет? В двух словах, укажите мне направление, я действительно, остался в некоторых технологиях в прошлом на несколько лет…

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Поможет тем, что вы будете работать с объектами, и вообще не будете думать об SQL. Это очень хорошо и удобно. С SQL вместо вас будет работать ORM.

> Числовые индексы быстрее чем текстовые
это не так. С чего вы взяли это вообще? Если мне не изменяет память, от строки берется хэш и по нему строится, например, бинарное дерево. Получается не помедленнее чем по числам. От коллизий защищаются постпроверкой.

Возможно такое впечатление сложилось из-за использования LIKE '%variable%', тогда индекс не используется. Подробнее, смотрите EXPLAIN.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Да, я так и работаю, поскольку использую Zend_Db_Table, Но это не решает моего вопроса и не помогает составить sql-запрос, а потом перенести его на ORm.

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Если правильно используете ORM, то вы не должны писать запрос. В этом смысл ORM. Если вы пишите запросы для ORM, то вы либо:
-неправильно используете ORM
-используете не ORM

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Для того, чтобы правильно написать последовательность методов и передать им корректные массива в качестве параметров мне сначала в голове нужно создать sql-запрос. Т.е.

$select->from(array('i' => 'image'), array('id', 'title', 'description'))->joinLeft(array('t' => 'table2)', 't.image_id = i.id', array('id'? 'title')) — это и есть orm? Если да, то так или иначе я должен понимать, что я такое написал и что оно значит и все так или иначе сводится к текстовому sql-запросу.

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Тут сложно сказать ORM это или нет. Но во «взрослых» системах это выглядит примерно так:

$datacontext = $db.getContext();
$wallItem = $datacontext.wall().getById($id);
$wallElementItems = $wallItem.elements();

Что есть в php на эту тему, честно говоря не могу сказать. Я сейчас больше на .NET. Там это делает EntityFramework либо nhibernate. В джаве hibernate.

Написано более трёх лет назад

10 комментариев

excalibur @excalibur Автор вопроса

Нет, не то… Совсем не то… Посмотрел в Ваш профиль… Вы где-то на 2-3 курсе. У Вас нету того опыта, чтобы ответить на этот вопрос, даже если Вы и гений. Но за внимание к вопросу спасибо.

Написано более трёх лет назад
Дмитрий Гукетлев @Yavanosta

Охренеть, извините, у вас подход. Из вашего вопроса не понять, что вам вообще нужно. Что спросили, вам то и ответили, формулируйте четче и короче.

«Вы на втором курсе, у вас нет опыта». Ну тогда, простите великодушно, милостивый государь, но я как студент шестого не могу более тратить ваше драгоценное время своими неразумными словами. Куда уж мне. Но за внимание к моим ответам спасибо.

Написано более трёх лет назад
Никита Гусаков @hell0w0rd

Я на 1 курсе;) Обожаю когда судят по возрасту. Как вы мой опыт определили?

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Если будете работать с первого курса, Вы просто не успеете за учебой и Вас отчислят рано или поздно) А опыт — по возрасту, конечно… В 75% я буду прав))

Извините за резкость… Вопрос на самом деле в заголовке, т.е. «Как написать стену»…

Написано более трёх лет назад
Никита Гусаков @hell0w0rd

Если вы позволите абстрагироваться от кол-ва опыта у меня — попробуйте прикинуть что плохого в предложенном мной варианте? Вы зачем-то перешли на личности, вместо уточнения своей задачи. Посмотрите пару открытых движков соц-сетей, если вы не доверяете студентам.
А студенты отличаются от других программистов тем, что еще «не застолбились». То что они учат — учат в основном для себя. Не отчислят, спасибо что переживаете.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Ну я же извинился за резкость… Я просто не понял что Вы мне предлагаете…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>А вот в таблице постов должна быть связь со всеми составляющими поста, а также связь с автором.

Ну да, связь я и показал в таблице «wall_element» — Здесь связь почти со всеми таблицами базы данных.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Т.е. в этой таблице предоставляются идентификаторы для моделей компонент.

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

Использую ZF, т.е. MVC — отсюда и модульный подход (я это называю компонентами, т.е. набор контроллеров, моделей и представлений)…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>Посмотрите пару открытых движков соц-сетей, если вы не доверяете студентам.
На изучение чужого кода уйдет слишком много времени, а на счет структуры БД после долгих «исследований» я пришел к выводу, что именно эта структура позволить реализовать соц-функционал… Здесь нету никакой дискриминации. Если программист с 10-летним опытом даст мне совет и я буду уверен, что это плохой совет — я им не воспользуюсь и наоборот, если студент даст отличны совет — то было бы глупо им не воспользоваться.

Написано более трёх лет назад

3 комментария

excalibur @excalibur Автор вопроса

Это писалось в 2010… А подобное кеширование переменных использую в джаваскрипте… на счет пхп — спасибо буду знать…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>Вы пытаетесь определить ту, что быстрее работает
Ничего я там не пытаюсь определить по скорости… там простой подсчет количества…

Написано более трёх лет назад
excalibur @excalibur Автор вопроса

>И вы еще после этого кого-то упрекаете в отсутствии опыта?
Не было никакого упрека… Только констатация факта… Когда я провожу собеседование с программистом, я могу довольно легко определить уровень его опыта по его ответам и вопросам… Это не высокомерие… Хотел сэкономить себе время, чтобы не объяснять больше чем нужно… И нет пределу совершенствованию… И когда придет время — займусь рефакторингом той функции :)

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как исправить ошибки шаблона WP?
- 1 подписчик
- 14 июл.
- 136 просмотров
1

ответ
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 2 подписчика
- 17 июн.
- 225 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 483 просмотра
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 259 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 204 просмотра
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 162 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2487 просмотров
8

ответов
MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 138 просмотров
1

ответ
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 354 просмотра
6

ответов
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 119 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2013-03-30 19:54:24

UNION не так уж и плох. Особенно UNION ALL, где не требуется выбирать уникальные записи. По крайней мере он будет не медленнее чем выполнить каждый запрос по отдельности, за счет того, что может теоретически быть выполнен параллельно на нескольких ядрах.

Но если не подходит, давайте от печки. Вы постулируете следующее «мы не можем выбирать все в одном запросе, чтобы не мешать модели».

Значит минимальное количество запросов получается равным количеству_типов_данных. Для этого нужно выполнить по отдельности запросы которые у меня в UNION, но тогда вручную в коде сортировать эту кашу по датам и группировать по wall_id. Это плохой путь.

Предлагаю такой вариант:

SELECT
	w.id,
	w.description,
	COUNT(i.id) i_cnt,
	COUNT(bp.id) bp_cnt
FROM wall w

INNER JOIN wall_element we_i
        ON we_i.wall_id = w.id
INNER JOIN image i
        ON i.id = we_i.element_id

INNER JOIN wall_element we_bp
        ON we_bp.wall_id = w.id
INNER JOIN blog_post bp
        ON bp.id = we_bp.element_id

ORDER BY w.timestamp

GROUP BY w.id, w.description

Мы получаем список записей, и количество связанных с каждой записью единиц контента. Дальше разделяем ответственность в коде следущим образом:
1. основной код выполняет этот запрос, и бежит по результатам. Смотрит, что есть в конкретной записи. Например видит что картинка, и товар из магазина
2. основной код вызывает соответствующие рендереры, передавая им идентификатор записи wall_id.
3. рендерер сам (своим запросом) достает уже те данные, которые ему нужны оттуда, откуда хочет, в ту модель, которая ему нравится. Это полностью развязывает рендереры друг от друга и от вызывающего кода.

Итого имеем запросов: количество_записей_на_стене * среднее_количество_единиц_контента + 1. Думаю у вас в среднем 1 запись на стене будет иметь ссылку на 1 единицу контента (например пяток фоток, которые рендерер картинок сможет вытащить одним запросом).

Имеем в среднем запросом количество_записей_на_стене + 1. Вполне приемлимо.

Answer 2 · 2013-03-30 22:47:51

Я бы сделал так:(читать до конца)
1)создал бы таблицу wall с полями id, author_user_id, author_user_name, owner_user_id, wall_content, где
-id идентификатор записи в таблице-
— author_user_id — идентификатор пользователя создавшего пост
-author_user_name его имя, внесем сюда же, чтобы не делать лишний запрос к таблицам пользователей
-owner_user_id — идентификатор владелец стены
-wall_record_content — контент записи. представляет собой json с полями title, description,images, видео, опросы и что у ваc там есть. пример

content: {
title: SuperProPost,
Mysuper_Puper_Images: [{
Photo_link1, Photo_link1

}],
Mysuper_Puper_Video_links[{
videolink1, videolink2....
}]
и т.д,
}

Структура на самом деле будет немного посложней, но я думаю вы справитесь.
И потом уже в самом скрипте обрабатывать этот json и формировать шаблон. При записи и изменении скриптом формировать этот json и записывать его в БД,

В итоге все будет получено одним запросом, нагрузка на БД будет минимальна. Без джойнов.

Select  * from wall_1234(лучше использовать шардинг чтобы не было по 20 млн записей в одной таблице) where owner_id=Owner_id_from request Limit 0, 20 (к примеру)

На каждые 50 пользователей выделять отдельную таблицу wall_groupId. Таким образом все данные для стены будут получены, внимание, в ОДИН запрос из таблицы на 100-300 тысяч записей, за что БД скажет нам спасибо
Я надеюсь мысль ясна, подкорректируйте под свои нужды.

Answer 3 · 2013-03-31 00:15:38

Из таблиц не надо тянуть для всей стены, слишком тяжело.
На счет «кэширования»? А в чем проблема закэшировать ответ на мой запрос? Тот же memcashed отлично закэширует результаты запросы

Select  * from wall_1234 where owner_id=Owner_id_from_request Limit 0, 20

Ладно, давайте я объясню механизм подробнее. В поле «wall_record_content» вся фишка. Оно нам крайне необходимо и именно оно позволяет нам очень легко выводить данные. Но для этого нам придется заплатить тем, что вводить их будет немного сложнее. Но это не страшно, в соц сети намного чаще читают чем пишут.

Начинаем.
Пользователь создает пост на стене друга.

Готовим запрос на сервер. Вначале ~~кипятим воду~~ включаем личные данные пользователя как автора(имя и id в приложении) и id друга для поля id_owner_user в запрос. Отлично, мы молодцы, но это еще не все.

Дальше пользователь вводит описание. Ничего себе. Тоже вставляем эти данные в параметр description нашего запроса. Идем дальше.
Пользователь прикрепляет фото и видео. Чтобы можно было просматривать фото нам необходим адрес маленькой картинки(в дальнейшем буду называть его «превьюшкой» )и адрес страницы, где мы будем просматривать фото в полном размере. Допустим у нас есть несколько способ прикрепления фото: драг-эн-дропом, если фото уже было добавлено на сервер, или сразу с локального компьютера(или телефона)

Если фото было ранее загружено на сервер (то есть эти данные уже записаны в БД), то просто с помощью ajax запроса получаем эти данные из БД.(Возможно и не потребуется, если на страницк у нас уже есть необходимые данные для фото). Полученные данные вставляем в параметр массив Post_images.

Если нет, то ПЕРВЫМ ДЕЛОМ ЗАГРУЖАЕМ ФОТО НА СЕРВЕР с помощью ajax запроса(с помощью него будет проще) и вносим данные о фото в таблицу images. Когда это будет сделано, возвращаем данные ajax запросом. Включаем их в параметр Post_images. Неплохо.

Теперь у нас есть параметр в котором содержатся данные о фотографиях, которые прикреплены к посту.

Аналогично с видео и аудио. Супер!

Теперь у нас есть полностью сформированные Post запрос с параметрами author_user_id, author_user_name, owner_id, post_description, Post_images, Post_videos. Отправляем на сервер. И не забываем про CSRF-защиту. Мы любим своих пользователей и заботимся о них.

На сервере принимаем данные запрос, обрабатываем его и записываем в БД как я писал в первом посте.
Пример json-a, которые попадет в БД.

content: {
description: Срочно оцени эти супер-крутые фотки! ,
Mysuper_Puper_Images: [{
Photo_link1{
preview:"images.site.com/dsfgdfgsdg.jpg"
link:"www.site.com/viewphoto/345345345345"
},
Photo_link2{
preview:"images.site.com/dsfgdfgsdg.jpg"
link:"www.site.com/viewphoto/345345345345"
}

}],
Mysuper_Puper_Video_links[{
videolink1{}, videolink2{}
}]
и т.д,
}

Вот и все, теперь у нас в базе лежит пост пользователя.

В сеть выходит друг Павел Недуров. Первым делом он идет на свою стену, чтобы просмотреть, что симпатичные девчонки написали ему за день. При загрузке его стены мы формируем запрос

Select  * from wall_1234 where owner_id=Owner_Павел НедуровID Limit 0, 20

Наш скрипт получает из базы( или memcashed) результат выполнения этого запроса. Обрабатываем эти данные и выводим их в нашем шаблоне, не забывая все экранировать для предотвращения xss атак. Мы любим пользователей!

В итоге на странице будет выведено:
1)текст записи
2)маленькие картинки, по клику на превьюшку переходим на страницу, где можно просмотреть большую версию.
3)маленькие картинки с кадром из видео, по клику переходим на страницу, где можно просмотреть видео(хм, где-то я уже это слышал)

Пост друга Павлу понравился! Но вот незадача, симпатичные девчонки сегодня ничего не написали. Не горюй, бро, твое время еще придет. А на этом наша программа подходит к концу. В следующей передаче раз мы будем делать новостную ленту. Оставайтесь на связи.

В итоге благодаря моему способу очень легко и быстро выводить записи, ведь все данные мы получаем одним запросом. И легко кэшировать. И индексы тоже можно использовать. Картинки хранятся в таблице images, видео — в videos. Все можно легко просмотреть. Но с реализацией ввода поста придется немного попотеть, но результат того стоит.

P. S. Не принимайте ничего на свой счет, это у меня просто такой стиль.

Answer 4 · 2013-03-30 11:45:16

Никита Гусаков @hell0w0rd

Просто разработчик

Использовать JOIN'ы или что вы хотите услышать?

Ответ написан более трёх лет назад

1 комментарий

Answer 5 · 2013-03-30 12:06:04

Как можно втянуть «те 20 фото которые вы добавили на стену» если у вас нет идентификатора пользователя нигде.

Если просто все фото на стене, то так:

SELECT
	w.id,
	w.description,
	we.*
FROM
	wall w
INNER JOIN wall_element we
	ON w.id = we.wall_id

Это то, что вы хотели?

Answer 6 · 2013-03-30 13:42:53

То, что вы пишите в вопросе, и если так делаете — это индусский код. Не надо решать задачи SQL посредством PHP, или другого языка. Тем более запросы к бд в цикле/рекурсии, еще как-то.
У вас должно быть как с классами — каждый класс отвечает за свое — так и в базах данных, каждая таблица отвечает за свое. В таблице картинок вы храните все что нужно по картинкам, в таблице видео, ну вы поняли. А вот в таблице постов должна быть связь со всеми составляющими поста, а также связь с автором.
Мартин Грубер — Понимание SQL — говорят что перевод не самый лучший. Однако мне книга очень понравилась, и вам советую.

Answer 7 · 2013-03-30 14:04:25

Кстати простите за оффтопик, но я вот бегло посмотрел ваш сайт. Первой глянул на вот это:
excalibur.com.ua/blog/php-c3/%D0%B3%D0%B5%D0%BD%D0%B5%D1%80%D0%B0%D1%82%D0%BE%D1%80-%D0%BF%D0%B0%D1%80%D0%BE%D0%BB%D0%B5%D0%B9-%D0%BD%D0%B0-php-i22.html

Вы пытаетесь определить ту, что быстрее работает, и в обоих ВНУТРИ цикла делаете count($arr) и strlen($chars). Вы не думали, что если вынести подсчет длинны массива и длинны строки за цикл, то у вас функция ускорится примерно в $length раз? И вы еще после этого кого-то упрекаете в отсутствии опыта?

Answer 8 · 2013-03-30 14:43:07

Если я правильно понял.

Одним запросом через джоины вытаскиваете все данные. Поле у которого какой например description= NULL говорит о том что это не запись а элемент записи(фото, видео...). В цикле когда обрабатываете запрос сразу же видите как его рендерить.
То есть вся идея в том, что вы результат запроса сводите к одному формату который уже кодом направляете куда вам нужно.

Стена соцсети: выборка данных

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт