Подобрать архитектуру распределённого Yii-приложения?

Question

Виталий Петров @vitaly_KF

Разработчик Qt/C++

Подобрать архитектуру распределённого Yii-приложения?

День добрый есть у меня такая задача — разработать веб-приложении, позволяющее редактировать некую базу данных.

Базовые технологии: Yii, PHP, MySql, Ubuntu, Apache2

В будущем данное приложение должно будет устанавливаться у множества заказчиков, соответственно копий баз будет также несколько.

Все организации в которые будет устанавливаться данное По имеют строгую иерархическую структуру. Допустим… трёхуровневую. Где на самом нижнем уровне организация должна иметь доступ лишь к своим данными, организация находящаяся на ступеньку выше — к своим и к данным всех подчинённых организаций, а самая высокая в иерархии — вообще ко всем-всем-всем данным.

C начала конечно хотелось попробовать простую репликацию — но не пройдёт, так как организации должны вносить данные каждая на своём уровне, а нормально master-master репликации от MySql добиться пока что насколько я знаю невозможно.

Теперь же единственный выход который я вижу — это сделать некое подобие шардинга. Понравилось например решение, описанное в данном посте habrahabr.ru/post/129780/. Но вот как бы его красиво применить я не знаю. Казалось бы — можно не заморачиваться со сквозной нумерацией таблиц, с guid и прочим, а просто позволять каждому уровню пользователей работать только со своей БД. А потом на каждом новом уровне иерархии просто определять одновермено несколько подключений к БД и искать данные одноврменно по всем подчинённым базам через Sphinx (с коим я тоже ни разу не знаком и даже не в курсе можно ли на нём настроить подклчюение к нескольким базам данных расположенным на нескольких серверах).

Но это всё в теории, на практике почему-то в голову не лезет никаких идей. даже вопрос нормально сформулировать как-то не вышло =)

Что можете посоветовать?

Вопрос задан более трёх лет назад
5040 просмотров

Комментировать

Подписаться 8 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее
Академия Эдюсон

FullStack-разработчик: тариф PRO

14 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Виталий Петров @vitaly_KF Автор вопроса

Огромное спасибо Вам за такой большой и развёрнутый ответ.

К сожалению выходит чутка не то…

Во первых — нам почти никогда не нужно, чтобы документы сверху спускались вниз, нужно чтобы наоборот все записи с низов поднимались наверх по иерархии. То есть в терминах репликации — от слейвов к мастеру.

В другую же сторону должна спускаться структура таблиц. То есть на главном сервере прям в интерфейсе приложения можно изменять структуру таблиц и она должна будет спускаться вниз по иерархии.

Во вторых — пользователи у нас такие, что после к примеру создания новой записи у себя в организации они тут же захотят её увидеть.
Я бы здесь попробовал использовать обычную репликацию, но надо будет каким-то образом обрабатывать такой момент, что данные, которые были только что добавлены/изменены — нужно подтягивать с мастера. Да вот засада — никакого мастера может и не быть, если организация всё захочет хранить и настраивать у себя… Вплоть до структуры таблиц, а зтем влить всё это в общую базу уже не выйдет… Короче геморой блин.

Буду думать. Ваше предложение держу в голове. Ещё раз спасибо за ответ.

Написано более трёх лет назад
Максим Дьяченко @Mendel

Так у себя то они ее и увидят сразу. Это соседи увидят не сразу. Но опять таки это вопрос реализации. Если у вас будет хорошо налаженый канал между серверами, то вы можете выделить одного демона, который будет в бесконечном цикле оббегать всех нижестоящих и проводить с ними синхронизацию (или вышестоящих, это уже детали даже не реализации а настройки). Тогда можно будет добиться того, что задержки будут в пределах секунды. Просто озвученная схема позволяет работать в плохих сетевых условиях. У меня один канал в подобном проекте сейчас реализован в виде флешки :)

Что касается изменения структуры, то советую сильно подумать. Очень сильно. Отдавать такое прикладному админу это уже страшно, а пользователям… ну мне вот сходу не приходит в голову ни одна задача где это было бы уместно. Подумайте о другом решении. Вплоть до EAV.

С другой стороны передавать изменение структуры вполне себе можно таким же образом. Я понимаю что мне хорошо говорить, у меня в моем ORM есть AR и для полей таблиц, и для списка таблиц, и даже для баз на сервере, но в принципе в этом нет ничего сложного. Вы ведь все равно будете себе какую-то модель писать для работы со структурой базы. Вот в них и заложите те же методы репликации. Но я еще раз повторюсь — плохое это дело. Советую лучше создайте еще вопрос, с подробным описанием задачи и вашего видения архитектуры. Думаю вам подскажут как избежать изменения структуры.

Написано более трёх лет назад

3 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+3 ещё

Средний
Как организовать автоматическую выдачу цифровых товаров после оплаты на чистом PHP?
- 2 подписчика
- 20 апр.
- 200 просмотров
3

ответа
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 313 просмотров
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 222 просмотра
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 196 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 210 просмотров
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 295 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 151 просмотр
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 187 просмотров
1

ответ
MySQL

Средний
Почему время в mysql опережает на пару секунд?
- 4 подписчика
- 06 янв.
- 435 просмотров
4

ответа
Yii

Простой
Yii1 в поля типа datetime вставляет значение по умолчанию «current_timestamp()» как строку. Как починить?
- 1 подписчик
- 28 дек. 2025
- 88 просмотров
0

ответов
Показать ещё Загружается…

Системный администратор Linux (SysOps)

НТЦ ПРОТЕЙ • Санкт-Петербург

До 200 000 ₽

Fullstack PHP Laravel/VueJS разработчик

Emsoft

До 150 000 ₽

Fullstack developer (python/react)

Крона Лабс • Екатеринбург

от 200 000 ₽

Answer 1 · 2013-06-29 14:29:15

У меня похожая ситуация. Разрабатываю SaaS приложение, где много пользователей, при этом каждый сам себе король, у каждого своя нумерация (id) и т.д. и т.п. Тоже думал про несколько баз, но в результате решил использовать одну базу

В БД к таблицам добавляю поля (int) personalID и projectID, а дальше наследуюсь вот от этого класса

abstract class PersonalActiveRecord extends CActiveRecord
{
  public $usePersonalID = true; // Использовать ли персональную нумерацию
  public $personalID = null;
  public $projectID = null;

  protected function personalIdExpression(){
    $sql =
      'COALESCE((SELECT personalID FROM
        (SELECT (MAX(personalID)+1) as personalID FROM '.$this->tableName().' WHERE projectID = '.$this->projectID.')
      as personalID ),1)';
    return new CDbExpression($sql);
  }

  protected function beforeSave(){
    if (!parent::beforeSave()) return false;
      if ($this->isNewRecord) {
        $this->projectID = (int)Y::param('projectID');
        if ($this->usePersonalID)
          if ($this->personalID===null) $this->personalID = $this->personalIdExpression();
      }
    return true;
  }

  public function defaultScope() {
    return array(
      'condition'=>"projectID='".(int)Y::param('projectID')."'",
    );
  }

}

Answer 2 · 2013-06-13 19:24:45

Первое что Вам нужно сделать это разобраться с guid.
Я не пробовал этого в Yii, но насколько я помню навскидку там не должно быть серьезных препятствий к его использованию.
Если есть какие-то наработки, модули модели и т.п., то надо будет их приучить к новой структуре. Поменять типы полей в базе (включая связанные), поменять автоинкремент на генерацию гуид по вашей логике и т.п.

Создаете себе базовый класс наследник от CActiveRecord, скажем CDistributedActiveRecord.
Этот класс у вас будет отвечать как за guid так и за репликацию.
Собственно все АР наследуют от него.

Проектирование архитектуры нужно начать с четкого планирования базы.
Очевидно что часть таблиц у вас будут уместны во всех базах, без фильтрации. К примеру таблица содержащая список организаций в вашей иерархии нет смысла. Вообще стандартная логика обычно такая — «справочники» мы имеем общие, «документы» у каждого свои. К примеру номенклатуру (товары, виды услуг и т.п.) лучше отнести к справочникам, и тиражировать централизованно, а вот к примеру прайс из этой номенклатуры лучше считать документом (но опять де от специфики зависит). «Документы» и «справочники» нам не обязательно делать так строго как в 1С, мы ведь свою архитектуру делаем. К примеру сотрудники/пользователи по логике это справочник, но мы можем отнести его к документу, и вообще сделать два базовых класса для них. Это опять таки сильно зависит от вашей задачи.

Далее вам необходимо будет создать критерий, по которому вы будете определять кому принадлежит тот или иной документ, и нужно ли его передавать. В простейшем случае это будет идентификатор предприятия/подразделения. Очень хорошо будет, если он будет у вас простой, и универсальный. Т.е. чтобы он во всех таблицах которые реплицируются был одинаков. Пусть он будет у нас называться ПредприятиеВладелец.
Обратите внимание, что если вышестоящие подразделения будут не только просматривать данные нижестоящих, но и вносить в них изменения, или еще хуже — создавать связанные с ними новые документы, то вы должны указывать этим документам правильное ПредприятиеВладелец. Если документ подразумевает, что его должны прочитать в подчиненном предприятии (к примеру это документ содержащий резолюцию по заявке полученной из подчиненного подразделения), то необходимо указывать у такого документа ПредприятиеВладелец равное тому, которое было указано в документе связанном с этим (т.е. в нашем примере Владелец из «заявки»). Если вы укажете Владельца равного предприятию в котором был создан документ, то потом придется городить сложные критерии того какой документ передавать при репликации и кому передавать.

Совет — сильно подумайте о внешних ключах. Как это отразится на ваших ручных репликациях.

Теперь перейдем собственно к репликации. Тут я сделаю несколько допущений. Если они неверны, то озвучьте. Для начала я предположу, что вам не нужна реалтайм репликация. Т.е. было бы хорошо, чтобы все документы появлялись в ту же милисекунду в другой базе, но если будет задержка даже в несколько минут, то никто не умрет, не будет нарушена целостность данных и т.п. Второе допущение — скорее всего у вас будет не много маленьких изменений больших записей. Т.е. если вы не создаете запись, а вносите в нее изменения, то вы все равно можете передать всю измененную запись, а не только изменения, и при этом излишние накладные расходы будут не очень высокими. К примеру если вы даже передаете в базе файлик, который весит несколько мегабайт, то вы либо изменяете сам файл и размер изменения большой, либо его описание, которое занимает небольшую часть общего объема. В идеале если у вас ожидается большое количество изменений этого самого описания, без изменения «файла», то лучше разделить это на две связанные таблицы, чем городить сложную репликацию.

Если мои ограничения вам подходят, или вы готовы под них подстроится, то можем переходить к репликации.
Для репликации мы переопределяем методы создания и изменения записей таким образом, чтобы они сохраняли наши изменения в журналы.
Журналы могут быть как у каждой реплицируемой таблицы, так и общие для всех. Зависит от задачи. Журналы у нас содержат в себе только:
инкрементарный номер записи, который представляет из себя «скрытое время», который является сквозным для всех таблиц, возможно название таблицы, и guid изменяемой записи. Также мы указываем что произошло с записью. для целей репликации у нас есть два действия — сохранение и удаление. Нам не интересно была ли запись создана, или редактируется старая — все равно нам ее передавать.

Далее мы создаем еще одну таблицу, в которой у нас будут указаны узлы с которыми у нас предусмотрена связь. Здесь может быть что угодно, включая реквизиты для связи с узлом, но обязательными полями должны быть — признак того, какие именно записи передавать (поскольку некоторые данные могут передаваться в несколько узлов сразу, то нет смысла выносить это в журналы репликации) и два номера обработанных записей: входящий и исходящий (не путать с номерами сообщений в 1с). В этих номерах мы будем отражать какие записи из журналов репликации мы получили или отправили (или если у нас будет оффлайн репликация, то какие изменения мы отправили и получили о них подтверждение о получении). Далее при передаче инфы соседям, мы будем делать запрос в журнал репликации, который будет отбирать только данные с нужным ПредприятиеВладелец (или без ограничения если у нас отправка «наверх») и с номером записи больше чем номер уже обработанный. Имея список записей которые нам надо отдать мы ищем их в соответствующих таблицах, формируем пакет для синхронизации, и отправляем его. При получении пакета мы проверяем записи на факт того, не являются ли эти записи уже отработанными до этого (проверяем по номеру, особенно критично для оффлайн синхронизации).

Обратите внимание — мы не храним все изменения, а храним только номера измененных записей. При получении мы или изменяем запись, или создаем новую если таковой нет, или удаляем если указано удалить.

Как передавать информацию? да как угодно. Хоть по почте кидайте в виде json.

Не забывайте чистить «журналы репликации» от записей которые уже не нужны никаким из узлов с которыми есть связь (т.е. чьи номера меньше чем ВСЕ исходящие номера у всех узлов). Также хочу обратить ваше внимание на размерность счетчика-идентификатора в этом журнале. Делайте его побольше :)

Что еще важно в большой, распределенной системе? Важны тщательно продуманные права пользователей, и важны ЛОГИ. Много больших и разных логов. Еще больше логов. Логи для разбора полетов лучше всего вести отдельно от журналов репликаций. В них требуется большая детализация чем там, с другой стороны они читаются редко, а пишутся часто, так что индексация нужна в меньшей степени. обязательно указывать кто вносил изменения, когда вносил и т.п. В идеале такие журналы держать вообще в отдельной базе или даже в текстовом файле.

Вроде пока всё что вспомнил.

Answer 3 · 2013-06-13 08:30:33

Max @7workers

Я так понял, вариант с единой базой по какой-то причине не подходит?

Ответ написан более трёх лет назад

3 комментария

Подобрать архитектуру распределённого Yii-приложения?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт