Распределенное хранилище изображений

Question

skvot @skvot

Распределенное хранилище изображений

Привет, хабр!
Задача заключается в создании распределенного хранилища изображений, которые необходимо хранить в различных размерах, исходные картинки могут храниться на любом из серверов.

Мы пришли к следующей схеме: есть физическая машина, являющаяся точкой входа, и N дополнительных хранилищ. На главном сервере установлены nginx, слушающий 80 порт и apache. При обращении к серверу nginx ищет обработанное изображение в файловой системе, если не находит, пытается найти изображение на дополнительных серверах. Если изображения нет и там, через apache nginx обращается к PHP скрипту, который ищет исходник нужного изображения на машинах (загружатся изображение может напрямую на любую из машин), выполняет необходимые обработки и сохраняет обработанные изображения в хранилище. Если же не найден оригинал изображения, php отдает 404-е заголовки, в ответ на которые nginx отдает картинку-заглушку.

Прошу советов по самой схеме работы (возможно, есть альтернативные варианты построения взаимодействия, которые нам подойдут?), а так же помощи с конфигурированием nginx (конкретно — не получается обработать возвращаемые apache заголовки в nginx через error_page).

Всем заранее спасибо!

Вопрос задан более трёх лет назад
4655 просмотров

1 комментарий

Подписаться 5 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

Язык программирования PHP

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 5

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Хранение данных

+1 ещё

Простой
Есть ли программа, которая сравнит два диска на наличие дубликатов файлов (побайтно!) и покажет файлы, НЕ имеющие двойников?
- нет подписчиков
- 7 часов назад
- 67 просмотров
0

ответов
PHP

Простой
Как отдать ответ клиенту без ожидания завершения скрипта?
- 1 подписчик
- 21 час назад
- 174 просмотра
3

ответа
PHP

Простой
Как в PHP вернуть NULL по ссылке?
- 1 подписчик
- вчера
- 122 просмотра
1

ответ
Nginx

Простой
Как сделать так, чтобы nginx не слушал http, а только https?
- 1 подписчик
- вчера
- 267 просмотров
2

ответа
Nginx

Простой
Почему не работает защита?
- 2 подписчика
- 20 дек.
- 141 просмотр
0

ответов
PHP

Простой
Как декодировать/закодировать спец символы в get запросе?
- 1 подписчик
- 18 дек.
- 134 просмотра
1

ответ
PHP

Простой
Как вызвать curl и не ждать ответ?
- 1 подписчик
- 16 дек.
- 313 просмотров
2

ответа
Ubuntu

+2 ещё

Средний
Кто сталкивался с 'Nginx invalid URL prefix' и 'Promtail client version too old' после обновления Docker на Ubuntu 24.04?
- 1 подписчик
- 13 дек.
- 162 просмотра
0

ответов
PHP

Простой
Как сделать это?
- 1 подписчик
- 11 дек.
- 298 просмотров
2

ответа
Nginx

+1 ещё

Простой
Как настроить выдачу данных с одного домена на другом в ingress k8s?
- 1 подписчик
- 07 дек.
- 98 просмотров
0

ответов
Показать ещё Загружается…

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

TeamLead PHP (Symfony)

AGIMA • Москва

от 210 000 ₽

Answer 1 · 2013-11-05 12:39:37

Не совсем понятно, почему «исходные картинки могут храниться на любом из серверов».
Логично было бы сделать такую архитектуру, при которой по имени изображения можно однозначно определить ее местоположение.
1. В момент загрузки картинки определять сервер, на котором она должна храниться.
2. Именовать картинку соответственно хранилищу.
3. При отдаче вы точно знаете, где ее искать.

Answer 2 · 2013-11-05 11:22:36

Имхо будет совсем не быстро. Ну локально файл проверить не долго, а вот проверить на других N серверах будет уже и не быстро. И опять же узким местом может оказаться канал до балансировщика (точки входа).

Я бы посоветовал рассмотреть вариант, когда на этапе генерации html контента уже известно месторасположение картинок. Каждый сервер имеет своё поддомен, например: img1.domain.com, img2.domain.com и т.д. Здесь вы так же сможете легко накинуть dns балансировку.

Ну и соответственно, если нет готовой картинки, уже отдаёте путь до пхп скрипта.

Хранить id хранилища рядом с нужной версией картинки будет не сложно.

Answer 3 · 2013-11-05 12:21:02

К главной машине через NFS подключены N с превюшками.
Через NFS легко проверяем на каком из серверов есть уже обработанное изображение и редиректим на него.
Изначально через NFS планировалось только проверять наличие файла, но после долгих тестов оказалось что даже с записью превюшек на другие сервера он справляется на ура. Падает не чаще раз в год.

Answer 4 · 2013-11-05 12:36:31

А почему не сделать простую БД на точке входа, в которой будет храниться путь до картинки (или хотябы имя сервера)? Поиск все равно будет производиться, но на правильно сделаной базе искать придется намного меньше, и работать будет намного быстрее.

Answer 5 · 2013-11-05 12:48:57

Я хочу предложить следующий вариант.

Идея:
0 опционально — поиск на локальной ФС
1 создаётся хэш-функция от пути к картинке, возвращающая целое число. hashVal
2. выбирается фронт сервер с номером hashVal % serversCount, и если он живой — стягивается картинка с этого сервера. если её нет — то генерится.
3. если сервер не живой — берем следующий.и переходим к пункту 2.

На практике такое решение ущербно по причине того, что после выхода из строя сервера — следующий сервер становится перегружен.
В живом проэкте используется модификация:
Есть 1000 записей в мэмкеше. Инициированых значениями из пункта 2. После падения фронт сервера его индексы меняются на индексы живых серверов случайным образом. После поднятия — восстанавливаются.
(на самом деле чуть сложнее, так как каждая картинка живет всегда на 3х серверах, и доступ к ним балансируется каруселью, но это не важно для этого вопроса)

Распределенное хранилище изображений

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт