Как организовать синхронизацию файлов для собственного CDN?

Question

yiicoder @yiicoder

Как организовать синхронизацию файлов для собственного CDN?

Потребовалось раздавать среднего объема статику(250-500TB/месяц). Реализовали свой "cdn"в виде N-количества серверов Nginx с синхронизацией данных по Rsync. Нам очень важно, чтобы при обновлениях контент быстро разлетался по серверам, поэтому реализовали в виде master-slave, где master - это центральный сервер куда заливаются данные, работает в пассивном режиме: на каждом slave работает rsync по крону и забирает данные.
Плюсы из этой схемы следующие:
- если мастер упадет, то на каждом сервере есть копия всех данных
- мастер сервер ничего не знает о slave'ах, легко добавлять новый сервер в группу.
- для инициации обновления серверов достаточно просто залить новый контент (не требуется дополнительного активного действия)
Минус получается следующий:
Хотя, объем статики не большой (5-6гб), но 10 серверов, каждую минуту дергая мастер-сервер rsync'ом - очень неплохо его грузят.
Есть желание сохранить все плюсы и как-то разобраться с минусом, я так понимаю RSYNC вынужден каждый раз на каждый запрос сканировать файлы и это что-то неплохо ест CPU, хотя 99% времени файлы не меняются(обновления происходят 2-3 раза в день).
Как можно переработать схему? Каким ПО воспользоваться?

Вопрос задан более трёх лет назад
902 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 7

Комментировать

3 комментария

yiicoder @yiicoder Автор вопроса

К сожалению URL не всегда меняется, CDN используется для нескольких проектов и в одном, очень старом ПО настроено на простую заливку по ФТП и не просто этот процесс изменить.
Рассматривали вариант с proxy_pass, но:
1) нужно дублировать мастер (для надежности)
2) появляется необходимость пробежаться по всем серверам и сбросить кэш

Написано более трёх лет назад
Алексей @alsopub

Скинуть кеш нужно только у изменившихся файлов, на всех cdn, это да.
Но я не вижу в этом проблему, или как часто и сколько обновляется файлов?
Мастер дублировать, в принципе, можно тем же способом, на нем в первую очередь обновить кеш у измененных файлов, а затем разослать запросы на cdn.

Написано более трёх лет назад
Алексей @alsopub

Примерно по такой схеме - joxi.ru/DrlOkeGC4643RA.png
Где зеленое - заливка по ftp, синие - запросы proxy_pass, красное - запросы к nginx для сброса кеша.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+4 ещё

Простой
Возможно ли получить интернет с openwrt в proxmox?
- 1 подписчик
- вчера
- 179 просмотров
4

ответа
Linux

+2 ещё

Простой
Как настроить Matrix Synapse сервер, чтобы работал клиент Element X (Element подключается)?
- 1 подписчик
- 17 окт.
- 65 просмотров
1

ответ
Nginx

Простой
Как определить картинку: Встроена в страницу или прямая ссылка?
- 1 подписчик
- 16 окт.
- 162 просмотра
1

ответ
Nginx

Простой
Откуда nginx берет главную страницу сайта в моем случае?
- 1 подписчик
- 15 окт.
- 145 просмотров
2

ответа
Linux

Средний
Какой Linux поставить в виртуалку, чтобы поднять на нём OpenVPN клиент и 3proxy сервер для локального использования?
- 4 подписчика
- 15 окт.
- 386 просмотров
4

ответа
Linux

Простой
Как запустить две копии программы в Linux?
- 2 подписчика
- 14 окт.
- 425 просмотров
4

ответа
Linux

+1 ещё

Простой
Какой самый стабильный и лучший вариант собрать QUIC для curl [cross-compilation]?
- 1 подписчик
- 14 окт.
- 111 просмотров
0

ответов
Linux

+2 ещё

Средний
Существует ли готовое решение или проект для организации Linux-шлюза с маршрутизацией, VPN и DPI-обходом?
- 5 подписчиков
- 13 окт.
- 1049 просмотров
2

ответа
Linux

+1 ещё

Средний
Не вижу трафика клиентов и их онлайн в панели 3x-ui, что можно сделать?
- 2 подписчика
- 13 окт.
- 686 просмотров
2

ответа
Linux

+1 ещё

Простой
Как запретить удаление папки в Linux?
- 1 подписчик
- 13 окт.
- 299 просмотров
2

ответа
Показать ещё Загружается…

Ведущий инженер-проектировщик линий электропередачи (ЛЭП)

ЭЛСИ Энергопроект • Новосибирск

от 121 000 ₽

Системный администратор Linux

Abc staff • Москва

До 250 000 ₽

Специалист первой линии технической поддержки

Петрович-Тех

До 52 882 ₽

Answer 1 · 2016-05-16 12:12:04

Master-slave структура под нагрузкой часто подразумевает, что на мастер идут запросы только на запись-обновление, а мастер пушит изменения на слейвы

Можно воспользоваться встроенным функционалом nginx - настроить проксирование с кешированием
Те запрос поступает на слейв, если у него в кеше есть контент, то он отдает, если нет, то идет на мастер, забирает контент, кеширует и отдает клиенту
В таком случае, тебе не нужно ничего копировать, просто добавить его имя в список серверов для статики

Answer 2 · 2016-05-16 12:26:39

Возможно, стоит изменить схему распространения с "слейвы тянут с мастера" на "мастер пушит слейвам", чтобы уменьшить число сканирований изменений файлов (оно будет производится единожды, в момент обновления данных мастера), а так же использоваться пакетный режим rsync
serverfault.com/questions/137119/rsync-to-multiple...

Answer 3 · 2016-05-16 11:54:45

Если url при обновлении меняются (если новый контент только добавляется и старый удаляется) или есть возможность их менять (при обновлении), то можно попробовать nginx + proxy_pass + кеширование nginx.
Ну или если url не меняются то же самое, но сброс кеша у обновленных файлов скриптом по списку.

Answer 4 · 2016-05-16 12:16:33

дать команду скачивать файл полностью, а не дифф (--whole-file), не проверять чексуммы, если стоит ключ проверки

Answer 5 · 2016-05-16 12:22:22

странно, даже при наличии 50к файлов rsync проц у меня не грузит при поиске, да и отрабатывает очень быстро... возможно проблема в медленной дисковой подсистеме на сервере?

просто предлагаю очередной вариант, а никак не решение вашей проблемы)
если файлов очень много и никак не избавиться от текущей схемы, то есть такой вариант:
делаем на сервере спец файл (пусть данные хранятся в нем в виде таблицы) - в нем номер залитого файла и путь к нему. для примера:
...
9 /var/www/backup/2016-05-15.tar
10 /etc/postfix/main.cf
и еще один файл который содержит номер последнего обновления.
клиент подключается, и сверяет свой номер с номером последнего обновления на сервере, для примера на клиенте последний залитый файл: 8.
8<10, поэтому качаем файлы 9 и 10 с сервера, запрашиваем их путь (awk в помощь) и копируем обычным scp)
думаю мысль понятна?

Answer 6 · 2016-05-16 15:15:41

nginx + proxy_store (nginx.org/ru/docs/http/ngx_http_proxy_module.html#..., чтобы файлы на слейвах "появлялись" мнгновенно , а rsync дергайте пореже с разносом по времени между слейвами.

Answer 7 · 2016-05-16 17:38:53

Евгений Безымянников @psman

https://syncthing.net/

Ответ написан более трёх лет назад

Комментировать

Как организовать синхронизацию файлов для собственного CDN?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт