Синхронизация двух директорий через ssh?

Question

Влад Зайцев @vvzvlad

Синхронизация двух директорий через ssh?

Вот пишу я какой-то код на ноуте. А запускаю на сервере. Как мне самым простым способом синхронизировать две директории — локальную и серверную?

Требования:
1)Без дополнительного софта на сервере. Я могу поставить туда synthing, но я не хочу ставить на каждый сервер, на котором хочу поработать день, ставить софтину, настраивать ее через веб-панель, придумывать ей пароль, добавлять ее в локальный конфиг synthing и так далее. Есть ssh, по которому можно передавать файлы. Есть ключ, который уже подходит к новому серверу. Зачем еще что-то?
2)Двухсторонняя синхронизация. Там у меня логи, тут у меня новые версии кода. Хочу смотреть логи в GUI на ноута, как и править код, а запускать на сервере.
3)Быстрая синхронизация. Мне ручками залить файл — пару секунд, хочу не медленнее. Локально можно по триггерам на изменение файла, удаленно — можно снизить "быстрость" до "раз в 30 секунд".
4)Просто синхронизация. Опционально с исключениями. Мне не нужны резервные копии, версионирование, синхронизация на основе гит-а, и так далее. Мне просто надо, чтобы файлы на сервере совпадали с файлами на на локальной машине.
5)Синхронизация, а не удаленный доступ. Я могу смонтировать директорию через ssh или использовать ssh-плагин для вскода, но не хочу. Я хочу отдельные копии файлов и у меня и на сервере, я не хочу зависеть от сети, канала и доступности сервера, когда я в метро достаю ноут, чтобы пофиксить баг в скрипте.
6)Синхронизация, а не системы деплоя. Мне не нужен докер, ансибл или упаковка в deb, чтобы иметь централизованное обновление. Это просто скрипт, который я запускаю на сервере, это не часть продакшена или крупного проекта. Мне пофиг, если он упадет, я увижу это в консоли, у него нет зависимостей и сложного окружения, это просто питон-скрипт в один файл у которого из требований — два pip-пакета. Он просто автоматизирует десяток моих действий в проекте. Он никому кроме меня не нужен. Он коряво написан и будет удален, как только проект кончится через месяц.
7)Linux/macos.
Мне постоянно советуют rsync, но это же просто продвинутая замена scp. Там даже для обратной синхронизации надо его запускать второй раз с другим направлением.
Пока что решение видится как "скрипт с fswatch и rsync, который по локальным изменениям триггерит аплоад-синхронизацию, а раз в 10 секунд делает тоже самое, но по направлению сервер->локальная машина". Но это же писать надо, отлаживать.. Неужели такая странная хотелка, что нет готового решения?

Вопрос задан более года назад
205 просмотров

2 комментария

Подписаться 1 Средний 2 комментария

Пригласить эксперта

Ответы на вопрос 5

8 комментариев

rPman @rPman

формально у rsync есть свой протокол, который может работать вне ssh по своим сетевым каналам, он в каком то смысле эффективнее.

Написано более года назад
Влад Зайцев @vvzvlad Автор вопроса

Так тебе и советуют готовое отличное решение.

Отличное, готовое, но не решение. Вы читали вопрос-то или распарсили ключевые слова "синхронизация ssh", и вытащили rsync?

Нет, это не замена scp. То, что используется тот же протокол не значит что работает одинаково. rsync умеет обновлять файлы частично, экономит трафик.

В контексте моей задачи — именно что улучшенная замена scp, которая умеет в дифф копии. Постоянную синхронизацию не умеет, надо писать обвязки.

Обычно для таких вещей используют систему контроля версий, что гораздо лучше чем просто синхронизация директорий.

А, понятно, вопрос не читали. Система контроля версий — очень плохое решение задачи "поддерживать консистентность двух папок", я пробовал.

То тебе нужно, чтоыб какие-то файлы не синкались. То есть уже нужно поддерживать список исключений и возможно настраивать его на каждом сервере.
Потом у тебя день поработать на каком-то сервере, а завтра на другом. То есть ситуация, когда у тебя 5-10 серверов и ноут будут синкаться друг с другом?

Нет. Я просто не хочу таскать .git/.venv, но в целом, это не очень критичное требование. Десятка серверов у меня не будет. Для задач уровня "потыкать 30 аппок тестами-скриптами" я пишу скрипт на питоне на 200 строк и запускаю его на соседнем сервере. Пишу я его на ноуте. Хочу, чтобы исправления в нем сами убегали на сервер, а не руками это делать, и тоже самое — с логами в обратном направлении, потому что логи не всегда удобно смотреть в консоли. Запускаю скрипт я на сервере, потому что до этих аппок не всегда есть доступ извне, потом что задачи могут занимать часы, а я ноут иногда закрываю и спать ложусь. Дописываю я скрипт понемногу несколько месяцев — сегодня задача вот это собрать, завтра вот эти эндпоинты подергать.
Проект через пару месяцев кончился, я сервер погасил, скрипт удалил, синхронизацию выключил. Ушел на новый проект — и там тоже нашлись задачи, под которые надо написать небольшой скрипт и запустить его. Поднял сервер, включил синхронизацию (уже на другой сервер), написал скрипт, дописываю-гоняю. Гит-а мне для этого скрипта не надо, он временный и утилитарный, и я эти 200 строк прекрасно держу в голове.

Написано более года назад
Saboteur @saboteur_kiev Куратор тега SSH

ну вы же понимаете, что не существует волшебства.
Любая синхронизация должна где-то хранить данные, и если не настраивать сервера и ноут с белыми айпишниками, не прокидывать между ними сеть, то единственный вариант - облачное решение, какой-нить гуглдрайв или гитхаб именно как место для хранения.

Вам кажется что задача простая, но она упирается во все эти моменты - кто с кем должен синхронизироваться. В какой момент. С каждым сохранением файла? и тут вы утверждаете что хотите иметь возможность сидеть с ноутом в оффлайн, не зависеть от интернета.
С запуском команды? Ну тогда вероятность что на ноуте вы не запустите команду, а на сервере запустите и перезатрете изменения на ноуте есть.
Игнорирование каких-то файлов - нужно настроить список.

Я как раз прочитал ваше сообщение целиком, но упоминаю гит и рсинк именно потому что вижу что вы даже сами не хотите осознать что все эти нюансы не решатся волшебным образом, и требования к софту выше, чем вам кажется, прям на уровне АИ, который должен догадываться в отдельных случаях что делать.

Поэтому проще всего изменить свой подход.
я в гите храню разный набор скриптов и на 10 и на 20 и на 100 строк, не страдаю от этого. Гит не только для крупных проектов, он просто удобен для текста. В нем можно писать код, можно писать книжки или статьи, или просто хранить набор шаблонов под рукой, поэтому мне кажется гит был бы хорошим решением, особенно учитывая наличие бесплатных облачных сервисов типа гитхаба.

Для рсинк или любого ругого "прямого" способа синхронизации нужно будет еще думать о том, как подключиться - белый айпишник, порты, все вот это.

Написано более года назад
Влад Зайцев @vvzvlad Автор вопроса

Для рсинк или любого ругого "прямого" способа синхронизации нужно будет еще думать о том, как подключиться - белый айпишник, порты, все вот это.

Я уже имею доступ к серверу через ssh. У меня нет проблем как закинуть туда файл. Я хочу просто это автоматизировать.
Я не вижу особых сложностей в синхронизации — все изменения файлов с кодом происходят на ноуте, все изменения логов — на сервере. Один пользователь, один ноут. Если файл изменился, то синхронизируемся. Если доступа нет — не делаем ничего, доступ появится, синхронизируемся.

Я знаю плюсы гита, я просто в данном случае хочу около-мгновенной синхронизации, а не поллинга гит-сервера на предмет "есть чо новое?".

Собственно, я уже накостылял: https://gitea.vvzvlad.xyz/vvzvlad/syncer/src/branc...
Тупо скрипт который по триггеру изменения пушит на сервер файлы через rsync, а по таймеру стягивает с сервера изменения. Просто чувствую, что следующие пару недель я буду вылавливать всякие крайние случаи, и вот этого хотелось бы избежать, имея готовое решение.

Написано более года назад
Saboteur @saboteur_kiev Куратор тега SSH

А если вы без интернета, что будет делать скрипт по триггеру? будет как-то откладывать изменения на потом?

Написано более года назад
Влад Зайцев @vvzvlad Автор вопроса

Saboteur, ничего не будет делать. измененные файлы будут лежать у меня локально. появится интернет, он либо по сохранению выполнит синк, либо по времени, каждые 100 секунд, что ли, для аплоада.

Написано более года назад
Saboteur @saboteur_kiev Куратор тега SSH

Влад Зайцев,
Тупо скрипт который по триггеру изменения пушит на сервер файлы через rsync, а по таймеру стягивает с сервера изменения.

Так какие изменения он подтянет туда, или оттуда? =)

Написано более года назад
Влад Зайцев @vvzvlad Автор вопроса

Saboteur, туда конечно. первым идет аплоад, вторым даунлоад.

Написано более года назад

1 комментарий

Комментировать

7 комментариев

Влад Зайцев @vvzvlad Автор вопроса

Так напишите мне простую команду, которая будет поддерживать консистентность директории "локальный компьютер"-"сервер".

Написано более года назад
Drno @Drno

Влад Зайцев, напишите её сами исходя из helpA rsync. и запускайте когда нужно... тут не фриланс же

Написано более года назад
Влад Зайцев @vvzvlad Автор вопроса

Drno,
— Я хочу вот такое решение, есть готовое, писать не хочу?
— Есть Х
— Но Х не решает проблему
— Ну так допишите, я что, за вас должен писать??

Написано более года назад
Drno @Drno

Влад Зайцев, хотите, кто Вам мешает не хотеть то... просто Ваша проблема решается написанием 1 простой команды rsync и запуском её в нужное Вам время. хз что Вас не устраивает

Написано более года назад
Влад Зайцев @vvzvlad Автор вопроса

Drno, так вы напишите эту "простую команду" или нет?

Написано более года назад
Drno @Drno

Влад Зайцев, нет, тут не фриланс же. Вам подсказали какой софт можно использовать, посмотрите их сайт и составьте команду

Написано более года назад
Влад Зайцев @vvzvlad Автор вопроса

Drno, т.е. как только потребовалось написать ее, она резко стала не такой простой, я правильно понимаю?

Написано более года назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SSH

Простой
Как технически работает проксирование через ssh?
- 1 подписчик
- 15 окт.
- 171 просмотр
5

ответов
Python

+2 ещё

Средний
При подключении к бд MySQL через SSH из Python появляется ошибка, а через DBeaver всё чётко. В чём дело?
- 2 подписчика
- 29 сент.
- 282 просмотра
1

ответ
Linux

+1 ещё

Простой
Как сформировать .known_hosts для списка IP-адресов?
- 1 подписчик
- 17 сент.
- 222 просмотра
2

ответа
VPN

+1 ещё

Простой
Как с wireguard (amnezia) добиться того, что делает ssh tunnelling?
- 1 подписчик
- 12 сент.
- 454 просмотра
2

ответа
Linux

+2 ещё

Простой
Не полноценно работает fail2ban. Как настроить?
- 3 подписчика
- 19 авг.
- 291 просмотр
1

ответ
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Почему не получается войти на сервер?
- 2 подписчика
- 27 июл.
- 379 просмотров
1

ответ
SSH

Средний
SSH +reverse https proxy, при чём тут openSSL(VPN)?
- 1 подписчик
- 25 июл.
- 222 просмотра
4

ответа
Ubuntu

+1 ещё

Простой
Как получить инфу по всем учеткам на сервере Ubuntu?
- 1 подписчик
- 02 июл.
- 199 просмотров
3

ответа
Ubuntu

+1 ещё

Простой
Как правильно обновить OpenSSH server на ubuntu?
- 2 подписчика
- 27 июн.
- 1468 просмотров
2

ответа
SSH

+1 ещё

Простой
Как подключится к ubuntu на virtualbox через wsl по ssh?
- 2 подписчика
- 24 июн.
- 167 просмотров
2

ответа
Показать ещё Загружается…

Art Director (TV, Youtube, Реклама)

SDL • Москва

от 190 000 ₽

Системный аналитик (Мои Сервисы)

Сбер • Москва

от 300 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

У winscp, кажется, есть функция синхронизации. На удалённом узле кроме ssh ничего не нужно.

Answer 1 · 2024-08-05 02:49:13

Мне постоянно советуют rsync

Неужели такая странная хотелка, что нет готового решения?

Так тебе и советуют готовое отличное решение.

, но это же просто продвинутая замена scp. Там даже для обратной синхронизации надо его запускать второй раз с другим направлением.

Нет, это не замена scp. То, что используется тот же протокол не значит что работает одинаково. rsync умеет обновлять файлы частично, экономит трафик.

Вот пишу я какой-то код на ноуте. А запускаю на сервере. Как мне самым простым способом синхронизировать две директории — локальную и серверную?

Обычно для таких вещей используют систему контроля версий, что гораздо лучше чем просто синхронизация директорий.

В твоих требованиях противоречия.
То тебе нужно, чтоыб какие-то файлы не синкались. То есть уже нужно поддерживать список исключений и возможно настраивать его на каждом сервере.
Потом у тебя день поработать на каком-то сервере, а завтра на другом. То есть ситуация, когда у тебя 5-10 серверов и ноут будут синкаться друг с другом?
Потом ты хочешь "готовое решения", но не хочешь ставить его на каждый сервер/ноут и настраивать. Ну вот есть какой-нить unison, который синкает в обе стороны за один запуск, но его нужно будет и ставить и настраивать как и synthing, который ты не хочешь ставить или настраивать.

Я бы не парился, а просто юзал приватный git репозиторий, который легко поставить везде. И в гите не обязательно сотни веток и даже коммит можешь просто ребейзить постоянно, чтобы был один.
Или rsync который уже обычно есть почти везде и который понятно как работает.

Или уж настрой тот же synthing, а настройку добавь себе в гитхаб, чтобы можно было скриптом скачать готовый сетап и все.

Answer 2 · 2024-08-05 01:24:45

Да, странная. Обычно бэкапы делаются по расписанию, а для этих целей rsync хватает.
А твой скрипт после написания и отладки как раз и превратится в неполное подобие syncthing, nextcloud и т.п.

Answer 3 · 2024-08-05 06:17:25

rsync более чем покроет все твои задачи, и он считается стандартом defacto в мире синхронизации файлов, но чтобы добавить полезной информации - у всех механизмов синхронизации на основе файлов есть легкий недостаток, информацию об изменении файла они получают из метаинформации (размер файла, флаги или даты модификации), которая не защищена от изменения, т.е. возможна ситуация, когда файл изменен но его дата нет.

spoiler

А еще есть проблема еще больше, обычно файлы копируются целиком, даже если в них были только минимальные изменения (вопрос что есть изменения - отдельный и философский), классический пример - вставка или удаление новой строки в текстовый файл, с помощью утилиты diff можно сравнить старую версию и новую версию файла, и получить diff patch, текстовый файл, содержащий только информацию об изменениях (так же построчно а не посимвольно), но для проведения этого сравнения нужно прочитать старую версию файла и новую, а так же потратить порядка n^2 памяти (в универсальном случае для binary diff), поэтому этим не пользуются именно для синхронизации файлов, а копируют файл по сети целиком (но помните об этом если у вас есть память для хранения копии старых файлов но очень медленный канал связи).

Теперь о важном - если использовать cow файловые системы типа btrfs/zfs, то можно максимально быстро (без затрат памяти и лишних чтений с диска) получить максимально эффективный патч простых бинарных изменений (без сдвигов содержимого файла) с минимальным размером куска файла - размером с кластер файловой системы (обычно 4 или 8 кб) и послать его по сети, а затем применить его на удаленную файловую систему (btrfs snapshot send), при этом это еще и максимально эффективно для медленных дисков hdd (так как утилиты пытаются обрабатывать данные последовательно а не случайно), в общем никакой другой алгоритм так эффективно синхранизацию больших объемов не сможет сделать (точнее можно, если использовать binary diff и хранить локально копии удаленных старых версий, но это очень ресурсоемко и по памяти и по процессору)

Answer 4 · 2024-08-05 08:20:27

Drno @Drno

rsync. Я простая команда. Чего еще нало то?

Ответ написан более года назад

7 комментариев

Answer 5 · 2024-08-05 18:12:46

Виктор Таран @shambler81

csync

Ответ написан более года назад

1 комментарий

Синхронизация двух директорий через ssh?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт