Как скопировать в несколько потоков?

Question

Виктор Таран @shambler81

bash

Как скопировать в несколько потоков?

Задача скопировать 54Млн файлов
занято уже 95% диска
Написал скрипт который по отдельности сжимал папки и копировал на удалённый сервер там распаковывал.
Но проблема в том что даже для 1 папки места нет, а у некоторых и у подкаталогов такая же ситуация.
В общем слишком много исключений в циклах пришлось делать и тд.
Если же копировать в 1 поток то 320 часов
Собственно поскольку при копирование файлов пролемма не в размере а в количестве, то есть идея копировать скажем в 100 потоков, тем самым сократив до 3 часов, что вполне себе уже жизнеспособно I-O nvme дисков это вообще никак не потревожит.
по идее что-то через find (с макс деп3) и xargs
может кто подскажет как лучше сделать, в идеале примерчик.
Все это веселье заправляется работой 24\7 и потом мне нужно будет расхождения отдельно скопировать в общем желательно чтоб если-что то все это было еще и повторяемо.

Вопрос задан более трёх лет назад
1135 просмотров

1 комментарий

Подписаться 2 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Фронтенд-разработчик

10 месяцев

Далее
Нетология

Системный администратор

11 месяцев

Далее
Skillfactory

Профессия «Белый» хакер

13 месяцев

Далее

Решения вопроса 1

7 комментариев

Виктор Таран @shambler81 Автор вопроса

как ни странно этого вполне хватило, скорость передачи под 60мб сек
я так базу забирал с сервера с 100% занятым /
но что-то думал что он темп создает в оперативке.
и сей понт пройдет только с папкой меньше чем места в памяти, однакож нет все работает норм

Написано более трёх лет назад
TheAthlete @TheAthlete
Нашел еще такой вариант:

tar -czf - /some/file | ssh joebloggs@otherserver.com tar -xzf - -C /destination

т.е. использование -C вместо 'cd destination'
Написано более трёх лет назад
shurshur @shurshur

В наборе опций f должна быть последней, так как у неё есть параметр - файл (в данном случае -, что означает stdin/stdout в зависимости от контекста).

Ничего в "temp" оно не создаёт. Если буфера ввода-вывода везде полные, оно просто подождёт их освобождения.

Написано более трёх лет назад
Saboteur @saboteur_kiev Куратор тега bash

shurshur, нет, tar достаточно умный, чтобы понять что f опция может быть в середине списка опций.
Но да, это так автор tar сделал. Если по POSIX то не должно работать. Просто tar появился раньше, чем стандартизировался POSIX ;)

Написано более трёх лет назад
shurshur @shurshur

Saboteur, это странно, у меня на подобное ругалось, когда я допускал подобные ошибки. Возможно, я тогда сталкивался с tar другой космической системы :)

Написано более трёх лет назад
Виктор Таран @shambler81 Автор вопроса

shurshur, Saboteur, shurshur,
И того перенос занял 6 часов что вполне в разумных приделах, учитывая что импорт бд идет уже 2 час ;)

Написано более трёх лет назад
Saboteur @saboteur_kiev Куратор тега bash

Виктор Таран,

но что-то думал что он темп создает в оперативке.

ну как так, tar был написан во времена, когда оперативки было меньше чем сейчас кеш даже в сетевушке =)

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Регулярные выражения

+1 ещё

Средний
Почему один регэксп работает, а второй нет?
- 1 подписчик
- 03 сент.
- 241 просмотр
4

ответа
bash

Простой
Как перебрать элементы в массиве для вывода netcat?
- 2 подписчика
- 21 авг.
- 125 просмотров
1

ответ
Linux

+2 ещё

Простой
Что надо установить, чтобы помимо текста ошибки выводились советы в терминале?
- 3 подписчика
- 16 авг.
- 3777 просмотров
3

ответа
bash

+1 ещё

Простой
Как переписать скрипт чтоб без pgrep?
- 3 подписчика
- 12 авг.
- 797 просмотров
1

ответ
Docker

+2 ещё

Средний
Как использовать docker secrets в bash скриптах?
- 1 подписчик
- 09 авг.
- 317 просмотров
5

ответов
bash

Простой
Как исправить код, чтобы shellcheck не ругался на одинарные кавычки?
- 1 подписчик
- 26 июн.
- 105 просмотров
1

ответ
bash

Простой
Как запустить bash скрипт от другого пользователя?
- 1 подписчик
- 22 июн.
- 203 просмотра
1

ответ
Docker

+1 ещё

Средний
Как корректно выгрузить список docker-образов в массив?
- 2 подписчика
- 16 мая
- 905 просмотров
3

ответа
bash

Простой
Как расшифровать sh скрипт?
- 1 подписчик
- 03 мая
- 263 просмотра
2

ответа
Linux

+2 ещё

Средний
Как в linux VanillaOS дать доступ для nodeJS с IDE NetBeans?
- 2 подписчика
- 26 апр.
- 137 просмотров
1

ответ
Показать ещё Загружается…

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Программист С++

Ридан • Москва

от 110 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Answer 1 · 2021-08-11 16:24:00

Написал скрипт который по отдельности сжимал папки и копировал на удалённый сервер там распаковывал

Так сжимайте сразу на удаленный сервер

tar cvfz - mydirectory|ssh user@remote_server "cd target_directory;tar xvfz -"

Или даже проще будет запустить несколько экземпляров rsync в фоне через xargs или parallel

Answer 2 · 2021-08-11 16:09:27

Армянское Радио @gbg

Любые ответы на любые вопросы

Что-то такое, с использованием GNU Parallel

find . -print0 | parallel -0 -j10 cp {} destdir

Источник

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2021-08-11 16:14:54

Не совсем понимаю чем мешает недостаток места на источнике.
Что делать - зависит от структуры каталогов и распределения данных в них, например сделать список каталогов 2го или 3его или Нного уровня и на каждый каталог запустить свой rsync.

Как скопировать в несколько потоков?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт