@byT3b0N3

Почему не получается сделать контрольное сохранение и восстановится на Raspberry Pi с MPICH/BLCR?

Привет всем.
Уже замучался пытаться решить проблему.
Достал всех на stackoverflow.Link

Есть RPi (Raspberry Pi Model B x 10 штук). На нем Raspbian и MPICH и BLCR.
Мне надо сделать checkpoint любого MPI приложения и перезапустится позже с него. Без MPI BLCR работает на ура. Дело в том, что получаю кучу всяких ошибок. С MPI и BLCR знаком пару недель/месяцев, в универе сказали разбирайтесь или нет вам зачёта (это у нас проект).
Просто уже не знаю что делать. Пробовал всё возможное (MPI_Irecv, MPI_Reduce, MPI_*). Проблема только с этим checkpoint'ом.
Понял что надо вызывать MPI-функции перед checkpoint'ом а то будет ошибка, что он чего то там не смог так как итд..

Если есть знающие MPI (MPICH) и BLCR с опытом на ARM прошу помочь.
В верхней ссылке все подробности.
  • Вопрос задан
  • 2701 просмотр
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы