[mephi-hpc] Проблема с работой программы

anikeev anikeev at ut.mephi.ru
Mon Feb 4 10:53:31 MSK 2019


On Sat, 2019-02-02 at 08:21 +0300, Alexandra Freidzon wrote:
> Добрый день,

Здравствуйте!

> Я работаю с программой FireFly. С какого-то момента (честно говоря,
> не
> знаю с какого, точно после июля) программа стала вылетать через
> примерно 30-40 минут работы, а то и раньше (даже одна задача на одной
> и той же ноде слетает через разное время). Проблема есть и на Басове,
> и на Черенкове, т.е., не зависит ни от конкретной сборки программы
> (басовская под mpich1, черенковская под mvapich2), ни от версии
> Линукса, ни от реализации mpi. Никаких особых сообщений в файлах
> firefly.o* и firefly.e*, отличных от сообщений при корректном
> завершении задачи, нет. В самом выходном файле программы тоже ничего,
> просто обрыв -- и все.

Вне нужна возможность повторить проблему самостоятельно. Как именно Вы
запускает задачу? У Вас есть готовый скрипт?

> Что можно с этим сделать? Другие пользователи группы kintech тоже
> хотели бы работать с FireFly, но теперь это практически невозможно...
> 
> С уважением,
> А. Фрейдзон
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
-- 
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998


More information about the hpc mailing list