[mephi-hpc] ошибка на кластере Черенков при запуске и просмотре задач
Богданов Алексей Георгиевич
AGBogdanov at mephi.ru
Tue Jan 14 17:31:16 MSK 2020
Здравствуйте!
А посмотрите, пожалуйста, на кластере Черенков перестали задачи запускаться, менеджер задач дает сообщения типа: slurmstepd-n206: error: Unable to send job complete message: Unable to contact slurm controller (connect failure) и посмотреть (squeue) задачи тоже нельзя: slurm_load_jobs error: Unable to contact slurm controller (connect failure).
С уважением,
Алексей Богданов
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.mephi.ru/pipermail/hpc/attachments/20200114/48471d4d/attachment.html>
More information about the hpc
mailing list