[mephi-hpc] система очередей

Kseniya Komarova kgvladi at gmail.com
Sat Oct 26 20:37:55 MSK 2013


Спасибо за разъяснение. Теперь хоть понятно, что происходит :)


2013/10/26 Andrew A. Savchenko <bircoph at ut.mephi.ru>

> Здравствуйте,
>
> On Sat, 26 Oct 2013 14:06:41 +0300 Kseniya Komarova wrote:
> > Добрый день.
> > Не могли бы вы пояснить следующее. Почему задача продолжает стоять в
> > очереди, если при этом есть свободные ноды для расчета?
> > Например, задача на 32 процессора, и lspbs сообщает, что 44 ноды
> свободны.
>
> Во-первых, под данным lspbs свободно не 44 ноды, а 44 процессора; у
> нас всего 13 нод (полнофункциональных узлов).
>
> Во-вторых, lspbs говорит лишь о доступности CPU узла, но не учитывает
> недоступность узла из-за иных проблем (например, нехватка места на
> диске). Для этого есть showq, который показывает, что на самом деле
> доступно лишь 4 CPU:
>
> 2 Active Jobs      64 of   68 Processors Active (94.12%)
>
> На остальных пяти узлах возникли неполадки, связанные с переполнением
> дискового пространства, которого у нас очень мало. Что, в свою
> очередь было вызвано слишком ранним пуском pvfs2 (ещё не готовой к
> некоторым видам нагрузок), сделанным по просьбе пользователя.
>
> Сейчас проблема устранена, задачи пошли.
>
> Best regards,
> Andrew Savchenko
>
> _______________________________________________
> hpc mailing list
> hpc at lists.ut.mephi.ru
> http://lists.ut.mephi.ru/listinfo/hpc
>
>


-- 
*С уважением,
Ксения Комарова
*
Центр Фотохимии РАН
ул. Новаторов, 7а, корп. 1
Москва, 117421
Тел. : (495)935-02-13
Факс: (495)936-12-55
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.ut.mephi.ru/pipermail/hpc/attachments/20131026/645b4013/attachment.html>


More information about the hpc mailing list