[mephi-hpc] Запуск задачи на 8 потоках

anikeev anikeev at ut.mephi.ru
Fri Jun 14 13:29:51 MSK 2019


On Fri, 2019-06-14 at 09:47 +0300, Анастасия Шошина wrote:
> Доброе утро!
> Простите за беспокойство.

Здравствуйте!

> Задача 516745.master.basov.hpc.mephi.ru, в которой запрошено 8 узлов
> стоит в очереди несколько дней(~7).

Как Вы можете заметить, задача 516745 имеет статус blocked. Она не
запустится, поскольку на кластере Баcов запрещено одному пользователя
занимать более 192 вычислительных потоков одновременно. Вы запросили
256. Информация об изменении настроек очередей рассылалась через
официальный лист рассылки в письме от Thu Jan 31 18:19:28 MSK 2019:

>>По причине большого числа задач в очередях сокращено количество
>>ресурсов, доступных для длительных задач или одному пользователю:
>>...
>>basov:
>>qmgr -c 'p s'
>>...
>>set queue xxl resources_available.procct = 96
>>set queue long resources_available.procct = 192
>>...
>>cat /var/spool/maui/maui.cfg
>>...
>>USERCFG[DEFAULT]        MAXPROC=192

> Также она запущена на Черенкове(222204.master). 

Я вижу точно такую же информацию, что и Вы:

anikeev at master.cherenkov ~ $ showq
ACTIVE JOBS--------------------
JOBNAME            USERNAME      STATE  PROC   REMAINING            STA
RTTIME

227726             osama.ashraf    Running    24     3:47:42  Thu Jun
13 00:28:19
227749             osama.ashraf    Running    24    22:52:31  Fri Jun
14 11:33:08
218392             dubinets    Running    32  1:10:37:01  Sat Jun  8
23:17:38
218393             dubinets    Running    32  1:10:37:01  Sat Jun  8
23:17:38
218394             dubinets    Running    32  1:10:37:01  Sat Jun  8
23:17:38
219555             ovkomleva    Running    16  2:00:23:25  Sun Jun  9
13:04:03
227308             dubinets    Running    32  4:12:40:57  Wed Jun 12
01:21:34
227310             dubinets    Running    32  4:13:30:42  Wed Jun 12
02:11:19
221555             shargatov    Running     1 82:06:12:38  Thu Jun  6
18:53:15
216935                titov    Running    32    INFINITY  Thu May 23
15:56:09
216936                titov    Running    32    INFINITY  Thu May 23
15:56:37
216937                titov    Running    32    INFINITY  Thu May 23
15:56:43
216939                titov    Running    32    INFINITY  Thu May 23
19:14:13
216940                titov    Running    32    INFINITY  Thu May 23
21:17:16
216941                titov    Running    32    INFINITY  Thu May 23
23:43:14
216942                titov    Running    32    INFINITY  Fri May 24
04:41:15
218395             dubinets    Running    32    INFINITY  Sat Jun  8
23:17:38
218396             dubinets    Running    32    INFINITY  Sat Jun  8
23:17:38

    18 Active Jobs     513 of  576 Processors Active (89.06%)
                        18 of   18 Nodes Active      (100.00%)

IDLE JOBS----------------------
JOBNAME            USERNAME      STATE  PROC     WCLIMIT            QUE
UETIME

221568             shargatov       Idle   256 90:00:00:00  Wed Jun  5
02:18:27
221985             romanenkovli       Idle   128  1:00:00:00  Wed
Jun  5 10:47:13
221987             romanenkovli       Idle    96  1:00:00:00  Wed
Jun  5 10:52:40
221988             romanenkovli       Idle   128  1:00:00:00  Wed
Jun  5 10:52:46
222202             iamnastishoshina       Idle    96    20:00:00  Fri
Jun  7 20:42:54
222203             iamnastishoshina       Idle   128    20:00:00  Fri
Jun  7 20:43:04
222204             iamnastishoshina       Idle   256    20:00:00  Fri
Jun  7 20:43:11

Перед Вашей задачей стоит задача на 90 дней. Ваша задача может
запуститься раньше, если образуется окно, достаточное для Вашей задачи,
но недостаточное для задач, стоящих раньше. Перед Вашей задачей 222204
стоит 5 задач, требующих меньше ресурсов, которые будут занимать окна,
появляющиеся в ближайшее время. Предсказывать появление окон на такое
значительное число итераций достаточно проблематично, особенно с учетом
того, что задачи завершаются на самом деле раньше walltime.

Я регулярно поднимаю вопрос закупки нового оборудования на совещаниях с
руководством. К сожалению, финансирования пока нет.

> Хотелось бы уточнить, будет ли возможен ее запуск в условиях
> загруженности кластера в ближайшие 1-2 недели? (время выполнения ее
> приблизительно 10-12 часов)
> Спасибо за ответ.
> 
> С уважением,
> Шошина А.В.
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
-- 
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998


More information about the hpc mailing list