[mephi-hpc] Запуск задачи на 8 потоках
anikeev
anikeev at ut.mephi.ru
Fri Jun 14 13:29:51 MSK 2019
On Fri, 2019-06-14 at 09:47 +0300, Анастасия Шошина wrote:
> Доброе утро!
> Простите за беспокойство.
Здравствуйте!
> Задача 516745.master.basov.hpc.mephi.ru, в которой запрошено 8 узлов
> стоит в очереди несколько дней(~7).
Как Вы можете заметить, задача 516745 имеет статус blocked. Она не
запустится, поскольку на кластере Баcов запрещено одному пользователя
занимать более 192 вычислительных потоков одновременно. Вы запросили
256. Информация об изменении настроек очередей рассылалась через
официальный лист рассылки в письме от Thu Jan 31 18:19:28 MSK 2019:
>>По причине большого числа задач в очередях сокращено количество
>>ресурсов, доступных для длительных задач или одному пользователю:
>>...
>>basov:
>>qmgr -c 'p s'
>>...
>>set queue xxl resources_available.procct = 96
>>set queue long resources_available.procct = 192
>>...
>>cat /var/spool/maui/maui.cfg
>>...
>>USERCFG[DEFAULT] MAXPROC=192
> Также она запущена на Черенкове(222204.master).
Я вижу точно такую же информацию, что и Вы:
anikeev at master.cherenkov ~ $ showq
ACTIVE JOBS--------------------
JOBNAME USERNAME STATE PROC REMAINING STA
RTTIME
227726 osama.ashraf Running 24 3:47:42 Thu Jun
13 00:28:19
227749 osama.ashraf Running 24 22:52:31 Fri Jun
14 11:33:08
218392 dubinets Running 32 1:10:37:01 Sat Jun 8
23:17:38
218393 dubinets Running 32 1:10:37:01 Sat Jun 8
23:17:38
218394 dubinets Running 32 1:10:37:01 Sat Jun 8
23:17:38
219555 ovkomleva Running 16 2:00:23:25 Sun Jun 9
13:04:03
227308 dubinets Running 32 4:12:40:57 Wed Jun 12
01:21:34
227310 dubinets Running 32 4:13:30:42 Wed Jun 12
02:11:19
221555 shargatov Running 1 82:06:12:38 Thu Jun 6
18:53:15
216935 titov Running 32 INFINITY Thu May 23
15:56:09
216936 titov Running 32 INFINITY Thu May 23
15:56:37
216937 titov Running 32 INFINITY Thu May 23
15:56:43
216939 titov Running 32 INFINITY Thu May 23
19:14:13
216940 titov Running 32 INFINITY Thu May 23
21:17:16
216941 titov Running 32 INFINITY Thu May 23
23:43:14
216942 titov Running 32 INFINITY Fri May 24
04:41:15
218395 dubinets Running 32 INFINITY Sat Jun 8
23:17:38
218396 dubinets Running 32 INFINITY Sat Jun 8
23:17:38
18 Active Jobs 513 of 576 Processors Active (89.06%)
18 of 18 Nodes Active (100.00%)
IDLE JOBS----------------------
JOBNAME USERNAME STATE PROC WCLIMIT QUE
UETIME
221568 shargatov Idle 256 90:00:00:00 Wed Jun 5
02:18:27
221985 romanenkovli Idle 128 1:00:00:00 Wed
Jun 5 10:47:13
221987 romanenkovli Idle 96 1:00:00:00 Wed
Jun 5 10:52:40
221988 romanenkovli Idle 128 1:00:00:00 Wed
Jun 5 10:52:46
222202 iamnastishoshina Idle 96 20:00:00 Fri
Jun 7 20:42:54
222203 iamnastishoshina Idle 128 20:00:00 Fri
Jun 7 20:43:04
222204 iamnastishoshina Idle 256 20:00:00 Fri
Jun 7 20:43:11
Перед Вашей задачей стоит задача на 90 дней. Ваша задача может
запуститься раньше, если образуется окно, достаточное для Вашей задачи,
но недостаточное для задач, стоящих раньше. Перед Вашей задачей 222204
стоит 5 задач, требующих меньше ресурсов, которые будут занимать окна,
появляющиеся в ближайшее время. Предсказывать появление окон на такое
значительное число итераций достаточно проблематично, особенно с учетом
того, что задачи завершаются на самом деле раньше walltime.
Я регулярно поднимаю вопрос закупки нового оборудования на совещаниях с
руководством. К сожалению, финансирования пока нет.
> Хотелось бы уточнить, будет ли возможен ее запуск в условиях
> загруженности кластера в ближайшие 1-2 недели? (время выполнения ее
> приблизительно 10-12 часов)
> Спасибо за ответ.
>
> С уважением,
> Шошина А.В.
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
--
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998
More information about the hpc
mailing list