[mephi-hpc] Не запускаются на счет задачи на кластере Басов

Богданов Алексей Георгиевич AGBogdanov at mephi.ru
Mon Oct 28 14:12:27 MSK 2019


OK, спасибо за пояснения!

С уважением,
Алексей Богданов

-----Original Message-----
From: hpc [mailto:hpc-bounces at lists.mephi.ru] On Behalf Of anikeev
Sent: Monday, October 28, 2019 2:05 PM
To: NRNU MEPhI HPC discussion list <hpc at lists.mephi.ru>
Subject: Re: [mephi-hpc] Не запускаются на счет задачи на кластере Басов

On Mon, 2019-10-28 at 10:26 +0000, Богданов Алексей Георгиевич wrote:
> Все понятно, спасибо большое!
> 
> А еще не подскажете по кластеру Черенков? Там сейчас нет ограничений 
> по числу узлов, занятых одним пользователем? И еще странно, что в 
> большинстве узлов используется только половина CPU, а простая задачка 
> даже для 1 CPU все равно ставится в очередь.

Ограничений на одного пользователя нет.

Кластер занят полностью. Благодаря введению менеджера ресурсов Slurm работа с потоками HyperThreading стала более наглядной. И на узлах кластера Черенков, и на узлах кластера Басов имеется 16 ядер. На каждое ядро имеется два потока HT. Большинство математических алгоритмов замедляются при использовании HT ввиду вымывания кэша. Но есть алгоритмы, которые ускоряются на HT, поэтому он не отключен на аппаратном уровне. Прежде чем использовать потоки HT, необходимо убедиться, что они ускоряют, а не замедляют задачу. Slurm позволяет работать с потоками и ядрами отдельно, в то время как старый PBS не видит между ними разницы. Минимальной единицей ресурса для Slurm является ядро. Управление потоками внутри задачи осуществят пользователь самостоятельно, чтобы не мешать задачам большинства пользователей, не использующих HT.

> С уважением,
> Алексей Богданов
> 
> 
> -----Original Message-----
> From: hpc [mailto:hpc-bounces at lists.mephi.ru] On Behalf Of anikeev
> Sent: Monday, October 28, 2019 1:12 PM
> To: NRNU MEPhI HPC discussion list <hpc at lists.mephi.ru>
> Subject: Re: [mephi-hpc] Не запускаются на счет задачи на кластере 
> Басов
> 
> On Mon, 2019-10-28 at 08:35 +0000, Богданов Алексей Георгиевич wrote:
> > Здравствуйте!
> 
> Добрый день!
> 
> > А посмотрите, пожалуйста, все ли там нормально с кластером Басов - 
> > вроде четыре свободных узла, а задачки в очереди стоят?
> 
> Да, всё в порядке. Задачи из очереди относятся к классам "long" и 
> "xxl", для которых исчерпаны имеющиеся ресурсы:
> 
> master.basov anikeev # qmgr -c 'p s'
> ...
> create queue long
> ...
> set queue long resources_available.procct = 192 ...
> ...
> create queue xxl
> ...
> set queue xxl resources_available.procct = 96
> 
> Проверить причину помещения задачи в очередь "blocked" можно при 
> помощи showq -b
> 
> Оставшиеся свободные узлы доступны для задач с меньшей 
> продолжительностью, используемых в учебных задачах и лабораторных 
> работах. Подобного резервирования нет на кластере "Черенков".
> 
> 
> > С уважением,
> > Алексей Богданов
> > _______________________________________________
> > hpc mailing list
> > hpc at lists.mephi.ru
> > https://lists.mephi.ru/listinfo/hpc
> --
> С уважением,
> инженер отдела Unix-технологий МИФИ,
> Аникеев Артём.
> Тел.: 8
> (495) 788-56-99, доб. 8998
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
--
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998
_______________________________________________
hpc mailing list
hpc at lists.mephi.ru
https://lists.mephi.ru/listinfo/hpc


More information about the hpc mailing list