[mephi-hpc] Не запускаются на счет задачи на кластере Басов

anikeev anikeev at ut.mephi.ru
Mon Oct 28 14:04:57 MSK 2019


On Mon, 2019-10-28 at 10:26 +0000, Богданов Алексей Георгиевич wrote:
> Все понятно, спасибо большое!
> 
> А еще не подскажете по кластеру Черенков? Там сейчас нет ограничений
> по числу узлов, занятых одним пользователем? И еще странно, что в
> большинстве узлов используется только половина CPU, а простая задачка
> даже для 1 CPU все равно ставится в очередь.

Ограничений на одного пользователя нет.

Кластер занят полностью. Благодаря введению менеджера ресурсов Slurm
работа с потоками HyperThreading стала более наглядной. И на узлах
кластера Черенков, и на узлах кластера Басов имеется 16 ядер. На каждое
ядро имеется два потока HT. Большинство математических алгоритмов
замедляются при использовании HT ввиду вымывания кэша. Но есть
алгоритмы, которые ускоряются на HT, поэтому он не отключен на
аппаратном уровне. Прежде чем использовать потоки HT, необходимо
убедиться, что они ускоряют, а не замедляют задачу. Slurm позволяет
работать с потоками и ядрами отдельно, в то время как старый PBS не
видит между ними разницы. Минимальной единицей ресурса для Slurm
является ядро. Управление потоками внутри задачи осуществят
пользователь самостоятельно, чтобы не мешать задачам большинства
пользователей, не использующих HT.

> С уважением,
> Алексей Богданов
> 
> 
> -----Original Message-----
> From: hpc [mailto:hpc-bounces at lists.mephi.ru] On Behalf Of anikeev
> Sent: Monday, October 28, 2019 1:12 PM
> To: NRNU MEPhI HPC discussion list <hpc at lists.mephi.ru>
> Subject: Re: [mephi-hpc] Не запускаются на счет задачи на кластере
> Басов
> 
> On Mon, 2019-10-28 at 08:35 +0000, Богданов Алексей Георгиевич wrote:
> > Здравствуйте!
> 
> Добрый день!
> 
> > А посмотрите, пожалуйста, все ли там нормально с кластером Басов - 
> > вроде четыре свободных узла, а задачки в очереди стоят?
> 
> Да, всё в порядке. Задачи из очереди относятся к классам "long" и
> "xxl", для которых исчерпаны имеющиеся ресурсы:
> 
> master.basov anikeev # qmgr -c 'p s'
> ...
> create queue long
> ...
> set queue long resources_available.procct = 192 ...
> ...
> create queue xxl
> ...
> set queue xxl resources_available.procct = 96
> 
> Проверить причину помещения задачи в очередь "blocked" можно при
> помощи showq -b
> 
> Оставшиеся свободные узлы доступны для задач с меньшей
> продолжительностью, используемых в учебных задачах и лабораторных
> работах. Подобного резервирования нет на кластере "Черенков".
> 
> 
> > С уважением,
> > Алексей Богданов
> > _______________________________________________
> > hpc mailing list
> > hpc at lists.mephi.ru
> > https://lists.mephi.ru/listinfo/hpc
> --
> С уважением,
> инженер отдела Unix-технологий МИФИ,
> Аникеев Артём.
> Тел.: 8
> (495) 788-56-99, доб. 8998
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
-- 
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998


More information about the hpc mailing list