[mephi-hpc] SIESTA

anikeev anikeev at ut.mephi.ru
Fri Feb 8 14:15:55 MSK 2019


On Fri, 2019-02-08 at 10:20 +0300, Мария Шутикова wrote:
> Здравствуйте!

Добрый день!

> Мой вопрос про ppn возник не с проста!
> В папке pool/4/mishutikova остались файлы torque от двух задач:
> W444job.sh.o143244, соответствующий запуску с nodes=1::ppn=1
> и OMP_NUM_THREADS=1
> 
> и
> 
> W444job.sh.o143517, соответствующий запуску с nodes=1::ppn=32
> и OMP_NUM_THREADS=1
> 
> В первом случае задача посчиталась полностью (через ~10 часов) и
> написала в конце Job completed
> 
> Во втором случае задача застыла через  примерно 40 минут работы и
> все. Если зайти и проверить ее статус, то выясняется, что задачи
> больше нет, хотя она стояла в очереди long, и время выйти еще не
> должно было.
> И вот так было и раньше когда я ставила ppn=32
> 
> Вот...

Torque не различает задачи, завершившиеся аварийно или штатно. Он
просто записывает STDOUT и STDERR.

Проблема оказалась в том, что Ваша задача потребляет слишком малую
часть запрошенных ресурсов и принудительно завершается как зависшая.
Попробуйте начать с OMP_NUM_THREADS=4 и больше.

> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
-- 
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998


More information about the hpc mailing list