[mephi-hpc] SIESTA

anikeev anikeev at ut.mephi.ru
Fri Feb 8 16:04:02 MSK 2019


On Fri, 2019-02-08 at 15:55 +0300, Мария Шутикова wrote:
> Понятно!
> Значит из того, что задачи с nodes=1::ppn=32 и OMP_NUM_THREADS=1, 4,
> 8, 32 так завершаются, а задача с  nodes=1::ppn=1
> и  OMP_NUM_THREADS=1 считается 10 часов, осталось поменять pnn,
> скажем, на  nodes=1::ppn=4, чтобы задача не завершалась как
> зависшая, и подобрать OMP_NUM_THREADS, или я ошибаюсь?

Как запустить Вашу задачу, не повредив Ваши данные? Что-то с ней
слишком много проблем, давайте я посмотрю более детально.

> Пятница, 8 февраля 2019, 14:15 +03:00 от anikeev <anikeev at ut.mephi.ru
> >:
> 
> On Fri, 2019-02-08 at 10:20 +0300, Мария Шутикова wrote:
> > Здравствуйте!
> Добрый день!
> 
> > Мой вопрос про ppn возник не с проста!
> > В папке pool/4/mishutikova остались файлы torque от двух задач:
> > W444job.sh.o143244, соответствующий запуску с nodes=1::ppn=1
> > и OMP_NUM_THREADS=1
>> > и
>> > W444job.sh.o143517, соответствующий запуску с nodes=1::ppn=32
> > и OMP_NUM_THREADS=1
>> > В первом случае задача посчиталась полностью (через ~10 часов) и
> > написала в конце Job completed
>> > Во втором случае задача застыла через  примерно 40 минут работы и
> > все. Если зайти и проверить ее статус, то выясняется, что задачи
> > больше нет, хотя она стояла в очереди long, и время выйти еще не
> > должно было.
> > И вот так было и раньше когда я ставила ppn=32
>> > Вот...
> 
> Torque не различает задачи, завершившиеся аварийно или штатно. Он
> просто записывает STDOUT и STDERR.
> 
> Проблема оказалась в том, что Ваша задача потребляет слишком малую
> часть запрошенных ресурсов и принудительно завершается как зависшая.
> Попробуйте начать с OMP_NUM_THREADS=4 и больше.
> 
> > _______________________________________________
> > hpc mailing list
> > hpc at lists.mephi.ru
> > https://lists.mephi.ru/listinfo/hpc
> -- 
> С уважением,
> инженер отдела Unix-технологий МИФИ,
> Аникеев Артём.
> Тел.: 8
> (495) 788-56-99, доб. 8998
> 
> 
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
-- 
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998


More information about the hpc mailing list