<HTML><BODY>Понятно!<br>Значит из того, что задачи с nodes=1::ppn=32 и OMP_NUM_THREADS=1, 4, 8, 32 так завершаются, а задача с nodes=1::ppn=1 и OMP_NUM_THREADS=1 считается 10 часов, осталось поменять pnn, скажем, на nodes=1::ppn=4, чтобы задача не завершалась как зависшая, и подобрать OMP_NUM_THREADS, или я ошибаюсь?<br><blockquote style="border-left:1px solid #0857A6; margin:10px; padding:0 0 0 10px;">
Пятница, 8 февраля 2019, 14:15 +03:00 от anikeev <anikeev@ut.mephi.ru>:<br>
<br>
<div id="">
<div class="js-helper js-readmsg-msg">
<style type="text/css"></style>
<div>
<base target="_self" href="https://e.mail.ru/">
<div id="style_15496245550000000454_BODY">On Fri, 2019-02-08 at 10:20 +0300, Мария Шутикова wrote:<br>
> Здравствуйте!<br>
Добрый день!<br>
<br>
> Мой вопрос про ppn возник не с проста!<br>
> В папке pool/4/mishutikova остались файлы torque от двух задач:<br>
> W444job.sh.o143244, соответствующий запуску с nodes=1::ppn=1<br>
> и OMP_NUM_THREADS=1<br>
> <br>
> и<br>
> <br>
> W444job.sh.o143517, соответствующий запуску с nodes=1::ppn=32<br>
> и OMP_NUM_THREADS=1<br>
> <br>
> В первом случае задача посчиталась полностью (через ~10 часов) и<br>
> написала в конце Job completed<br>
> <br>
> Во втором случае задача застыла через примерно 40 минут работы и<br>
> все. Если зайти и проверить ее статус, то выясняется, что задачи<br>
> больше нет, хотя она стояла в очереди long, и время выйти еще не<br>
> должно было.<br>
> И вот так было и раньше когда я ставила ppn=32<br>
> <br>
> Вот...<br>
<br>
Torque не различает задачи, завершившиеся аварийно или штатно. Он<br>
просто записывает STDOUT и STDERR.<br>
<br>
Проблема оказалась в том, что Ваша задача потребляет слишком малую<br>
часть запрошенных ресурсов и принудительно завершается как зависшая.<br>
Попробуйте начать с OMP_NUM_THREADS=4 и больше.<br>
<br>
> _______________________________________________<br>
> hpc mailing list<br>
> <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> <a href="https://lists.mephi.ru/listinfo/hpc" target="_blank">https://lists.mephi.ru/listinfo/hpc</a><br>
-- <br>
С уважением,<br>
инженер отдела Unix-технологий МИФИ,<br>
Аникеев Артём.<br>
Тел.: 8<br>
(495) 788-56-99, доб. 8998<br>
</div>
<base target="_self" href="https://e.mail.ru/">
</div>
</div>
</div>
</blockquote>
<br>
<br>-- <br>Мария Шутикова<br></BODY></HTML>