[mephi-hpc] SIESTA

Мария Шутикова shutikova_maria at mail.ru
Fri Feb 8 19:38:52 MSK 2019


Спасибо!
Входные файлы и скрипт для запуска задачи поместила в pool/4/mishutikova/W_444_test
Наверное, лучше дождаться завершения моей текущей задачи, и запускать после, тогда наверняка ничего не повредится.
И я после нее не буду пока ставить задач, дождусь Вашего совета.

>Пятница,  8 февраля 2019, 16:04 +03:00 от anikeev <anikeev at ut.mephi.ru>:
>
>On Fri, 2019-02-08 at 15:55 +0300, Мария Шутикова wrote:
>> Понятно!
>> Значит из того, что задачи с nodes=1::ppn=32 и OMP_NUM_THREADS=1, 4,
>> 8, 32 так завершаются, а задача с  nodes=1::ppn=1
>> и  OMP_NUM_THREADS=1 считается 10 часов, осталось поменять pnn,
>> скажем, на  nodes=1::ppn=4, чтобы задача не завершалась как
>> зависшая, и подобрать OMP_NUM_THREADS, или я ошибаюсь?
>Как запустить Вашу задачу, не повредив Ваши данные? Что-то с ней
>слишком много проблем, давайте я посмотрю более детально.
>
>> Пятница, 8 февраля 2019, 14:15 +03:00 от anikeev < anikeev at ut.mephi.ru
>> >:
>> 
>> On Fri, 2019-02-08 at 10:20 +0300, Мария Шутикова wrote:
>> > Здравствуйте!
>> Добрый день!
>> 
>> > Мой вопрос про ppn возник не с проста!
>> > В папке pool/4/mishutikova остались файлы torque от двух задач:
>> > W444job.sh.o143244, соответствующий запуску с nodes=1::ppn=1
>> > и OMP_NUM_THREADS=1
>>>> > и
>>>> > W444job.sh.o143517, соответствующий запуску с nodes=1::ppn=32
>> > и OMP_NUM_THREADS=1
>>>> > В первом случае задача посчиталась полностью (через ~10 часов) и
>> > написала в конце Job completed
>>>> > Во втором случае задача застыла через  примерно 40 минут работы и
>> > все. Если зайти и проверить ее статус, то выясняется, что задачи
>> > больше нет, хотя она стояла в очереди long, и время выйти еще не
>> > должно было.
>> > И вот так было и раньше когда я ставила ppn=32
>>>> > Вот...
>> 
>> Torque не различает задачи, завершившиеся аварийно или штатно. Он
>> просто записывает STDOUT и STDERR.
>> 
>> Проблема оказалась в том, что Ваша задача потребляет слишком малую
>> часть запрошенных ресурсов и принудительно завершается как зависшая.
>> Попробуйте начать с OMP_NUM_THREADS=4 и больше.
>> 
>> > _______________________________________________
>> > hpc mailing list
>> >  hpc at lists.mephi.ru
>> >  https://lists.mephi.ru/listinfo/hpc
>> -- 
>> С уважением,
>> инженер отдела Unix-технологий МИФИ,
>> Аникеев Артём.
>> Тел.: 8
>> (495) 788-56-99, доб. 8998
>> 
>> 
>> _______________________________________________
>> hpc mailing list
>>  hpc at lists.mephi.ru
>>  https://lists.mephi.ru/listinfo/hpc
>-- 
>С уважением,
>инженер отдела Unix-технологий МИФИ,
>Аникеев Артём.
>Тел.: 8
>(495) 788-56-99, доб. 8998


-- 
Мария Шутикова
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.mephi.ru/pipermail/hpc/attachments/20190208/070a8d1b/attachment.html>


More information about the hpc mailing list