<div dir="ltr">Спасибо!<br>После упрощения стартового .sh скрипта приложение работает корректно. Видимо ошибка была связана именно с этим.</div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">пт, 10 сент. 2021 г. в 13:26, anikeev <<a href="mailto:anikeev@ut.mephi.ru">anikeev@ut.mephi.ru</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On Fri, 2021-09-10 at 12:27 +0300, Николай Бухарский wrote:<br>
> Добрый день,<br>
> <br>
> Для запуска задачи сначала необходимо скомпилировать код - я это<br>
> делал следующим образом - создавал в папке 'pond_force' директорию<br>
> build, переходил в нее и использовал команду cmake для создания<br>
> makefile, а затем компилировал при помощи make - после этого в<br>
> исходной директории 'pond_force' появляется исполняемый файл<br>
> 'elektra'.<br>
> <br>
> Затем, когда код скомпилирован, необходимо создать в директории<br>
> 'pond_force' папку 'results' - в нее будут записываться создаваемые<br>
> кодом файлы. Далее можно производить запуск с помощью .sh скрипта,<br>
> который обращается к исполняемому файлу 'elektra'. Свой .sh скрипт я<br>
> приложил к предыдущему письму ('run.sh'). При этом для расчета<br>
> используются параметры файлов из папки 'config' - их можно не менять,<br>
> но папка 'config' должна также быть в директории 'pond_force'. <br>
> Спустя какое-то время в .out файле должны начать появляться данные о<br>
> прогрессе от каждого из процессов, а в папке results - .h5 файлы с<br>
> результатами расчета. Ранее при запуске на 64 ядрах каждые 10 минут<br>
> появлялось где-то штук 30 новых файлов. Сейчас же ничего не<br>
> происходит и за 30 минут, а в .out файле не появляется вообще никаких<br>
> выводов.<br>
<br>
Вы забыли рассказать, что ещё нужно создать файл <a href="http://log.in" rel="noreferrer" target="_blank">log.in</a>, который<br>
приложение почему-то не создает само и выводит соответствующее<br>
предупреждение в STDOUT/STDERR.<br>
<br>
Приложение работает. Задача 202975, директория<br>
/mnt/pool/5/anikeev/bukharskii_problem/pond_force<br>
<br>
Скрипт упростил до такого:<br>
<br>
=====<br>
#!/bin/bash<br>
#<br>
#SBATCH -t 30:00:00<br>
#SBATCH --ntasks=8<br>
#SBATCH --cpus-per-task=8<br>
export OMP_NUM_THREADS=8<br>
export HDF5_USE_FILE_LOCKING=FALSE<br>
<br>
mpirun.openmpi ./elektra<br>
=====<br>
> ---<br>
> С уважением,<br>
> Бухарский Николай<br>
> <br>
> пт, 10 сент. 2021 г. в 11:50, anikeev <<a href="mailto:anikeev@ut.mephi.ru" target="_blank">anikeev@ut.mephi.ru</a>>:<br>
> > On Fri, 2021-09-10 at 02:11 +0300, Николай Бухарский wrote:<br>
> > > Добрый день!<br>
> > <br>
> > Здравствуйте!<br>
> > <br>
> > > После обновления кластера cherenkov перестала считаться одна из<br>
> > > задач, которая ранее работала без нареканий. Код и файл, с<br>
> > помощью<br>
> > > которого ее запускаю, прикладываю. <br>
> > > <br>
> > > Для компиляции использовал cmake, его файл также прикладываю. На<br>
> > > этапе компиляции никаких ошибок не возникает. Однако<br>
> > скомпилированный<br>
> > > код при запуске не производит никаких данных, но и не закрывается<br>
> > из-<br>
> > > за каких-либо ошибок, то есть просто висит мертвым грузом.<br>
> > Заметил<br>
> > > только, что при запуске задачи на 218 ноде в логе выводится: <br>
> > > slurmstepd: error: file_write uint32: unable to open<br>
> > '(null)/tasks'<br>
> > > for writing: No such file or directory <br>
> > > slurmstepd-n: error: unable to add task[pid=5606] to memory cg<br>
> > > '(null)'<br>
> > > С другими нодами же не выводится вообще ничего.<br>
> > > <br>
> > > Подскажите пожалуйста, с чем это может быть связано и как это<br>
> > можно<br>
> > > исправить?<br>
> > <br>
> > Подскажите, пожалуйста, как можно полностью воспроизвести запуск<br>
> > Вашей<br>
> > задачи на самом кластере, используя оригинальные директории и<br>
> > исполняемые файлы?<br>
> > <br>
> > > ---<br>
> > > С уважением,<br>
> > > Бухарский Николай<br>
> > > _______________________________________________<br>
> > > hpc mailing list<br>
> > > <a href="mailto:hpc@lists.mephi.ru" target="_blank">hpc@lists.mephi.ru</a><br>
> > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/listinfo/hpc</a><br>
> > <br>
> > _______________________________________________<br>
> > hpc mailing list<br>
> > <a href="mailto:hpc@lists.mephi.ru" target="_blank">hpc@lists.mephi.ru</a><br>
> > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/listinfo/hpc</a><br>
<br>
-- <br>
С уважением,<br>
инженер отдела Unix-технологий МИФИ,<br>
Аникеев Артём.<br>
Тел.: 8 (495) 788-56-99, доб. 8998<br>
<br>
_______________________________________________<br>
hpc mailing list<br>
<a href="mailto:hpc@lists.mephi.ru" target="_blank">hpc@lists.mephi.ru</a><br>
<a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/listinfo/hpc</a><br>
</blockquote></div>