<div dir="ltr">Понятно: запускалась программа в <span style="font-size:12.8px">/magn_2D_</span><wbr style="font-size:12.8px"><span style="font-size:12.8px">TNSA_3 а не в </span><span style="font-size:12.8px">/magn_2D_</span><wbr style="font-size:12.8px"><span style="font-size:12.8px">TNSA_3a.</span><div><span style="font-size:12.8px">Пока ошибок нет. Я считаю.</span></div><div><span style="font-size:12.8px">Спасибо</span></div><div><span style="font-size:12.8px">С уважением,</span></div><div><span style="font-size:12.8px">к</span></div></div><div class="gmail_extra"><br><div class="gmail_quote">2017-04-19 12:48 GMT+03:00 anikeev <span dir="ltr"><<a href="mailto:anikeev@ut.mephi.ru" target="_blank">anikeev@ut.mephi.ru</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Tue, 2017-04-18 at 20:34 +0300, Phil Korneev wrote:<br>
> Добрый день,<br>
</span><span class="">> скажите, а где находятся файлы mtnsa_2D3.e24735 и mtnsa_2D3.o24735?<br>
> Я не вижу их в директории где запускалась программа. Мне кажется, что<br>
> это произошло по той же причине, по которой я получаю ошибку "file is<br>
> already opened...".<br>
> к<br>
<br>
</span>Здравствуйте!<br>
<br>
Файлы здесь:<br>
<br>
phkorneev@master.cherenkov /mnt/pool/3/phkorneev/magn_2D_<wbr>TNSA_3 $ ls<br>
-lah /mnt/pool/3/phkorneev/magn_2D_<wbr>TNSA_3/mtnsa_2D3.e24735<br>
-rw------- 1 phkorneev users 14K Apr 18 14:03<br>
/mnt/pool/3/phkorneev/magn_2D_<wbr>TNSA_3/mtnsa_2D3.e24735<br>
phkorneev@master.cherenkov /mnt/pool/3/phkorneev/magn_2D_<wbr>TNSA_3 $ ls<br>
-lah /mnt/pool/3/phkorneev/magn_2D_<wbr>TNSA_3/mtnsa_2D3.o24735<br>
-rw------- 1 phkorneev users 329 Apr 17 14:59<br>
/mnt/pool/3/phkorneev/magn_2D_<wbr>TNSA_3/mtnsa_2D3.o24735<br>
<div class="HOEnZb"><div class="h5"><br>
> 2017-04-18 19:30 GMT+03:00 anikeev <<a href="mailto:anikeev@ut.mephi.ru">anikeev@ut.mephi.ru</a>>:<br>
> > On Mon, 2017-04-17 at 19:30 +0300, Phil Korneev wrote:<br>
> > > Добрый день,<br>
> ><br>
> > Здравствуйте!<br>
> ><br>
> > > программа не выдаёт данных. Мне кажется, она просто висит в<br>
> > > планировщике. <br>
> > > Файл<br>
> > энергии /mnt/pool/3/phkorneev/<wbr>magn_2D_TNSA_3a/etc/energy_<wbr>00008<br>
> > > должен обновляться, за время работы, по крайней мере, несколько<br>
> > раз.<br>
> > > Кроме того, файл /mnt/pool/3/phkorneev/<wbr>magn_2D_TNSA_3a/timer<br>
> > после<br>
> > > успешного запуска должен замениться<br>
> > > на /mnt/pool/3/phkorneev/magn_<wbr>2D_TNSA_3a/timer_0.<br>
> > > С уважением,<br>
> > > к.<br>
> ><br>
> > Программа завершила работу без ошибок. Файл <a href="http://outout.info" rel="noreferrer" target="_blank">outout.info</a> обновился.<br>
> ><br>
> > Необходимо понять, как можно воспроизвести ошибку. Для ускорения<br>
> > перебора вариантов можно сократить число итераций в стартовых<br>
> > файлах.<br>
> ><br>
> > Весьма вероятно, что ошибка была связана с одновременным запуском<br>
> > задач, работающих одновременно с одним фалом. По окончании второго<br>
> > процесса первый стал работать корректно.<br>
> ><br>
> > Я бы рекомендовал поискать в исходном коде открытие файлов без<br>
> > проверок. Речь может идти не только о файлах пользователя, но и о<br>
> > служебных файлах, которые могут использоваться для межпроцессного<br>
> > взаимодействия.<br>
> ><br>
> > > 2017-04-17 19:04 GMT+03:00 anikeev <<a href="mailto:anikeev@ut.mephi.ru">anikeev@ut.mephi.ru</a>>:<br>
> > > > On Mon, 2017-04-17 at 14:26 +0300, anikeev wrote:<br>
> > > > > On Mon, 2017-04-17 at 13:04 +0300, Phil Korneev wrote:<br>
> > > > > > Добрый день, ошибка повторилась:<br>
> > > > > > At line 254 of file em2d.f (unit = 10, file = '')<br>
> > > > > > Fortran runtime error: File already opened in another unit<br>
> > > ><br>
> > > > От Вашего пользователя программа работает без ошибок длительное<br>
> > > > время.<br>
> > > ><br>
> > > > Job ID Name <wbr> User Time<br>
> > Use<br>
> > > > S<br>
> > > > Queue<br>
> > > > ------------------------- ---------------- --------------- ----<br>
> > ----<br>
> > > > -<br>
> > > > -----<br>
> > > ><br>
> > 24735.master <wbr>mtnsa_2D3 phkorneev <wbr> 469:45:<br>
> > > > 2 R<br>
> > > > medium<br>
> > > ><br>
> > > > Пока диагностировать нечего. Жду проявления ошибки.<br>
> > > ><br>
> > > > > У меня возникают множественные SegFault. Я создам ещё одну<br>
> > копию<br>
> > > > и<br>
> > > > > запущу задачу от Вашего пользователя, чтобы избавиться от<br>
> > > > побочных<br>
> > > > > проблем.<br>
> > > > ><br>
> > > > > > Для диагностики, чтобы не повредить данные, можно либо<br>
> > > > скопировать<br>
> > > > > > директорию /mnt/pool/3/<wbr>phkorneev/magn_2D_TNSA_3a/ в новую<br>
> > > > > > (необходимо<br>
> > > > > > скопировать "restart", "ipicls" , файл "timer" и скрипт<br>
> > > > > > "task_basov")<br>
> > > > > > и запускать оттуда, или запускать из текущей директории, но<br>
> > > > файл<br>
> > > > > > "timer" при начале счёта заменяется на "timer_0", поэтому<br>
> > для<br>
> > > > > > сохранения данных желательно следить за ним и при<br>
> > необходимости<br>
> > > > > > перед<br>
> > > > > > запуском переименовывать в "timer".<br>
> > > > > > Проще всего сделать резервное копирование директории, мне<br>
> > > > кажется,<br>
> > > > > > а<br>
> > > > > > когда проблема будет решена, удалить все новые данные.<br>
> > > > > > Я уже всё сохранил на всякий случай в<br>
> > > > > > "/mnt/pool/3/phkorneev/magn_<wbr>2D_TNSA_3a_cc"<br>
> > > > > > с уважением,<br>
> > > > > > к.<br>
> > > > > ><br>
> > > > > ><br>
> > > > > > 2017-04-17 12:06 GMT+03:00 anikeev <<a href="mailto:anikeev@ut.mephi.ru">anikeev@ut.mephi.ru</a>>:<br>
> > > > > > > On Sat, 2017-04-15 at 12:37 +0300, Phil Korneev wrote:<br>
> > > > > > > > Добрый день,<br>
> > > > > > > > подскажите пожалуйста, что это значит (ниже -<br>
> > содержание<br>
> > > > error<br>
> > > > > > > > -<br>
> > > > > > > > файла) и как с этим бороться?<br>
> > > > > > > > Задача на cherenkov, эта ошибка возникает всегда<br>
> > сегодня с<br>
> > > > > > > > утра,<br>
> > > > > > > > пробовал запустить около 10 раз. Вчера задача<br>
> > считалась.<br>
> > > > > > ><br>
> > > > > > > Добрый день!<br>
> > > > > > ><br>
> > > > > > > На кластере произошёл инцидент с переполнением хранилища.<br>
> > > > > > > Попробуйте,<br>
> > > > > > > пожалуйста, запустить задачу ещё раз. В случае повторения<br>
> > > > ошибки,<br>
> > > > > > > сообщите, как мне запустить задачу для дальнейшей<br>
> > > > диагностики,<br>
> > > > > > > чтобы не<br>
> > > > > > > повредить Ваши данные.<br>
> > > > > > ><br>
> > > > > > > > Спасибо!<br>
> > > > > > > > к<br>
> > > > > > > ><br>
> > > > > > ><br>
> > > > > > ><br>
> > > ><br>
> > ______________________________<wbr>______________________________<wbr>_____<br>
> > > > > > > __<br>
> > > > > > > __<br>
> > > > > > > > __<br>
> > > > > > > > At line 254 of file em2d.f (unit = 10, file = 'H����*')<br>
> > > > > > > > Fortran runtime error: File already opened in another<br>
> > unit<br>
> > > > > > > > ------------------------------<wbr>-----------------------<br>
> > ----<br>
> > > > ------<br>
> > > > > > ><br>
> > > > > > > ----<br>
> > > > > > > > -------<br>
> > > > > > > > mpirun has exited due to process rank 0 with PID 15890<br>
> > on<br>
> > > > > > > > node n217 exiting improperly. There are two reasons<br>
> > this<br>
> > > > could<br>
> > > > > > ><br>
> > > > > > > occur:<br>
> > > > > > > ><br>
> > > > > > > > 1. this process did not call "init" before exiting, but<br>
> > > > others<br>
> > > > > > > > in<br>
> > > > > > > > the job did. This can cause a job to hang indefinitely<br>
> > > > while it<br>
> > > > > > ><br>
> > > > > > > waits<br>
> > > > > > > > for all processes to call "init". By rule, if one<br>
> > process<br>
> > > > calls<br>
> > > > > > > > "init",<br>
> > > > > > > > then ALL processes must call "init" prior to<br>
> > termination.<br>
> > > > > > > ><br>
> > > > > > > > 2. this process called "init", but exited without<br>
> > calling<br>
> > > > > > ><br>
> > > > > > > "finalize".<br>
> > > > > > > > By rule, all processes that call "init" MUST call<br>
> > > > "finalize"<br>
> > > > > > ><br>
> > > > > > > prior to<br>
> > > > > > > > exiting or it will be considered an "abnormal<br>
> > termination"<br>
> > > > > > > ><br>
> > > > > > > > This may have caused other processes in the application<br>
> > to<br>
> > > > be<br>
> > > > > > > > terminated by signals sent by mpirun (as reported<br>
> > here).<br>
> > > > > > > > ------------------------------<wbr>-----------------------<br>
> > ----<br>
> > > > ------<br>
> > > > > > ><br>
> > > > > > > ----<br>
> > > > > > > > -------<br>
> > > > > > > ><br>
> > > > > > ><br>
> > > > > > ><br>
> > > ><br>
> > ______________________________<wbr>______________________________<wbr>_____<br>
> > > > > > > __<br>
> > > > > > > __<br>
> > > > > > > > __<br>
> > > > > > > ><br>
> > > > > > > > -- <br>
> > > > > > > > All the best , <br>
> > > > > > > > Philipp K<br>
> > > > > > > > ______________________________<wbr>_________________<br>
> > > > > > > > hpc mailing list<br>
> > > > > > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > > > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > > > > > ><br>
> > > > > > > --<br>
> > > > > > > С уважением,<br>
> > > > > > > аспирант кафедры 4 МИФИ,<br>
> > > > > > > инженер отдела Unix-технологий,<br>
> > > > > > > Аникеев Артём.<br>
> > > > > > > Тел.: 8 (495) 788-56-99, доб. 8998<br>
> > > > > > > ______________________________<wbr>_________________<br>
> > > > > > > hpc mailing list<br>
> > > > > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > > > > > ><br>
> > > > > ><br>
> > > > > ><br>
> > > > > ><br>
> > > > > > -- <br>
> > > > > > All the best , <br>
> > > > > > Philipp K<br>
> > > > > > ______________________________<wbr>_________________<br>
> > > > > > hpc mailing list<br>
> > > > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > > > ><br>
> > > > > ______________________________<wbr>_________________<br>
> > > > > hpc mailing list<br>
> > > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > > > --<br>
> > > > С уважением,<br>
> > > > аспирант кафедры 4 МИФИ,<br>
> > > > инженер отдела Unix-технологий,<br>
> > > > Аникеев Артём.<br>
> > > > Тел.: 8 (495) 788-56-99, доб. 8998<br>
> > > > ______________________________<wbr>_________________<br>
> > > > hpc mailing list<br>
> > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > > ><br>
> > ><br>
> > ><br>
> > ><br>
> > > -- <br>
> > > All the best , <br>
> > > Philipp K<br>
> > > ______________________________<wbr>_________________<br>
> > > hpc mailing list<br>
> > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > --<br>
> > С уважением,<br>
> > аспирант кафедры 4 МИФИ,<br>
> > инженер отдела Unix-технологий,<br>
> > Аникеев Артём.<br>
> > Тел.: 8 (495) 788-56-99, доб. 8998<br>
> ><br>
> > ______________________________<wbr>_________________<br>
> > hpc mailing list<br>
> > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> ><br>
><br>
><br>
><br>
> -- <br>
> All the best , <br>
> Philipp K<br>
> ______________________________<wbr>_________________<br>
> hpc mailing list<br>
> <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
--<br>
С уважением,<br>
аспирант кафедры 4 МИФИ,<br>
инженер отдела Unix-технологий,<br>
Аникеев Артём.<br>
Тел.: 8 (495) 788-56-99, доб. 8998<br>
______________________________<wbr>_________________<br>
hpc mailing list<br>
<a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
<a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature">All the best , <br>Philipp K</div>
</div>