<div dir="ltr">Добрый день,<div>скажите, а где находятся файлы mtnsa_2D3.e24735 и mtnsa_2D3.o24735?</div><div>Я не вижу их в директории где запускалась программа. Мне кажется, что это произошло по той же причине, по которой я получаю ошибку "file is already opened...".</div><div>к</div></div><div class="gmail_extra"><br><div class="gmail_quote">2017-04-18 19:30 GMT+03:00 anikeev <span dir="ltr"><<a href="mailto:anikeev@ut.mephi.ru" target="_blank">anikeev@ut.mephi.ru</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Mon, 2017-04-17 at 19:30 +0300, Phil Korneev wrote:<br>
> Добрый день,<br>
<br>
</span>Здравствуйте!<br>
<span class=""><br>
> программа не выдаёт данных. Мне кажется, она просто висит в<br>
> планировщике. <br>
> Файл энергии /mnt/pool/3/phkorneev/<wbr>magn_2D_TNSA_3a/etc/energy_<wbr>00008<br>
> должен обновляться, за время работы, по крайней мере, несколько раз.<br>
> Кроме того, файл /mnt/pool/3/phkorneev/<wbr>magn_2D_TNSA_3a/timer после<br>
> успешного запуска должен замениться<br>
> на /mnt/pool/3/phkorneev/magn_<wbr>2D_TNSA_3a/timer_0.<br>
> С уважением,<br>
> к.<br>
<br>
</span>Программа завершила работу без ошибок. Файл <a href="http://outout.info" rel="noreferrer" target="_blank">outout.info</a> обновился.<br>
<br>
Необходимо понять, как можно воспроизвести ошибку. Для ускорения<br>
перебора вариантов можно сократить число итераций в стартовых файлах.<br>
<br>
Весьма вероятно, что ошибка была связана с одновременным запуском<br>
задач, работающих одновременно с одним фалом. По окончании второго<br>
процесса первый стал работать корректно.<br>
<br>
Я бы рекомендовал поискать в исходном коде открытие файлов без<br>
проверок. Речь может идти не только о файлах пользователя, но и о<br>
служебных файлах, которые могут использоваться для межпроцессного<br>
взаимодействия.<br>
<div class="HOEnZb"><div class="h5"><br>
> 2017-04-17 19:04 GMT+03:00 anikeev <<a href="mailto:anikeev@ut.mephi.ru">anikeev@ut.mephi.ru</a>>:<br>
> > On Mon, 2017-04-17 at 14:26 +0300, anikeev wrote:<br>
> > > On Mon, 2017-04-17 at 13:04 +0300, Phil Korneev wrote:<br>
> > > > Добрый день, ошибка повторилась:<br>
> > > > At line 254 of file em2d.f (unit = 10, file = '')<br>
> > > > Fortran runtime error: File already opened in another unit<br>
> ><br>
> > От Вашего пользователя программа работает без ошибок длительное<br>
> > время.<br>
> ><br>
> > Job ID Name <wbr> User Time Use<br>
> > S<br>
> > Queue<br>
> > ------------------------- ---------------- --------------- --------<br>
> > -<br>
> > -----<br>
> > 24735.master <wbr>mtnsa_2D3 phkorneev <wbr> 469:45:<br>
> > 2 R<br>
> > medium<br>
> ><br>
> > Пока диагностировать нечего. Жду проявления ошибки.<br>
> ><br>
> > > У меня возникают множественные SegFault. Я создам ещё одну копию<br>
> > и<br>
> > > запущу задачу от Вашего пользователя, чтобы избавиться от<br>
> > побочных<br>
> > > проблем.<br>
> > ><br>
> > > > Для диагностики, чтобы не повредить данные, можно либо<br>
> > скопировать<br>
> > > > директорию /mnt/pool/3/<wbr>phkorneev/magn_2D_TNSA_3a/ в новую<br>
> > > > (необходимо<br>
> > > > скопировать "restart", "ipicls" , файл "timer" и скрипт<br>
> > > > "task_basov")<br>
> > > > и запускать оттуда, или запускать из текущей директории, но<br>
> > файл<br>
> > > > "timer" при начале счёта заменяется на "timer_0", поэтому для<br>
> > > > сохранения данных желательно следить за ним и при необходимости<br>
> > > > перед<br>
> > > > запуском переименовывать в "timer".<br>
> > > > Проще всего сделать резервное копирование директории, мне<br>
> > кажется,<br>
> > > > а<br>
> > > > когда проблема будет решена, удалить все новые данные.<br>
> > > > Я уже всё сохранил на всякий случай в<br>
> > > > "/mnt/pool/3/phkorneev/magn_<wbr>2D_TNSA_3a_cc"<br>
> > > > с уважением,<br>
> > > > к.<br>
> > > ><br>
> > > ><br>
> > > > 2017-04-17 12:06 GMT+03:00 anikeev <<a href="mailto:anikeev@ut.mephi.ru">anikeev@ut.mephi.ru</a>>:<br>
> > > > > On Sat, 2017-04-15 at 12:37 +0300, Phil Korneev wrote:<br>
> > > > > > Добрый день,<br>
> > > > > > подскажите пожалуйста, что это значит (ниже - содержание<br>
> > error<br>
> > > > > > -<br>
> > > > > > файла) и как с этим бороться?<br>
> > > > > > Задача на cherenkov, эта ошибка возникает всегда сегодня с<br>
> > > > > > утра,<br>
> > > > > > пробовал запустить около 10 раз. Вчера задача считалась.<br>
> > > > ><br>
> > > > > Добрый день!<br>
> > > > ><br>
> > > > > На кластере произошёл инцидент с переполнением хранилища.<br>
> > > > > Попробуйте,<br>
> > > > > пожалуйста, запустить задачу ещё раз. В случае повторения<br>
> > ошибки,<br>
> > > > > сообщите, как мне запустить задачу для дальнейшей<br>
> > диагностики,<br>
> > > > > чтобы не<br>
> > > > > повредить Ваши данные.<br>
> > > > ><br>
> > > > > > Спасибо!<br>
> > > > > > к<br>
> > > > > ><br>
> > > > ><br>
> > > > ><br>
> > ______________________________<wbr>______________________________<wbr>_____<br>
> > > > > __<br>
> > > > > __<br>
> > > > > > __<br>
> > > > > > At line 254 of file em2d.f (unit = 10, file = 'H����*')<br>
> > > > > > Fortran runtime error: File already opened in another unit<br>
> > > > > > ------------------------------<wbr>---------------------------<br>
> > ------<br>
> > > > ><br>
> > > > > ----<br>
> > > > > > -------<br>
> > > > > > mpirun has exited due to process rank 0 with PID 15890 on<br>
> > > > > > node n217 exiting improperly. There are two reasons this<br>
> > could<br>
> > > > ><br>
> > > > > occur:<br>
> > > > > ><br>
> > > > > > 1. this process did not call "init" before exiting, but<br>
> > others<br>
> > > > > > in<br>
> > > > > > the job did. This can cause a job to hang indefinitely<br>
> > while it<br>
> > > > ><br>
> > > > > waits<br>
> > > > > > for all processes to call "init". By rule, if one process<br>
> > calls<br>
> > > > > > "init",<br>
> > > > > > then ALL processes must call "init" prior to termination.<br>
> > > > > ><br>
> > > > > > 2. this process called "init", but exited without calling<br>
> > > > ><br>
> > > > > "finalize".<br>
> > > > > > By rule, all processes that call "init" MUST call<br>
> > "finalize"<br>
> > > > ><br>
> > > > > prior to<br>
> > > > > > exiting or it will be considered an "abnormal termination"<br>
> > > > > ><br>
> > > > > > This may have caused other processes in the application to<br>
> > be<br>
> > > > > > terminated by signals sent by mpirun (as reported here).<br>
> > > > > > ------------------------------<wbr>---------------------------<br>
> > ------<br>
> > > > ><br>
> > > > > ----<br>
> > > > > > -------<br>
> > > > > ><br>
> > > > ><br>
> > > > ><br>
> > ______________________________<wbr>______________________________<wbr>_____<br>
> > > > > __<br>
> > > > > __<br>
> > > > > > __<br>
> > > > > ><br>
> > > > > > -- <br>
> > > > > > All the best , <br>
> > > > > > Philipp K<br>
> > > > > > ______________________________<wbr>_________________<br>
> > > > > > hpc mailing list<br>
> > > > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > > > ><br>
> > > > > --<br>
> > > > > С уважением,<br>
> > > > > аспирант кафедры 4 МИФИ,<br>
> > > > > инженер отдела Unix-технологий,<br>
> > > > > Аникеев Артём.<br>
> > > > > Тел.: 8 (495) 788-56-99, доб. 8998<br>
> > > > > ______________________________<wbr>_________________<br>
> > > > > hpc mailing list<br>
> > > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > > > ><br>
> > > ><br>
> > > ><br>
> > > ><br>
> > > > -- <br>
> > > > All the best , <br>
> > > > Philipp K<br>
> > > > ______________________________<wbr>_________________<br>
> > > > hpc mailing list<br>
> > > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > ><br>
> > > ______________________________<wbr>_________________<br>
> > > hpc mailing list<br>
> > > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> > --<br>
> > С уважением,<br>
> > аспирант кафедры 4 МИФИ,<br>
> > инженер отдела Unix-технологий,<br>
> > Аникеев Артём.<br>
> > Тел.: 8 (495) 788-56-99, доб. 8998<br>
> > ______________________________<wbr>_________________<br>
> > hpc mailing list<br>
> > <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> > <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
> ><br>
><br>
><br>
><br>
> -- <br>
> All the best , <br>
> Philipp K<br>
> ______________________________<wbr>_________________<br>
> hpc mailing list<br>
> <a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
> <a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
--<br>
С уважением,<br>
аспирант кафедры 4 МИФИ,<br>
инженер отдела Unix-технологий,<br>
Аникеев Артём.<br>
Тел.: 8 (495) 788-56-99, доб. 8998</div></div><br>______________________________<wbr>_________________<br>
hpc mailing list<br>
<a href="mailto:hpc@lists.mephi.ru">hpc@lists.mephi.ru</a><br>
<a href="https://lists.mephi.ru/listinfo/hpc" rel="noreferrer" target="_blank">https://lists.mephi.ru/<wbr>listinfo/hpc</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature">All the best , <br>Philipp K</div>
</div>