<div dir="ltr">Большое спасибо!<div><br></div><div>С уважением,<br>Александр Зайцев.</div></div><div class="gmail_extra"><br><div class="gmail_quote">1 декабря 2016 г., 12:51 пользователь anikeev <span dir="ltr"><<a href="mailto:anikeev@ut.mephi.ru" target="_blank">anikeev@ut.mephi.ru</a>></span> написал:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On Tue, 2016-11-29 at 19:57 +0300, Alexander Zaytsev wrote:<br>
> Здравствуйте!<br>
<br>
Добрый день!<br>
<br>
Проблема была в разрыве сетевых соединений на узле n113. Все задачи,<br>
попадавшие на этот узел, не могли сохранять файлы на сетевые носители.<br>
<br>
Проблема исправлена.<br>
<br>
Приносим извинения за неудобства.<br>
<br>
> Столкнулся сегодня с проблемой и провел небольшой тест, чтобы<br>
> продемонстрировать ее:<br>
> Ставлю 30 одинаковых задач на basov. Из них около 20-25 выполняются<br>
> нормально (минуты за 2), остальные 5-10 задач не выполняясь сразу<br>
> получают статус Сompleted, даже не создав .o и .e лог-файлов.<br>
><br>
> qstat:<br>
> 317400.master task19.sh zaitsev136 00:01:25<br>
> R short<br>
> 317401.master task20.sh zaitsev136 00:01:24<br>
> R short<br>
> 317402.master task21.sh zaitsev136 00:01:23<br>
> R short<br>
> 317403.master task22.sh zaitsev136 00:01:59<br>
> C short<br>
> 317404.master task23.sh zaitsev136 00:02:01<br>
> C short<br>
> 317405.master task24.sh zaitsev136 00:01:20<br>
> R short<br>
> 317406.master task25.sh zaitsev136 00:01:19<br>
> R short<br>
> 317407.master task26.sh zaitsev136 00:00:00<br>
> C short<br>
> 317408.master task27.sh zaitsev136 00:00:00<br>
> C short<br>
> 317409.master task28.sh zaitsev136 00:00:00<br>
> C short<br>
> 317410.master task29.sh zaitsev136 00:00:00<br>
> C short<br>
><br>
> ls ./*.sh.o*<br>
> ./task0.sh.o317381 ./task15.sh.o317396 ./task21.sh.o317402<br>
> ./task5.sh.o317386<br>
> ./task1.sh.o317382 ./task16.sh.o317397 ./task22.sh.o317403<br>
> ./task6.sh.o317387<br>
> ./task10.sh.o317391 ./task17.sh.o317398 ./task23.sh.o317404<br>
> ./task7.sh.o317388<br>
> ./task11.sh.o317392 ./task18.sh.o317399 ./task24.sh.o317405<br>
> ./task8.sh.o317389<br>
> ./task12.sh.o317393 ./task19.sh.o317400 ./task25.sh.o317406<br>
> ./task9.sh.o317390<br>
> ./task13.sh.o317394 ./task2.sh.o317383 ./task3.sh.o317384<br>
> ./task14.sh.o317395 ./task20.sh.o317401 ./task4.sh.o317385<br>
><br>
> Как видно, задачи task26 - task29 не выполнялись (нет лог файлов).<br>
> При этом все таски абсолютно одинаковые, см. папку<br>
> /home/zaitsev136/phenix/<wbr>clusterTest/tasks (на басове)<br>
><br>
> Т.е. часть задач просто не выполняется, ничего не сообщив юзеру.<br>
><br>
> С уважением,<br>
> Александр Зайцев,<br>
> инженер каф. 67<br>
<span class="HOEnZb"><font color="#888888">--<br>
С уважением,<br>
аспирант кафедры 4 МИФИ,<br>
инженер отдела Unix-технологий,<br>
Аникеев Артём.<br>
Тел.: 8 (495) 788-56-99, доб. 8998<br>
</font></span></blockquote></div><br></div>