[mephi-hpc] [!!Mass Mail] Проблема с логами

Кумпан Александр avkumpan at mephi.ru
Wed Apr 22 11:23:09 MSK 2015


Снова прошу прощения за забывчивость: ферма Basov

On 04/22/2015 11:20 AM, Кумпан Александр wrote:
> Уважаемая Администрация!
>
>     Возникает непонятная проблема с возвратом логов после исполнения 
> задач, т.е. либо все файлы логов, либо часть из них возвращаются пустыми.
>     Пример:
>     В директории /home/akumpan/pool/01Pa234 часть файлов с логами 
> имеют размер 0, чего не должно быть в принципе, т.к. при запуске 
> программы на исполнение используется команда time (сценарии запуска 
> лежат в той же директории и имеют постфикс .sh), которая просто 
> обязана дать какой-либо выход (по умолчанию, как я понимаю, в error).
>     При этом логи, возвращенные непустыми, содержат тот "выхлоп", 
> который они и должны содержать, например, файлы 01Pa234_014.out и 
> 01Pa234_014.err.
>     Также привожу jobID задач из указанной директории (qstat):
>
> 37486.master    01Pa234_000 akumpan         39:27:27 R long
> 37487.master    01Pa234_001      akumpan         39:27:35 R long
> 37488.master    01Pa234_002      akumpan         20:54:37 C long
> 37489.master    01Pa234_003      akumpan         30:11:01 C long
> 37490.master    01Pa234_004      akumpan         29:52:17 C long
> 37491.master    01Pa234_005      akumpan         36:17:17 C long
> 37492.master    01Pa234_006      akumpan         28:11:40 C long
> 37493.master    01Pa234_007      akumpan         27:58:06 C long
> 37494.master    01Pa234_008      akumpan         39:27:33 R long
> 37495.master    01Pa234_009      akumpan         39:27:32 R long
> 37496.master    01Pa234_010      akumpan         29:03:27 C long
> 37497.master    01Pa234_011      akumpan         34:16:53 C long
> 37498.master    01Pa234_012      akumpan         34:08:28 C long
> 37499.master    01Pa234_013      akumpan         34:25:06 C long
> 37500.master    01Pa234_014      akumpan         38:54:22 C long
>
>     Кроме того, попытка воспроизвести указанную проблему привела к еще 
> более удручающим результатам: абсолютно все файлы логов вернулись 
> пустыми. Файлы запуска и результаты можно найти в директории 
> /home/akumpan/01test . Во избежание путаницы (было предпринято 
> несколько попыток воспроизведения с одинаковыми именами задач), также 
> приведу их ID:
>
> 37549.master     01test_000 akumpan        00:00:28 C short
> 37550.master     01test_001       akumpan        00:00:30 C short
> 37551.master     01test_002       akumpan        00:00:14 C short
> 37552.master     01test_003       akumpan        00:00:20 C short
> 37553.master     01test_004       akumpan        00:00:27 C short
> 37554.master     01test_005       akumpan        00:00:27 C short
> 37555.master     01test_006       akumpan        00:00:28 C short
> 37556.master     01test_007       akumpan        00:00:29 C short
> 37557.master     01test_008       akumpan        00:00:00 C short
> 37558.master     01test_009       akumpan        00:00:17 C short
>
>     Не могли бы вы помочь разобраться с возникшей проблемой? Замечена 
> она была ранее, но, сколько ни старался, я так и не понял, в чем может 
> быть ошибка. Есть ли какие-нибудь ограничения на количество запущенных 
> задач?
> -- 
> С уважением,
> Кумпан А.В.
> Лаборатория 344


-- 
С уважением,
Кумпан А.В.
Лаборатория 344

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.ut.mephi.ru/pipermail/hpc/attachments/20150422/944885ac/attachment.html>


More information about the hpc mailing list