[mephi-hpc] ограничение времени?

Phil Korneev korneev at theor.mephi.ru
Sat Mar 28 00:17:45 MSK 2015


Добрый день, в последнее время (около двух недель) моя задача всё время
снимается со счёта, причём иногда это выглядит так (в error output)

=>> PBS: job killed: walltime 259234 exceeded limit 259200

а иногда так


[n115][[59863,1],32][btl_tcp_endpoint.c:657:mca_btl_tcp_endpoint_complete_connect]
connect() to 192.168.137.118 failed: Connection refused (111)
[n112][[59863,1],95][btl_tcp_endpoint.c:657:mca_btl_tcp_endpoint_complete_connect]
connect() to 10.0.101.118 failed: Connection refused (111)


Запуск задачи происходит нормально, она снимается после нескольких часов
счёта. Вы не могли бы прояснить, это технический сбой, или ограничение
времени? Если ограничение времени, почему задача ставится в очередь и
начинает выполняться, ведь в скрипте на запуск указано необходимое время
счёта.

Спасибо,
ф.к.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.ut.mephi.ru/pipermail/hpc/attachments/20150328/d8d2a201/attachment.html>


More information about the hpc mailing list