[mephi-hpc] проблема с задачей

Alexandra Freidzon freidzon.sanya at gmail.com
Sun Sep 22 01:29:23 MSK 2013


> Может повредить. Всё зависит от того, как и где запускаются задачи:
> если на узле, где выполняется завершающаяся задача, есть другие
> _Ваши_ задачи и они не умеют обрабатывать исчезновение семафоров, то
> будут проблемы. Других пользователей это не коснётся. Если Вы
> выполняете задачи на разных узлах, то проблем не будет; в частности,
> если ppn=8, то на одном узле сможет исполняться только одна задача,
> т.к. на узле ровно 8 ядер.

Я запускаю одну задачу на нескольких узлах с ppn=8, так что все ОК.

> Кроме того ipcrm нужно выполнять на всех узлах, где работает задача,
> а не там, где она была запущена. Это может быть проблемой, если Вы
> запускаете задачу через mpirun.

Я запускаю через pbs. Это нормально?

> Наиболее верным решением будет понять, почему приложение оставляет
> семафоры и устранить эту проблему. Наиболее вероятно, что они
> остаются при преждевременном завершении задачи на узле, например,
> из-за получения сигнала, внутренней ошибки или каких-либо особых
> краевых условий. Для устранения проблемы я бы предложил добавить
> обработчик сигналов/выхода из программы, который будет проверять, все
> ли семафоры удалены и удалять их по необходимости.

Дело в том, что программу писала не я, я только получила код и его
собрала на кластере. Да, задача несколько раз подряд завершалась с
ошибкой, я пыталась разобраться, отчего она возникает. Весьма
вероятно, что будет возникать и дальше, а поправить код я не могу,
только выяснить условия, когда она проявляется.

> Сделал сборщик неиспользуемых семафоров.

Спасибо!


More information about the hpc mailing list