[mephi-hpc] проблема с задачей
Andrew A. Savchenko
bircoph at ut.mephi.ru
Sat Sep 21 08:25:12 MSK 2013
Здравствуйте,
On Sat, 21 Sep 2013 04:37:21 +0300 Alexandra Freidzon wrote:
> Добрый день,
>
> У меня вдруг начались проблемы с программой, к-рая успешно работала до
> начала технических работ.
Технические работы здесь ни при чём. Они начались почти на два дня
позже сообщения в mail-листе, а Ваши проблемы начались раньше.
> А теперь все время вылетает с сообщениями типа:
> DDI Process 4: semget return an error.
> semget errno=ENOSPC -- check system limit for sysv semaphores.
> Запускается из ~/pool
>
> Что случилось?
В сообщении об ошибке написано, что случилось: Вы исчерпали лимит
семафоров. Диагностика с узлов это подтверждает, например, на n10:
# ipcs -s | grep freidzon | wc -l
120
Судя по датам последнего использования семафоров и датам запуска
Ваших задач, Ваше приложение работает грязно и не убирает после себя
семафоры, по крайней мере в ряде случаев.
У нас есть механизмы очистки системы, но слишком свежие семафоры не
удаляются, т.к. это может повредить работе задач, которые, возможно,
их используют. Лимиты я увеличивать не буду, т.к. в таком случае
некорректно работающее приложение приведёт к невозможности работы не
только Ваших приложений, но и задач всех остальных пользователей.
На данный момент я очистил пул семафоров на всех узлах. Рекомендую
Вам и остальным пользователям Кинтеха добавить
ipcrm --all=sem
в конец своих скриптов выполнения задачи.
К сожалению, данная проблема есть не только у Ваших задач, но у Вас
она выражена наиболее сильно.
Best regards,
Andrew Savchenko
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 836 bytes
Desc: not available
URL: <http://lists.ut.mephi.ru/pipermail/hpc/attachments/20130921/96ced22d/attachment.sig>
More information about the hpc
mailing list