[mephi-hpc] Что случилось с pool/3 и pool/4?

anikeev anikeev at ut.mephi.ru
Thu Jan 31 13:43:21 MSK 2019


On Thu, 2019-01-31 at 03:10 +0300, Alexandra Freidzon wrote:
> Добрый день!

Здравствуйте!

> А что случилось с /mnt/pool/3 и 4? На Черенкове при попытке вызвать
> Midnight Commander все виснет (листинг директории получить можно из
> ком. строки). На Басове mc работает, но только с /mnt/pool/1 и 2, а 3
> и 4 показывает пустыми.

Исправлено.

Произошло наложение нескольких проблем. Головной узел basov аварийно
перезагрузился по причине перегрузки пользователями (сразу несколько
людей пытались считать на голове в обход менеджера ресурсов, в
результате чего лимиты на отдельного пользователя не помогли). Из-за
перезагрузки оборвалось монтирование /home/basov на cherenkov, в
результате чего не работал df на голове cherenkov, в результате чего
некорректно работал mc на голове cherenkov. Функционирование самой
файловой системы на cherenkov не прерывалось. Кроме того, в результате
перезагрузки не смонтировались pool/3 и pool/4 на голове basov (на
вычислительные узлы basov проблема не распространялась).

Для устранения подобных проблем в будущем были размонтированы
перекрестные точки монтирования /home. Для передачи данных меду
кластерами рекомендуется использовать pool (/home рекомендуется
использовать только для конфигурационных файлов, там не осталось места
для данных).

Кроме того, произошло зависание задач на n208, n216, n219. Эта проблема
похожа на программную и не совпадает по времени с проблемами на голове
basov, новые задачи запустились на этих узлах без проблем. При
повторении зависания прошу автора задач повторно обратиться ко мне.

Прошу прощения за неудобства.

> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
-- 
С уважением,
инженер отдела Unix-технологий МИФИ,
Аникеев Артём.
Тел.: 8
(495) 788-56-99, доб. 8998


More information about the hpc mailing list