[mephi-hpc] Fwd: error cherenkov

Andrew A. Savchenko bircoph at ut.mephi.ru
Wed Dec 21 18:59:40 MSK 2016


On Wed, 21 Dec 2016 18:29:20 +0300 Phil Korneev wrote:
> Спасибо!
> Но только проблема осталась:
> 
> Unable to copy file /var/spool/pbs/spool/13418.master.OU to
> /mnt/pool/1/phkorneev/TADEK_2+/TADEK_2+.o13418
> *** error from copy
> /bin/cp: cannot create regular file
> '/mnt/pool/1/phkorneev/TADEK_2+/TADEK_2+.o13418': No such file or directory
> *** end error output
> Output retained on that host in: /var/spool/pbs/undelivered/13418.master.OU
> 
> Unable to copy file /var/spool/pbs/spool/13418.master.ER to
> /mnt/pool/1/phkorneev/TADEK_2+/TADEK_2+.e13418
> *** error from copy
> /bin/cp: cannot create regular file
> '/mnt/pool/1/phkorneev/TADEK_2+/TADEK_2+.e13418': No such file or directory
> *** end error output
> Output retained on that host in: /var/spool/pbs/undelivered/13418.master.ER

Это другая проблема: pool 1 и 2 доступны только на голове
cherenkov, на вычислительных узлах cherenkov их нет, поскольку это
полки basov и соединение между basov и cherenkov гораздо медленнее
соединения между узлами cherenkov. Если мы разрешим использование
pool/{1,2} на вычислительных узлах cherenkov, интерконнект между
cherenkov и basov станет узким местом и задачи будут работать
очень медленно.

Точно так же на basov: там родные 1 и 2, а 3 и 4 доступны только на
голове (для облегчения переноса данных между кластерами).

Вся эта информация была указана ещё весной этого года в
информационной рассылке по поводу запуска cherenkov.

Best regards,
Andrew Savchenko
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 819 bytes
Desc: not available
URL: <http://lists.mephi.ru/pipermail/hpc/attachments/20161221/180aff17/attachment.sig>


More information about the hpc mailing list