[mephi-hpc] Ошибка команды nvidia-smi
anikeev
anikeev at ut.mephi.ru
Fri Nov 18 10:41:55 MSK 2022
On Thu, 2022-11-17 at 18:54 +0000, Резник Максим Семенович wrote:
> Добрый вечер!
Здравствуйте!
> Команда nvidia-smi выдаёт ошибку с текстом:
> "NVIDIA-SMI has failed because it couldn't communicate with the
> NVIDIA driver. Make sure that the latest NVIDIA driver is installed
> and running."
>
> Задался этим вопросом, потому что python библиотека torch при
> написании torch.cuda.is_available() выдаёт False.
> Помогите, пожалуйста!
На головном узле нет видеокарт, он предназначен только для подготовки
задач. Видеокарты находятся на вычислительных узлах. Вам нужно освоить
использование менеджера ресурсов Slurm. Основы работы со Slurm описаны
в официальном руководстве пользователя:
http://ut.mephi.ru/pdf/projects/hpc/userguide.pdf
> С уважением,
> Максим Резник
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc
--
С уважением,
ведущий инженер отдела UNIX-технологий НИЯУ МИФИ,
к.ф.-м.н. Аникеев Артем.
email: aaanikeyev at mephi.ru, anikeev at ut.mephi.ru
Best regards,
MEPhI UNIX-technology department lead engineer,
Artem Anikeev, Ph.D.
e-mail: aaanikeyev at mephi.ru, anikeev at ut.mephi.ru
More information about the hpc
mailing list