[mephi-hpc] Ошибка команды nvidia-smi

anikeev anikeev at ut.mephi.ru
Fri Nov 18 10:41:55 MSK 2022


On Thu, 2022-11-17 at 18:54 +0000, Резник Максим Семенович wrote:
> Добрый вечер!

Здравствуйте!

> ​Команда nvidia-smi выдаёт ошибку с текстом:
> "NVIDIA-SMI has failed because it couldn't communicate with the
> NVIDIA driver. Make sure that the latest NVIDIA driver is installed
> and running."
> 
> Задался этим вопросом, потому что python библиотека torch при
> написании torch.cuda.is_available() выдаёт False.
> Помогите, пожалуйста!

На головном узле нет видеокарт, он предназначен только для подготовки
задач. Видеокарты находятся на вычислительных узлах. Вам нужно освоить
использование менеджера ресурсов Slurm. Основы работы со Slurm описаны
в официальном руководстве пользователя:

http://ut.mephi.ru/pdf/projects/hpc/userguide.pdf

> С уважением,
> Максим Резник
> _______________________________________________
> hpc mailing list
> hpc at lists.mephi.ru
> https://lists.mephi.ru/listinfo/hpc

-- 
С уважением,
ведущий инженер отдела UNIX-технологий НИЯУ МИФИ,
к.ф.-м.н. Аникеев Артем.
email: aaanikeyev at mephi.ru, anikeev at ut.mephi.ru

Best regards,
MEPhI UNIX-technology department lead engineer,
Artem Anikeev, Ph.D.
e-mail: aaanikeyev at mephi.ru, anikeev at ut.mephi.ru






More information about the hpc mailing list