[mephi-hpc] Запуск задач на кластере

Андрей Шумилин shumilin.2002 at gmail.com
Wed Apr 24 22:39:56 MSK 2024


Добрый вечер!

Подскажите пожалуйста, в чем может быть проблема и какой может быть выход
из нее.
Я запускаю задачи скриптом (приведен ниже, кластер cherenkov), но почему-то
они запускаются через раз. На прошлой неделе удалось запустить все задачи и
они спокойно по очереди запускались и все работало, однако в последние
несколько дней наблюдаю странную особенность: задачи лежат в беклоге уже
дня 3, причем дело не в приоритете, а в том, что задача ждет ресурсов. При
этом ноды свободные регулярно освобождаются, но на них запускаются задачи
других людей, хотя следующая в очереди моя. Я не совсем понимаю, ресурсы,
которые я запрашиваю вроде как входят в рамки оборудования, да и этим
скриптом я пользовался совершенно недавно и все удавалось запускать, но тем
не менее задачи ждут ресурсов и не запускаются.

#!/bin/bash
#SBATCH --nodes=1  # One physical node requested
#SBATCH --tasks-per-node=8     # Number of MPI threads running on 1 node
#SBATCH --cpus-per-task=2      # Number of CPU needed to execute 1 task
#SBATCH --time=240:00:00
#SBATCH --mem-per-cpu=6000     # Memory per core

mpirun pw.x <relax.in> relax.out && python3 fetch_relax_out.py && mpirun
pw.x <scf.in> scf.out && mpirun pw.x <nscf.in> nscf.out && mpirun pw.x <
bands.in> bands.out && mpirun dos.x <dos.in> dos.out && mpirun bands.x <
bands_postprocess.in> bands_postprocess.out && mpirun plotband.x <
struct.plotband
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.mephi.ru/pipermail/hpc/attachments/20240424/af6688f8/attachment.htm>


More information about the hpc mailing list