squeue
- wylistuj zadania w systemie kolejkowym
sstat
- wyświetl statystyki trwającego zadania
sacct
- wyświetl informacje o zakończonych zadaniach
Informacji na temat statusu zadań można uzyskać za pomocą polecenia squeue.
Wywołanie polecenia bez podania dodatkowych parametrów, powoduje wyświetlenie informacji o wszystkich zadaniach.
Do uzyskania informacji o statusie swoich zadań, należy podać opcję --user=nazwa_użytkownika
lub -u nazwa_użytkownika
:
abcd@ui: ~ $ squeue -u abcd
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
142 test bash abcd R 0:18 1 wn1701
lub dłuższą wersję:
abcd@ui: ~ $ squeue -u abcd --long
Mon Jul 05 10:44:43 2021
JOBID PARTITION NAME USER STATE TIME TIME_LIMI NODES NODELIST(REASON)
142 test bash abcd RUNNING 8:23 UNLIMITED 1 wn1701
Gdzie:
JOBID | Numer zadania |
PARTITION | Nazwa partycji |
NAME | Nazwa zadania |
USER | Właściciel zadania |
STATE | Status zadania (zobacz niżej) |
TIME | Czas wykonanie |
TIME_LIMIT | Maksymalny czas wykonania zadania (INFINITY, oznacza nieograniczony czas) |
NODES | Liczba węzłów przedzielonych zadaniu |
NODELIST | Nazwa węzłów na których uruchomione jest zadanie |
Status może mieć wartość:
Status | Kod | Opis |
---|---|---|
COMPLETED | CD | Zadanie zostało ukończone pomyślnie |
COMPLETING | CG | Zadanie jest w trakcie kończenia pracy |
FAILED | F | Zadanie zakończyło się błędem |
PENDING | PD | Oczekuje na alokację zasobów |
PREEMPTED | PR | Zadanie zostało wywłaszczone przez inne zadanie |
RUNNING | R | Uruchomione (w trakcie pracy) |
SUSPENDED | S | Zatrzymane z dealokacją zasobów |
Polecenie scancel służy do zakończenie zadania i usunięcia go z kolejki. Aby usunąć zadanie, należy znać jego JOBID
odczytany poleceniem squeue.
abcd@ui: ~ $ squeue -u abcd
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
613 test bash abcd R 0:05 1 wn1701
614 test bash abcd R 1:05 1 wn1702
615 test bash abcd R 1:05 1 wn1703
abcd@ui ~>scancel 613
abcd@ui ~>squeue -u abcd
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
614 test bash abcd R 1:05 1 wn1702
615 test bash abcd R 1:05 1 wn1703
Możemy również usunąć kilka zadań jednym poleceniem
abcd@ui: ~ $ squeue -u abcd
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
613 test bash abcd R 0:05 1 wn1701
614 test bash abcd R 1:05 1 wn1702
615 test bash abcd R 1:05 1 wn1703
abcd@ui ~>scancel 613 615
abcd@ui ~>squeue -u abcd
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
614 test bash abcd R 1:05 1 wn1702
Lub wszystkie zadania
abcd@ui: ~ $ squeue -u abcd
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
613 test bash abcd R 0:05 1 wn1701
614 test bash abcd R 1:05 1 wn1702
615 test bash abcd R 1:05 1 wn1703
abcd@ui: ~ $ scancel -u abcd
abcd@ui: ~ $ squeue -u abcd
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
Bardziej szczegołówy status zadania można uzyskać za pomocą polecenie sstat. Polecenie wymaga jako parametr JOBID
odczytanego za pomocą polecenia squeue. Ze względu na duże ilości wyświetlanych kolumn, zaleca się używania opcji --fields=
.
Przykład polecenie sstat:
abcd@ui: ~ $ sstat 581969
JobID MaxVMSize MaxVMSizeNode MaxVMSizeTask AveVMSize MaxRSS MaxRSSNode MaxRSSTask AveRSS MaxPages MaxPagesNode MaxPagesTask AvePages MinCPU MinCPUNode MinCPUTask AveCPU NTasks AveCPUFreq ReqCPUFreqMin ReqCPUFreqMax ReqCPUFreqGov ConsumedEnergy MaxDiskRead MaxDiskReadNode MaxDiskReadTask AveDiskRead MaxDiskWrite MaxDiskWriteNode MaxDiskWriteTask AveDiskWrite TRESUsageInAve TRESUsageInMax TRESUsageInMaxNode TRESUsageInMaxTask TRESUsageInMin TRESUsageInMinNode TRESUsageInMinTask TRESUsageInTot TRESUsageOutAve TRESUsageOutMax TRESUsageOutMaxNode TRESUsageOutMaxTask TRESUsageOutMin TRESUsageOutMinNode TRESUsageOutMinTask TRESUsageOutTot
------------ ---------- -------------- -------------- ---------- ---------- ---------- ---------- ---------- -------- ------------ -------------- ---------- ---------- ---------- ---------- ---------- -------- ---------- ------------- ------------- ------------- -------------- ------------ --------------- --------------- ------------ ------------ ---------------- ---------------- ------------ -------------- -------------- ------------------ ------------------ -------------- ------------------ ------------------ -------------- --------------- --------------- ------------------- ------------------- --------------- ------------------- ------------------- ---------------
581969.0 864K r21c01b06 0 864K 840K r21c01b06 0 840K 0 r21c01b06 0 0 00:00:00 r21c01b06 0 00:00:00 1 3.41M Unknown Unknown Unknown 0 752302 r21c01b06 0 752302 18100 r21c01b06 0 18100 cpu=00:00:00,+ cpu=00:00:00,+ cpu=r21c01b06,ene+ cpu=00:00:00,fs/d+ cpu=00:00:00,+ cpu=r21c01b06,ene+ cpu=00:00:00,fs/d+ cpu=00:00:00,+ energy=0,fs/di+ energy=0,fs/di+ energy=r21c01b06,f+ fs/disk=0 energy=0,fs/di+ energy=r21c01b06,f+ fs/disk=0 energy=0,fs/di+
A ten sam przykład z użyciem --fields
abcd@ui ~ $ sstat --fields=JobID,MaxVMSize,MaxVMSizeNode,MaxVMSizeTask,AveCPU 581969
JobID MaxVMSize MaxVMSizeNode MaxVMSizeTask AveCPU
------------ ---------- -------------- -------------- ----------
581969.0 872K r21c01b06 0 00:00:00