Zadania zlecaj do partycji:
lem-cpu
oraz bem2-cpu
- dla zadań CPUlem-gpu
- dla zadań GPUNa superkomputerze WCSS dostępne są różne partycje SLURM, mogące być również rozumiane jako kolejki zadań. Partycje grupują wybrane zasoby obliczeniowe i każda z nich ma swój zestaw ograniczeń, takich jak limit rozmiaru zadania, limit czasu zadania, grupy (usługi) mające do nich dostęp itp. Dostęp do partycji przyznawany jest na podstawie przynależności do odpowiednich usług (a dokładniej Linuxowych grup odpowiadających tym usługom).
Poniżej znajdują się tabele zawierające informacje na temat poszczególnych partycji, których dostępność zależy od rodzaju posiadanej usługi.
Automatyczne dopasowanie partycji do czasu trwania zadania
Aby na podstawie zadeklarowanego czasu zadania automatycznie zlecić zadanie w odpowiedniej partycji:
lem-cpu-short
lublem-cpu-normal
- użyj opcji--partition lem-cpu
bem2-cpu-short
lubbem2-cpu-normal
- użyj opcji--partition bem2-cpu
Jest to dodatkowy mechanizm rekolejkujący i
bem2-cpu
orazlem-cpu
nie są formalnie partycjami SLURM
Ograniczenia i wymagania:
service-balance --check-cpu
)Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIRa (quotab) |
---|---|---|---|---|---|---|---|---|
bem2-cpu-short | 487 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G/357Gc | 3-00:00:00 |
|
bem2-cpu-normal | 336 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G/357Gc | 21-00:00:00 |
|
lem-cpu-short | 184 | AMD EPYC 9554 | 128 | - | - | 1430G | 3-00:00:00 |
|
lem-cpu-normal | 140 | AMD EPYC 9554 | 128 | - | - | 1430G | 21-00:00:00 |
|
a domyślna przestrzeń TMPDIR: * - dla zadań jednowęzłowych; ** - dla zadań wielowęzłowych
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
c dostępne dwa rodzaje węzłów z różną ilością pamięci podręcznej
d dostępne dwa rodzaje węzłów z różną ilością pamięci masowej Local
Automatyczne dopasowanie partycji do czasu trwania zadania
Aby na podstawie zadeklarowanego czasu zadania automatycznie zlecić zadanie w odpowiedniej partycji:
lem-gpu-short
lublem-gpu-normal
- **użyj opcji--partition lem-gpu
**Jest to dodatkowy mechanizm rekolejkujący i
lem-gpu
nie jest formalnie partycją SLURM
Ograniczenia i wymagania:
service-balance --check-cpu --check-gpu
)--gres=gpu:<TYPE>:<NUM>
)Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIRa (quotab) |
---|---|---|---|---|---|---|---|---|
lem-gpu-short | 74 | Intel(R) Xeon(R) Platinum 8462Y+ | 64 | NVIDIA H100-94GB | 4 | 996G | 3-00:00:00 |
|
lem-gpu-normal | 52 | Intel(R) Xeon(R) Platinum 8462Y+ | 64 | NVIDIA H100-94GB | 4 | 996G | 7-00:00:00 |
|
tesla | 2 | Intel(R) Xeon(R) Gold 6126 | 24 | NVIDIA Tesla P100-16GB | 2 | 117G | 7-00:00:00 |
|
a domyślna przestrzeń TMPDIR: * - dla zadań jednowęzłowych; ** - dla zadań wielowęzłowych
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
Skrypty uruchamiające
Aby uruchomić sesję interaktywną skorzystaj z komend:
sub-interactive
dla partycji bem2-cpu-interactivesub-interactive-lem-cpu
dla partycji lem-cpu-interactivesub-interactive-lem-gpu
dla partycji lem-gpu-interactive
Ograniczenia i wymagania:
srun
(nie można zlecić zadania za pomocą sbatch
)Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIRa (quotab) | Dodatkowe ograniczenia |
---|---|---|---|---|---|---|---|---|---|
bem2-cpu-interactive | 2 | Intel(R) Xeon(R) Platinum 8268 | 96 | - | - | 177G | 06:00:00 |
|
|
lem-cpu-interactive | 1 | AMD EPYC 9554 | 128 | - | - | 1700G | 06:00:00 |
|
|
lem-gpu-interactive | 1 | Intel(R) Xeon(R) Platinum 8462Y+ | 64 | NVIDIA H100-94GB | 4 | 996G | 06:00:00 |
|
|
a domyślna przestrzeń TMPDIR: * - dla zadań jednowęzłowych; ** - dla zadań wielowęzłowych
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
Ograniczenia i wymagania:
Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIRa (quotab) |
---|---|---|---|---|---|---|---|---|
plgrid-short | 32 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G | 1-00:00:00 |
|
plgrid | 32 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 187G | 3-00:00:00 |
|
plgrid-long | 32 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G | 1-00:00:00 |
|
a domyślna przestrzeń TMPDIR: * - dla zadań jednowęzłowych; ** - dla zadań wielowęzłowych
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
Maksymalne ilości zasobów per zadanie
Wartości podane w kolumnach "Liczba CPU per węzeł", "Liczba GPU per węzeł", "Pamięć podręczna" oraz "Dostępne TMPDIR" definiują maksymalne ilości tych zasobów per węzeł dla jednego zadania.
Katalogi TMPDIR
W zależności od wyboru partycji i rodzaju zadania - jedno lub wielowęzłowego, przyporządkowywane są domyślne rodzaje katalogów TMPDIR (patrz kolumna "Dostępne TMPDIR"). Więcej informacji na stronie Tymczasowa przestrzeń dyskowa na obliczenia (TMPDIR).
Do uzyskania informacji o aktualnie dostępnych węzłach na poszczególnych partycjach należy posłużyć się komendą check-partitions
:
$ check-partitions
PARTITION TIMELIMIT NODES(A/I)
bem2-cpu-short 3-00:00:00 412/53
bem2-cpu-normal 21-00:00:00 308/12
bem2-cpu-interactive 6:00:00 1/1
lem-cpu-short 3-00:00:00 0/171
lem-cpu-normal 21-00:00:00 0/128
lem-cpu-interactive 6:00:00 0/1
lem-gpu-short 3-00:00:00 14/47
lem-gpu-normal 7-00:00:00 13/27
lem-gpu-interactive 6:00:00 0/1
gdzie:
Więcej szczegółów
Informacje na temat konkretnej partycji można uzyskać za pomocą komendyscontrol show partition <NAZWA_PARTYCJI>
Niedostępna partycja
Brak informacji o danej partycji oznacza, że nie jest ona dostępna dla użytkownika.