Na superkomputerze WCSS dostępne są różne partycje SLURM, mogące być również rozumiane jako kolejki zadań. Partycje grupują wybrane zasoby obliczeniowe i każda z nich ma swój zestaw ograniczeń, takich jak limit rozmiaru zadania, limit czasu zadania, grupy (usługi) mające do nich dostęp itp. Dostęp do partycji przyznawany jest na podstawie przynależności do odpowiednich usług (a dokładniej Linuxowych grup odpowiadających tym usługom).
Poniżej znajdują się tabele zawierające informacje na temat poszczególnych partycji, których dostępność zależy od rodzaju posiadanej usługi.
Maksymalne ilości zasobów per zadanie
Wartości podane w kolumnach "Liczba CPU per węzeł", "Liczba GPU per węzeł", "Pamięć podręczna" oraz "Dostępne TMPDIR" definiują maksymalne ilości tych zasobów per węzeł dla jednego zadania.
Katalogi TMPDIR
W zależności od wyboru partycji i rodzaju zadania - jedno lub wielowęzłowego, przyporządkowywane są domyślne rodzaje katalogów TMPDIR (patrz kolumna "Dostępne TMPDIR"). Więcej informacji na stronie Tymczasowa przestrzeń dyskowa na obliczenia (TMPDIR).
Automatyczne dopasowanie partycji do czasu trwania zadania
Aby automatycznie zlecić zadanie w odpowiedniej partycjibem2-cpu-short
lubbem2-cpu-normal
na podstawie zadeklarowanego czasu zadania, przy zlecaniu zadania należy użyć opcji--partition bem2-cpu
(jest to dodatkowy mechanizm rekolejkujący ibem2-cpu
nie jest formalnie partycją SLURM).
Ograniczenia i wymagania
- wymagana usługa posiadająca CPU godziny (sprawdź za pomocąservice-balance --check-cpu
)
Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIR (quotab) |
---|---|---|---|---|---|---|---|---|
bem2-cpu-short | 487 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G/357Ga | 3-00:00:00 |
|
bem2-cpu-normal | 336 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G/357Ga | 21-00:00:00 |
|
a dostępne dwa rodzaje węzłów z różną ilością pamięci podręcznej
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
* domyślna przestrzeń TMPDIR dla zadań jednowęzłowych
** domyślna przestrzeń TMPDIR dla zadań wielowęzłowych
Automatyczne dopasowanie partycji do czasu trwania zadania
Aby automatycznie zlecić zadanie w odpowiedniej partycjilem-gpu-short
lublem-gpu-normal
na podstawie zadeklarowanego czasu zadania, przy zlecaniu zadania należy użyć opcji--partition lem-gpu
(jest to dodatkowy mechanizm rekolejkujący ilem-gpu
nie jest formalnie partycją SLURM).
Ograniczenia i wymagania
- wymagana usługa posiadająca CPU i GPU godziny (sprawdź za pomocąservice-balance --check-cpu --check-gpu
)
- alokacja minimum 1 karty GPU do zadania (użyj opcji--gres=gpu:<TYPE>:<NUM>
)
Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIR (quotab) |
---|---|---|---|---|---|---|---|---|
lem-gpu-short | 74 | Intel(R) Xeon(R) Platinum 8462Y+ | 64 | NVIDIA H100-94GB | 4 | 996G | 3-00:00:00 |
|
lem-gpu-normal | 52 | Intel(R) Xeon(R) Platinum 8462Y+ | 64 | NVIDIA H100-94GB | 4 | 996G | 7-00:00:00 |
|
tesla | 2 | Intel(R) Xeon(R) Gold 6126 | 24 | NVIDIA Tesla P100-16GB | 2 | 117G | 7-00:00:00 |
|
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
* domyślna przestrzeń TMPDIR dla zadań jednowęzłowych
** domyślna przestrzeń TMPDIR dla zadań wielowęzłowych
Skrypty uruchamiające
Aby uruchomić sesję interaktywną skorzystaj z komend:
-sub-interactive
dla partycji bem2-cpu-interactive
-sub-interactive-lem-gpu
dla partycji lem-gpu-interactive
Ograniczenia i wymagania
- możliwośc uruchomienia wyłącznie zadania interaktywnegosrun
(nie można zlecić zadania za pomocąsbatch
)
Więcej ograniczeń dla wybranej partycji interaktywnej znajduje się w kolumnie "Dodatkowe ogarniczenia"
Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIR (quotab) | Dodatkowe ograniczenia |
---|---|---|---|---|---|---|---|---|---|
bem2-cpu-interactive | 2 | Intel(R) Xeon(R) Platinum 8268 | 96 | - | - | 177G | 06:00:00 |
|
|
lem-gpu-interactive | 1 | Intel(R) Xeon(R) Platinum 8462Y+ | 64 | NVIDIA H100-94GB | 4 | 996G | 06:00:00 |
|
|
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
* domyślna przestrzeń TMPDIR dla zadań jednowęzłowych
** domyślna przestrzeń TMPDIR dla zadań wielowęzłowych
Poniższe partycje są dostępne wyłącznie dla użytkowników infrastruktury PLGRID
Aby zlecić zadanie w poniższych partycjach, należy skorzystać z opcji-p <PARTITION>
, gdzie<PARTITION>
to nazwa jednej z partycji podanych w poniższej tabeli
Partycja | Liczba węzłów | Model CPU | Liczba CPU per węzeł | Model GPU | Liczba GPU per węzeł | Pamięć podręczna | Maks. czas zadania | Dostępne TMPDIR (quotab) |
---|---|---|---|---|---|---|---|---|
plgrid-short | 32 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G | 1-00:00:00 |
|
plgrid | 32 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 187G | 3-00:00:00 |
|
plgrid-long | 32 | Intel(R) Xeon(R) Platinum 8268 | 48 | - | - | 177G | 1-00:00:00 |
|
b maksymalna zajętość TMPDIR: Lustre - brak ograniczeń na zajętość TMPDIR; SHM - maksymalna pojemność TMPDIR równa ilości pamięci podręcznej na węźle, LOCAL - dostępna przestrzeń na TMPDIR per węzeł podana w nawiasie
* - domyślna przestrzeń TMPDIR dla zadań jednowęzłowych
** - domyślna przestrzeń TMPDIR dla zadań wielowęzłowych
Do uzyskania informacji o aktualnie dostępnych węzłach na poszczególnych partycjach należy posłużyć się komendą check-partitions
:
$ check-partitions
PARTITION TIMELIMIT NODES(A/I)
bem2-cpu-short 3-00:00:00 412/53
bem2-cpu-normal 21-00:00:00 308/12
bem2-cpu-interactive 6:00:00 1/1
lem-cpu-short 3-00:00:00 0/171
lem-cpu-normal 21-00:00:00 0/128
lem-cpu-interactive 6:00:00 0/1
lem-gpu-short 3-00:00:00 14/47
lem-gpu-normal 7-00:00:00 13/27
lem-gpu-interactive 6:00:00 0/1
staff-bem2-cpu infinite 1/0
staff-lem-cpu infinite 1/0
staff-lem-gpu infinite 1/0
gdzie:
Więcej szczegółów
Informacje na temat konkretnej partycji można uzyskać za pomocą komendyscontrol show partition <NAZWA_PARTYCJI>
UWAGA!
Brak informacji o danej partycji oznacza, że nie jest ona dostępna dla użytkownika.