SuperDuper: GigaIO SuperDuperNODE umożliwia jednoczesne połączenie 64 akceleratorów poprzez PCIe

Redaktor NetMaster
Redaktor NetMaster
4 min. czytania

Firma GigaIO, której głównym osiągnięciem jest rozproszony system interkonektów oparty na PCI Express o nazwie FabreX, ustanowiła nowy rekord – na nowej platformie twórcom udało się podwoić liczbę jednocześnie podłączonych urządzeń PCIe, zwiększając ją z 32 do 64.

O nowościach GigaIO opowiadaliśmy już nie raz naszym czytelnikom. Pod wieloma względami są one naprawdę wyjątkowe, gdyż stworzona przez firmę złożona infrastruktura pozwala na podłączenie znacznie większej liczby różnych akceleratorów do jednego lub kilku serwerów, niż jest to możliwe w wersji klasycznej, ale jednocześnie utrzymuje wysoki poziom wykorzystania te akceleratory.

SuperNODE GigaIO. Źródło zdjęć tutaj i poniżej: GigaIO

Na początku roku firma zademonstrowała już system z 16 akceleratorami NVIDIA A100, a latem GigaIO zaprezentowała miniklaster SuperNODE. W różnych konfiguracjach system mógłby zawierać 32 akceleratory AMD Instinct MI210 lub 24 akceleratory NVIDIA A100, uzupełnione o pojemność 1 PB. Jednocześnie system dzięki funkcjom FabreX nie wymagał żadnych specjalnych ustawień przed pracą.

FabreX umożliwia fizyczne łączenie wszystkich typów zasobów w oparciu o istniejący stos technologii PCI Express

W tym tygodniu GigaIO ogłosiło nową wersję swojego systemu HPC, nazwaną po prostu SuperDuperNODE. Udało jej się w nim podwoić liczbę akceleratorów z 32 do 64. Podobnie jak poprzednio, system przeznaczony jest przede wszystkim do wykorzystania w scenariuszach generatywnych AI, ale jest też ciekawy z punktu widzenia szeregu zadań HPC, w w szczególności obliczeniowa dynamika płynów (CFD).

SuperNODE był w stanie przeprowadzić najbardziej złożoną symulację CFD na świecie w zaledwie 33 godziny. Symulował lot 62-metrowego samolotu pasażerskiego Concorde. Choć model trwa tylko 1 sekundę, jest bardzo złożony, gdyż wymaga obliczenia zachowania 40 miliardów komórek o objętości 12,4 mm3 w 67 268 okresach czasu. System spędził 29 godzin na obliczaniu lotu, a kolejne 4 godziny na renderowaniu 3000 obrazów 4K. Biorąc pod uwagę doskonałą skalowalność przy zastosowaniu SuperDuperNODE, czas obliczeń został skrócony prawie o połowę.

Jak już wspomniano, FabreX pozwala łatwo zwiększyć liczbę akceleratorów i innych wydajnych urządzeń PCIe na węzeł procesora przy niemal idealnym skalowaniu. Zaktualizowana platforma i tym razem nie zawiodła: w teście HPL-MxP szczytowy współczynnik wykorzystania wyniósł 99,7% teoretycznego maksimum, a w testach HPL i HPCG odpowiednio 95,2% i 88%.

Firma deweloperska podaje, że oprogramowanie FabreX nabrało pełnej formy i bez żadnych problemów przełącza tryby SuperNODE pomiędzy Beast (system widoczny jest jako jeden duży węzeł), Swarm (wiele węzłów dla wielu obciążeń) i Freestyle Mode (każdy ładunek ma dedykowany Twój węzeł z określoną liczbą akceleratorów). Rozpoczęcie dostaw SuperDuperNODE zaplanowano na koniec roku. Partnerami, podobnie jak w przypadku SuperNODE, będą Dell i Supermicro.

Powiązane materiały:

Superkomputer w szafie: GigaIO SuperNODE pozwala na połączenie 32 akceleratorów AMD Instinct MI210 GigaIO FabreX obiecuje podwoić efektywność wykorzystania zasobów akceleratora dla platform opartych na Sapphire Rapids GigaIO FabreX z CXL umożliwi przeniesienie pul RAM poza serwery Microsoft po cichu uruchomił pierwszy region chmurowy Azure w Izraelu 1C zmieni koszt swojego oprogramowania w oparciu o 1C:Enterprise 8 w 2024 roku

Udostępnij ten artykuł
Dodaj komentarz