Intel pokazał wyniki testów akceleratora Max 1550 i opowiedział o przyszłych chipach Gaudi3 i Falcon Shores

Redaktor NetMaster
Redaktor NetMaster
5 min. czytania

Na SC23 Intel pokazał szereg ciekawych slajdów. Zawierają wyniki testów akceleratora Max 1550 o architekturze Xe, a także plany dotyczące kolejnej generacji akceleratorów AI Gaudi.

Obraz: Intel

Jednocześnie firma przyjęła inne niż zwykle podejście – zamiast demonstrować wyniki uzyskane w murach samego Intela, głos oddano do Narodowego Laboratorium Argonne Departamentu Energii USA, gdzie latem tego roku zainstalowano Ukończono superkomputer klasy ex-class Aurora, który obecnie zajmuje drugie miejsce w TOP500.

Ten klaster HPC wykorzystuje moduły OAM Max 1550 (Ponte Vecchio) z pakietem termicznym o mocy 600 W. Zawierają 128 rdzeni Xe i 128 GB pamięci HBM2E. Interfejs Xe Link umożliwia bezpośrednią komunikację nawet ośmiu z tych modułów, zapewniając bardziej efektywną skalowalność.

Źródło zdjęć tutaj i poniżej: Intel za pośrednictwem ServeTheHome

Chociaż dostrajanie kompleksu obliczeniowego Aurora wciąż trwa, istnieją już dane na temat wydajności Max 1550 w porównaniu z AMD Instinct MI250 i NVIDIA A100. W teście fizyki wysokich cząstek z wykorzystaniem kombinacji PyTorch + Horovod (dokładność obliczeń FP32) akceleratory Intela pewnie zajęły pierwsze miejsce i wykazały również 83% efektywność skalowania na 512 węzłach Aurora.

W teście symulującym zachowanie kompleksu nanocząstek krzemu akceleratory Max 1550 również wypadły na pierwsze miejsce, zarówno w wartościach bezwzględnych, jak i w teście 128-węzłowym, w porównaniu do Polarisa (cztery A100 na węzeł) i Frontier (cztery MI250 na węzeł) systemów. . Kod napisany przy użyciu języka Fortran i OpenMP okazał się skuteczny po skalowaniu do ponad 500 węzłów obliczeniowych Aurora.

Źródło obrazu: Intel za pośrednictwem Phoronix

Ogólnie rzecz biorąc, akceleratory Intel Max 1550 wykazują dobre wyniki i nie są gorsze od NVIDIA H100: w niektórych zadaniach ich względna wydajność wynosi co najmniej 0,82, ale w większości innych testów liczba ta waha się od 1,0 do 3,76. Oczywiście H100 ma godnego rywala, który ponadto ma niższy koszt i większą dostępność. Ale sama NVIDIA zaprezentowała już chipy (G)H200, a AMD przygotowuje Instinct MI300.

Systemy oparte na Intel Max dostępne są w różnych formach: zarówno w Intel Developer Cloud, jak i w ramach rozwiązań OEM. Supermicro oferuje serwer z ośmioma modułami OAM, natomiast Dell i Lenovo oferują rozwiązania z czterema akceleratorami w tym samym formacie. Wariant PCIe Max 1100 jest dostępny u powyższych producentów, a także w firmie HPE.

Oprócz akceleratorów Max, Intel udostępnił także nowe dane na temat wydajności koprocesorów AI Gaudi2. Firma w dalszym ciągu aktywnie ulepsza i optymalizuje ekosystem oprogramowania Gaudi. W rezultacie w systemie wnioskowania opartym na modelu GPT-J-6B wyniki akceleratorów Gaudi2 są już porównywalne z NVIDIA H100 (SXM 80 GB), a A100 jest znacznie gorszy zarówno od Gaudi2, jak i Max 1550.

Ale najciekawsza jest informacja o planach na kolejne pokolenie Gaudiego. Obecnie wiadomo, że Gaudi3 będzie produkowany w procesie technologicznym 5 nm. Nowy układ będzie czterokrotnie szybszy w obliczeniach BF16, a także będzie miał dwukrotnie większy podsystem pamięci i 1,5 razy więcej pamięci HBM. Powinien ujrzeć światło dzienne w 2024 roku.

Jednocześnie firma przypomniała, że ​​procesory Xeon Emerald Rapids zostaną zaprezentowane dokładnie za miesiąc, a Granite Rapids pojawią się w 2024 roku. W 2025 roku pojawi się chip Falcon Shores, który według Intela powinien teraz łączyć procesor graficzny i koprocesor AI. Połączy architektury Habana i Xe w jedno rozwiązanie z układem kafelkowym, pamięcią HBM3 i pełną obsługą CXL.

Źródło obrazu: Intel za pośrednictwem Phoronix

Warto zaznaczyć, że takie ujednolicenie jest całkiem realne: Intel bardzo aktywnie rozwija uniwersalny, elastyczny i otwarty stos technologii w ramach projektu oneAPI. Zawiera wszystkie niezbędne narzędzia – od kompilatorów i bibliotek systemowych po narzędzia integrujące z popularnymi silnikami analityki danych, modelami i bibliotekami sztucznej inteligencji.

Powiązane materiały:

Intel porzucił akceleratory AI Habana Greco Laboratorium Los Alamos uruchomiło superkomputer Crossroads oparty na procesorze Intel Xeon Sapphire Rapids Intel i Supermicro zademonstrowały próbki akceleratorów Ponte Vecchio na targach Computex 2023 Microsoft po cichu uruchomił pierwszy region chmurowy Azure w Izraelu 1C zmieni koszt swojego oprogramowania w oparciu o 1C:Enterprise 8 w 2024 roku

Źródła:

SłużyćDomowi Foronix

Udostępnij ten artykuł