NVIDIA ogłosiła akcelerator H200 NVL, zaprojektowany jako dwuslotowa karta rozszerzeń PCIe. Mówi się, że produkt jest przeznaczony dla wysoce konfigurowalnych, chłodzonych powietrzem systemów korporacyjnych do zastosowań AI i HPC.
Podobnie jak wersja SXM NVIDIA H200, prezentowany akcelerator otrzymał 141 GB pamięci HBM3e o przepustowości 4,8 TB/s. Jednocześnie obniżono maksymalne TDP z 700 do 600 W. Za pomocą łącza NVIDIA NVLink można podłączyć cztery karty o przepustowości do 900 GB/s na procesor graficzny. W tym przypadku akceleratory są podłączone do systemu hosta za pośrednictwem PCIe 5.0 x16.
Można zainstalować dwa takie pakiety na jednym serwerze, co da w sumie osiem akceleratorów H200 NVL i 1126 GB pamięci HBM3e, co jest bardzo istotne przy obciążeniach wnioskowania. Deklarowana wydajność karty H200 NVL w FP8 sięga 3,34 Pflops w porównaniu do około 4 Pflops dla wersji SXM. Szybkość FP32 i FP64 wynosi odpowiednio 60 i 30 Tflops. Wydajność INT8 wynosi do 3,34 Pflops. Do kart dołączona jest licencja na platformę oprogramowania NVIDIA AI Enterprise.
Źródło obrazu: NVIDIA
Ponadto NVIDIA zapowiedziała akceleratory GB200 NVL4 z chłodzeniem cieczą. Znajdują się w nich dwa superchipy Grace-Backwell, co daje dwa 72-rdzeniowe procesory Grace i cztery akceleratory B100. Pojemność pamięci LPDDR5X ECC wynosi 960 GB, pamięć HBM3e to 768 GB. Wykorzystano interkonekt NVlink-C2C o przepustowości do 900 GB/s, w którym wszystkie sześć układów CPU-GPU znajduje się w tej samej domenie.
System GB200 NVL4 wyposażony jest w dwa złącza M.2 22110/2280 dla dysków SSD z interfejsem PCIe 5.0, osiem slotów na dyski NVMe E1.S (PCIe 5.0), sześć interfejsów dla kart FHFL PCIe 5.0 x16, port USB, Złącze sieciowe RJ45 (IPMI) i interfejs Mini-DisplayPort. Urządzenie wykonane jest w obudowie 2U o wymiarach 440×88×900 mm i wadze 45 kg. Regulowane TDP – od 2,75 kW do 5,5 kW.
Powiązane materiały:
NVIDIA zmienia nazwę przyszłych akceleratorów Blackwell Ultra AI na B300 NVIDIA dostarczy firmie OCP specyfikacje komponentów superakceleratora GB200 NVL72 NVIDIA wprowadziła akceleratory GB200 NVL2, platformy HGX B100/B200 i ogłosiła ekosystem Vera Rubin nowej generacji Ministerstwo Spraw Wewnętrznych: uszkodzonych serwerów na Elbrusie nie da się szybko wymienić Huawei skrzyżował dysk SSD z taśmą w napędzie MED: w związku z sankcjami firma nie może już polegać na dostawach dysków twardych