AMD mówi o wielochipowych akceleratorach serwerowych Instinct MI200 na CDNA 2

Rafał Nowakowski
Rafał Nowakowski
4 min. czytania

Na konferencji Hot Chips 34 firma AMD podzieliła się szczegółami na temat serii akceleratorów obliczeniowych serwerów Instinct MI200 opartych na układach Aldebaran opartych na architekturze CDNA 2. Są to pierwsze procesory graficzne AMD, które wykorzystują układ wielochipowy (chiplet), znany również jako układ MCM.

Źródło obrazu: AMD

Niektóre z kluczowych cech Instinct MI200 to:

  • Architektura CDNA 2 z rdzeniami macierzy drugiej generacji w celu przyspieszenia obliczeń FP64 i FP32. Zapewniają nawet czterokrotnie wyższą wydajność operacji FP64 w porównaniu z poprzednią generacją akceleratorów serwerowych AMD;
  • zaawansowana technologia pakowania 2.5D Elevated Fanout Bridge (EFB), która zapewnia do 1,8 razy więcej rdzeni i do 2,7 razy większą przepustowość pamięci niż poprzednia generacja procesorów graficznych AMD do serwerów, jednocześnie osiągając szczytową przepustowość pamięci na poziomie 3x, 2 TB/s;
  • trzecia generacja magistrali AMD Infinity Fabric; obsługa do 8 linii Infinity Fabric, które zapewniają komunikację między kilkoma samymi procesorami AMD Instinct MI200, a także procesorami AMD EPYC, w tym trzeciej generacji, które zapewniają systemowi zunifikowaną pamięć CPU/GPU i zwiększają maksymalną przepustowość.

W ramach akceleratorów AMD Instinct MI200 zastosowano procesor graficzny z dwoma kryształami (chipletami) – głównym i wtórnym. Każdy układ zawiera 8 silników cieniowania, z których każdy zawiera 14 jednostek obliczeniowych (CU) dla operacji FP64, FP32, a także silniki macierzy drugiej generacji dla operacji FP16 i BF16.

W ten sposób na kostkę przypada 112 jednostek obliczeniowych lub 7168 procesorów strumieniowych oraz 224 jednostki CU lub 14 336 procesorów strumieniowych dla całego GPU. Procesor GPU jest wytwarzany w procesie 6 nm TSMC. W sumie akcelerator zawiera 58 miliardów tranzystorów.

Schemat blokowy karty graficznej AMD Instinct MI200

Układ Aldebarana korzysta z szybkiej magistrali xGMI. Każdy chiplet ma silnik VCN 2.6 i główny kontroler IO, każdy po cztery 1024-bitowe kontrolery pamięci HBM2e. Każdy chiplet ma też 8 MB pamięci podręcznej L2, fizycznie podzielonej na 32 bloki, oraz 64 GB pamięci HBM2e o przepustowości 1,6 TB/s. Łączna ilość pamięci HBM2e na GPU może wynosić nawet 128 GB, a jej przepustowość to 3,2 TB/s. To o 1,2 TB/s więcej niż w przypadku karty NVIDIA A100 wyposażonej w 80 GB pamięci HBM2e.

AMD Aldebaran obsługuje 8 kanałów Infinity Fabric. Jeden z nich może być wykorzystany do podłączenia CPU i GPU (przez PCI Express). Został zaprojektowany z myślą o stałej szybkości przesyłania danych na poziomie 144 GB/s. Skalowanie do 500 GB/s przy użyciu zewnętrznego łącza Infinity Fabric z czterema podłączonymi akceleratorami AMD Instinct MI200 lub przy użyciu karty PCIe 4.0 ESM AIC zapewniającej przepustowość 100 GB/s.

Wskaźnik wydajności AMD Instinct MI200

AMD twierdzi, że w zależności od zadania Aldebaran może być nawet trzy razy szybszy niż NVIDIA A100.

Akceleratory AMD Instinct MI200 oparte na architekturze CNDA 2 są już używane jako część superkomputera eksaskalowego Frontier, który znajduje się na szczycie rankingu TOP500 najpotężniejszych superkomputerów na świecie. Zapewnia wydajność na poziomie 1,1 eksaflopa.

AMD ogłosiło również plany wypuszczenia nowej generacji akceleratorów obliczeniowych Instinct MI300. Będą też korzystać z układu chipletów, ale będą to już APU – kryształy CPU i GPU zostaną połączone na tym samym podłożu. Instinct MI300 twierdzi, że wykorzystuje architekturę GPU CDNA 3 i Zen 4 oraz do 5 razy wyższą wydajność AI niż architektura CDNA 2.

Źródło: AMD

Udostępnij ten artykuł