NVIDIA wypuści trzy nowe dedykowane akceleratory AI dla Chin. Nowe produkty będą odpowiedzią na najnowsze ograniczenia handlowe USA dotyczące eksportu sprzętu komputerowego dla centrów danych do Chin i innych krajów. Kilka źródeł podaje to jednocześnie.
Nowe zasady eksportu wprowadzone przez Stany Zjednoczone uwzględniają ogólną wydajność wyspecjalizowanych akceleratorów i obniżają jej poprzeczkę do tego stopnia, że nawet gamingowa karta graficzna GeForce RTX 4090 ma zakaz wysyłki do Chin, Rosji i szeregu innych krajów. nowe ograniczenia iloczyn liczby bitów i wydajności obliczeniowej, zwany Total Processing Performance (TPP), nie powinien przekraczać 4800, ale w przypadku gamingowego flagowca NVIDII jest to 5285.
Zdaniem analityków Semianalytics, NVIDIA ma już w ofercie nowe modele akceleratorów AI, które nie podlegają najnowszym ograniczeniom eksportowym. Nazwano je H20, L20 i L2. Jak podaje Semianalytics, ich masowa produkcja rozpocznie się w przyszłym miesiącu. Z kolei cytowany przez Bloomberg chiński państwowy serwis informacyjny Chinastarmarket donosi, że NVIDIA w ciągu najbliższych dni rozpocznie wysyłkę tych akceleratorów do Chin, a ich oficjalna zapowiedź nastąpi w drugiej połowie tego miesiąca. Jak podaje chiński portal ITHome, masowa produkcja H20 i L20 rozpocznie się w grudniu, a akceleratora L2 w styczniu.
Dokładna charakterystyka akceleratorów NVIDIA H20, L20 i L2 nie jest znana. Według niektórych źródeł H20 zbudowany jest na zmodyfikowanym układzie graficznym GH100 opartym na architekturze Hopper i wykorzystuje opakowanie CoWoS od TSMC. Z architekturą Ady Lovelace można kojarzyć dwóch przedstawicieli serii L. Bloomberg podaje, że wszystkie nowe produkty wykorzystują architekturę Hopper. Analitycy semianalizy zauważają, że H20 radzi sobie z niektórymi zadaniami nawet lepiej niż akcelerator H100, który został objęty zakazem dostaw.
Chiński zasób ITHome opublikował główną charakterystykę tych akceleratorów. Według tych danych, H20 otrzyma 96 GB pamięci HBM3 o przepustowości 4 TB/s i zaoferuje wydajność rdzenia tensorowego na poziomie aż 296 teraflopów w operacjach na liczbach całkowitych INT8. Wskaźnik TPP dla nowego produktu wyniesie 2368 i z marżą spełni nowe ograniczenia eksportowe. W operacjach FP64 akcelerator H20 zapewni wydajność 1 Tflops (H100 zapewnia 34 Tflops), a w operacjach FP16/BF16 – 148 Tflops (H100 zapewnia 1979 Tflops). Pobór mocy H20 wyniesie 400 W. H20 zachowa obsługę magistrali NVLink o szybkości 900 GB/s. Dzięki temu możliwe będzie połączenie w klastry aż ośmiu akceleratorów.
Model NVIDIA L20 w formacie PCIe otrzyma 48 GB pamięci GDDR6 i zapewni maksymalną wydajność obliczeniową na poziomie 239 teraflopów w operacjach INT8. Z kolei model L2, również w formacie PCIe, otrzyma 24 GB pamięci GDDR6 i będzie miał maksymalną wydajność obliczeniową na poziomie 193 teraflopów w zadaniach INT8. Wskaźniki TPP dla modeli L20 i L2 wyniosą odpowiednio 1912 i 1544.
Bloomberg donosi, że NVIDIA odmówiła komentarza w sprawie najnowszych przecieków, jednak na tle tych doniesień akcje spółki przed rozpoczęciem notowań na nowojorskiej giełdzie wzrosły o 1,9%.
Źródła:
Bloomberga To dom półanaliza Komentarz ( ) Wieczorne 3DNews W każdy dzień powszedni wysyłamy podsumowanie wiadomości bez żadnych bzdur i reklam. Dwie minuty na przeczytanie – i jesteś świadomy głównych wydarzeń. Powiązane materiały Baidu zamówił akceleratory AI od Huawei zamiast od NVIDII NVIDIA przekieruje „chiński” akcelerator A800 na inne rynki Ograniczenia w dostawach akceleratorów AI do Chin weszły w życie tydzień wcześniej Kaspersky Lab stworzył procesor neuromorficzny, ale nie ma miejsca, aby go wypuścić NVIDIA rzekomo przygotowuje karty graficzne z serii GeForce RTX 40 ze zwiększoną pamięcią wideo IBM opracował układ AI z wewnętrznym przechowywaniem danych, który jest o rząd wielkości szybszy niż akceleratory Nvidii