Kalray ogłosił komercyjną dostępność swoich nowych akceleratorów Turbocard4 (TC4). Nowy produkt pozycjonowany jest jako rozwiązanie przyspieszające działanie komputerowych systemów wizyjnych lub jako akcelerator „inteligentnego” indeksowania danych.
Na pokładzie akceleratora, wykonanego w formacie FHFL, zainstalowane są cztery chipy DPU Coolidge 2 z autorską architekturą Kalray MPPA. Procesory te zostały ogłoszone latem ubiegłego roku jako energooszczędne DPU o wydajności do 1,5 Tflops w trybie FP32 i 50 Tops w trybie INT8, charakterystycznej dla wnioskowania.
Wybór rynków nie jest przypadkowy: wizja komputerowa to dziś szybko rozwijająca się branża, wyceniana na ponad 20 miliardów dolarów w 2023 r., a do 2032 r. liczba ta ma wzrosnąć do 175 miliardów dolarów. O indeksowaniu danych na potrzeby generatywnej sztucznej inteligencji nie ma co mówić – na podwórku panuje boom na tego typu technologie, a ilość zbiorów danych stale rośnie. Takie zbiory danych wymagają efektywnego przetwarzania wstępnego, w przeciwnym razie rosnący czas potrzebny na pobranie niezbędnych danych utrudni wykonywanie zarówno uczenia, jak i wnioskowania.
Co ciekawe, TC4 produkowany jest w Europie, we francuskiej fabryce Asteelflash, która otrzymała już pierwsze zamówienie o wartości ponad 1 miliona dolarów.Z uwagi na perspektywy wybranych obszarów nie powinno dziwić, że europejska inicjatywa Kalray i Asteelflash jest wspierany przez rząd francuski w ramach programu CARAIBE. Już w 2025 roku planowane jest zwiększenie skali produkcji akceleratorów TC4 z kilkuset do kilku tysięcy miesięcznie.
Coolidge 2, zdaniem twórców, to uniwersalne rozwiązanie oparte na architekturze VLIW. Posiada 80 rdzeni o częstotliwości do 1,2 GHz, a każdy rdzeń ma FPU (IEEE 754-2008). Istnieją optymalizacje dla operacji macierzowych i funkcji przestępnych. Procesor podzielony jest na 5 klastrów po 16 rdzeni, każdy klaster posiada dodatkowy rdzeń sterujący, który odpowiada także za funkcje bezpieczeństwa. Uzupełnieniem Coolidge 2 jest 8 MB pamięci podręcznej, dwukanałowy kontroler pamięci DDR4-3200 i para interfejsów 100GbE z obsługą RoCE. Układ obsługuje formaty INT8, FP16, FP32, a nawet FP64.
Ponieważ na karcie Turbocard4 działają cztery Coolidge 2, mówimy o 6 Tflopach dla FP32, 100 Tflopach dla FP16 i 200 Topach dla INT8 z pakietem termicznym o mocy około 120 W. W zakresie wsparcia oprogramowania Kalray wspiera swoje rozwiązania pakietem SDK opartym na otwartych standardach. Obsługiwane są systemy Linux i RTOS.
Powiązane materiały:
Chińskie Sophgo chce dostarczać do Rosji procesory tensorowe AI Kalray wypuścił system pamięci masowej NG-Box oparty na serwerach Dell PowerEdge z DPU Kalray przygotował DPU Coolidge 2 trzeciej generacji Firma Micron wprowadziła pierwszy na świecie 4-portowy dysk SSD Płyta CWWK CW-J6-NAS otrzymała sześć portów SATA-3, dwa złącza M.2 2280 i trzy porty 2,5GbE