Wyprodukowano w Europie: Kalray przedstawia akcelerator Turbocard4 do przetwarzania danych maszynowych i sztucznej inteligencji

Redaktor NetMaster
Redaktor NetMaster
3 min. czytania

Kalray ogłosił komercyjną dostępność swoich nowych akceleratorów Turbocard4 (TC4). Nowy produkt pozycjonowany jest jako rozwiązanie przyspieszające działanie komputerowych systemów wizyjnych lub jako akcelerator „inteligentnego” indeksowania danych.

Na pokładzie akceleratora, wykonanego w formacie FHFL, zainstalowane są cztery chipy DPU Coolidge 2 z autorską architekturą Kalray MPPA. Procesory te zostały ogłoszone latem ubiegłego roku jako energooszczędne DPU o wydajności do 1,5 Tflops w trybie FP32 i 50 Tops w trybie INT8, charakterystycznej dla wnioskowania.

Źródło zdjęć tutaj i poniżej: Kalray

Wybór rynków nie jest przypadkowy: wizja komputerowa to dziś szybko rozwijająca się branża, wyceniana na ponad 20 miliardów dolarów w 2023 r., a do 2032 r. liczba ta ma wzrosnąć do 175 miliardów dolarów. O indeksowaniu danych na potrzeby generatywnej sztucznej inteligencji nie ma co mówić – na podwórku panuje boom na tego typu technologie, a ilość zbiorów danych stale rośnie. Takie zbiory danych wymagają efektywnego przetwarzania wstępnego, w przeciwnym razie rosnący czas potrzebny na pobranie niezbędnych danych utrudni wykonywanie zarówno uczenia, jak i wnioskowania.

Co ciekawe, TC4 produkowany jest w Europie, we francuskiej fabryce Asteelflash, która otrzymała już pierwsze zamówienie o wartości ponad 1 miliona dolarów.Z uwagi na perspektywy wybranych obszarów nie powinno dziwić, że europejska inicjatywa Kalray i Asteelflash jest wspierany przez rząd francuski w ramach programu CARAIBE. Już w 2025 roku planowane jest zwiększenie skali produkcji akceleratorów TC4 z kilkuset do kilku tysięcy miesięcznie.

Coolidge 2, zdaniem twórców, to uniwersalne rozwiązanie oparte na architekturze VLIW. Posiada 80 rdzeni o częstotliwości do 1,2 GHz, a każdy rdzeń ma FPU (IEEE 754-2008). Istnieją optymalizacje dla operacji macierzowych i funkcji przestępnych. Procesor podzielony jest na 5 klastrów po 16 rdzeni, każdy klaster posiada dodatkowy rdzeń sterujący, który odpowiada także za funkcje bezpieczeństwa. Uzupełnieniem Coolidge 2 jest 8 MB pamięci podręcznej, dwukanałowy kontroler pamięci DDR4-3200 i para interfejsów 100GbE z obsługą RoCE. Układ obsługuje formaty INT8, FP16, FP32, a nawet FP64.

Ponieważ na karcie Turbocard4 działają cztery Coolidge 2, mówimy o 6 Tflopach dla FP32, 100 Tflopach dla FP16 i 200 Topach dla INT8 z pakietem termicznym o mocy około 120 W. W zakresie wsparcia oprogramowania Kalray wspiera swoje rozwiązania pakietem SDK opartym na otwartych standardach. Obsługiwane są systemy Linux i RTOS.

Powiązane materiały:

Chińskie Sophgo chce dostarczać do Rosji procesory tensorowe AI Kalray wypuścił system pamięci masowej NG-Box oparty na serwerach Dell PowerEdge z DPU Kalray przygotował DPU Coolidge 2 trzeciej generacji Firma Micron wprowadziła pierwszy na świecie 4-portowy dysk SSD Płyta CWWK CW-J6-NAS otrzymała sześć portów SATA-3, dwa złącza M.2 2280 i trzy porty 2,5GbE

Udostępnij ten artykuł
Dodaj komentarz