Francuska firma Mistral AI, założona przez imigrantów z Google Deepmind i Meta✴, wprowadziła kompaktowy model sztucznej inteligencji Mistral Small 3 – rozprzestrzenia się z otwartym kodem i oferuje wysoką wydajność.
Mistral Small 3 ma 24 miliardy parametrów i jest ustawiony jako bezpośredni konkurent w stosunku do większych modeli, w tym Meta✴ Lamy 3.3 70b i Alibaba Qwen 32B, a także bezpłatną wymianę systemów zamkniętych, w tym Openai GPT-4O Mini. Deweloper zapewnia, że nowy model daje wyniki na tym samym poziomie z instruktorem LLAMA 3.3 70B, ale działa trzy razy szybciej na tym samym sprzęcie i jest zaprojektowany dla 80 % zadań generatywnej AI.
System został stworzony z myślą o lokalnym wdrożeniu – jego architektura ma znacznie mniejsze warstwy w porównaniu z konkurencyjnymi modelami, co skraca czas na bezpośrednie przejście. Dokładność Mistral Small 3 w teście MMLU wynosi 81 % z opóźnieniem u 150 tokenów na sekundę, co według dewelopera czyni go najbardziej skutecznym w swojej kategorii. Może również służyć jako podstawa do tworzenia bardziej złożonych modeli rozumowania, takich jak Deepseek R1.
Nowa sieć neuronowa została ślepo przetestowana wśród wykonawców trzeciej części – procedura zawierała ponad tysiąc zadań do napisania kodu i odpowiedzi na ogólne pytania. Mistral Small 3 wydał konkurencyjne wyniki w porównaniu z otwartymi modelami trzykrotnie więcej, a także zamkniętym mini GPT-4O w próbach związanych z pisaniem kodu, rozwiązywaniem problemów matematycznych, testowaniem wiedzy ogólnej i wykonywania instrukcji.
W praktyce model będzie przydatny w przypadkach, w których szybkie i dokładne odpowiedzi są niezwykle ważne-mogą być wirtualni asystenci, agenci AI i automatyzacja procesów pracy w czasie rzeczywistym. Deweloper zapewnił użytkownikom możliwość wykonania doskonałej konfiguracji Mistral Small 3 dla jego specjalizacji w niektórych obszarach – mogą to być porada prawna, diagnostyka medyczna i wsparcie techniczne.
W dziedzinie usług medycznych Mistral Small 3 jest w stanie zidentyfikować próby oszustw; w medycynie – skierować pacjentów do właściwych specjalistów; W robotyce, branży motoryzacyjnej i produkcji – wykonuj funkcje kontroli i kontroli; Dostarczane są wirtualne scenariusze obsługi klienta, analiza nastroju i recenzje. Można go uruchomić w systemie z jedną kartą graficzną NVIDIA Geforce RTX 4090 lub na rzeczywistych MacBookach Apple z 32 GB pamięci RAM.
Mistral Small 3 jest już dostępny i pojawi się na wszystkich największych wyspecjalizowanych platformach w najbliższej przyszłości – rozprzestrzenia się na bezpłatną i otwartą licencję Apache 2.0.