Alibaba Cloud wprowadził model AI QWEN2.5-Max, który przekracza Deepseek V3 w kluczowych testach

Redaktor NetMaster
Redaktor NetMaster
2 min. czytania

Alibaba Cloud, jednostka chmurowa chińskiej firmy Alibaba, ogłosiła wydanie zaktualizowanego modelu języka na dużą skalę QWEN2.5-Max. Model AI oparty jest na architekturze mieszanki ekspertów (MOE) i wyszkolony w ponad 20 bilionach żetonów. Deweloperzy podkreślają, że narzędzie wykazało „znaczący postęp w zdolnościach intelektualnych” i jest już dostępne do użycia.

Nowa wersja modelu charakteryzuje się lepszą wydajnością i dokładnością, jest w stanie lepiej poradzić sobie z zadaniami wymagającymi głębokiego zrozumienia kontekstu, takich jak analiza tekstu, tłumaczenie i generowanie treści. „QWEN2.5-Max pokazuje znaczny postęp w przetwarzaniu złożonych żądań i udzielaniu odpowiednich odpowiedzi”, pisze firma na stronach swojego bloga.

QWEN2,5-Max został przetestowany w wielu kluczowych testach porównawczych, w tym MMLU-PRO, LiveCodeBench, Livebench i Arena-Hard. Model wykazał wyższość nad Deepseek V3 w testach takich jak arena, LiveBench i LiveCodeBench, a także wykazał konkurencyjne wyniki w MMLU-PRO. W porównaniu z innymi wiodącymi modelami, takimi jak GPT-4O i Claude-3,5-Sonnet, QWEN2.5-Max również potwierdził jego wiodące pozycje.

Alibaba Cloud planuje zintegrować QWEN2.5-Max z usługami w chmurze, co pozwoli klientom korzystać z narzędzia do rozwiązywania szerokiego zakresu problemów, w tym automatyzacji przetwarzania danych, poprawy interakcji z klientami poprzez boty czatu i optymalizację procesów biznesowych.

Model AI jest już dostępny za pośrednictwem serwisu czatu QWEN, w której użytkownicy mogą wchodzić w interakcje z QWEN2.5-Max, testować jego możliwości i eksperymentować z różnymi funkcjami. Dla programistów interfejs oprogramowania API jest również otwarty. Aby uzyskać dostęp, musisz zarejestrować się w Alibaba Cloud, aktywować usługę Model Studio i utworzyć klucz API.

Udostępnij ten artykuł
Dodaj komentarz