Nowy artykuł: Jitogs z stycznia 2025 r.: Zobacz, kto przyszedł!

Redaktor NetMaster
Redaktor NetMaster
5 min. czytania

Nawet chińskie modele AI zdają sobie sprawę, że Naruto jest fajny (źródło: zrzut ekranu witryny Deepseek)

⇡#Niebiański Dannas uderza w odpowiedź

Jak wskazuje wielu analityków wymiany, nerwowość inwestorów wcale nie była sama w sobie faktem stworzenia modelu generatywnego Deepseek R1, który był dostępny za pośrednictwem interfejsu internetowego od grudnia 2024 Nadchodzący rok po prostu wysadził listy przebojów, osiągając pierwsze miejsce w ładowaniu na iOS w USA, Wielkiej Brytanii, Kanadzie, Singapurze i Chinach. Najważniejszą rzeczą, która była przerażona przez graczy Exchange, jest uderzająco niski koszt chińskiej nowości w porównaniu z kosztami monstrualnych produktów Openai, Meta*, Google i innych uznanych liderów segmentu II. Chiński startup, który stworzył DeepSeek-V3 (nieco później w oparciu o ten model, rozumowanie (rozumowanie) R1 było subtelne, jak to zapewnia przedstawiciele, do szkolenia klastra serwerów z akceleratorami NVIDIA H800 2048, jest to różnorodne Najpopularniejsze w indukcji AI. GPT-4, przypomina, został przeszkolony w szeregu około 25 tysięcy NVIDIA A100, a przyjemność ta kosztowała co najmniej 63 miliony dolarów-różnica polega na tym, że w sprzęcie, co jest czymś więcej niż decydywacją rozmiaru. Szczerze mówiąc, zauważamy: niemal natychmiast eksperci mają podejrzenia, że ​​rzeczywiste koszty programistów były nadal znacznie wyższe, ale to nie zmienia zasadniczo.

Dostęp komercyjny do Cloud API Deepseek R1 jest dostarczany po cenie 0,14 USD za 1 milion tokenów żądania – bezdyskusyjne zrzuty w porównaniu do 7,50 dolarów za te same milion tokenów, o które Openai prosi o swoje faktyczne modele. Ponadto V3, R1 i wiele bardziej kompaktowych modeli przeszkolonych w tej samej gamie danych jest dostępnych na twarzy przytulania na licencji MIT – niektóre z nich są uruchamiane nawet na personelu, a nie najpotężniejsze karty wideo (możesz się obejść bez możliwości (możesz się obejść bez najmodniejszych Karty wideo, tylko na CP +RAM, – tylko odpowiedź na każde pytanie będzie musiała czekać bardzo długo). Innymi słowy, chiński startup założony w 2023 r. 深度求索 wyraźnie wykazał, że dla poziomu sztucznej inteligencji akceptowalnej w nowoczesnych rzeczywistości (w wielu głębokich osób szeroko rozpowszechnionych w branży, QWen2.5, Lama3.1, Claude-3.5 i GPT-4O, ale w serii są gorsze, ale nie za dużo) nie potrzebują inwestycji w dziesiątki i setki miliardów dolarów. Wystarczy tylko w praktyce najnowsze teoretyczne osiągnięcia w dziedzinie generatywnej sztucznej inteligencji, przede wszystkim architektury „zespołu ekspertów”, zamiast szeroko rozszerzania gęstej sieci neuronowej transformatora, pochłaniając nowe dziesiątki tysięcy żelazków i Megavattes of Electricity, jak działają programistom generatywnych modeli GPT, rodzin sonetów i tym podobnych.

Tak, oczywiście Deepseek nie jest „srebrną kulą”: entuzjastowie bezpośrednio wskazują jego niedociągnięcia, przede wszystkim pod względem tworzenia kodu oprogramowania. Ale po pierwsze, jest katastroficznie (tylko z punktu widzenia konkurentów) tańsze niż amerykańskie analogi dla użytkownika końcowego dla wielu klientów komercyjnych, zwłaszcza z drobiazgami, staje się to w obecnej trudnej rzeczywistości makroekonomicznej przez decydujące argument. Po drugie, nie jest to jeden: od ostatniej jesieni w ChRL pojawia się ciągła seria (zorientowana jednak głównie na rynku krajowym, ale nadal przy wsparciu wielu języków, w tym angielskiego) Nowe budżetowe modele generacyjne rozwoju Baidu , Zhipu AI, Minimax itp. W szczególności Bytedance zamierza rozszerzyć 12 miliardów dolarów w 2025 r. Tylko akceleratory serwerowe do szkolenia jej obiecującej sztucznej inteligencji, a Alibaba wprowadził następny model w QWen, który twierdzi, że przekracza GPT -4O i Deepseek -V3. Pod koniec stycznia stał się wiadomo o modelu multimodalnym Janus-Pro-7B stworzonym przez ten sam Deepseek, zdolny do prezentowanych mu obrazów i generowania zdjęć na wskazówki tekstowej. Twierdzi się już, że przewyższa w tych obszarach przynajmniej Dall-E 3 i świeże wersje stabilnej dyfuzji, co oznacza, że ​​amerykańscy inwestorzy mają zwiększone przyczyny niepokoju.

„Cóż, naprzód! Co utknęło? ” -„Wyrzuciliśmy kilka słów na własną rękę, Ai-Agent, a oto co, bohater: jesteśmy z nim-ta sama krew!” (

Udostępnij ten artykuł