Nawet chińskie modele AI zdają sobie sprawę, że Naruto jest fajny (źródło: zrzut ekranu witryny Deepseek)
⇡#Niebiański Dannas uderza w odpowiedź
Jak wskazuje wielu analityków wymiany, nerwowość inwestorów wcale nie była sama w sobie faktem stworzenia modelu generatywnego Deepseek R1, który był dostępny za pośrednictwem interfejsu internetowego od grudnia 2024 Nadchodzący rok po prostu wysadził listy przebojów, osiągając pierwsze miejsce w ładowaniu na iOS w USA, Wielkiej Brytanii, Kanadzie, Singapurze i Chinach. Najważniejszą rzeczą, która była przerażona przez graczy Exchange, jest uderzająco niski koszt chińskiej nowości w porównaniu z kosztami monstrualnych produktów Openai, Meta*, Google i innych uznanych liderów segmentu II. Chiński startup, który stworzył DeepSeek-V3 (nieco później w oparciu o ten model, rozumowanie (rozumowanie) R1 było subtelne, jak to zapewnia przedstawiciele, do szkolenia klastra serwerów z akceleratorami NVIDIA H800 2048, jest to różnorodne Najpopularniejsze w indukcji AI. GPT-4, przypomina, został przeszkolony w szeregu około 25 tysięcy NVIDIA A100, a przyjemność ta kosztowała co najmniej 63 miliony dolarów-różnica polega na tym, że w sprzęcie, co jest czymś więcej niż decydywacją rozmiaru. Szczerze mówiąc, zauważamy: niemal natychmiast eksperci mają podejrzenia, że rzeczywiste koszty programistów były nadal znacznie wyższe, ale to nie zmienia zasadniczo.
Dostęp komercyjny do Cloud API Deepseek R1 jest dostarczany po cenie 0,14 USD za 1 milion tokenów żądania – bezdyskusyjne zrzuty w porównaniu do 7,50 dolarów za te same milion tokenów, o które Openai prosi o swoje faktyczne modele. Ponadto V3, R1 i wiele bardziej kompaktowych modeli przeszkolonych w tej samej gamie danych jest dostępnych na twarzy przytulania na licencji MIT – niektóre z nich są uruchamiane nawet na personelu, a nie najpotężniejsze karty wideo (możesz się obejść bez możliwości (możesz się obejść bez najmodniejszych Karty wideo, tylko na CP +RAM, – tylko odpowiedź na każde pytanie będzie musiała czekać bardzo długo). Innymi słowy, chiński startup założony w 2023 r. 深度求索 wyraźnie wykazał, że dla poziomu sztucznej inteligencji akceptowalnej w nowoczesnych rzeczywistości (w wielu głębokich osób szeroko rozpowszechnionych w branży, QWen2.5, Lama3.1, Claude-3.5 i GPT-4O, ale w serii są gorsze, ale nie za dużo) nie potrzebują inwestycji w dziesiątki i setki miliardów dolarów. Wystarczy tylko w praktyce najnowsze teoretyczne osiągnięcia w dziedzinie generatywnej sztucznej inteligencji, przede wszystkim architektury „zespołu ekspertów”, zamiast szeroko rozszerzania gęstej sieci neuronowej transformatora, pochłaniając nowe dziesiątki tysięcy żelazków i Megavattes of Electricity, jak działają programistom generatywnych modeli GPT, rodzin sonetów i tym podobnych.
Tak, oczywiście Deepseek nie jest „srebrną kulą”: entuzjastowie bezpośrednio wskazują jego niedociągnięcia, przede wszystkim pod względem tworzenia kodu oprogramowania. Ale po pierwsze, jest katastroficznie (tylko z punktu widzenia konkurentów) tańsze niż amerykańskie analogi dla użytkownika końcowego dla wielu klientów komercyjnych, zwłaszcza z drobiazgami, staje się to w obecnej trudnej rzeczywistości makroekonomicznej przez decydujące argument. Po drugie, nie jest to jeden: od ostatniej jesieni w ChRL pojawia się ciągła seria (zorientowana jednak głównie na rynku krajowym, ale nadal przy wsparciu wielu języków, w tym angielskiego) Nowe budżetowe modele generacyjne rozwoju Baidu , Zhipu AI, Minimax itp. W szczególności Bytedance zamierza rozszerzyć 12 miliardów dolarów w 2025 r. Tylko akceleratory serwerowe do szkolenia jej obiecującej sztucznej inteligencji, a Alibaba wprowadził następny model w QWen, który twierdzi, że przekracza GPT -4O i Deepseek -V3. Pod koniec stycznia stał się wiadomo o modelu multimodalnym Janus-Pro-7B stworzonym przez ten sam Deepseek, zdolny do prezentowanych mu obrazów i generowania zdjęć na wskazówki tekstowej. Twierdzi się już, że przewyższa w tych obszarach przynajmniej Dall-E 3 i świeże wersje stabilnej dyfuzji, co oznacza, że amerykańscy inwestorzy mają zwiększone przyczyny niepokoju.
„Cóż, naprzód! Co utknęło? ” -„Wyrzuciliśmy kilka słów na własną rękę, Ai-Agent, a oto co, bohater: jesteśmy z nim-ta sama krew!” (