Microsoft wprowadził zaawansowany model AI Phi-2, z 2,7 miliardami parametrów. Model wykazał doskonałe wyniki w szerokim zakresie testów, obejmujących rozumienie języka, rozwiązywanie problemów matematycznych, programowanie i przetwarzanie informacji. Główną cechą Phi-2 jest jego zdolność do konkurowania z modelami sztucznej inteligencji, które są nawet 25-krotnie większe, a często nawet przewyższają je. Nowy produkt jest już dostępny za pośrednictwem Microsoft Azure AI Studio dla badaczy i programistów, którzy chcą zintegrować zaawansowaną sztuczną inteligencję ze swoimi aplikacjami.
Dyrektor generalny Microsoft, Satya Nadella, zaprezentował Phi-2 podczas wydarzenia Ignite. Charakterystyczną cechą tego modelu jest to, że jest on szkolony na danych odpowiadających jakości poziomu edukacji. Oznacza to, że dane do trenowania modelu zostały starannie dobrane i uporządkowane, co wpłynęło na dokładność i efektywność uczenia. Takie podejście pozwala Phi-2 efektywniej przekazywać wiedzę i interpretacje wyniesione z innych modeli, wzmacniając jego zdolności w obszarach rozumienia języka, logicznego rozumowania i przetwarzania informacji.
Phi-2 podważa długo utrzymywane poglądy na temat związku między wielkością i mocą modeli językowych. Model jest porównywalny z dużymi modelami AI, takimi jak 7B Mistral firmy Mistral AI, 13B Llama 2 firmy Meta✴, a nawet 70B Llama-2. Na szczególną uwagę zasługuje zdolność Phi-2 do przewyższenia nawet Gemini Nano firmy Google, najskuteczniejszego modelu z serii Gemini zaprojektowanej do działania na urządzeniach mobilnych. Podkreśla to potencjał Phi-2 w zakresie technologii mobilnej, zapewniając automatyczne podsumowywanie tekstu, zaawansowaną korektę i korekcję gramatyczną oraz inteligentne odpowiedzi kontekstowe.
Eksperci Microsoft podkreślają, że wysoką wydajność modelu Phi-2 uzyskano bez stosowania metod uczenia się przez wzmacnianie, opartych na informacjach zwrotnych od człowieka, czy instruktażowych metod dostrajania. Pozwala to modelowi skutecznie minimalizować stronniczość i zmniejszać ryzyko emisji substancji toksycznych, czyniąc Phi-2 jednym z najbezpieczniejszych i najbardziej etycznych modeli w dziedzinie sztucznej inteligencji.
Phi-2 jest częścią serii małych modeli językowych (SLM) firmy Microsoft. Pierwszy model z tej serii, Phi-1 z 1,3 miliardem parametrów, został wydany na początku tego roku i był przeznaczony do programowania zadań w języku Python. We wrześniu wprowadzono Phi-1.5 z podobną liczbą parametrów, ale trenowano go na nowych danych, w tym na tekstach syntetycznych utworzonych przy użyciu programowania w języku naturalnym.
Phi-2 otwiera nowy rozdział w uczeniu maszynowym, w którym jakość i wydajność szkolenia stają się kluczowymi czynnikami. Ten model sztucznej inteligencji nie tylko demonstruje znaczące postępy Microsoftu w tej dziedzinie, ale także zapewnia programistom i badaczom na całym świecie nowe możliwości, otwierając drzwi do inteligentniejszych i bezpieczniejszych technologii przyszłości.