M**a opracował model języka sztucznej inteligencji, który może uczyć się od samego Google

Redaktor NetMaster
Redaktor NetMaster
3 min. czytania

Meta* wprowadziła Toolformer, model języka AI, który jest w stanie samouczyć się korzystania z narzędzi zewnętrznych, takich jak wyszukiwarki, kalkulatory i kalendarze, bez uszczerbku dla podstawowych możliwości modelowania języka.

Możliwość dodania zewnętrznych narzędzi do modelu językowego w celu poprawy jego wydajności nie jest niczym nowym. Nowością w Toolformer jest to, że system nauczył się robić to samodzielnie.

Podczas szkolenia badacze przekazali Toolformer mały zestaw przykładów demonstrujących użycie każdego API, a następnie zaproponowali listę potencjalnych wywołań API dla dużego zestawu danych modelowania języka. Bot zrobił to w trybie „samomonitorowania”, co oznacza zdolność uczenia się bez potrzeby kierowania przez człowieka i korzystania z większego zestawu narzędzi.

Główną zaletą bota Toolformer AI jest możliwość korzystania z interfejsów API, które pozwalają różnym aplikacjom na interakcję ze sobą, często w sposób płynny i zautomatyzowany. Co więcej, w zależności od zadania, Toolformer może samodzielnie „zdecydować”, które narzędzie powinno zostać użyte w danym przypadku i jak je zastosować. Integruje również wyniki uzyskane w procesie z przewidywaniem przyszłych przypadków użycia narzędzia.

Poprzednie modele językowe wymagały wielu adnotacji programistycznych lub ograniczały się do używania zewnętrznych narzędzi do określonych zadań. Według naukowców stanowiło to przeszkodę w ich szerszym zastosowaniu. Z kolei Toolformer może nauczyć się korzystać z wielu narzędzi w sposób uogólniony, dzięki czemu nie wymaga specjalnego przeszkolenia do wykonywania określonych zadań.

Dzięki temu bot AI może korzystać z różnych zewnętrznych narzędzi programowych, w tym wyszukiwarek, kalkulatorów, tłumaczy językowych i linków rzeczowych. Na przykład wiadomo, że duże modele językowe (LLM) są „słabo zorientowane” w arytmetyce. Toolformer może ominąć to ograniczenie za pomocą programu kalkulatora. Lub, jeśli chcesz, aby asystent oparty na LLM dodał datę do swojego kalendarza, Toolformer może to zrobić za pomocą łącza API do aplikacji kalendarza.

Narzędzie Toolformer jest oparte na wstępnie wytrenowanym modelu GPT-J z 6,7 miliardami parametrów. Zdaniem naukowców wydajność narzędzia Toolformer przewyższa znacznie większy model GPT-3, który zawiera 175 miliardów parametrów.

* Zawarte w wykazie stowarzyszeń publicznych i organizacji religijnych, w stosunku do których sąd podjął ostateczną decyzję o likwidacji lub zakazie działalności na podstawie ustawy federalnej nr 114-FZ z dnia 25 lipca 2002 r. „O przeciwdziałaniu działalności ekstremistycznej. ”

Udostępnij ten artykuł
Dodaj komentarz