Dwa tygodnie temu amerykańska firma AI odmówiła współpracy z Openai, a wczoraj wykazała zdolność swoich humanoidalnych robotów do zrozumienia zespołów w języku naturalnym, przetwarzanym przez model Helix VLA.
Model VLA jest kombinacją systemu wizji maszynowej i dużego modelu języka, który pozwala uczyć roboty różnych operacji w kombinacji wizualnych obrazów i poleceń językowych. W praktyce prowadzi to do faktu, że wyszkolone roboty mogą manipulować przedmiotami, których nigdy wcześniej nie widzieli. Uzyskując zespół głosowy w naturalnej formie, robot zaczyna wizualnie analizować środowisko, a następnie wykonuje zadanie, biorąc pod uwagę wyniki analizy sytuacji.
Model Helix pozwala robotom figurowym pracować w parach i interakcja ze sobą podczas wykonywania operacji gospodarstwa domowego. Rozumie się, że w życiu codziennym roboty mogą działać w parach, pomagając sobie nawzajem i zwiększając wydajność pracy. Rycina pokazuje możliwości swoich robotów 02 w typowym wnętrzu gospodarstwa domowego, które tradycyjnie jest uważane za bardzo trudne środowisko dla robotów. Producentom znacznie łatwiej jest tworzyć roboty, które będą działać w bardziej kontrolowanym i przewidywalnym środowisku przemysłowym. W związku z tym pojawienie się „zdolnych” robotów podobnych do domu na rynku jest uważane za bardziej odległe perspektywę.
Nauczanie robotów wykonywania operacji gospodarstwa domowego wymaga znacznych kosztów rozwoju oprogramowania lub tysięcy eksperymentów. W tym przypadku nie jest możliwe zaprogramowanie ich ręcznie, a zatem jedynym sposobem na stworzenie robota pomagającego w życiu codziennym jest ich samokierowanie. W środowisku domowym jest zbyt wiele zmiennych, z którymi roboty muszą napotkać, więc poprawa profilu w kategoriach będzie wymagała znacznego czasu spędzonego.