Szef jednostki sztucznej inteligencji w Microsoft Mustafa Suleyman (Mustafa Suleyman) w celu wzmocnienia pozycji firmy w zakresie rozwoju interaktywnego Jeenets rozszerza zespół Microsoft, zwabia kluczowych specjalistów z Google, w tym twórców technologii przeglądów audio. Byli koledzy z Suleiman z DeepMind, skąd opuścił w 2022 r., Będą zaangażowani w projekt tworzenia modeli multimodalnych do przetwarzania tekstu, dźwięku i wideo.
Według Financial Times, wśród nowych pracowników Microsoft byli Marco Tagliasacchi i Zalán Borsos, twórcy funkcji przeglądów audio, która pozwala przekształcić tekst w stylu fascynującej podkładki. Badacze ci uczestniczyli również w rozwoju ASTRA, obiecującego agenta Deepmind, zdolnego do odpowiadania na pytania w czasie rzeczywistym za pomocą wideo, audio i tekstu.
Matthias Minderer również dołączył do zespołu. Będzie zaangażowany w rozwój możliwości AI do analizy obrazów. Wszystkie trzy będą działać w nowym Microsoft Research Center w Zurychu i, według źródła znanego z sytuacją, odgrywają kluczową rolę w rozwoju nowej generacji Copilot, na podstawie którego interaktywne Jeenety zdolne do wykonania szerokiego zakresu zadań zostanie utworzone.
Jeśli chodzi o straty personelu tego poziomu, Google Deepmind nie przekazał komentarzy. Należy jednak zauważyć, że przejście tych specjalistów z Google Deepmind do Microsoft jest częścią gwałtownej walki o talenty w dziedzinie AI. Jednocześnie obie firmy pozostają kluczowymi graczami w opracowywaniu multimodalnych modeli AI, które są w stanie analizować i rozumieć treści oparte na dźwięku, filmach lub obrazach.
W porównaniu z tym wyścigiem konkurencyjnym inne firmy również nie są daleko – Openai wprowadził tryb głosowy dla Chatgpt, Amazon wprowadza AI do asystenta głosowego Alexa. Google przygotowuje się również do wydania agenta głosowego Astra w 2025 r.