Zespół programistów Yandex zaprezentował nową dyfuzyjną sieć neuronową, Yandex AI Rendering Technology (YandexART), która tworzy obrazy i animacje w odpowiedzi na zapytania tekstowe użytkowników.
YandexART generuje obrazy i animacje metodą dyfuzji kaskadowej: najpierw sieć neuronowa generuje obrazy i klatki zgodnie z żądaniem użytkownika, a następnie stopniowo zwiększa ich rozdzielczość, nasycając je szczegółami. Jako zbiór danych szkoleniowych wykorzystano 330 milionów obrazów z opisami tekstowymi. Twórcy zaimplementowali także nowy algorytm rozpoznawania tekstu, który pomaga sieci neuronowej lepiej rozumieć życzenia użytkowników.
Charakterystyczną cechą YandexART jest zrozumienie rosyjskiego kodu kulturowego – sieć neuronowa zna słynne miejsca i miasta kraju, wybitne osobistości różnych epok oraz postacie z kreskówek i bajek znane z dzieciństwa. Na przykład Cheburashka, bohaterowie i Babu Jaga.
Sieć neuronowa została już zintegrowana z aplikacją mobilną Masterpiece i pomaga ilustrować reklamy w Yandex Business. Wkrótce YandexART pojawi się w Yandex Keyboard i innych usługach firmy.