Naukowcy z Adobe i Australijskiego Uniwersytetu Narodowego opracowali algorytm, który konwertuje obrazy 2D na modele 3D w zaledwie 5 sekund. Ten przełom może zrewolucjonizować tworzenie treści w projektowaniu i rozrywce, należy jednak uważać na możliwe problemy związane z rozmytymi teksturami i naruszeniami praw autorskich.
Nowy algorytm, nazwany Large Reconstruction Model (LRM), stanowi znaczący postęp w szybkim tworzeniu modeli 3D z pojedynczego obrazu. Algorytm, wyszkolony na dużym zbiorze danych składającym się z prawie miliona obiektów 3D dostępnych w Objaverse i MVImgNet, wykazał wyjątkową zdolność uogólniania różnych obrazów podczas tworzenia treści 3D.
W przeciwieństwie do poprzednich modeli, które były trenowane na ograniczonych zbiorach danych skupiających się na jednej kategorii obrazów, LRM wykorzystuje architekturę transformatorową, która stała się podstawą wielu osiągnięć w dziedzinie głębokiego uczenia się, z 500 milionami parametrów. Dzięki temu model AI może efektywnie współpracować z różnymi typami obrazów, w tym ze zdjęciami ze świata rzeczywistego i kolażami wizualnymi tworzonymi przez inne usługi AI, takie jak DALL-E i Stable Diffusion.
Yicong Hong, główny autor badania, podkreślił, że LRM stanowi znaczący przełom w dziedzinie rekonstrukcji 3D. Algorytm jest w stanie odtworzyć szczegółową geometrię i złożone tekstury, takie jak słoje drewna, przy zachowaniu jakości i dokładności.
Zastosowanie LRM może być naprawdę powszechne, od projektowania i rozrywki po branżę gier. Dla projektantów i artystów 3D oznacza to szybsze tworzenie modeli, co jest szczególnie ważne przy tworzeniu gier wideo i animacji. Ponadto możliwość korzystania z LRM przez zwykłych użytkowników sprawia, że modelowanie 3D staje się domeną nie tylko profesjonalistów. Teraz możliwe będzie tworzenie szczegółowych modeli nawet ze zdjęć zrobionych smartfonem.
Jednak LRM ma swoje ograniczenia, takie jak rozmycie tekstur w ukrytych obszarach obrazu. Warto też zastanowić się nad kwestiami praw autorskich, zwłaszcza w kontekście wykorzystania obrazów generowanych przez inne usługi AI. Aby zademonstrować możliwości LRM, badacze utworzyli stronę z demonstracjami wideo i interaktywnymi modelami 3D. Podkreśla to rosnącą rolę sztucznej inteligencji we współczesnym świecie i jej potencjalny wpływ na przyszłość przemysłów kreatywnych.