Stworzono sztuczną inteligencję, która zamienia obraz 2D w model 3D w pięć sekund

Redaktor NetMaster
Redaktor NetMaster
2 min. czytania

Naukowcy z Adobe i Australijskiego Uniwersytetu Narodowego opracowali algorytm, który konwertuje obrazy 2D na modele 3D w zaledwie 5 sekund. Ten przełom może zrewolucjonizować tworzenie treści w projektowaniu i rozrywce, należy jednak uważać na możliwe problemy związane z rozmytymi teksturami i naruszeniami praw autorskich.

Nowy algorytm, nazwany Large Reconstruction Model (LRM), stanowi znaczący postęp w szybkim tworzeniu modeli 3D z pojedynczego obrazu. Algorytm, wyszkolony na dużym zbiorze danych składającym się z prawie miliona obiektów 3D dostępnych w Objaverse i MVImgNet, wykazał wyjątkową zdolność uogólniania różnych obrazów podczas tworzenia treści 3D.

W przeciwieństwie do poprzednich modeli, które były trenowane na ograniczonych zbiorach danych skupiających się na jednej kategorii obrazów, LRM wykorzystuje architekturę transformatorową, która stała się podstawą wielu osiągnięć w dziedzinie głębokiego uczenia się, z 500 milionami parametrów. Dzięki temu model AI może efektywnie współpracować z różnymi typami obrazów, w tym ze zdjęciami ze świata rzeczywistego i kolażami wizualnymi tworzonymi przez inne usługi AI, takie jak DALL-E i Stable Diffusion.

Yicong Hong, główny autor badania, podkreślił, że LRM stanowi znaczący przełom w dziedzinie rekonstrukcji 3D. Algorytm jest w stanie odtworzyć szczegółową geometrię i złożone tekstury, takie jak słoje drewna, przy zachowaniu jakości i dokładności.

Zastosowanie LRM może być naprawdę powszechne, od projektowania i rozrywki po branżę gier. Dla projektantów i artystów 3D oznacza to szybsze tworzenie modeli, co jest szczególnie ważne przy tworzeniu gier wideo i animacji. Ponadto możliwość korzystania z LRM przez zwykłych użytkowników sprawia, że ​​modelowanie 3D staje się domeną nie tylko profesjonalistów. Teraz możliwe będzie tworzenie szczegółowych modeli nawet ze zdjęć zrobionych smartfonem.

Jednak LRM ma swoje ograniczenia, takie jak rozmycie tekstur w ukrytych obszarach obrazu. Warto też zastanowić się nad kwestiami praw autorskich, zwłaszcza w kontekście wykorzystania obrazów generowanych przez inne usługi AI. Aby zademonstrować możliwości LRM, badacze utworzyli stronę z demonstracjami wideo i interaktywnymi modelami 3D. Podkreśla to rosnącą rolę sztucznej inteligencji we współczesnym świecie i jej potencjalny wpływ na przyszłość przemysłów kreatywnych.

Udostępnij ten artykuł