Cały mój wolny czas w ciągu ostatnich czterech dni spędziłem na jednym zadaniu – pisaniu zapytań do sieci neuronowej Stable Diffusion, sieci neuronowej do tworzenia obrazów z opisu tekstowego. Wszystkie obrazy do artykułu (oprócz zrzutów ekranu) zostały stworzone osobiście w tej sieci neuronowej, a nie przez artystę.
W tym przewodniku opisano, jak zainstalować Stable Diffusion na komputerze lub laptopie, możliwość wypróbowania sieci neuronowej bez instalacji oraz kilka dodatkowych szczegółów, które mogą być przydatne, jeśli zdecydujesz się zagłębić w to tak, jak ja.
Sieć neuronowa Stable Diffusion różni się od analogów takich jak DALL-E 2 czy Midjourney tym, że jest open source: to znaczy, jeśli masz odpowiedni sprzęt, możesz zainstalować na swoim komputerze niezbędne oprogramowanie za darmo i używać go do tworzenia obrazów za pomocą tekstu żądanie (w dyskusjach często używa się kalki technicznej z angielskiego „podpowiedź”).
Oficjalne oprogramowanie Stable Diffusion nie posiada wygodnego interfejsu graficznego, poza dostępnym na oficjalnej stronie https://beta.dreamstudio.ai/, z którego polecam rozpocząć eksperymenty i sprawdzić, czy jest to potrzebne: po rejestracji będzie miał 200 darmowych generacji z domyślnymi parametrami (możesz zarejestrować się więcej niż raz z różnymi adresami e-mail).
Podczas instalowania oficjalnego oprogramowania na komputerze wszystkie czynności będą musiały zostać wykonane w wierszu poleceń. Ponadto nie będziesz w stanie wygenerować zbyt wiele z kartą graficzną, która ma 6 GB lub mniej pamięci.
Jednak dzięki kodowi open source niemal natychmiast po wydaniu Stable Diffusion pojawiły się alternatywne opcje oprogramowania („forki”), optymalizujące uruchomienie na słabszym sprzęcie (4 GB VRAM, są nawet opcje działające na procesorze, ale bardzo wolno), zapewniając wygodny dostęp do ustawień i upraszczając korzystanie z sieci neuronowej.
Od jednej z tych alternatyw, które uważam za najbardziej udane, i rozpoczniemy instalację. Jeśli potrzebujesz opisu procesu instalacji oficjalnej wersji, możesz go również znaleźć w dalszej części artykułu.
Najpierw o tym, czego potrzebujemy: dość mocny komputer lub laptop, karta graficzna NVIDIA GeForce, co najmniej 4 GB pamięci wideo. Wszystkie zainstalowane komponenty zajmą około 10 GB miejsca na dysku twardym lub SSD. Jeśli to wszystko jest dostępne, możesz kontynuować:
Podczas instalowania oficjalnej wersji Stable Diffusion wszystkie niezbędne komponenty są prawie takie same, ale będą musiały zostać zainstalowane ręcznie. Wymagania są takie same, z wyjątkiem konieczności użycia karty graficznej z co najmniej 6 GB pamięci VRAM.
Aby zobaczyć informacje o dostępnych opcjach wiersza poleceń, użyj polecenia
Po uruchomieniu webui-user.bat i przejściu w przeglądarce pod adres 127.0.0.1:7860, będziesz miał interfejs WWW dostępny lokalnie na Twoim komputerze (internet nie jest wymagany do działania), którego pierwsza zakładka to txt2img, gdzie dzieje się cała zabawa. Możesz od razu zacząć eksperymentować: wystarczy wpisać tekst w języku angielskim w polu powyżej i kliknąć przycisk „Generuj”, aby uzyskać gotowy obrazek z domyślnymi parametrami (zostały one już zmienione na zrzucie ekranu).
Po najechaniu wskaźnikiem myszy na nazwę dostępnych opcji większość z nich ma opisy w języku angielskim. Wśród głównych:
Domyślnie obrazy są zapisywane w podfolderach w folderze Outputs w lokalizacji, w której zainstalowałeś Stable Diffusion WebUI, ale możesz wyłączyć autozapis na karcie Ustawienia, jeśli chcesz, a także możesz tutaj skonfigurować inne ustawienia.
Zakładka img2img pozwala modyfikować istniejący obraz zgodnie z opisem tekstowym.
Zakładka Dodatki zawiera dodatkowe narzędzia. Najważniejsze jest zwiększenie rozdzielczości obrazu za pomocą sieci neuronowej.
W większości przypadków będziesz musiał sam wybrać wartości parametrów, śledząc wynik. Ale nawet przy tych samych wartościach może być bardzo różny i przede wszystkim zależy od danego żądania, wymagań obrazu i określonych w nim stylów. Może to być prosty rysunek w stylu plakatu:
A może prawie zdjęcie:
Tworzenie takich robotów jest łatwe:
I trudniejsze – takie:
Nie zapomnij pokazać wyobraźni, możesz dużo rysować, najważniejsze jest, aby móc to opisać:
Zapamiętaj nazwy efektów filmowych, właściwości materiałów i opisy kształtów:
Aby uzyskać najlepsze wyniki, polecam studiowanie pracy innych osób i używanych zapytań: istnieje wiele kanałów tematycznych na temat tworzenia obrazów w Stable Diffusion w komunikatorach internetowych, sieciach społecznościowych i witrynach tematycznych. Ale nawet własne pomysły mogą często dać ciekawy i piękny efekt, czas na nieoczekiwane znaleziska w zapytaniach jeszcze nie wyszedł.