Historia eksperymentu:
Pojawienie się w ubiegłym roku kilku niezwykle zaawansowanych modeli sztucznej inteligencji (SI) zaprojektowanych do syntezy obrazu z wprowadzonej przez użytkownika podpowiedzi tekstowej wywołało prawdziwy wstrząs. Okazało się, że SI jest w stanie generować wysokiej jakości obrazy na podstawie tylko opisów. Oczywiście już od kilku lat mogliśmy pobawić się w generowanie obrazków w internecie, ale to jeszcze nie było to, możliwości wczesnych generatorów były ograniczone i dopiero ubiegłoroczna premiera projektów Midjourney, DALLE2 i Stable Diffusion wniosła nową jakość. Obsługa generatorów obrazu okazała się być przerażająco przystępna, na poziomie podstawowym (który już wystarcza do stworzenia interesującej grafiki) jest równie łatwa jak korzystanie z kalkulatora czy aparatu fotograficznego w smartfonie. Sieć momentalnie zalały tysiące obrazów. Nim minęły dwa tygodnie grafika wygenerowana przy pomocy SI zwyciężyła w pierwszym konkursie artystycznym. Reakcje publiczności były zróżnicowane, od entuzjazmu po jęk szczerej zgrozy. Ja poczułem przede wszystkim ciekawość, odsłonił się nagle nowy obszar mapy.
Postanowiłem przeprowadzić własny eksperyment. Wydobyłem z dna szuflady moje nieszczęsne próby poetyckie z czasów młodości (co do których jakości nie mam absolutnie żadnych złudzeń) i wprowadziłem je jako monity tekstowe w trzewia Stable Diffusion, modelu sztucznej inteligencji, który wcześniej przeszkoliłem na zbiorze moich prac. Wpisałem polecenia i maszyna zaczęła śnić. Nie miałem pojęcia, co na tym nawozie wyrośnie. Czy SI poradzi sobie z tekstem niekonkretnym, metaforą, poezją? Tak. Otrzymywałem wizje zaskakujące, przedziwne, a jednocześnie odnajdowałem w nich elementy moich snów i emocji! Jedne obrazy prowadziły do następnych, zmiana pojedynczego słowa, czasem nawet przestawienie jednej litery powodowały kolejne transformacje i iteracje. Nagle nie ograniczał mnie czas, ani technika, pomysły nie musiały już czekać. Obudziło to we mnie zapomniane wydawałoby się emocje, zaczęły powstawać nowe wiersze i nagle początkowo czysto techniczny eksperyment nabrał osobistego charakteru, przemienił się w artystyczną podróż do krainy cieni.
Efektem doświadczenia jest książka, „Maszyna Snów”, wydana w 2022 roku przez TPZG Winnica. Zawiera moje wiersze i wygenerowane na ich podstawie przy pomocy SI obrazy. Najprawdopodobniej jest to także pierwsza polska publikacja wykorzystująca sztuczną inteligencję do zaprojektowania całości oprawy graficznej.
Człowiek:
Igor Myszkiewicz (ur. 1974 r.); absolwent Instytutu Sztuki i Kultury Plastycznej w Zielonej Górze. Na co dzień kustosz i plastyk w zielonogórskim Muzeum Ziemi Lubuskiej. Od ćwierć wieku w szeregach Zielonogórskiego Klubu Fantastyki Ad Astra, nieco krócej w Stowarzyszeniu Forum Art. Pomysłodawca i ilustrator antologii opowiadań fantastycznych „Fantazje Zielonogórskie”; autor („Signum Temporis. Zielonogórskie pomniki i rzeźby plenerowe”, „Galeria Twórców Galera. XX lat rejsu”, „Krew Bachusa. Opowieści Zielonogórskie”, „Ilustrowana Kronika Zielonej Góry”), a czasem współautor („Monografia Okręgu Zielonogórskiego ZPAP”, „Nie wszystek umrę”, „Kronika Zielonogórskiego Rocka”) publikacji o lubuskim środowisku kulturalnym i dziejach Winnego Grodu. Ilustrator książek i gier fabularnych, twórca komiksów, m.in. krzepiącej internetowej serii „Kryzys Wieku”, „Zdeptaka” (2009–2016), „Paprochów Historii. Zielonogórskich podróży w czasie”, „W SEPII”.
SI:
Stable Diffusion to wydany przez startup Stability AI w 2022 roku generator obrazu dedykowany syntezie tekstu w obraz. Wykorzystuje rodzaj generatywnej sieci neuronowej opracowanej przez naukowców z LMU Monachium. Stable Diffusion została stworzona przez Stability AI we współpracy z LMU i Runway, przy wsparciu EleutherAI i LAION. Kod i wytrenowane modele SD zostały udostępnione przez twórców jako otwarte oprogramowanie i mogą działać na większości urządzeń konsumenckich wyposażonych w średniej klasy procesor graficzny. Wokół projektu powstaje szybko rozrastająca się społeczność użytkowników rozwijających go i dzielących się doświadczeniami.
Sztuczna inteligencja i sztuka
Generatory obrazów budzą różne emocje. Trudno ogarnąć na razie wszelkie potencjalne skutki pojawienia się tej technologii, ale być może będzie to przełom na miarę wynalezienia fotografii w wieku XIX i pojawienia się grafiki komputerowej w stuleciu następnym. Inteligentna synteza obrazu, dostępna i przystępna dla wszystkich, szybka i efektywna, może znacząco wpłynąć choćby na rynek usług plastycznych (część twórców reaguje na to niepokojem, część zainteresowaniem). To jak spektakularne efekty można osiągnąć używając obecnie dostępnych, wczesnych przecież modeli i jak szybko one ewoluują, tylko powyższe obawy wzmaga.
Fale już się rozchodzą. Niektóre strony i serwisy zamknęły podwoje przed pracami generowanymi przy pomocy sztucznej inteligencji (w kilku przypadkach tylko po to by zaoferować potem użytkownikom własne modele SI), protestuje część artystów. Podnoszone w debacie argumenty to zarówno proza życia – czyli obawa twórców, że zostaną wyparci z rynku przez użytkowników łatwych w obsłudze aplikacji, wątpliwości w kwestii praw autorskich do wygenerowanych grafik i wreszcie pytanie o prawną dopuszczalność szkolenia modeli SI na miliardach zdjęć i obrazów udostępnianych przez nas w internecie. Słychać też pytania z górnych rejestrów egzystencji i jęk zranionego ego – wołanie o sztukę jako domenę zarezerwowaną dla człowieka i tajemnic jego duszy, o wyjątkowość artysty. Bo czy sztuka powinna być łatwa i dostępna dla wszystkich? Nielimitowana? Czy sztuka generatywna to nadal sztuka? Czy SI to tylko nowe narzędzie czy coś o wiele więcej? Wiele z tych pytań nieświadomie powtarza myśli i obawy jakie w XIX wieku formułowano pod adresem fotografii.
Artyści od zawsze starali się usprawnić lub zautomatyzować ten czy inny aspekt procesu twórczego; mistrz powierzał studentom mniej istotne elementy obrazu, wykorzystywano aktualne zdobycze techniki (camerę lucida, camerę obscura, fotografię, programy graficzne), wszystko by skrócić czas i mozół i skupić się na najważniejszym, na samym akcie kreacji. Sztuczna inteligencja jest tutaj kolejnym etapem automatyzacji, fakt, że w przeciwieństwie do poprzednich rewolucji technicznych, ta przeskakuje naraz o kilka stopni. Przejmuje i automatyzuje proces nauki i jednocześnie, przez swą przystępność czyni z „wyjątkowości artysty” pojęcie historyczne. Krytycy pytają czy SI nie odbiera twórcom zbyt dużo? Kto jest naprawdę autorem? Czy wystarczy tylko pomysł by być twórcą? Czy wszyscy mogą być artystami? Być może odpowiedzi na dwa ostatnie pytania już istnieją, moim zdaniem udzieliło je ostatnie sto lat rozwoju sztuki nowoczesnej.
Innym argumentem podnoszonym przez przeciwników jest kwestia, że modele SI mogą być szkolone także na obrazach chronionych prawem autorskim. Mówiąc wprost, czy SI kradnie dzieła artystów? Według jej twórców, nie; SI nie jest maszyną do kolażu, nie kopiuje obrazów które „widziała” lecz uczy się na nich, a następnie generuje nowe obrazy korzystając ze zdobytej wiedzy. Sieć neuronowa rozpoznając wzorce z miliardów obejrzanych obrazów działa podobnie jak ludzki mózg; lub raczej JAK SĄDZIMY, że działa ludzki mózg, analogia nie jest doskonała, lecz z drugiej strony, najlepsza jaką obecnie dysponujemy. Zwolennicy argumentują, że to tylko nowe narzędzie w przyborniku artysty, że sztuka powinna być dostępna dla wszystkich, że generator obrazu to po prostu nowy kalkulator. Na poziomie podstawowym istotnie tak jest, można używać generatora obrazu jak artystycznego kalkulatora czy aparatu w telefonie, uzyskując dla prostej podpowiedzi całkiem przyzwoite efekty. W rękach świadomego artysty narzędzie rozwija jednak o wiele większe możliwości, a zaawansowane funkcje edycji oddają pod kontrolę użytkowników właściwie każdy element generowanego obrazu.
Debata trwa, filozoficzna, etyczna, prawna. I gorąca. Przybiera często skrajne formy, użytkownicy generatorów obrazów bywają w przestrzeni internetowej (i oby tylko) obrażani, nękani i zastraszani. Twórcy nowej technologii otrzymali już pierwsze pozwy sądowe. Z drugiej strony, generatory obrazów zyskały miliony użytkowników, efekty ich pracy zaczynają pojawiać się na okładkach książek, wykorzystywane są w produkcji filmów i gier, wkraczają do galerii i muzeów.
W toczącej się debacie widać też wpływ kultury popularnej. Wkroczenie sztucznej inteligencji w różne dziedziny naszego życia aktywowało w nas różne kody (pop)kulturowe: przeciwnicy SI zdają się widzieć w niej nadciągającą unifikację i tyranię, wszechwładny SKYNET, który odbierze nam wszystko co ludzkie, któremu trzeba stawić opór na wszystkich frontach nie czekając na Johna Connora. Entuzjaści nowej technologii w tej optyce jawią się jako amoralni „tech bros”, janczarzy nowego porządku. Z kolei dla zwolenników SI jest ona narzędziem zmiany, które pomoże zakwestionować opresyjne hierarchie, rozszerzy możliwości człowieka i pomoże mu wyzwolić się z ograniczeń i skostniałej rutyny starego świata. Czuć w tym buntowniczego ducha cyberpunka, tutaj z kolei przeciwnicy upowszechniania technologii postrzegani są jako niechętni zmianom „luddyści” i strażnicy skostniałego paradygmatu.
Na pewno obserwujemy szalenie interesujący moment w historii sztuki. Trudno dziś przewidzieć, jaki ostatecznie przybiorą kształt regulacje prawne i w jaki sposób narzędzia SI wpłyną na świat (nie tylko) sztuki. Jej samej nic nie grozi, jest, mimo wielu prób, niedefiniowalna, konstytuowana nieustanną zmianą. Sztuczna inteligencja otwiera kolejne drzwi, nie pierwsze, ale i nieostatnie, do niewypełnionych jeszcze obszarów mapy, krain gdzie, jak się okazało, naprawdę mieszkają smoki. A piękno? Czy kryje się tylko w dziele tradycyjnym, a prace made in SI oferują tylko puste decorum? To już zależy od nas, piękno tkwi przecież w oku patrzącego. Dzieło sztuki jest tylko punktem wyjścia, a dopiero w umyśle widza, w umyśle człowieka, dzieje się magia.
Igor Myszkiewicz