POST
EFFORT

Bez tarcia nie ma iskier.
O wysiłku i procesie twórczym w czasach zautomatyzowanej kreatywności.

SPIS TREŚCI

Autostrada kreatywności

Trud, wysiłek, znój - to brzydkie słowa, kulturowo naznaczone, nieprzystające do nowoczesnego świata, w którym za podstawowy paradygmat przyjmuje się minimalizację egzystencjalnego tarcia i oporu materii. W ciągu ostatnich dwóch dekad ilość cyfrowego smaru wciskanego we wszelkie obszary gospodarki i naszego życia codziennego rośnie bezprecedensowo. Przyjazne interfejsy dostarczają wszystkiego w mgnieniu oka, na skinienie palca przesuwanego po gładkiej tafli ekranu. W końcu istotna część cyfrowej gospodarki zbudowana jest właśnie wokół idei ułatwiania, przyspieszania i optymalizowania procesów, idealnie współgrając z kulturą szybkiej konsumpcji.

Jedną z głównych osi techno-apologetycznej narracji jest wyzwolenie nas z okowów tego,co jakoby prozaiczne, monotonne i powtarzalne. We frazie "work smarter, not harder", mającej genezę w okresie drugiej rewolucji przemysłowej, a w XXI w. ochoczo przejętej przez korporacje IT i startupy, z pozoru czysto pragmatycznej i zdroworozsądkowej, kryje się jednak dewaluacja wysiłku jako doświadczenia immanentnie wartościowego w wymiarze egzystencjalnym i psychologicznym.

Oczywiście proces automatyzacji i technologicznego zapośredniczenia postępuje od zarania dziejów - od kamiennych łupków, poprzez koło młyńskie, prasę drukarską, maszynę tkacką po roboty przemysłowe i komputery osobiste. Niemniej skala, tempo oraz zakres (choćby bezprecedensowe wejście w obszar kognitywny) automatyzacji i eksternalizacji wysiłku - szczególnie w kontekście generatywnej AI - stawia nas w sytuacji, gdy należy zadać pytanie, czy oby na pewno chcemy, by maszyny odebrały nam cały trud? Jak odnajdziemy się w epoce post-wysiłku?

Co, jeśli głęboką satysfakcję wynikającą z mozolnego pokonywania oporu materii zastąpimy natychmiastową gratyfikacją? Czy kompresja procesu twórczego między intencją a rezultatem może postępować w nieskończoność? Gdzie leży granica między autonomicznym podmiotem a bezwolnym narzędziem? Gdzie tak naprawdę przebiega podział między tym, co wartościowe, a prozaiczne w procesie kreacji? Czy aby wszyscy chcemy i możemy stać się "managerami kultury", orkiestrującymi wytwórczych agentów? Jak może zmienić się obecne status quo w postrzeganiu roli artysty w procesie twórczym i definicja sztuki jako takiej? Czy obiecywana nam akceleracja produktywności, szczególnie w "branży kreatywnej", nie jest toksycznym mitem? Czy ilość wysiłku jest i pozostanie istotną osią aksjologiczną w ocenie danego dzieła i jak de facto definiujemy "wysiłek twórczy"? Czy, wreszcie, stoimy w przededniu kulturowego singularity, gdzie poprzez automatyzację wszystkie możliwe i sensowne permutacje zostaną ostatecznie wygenerowane i zweryfikowane?

To pytania, które nie dawały mi spokoju od chwili, gdy zobaczyłem pierwszego "astronautę na koniu na marsie" niosącego dobrą nowinę o galopującym tempie rozwoju generatywnej AI w kontekście automatyzacji wysiłku wkładanego do tej pory w "manualną" aranżację pikseli, słów i dźwięków.

Bardziej jednak niż epatujące z nagłówków prasowych pytania o wymiar ekonomiczny - "Czy AI zabierze pracę grafikom?!", nurtuje mnie psychologiczny i egzystencjalny wymiar potencjalnej erozji wynikającej ze stopniowego podmywania fundamentów procesu twórczego.

Stopniowe wypłukiwanie tych jakoby niewygodnych i zbytecznych kamyczków - ruchów ręki dzierżącej rysik, kliknięć i mikro-decyzji leżących na drodze między gloryfikowaną ideą a rezultatem. Innymi słowy - zamiana wielogodzinnej, mozolnej wędrówki krętą ścieżką przez las na "autostradę kreatywności".

Oczywiście, zdając sobie sprawę z własnych kognitywnych ograniczeń i siłą rzeczy bardzo idiosynkratycznej perspektywy, postanowiłem, że najlepszą drogą do uporządkowania myśli i próby względnej obiektywizacji wniosków, będzie rozmowa z przedstawicielami szeroko rozumianej "branży kreatywnej" - od niezależnych artystów, poprzez crative directorów agencji reklamowych, szefów studiów graficznych, gamedev i "immersyjnych doświadczeń", po projektantów spekulatywnych i osoby związane z edukacją artystyczną.

Wszystko, co następuje jest efektem dziesięciu kilkugodzinnych rozmów, wielu lektur i własnych refleksji. Doskonale zdaje sobie sprawę, że prawdopodobnie brakuje mi adekwatnych intelektualnych kompetencji i wystarczającej erudycji, by móc w autorytatywny sposób postawić tezy w tak szerokim i wielowątkowym zakresie. Niniejszy tekst nie ma charakteru opracowania naukowego - jest jednak zapisem osobistego, poznawczego wysiłku w starciu z tematem, który w moim mniemaniu ma charakter fundamentalny dla wszystkich, którzy czują się twórcami i to im wszystkim go dedykuję oraz zapraszam do polemiki.

Pożytki ze znoju

„Najlepsze momenty pojawiają się zazwyczaj wtedy, gdy ciało lub umysł danej osoby są napięte do granic możliwości w dobrowolnym wysiłku, by osiągnąć coś trudnego i wartościowego."

— Mihály Csíkszentmihályi, FLOW

Praca to życie

Czym właściwie jest wysiłek? Słownik języka polskiego PWN definiuje to pojęcie jako "wytężenie sił fizycznych lub psychicznych dla osiągnięcia, lub zrobienia czegoś". Warto zwrócić uwagę na zawartą w tej definicji problematyczną dychotomię między tym co mentalne a fizyczne - aspekt który będzie jeszcze wybrzmiewał w rozważaniach o jego roli w procesie twórczym. Na potrzeby dalszych rozważań proponuję alternatywną definicję wysiłku, w szczególności "wysiłku twórczego", osadzoną w termodynamice i teorii informacji - wysiłek twórczy to kierowany informacją przepływ energii zwiększający organizację systemu.

W słynnym eseju "Czym jest Życie?", Erwin Schrödinger, jeden z twórców fizyki kwantowej (ten od kota), mierzył się z paradoksem życia jako fenomenu, które na pierwszy rzut oka stoi w sprzeczności z drugą zasadą termodynamiki (w dużym skrócie - entropia zawsze rośnie). Organizmy żywe - od jednokomórkowców po naczelne - zdają się przeciwstawiać entropii poprzez samoorganizację, zwiększenie złożoności i uporządkowania samych siebie, jak i w niektórych przypadkach swojego otoczenia - termity budujące termitiery, ptaki wijące gniazda, ludzie budujący statki kosmiczne. Sam paradoks można dość łatwo wyjaśnić, jako że, nie wdając się w szczegóły, zmniejszenie entropii lokalnie, de facto przyśpiesza jej wzrost globalnie - tzn. jedząc batonik, czy malując obraz olejny przyspieszamy śmierć termiczną wszechświata. Nie ta defetystyczna konstatacja jest tu jednak istotna - istotny jest egzystencjalny wymiar obserwacji, że w tym ujęciu wysiłek (ukierunkowanie przepływu energii) wkładany w lokalną redukcję entropii zdaje się esencją życia jako takiego. Wysiłek jest zatem nieodłącznym, a wręcz koniecznym warunkiem egzystencji. Parafrazując zatem nieco przewrotnie - "praca to życie!".

Paradoks pracy

Skoro padł już termin praca - tu rozumiana jako ustrukturalizowana i społecznie usankcjonowana forma wysiłku (przy czym niekoniecznie jest to typowa praca zarobkowa), nie sposób nie wspomnieć o słynnej "teorii Flow" (przepływu) autorstwa psychologa o wdzięcznym nazwisku Mihály Csíkszentmihályi.

Csíkszentmihályi, eksplorujący związki motywacji, aktywności, wysiłku i dobrostanu psychicznego przeprowadził w latach 80' pionierskie badania oparte o metodologię ESM (experience sampling method). Schemat badania polegał na rozdaniu setkom uczestników, pagerów na okres jednego tygodnia i wysyłanie powiadomień w losowych momentach dnia. Uczestnicy po otrzymaniu powiadomienia mieli za zadanie zaraportować w specjalnym dzienniczku, co robią w danej chwili i jak się czują. Badania te pozwoliły zebrać ponad 100 000 „przekrojów" doświadczeń od ludzi z różnych kręgów kulturowych i zawodowych - od pracowników taśmowych w Chicago, przez rolników w Alpach, po nastolatków w Tokio.

Jeden z paradoksów, jaki wyłonił się z wyników tych badań, jest fakt, iż mimo, że większość badanych deklarowała, że wolałaby wypoczywać, a nie pracować, to z zebranych próbek wyłonił się obraz zgoła odmienny - wyniki wskazywały na wyższy poziom satysfakcji i dobrostanu psychicznego podczas wykonywania obowiązków domowych, zawodowych i szkolnych niż w czasie wolnym.

Ten "paradoks pracy" potwierdza postulowane przez Mihály'ego tezy, stawiane w ramach teorii optymalnego doświadczenia, znanego powszechnie jako "flow". Centralnym założeniem leżącym u podstaw tej teorii jest obserwacja, że umysł pozostawiony bez wyraźnego celu i zadania, na którym może się skoncentrować, naturalnie dąży do "entropii psychicznej" - stanu nieuporządkowania, w którym częściej pojawiają się negatywne myśli, ruminacje i lęki związane z przyszłością. Csíkszentmihályi twierdzi, że jednym ze sposobów uporządkowania jaźni i podniesienia jakości subiektywnego doświadczenia jest oddanie się zadaniom które wywołują w nas stan przepływu - kiedy to bez reszty zanurzamy się w procesie, w pewnym sensie zapominając o nas samych, a wszelkie troski i lęki wypierane są przez koncentrację na bieżących czynnościach wiodących do danego celu.

Oczywiście, tu warto nadmienić, że nie każdy wysiłek i nie każda praca ma równy potencjał do stworzenia warunków dla "flow", przy czym wbrew pozorom podział nie przebiega na osi między "prostą pracą mechaniczną" na linii montażowej a pisaniem poematu - co jest istotne w kontekście rozważań o AI w procesie twórczym. Praktycznie każdy rodzaj aktywności może być "przepływotwórczy" pod warunkiem, że spełnia kilka z podstawowych kryteriów:

  • optymalny poziom trudności zadania - zbyt łatwy proces nie dostarcza adekwatnej stymulacji, zbyt trudny może przytłoczyć
  • jasno określony cel - wiemy, do czego zmierzamy, niekoniecznie na poziomie globalnym (jak w wielu nieustrukturyzowanych procesach artystycznych) ale przynajmniej na jeden krok w przód
  • szybka informacja zwrotna - musimy czuć, że nasze działania dają wymierne postępy, przy czym istotniejsze są tu drobne bieżące kroki niż odroczona w czasie walidacja efektu
  • głęboka koncentracja na zadaniu - poświęcamy danemu działaniu maksimum zasobów poznawczych
  • poczucie kontroli - subiektywne poczucie, że panujemy nad sytuacją (nawet jeśli jest ono de facto iluzoryczne)
  • motywacja autoteliczna - czynność jest wykonywana dla niej samej, a nie dla zewnętrznej nagrody. Sam proces jest źródłem satysfakcji. Celem wspinaczki jest proces pięcia się pod górę.
krzywa Wundta

Mam nadzieję, że po przytoczeniu powyższych aspektów "optymalnego doświadczenia" powoli zaczyna wyłaniać się fundament moich obaw związanych z postępującą automatyzacją procesów twórczych i narracji o tym, jak to teraz dzięki wycięciu wszystkich "trywialnych i mozolnych" elementów procesu każdy może mieć spektakularne efekty "na już". Pamiętajmy - flow można odnaleźć nawet w prostych czynnościach życia codziennego - częstokroć o wiele łatwiej ten stan uzyskać lepiąc z gliny, wyklikując wielokąty w Blenderze, czy zmywając talerze (jasno określony cel, natychmiastowa informacja o postępach, poczucie kontroli), niż wykonując tę gloryfikowaną pracę kognitywną na wysokim poziomie, na którą dzięki AI będziemy mieć teraz ponoć więcej czasu - uczestnicząc w kolejnym spotkaniu zarządu czy planując bardzo ważną kampanię marketingową serka homogenizowanego.

Jak zatem korzystanie z AI może wpływać na "przepływotwórczość" procesu? Z rozmów z twórcami wyłania się niejednoznaczny obraz. Część z rozmówców potwierdza moje intuicyjne obawy o zbytnie skracanie drogi między intencją a rezultatem:

„Korzystając z guzika 'zrób mi natychmiast moje dzieło sztuki', my się pozbawiamy tej trasy całej... to jest trochę jak wzięcie pigułki [narkozy na czas podróży]."

poczucia kontroli:

„Ja nie widzę w swojej praktyce twórczej przestrzeni na traktowanie AI na równi ze mną. [...] Bo to dla mnie jest żadna frajda, że że coś jest dla mnie, że muszę oddawać część swojej sprawczości jakiemuś narzędziu."

oraz zachwiania optymalnego poziomu trudności:

„Miałem gigantyczną satysfakcję z przyspieszenia roboty [poprzez wykorzystanie AI]. Dziś jest to tak część takiej rutyny wręcz zawodowej, że nie odczuwam, szczerze mówiąc, zbyt dużo jakby."

Pojawiały się jednak również głosy, które wskazywały na pozytywny wpływ w osiąganiu stanu flow, poprzez realizację jednego z fundamentalnych dla jego uzyskania wymagań - szybkiej informacji zwrotnej oraz, dodatko, możliwości wykonania większej ilości iteracji w tym samym czasie:

„Dzięki tym narzędziom mogę szybciej pewne rzeczy wytworzyć po to, żeby je szybciej przegadać z kimś, żeby zweryfikować w ogóle [...] to jest taka de facto super moc."

„Siedząc w takim narzędziu i generując kolejne jakieś iteracje, ta łatwość tego wyniku [...] ona bardzo pomaga w wejściu w ten taki nazwijmy to flow."

„Jak ja zaczynam pracować z AI [...] to ja mam jednak i czas i przestrzeń i brak tego hamulca, który pozwala mi spróbować po raz trzeci, po raz czwarty, po raz piąty."

„Więcej pytań sobie zadaję. Więcej ścieżek mogę 'wyeksplorować' i w rezultacie powstają rzeczy, które wydaje mi się, że są lepsze."

Tu warto zwrócić uwagę na dwie odmienne strategie wykorzystania AI w procesie twórczym - jedna nakierowana jest na bezpośrednie przyśpieszenie procesu produkcji, skrócenie drogi między ideą a produktem końcowym, druga polega na "zagęszczeniu" samego etapu ideacji poprzez zmieszczenie większej ilości prób przed wybraniem ostatecznego wariantu.

W pierwszym modelu - ilościowym - faktycznie idziemy na skróty, potencjalnie zwiększając ilość "produktów końcowych" możliwych do uzyskania w tym samym czasie, w drugim - jakościowym - niekoniecznie wytworzymy więcej dzieł w danym czasie, natomiast weryfikujemy po drodze więcej szkiców/wariantów z intencją podniesienia jakość finalnej kreacji - przesuwając potencjał do wystąpienia przepływu z implementacji do fazy konceptualnej.

Oczywiście ta druga ścieżka wymaga o wiele większej samodyscypliny i mentalnego wysiłku niejako w kontrze do tego w jaki sposób "dopaminogenne" narzędzia generatywnej AI są projektowane.

Kreacja pod wpływem

"Kiedy cele, które osiągało się kiedyś dzięki własnej pomysłowości, poświęceniu i nabytym z trudem umiejętnościom, osiągają za nas wymyślne urządzenia, wymagające jedynie posiadania karty kredytowej i wciśnięcia odpowiedniego guzika, tracimy coś, co zapewniało ludziom szczęście i było, jak się wydaje, niezbędnym warunkiem jego zdobycia: dumę z własnej sprawności, bystrości i zręczności, z realizacji trudnego zadania i z pokonania piętrzących się przeszkód. Z upływem czasu zapominamy i tracimy nabyte wcześniej umiejętności oraz samą zdolność uczenia się i doskonalenia umiejętności nowych. Wraz z nimi znika radość płynąca z dobrze wykonanej pracy - radość trudna do zastąpienia, bo warunkująca nasze poczucie własnej wartości. Kurczy się także szczęście czerpane z poczucia własnej godności."

— Zygmunt Bauman, "Sztuka Życia"


W omówionym w poprzednim fragmencie kontekście - zwiększania tempa produkcji vs podnoszenia poziomu jakości, nie sposób pominąć wprowadzonego przez Csikszentmihalyiego rozróżnienia między przyjemnością a satysfakcją. Mimo że w potocznym języku zwykle używamy tych pojęć zamiennie, to w psychologii optymalnego doświadczenia opisują one dwa istotnie różne fenomeny:

  • Przyjemność - jest doświadczeniem homeostatycznym, sygnałem wysyłanym przez nasz układ nerwowy, gdy bieżąca potrzeba zostanie zaspokojona. Jest pasywna i nie wymaga inwestowania energii psychicznej, może się nam "przydarzyć" bez żadnego wysiłku z naszej strony. Przykłady - zjedzenie pączka, powiadomienie o polubieniu na instagramie, oglądanie serialu na Netflix. Przyjemność jest ważna dla jakości życia, ale sama w sobie nie prowadzi do rozwoju psychologicznego, ani nie dodaje złożoności naszemu „ja". Przyjemność to "komfortowe siedzenie w miejscu".
  • Satysfakcja - pojawia się tylko w wyniku istotnej inwestycji energii psychicznej (i/lub fizycznej), charakteryzuje się poczuciem nowości i osiągnięcia celu. W przeciwieństwie do przyjemności satysfakcja wymaga wysiłku i skupienia. Nie można czerpać satysfakcji z gry w tenisa, czytania trudnej książki, czy głębokiej rozmowy bez pełnego zaangażowania uwagi. Co istotne, czynności dające satysfakcję niekoniecznie muszą być przyjemne w momencie ich wykonywania. Mogą wiązać się z bólem, zmęczeniem czy stresem (np. wyczerpujący bieg, trudna wspinaczka, rozwiązywanie skomplikowanego problemu w pracy), ale z perspektywy czasu oceniamy je jako wartościowe momenty. Doświadczając satysfakcji, czujemy, że się zmieniliśmy, że nasze „ja" stało się bardziej złożone. Satysfakcja to „mozolny ruch naprzód".

Nie sposób nie zauważyć, że architektura, model biznesowy i marketingowa narracja wokół narzędzi generatywnej AI w tandemie z ekosystem mediów społecznościowych kierują użytkowników raczej ku doświadczaniu natychmiastowej przyjemności, niż długofalowej satysfakcji. Pamiętaj - "work smarter, not harder!" - nie bądź frajerem - wrzuć monetę, a dostaniesz cały oteksturowany już model 3D którego ręczne wyrzeźbienie zajęłoby cały dzień. Bilans lajków na insta wyjdzie podobnie, wyrzut dopaminy gwarantowany - "oferujemy 7-dniowy okres próbny - kliknij poniżej".

Jak do zagadnienia przyjemności/satysfakcji w kontekście korzystania z AI odnoszą się moi rozmówcy? Spora część wypowiedzi zdaje się pokrywać z moimi obserwacjami:

„Ja mam taką teorię, że my się od AI uzależniamy, ponieważ to bardzo przypomina proces uzależnienia od wszystkiego, co daje nam krótkie wybuchy dopaminy. A ja takie wybuchy dopaminy czuję za każdym razem, jak generuje obrazy... ta szybkość, ta łatwość."

„Przyjemność co jest takie slot machine, nie? Że jest pewnie w tym ryzyko, że jest uzależniające, że masz szybko gratyfikację i możesz ich uzależnić i potem chcesz więcej i więcej."

„Ja sama nie wiem na ile właśnie używanie na przykład Midjourney... nie wiem na ile to jest hazard, a na ile to jest flow. Trochę wrzucasz te monetki... więc tam na pewno jest element hazardu, więc prawdopodobnie nie jest dla nas najzdrowsze."

„Dla mnie to była po prostu no taka trochę druga młodość kreatywna... Ja się bardzo szybko uzależniłem od tego, że po prostu zamiast się do łóżka to 3 godziny jeszcze promptowałem."

"Faktycznie ja to traktuję bardziej jako bardziej jako rozrywkę niż pracę twórczą. [...] to jest dla mnie spędzanie czasu, które jest fajniejsze niż oglądanie seriali... ale też nie kwalifikuję go jakoś super wysoko jako wiesz, wyrażanie siebie."

Dla równowagi jednak przytaczam też wypowiedzi które prace z AI osadzają jednak w spektrum twórczej satysfakcji:

„Ten proces, który ostatnio mam [z kodowaniem]... no to ja się czuję ku*** jakbym miał zaczarowany ołówek, rozumiesz? To jest jakby ja se wymyślę i se jest… No i jest w tym jakiś poziom satysfakcji, bo ja sobie na to patrzę, ja sobie myślę, no ja pier****, w życiu nie myślałem, że będę w stanie zrobić w ogóle coś takiego... i mam poczucie, że to jednak ja zrobiłem również."

Znamienne jest przytaczanie przez niektórych rozmówców metafor narkotyków i hazardu związanych z użyciem AI w procesie kreacji. Uzależniająca może być natychmiastowość efektu, ale także, co być może mniej oczywiste, aspekt losowości. Związek między nieprzewidywalnością nagrody a intensywnością odczuwanej przyjemności jest jednym z najlepiej udokumentowanych zjawisk w psychologii behawioralnej. W skrócie: nagrody przyznawane w sposób nieregularny i nieprzewidywalny wzmacniają zachowanie silniej, niż nagrody stałe - i generują większe pobudzenie dopaminowe. Efekt ten wykazał B.F. Skinner już w latach 50' w klasycznych eksperymentach z udziałem gołębi. Co mają jednak wspólnego gołębie dziobiące dźwignie, która często, ale nie zawsze, uwalniała porcję pokarmu, z generatywną sztuczną inteligencją? Otóż każdy, kto kiedykolwiek korzystał z generatorów obrazów czy video doskonale wie, że mimo szybko rosnącej jakości outputu, nadal dostarczane rezultaty potrafią odbiegać drastycznie od tego, co chcielibyśmy uzyskać i otrzymanie zadowalajacego nas efektu przypomina nieco sesję z jednorękim bandytą w salonie gier. Owa niepewność nagrody, ekscytacja, kiedy jednak się uda, ma charakter bliższy grze hazardowej niż mozolny proces, w którym widzimy stopniowe "wyłanianie" się rezultatu będącego kumulacją tysięcy naszych mikro-decyzji kreatywnych.

Ta dynamika - intensyfikacja tempa i ekscytująca niepewność już na podstawowym behawioralnym poziomie wygrywa ze żmudnym i bardziej przewidywalnym procesem twórczym z odwleczoną gratyfikacją.

Z nieodłącznie losowym, nieprzewidywalnym, zaskakującym nas efektem końcowym wytwarzanym przez generatywne modele związany jest też kolejny aspekt, ważny w dalszych rozważaniach nad relacją twórca-narzędzie oraz kluczowymi pojęciami intencji, kontroli, autonomii i sprawczości…

Wszyscy jesteśm narzędziami

Kreatywna narkoza

Jak już napomknąłem we wstępie, tworzenie narzędzi, które pozwalają eksternalizować nasz wysiłek, optymalizując przepływ energii jest fenomenem obecnym od zarania dziejów. Praktycznie równie stare są też obawy o negatywny wpływ nowych technologii na kondycję ludzką. W obszarze technologii kognitywnych warto wspomnieć Sokratesa, który przestrzegał przed technologią pisma jako zubożającą możliwości pamięciowe i spłaszczającą subtelności żywej dialektyki - o ironio, jego słowa znamy tylko dzięki temu, że spisał je Platon.

Ta obawa i napięcie między jednoczesnym zwiększaniem potencjału całego systemu człowiek-narzędzie przy jednoczesnym zubożeniu umiejętności samej jednostki, wybrzmiewa wyjątkowo mocno w epoce cyfrowej i aktualnym bezprecedensowym zapośredniczaniu wysiłku kognitywnego przez nowe technologie. Dobrym przykładem tego zjawiska są badania wskazujące na pogorszenie naturalnych zdolności nawigacji w terenie na skutek używania GPS'u.

W kontekście rozgrzanych debat o wykorzystaniu AI w procesie twórczym jednym z częściej spotykanych zawołań jest - "AI to tylko narzędzie - jak Photoshop!".

Myślę, że, odkładając na chwilę na bok problem definicji narzędzia jako takiego, różnica między wykorzystaniem generatora obrazów bazującego na AI a wykorzystaniem Photoshopa czy ołówka ma jednak charakter bardziej ilościowy, niż jakościowy. Postuluję, iż jednym z wymiarów, po których możemy się tutaj poruszać jest, zasygnalizowany w poprzedniej sekcji, "potencjał zaskoczenia".

Owszem, nierzadko twórca, patrząc na swoje finalne, stworzone "klasycznymi" metodami dzieło, odczuwa pewien poziom zaskoczenia, w końcu prawie nigdy ostateczny efekt nie pokrywa się w pełni z pierwotną intencją. Nawet osoby obdarzone wyjątkowym talentem do wizualizacji nie są w stanie przewidzieć wszystkich niuansów i detali obecnych w skończonej formie - zawsze są one bowiem efektem interakcji i sprzężenia zwrotnego między nami a materią. Niemniej, finalny efekt jesteśmy w stanie wywieść z serii kroków, zarówno fizycznych, jak i mentalnych, wykonanych przez nas na drodze do celu. Im bardziej skracamy drogę między intencją a rezultatem, przeskakując daną sekwencję kroków, tym większe prawdopodobieństwo, że zamiast stopniowo wyłaniającego się przed nami, spodziewanego krajobrazu, zostaniemy teleportowani w miejsce, którego się nie spodziewaliśmy, nie umiejąc wyjaśnić jak się doń dostaliśmy. Przytoczę tu ponownie jedną z wypowiedzi:

„Korzystając z guzika 'zrób mi natychmiast moje dzieło sztuki', my się pozbawiamy tej trasy całej... to jest trochę jak wzięcie pigułki [narkozy na czas podróży]."

Im większy "potencjał zaskoczenia", im częściej w procesie poddajemy się kreatywnej narkozie, tym bardziej rozmywają się granice między tym, co tradycyjnie rozumiemy jako narzędzie, a tym co uznajemy za twórcę.

Aspekt elementu zaskoczenia jest zresztą jednym z centralnych kryteriów w tzw. Teście Lovelace, nazwanego tak na cześć Ady Lovelace, uznawanej za pierwszą osobę programistyczną, która odnosiła się krytycznie do kreatywnego potencjału jednego z pierwszych komputerów - dziewiętnastowiecznej maszyny analitycznej Charlesa Babbage'a.

Test ten, stawiający wyżej, niż słynny Test Turinga, wiecznie podnoszoną dla naszego komfortu poprzeczkę tego, co "może tylko człowiek", to próba sprawdzenia, czy maszyna jest zdolna do autentycznej twórczości. W swojej oryginalnej wersji z 2001 zdefiniowany jest następująco:

System A przechodzi Test Lovelace wtedy, gdy:

  • A wytwarza artefakt O (np. wiersz, obraz, dowód matematyczny).
  • Artefakt O jest wynikiem działania systemu A, nie jest wynikiem błędu i może zostać powtórzony.
  • Twórcy systemu (lub ktokolwiek posiadający tożsamą wiedzę i zasoby) nie są w stanie wyjaśnić, w jaki sposób A wygenerował O.

W pewnym uproszczeniu - maszyna przechodzi Test Lovelace, jeśli wytworzy artefakt, którego jej twórcy nie są w stanie w pełni wyjaśnić na podstawie znanych im zasad działania systemu. Innymi słowy, jest w stanie autentycznie nas zaskoczyć - znajdując się wysoko na skali "potencjału zaskoczenia".

Na marginesie - tak sformułowane zasady poddane zostały później krytyce jako logicznie niemożliwe do spełnienia (postulując, że twórca systemu musi, siłą rzeczy umieć wyjaśnić genezę efektów działania systemu) i wersja 2.0 wprowadza rolę, jakże by inaczej, człowieka-eksperta oceniającego "kreatywność" rezultatu. Nie zmienia to faktu, że nadal - jak postuluje pionierka badań nad twórczością i AI, Margaret. A. Boden, kluczowa triada - "nowe, wartościowe i zaskakujące" stanowi istotny element w ocenie zdolności twórczych danego systemu.

Oczywiście, owa triada wyznaczników kreatywności ma charakter płynny - poziom nowatorstwa, wartościowości i zaskoczenia rozciąga się w szerokim spektrum, niemniej Boden wyróżnia dwie zasadnicze klasy związane z zasięgiem tych pojęć:

  • Kreatywność-P - psychologiczną, rozpatrywaną w kategoriach doświadczenia i umiejętności danej jednostki, coś co jest nowe, wartościowe i zaskakujące dla danej osoby nie musi być nowe i zaskakujące w skali całej ludzkości.
  • Kreatywność-H - historyczną, rozpatrywaną w kategoriach postępów całej cywilizacji, dzieła i dokonania, które nie mają precedensu w skali globalnej i historii ludzkości.

Jak już zaznaczyłem, w rozważaniach o wysiłku twórczym i jego zapośredniczaniu przez nowe technologie interesuje mnie przede wszystkim aspekt psychologiczny i egzystencjalny, więc skupiam i przyglądam się "potencjałowi zaskoczenia" na poziomie P. Na razie na bok odkładam kwestię tego, czy AI może potencjalnie wytworzyć coś a poziomie H, czy jak to inaczej jeszcze klasyfikuje Boden - transformacyjnym. Jest to w kontekście dobrostanu szeregowego twórcy nieistotne - jako że dla 99% ludzkości poziom ten również jest nieosiągalny.

Zaczarowany ołówek

Ołówek, jako element systemu twórca-narzędzie, posiada skrajnie niski (choć nie zerowy) "potencjał zaskoczenia", każda kreska za jego pośrednictwem stawiana jest bezpośrednio i dosłownie "w naszych rękach". Photoshop, oferujący szereg cyfrowych filtrów podnosi nieco poprzeczkę, zapośredniczajac detale transformacji poszczególnych pikseli. Proceduralny system cząsteczek bazujący na symulacji fizyki w Cinema 4D podnosi ją jeszcze wyżej - nadal mamy kontrolę nad parametrami i siłami, jakie kształtują rezultat, niemniej przebieg pracy z takim systemem polega na serii ewaluacji i zaskoczeń wynikających z testowania różnych konfiguracji ustawień, a finalne efekty często wyłaniają się niejako emergentnie jako funkcja sprzężenia algorytmu i naszych preferencji. Na każdym z kolejnych szczebli tej drabiny proporcja sprawczości w duecie twórca-narzędzie, to co/kto i w jakim stopniu kontroluje proces w danym systemie - przesuwa się, a dotąd jasne, tradycyjne role ulegają rozmyciu.

Potencjalnie, każdy kolejny technologiczny krok poszerza pole twórczej ekspresji, otwiera nowe, rozgałęziające się ścieżki, których eksploatacja wiąże się z nowymi wyzwaniami i sensotwórczym trudem. Jednocześnie, każdy kolejny krok niesie ryzyko stopniowego oddalania się od naszych naturalnych umiejętności, zgubienia ich na drodze ustawicznego postępu i zrzekania się ich na rzecz zewnętrznych systemów w imię wygody i produktywności. Do niedawna pytanie o to, czy drabina wiodąca ku coraz wyższym stopniom abstrakcji, na jakim operują twórcy, stopniowo separująca nas od wszelkich bardziej "przyziemnych" i "bezpośrednich" elementów procesu, może piąć się w nieskończoność, wydawało się czysto teoretyczne. Jednak najnowszy stopień abstrakcji, dostarczany przez modele generatywne zmusza do postawienia pytania, czy oby na pewno wspinaczka ta może trwać w nieskończoność…

Do tego wątku powrócę jeszcze w ostatniej sekcji, eksplorującej potencjalne dalsze scenariusze rozwoju modeli pracy twórczej, najpierw jednak chciałbym przytoczyć kilka z istotniejszych wypowiedzi moich rozmówców pytanych o relację twórca-narzędzie.

W części wypowiedzi przewija się bliska teorii aktora-sieci Bruno Latoura refleksja o zacierającym się, czy wręcz nieistotnym podziale między twórcą a narzędziem, pytani o to, jak postrzegają relację między twórcą a systemem AI, czy bardziej jako a) współtwórcy/partnera/podwykonawcy czy b) "tylko narzędzia a la Photoshop":

„Z mojej perspektywy to co tworzy to jest zawsze system, który jest złożony ze mnie i z czegoś innego, który jest w relacjach. To oznacza, że nie ma wyraźnego rozgraniczenia pomiędzy mną a narzędziem w ogóle."

„Oczywiście, że A [partner]... No bo jest to zawsze współkreowanie bez względu na to, czy mamy tam podmiotowość, świadomość po drugiej stronie, czy nie mamy..."

„Po pierwsze y moje LLMy, z których korzystam, głównie z czata, ale też z innych, z których też korzystałem, to jest mój nowy ziomek. Mój nowy ziomek do współpracy.

[...] Z którym gadam. E, głównie odbijam swoje pomysły."

„Trochę czasami coraz bardziej partner do pracy twórczej, od którego można pewnego rodzaju pomysły jakby brać. Można być w dialogu odnośnie pomysłów."

"…ja uważam, że to jest istota. To jak bardzo głęboka jest to istota, jak czy ma duszę, czy nie, to w ogóle mnie to na razie nie zajmuje, ale na pewno jest to jakaś istota..."

Tu warto wrócić do kwestii ołówka i pytania, kto tworzy rysunek. Jak stwierdziłem wcześniej, ołówek ma niski, ale nie zerowy "potencjał zaskoczenia". Przekładając to na język Latoura, który postuluje, że nie ma podmiotów i przedmiotów - są tylko "aktanci" (czynniki działające na inne czynniki), ołówek jest w tym systemie wzajemnego oddziaływania mniej wpływowym elementem systemu, jednak przez swoją konstrukcję, parametry fizyczne, nadal ma wpływ na efekt.

Model generatywny może być postrzegany z tej perspektywy, zgodnie z tym, jak ujął to jeden z rozmówców nawiązując do telewizyjnej bajki z lat 70 - "Zaczarowany Ołówek". Ołówek, który dokonując daleko idącej translacji między ideą a formą, jest czynnikiem o wiele mocniej wpływającym na proces i efekty kreacji niż ten zwykły, grafitowy.

Jak słusznie zauważa jeden z rozmówców - im bardziej narzędzie jest złożone i im więcej kroków w procesie wykonuje za nas, tym bardziej uwidacznia się "ślad narzędzia":

„...wydaje mi się, że jest taki problem, że część z tych narzędzi cyfrowy po prostu zjada jakby artystę w takim sensie, że bardziej widać te narzędzia niż artystę..."

Na marginesie, ze swojej strony dodam, że faktycznie, wraz z upowszechnieniem i daleko idącym ułatwieniem oferowanym przez gotowe silniki i platformy mediów cyfrowych takie jak TouchDesigner czy Unreal, obserwuję wzrost poziomu generyczności dzieł w domenie nowych mediów. Twórcy łatwo poddają się grawitacji gotowców i presetów, podążając ścieżką najmniejszego oporu, dając narzędziu prowadzić się za rękę.

Oczywiście, rozrzut odpowiedzi jest jednak spory i w części z nich nadal pobrzmiewa paradygmat tradycyjnego podziału ról:

„Jako tylko narzędzie a la Photoshop zdecydowanie jak na razie. Ja nie ja bardzo jestem… w ogóle zupełnie do mnie nie przemawia jak jakaś taka właśnie tendencja do antropomorfizowania tego AI. No to po prostu jest jakiś kurczę model statystyczny, przynajmniej na razie ciągle."

„...ja to traktuję narzędziowo, więc chcę to poznać, więc to rozpoznaję i nie mam wątpliwości [...] że to ja jestem twórcą, używając narzędzia, nie narzędziem."

„Ja nie ja nie potrzebuję takiej takiej współpracy, bo to dla mnie jest żadna frajda, że że coś jest wiesz, że coś jest dla mnie, że muszę oddawać część swojej sprawczości jakiemuś narzędziu. No także ja ja nie widzę w swojej praktyce twórczej przestrzeni na traktowanie AI na równi ze mną."

Relacje

Jednym z pytań, które wywołało, w moim odczuciu, głębszy poziom refleksji nad tym, jak traktujemy nie tylko modele AI, ale przede wszystkim siebie nawzajem, było pytanie o to, czy rozmówcy widzą różnicę między zleceniem danego aspektu pracy twórczej innej osobie a wykorzystaniem systemu opartego o AI.

Część osób wskazywała na przewagę jaką ma współpraca z drugim człowiekiem, wynikającą przede wszystkim z większego potencjału do poszerzenia kontekstu, poprzez wyjście poza samą realizację danego zadania, w sposób, który może wzbogacić efekt finalny, oraz personalne relacje i wyższą jakość:

„Widzę chyba nawet kilka różnic bardzo istotnych [...] w momencie, kiedy ja coś zlecam drugiemu człowiekowi, to po pierwsze dużo szerszy zakres naszych rozmów ma wpływ na to, co będzie z tego powstawało. Czyli to jest dużo, dużo szersza perspektywa, nie? Bo to, że my sobie będziemy filozoficznie gadać o tym, jak rzeczywistość działa, będzie miało wpływ na to, co w rezultacie powstanie."

„[...] jeśli robię projekt, w którym jest budżet i chcę, żeby to było konkretne, to jeszcze długi, długi czas będę zlecał to człowiekowi. [...] Przede wszystkim kontrola jakości. I sam aspekt tego współpracownika, tej osoby"

„[...] gdybym miała na ten projekt dużo więcej czasu, wolałabym go zrobić człowiekiem."

Powszechniejsza okazała się jednak perspektywa, z której przebija "narzędziowy" sposób postrzegania współpracowników. Co charakterystyczne Słownik PWN definiuje narzędzie jako:

  • «urządzenie umożliwiające ręczne wykonanie jakiejś czynności lub pracy»
  • «osoba będąca biernym wykonawcą cudzej woli»

Niestety trudno uniknąć tu refleksji, że współczesny system organizacji pracy - szczególnie w wydaniu korporacyjnym, od dawna przygotowywał nas mentalnie na płynną podmianę trybików, z tych bazujących na węglu na te bazujące na krzemie.

Doświadczenia pandemii, zamienienie komunikacji bezpośredniej na tą zdalną - wszystko to przygotowało idealny grunt dla chatbotów i agentów AI, zamieniając zniuansowane wielowymiarowe interfejsy żywych relacji, na interakcje dokonywane poprzez homogeniczną taflę ekranu. W tym ujęciu sparafrazować można wcześniej przytoczone zawołanie jako - "wszyscy jesteśmy tylko narzędziami!". W obliczu alternatywy dostrzegamy wady konstrukcyjne innych jednostek stojące na drodze do realizacji naszych celów:

„[...] brainstorm z tym czatem potrafi być bardziej ludzki niż brainstorm ze zmęczonym, nie wiem, mało zaangażowanym człowiekiem, który trochę jest obrażony na rzeczywistość."

„Sytuacja, w której ja chcę wejść w relację, w której ja chcę zbudować sieć, a druga osoba podchodzi na zasadzie joba do zrobienia [...] to w tym momencie to jest z kolei bardzo duże rozczarowanie, nie? I takie, taki rodzaj odcięcia to ja już wolę z AI wtedy, rozumiesz?"

„No wydaje mi się, że w dzisiejszym czasie takie są nasze doświadczenia ze współpracy z ludźmi i z systemami AI. No i niestety ta współpraca z AI jest o wiele łatwiejsza. [...] I to jest pewne niebezpieczeństwo."

„W przypadku indie dev [niezależne studia tworzące gry video] to jest zupełnie inna struktura, inne rzeczy się ocenia i tu współpraca z ludźmi to jest okazja, żeby po prostu być z człowiekiem. Tak, to są relacje. W strukturze, jak wyobrażam sobie, w strukturze dużej korporacji relacje międzyludzkie mają mniejsze znaczenie [...] Więc im bliżej człowieka jesteś, tego, który tworzy, tym jesteś w stanie docenić to, że to, że to zrobił. Ale jeżeli to jest struktura korporacyjna, to to gdzieś [...] I tak traktujesz innych ludzi trochę jak takie boty, trybiki."

Tu warto powrócić do myśli Csikszentmihalyiego dotyczącej stanu przepływu. Twierdzi on bowiem, że jakość życia w największym stopniu zależy od dwóch czynników - doświadczeń związanych z pracą i relacji z innymi. Przy czym, jako że w obecnym systemie większość naszego czasu spędzamy w ramach aktywności zawodowej, obie sfery naturalnie się przenikają. Dla większości z nas praca, na przekór turbo kapitalistycznej narracji, nie jest tylko o efektywnej realizacji zadań, to również przestrzeń relacji, emocjonalnej wymiany, poczucia przynależności. A moim zdaniem, jednym z najbardziej satysfakcjonujących i "przepływotówrczych" doświadczeń jest współdzielony trud związany ze wspólnym podążaniem do celu.

Warto zastanowić się, czy w dominującej narracji o tym, że teraz dzięki AI każdy będzie mógł zostać jednoosobowym studiem filmowym, że oto, hurra, nie będziemy już potrzebować współpracy z operatorem, dźwiękowcem, kompozytorem, bo całe dzieło powstanie gdzieś w wirtualnej przestrzeni między naszą klawiaturą a data center, nie ma pobrzmiewa aby metaliczne echo izolacji i osamotnienia.

Czy oby na pewno chcemy zastąpić naturalne tarcie i iskry obecne w mozolnym akcie współtworzenia z innymi ludźmi, ścierania się odmiennych poglądów, charakterów, opinii i doświadczeń, na chłodną, sterylną poświatę ekranu, gdy w samotności, w mgnieniu oka tworzymy kolejną mega produkcję - jedną z tysięcy, które zostaną opublikowane w ciągu najbliższych 24h? To jeden ze scenariuszy tego, jak może potoczyć się nasza dalsza relacja z narzędziami AI - więcej o potencjalnych kierunkach rozwoju wydarzeń i szerszym wpływie automatyzacji procesu twórczego na przyszłość kultury w kolejnej, ostatniej już sekcji.

Kulturowa osobliwość

Przewroty

Trudno oprzeć się refleksji, że większość naukowych rewolucji w postrzeganiu wszechświata była jednocześnie rewolucją w myśleniu o nas samych, zmuszając do przewartościowania naszego mniemania o sobie i domniemanej unikalnej pozycji w naturalnym porządku rzeczy. Do tej pory mieliśmy do czynienia z kilkoma tego typu "przewrotami kopernikańskimi" - poczynając od Kopernika właśnie, który zepchnął nas z centrum wszechświata na prozaiczną orbitę wokół jednej z bilionów gwiazd, poprzez Darwina, który uświadomił nam, że jesteśmy jedynie liściem w bujnej koronie świata ożywionego i współdzielimy te same korzenie z szympansem i amebą. Następnie Freuda, który uświadomił nam nieświadome, wskazująć, że ludzkie zachowania kształtują siły i procesy, które wymykają się naszej kontroli. Seria kolejnych, choć nieco cichszych rewolucji dokonywała się na przestrzeni XX wieku, gdy z jednej strony, przyglądając się uważniej przyrodzie wokół nas, zaczęliśmy lepiej dostrzegać olbrzymi potencjał inteligencji zwierząt - złożonej komunikacji, społecznych relacji, używania narzędzi…

Przy każdym takim przewrocie musieliśmy, choć najczęściej nie bez walki i oporu, z pokorą w końcu przyznać, że domena tego "co może tylko człowiek" po raz kolejny się skurczyła, a pojęcia mające do tej pory jasne definicje muszą zostać zredefiniowane. Obecnie stoimy w przedsionku kolejnej rewolucji, wymagając od nas głębokiej refleksji na temat takich pojęć jak myślenie i twórczość oraz, jak dotąd uprzywilejowanej, niemal "ekskluzywnej" relacji, jakie ma z nimi nasz gatunek.

Tu istotna dygresja - porównując potencjał intelektualny i twórczy ludzi oraz maszyn, stawiając pytania o to, czy maszyna może tworzyć i myśleć jak człowiek, należy dokonać rozróżnienia "jak" w sensie dosłownym, esencjonalnym oraz "jak" w sensie funkcjonalnym.

Nie ulega wątpliwości, że obecne modele AI nie przetwarzają informacji w taki sam sposób, jak robi to człowiek, zarówno substrat jak i jego konfiguracja jest drastycznie różna (choć w niektórych modelach, na bardzo wysokim poziomie abstrakcji poniekąd zainspirowana) od tej obecnej w naszym mózgu. Modele językowe są, jak sama nazwa wskazuje - modelami języka a język jest jedynie swego rodzaju "proxy" i artefaktem myślenia, najlepszym i najbardziej obecnie dostępnym, ale nie będący tożsamym z myśleniem w sposób, jaki robi to człowiek. Najpopularniejsze obecnie modele dyfuzyjne służące kreacji obrazów modelują jedynie finalne artefakty wizualne, nie proces tworzenia tożsamy z tym, jak tworzą ludzie. W tych systemach nie ma rozumianego klasycznie "twórcy", jest jedynie zakodowane w wielowymiarowych matrycach tworzywo.

A jednak, mimo to, nawet jeśli obecne technologie AI są jedynie symulacjami, świetnymi (w Turingowskim sensie), "imitatorami" procesów myślenia i tworzenia "jak człowiek", nie oznacza to, że nie mogą stanowić funkcjonalnego ekwiwalentu tych procesów, generując rezultaty nieodbiegające, a być może w końcu przewyższające to, co może osiągnąć pojedynczy człowiek lub cała ludzkość. Dla dalszych naszych rozważań kompletnie nie ma znaczenia, co dokładnie dzieje się w cyfrowych trzewiach centrów przetwarzania danych, podobnie jak fakt, że mało nas obchodzi, iż samolot nie macha skrzydłami jak ptak, a zamiast tego wykorzystuje kompresję powietrza w turbinie - ważne jest dla nas, że pełni on swoją funkcję w dostarczaniu nas do celu.

I to na tych właśnie utylitarnych, pragmatycznych implikacjach nowych technologii wytwarzania kultury chciałbym się skupić w większym stopniu niż na ontologicznych rozważaniach o tym, czy jest jakiś duch w maszynie, i czy/czym jest "świadomość". Nie ukrywam bowiem, iż bliska jest mi wizja Daniela C. Dennetta, zwracającego uwagę, że świat ożywiony, kształtowany przez proces doboru naturalnego, charakteryzuje się właściwością określoną przez niego jako "competence without comprehension" - autonomia nie wymaga introspekcji, a złożone, inteligentne zachowania mogą wyłaniać się oddolnie ze "ślepych" algorytmicznych procesów. Całe piękno i złożoność przyrody jest w końcu efektem stosunkowo prostej pętli filtrującej przepływ informacji (genetycznej), działającej nieświadomie bez ustanku przez kilka miliardów lat…

Paradoks produktywności

Wróćmy do wątku narracji o przesunięciu środka ciężkości w procesie kreacji z "prozaicznej" produkcji na rzecz skupienia na jakoby bardziej wartościowej pracy koncepcyjnej. Ten głęboko zakorzeniony w naszej kulturze platoński idealizm, który świetnie współgra z aktualną strukturą kulturowego kapitalizmu opartego o prawo "własności intelektualnej", jasno definiuje hierarchię wartości - liczy się koncept, idea, narracja. Wszystko, co leży na drodze między pomysłem a realizacją, to przeszkoda, ekonomiczna nieefektywność generująca koszty.

Co ciekawe, ta sama pogarda dla warsztatu i produkcyjnego trudu pobrzmiewa zarówno w agencjach reklamowych (gdzie to tzw. "kreacja" jest gloryfikowaną kastą), jak i na salonach sztuki współczesnej, gdzie niepodzielnie rządzi ideolo, a nie fizyczny trud i produkcyjny kunszt.

Wpisując się w ten aksjologiczny podział, apologeci AI przekonują, że dzięki tej technologii wszyscy będziemy mogli wykonywać właśnie tą wartościowszą pracę, awansując w hierarchii z marnych wykonawców do prawdziwych twórców - teraz wszyscy będziemy reżyserami, architektami, art/creative directorami, wszystkie ludzkie trybiki w maszynie kulturowej produkcji, odpowiadające za mozolną materializację myśli, zastąpione zostaną chmarą agentów AI.

Czy taka wizja przyszłości, wspartego maszynowo tworzenia, propagowana przez dostawców kreatywnego outsourcingu, jest jednak, używając języka Doliny Krzemowej - "skalowalna"? Wszystko opiera się tu na starym, dobrym, sprawdzonym paradygmacie nieograniczonego wzrostu (pozdrowienia dla planety ziemia). Skoro bowiem większość społeczności kreatywnej ma dostać upgrade do klasy premium i zyskać jednoosobowy potencjał tworzenia, będący ekwiwalentem całych domów produkcji filmowej, agencji reklamowych, studiów architektonicznych i projektowych, oznaczać to musi drastyczny wzrost wolumenu kreatywnych wytworów. Kultura jednak podobnie jak przemysł ciężki, bazuje na ograniczonym zasobie - nie paliwach kopalnych i minerałach ziem rzadkich, tylko na zasobie naszej uwagi i możliwościach poznawczych. Oczywistym problemem współczesnej kultury nie jest niedobór, a gargantuiczny nadmiar. Z tej perspektywy obietnica zwiększenia produktywności w dziedzinie kultury wydaje się ponurym żartem, nawet jeśli uwzględnimy takie procesy, jak fragmentację, personalizację i powstawanie hiper-nisz gatunkowych, to ilość pełnometrażowych filmów "sf-w-stylu-Quentina-Tarantino-które-dzieją-się-na-marsie-i-zawierają-wątki-queer", które zainteresowana nimi target grupa składająca się z 100 osób może skonsumować w ciągu doby, jest fizjologicznie ograniczona. Problemem, jak zawsze są ludzie - ludzie się nie skalują.

Jest w tej pochwale produktywności inna pułapka, o charakterze być może jeszcze bardziej fundamentalnym. Jaskrawy paradoks - a mianowicie produktywność ma de facto charakter względny. Możemy być bardziej produktywni tylko w odniesieniu do naszych kolegów i koleżanek po fachu, jeśli wszyscy jednocześnie dostaniemy narzędzie zwiększające produktywność o 10x, to relatywny wzrost produktywności każdego z nas wyniesie dokładnie 0, podnosi się jedynie kolektywna poprzeczka oczekiwań tego, co uznajemy za produktywność bazową. Tu chciałbym przytoczyć jedną z wypowiedzi:

„...pamiętam, że my robiliśmy różnego typu przygotowania do projektów, oferty tak zwane i robiliśmy dwa do trzech tygodniowo. [...] Jak już odchodziłem od [nazwa agencji] po roku, to my robiliśmy dwie, trzy oferty dziennie. [...] Z powodu AI, bo ci, którzy [przyjmują] oferty też wiedzą, że jest AI, w związku z tym oczekują więcej propozycji."

Jak nietrudno się domyślić w kontekście dobrostanu twórców, ta presja produktywności nie jest czynnikiem pozytywnym. Likwidując wszystkie proste elementy pracy, pozostawiamy jedynie elementy trudne, oczekując, że w tym samym czasie, który był przeznaczony na miks tego, co prozaiczne, z tym, co istotne, będziemy zaangażowani w pełni na najwyższych obrotach, zaburzając naturalną dynamikę i niebezpiecznie podnosząc poziom trudności zadania. Niwecząc jeden z podstawowych postulatów optymalnego doświadczenia tj. - "optymalny poziom trudności zadania, zbyt łatwy proces nie dostarcza adekwatnej stymulacji, zbyt trudny może przytłoczyć". Parafrazując przytaczane na początku tekstu motto - "Work smarter and harder!"

Amplifikacja przeciętności

Kolejna zafałszowana i toksyczna narracja dotyczy tzw. "demokratyzacji twórczości". Oto każdy, nieposiadający żadnych umiejętności i treningu w danej dziedzinie, nawet przy małych nakładach finansowych, będzie mógł stanąć w szranki z najlepszymi w branży. Problem z jakim mamy do czynienia, podobnie jak przy "paradoksie produktywności" polega na tym że demokratyzacja implikuje masowy wzrost konkurencji - stosunek szumu do sygnału pozostaje zatem bez zmian, owszem z większą łatwością będziemy mogli wyprodukować dzieło, ale szanse na przebicie się najprawdopodobniej jeszcze bardziej zmaleją. To co natomiast przy okazji może ulec pogorszeniu to parametry które decydują o tym kto się przebija. Im bardziej spłaszczamy pole gry, wyrównując "poziom trudności", zmierzający ku zeru, tym bardziej w miejsce merytorycznych czynników do głosu dochodzić zaczynają czynniki losowe i pozamerytoryczne. Maszynowo wspierana kreacja, demokratyzując twórczość amplifikuje przeciętność, tzw. "długi ogon" twórczości ulegnie tylko wydłużeniu, a ci wylosowani (lub korzystający ze schematu "pay to win") przez algorytm wybrańcy będą kumulować tylko większy kapitał. Twórczość przy tak dużej próbie i tak małej wariancji będzie coraz bardziej przyjmować charakter gry losowej, i to niestety, raczej nie uczciwej…

Kreatywne tarcie

Czy jest jakiś pozytywny scenariusz wykorzystania AI w procesie twórczym, który pozwoliłby wyrwać się z okrutnej spirali presji produktywności? Tu możemy wrócić do poruszonego wcześniej wątku użycia ilościowego vs jakościowego. Jak mówi jeden z rozmówców:

„To też będzie paradoksalne trochę, dlatego że, ja nie mam poczucia że ja robię rzeczy szybciej. [...] ale mam poczucie, że ja robię rzeczy lepiej. [...] jak pracuję z AI i przyjdzie mi nowy pomysł do głowy w trakcie - ej, a jednak tak byłoby lepiej, to ja mam przez to, że same rzeczy się dzieją szybciej, to ja mam jednak i czas, i przestrzeń, i brak tego hamulca, który pozwala mi spróbować po raz trzeci, po raz czwarty, po raz piąty. [...] Myślę, że robię je mniej więcej tak samo długo. Natomiast przez to, że mam więcej prób, więcej eksperymentowania, więcej szukania tego, że ja nie jestem w tym zakresie w żaden sposób ograniczony, to więcej pytań sobie zadaję."

Choć zdaje sobie boleśnie sprawę z faktu, że "jakościowe" wykorzystanie AI nie wpisuje się w logikę wolnego rynku, to myśląc perspektywicznie o dobrostanie zarówno twórców, jak i odbiorców postuluję, by AI używać do spowalniania procesu i zwiększania tarcia, a nie jego akceleracji. Narzędzia AI, będąc ze swej istoty świetnymi "uśredniaczami" kultury i jednocześnie bardzo inteligentnymi "bazami danych" o tym co zostało do tej pory zrobione, świetnie sprawdzają się w roli moderatorów i filtrów w procesie kreacji. Dzięki nim możemy skuteczniej weryfikować, czy dana idea została już wcześniej wdrożona - a więc nie warto się nią dalej zajmować, a propozycje przezeń generowane możemy uznać za tropy, którymi nie warto podążać, jako że z natury rzeczy będą one miały raczej generyczny charakter. Tu warto przywołać świetny projekt Philippa Schmitta "Camera Restricta" - aparatu fotograficznego, który odmawia zrobienia zdjęcia, jeśli wykryje, iż jest już zbyt wiele kadrów złapanych w danej lokacji (co prawda na podstawie geotagów, a nie maszynowej analizie obrazu, nie trudno wyobrazić sobie jednak taką uwspółcześnioną wersję). Na próżno jednak szukać marketingowych haseł sprzedających produkty bazujące AI pod szyldem - "create less - slower but better"...

Ruch 37

Do kanonu zmagań człowiek vs maszyna przeszła już historia o Lee Sedolu, który przegrał w uznawanej jeszcze kilka lat temu za nieosiągalną maszynom, grze Go z oponentem w postaci modelu AlphaGo. Szczególnie duży rozgłos uzyskał "ruch 37" określony przez zdumionych komentatorów jako "nieludzki" - strategia, która wymykała się sposobowi, w jaki gracze pojmują sensowne zbiory manewrów.

Tu warto wspomnieć nieco o historii AlphaGo - jego pierwsze wersje jako początkowy zbiór treningowy wykorzystywały historyczne zapisy rozgrywek na mistrzowskim poziomie, intuicja podpowiada, że najlepsze dane, na jakich można trenować taki model, muszą pochodzić od najlepszych ludzi w danej dyscyplinie. Jednak pierwsza wersja modelu nie była w stanie przeskoczyć poziomu najlepszych graczy. Dopiero gdy zmieniono paradygmat i zamiast tego, nie podając nawet dokładnych reguł gry, a jedynie definiując funkcję nagrody (miarę tego "jak dobrze idzie"), pozwolono algorytmowi grać przeciwko samemu sobie, udało się przeskoczyć dotychczasową poprzeczkę - i to na tyle wysoko, iż obecnie żaden człowiek nie jest już w stanie wygrać z AlphaGo. Nasza ludzka wiedza, kolektywne doświadczenie i sposób myślenia zaszyty w danych o poprzednich rozgrywkach, okazał się być raczej balastem niż pomocą w osiąganiu mistrzostwa maszyny.

Jak to się ma do procesów twórczych zapośredniczonych przez AI? Z jednej strony ta skompresowana wiedza o prawie całym (przynajmniej tym dostępnym w internecie) dorobku intelektualnym i kulturowym ludzkości stanowi zagrożenie dla wszystkich rodzajów twórczości, które operują na dwóch pierwszych, definiowanych przez Boden poziomach kreatywność, tj:

  • Kombinatorycznym - tworzenie nowych idei poprzez prostą rekombinację już istniejących elementów. Innymi słowy, wszelkie remiksy, transpozycje, zestawienia. Granie znanymi elementami wedle znanych reguł.
  • Eksploracyjnym - tworzenie nowych idei poprzez eksplorowanie możliwości w obrębie danego systemu reguł (tzw. „conceptual space"). Poszukiwanie jak daleko możemy zajść w ramach istniejących już reguł gry, testowanie potencjalnie nieodkrytych obszarów planszy.

Czyli de facto 99% produkcji kultury, od trywialnych memów po doceniane na festiwalach kino gatunkowe. Z drugiej jednak, dzięki potencjałowi wyjścia poza to co ludzkie (choć może to wymagać zmiany paradygmatu trenowania, w podobny sposób jak miało to miejsce z AlphaGo) dają też szansę na akcelerację trzeciego poziomu kreatywności:

  • Transformacyjnego - "wywrócenie stolika", obalenie istniejącego porządku i radykalne przedefiniowanie pola i zasad gry. Podniesienie pisuaru do rangi dzieła sztuki, przez Duchampa, czy zerwanie z tonalnością przez Arnolda Schoenberga.

Ton tego oczekiwania pobrzmiewa w niektórych wypowiedziach:

„...to, czego ja poszukuję w AI, to nie to, że i w ogóle co uważam, że tam może być wartościowe, to nie robienie filmów za pomocą AI, tylko właśnie to, czego nie można było zrobić wcześniej. [...] po cholerę jakby my już wiemy jak robić filmy i jak się robi filmy dobrze."

„No to jest taki optymistyczny, tak jakby scenariusz zastanawiania się nad tą wizualnością w sensie takiego supportu, no jakiegoś ciekawego spojrzenia, tak, który może wynikać z innej logiki, z jeżeli te modele nie będą tak bardzo ograniczane i alajmentowane z nami… [alignment - procedura 'ujarzmiania' modelu tak by zachowywał się w ramach wyznaczonych przez nas norm i oczekiwań]"

„No tak, na przykład koncepcje rzeczywistości tylko na przykład za pomocą, nie wiem, kamer, nie wiem, podczerwieni termicznych sensorów nie wiem ultradźwiękach i tak dalej [...] poszerzy to jakieś pole naszego rozumienia świata tak, no tak jak, no rzeczywiście, no to już jest ciągle przywoływane. No ale ten to ta strategia tej gry w go tak ulegała uległa jakiemuś przeanalizowaniu, przewartościowaniu, tak dzięki temu ruchowi 37 był nieludzki jakoś"

Być może to jest właśnie, do społu ze zwiększaniem kreatywnego tarcia, droga do pozytywnego scenariusza wykorzystania AI w procesie twórczym. Pozytywna historia płynąca ze skutków stworzenia AlphaGo, a wcześniej zaawansowanych algorytmów szachowych jest taka że ludzie, mimo oczywistej przewagi cyfrowych systemów, nie porzucili tych gier. Co więcej przeżywają one swego rodzaju renesans, jako że maszynowe modele ujawniły wiele strategii które do tej pory były poza polem naszej percepcji, wnosząc powiew świeżości w nieco już skostniałe tradycje i schematy.

Krzywa Wundta

Żeby jednak nie było za wesoło, należy zauważyć, że przytoczony powyżej scenariusz realnego wzbogacania nas i kultury jako takiej dzięki AI najprawdopodobniej się nie ziści w obecnym systemie, w każdym razie nie na skalę masową - zagrożeniem bowiem nie jest AI jako takie, ale AI w połączeniu aberracją jaką jest późny kapitalizm. Jak zgrabnie to ujmuje Ben Davis w Art in the After-Culture:

"To trochę niedorzeczne mówić, że 'AI nigdy nie stworzy prawdziwej kultury', skoro wszystkie zasoby kapitalistycznego 'przemysłu kulturowego' są dziś skoncentrowane dokładnie na tym rodzaju operacji twórczej, w której AI radzi sobie najlepiej: analizowaniu tego, co już zostało uznane za popularne, a następnie nieznacznym modyfikowaniu wzorca - czasem bardzo, bardzo nieznacznym - tak, by stworzyć nową, rynkową wersję tego samego."

Maszynowa kulturowa produkcja, w połączeniu z natychmiastową informacją zwrotną o tym, co się nam podoba, dostarczaną przez maszynowe platformy konsumpcji treści doprowadzić może do tego co Harry Collins nazywa "kapitulacją" - "kiedy poddajemy się nie super inteligentnej AI, lecz głupiej AI, która symuluje, wytwarza i rozwiązuje pewne problemy jedynie w sposób „wystarczająco dobry". Tą pułapkę "good enough" obrazuje świetnie tzw. "krzywa Wundta" zaproponowana przez Davida Byrne'a, który badał psychologiczne aspekty doświadczenia estetycznego. Punktem wyjścia była dla niego wcześniejsza koncepcja Wilhelma Wundta, według którego przyjemność pozostaje w nieliniowej relacji z intensywnością bodźca.

krzywa Wundta

W tym ujęciu wyraźnie widać, że optimum przyjemność obcowania z dziełem zmienia się nieliniowo wraz ze stopniem jego złożoności i nowatorstwa - za mało nas nudzi, za dużo odpycha. Algorytmy uczenia maszynowego świetnie umieją w tą grę - vide uzależniający potencjał TikToka. Łącząc platformę maszynowej dystrybucji kultury z maszyną do jej kreacji, domykamy pętlę sprzężenia zwrotnego z której uścisku trudno będzie się nam wyzwolić.

Dzieło ostateczne

Oczywiście wszelkie próby przewidywania przyszłości skazane są z góry na porażkę. Należy jednak pamiętać, że bardzo często ulegamy złudzeniu, iż status quo, w jakim wyrastaliśmy, ma charakter odwieczny i trwały. To oczywista iluzja. Jak wskazuje Larry Shiner w Invention of Art pojęcie sztuki, w rozumieniu "sztuk pięknych" (fine art) i jej oddzielenia od rzemiosła i życia codziennego jest stosunkowo nowym kulturowym wynalazkiem mającym genezę w połowie XVIII w. Czyli, przyjmując, że kultura symboliczna ma ok. 150 tys. lat, i zamieniając cały ten okres na 24-godzinny zegar, współczesne rozumienie sztuki, roli i pozycji artysty pojawiło się ledwie 2 min 39 sek temu…

Biorąc po uwagę, jak nowy jest to konstrukt, nie ma powodu zakładać, że jest on trwały i ustalony po wsze czasy. Od pytania o to czy "AI może tworzyć sztukę?" ciekawsze jest "Jak sztuka i rozumienie roli artysty, zmieni się pod wpływem nowych technologii?", bo zmieni się na pewno. Być może wejdziemy na trajektorię, w której klasycznie rozumiany artysta / twórca nie będzie w ogóle istotną kategorią, jak zapytuje Lev Manovich w jednym ze swoich wpisów na mediach społecznościowych:

"Czy tworzenie sztuki jest nadal sensowne lub wręcz konieczne, skoro AI potrafi często robić to równie dobrze jak ludzie - a czasem nawet lepiej? Być może ten typ ludzkiej aktywności spełnił już swoją funkcję w naszym dotychczasowym rozwoju. W rezultacie może stopniowo zanikać w naszym życiu, zastąpiony nowymi aktywnościami, których dziś jeszcze nie potrafimy sobie wyobrazić. Choć trudno nam obecnie wyobrazić sobie ten nowy świat, jest on logicznie możliwy, biorąc pod uwagę szybki rozwój AI. [...] Biorąc pod uwagę te radykalne przesunięcia w definiowaniu tego, czym jest „sztuka" i jak jest tworzona, kolejna wielka transformacja w nadchodzących dekadach wydaje się całkowicie prawdopodobna - jednak w przeciwieństwie do wcześniejszych zmian, które poszerzały możliwości artystyczne, ta może sprawić, że większość form ludzkiego tworzenia stanie się przestarzała. [...] mimo tych transformacji, niezmienne pozostawało jedno: sztuka była tworzona przez ludzi - nawet jeśli korzystali oni z różnych technologii medialnych, a później z komputerów. Być może następna transformacja okaże się bardziej radykalna"

No cóż - faktycznie, konceptualizm oswoił nas już z myślą, że może istnieć sztuka bez artefaktu, być może logiczną konkluzją jest, że może też istnieć sztuka bez "twórcy", wyłaniająca się emergentnie jako efekt działania chmary, przywołując znowu Dennetta, "kompetentnych, ale nieświadomych" cyfrowych bytów. Być może będą one tworzyć zupełnie bez naszego udziału. Być może wejdziemy na trajektorię antycypowanego przez Raya Kurzweila "singularity" - nie tylko stricte technologicznego, lecz także kulturowego, gdzie dzięki hiper-efektywnej maszynie generującej wszelkie możliwe permutacje kulturowych artefaktów osiągniemy absolutne plateau, gdzie jedyne co pozostanie jeszcze do stworzenia, wymykać się będzie już naszej percepcji, wprowadzając nas w erę "wielkiego piękna i jeszcze większego smutku" jak wieści Adam Greenfield w Radical Technologies:

„Nie mam też najmniejszych wątpliwości, że częściej będziemy czuć się otępiali, wyczerpani nieustannym naporem nowości - zwłaszcza wtedy, gdy będziemy mieć na głowie pilniejsze sprawy. Będziemy odczuwać dumę z tego, że te inteligencje mają w sobie nasze DNA, choćby było ono głęboko ukryte w całej tej mieszance, a zarazem smutek, że tak dalece wyprzedziły zasięg naszych talentów. Zapewne banalne jest określanie nadchodzących dekad jako czasu wielkiego piękna i jeszcze większego smutku, skoro z równą trafnością można by tak opisać całą historię ludzkości. A jednak wydaje mi się to najbardziej uczciwym i użytecznym sposobem scharakteryzowania epoki, w którą - jak sądzę - już wkroczyliśmy, gdy tylko w pełni się ona wyłoni."

W oczekiwaniu na hipoteteyczne wyłonienie się tej epoki, jedyne co nam pozostaje to odnalezienie obszarów, w których nadal możemy realizować "twórczy trud", odnajdując sens w samym procesie, nie zważając na niedoskonałość rezultatów, ciesząc się tą mozolną, powolną wędrówką przez las, niepomni ogłuszającego szumu dobiegającego z pobliskiej autostrady.

Jakub Koźniewski
2026



Podziękowania

Chciałbym serdecznie podziękować moim rozmówcom za poświęcony czas i podzielenie się swoimi przemyśleniami dotyczącymi procesu twórczego, relacji twórca-narzędzie i wysiłku w kontekście rozwoju sztucznej inteligencji - Jackowi Nagłowskiemu, Jankowi Simonowi, Kobasowi Laksie, Krzysztofowi Cybulskiemu, Kubie Matyce, Magdzie Mojsiejuk, Marcinowi Nowickiemu, Marcinowi Talarkowi, Marcie Flisykowskiej i Piotrowi Trackiemu. Dziękuję również Katarzynie Grzeszczak za pomoc w ujarzmianiu przecinków i wszelkie uwagi składniowo-stylistyczne.

Wszystkie cytowane wypowiedzi, o ile nie zaznaczono inaczej, pochodzą od tych osób, z niewielkimi korektami stylistycznymi mojej strony. Nie podpisywałem poszczególnych wypowiedzi nazwiskiem danej osoby, wychodząc z założenia że niektóre z nich mogą być uznane za kontrowersyjne - czy to w formie, czy to treści.


Projekt zrealizowany w ramach stypendium rozwojowego w segmencie Sztuki wizualne, w ramach którego powstaje przedsięwzięcie pt. „Post-wysiłek - jak sztuczna inteligencja ingeruje w proces twórczy”. Przedsięwzięcie ma na celu rozwijanie umiejętności artystycznych i cyfrowych. Stypendium zostało sfinansowane przez Unię Europejską NextGenerationEU.

KPO logo