Svi mi u nekom trenutku u životu vodimo bilješke. I dok je nekima lakše raditi tekstualne bilješke, drugi su vizualni tipovi koji bolje pamte kad vide fotografije, crteže ili pak strelice i različite oblike. Koji ćemo oblik vođenja bilježaka odabrati, ovisi ponajprije o nama samima.
U posljednje se vrijeme sve više za vođenje bilježaka okrećemo tehnologiji, pogotovo umjetnoj inteligenciji, koja nam može izvući ono najvažnije od nekog dugotrajnog sastanka i strukturirano posložiti.
No, činjenica je da nam vizualizacija određene teme, u obliku crteža ili skica, može pomoći da bolje zapamtimo podatke koji se spominju. A može li nam u tome također pomoći tehnologija?
Kako izgleda kad umjetnik (dizajner) i umjetna inteligencija ukrste "olovke" i tko je bolje obradio određenu temu, moglo se vidjeti na konferenciji Future Tense koja je održana u Zagrebu. Nakon svakog predavanja na velikom su se ekranu mogla vidjeti dva crteža - jedan koji je napravio dizajner Aleksandar Obrenović iz Komunikacijskog laboratorija i drugi koji je stvorila umjetna inteligencija a kojom je "dirigirao" Anton Radačić, motion designer iz Sofascorea.
Neposredno na samoj konferenciji posjetitelji su se teško mogli odlučiti tko je bio bolji u izradi "vizualnih bilješki", stoga smo odlučili pitati same "autore" što misle, tko je obavio bolji posao?
Kako zapravo nastaju te "vizualne bilješke" koje smo mogli vidjeti na ovogodišnjem Future Tense?
Aleksandar Obrenović: Uglavnom nastaju kao i sve bilješke, nešto čujemo, nešto zapamtimo a nešto i sami dodamo. Na kraju se sve to zajedno zabilježi i zaokruži u jednu, kao što ste rekli “ vizualnu bilješku”. Rekao bih, vrlo spontano.
Koliko je teško ili lako stvarati ih? Što je po vama najteži dio?
AO: Ne mislim da je teško stvoriti nešto tako. Ako nešto volite, jednostavno je. Gdje god vas emocije vode i samim tim stimuliraju ono što radite, ispunjavaju taj kreativni proces na ovaj ili onaj način, stvari su jednostavne.
Konkurencija je ove godine bila "žestoka" - borili ste se za pozornost protiv AI. Jeste li ju doživjeli kao konkurenciju? Tko je kome "krao" ideje?
AO: Kao što znate, AI radi na principu prikupljanja i obrade informacija u cilju isporučivanja najadekvatnijeg rješenja zadanog zadatka. Možda je i ‘ukrao show’ na kraju, ali ne mislim da je itko ikome tu bilo šta drugo ukrao. Pogotovu ne ideje. Volim misliti da su ideje ipak još uvijek ekskluzivno ljudski resursi. Jednostavno je svatko radio svoje i na kraju smo dobili crteže kao rezultat.
Vizualne bilješke s Future Tense konferencije - 6 (Foto: Future Tense)
S obzirom na to da se AI sve više koristi i u svijetu dizajna, mislite li da će takvi AI alati ugroziti dizajnere u budućnosti? Ili će se oni transformirati u nešto novo?
AO: Mislim da će prije svega ugroziti ljude. Nebitno je zanimanje ako stvari shvaćamo zdravo za gotovo. Sama prisutnost AI kao olakšica u mnogo kompleksnijim i preciznijim poslovima iz sfere medicine, obrazovanja ili arhitekture može biti vrlo ekonomična i korisna, ali lako može imati za posljedicu smanjenje koncentracije, kreativnosti, slobodnog razmišljanja. Sve to zajedno u kombinaciji sa perfektnim mašinama koje rade “bez greške” je malo zastrašujuće. Naravno, alati koji pomažu i pospješuju rad su uvijek dobrodošli, ali kada vas od svega dijeli samo jedan klik i sa njim sve rješavate, to zaista izgleda kao nešto što bi moglo da ugrozi bilo koji posao, pa naravno i dizajnerski.
Jedna od najvećih razlika između čovjeka i stroja, koja se obično navodi, je kreativnost i umjetnička crta. No, je li ta razlika još uvijek vidljiva ili se pak sve više smanjuje?
AO: Mislim da se kod određenih stvari pogotovo ako su one dio nekog kreativnog procesa nešto što je ljudsko ne može tako lako “prikriti”, odnosno razlika uvijek postoji u odnosu na neki stroj. Ako se recimo bavite slikarstvom, vaše platno će uvijek imati bezbroj “pogrešnih” linija i boja koje će biti prolivene upravo tamo gdje ćete ih vi ostaviti jer se u datom trenutku to vama čini savršeno. I sve te “greške” kao sastavni dio kreativnog procesa za vas osobno ostavljaju neki pečat koji je jedan subjektivni zbir vlastitih slobodnih misli. AI će brzo naučiti i oponašati čak i takve stvari ali neće imati tu slobodu stvaranja, odnosno tok misli koje čovjeku kao određeni rezultat daju nešto nesavršeno.
Što nas onda čeka u budućnosti? Hoće li se ljudi, iz umjetnika, pretvoriti u operatere AI alata? Ili će umjetnost, dizajn i kreativnost preživjeti?
AO: Nada uvijek umire posljednja. I za jedne i za druge. Na kraju se sve svodi na vlastiti izbor. Pitanje je da li je ljudima bitno da imaju svoj rukopis, služe se njime i naprave nešto po pitanju najobičnijeg potpisa. Mislim da je to pitanje bitno kao i ono: “Ako se zadesite na pustom otoku koje tri stvari biste ponijeli sa sobom?” Većina ljudi bi navela određene gadgete, a da pri tom ne zna da zapali najobičniju vatru. A šta bi nam bilo korisnije na pustom otoku? Nekako sam uvjeren da će umjetnost preživjeti, naravno pitanje kakav će to oblik biti jer se vremenom neminovno mijenja. Ono što je unikatno, drugačije, svoje, slobodno - ne može proći nezapaženo i izazvati prije ili kasnije zasluženu pažnju. Bitno je samo, bar iz moje perspektive, ne zaboraviti da je umjetnost suštinski vid komunikacije, a da nam je komunikacija kao socijalnim bićima oduvijek i zauvijek neophodna potreba.
Dakle, kreativnost će još jedno vrijeme ostati u domeni ljudi. No, znači li to da će AI s vremenom naučiti kako biti kreativna? Odgovor nam je ponudio Anton Radačić.
Vizualne bilješke s Future Tense konferencije - 5 (Foto: Future Tense)
Znamo da je vođenje bilježaka i izdvajanje najvažnijih informacija vještina koja se uči. Kako je AI to "naučila"?
Anton Radačić: Ako mislimo na to kako smo birali vizualne elemente za keynote vizuale, to je zadatak dizajnera da procijeni i odabere. Jer generativni alati, i dalje su alati. Oni i dalje ne razumiju što generiraju, već je to kompleksan matematički proces koji kroz nasumičnost piksela generira rezultate što je bliže moguće našem tekstualnom unosu.
Dakle, proces je zapravo takav da sam proučio prezentacije i iz njih izvukao ključne elemente i teme koje se pojavljuju u prezentaciji. Raspisao ih na papiru i krenuo generirati, svaki vizualni element je zasebno generiran. Svaki prikazani vizualni element je iteriran kroz nekih 10-50 pokušaja, a zatim obrađivan i oblikovan u estetiku mentalne mape. Čin generiranja je suradnja. Ja kao autor vrlo dobro znam što želim prikazati pomoću generiranja, ali vrlo često me i sam rezultat iznenadi s nečim što nisam zamislio u početku, ali zapravo jako odgovara kao dio u cjelini.
Možete li nam dati malo više informacija o samoj tehnologiji - kakav ste AI alat koristili? Je li on razvijen kod vas ili ste prilagodili neki komercijalno dostupan? Koliko je dugo trajalo "učenje" AI?
AR: Tehnologija koja je korištena za vizuale je Stable Diffusion, to je open source alat. Osim što je besplatan, na njemu radi hrpa entuzijasta obogaćujući ga novim mogućnostima i tehnikama. Za razliku od ostalih sličnih usluga i alata, Stable diffusion omogućuje podešavanje modela koji generira, kao i treniranje manjih modela koji dodatno usmjeravaju rezultat prema željenom cilju. Ti mali modeli se zovu Lora (Low rank adaptation).
Ako bismo to malo jednostavnije objasnili, možda bi najlakše bilo da glavni model gledamo kao tijelo fotoaparata, a Lora bi onda bila objektiv na tom fotoaparatu. Umjesto da u potpunosti izmijeni rezultat, ona ih izobliči u smjeru u kojem je trenirana. Pošto je zadatak bio oponašati grube skice, tražili smo Loru specijaliziranu za to. Testirali smo sve koje su bile na raspolaganju, dok nismo našli jednu koja je davala rezultate najbliže željenoj estetici, te smo nju onda dodatno modificirali prema potrebama tražene estetike. Da smo išli sami trenirati na vrlo specifičnom stilu, trebali bi pristup otprilike 100-200 slika nacrtanih u tom stilu. Zatim bi trebalo prilagoditi te slike za trening, i detaljno opisati svaku.
Kada sve to pripremimo, potrebno je nekoliko sati po treningu, ovisno o stroju na kojem treniramo. Trenirali bi recimo 5-6 varijanti modela, i onda testirali koji daje najbolje rezultate. Dakle, teško je reći koliko točno bi trebalo za tako nešto, ali sigurno nije jedan klik. Danas se neki ljudi već specijaliziraju isključivo na sam trening i podešavanje modela. Iz tog razloga smo koristili postojeću Loru koju smo dodatno modificirali za svoje potrebe.
Koliko je zapravo komplicirano "naučiti" AI da crta odnosno da riječi pretvara u smislene crteže kakve smo mogli vidjeti na Future Tense konferenciji?
AR: Samo stvaranje velikog, glavnog modela, za generiranje slika je vrlo teško, i prvenstveno vrlo skupo. Zato postojeće danas možemo praktički nabrojati na prste jedne ruke. A podešavanje tih velikih modela je ono što je nama pristupačno, za to treba malo manje znanja i vremena. Ta podešavanja će malo izmijeniti taj veliki model, ali mu neće u potpunosti izmijeniti “razumijevanje” (u nedostatku bolje riječi). U prošlom pitanju smo se dotaknuli treniranja Lora, težina treninga ovisi o temi. Na primjer, stil je najzahtjevniji. 100-200 slika nije malo, ali recimo za istrenirati nečije lice, to zahtijeva 10-20 slika, odjeća ili stil odijevanja 30-ak slika, itd. Svaki ŠTO, zahtijeva svoj KAKO.
Je li moguće takav alat koristiti i za stvaranje tzv. mentalnih mapa u svakodnevnom životu? Primjerice, tijekom predavanja u školi ili tijekom sastanaka?
AR: Nije.Takvi alati ne razumiju što su mentalne mape. Neke mentalne mape se nalaze unutar njihovog seta treniranja. Tako da s unosom želje da se generira mentalna mapa, dobili bismo izgled mentalne mape, ali bez smisla. A mentalne mape zahtijevaju upravo smisao. Također, simultano generiranje više subjekata zna biti izazov. Tako da, ako bi htjeli koristiti generativne tehnologije za mentalne mape, onda bi trebali njima pristupiti na sličan način kao vizual keynoteovima. Dizajnirati mapu, i ako želimo, naknadno generirati element po element na toj mapi.
AI se razvija nevjerojatnom brzinom. Što biste rekli, koji je sljedeći korak u njenom razvoju? Odnosno, za što bismo mogli koristiti AI na Future Tense 2025.?
AR: Neki su krajem prošle godine počeli prognozirati da bi zaluđenost, kao i sam napredak tehnologije, trebala početi usporavati. Na nekim tehnologijama se vidi lagano usporavanje napretka. Tj da je puno veći skok bio od 2022. do 2023., nego recimo od 2023. do 2024. Usporavanje ne mora značiti ništa loše. Ljudi su isprobali tehnologije, vidjeli gdje ih mogu primjenjivati, a gdje ne, i samim time bi se hype mogao smanjivati. Dok će oni koji ozbiljno rade na tim tehnologijama nastaviti raditi i poboljšavati njihove primjene. Nisam prorok pa mi je teško sa sigurnošću reći gdje će biti tehnologija za godinu dana, ali ako bih morao, rekao bih da će se vjerojatno video malo više razvijati. Tko zna! Možda će biti moguće umjesto vizuala imati generirane videe koji prate prezentacije. Vidjet ćemo na sljedećem izdanju Future Tense.