Budući da znamo da su današnji difuzijski modeli za stvaranje ilustracija trenirani na brojnim postojećim slikama, ponekad i umjetničkim djelima (bez dozvole autora), jedan se istraživač i podatkovni znanstvenik upitao što bi se dogodilo kada bi od umjetne inteligencije zatražio isto to prazan bijeli kvadrat, piše Bug.hr.
Njegovo ime je Cody Nash, a u svoju ideju je uložio podosta truda. Za naizgled jednostavan zadatak – natjerati AI ilustratora da izbaci potpuno bijelu sliku – ta se misija pokazala vrlo izazovnom, na granici nemogućega.
Avanturu je započeo sa sustavom DALL-E, koji je na promptove poput “potpuno bijela slika bez detalja” generirao složene uzorke, zamišljao snježne prizore, bijele drvene okvire za slike, pejzaže i svašta nešto – sve, osim potpuno bijele površine. Slično se Nash proveo i istražujući mogućnosti modela Stable Diffusion XL, no nikako nije uspio dobiti ono što želi. Umjesto bijele slike, dobivao je bijele zečeve na bijeloj podlozi, eksplozije bijele boje, sobe s bijelim zidovima i ostala čuda i čudesa, ne uvijek bijela.

Svoju “avanturu” Nash je opisao i detaljno potkrijepio primjerima na blogu, a zaključaka cijelog eksperimenta je nekoliko. Za početak, iz priloženog se vidi da difuzijski AI modeli nisu trenirani na “čistim” bojama i slikama bez detalja i da ne razumiju što se u tom slučaju od njih traži. Najbitniji zaključak jest – AI sustavi trenirani su na gotovim slikama, a ne na idejama ili objašnjenjima što te slike znače.
Čisti opisi onoga što želimo vidjeti u promptovima obično funkcioniraju dobro, dok je odemo u apstrakciju, a tada se svaki AI sustav pogubi. Za inspiraciju, ideju i koncept i dalje je ključan čovjek, umjetnik, a modeli umjetne inteligencije tu imaju još mnogo posla, čak i kad je riječ o najjednostavnijim konceptima, poput “potpuno bijele slike”.