Unistavad AI-ga loodud geomeetrilised stseenid võluvad sotsiaalmeedia kasutajaid
Pühapäeval postitas Redditi kasutaja nimega “Ugleh” tehisintellektiga loodud pildi spiraalikujulisest keskaegsest külast, mis pälvis sotsiaalmeedias kiiresti tähelepanu oma tähelepanuväärsete geomeetriliste omaduste tõttu. Järelpostitused kogusid veelgi rohkem kiitust, sealhulgas säuts , millel on üle 145 000 meeldimise. Ugleh lõi pildid kasutades Stable Diffusionit ja juhtimistehnikat nimega ControlNet.
Reaktsioonid kunstiteostele veebis ulatusid imestusest ja hämmastusest austuseni generatiivses tehisintellekti kunstis millegi uudse väljatöötamise vastu. “Selliseid pilte pole kunagi näinud. Midagi uut kunstimaailmas,” kirjutas üks X-i kasutaja. “Tbh, ma olen näinud PALJU AI-kunsti, olnud selles ruumis pikka aega ja see on üks ägedamaid teoseid, mida ma kunagi näinud olen. Sa tegid nii hästi, ” kirjutas AI-kunstnik Kali Yuga saates X.
Võib-olla kõige silmatorkavam Y-Combinatori kaasasutaja ja sagedane sotsiaalmeedia tehnoloogia kommentaator Paul Graham kirjutas : “See oli punkt, kus AI-ga loodud kunst läbis minu jaoks Turingi testi.”
Muidugi ei avaldanud kõigile muljet see, et mõned X-i kasutajad üritasid AI-ga loodud spiraalküla kompositsioonielemente üksteisest eraldada . “See on tore, kuid on palju otsuseid, mida inimene ei teeks,” kirjutas graafiline disainer Trent. “Paljud varjud pole õiged ja korstnate asetamine otse akende kohale pole mõtet. Sisse suumimisel on näha ka tehisintellekti kunstile iseloomulikke müramustreid.
Juunis käsitlesime tehnikat, mis kasutas tehisintellekti kujutise sünteesi mudelit Stable Diffusion ja ControlNet, et luua QR-koode, mis näevad välja nagu rikkalikud kunstiteosed, sealhulgas animest inspireeritud kunst. Ugleh võttis kasutusele sama närvivõrgu, mis on optimeeritud nende QR-koodide (mis ise on geomeetrilised kujundid) loomiseks, ja sisestas selle asemel lihtsad spiraalide ja malelaua mustrite kujutised .
Kui juhindutakse viipast „Keskaegne külastseen tiheda liiklusega tänavate ja lossiga kauguses (meistriteos: 1,4), (parim kvaliteet), (üksikasjalik) ”, „ControlNet renderdas stseene, kus piltide kunstilised elemendid ühtivad spiraalide ja kujunditega. malelauad. Ühel pildil kaarevad pilved pea kohal ja inimesed seisavad õrnalt kõveras, et ühtida spiraaliga. Teises moodustavad ruudukujulised pilved, hekid, hoonete küljed ja vagunikäru ruudukujulise stseeni.
ControlNeti võlu
Kuidas see siis töötab? Oleme stabiilset difusiooni varem sageli käsitlenud . See on närvivõrgu mudel, mis on treenitud miljonite Internetist kraabitud piltide põhjal. Kuid siin on võtmeks ControlNet, mis ilmus esmakordselt 2023. aasta veebruaris Lvmin Zhangi, Anyi Rao ja Maneesh Agrawala uurimustöös pealkirjaga ” Tingimusliku kontrolli lisamine teksti-pildi hajutamismudelitele ” ning sai kiiresti populaarseks stabiilse difusiooni valdkonnas. kogukond.
Tavaliselt luuakse stabiilse hajutusega pilt tekstiviipa (nn text2image) või pildiviipa (img2img) abil. ControlNet tutvustab täiendavaid juhiseid, mis võivad olla lähtekujutisest eraldatud teabe kujul, sealhulgas poosi tuvastamine, sügavuse kaardistamine, tavaline kaardistamine, serva tuvastamine ja palju muud. ControlNeti abil saab AI kunstiteoseid loov inimene palju täpsemalt jäljendada pildil oleva objekti kuju või poosi.
ControlNeti ja sarnaste viipade abil on Uglehi töid lihtne kopeerida ja teised on seda lõbusalt teinud, sealhulgas malelaua animetegelased , animatsioon , keskaegne küla “kits ” (üllatavalt ohutu töötamiseks) ja keskaegne külaversioon filmist ” Tüdruk Pärlikõrvarõngaga .”
Vaatamata tohutule tähelepanule ja paljudele pakkumistele kunstiteoste NFT-deks muutmiseks, on Ugleh otsustanud hoida praegu madalat profiili. X ütles ta : “Ma hindan kõike positiivset tagasisidet tehisintellekti kunstile, ma ei kavatse oma viimaste põlvkondadega raha teenida ja ma ei tee ametlikke intervjuusid. Olen lihtsalt tavaline tehisintellektiga nohik, kes katsetas uut ControlNeti tehnikat.
Kui soovite ControlNetiga katsetada, on sellel saidil hea õpetus. Samuti postitas Ugleh Imgurisse samm-sammult töövoo , sealhulgas spiraali- ja malelaua mallifailid.
Kuigi kunstiteos on tähelepanuväärne, ütleb praegune USA autoriõiguse poliitika, et pildid ei vasta autoriõiguse kaitse saamiseks kehtestatud standarditele, seega on need tehniliselt avalikud. Kuigi tehisintellekti loodud kunstiteosed on eetilistel ja juriidilistel põhjustel paljude jaoks endiselt vaieldavad teemad , nihutavad entusiastid jätkuvalt piire, mis on võimalik oskusteta või koolitamata praktiku jaoks, kasutades neid uusi tööriistu.
Lisa kommentaar