Svajingos dirbtinio intelekto sukurtos geometrinės scenos užburia socialinės žiniasklaidos vartotojus
Sekmadienį „Reddit“ vartotojas, vardu „Ugleh“, paskelbė dirbtinio intelekto sukurtą spiralės formos viduramžių kaimo vaizdą, kuris dėl savo nuostabių geometrinių savybių greitai sulaukė dėmesio socialinėje žiniasklaidoje. Tolesni įrašai susilaukė dar daugiau pagyrų, įskaitant tviterį su daugiau nei 145 000 paspaudimų. Ugleh sukūrė vaizdus naudodamas „Stable Diffusion“ ir valdymo techniką, vadinamą „ControlNet“.
Reakcijų į meno kūrinius internete buvo įvairių – nuo nuostabos ir nuostabos iki pagarbos kuriant kažką naujo generatyviame AI mene. „Tokių nuotraukų niekada nemačiau. Kažkas naujo meno pasaulyje“, – rašė vienas X vartotojas. „Tbh, aš mačiau DAUG AI meno, ilgą laiką buvau šioje erdvėje, ir tai yra vienas nuostabiausių kūrinių, kurį aš kada nors mačiau. Tu padarei taip gerai“, – rašė AI menininkas Kali Yuga X.
Galbūt labiausiai pastebimas „Y-Combinator“ įkūrėjas ir dažnas socialinės žiniasklaidos technologijų komentatorius Paulas Grahamas rašė : „Tai buvo ta vieta, kur dirbtinio intelekto sukurtas menas išlaikė Turingo testą.
Žinoma, ne visi buvo sužavėti, kai kai kurie X naudotojai bandė atskirti dirbtinio intelekto sukurto spiralinio kaimo kompozicinius elementus. „Puiku, bet yra daug sprendimų, kurių žmogus nepriimtų“, – rašė grafikos dizaineris Trentas. „Daugelis šešėlių yra neteisingi, o kaminus statyti tiesiai virš langų nėra prasmės. Priartinus ten taip pat matomi AI meno signaliniai triukšmo modeliai.
Birželio mėn. apžvelgėme techniką, kuri panaudojo dirbtinio intelekto vaizdų sintezės modelį „Stable Diffusion“ ir „ControlNet“, kad sukurtume QR kodus, kurie atrodo kaip turtingi meno kūriniai, įskaitant anime įkvėptą meną. Ugleh paėmė tą patį neuroninį tinklą, optimizuotą tiems QR kodams (kurie patys yra geometrinės formos) kurti, ir į jį įvedė paprastus spiralių ir šaškių lentos raštų vaizdus .
Vadovaujantis raginimu „Viduramžių kaimo scena su judriomis gatvėmis ir pilimi tolumoje (šedevras: 1.4), (geriausia kokybė), (išsamiai) “, „ControlNet“ pateikė scenas, kuriose meniniai vaizdų elementai atitinka suvokiamas spiralių formas ir šaškių lentos. Viename paveikslėlyje debesys slenka virš galvos, o žmonės stovi švelniai, kad atitiktų spiralės kryptį. Kitame debesų kvadratai, gyvatvorės, pastatų veidai ir vagono vežimėlis sudaro šachmatų formos sceną.
„ControlNet“ magija
Taigi kaip tai veikia? Anksčiau dažnai kalbėdavome apie stabilią difuziją . Tai neuroninio tinklo modelis, parengtas remiantis milijonais vaizdų, iškrapšytų iš interneto. Tačiau svarbiausia čia yra „ControlNet“, kuris pirmą kartą pasirodė 2023 m. vasario mėn. Lvmin Zhang, Anyi Rao ir Maneesh Agrawala moksliniame darbe „ Sąlyginio valdymo pridėjimas prie teksto į vaizdą difuzijos modelių “ ir greitai išpopuliarėjo stabilioje difuzijoje. bendruomenė.
Paprastai stabilios sklaidos vaizdas sukuriamas naudojant teksto raginimą (vadinamą text2image) arba vaizdo raginimą (img2img). „ControlNet“ pristato papildomas gaires, kurios gali būti gaunamos iš šaltinio vaizdo informacijos, įskaitant pozos aptikimą, gylio atvaizdavimą, įprastą žemėlapių sudarymą, kraštų aptikimą ir daug daugiau. Naudodamas „ControlNet“, kažkas, kuriantis AI meno kūrinius, gali daug tiksliau atkartoti objekto formą ar pozą vaizde.
Naudojant „ControlNet“ ir panašius raginimus, lengva atkartoti Ugleh darbą, o kiti padarė tai juokingai, įskaitant šaškių lentos anime personažus , animaciją , viduramžių kaimo „ožiukus “ (stebėtinai saugius darbui) ir viduramžių kaimo „ Mergaitės “ versiją. su perlų auskaru .
Nepaisant didžiulio dėmesio ir daugybės pasiūlymų meno kūrinius paversti NFT, Ugleh nusprendė kol kas išlaikyti žemą profilį. X jis pasakė : „Aš vertinu visus teigiamus atsiliepimus apie AI meną, neketinu užsidirbti pinigų iš savo naujausių kartų ir nedarysiu jokių oficialių interviu. Esu tik paprastas technologijų išmanantis AI vėpla, kuris eksperimentavo su nauja ControlNet technika.
Jei norite eksperimentuoti su ControlNet, ši svetainė turi gerą mokymo programą. Be to, Ugleh „Imgur“ paskelbė žingsnis po žingsnio darbo eigą , įskaitant spiralės ir šaškių lentos šablonų failus.
Nors meno kūrinys yra nuostabus, dabartinė JAV autorių teisių politika teigia, kad vaizdai neatitinka standartų, kad jiems būtų suteikta autorių teisių apsauga, todėl techniškai jie yra vieši. Nors dirbtinio intelekto sukurti meno kūriniai daugeliui tebėra ginčytini dėl etinių ir teisinių priežasčių, entuziastai ir toliau peržengia ribas, kas įmanoma nekvalifikuotam ar neapmokytam specialistui naudojant šiuos naujus įrankius.
Parašykite komentarą