Drömmande AI-genererade geometriska scener fascinerar användare av sociala medier

Drömmande AI-genererade geometriska scener fascinerar användare av sociala medier

På söndagen publicerade en Reddit-användare vid namn ”Ugleh” en AI-genererad bild av en spiralformad medeltida by som snabbt fick uppmärksamhet på sociala medier för sina anmärkningsvärda geometriska egenskaper. Uppföljande inlägg fick ännu mer beröm, inklusive en tweet med över 145 000 likes. Ugleh skapade bilderna med hjälp av Stable Diffusion och en vägledningsteknik som heter ControlNet.

Reaktionerna på konstverket online varierade från förundran och häpnad till respekt för att utveckla något nytt inom generativ AI-konst. ”Har aldrig sett sådana här bilder. Något nytt i konstens värld”, skrev en X-användare. ”Tbh, jag har sett MYCKET ai-konst, varit i det här utrymmet länge, och det här är en av de mest fantastiska verk jag någonsin sett. Du gjorde det så bra”, skrev AI-artisten Kali Yuga på X.

Kanske mest anmärkningsvärt, Y-Combinator medgrundare och frekvent teknisk kommentator för sociala medier Paul Graham skrev : ”Detta var punkten där AI-genererad konst klarade Turing-testet för mig.”

Ingen
Ingen
Ingen
Ingen
Ingen

Alla var naturligtvis inte imponerade av att några X-användare försökte plocka isär de sammansatta delarna av den AI-genererade spiralbyn. ”Det är trevligt, men det finns många beslut som en människa inte skulle fatta”, skrev en grafisk designer vid namn Trent. ”Många av skuggorna stämmer inte, och det är meningslöst att placera skorstenar precis ovanför fönstren. När man zoomar in där finns också de tydliga brusmönstren för AI-konst.”

I juni behandlade vi en teknik som använde AI-bildsyntesmodellen Stable Diffusion och ControlNet för att skapa QR-koder som ser ut som rika konstverk, inklusive anime-inspirerad konst. Ugleh tog samma neurala nätverk optimerat för att skapa de där QR-koderna (som i sig är geometriska former) och matade in enkla bilder av spiraler och rutmönster i det istället.

När den vägleds av uppmaningen, ”Medeltida byscen med livliga gator och slott i fjärran (mästerverk:1,4), (bästa kvalitet), (detaljerad),” återgav ControlNet scener där konstnärliga inslag i bilderna matchar de perceptuella formerna av spiraler och schackbräden. På en bild bågar molnen över huvudet och människor står i en mjuk kurva för att matcha spiralstyrningen. I en annan bildar rutor av moln, häckar, byggnadsansikter och en vagnvagn en rutbrädeformad scen.

Magin med ControlNet

Så hur fungerar det? Vi har behandlat stabil diffusion ofta tidigare . Det är en neural nätverksmodell tränad på miljontals bilder skrapade från Internet. Men nyckeln här är ControlNet, som först dök upp i en forskningsartikel med titeln ” Att lägga till villkorlig kontroll till text-till-bilddiffusionsmodeller ” av Lvmin Zhang, Anyi Rao och Maneesh Agrawala i februari 2023, och snabbt blev populär i den stabila diffusionen gemenskap.

Vanligtvis skapas en stabil diffusionsbild med hjälp av en textprompt (kallad text2image) eller en bildprompt (img2img). ControlNet introducerar ytterligare vägledning som kan ta formen av extraherad information från en källbild, inklusive posedetektering, djupkartläggning, normal kartläggning, kantdetektering och mycket mer. Med ControlNet kan någon som genererar AI-konstverk mycket närmare replikera formen eller poseringen av ett motiv i en bild.

Ingen
Ingen
Ingen

Genom att använda ControlNet och liknande uppmaningar är det lätt att replikera Uglehs arbete, och andra har gjort det med underhållande effekt, inklusive schackbrädeanimekaraktärer , en animation , medeltida by ”getter ” (förvånansvärt säker för arbete) och en medeltida byversion av ” Girl med ett pärlörhänge .”

Trots den massiva uppmärksamheten och många erbjudanden om att förvandla konstverket till NFT:er har Ugleh valt att hålla en låg profil för tillfället. På X sa han: ”Jag uppskattar all positiv feedback till AI-konst, jag planerar inte att tjäna pengar på mina senaste generationer, och jag kommer inte att göra några officiella intervjuer. Jag är bara en vanlig teknikkunnig AI-nörd som experimenterade med en ny ControlNet-teknik.”

Om du vill experimentera med ControlNet har den här webbplatsen en bra handledning. Dessutom publicerade Ugleh ett steg-för-steg-arbetsflöde , inklusive spiral- och schackbrädesmallfiler, på Imgur.

Även om konstverket är anmärkningsvärt säger den nuvarande amerikanska upphovsrättspolicyn att bilderna inte uppfyller standarderna för att få upphovsrättsskydd, så tekniskt sett är de offentliga. Medan AI-genererade konstverk fortfarande är ett kontroversiellt ämne för många på etiska och juridiska grunder, fortsätter entusiaster att tänja på gränserna för vad som är möjligt för en outbildad eller outbildad utövare som använder dessa nya verktyg.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *